Sunteți pe pagina 1din 25

Anlisis Factorial

El anlisis Factorial (AF) fue introducido por el psiclogo Charles Spearman (1904)
ya que decidi realizar su tesis doctoral sobre la medicin objetiva de la
inteligencia y propuso el primer modelo factorial, basado en un solo factor.
El AF es una tcnica estadstica que establece una relacin entre variables y
atributos que a primera vista no son aparentemente relacionados, tambin
proporciona la estructura interna, las relaciones subyacentes, permitiendo
establecer cmo unos factores afectan a otros y permite crear un modelo
matemtico, tambin permite reducir un conjunto de variables a un nmero de
factores representativos.

Existen dos tipos de AF, el Anlisis Factorial Exploratorio (AFE) y el


Anlisis Factorial Confirmatorio (AFC), el primero se usa para tratar de
descubrir la estructura interna de un nmero relativamente grande de
variables, aqu la hiptesis a priori del investigador es que puede existir una
serie de factores asociados a grupos de valores y el segundo trata de
determinar si el nmero de factores obtenidos y sus cargas corresponden
con los que cabra esperar a la luz de una teora previa acerca de los datos,
aqu la hiptesis a priori del investigador es que existen unos determinados
factores preestablecidos y que cada uno de ellos est asociado con un
determinado subconjunto de variables.

Para

el anlisis factorial vamos a considerar un conjunto de variables

aleatorias observadas con el propsito de encontrar los factores comunes


y los factores nicos

Las

cuales describen las variables originales mediante el modelo matemtico

ual puede representarse en forma matricial como:

Donde

Donde

son un parmetro que mide la contribucin del factor


comn en la explicacin de la variable y es el factor nico
de la variable observable .

Se

da por hecho que los factores comunes no observables son


independientes y estandarizados (media cero y varianza uno), y los
factores nicos son no correlacionados entre s y entre los factores
comunes y de igual manera con media cero y varianza:

Donde se le llama varianza especfica

La

varianza de la variable est dada por:

donde

el primer trmino es la suma de los efectos de los


factores

maremos comunalidad y al segundo se le conoce como varianza especifi


a forma

Para

obtener las cargas de los factores y las varianzas


especficas
se utilizar el mtodo de los componentes
principales.

Mtodo de Componentes Principales

La tcnica ms comn para extraer los factores en un anlisis factorial es


el de los componentes principales, el cual se basa en la obtencin de
autovectores y autovalores de la matriz de varianzas-covarianzas o de
correlacin. En este mtodo se toman los primeros componentes
principales en la matriz de varianzas-covarianzas, el modelo matemtico
es

Donde

son los componentes principales con varianza y


donde y son independientes entre s y son ortogonales y
donde son los elementos de los vectores propios de la
matriz de varianzas-covarianzas o de correlacin.
Las

variables se pueden representar en funcin de los componentes como


sigue
Si multiplicamos por la izquierda la ecuacin por
ortogonal, se obtiene lo siguiente

y recordando que es

Por

lo tanto

Ya

que los primeros componentes principales son los ms


importantes, tomaremos los primeros componentes principales,
por lo tanto
el modelo del AF queda como

Donde
es la parte de la varianza de las

Dado

que las varianzas de los factores son igual a uno, para ello, vamos a
dividir el componente por su desviacin estndar , por lo que tenemos

Aqu
son los factores comunes con varianza igual a
uno, por lo que el modelo de factores puede
representarse como

As

Donde .

se obtienen las variables originales


factores comunes un factor nico.

en trminos de

Rotacin de los factores

Sabemos que la matriz de cargas no est identificada ante


multiplicaciones por matrices ortogonales, que equivalen a
rotaciones y ya que la matriz de cargas factoriales es la
principal herramienta para interpretar el significado de los
factores y como en muchas ocasiones esta matriz es difcil de
interpretar vamos a recurrir a una rotacin de factores esto
es
Donde

es una matriz ortogonal de orden , por lo que es la nueva


matriz de cargas factorial que es ms simple de interpretar, por
lo tanto en los mtodos de rotacin lo importante es encontrar la
matriz ortogonal

Rotacin de Criterio Varimax (Ortogonal)


Esta rotacin conduce al criterio de maximizar la varianza
de los coeficientes que definen los efectos de cada factor
sobre las variables observadas.
Rotacin de Criterio de Quartimax
Minimiza la variabilidad de los coeficientes para cada variable,
reduciendo as el nmero de factores para explicar una
variable. Simplifica la interpretacin de las variables,
mejorando la solucin por filas, se utiliza cuando en el modelo
hay muchos factores.

Ejemplo
La contaminacin por mercurio de peces de agua dulce comestibles es
una amenaza directa contra nuestra salud. Entre 1990 y 1991, se llev a
cabo un estudio en 53 lagos de Florida con el fin de examinar los factores
que influyen en el nivel de contaminacin por mercurio. Las variables que
se midieron fueron
X1=Nmero de identificacin del X8= Nmero de peces estudiados
lago
por lago
X2= nombre del lago
X9= Mnimo de la concentracin de
mercurio en cada grupo de peces
X3=Alcalinidad (mg/l de
carbonato de calcio)
X10= Mximo de la concentracin
de mercurio en cada grupo de peces
X4=pH
X5= calcio (mg/l)
X11= Estimacin (mediante
regresin) de la concentracin de
X6= Clorofila (mg/l)
mercurio en un pez de 3 aos (o
X7= Concentracin media de
promedio de mercurio cuando la
mercurio (partes por milln) en
edad no est disponible)
el tejido muscular del grupo de
peces estudiados en cada lago
X12= Indicador de la edad de los
peces

X1

X2
1Alligator
2Annie
3Apopka
4Blue Cypress
5Brick
6Bryant
7Cherry
8Crescent
9Deer Point
10Dias
11Dorr
12Down
13Eaton
14East Tohopekaliga
15Farm-13
16George
17Griffin
18Harney
19Hart
20Hatchineha
21Iamonia
22Istokpoga
23Jackson
24Josephine
25Kingsley
26Kissimmee
27Lochloosa

X1
X3
X4
X5
X6
X7
X8
X9
X10
X11 2
5.9
6.1
3
0.7
1.23
5
0.85 1.43 1.53 1
3.5
5.1
1.9
3.2
1.33
7
0.92
1.9 1.33 0
116
9.1
44.1 128.3
0.04
6
0.04 0.06 0.04 0
39.4
6.9
16.4
3.5
0.44
12
0.13 0.84 0.44 0
2.5
4.6
2.9
1.8
1.2
12
0.69
1.5 1.33 1
19.6
7.3
4.5
44.1
0.27
14
0.04 0.48 0.25 1
5.2
5.4
2.8
3.4
0.48
10
0.3 0.72 0.45 1
71.4
8.1
55.2
33.7
0.19
12
0.08 0.38 0.16 1
26.4
5.8
9.2
1.6
0.83
24
0.26
1.4 0.72 1
4.8
6.4
4.6
22.5
0.81
12
0.41 1.47 0.81 1
6.6
5.4
2.7
14.9
0.71
12
0.52 0.86 0.71 1
16.5
7.2
13.8
4
0.5
12
0.1 0.73 0.51 1
25.4
7.2
25.2
11.6
0.49
7
0.26 1.01 0.54 1
7.1
5.8
5.2
5.8
1.16
43
0.5 2.03
1 1
128
7.6
86.5
71.1
0.05
11
0.04 0.11 0.05 0
83.7
8.2
66.5
78.6
0.15
10
0.12 0.18 0.15 1
108.5
8.7
35.6
80.1
0.19
40
0.07 0.43 0.19 1
61.3
7.8
57.4
13.9
0.77
6
0.32
1.5 0.49 1
6.4
5.8
4
4.6
1.08
10
0.64 1.33 1.02 1
31
6.7
15
17
0.98
6
0.67 1.44 0.7 1
7.5
4.4
2
9.6
0.63
12
0.33 0.93 0.45 1
17.3
6.7
10.7
9.5
0.56
12
0.37 0.94 0.59 1
12.6
6.1
3.7
21
0.41
12
0.25 0.61 0.41 0
7
6.9
6.3
32.1
0.73
12
0.33 2.04 0.81 1
10.5
5.5
6.3
1.6
0.34
10
0.25 0.62 0.42 1
30
6.9
13.9
21.5
0.59
36
0.23 1.12 0.53 1
55.4
7.3
15.9
24.7
0.34
10
0.17 0.52 0.31 1

X1

X2
28Louisa
29Miccasukee
30Minneola
31Monroe
32Newmans
33Ocean Pond
34Ocheese Pond
35Okeechobee
36Orange
37Panasoffkee
38Parker
39Placid
40Puzzle
41Rodman
42Rousseau
43Sampson
44Shipp
45Talquin
46Tarpon
51Tohopekaliga
47Trafford
48Trout
49Tsala Apopka
50Weir
52Wildcat
53Yale

X3
3.9
5.5
6.3
67
28.8
5.8
4.5
119.1
25.4
106.5
53
8.5
87.6
114
97.5
11.8
66.5
16
5
25.6
81.5
1.2
34
15.5
17.3
71.8

X4

X5
X6
X7
X8
4.5 3.3
7 0.84
4.8 1.7 14.8
0.5
5.8 3.3
0.7 0.34
7.8 58.6 43.8 0.28
7.4 10.2 32.7 0.34
3.6 1.6
3.2 0.87
4.4 1.1
3.2 0.56
7.9 38.4 16.1 0.17
7.1 8.8 45.2 0.18
6.8 90.7 16.5 0.19
8.4 45.6 152.4 0.04
7 2.5 12.8 0.49
7.5 85.5 20.1
1.1
7 72.6
6.4 0.16
6.8 45.5
6.2
0.1
5.9 24.2
1.6 0.48
8.3
26 68.2 0.21
6.7 41.2 24.1 0.86
6.2 23.6
9.6 0.52
6.2 12.6 27.7 0.65
8.9 20.5
9.6 0.27
4.3 2.1
6.4 0.94
7 13.1
4.6
0.4
6.9 5.2 16.5 0.43
5.2
3
2.6 0.25
7.9 20.5
8.8 0.27

X9
8
11
10
10
10
12
13
12
13
13
4
12
10
14
12
10
12
12
12
44
6
10
12
11
12
12

X10
X11 X12
0.59 1.38 0.87
0.31 0.84
0.5
0.19 0.69 0.47
0.16 0.59 0.25
0.16 0.65 0.41
0.31
1.9 0.87
0.25 1.02 0.56
0.07
0.3 0.16
0.09 0.29 0.16
0.05 0.37 0.23
0.04 0.06 0.04
0.31 0.63 0.56
0.79 1.41 0.89
0.04 0.26 0.18
0.05 0.26 0.19
0.27 1.05 0.44
0.05 0.48 0.16
0.36
1.4 0.67
0.31 0.95 0.55
0.3
1.1 0.58
0.04
0.4 0.27
0.59 1.24 0.98
0.08
0.9 0.31
0.23 0.69 0.43
0.15
0.4 0.28
0.15 0.51 0.25

1
0
1
1
1
0
0
1
1
1
0
1
1
1
1
1
1
1
1
1
0
1
1
1
1
1

Facto
r
Eigenv
Nme alor
ro
1
5.3612
3
2
1.2542
6
3
1.2166
8
4
0.9094
33
5
0.5914
17
6
0.3031
47

Porcent Porcent
aje de
aje
Varianza Acumula
do
53.612

53.612

12.543

66.155

12.167

78.322

9.094

87.416

5.914

93.330

3.031

96.362

MatrizdeCargasAntesdeRotar

X3
X4
X5
X6
X7
X8
X9
X10
X11
X12

Factor
1
0.811926
0.780309
0.652218
0.656059
-0.922255
-0.061766
-0.852987
-0.877406
-0.930945
-0.137338

Factor
2
-0.242932
-0.245724
-0.293991
0.114178
-0.13556
-0.644593
-0.0496408
-0.159448
-0.0591273
-0.755074

Factor
3
-0.383073
-0.260423
-0.564067
-0.291158
-0.330539
0.336495
-0.427631
-0.223353
-0.282632
0.253085

Variable
X3
X4
X5
X6
X7
X8
X9
X10
X11
X12

Comunalidad
0.864986
0.737084
0.82999
0.528223
0.978186
0.532544
0.912919
0.845152
0.950036
0.65305

Varianza
Especfica
0.135014
0.262916
0.17001
0.471777
0.0218136
0.467456
0.0870806
0.154848
0.0499644
0.34695

MatrizdeCargasdelFactorDespusVarimaxRotacin

X3
X4
X5
X6
X7
X8
X9
X10
X11
X12

Factor
1
-0.365236
-0.412643
-0.12334
-0.362791
0.944048
-0.0331758
0.931574
0.849697
0.908485
0.0957469

Factor
Factor
2
3
0.855316 0.0047414
0.750625 0.0580591
0.902628 -0.00625052
0.567346 -0.273356
-0.286195 0.0710735
-0.0444584 0.727645
-0.206008 -0.0514878
-0.325466 0.131294
-0.352516 0.0205827
0.00717756 0.802391

Variable
X3
X4
X5
X6
X7
X8
X9
X10
X11
X12

Comunalidad
0.864986
0.737084
0.82999
0.528223
0.978186
0.532544
0.912919
0.845152
0.950036
0.65305

Varianza
Especfica
0.135014
0.262916
0.17001
0.471777
0.0218136
0.467456
0.0870806
0.154848
0.0499644
0.34695

-0.365236*X3-0.412643*X4-0.12334*X5-0.362791*X6+0.944048*X7-
0.0331758*X8+0.931574*X9+0.849697*X10+0.908485*X11+0.0957469*X12

El factor 1 explica el 53,6% de la variacin total y las


variables que explica son:

X7= Concentracin media de


mercurio (partes por milln) en el
tejido muscular del grupo de peces
estudiados en cada lago
X9= Mnimo de la concentracin de
mercurio en cada grupo de peces
X10= Mximo de la concentracin
de mercurio en cada grupo de peces
X11= Estimacin (mediante
regresin) de la concentracin de
mercurio en un pez de 3 aos (o
promedio de mercurio cuando la
edad no est disponible)

Concentraci
n de Mercurio

El factor 2 explica el 12.54% de la variacin total y las variables que explica son:

X3=Alcalinidad (mg/l de
carbonato de calcio)
X4=pH
X5= calcio (mg/l)
X6= Clorofila (mg/l)

El factor 3 explica el 12.16% de la variacin total y las variables


que explica son:

X8= Nmero de peces


estudiados por lago
X12= Indicador de la
edad de los peces

Edad y nmero
de peces

F a c to r 2

Grfica de Cargas del Factor


1.1
0.8
0.5

X3
X4
X6

X5

0.2

X8X12

-0.1
-0.4
-0.5

-0.2

0.1
0.4
Factor 1

X9
X10X7
X11
0.7
1

Diagrama de Dispersin

F a c to r 3

2.4
1.4
0.4
-0.6
-1.6
-2.6
-1.4

-0.4

0.6
Factor 1

1.6

2.6

3.6

3.5
2.5
1.5
0.5
-0.5
-1.5
Factor 2