Mca 2008 6

Metode cantitative avansate
de cercetare sociala
Tema 5-7: Analiza factoriala (II)
Bibliografie: Capitolul 4
George H. Dunteman. 1989. Principal Components Analysis. Newbury Park,
Ca.: Sage Publications.
Jae-On Kim, Charles W. Mueller. 1978a. Introduction to Factor Analysis. What
It Is and How to Do It. Newbury Park, Ca.: Sage Publications.
Jae-On Kim, Charles W. Mueller. 1978b. Factor Analysis. Statistical Methods
and Practical Issues. Newbury Park, Ca.: Sage Publications.
J. Scott Long. 1983. Confirmatory Factor Analysis. Newbury Park, Ca.: Sage
Publications.
Recapitulare: Elementele critice intr-o analiza

factoriala
Urmarim sa identificam structuri de corelatii puternice
intre variabile, pe care le punem pe seama unor fatori
latenti
Construim un model teoretic, un care variabilele
observate Xi, i=1,m sunt determinate de factorii Fj, j=1,n.
[n<m]. corelatiile pot fi exprimate in functie de de
saturatii, pe care vrem sa le punem in acord cu corelatiile
observate empiric baza de calcul a factorilor.
Factorii vor fi extrasi rind pe rind, astfel incit sa explice
mai mult din varianta totala a variabilelor.
[Nota: consultati prezentarea nr. 1, si prezentarile ppt de pe site-ul cursului.]
Figura 1: Modelul general al analizei factoriale, cu m variabile observate, n factori

comuni ortogonali.
F1
F2
...
Fn
X1
U1
X2
U2
X3
...
U3
...
Xm
Um
X1 = b11 F1 + b12 F2 + ... + b1n Fn + d1 U1

X2 = b21 F1 + b22 F2 + ... + b2n Fn + d2 U2
...
Xm = bm1 F1 + bm2 F2 + ... + bmn Fn + dm Um
X1
X2
...
Xm
F1
b11
b21
F2
b12
b22
...
...
...
Fn
b1n
b2n
bm1
bm2
...
bmn
Pentru factori ortogonali doi cte doi (independeni):
bij = r(Xi,Fj)
pentru i = 1, ..., m, j = 1, ..., n
Comunalitatea variabilei Xi:
hi2 = bi12 + bi22 + ... + bin2

r(Xi,Xk) = bi1 bk1 + bi2 bk2 + bi3 bk3 + ... + bin bkn
Realizarea unei analize factoriale

1. Definirea problemei de cercetare:
2. Matricea de corelaie: existena unei corelaii suficient
de mari ntre variabile.
testul de sfericitate Bartlett
matricea de corelaii anti-imagine
indicele Kaiser-Meyer-Olkin (KMO)
Figura 8. Ipoteza testului de sfericitate Bartlett.
r(X1,X1)
r(X2,X1)
...
r(Xm,X1)
r(X1,X2) ... r(X1,Xm)

r(X2,X2) ... r(X2,Xm)
r(Xm,X2) ... r(Xm,Xm)
1 0 ... 0
0 1 ... 0
...
0 0 ... 1
Figura 9. Formula de calcul al indicelui KMO.
r(X , X )
r(X , X ) a (X , X )
i
KMO =
j i
j i
ji
unde a(Xi, Xj) este coeficientul de corelaie parial ntre Xi i Xj cnd toate
celelalte variabile sunt controlate.

3. Extragerea factorilor.
Algoritmul de extragere pornete de la ipoteza unui factor comun
unic, dup care se testeaz discrepana dintre matricea de corelaii
observate i cea produs prin model. Dac testul este respins
(discrepana dintre cele dou seturi de corelaii este prea mare din
punct de vedere statistic), atunci se estimeaz
un model cu doi factori. Acestui nou model i se aplic de asemenea
testul discrepanei dintre matricile de corelaii. Dac testul nu este
trecut, se mai adaug nc un factor i se estimeaz
un nou model. Acest algoritm continu pn cnd testul
discrepanei este trecut.
Exist mai multe metode de extragere a factorilor, n funcie de
criteriile de testare a discrepanei dintre cele dou matrici de
corelaie.
(a) metoda celor mai mici ptrate the least squares method,
(b) metoda probabilitii maxime - the maximum likelihood method,
(c) metoda de extragere factorial Alpha Alpha factoring,
(d) analiza imaginii image factoring,
(e) metoda factorilor principali principal axis factoring,
(f) metoda componentelor principale principal component analysis.
Una din diferenele conceptuale fundamentale ntre aceste

metode, care distinge ntre analiza componentelor
principale (f) i toate celelalte, poate fi descris n felul
urmtor. Variana total a variabilelor observate poate fi
descompus astfel:
(1) variana comun (comunalitatea), adic totalul varianei
variabilelor care se datoreaz factorilor comuni,
(2) variana specific (unicitatea), datorat factorilor unici, i
(3) eroarea introdus de msurare, eantionare, culegerea
datelor etc.
n analiza componentelor principale (principal

component analysis) se va descompune ntreaga
varian a variabilelor.
n analiza factorial propriuzis (principal axis
factoring) se va descompune doar variana
comun a variabilelor.
n analiza factorial ncercm s estimm coeficienii bik, adic

saturaiile factoriale pentru fiecare variabil observat, avnd la
dispoziie coeficienii de corelaie r(Xi,Xk).
Vom pune condiia ca matricea rezidual, adic diferena dintre
matricea de corelaie ajustat (R1) i matricea de corelaii rezultat (B
BT), s fie ct mai aproape de zero, adic diferenele dintre corelaiile
observate i cele rezultate din modelul factorial, s fie minimizate.
ntotdeauna putem reproduce corelaiile observate printr-un model
care are exact atia factori cte variabile, iar adecvarea modelului
pentru date crete odat cu numrul de factori.
Noi dorim: o structur redus a datelor, explicarea covarianelor dintre
variabile printr-un numr ct mai mic de factori comuni.
Primul factor extras va corespunde valorii proprii celei mai mari, cu alte
cuvinte primul factor extras este cel care explic cel mai mult din
variana variabilelor observate. Urmtorul factor extras va explica
ct mai mult din restul de varian rmas neexplicat, i aa mai
departe.
La ci factori ne oprim?
De ci factori avem nevoie pentru a reprezenta datele?
Oprim descompunerea varianei n momentul n

care factorul explic mai puin dect variana unei
singure variabile, adic atunci cnd valoarea proprie
corespunztoare factorului este mai mic dect 1.
Examinarea graficului care reprezint valorile
proprii (scree plot).
Alt soluie este s stabilim un procent de varian
care s fie explicat (n mod obinuit acesta se alege
70% sau 80%), i s ne oprim atunci cnd variana
explicat de factori, cumulat, depete acest prag.
Unii autori sugereaz c nu trebuie s ne bazm
automat pe astfel de criterii formale i c numrul
de factori obinut prin aplicarea acestor teste trebuie
s ne indice doar numrul maxim de factori.
Factorii pe care i vom reine trebuie s fie
substaniali i interpretabili teoretic (ndeosebi dup
rotaie).

4. Rotaia factorilor
Prin rotaia factorilor ncercm s obinem exact acest
lucru. Prin transformri ale matricii de saturaii
iniiale urmrim s ajungem la o matrice mai simpl,
care s fie uor de interpretat.
Problema rotaiei factorilor este o problem de
transformare a datelor ntr-un model factorial lipsit de
ambiguiti n ceea ce privete semnificaia factorilor.
Astfel, o transformare care s micoreze complexitatea
factorial a variabilelor i s mreasc gradul lor de
determinare factorial ne-ar uura substanial
nelegerea, interpretarea, numirea factorilor.
Termenul de rotaie denumete exact ceea ce implic:
sistemul de axe ortogonale reprezentat de factori este rotit
n jurul originii ntr-o alt poziie.
Figura 10. Obinerea unei structuri simple prin examinarea configuraiei grafice a
variabilelor.
X1
X2
X3
X4
X5
Factor1
0.83
0.76
0.90
0.20
0.25
Factor2
-0.15
-0.24
-0.35
0.80
0.85
1.0
X4
.8
X5
.6
.4
.2
F A C TO R 2
0.0
X1
X2
-.2
X3
-.4
0.0
FACTOR1
.2
.4
.6
.8
1.0
Metode de rotaie a factorilor: ortogonale i oblice

Metoda ortogonal varimax urmeaz criteriul
simplificrii coloanelor matricii factoriale, maximiznd
variana dat de ptratul saturaiilor pentru fiecare
factor. Cu alte cuvinte, minimizeaz numrul de variabile
cu saturaii factoriale mari pentru fiecare factor,
simplificnd astfel interpretarea factorilor.
Metoda ortogonal quartimax folosete alt criteriu de
simplificare, i anume maximizeaz variana dat de
ptratul saturaiilor pentru fiecare variabil. Prin aceasta
se minimizeaz numrul de factori care explic fiecare
variabil (se reduce complexitatea factorial a
variabilelor).
O metod ortogonal care aplic ambele criterii de
simplificare este equamax. Aceasta minimizeaz
numrul de variabile care satureaz un factor i numrul
de factori necesari pentru a explica variana unei
variabile.

5. Interpretarea factorilor
n general interpretarea factorilor este facilitat atunci
cnd variabilele satureaz n mod semnificativ doar unul
din factori.
Numele factorului i definiia sa nu pot fi date dect de
cercettor. El este cel care va sintetiza coninutul
variabilelor care satureaz un factor ntr-un concept
denominat printr-o etichet sau o descriere.

6. Scoruri factoriale, scale factoriale i variabile
surogat.
Odat identificate dimensiunile latente ale unui set de
date, analistul poate dori s examineze comportamentul
cazurilor n funcie de aceste dimensiuni, i nu doar n
funcie de variabilele date. Mai mult, el poate dori s
obin cte o variabil pentru fiecare dintre aceti factori,
care s poat fi folosite n continuare ca variabile
explicative n locul setului iniial de variabile, mai
numeros.
Exist dou opiuni principale pentru a face acest lucru.
(1) Examinnd matricea factorial (matricea saturaiilor

factoriale), analistul poate selecta variabila cu cel mai mare
scor factorial pentru un anume factor ca reprezentativ
pentru dimensiunea factorial respectiv (variabil surogat).
(2) Analistul poate construi o scal factorial (o variabil care
s reprezinte factorul respectiv), dat de scoruri factoriale
pentru fiecare obiect din eantion.
Exemplu: Care sunt factorii crora li se atribuie succesul n via?

Explicai utiliznd setul de variabile vr1 vr10 din BOP 2003!
Pentru ca o persoan din Romnia de

azi s reueasc n via, ct de
important este.
rv1 s se nasc ntr-o familie bogat?

rv2 . s aib relaii?
rv3 s aib noroc/ans?
rv4 s cread n Dumnezeu?
rv5 s fie deteapt/inteligent?
rv6 s arate bine?
rv7 s fac coal?
rv8 s munceasc mult?
rv9 s fure?
rv10 s tie s se descurce?
Variante de rspuns:
1. Foarte important
2. Important
3. Destul de important
4. Puin important
5. Deloc important
8. NS (recodat ca missing value)
9. NR (recodat ca missing value)
Exist o varian comun n cazul acestui set de indicatori?

Care variabile coreleaz ntre ele i n ce msur?
Care sunt direciile corelaiilor dintre variabile (pozitive sau negative)?
Corelaiile observate:
Correlations
S se nasc
ntr-o familie
bogat?
S stie s
se
descurce?
S aib
relatii?
S aib
noroc/
sans?
S cread n
Dumnezeu?
S fie
desteapt/in
teligent?
S arate
bine?
S fac
scoal?
S
munceasc
mult?
S fure?
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
S se nasc
ntr-o familie
S stie s se
bogat?
descurce?
1
,168**
,
,000
2027
1999
,168**
1
S aib
relatii?
,566**
,000
2011
,227**
S aib
S fie
noroc/
S cread n
desteapt/i
S arate
sans?
Dumnezeu?
nteligent?
bine?
,347**
,097**
,147**
,286**
,000
,000
,000
,000
2016
2015
2017
1999
,216**
,115**
,243**
,145**
S
S fac
munceasc
scoal?
mult?
S fure?
,067**
,081**
,214**
,003
,000
,000
2012
2015
1911
,209**
,213**
,115**
,000
,000
,000
,000
,000
,000
,000
,000
,000
1999
2025
2003
2013
2013
2014
1999
2013
2011
1927
Pearson Correlation
Sig. (2-tailed)
N
,566**
,000
,227**
,000
,389**
,000
,162**
,000
,190**
,000
,258**
,000
,069**
,002
,061**
,006
,198**
,000
2011
2003
2028
2023
2014
2021
2002
2016
2015
1917
,347**
,000
2016
,097**
,000
2015
,147**
,000
2017
,286**
,000
1999
,067**
,003
2012
,081**
,000
2015
,214**
,000
1911
,216**
,000
2013
,115**
,000
2013
,243**
,000
2014
,145**
,000
1999
,209**
,000
2013
,213**
,000
2011
,115**
,000
1927
,389**
,000
2023
,162**
,000
2014
,190**
,000
2021
,258**
,000
2002
,069**
,002
2016
,061**
,006
2015
,198**
,000
1917
1
,
2044
,287**
,000
2030
,268**
,000
2034
,214**
,000
2013
,124**
,000
2031
,147**
,000
2033
,107**
,000
1926
,287**
,000
2030
1
,
2047
,248**
,000
2029
,136**
,000
2011
,241**
,000
2029
,222**
,000
2031
-,037
,103
1926
,268**
,000
2034
,248**
,000
2029
1
,
2041
,240**
,000
2016
,474**
,000
2029
,402**
,000
2029
-,059**
,010
1926
,214**
,000
2013
,136**
,000
2011
,240**
,000
2016
1
,
2021
,240**
,000
2014
,157**
,000
2013
,164**
,000
1912
,124**
,000
2031
,241**
,000
2029
,474**
,000
2029
,240**
,000
2014
1
,
2041
,523**
,000
2031
-,131**
,000
1925
,147**
,000
2033
,222**
,000
2031
,402**
,000
2029
,157**
,000
2013
,523**
,000
2031
1
,
2042
-,104**
,000
1926
,107**
,000
1926
-,037
,103
1926
-,059**
,010
1926
,164**
,000
1912
-,131**
,000
1925
-,104**
,000
1926
1
,
1937
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
Pearson Correlation
Sig. (2-tailed)
N
**. Correlation is significant at the 0.01 level (2-tailed).
1
,
Observm c exist sub-seturi de variabile care

coreleaz relativ puternic ntre ele.
Exist factori lateni care explic variana comun a
sub-seturilor de variabile observate? Cu alte cuvinte,
putem considera c exist o tipologie a rspunsurilor i
factori lateni care determin aceast tipologie?
ncercm s realizm o analiz exploratorie deoarece
nu tim ci factori avem, nici dac acetia coreleaz
sau nu.
Un model simplu ar putea fi:

rv1
U1
F1
r (rv1, F1) = b11 + b12 * r(F1,F2)

rv2
U2
.
F2
Efect direct al lui F2
.
rv10
r (rv1, F2) = b12 + b211 *r(F1,F2)
U10
Efect indirect,
mediat de F1
Corelaiile dintre factori i variabile sunt

prezentate n matricea structur
(Structure Matrix) din SPSS output.
VAR (rv1) = b112 + b122 + b11 * b12 * 2 r(F1, F2) - d12

Comunalitatea lui rv1 (partea din
varian explicat de factori)
Ceea ce rmne ne-explicat de

factori din variana lui rv1
b11 este saturaia lui F1 (factor loading F1) iar b12 este saturaia lui F2 (factor loading F2).
Aceste saturaii sunt prezentate n matricea saturaiilor factoriale (Factor Matrix sau
Factor Loadings Matrix) din SPSS output. Dac noi alegem un model n care factorii
sunt independeni, atunci corelaiile dintre factori i variabile se reduc la efectele directe,
deci sunt identice cu saturaiile (factor loadings).
Extracia factorilor:
Construim un model al relaiilor dintre factori i variabile astfel nct
diferena dintre corelaiile observate i cele re-construite (reproduced
correlations) s fie ct mai mic.
Reproduced Correlations
S se nasc
ntr-o familie
bogat?
Reproduced Correlation
Residual a
S se nasc ntr-o familie

bogat?
S stie s se descurce?
S aib relatii?
S aib noroc/ sans?
S cread n Dumnezeu?
S fie
desteapt/inteligent?
S arate bine?
S fac scoal?
S munceasc mult?
S fure?
bogat?
S aib relatii?
S aib noroc/ sans?
S cread n Dumnezeu?
S fie
S arate bine?
S fac scoal?
S munceasc mult?
S fure?
S stie s se
descurce?
b
S aib
relatii?
S aib
noroc/
sans?
S cread n
Dumnezeu?
S fie
desteapt/i
nteligent?
S arate
bine?
S fac
scoal?
S fure?
,515
,197
,546
,354
,135
,137
,261
4,165E-02
4,790E-02
,215
,197
,546
,354
,135
,143b
,215
,182
,139
,215
,580b
,380
,151
,182
,380
,276b
,153
,139
,151
,153
,148b
,214
,160
,206
,245
,159
,283
,221
,145
,214
6,187E-02
,165
,267
,187
6,590E-02
,149
,231
3,333E-02
,224
,114
-7,39E-03
,137
,214
,160
,206
,245
,424
,211
,485
,417
-6,04E-02
,261
4,165E-02
4,790E-02
,215
,159
,214
,187
3,333E-02
,283
6,187E-02
6,590E-02
,224
,221
,165
,149
,114
,145
,267
,231
-7,395E-03
,211
,485
,417
-6,037E-02
,184b
,194
,172
6,622E-02
-3,280E-02
1,566E-02
-2,06E-02
-4,674E-02
-2,378E-02
2,373E-02
1,408E-02
2,268E-02
-2,29E-03
5,831E-03
2,858E-02
-2,85E-03
-2,616E-02
1,624E-04
,135
1,697E-02
2,552E-04
4,050E-02
9,117E-03
-2,14E-02
-2,98E-02
-1,46E-02
-5,90E-03
-1,02E-02
6,989E-03
-5,10E-02
-1,35E-02
2,308E-02
-1,056E-02
-8,712E-03
-1,445E-02
7,841E-02
-2,82E-02
-5,73E-03
-3,31E-02
5,076E-03
-3,40E-03
-1,279E-02
-1,94E-03
2,904E-02
-2,041E-02
1,121E-02
9,804E-02
-1,65E-02
-2,62E-03
-3,280E-02
1,566E-02
-2,063E-02
-4,674E-02
5,831E-03
2,858E-02
-2,616E-02
-2,85E-03
1,624E-04
,135
-2,378E-02
1,697E-02
2,552E-04
4,050E-02
9,117E-03
2,373E-02
1,408E-02
2,268E-02
-2,293E-03
-2,139E-02
-1,020E-02
2,308E-02
7,841E-02
-2,98E-02
6,989E-03
-1,06E-02
-2,82E-02
-1,46E-02
-5,10E-02
-8,71E-03
-5,73E-03
-5,895E-03
-1,345E-02
-1,445E-02
-3,315E-02
5,076E-03
-3,396E-03
-1,279E-02
-1,942E-03
2,904E-02
-2,04E-02
9,804E-02
,194
,582b
,498
-,126
1,121E-02
-1,65E-02
Extraction Method: Maximum Likelihood.

a. Residuals are computed between observed and reproduced correlations. There are 4 (8,0%) nonredundant residuals with absolute values greater than 0.05.
b. Reproduced communalities
S
munceasc
mult?
,172 6,622E-02
,498
-,126
,426b
-,103
-,103
,126b
-2,624E-03
Extracia factorilor:
Diferena dintre corelaiile observate i cele re-construite (reproduse) este
msurat ca suma ptratic a diferenelor i interpretat ca o msur de tip
CHI-ptrat. Se testeaz semnificaia statistic a diferenelor pe baza
distribuiei lui CHI-ptrat.
Goodness-of-fit Test
Chi-Square
182,705
df
26
Sig.
,000
Avem o diferen statistic semnificativ

ntre matricea corelaiilor observate i
matricea corelaiilor reproduse. Modelul
nostru simplific considerabil realitatea
complexitatea relaiilor dintre variabile.
Cum au fost
extrai factorii?
Rezultatele extraciei factorilor:

Testul de adecvare a eantionrii ne
arat c analiza este statistic
semnificativ.
KMO and Bartlett's Test

Kaiser-Meyer-Olkin Measure of Sampling
Adequacy.
Bartlett's Test of
Sphericity
Approx. Chi-Square
df
Sig.
,756
Exist o diferen statistic semnificativ ntre

matricea corelaiilor dintre variabile i
matricea unitate. Avem o ans apropiat de
zero (sig.=0.000) de a obine aceast
valoare a lui HI-ptrat dac variabilele
supuse analizei nu ar fi corelate ntre ele.
3351,885
45
,000
Comunaliti (communalities)
Iniiale
s aib relaii?
s arate bine?
s cread n Dumnezeu?
s aib noroc/ans?
s fac coal?
s fie inteligent?
s fure?
s munceasc mult?
s tie s se descurce?
s se nasc ntr-o familie bogat?
,378
,165
,150
,248
,382
,316
,113
,307
,128
,360
Extrase
,580
,184
,148
,276
,582
,424
,126
,426
,143
,515
37,8% din variana primei variabile

este datorat corelaiilor
(covarianei) din setul de date.
(comunalitatea iniial a primei
variabile este 0,378).
n urma extraciei factorilor, 58%
din variana primei variabile este
explicat de factorii in model
(comunalitatea extras este
0,580).
Total Variance Explained
Factor
1
2
3
4
5
6
7
8
9
10
Total
2,787
1,781
,966
,875
,828
,680
,633
,576
,452
,423
Initial Eigenvalues
% of Variance Cumulative %
27,866
27,866
17,813
45,679
9,656
55,335
8,752
64,087
8,277
72,364
6,804
79,168
6,329
85,497
5,755
91,252
4,516
95,768
4,232
100,000
Extraction Sums of Squared Loadings

Total
2,176
21,756
21,756
1,229
12,287
34,043
Rotation Sums of Squared Loadings

Total
1,803
18,031
18,031
1,601
16,011
34,043
Primul factor explic

variana
corespunztoare a 2,78
variabile, iar factorul al
doilea variana a 1,78
variabile. Toi ceilali
factori extrai explic
mai puin dect variana
unei unei variabile.
Primul factor explic

27,8% din variana
comun total a
variabilelor, iar cel de-al
doilea 17,8%. Cumulat,
primii doi factori extrai
explic 45% din
variana comun total
a variabilelor.
Pentru soluia factorial iniial, suma ptratelor

saturaiilor factoriale este 2,176 pentru F1 i 1,229
pentru F2. Factorul F1 explic 21,5% din variana
total a variabilelor, iar F2 12,8%. Cumulat, ptratul
saturaiilor factoriale constituie 34% din variana total
a variabilelor. Dup rotaia factorilor, suma ptratelor
saturaiilor este 1,803 pentru F1 i 1,601 pentru F2.
Observm c proporia de varian total explicat
cumulat de F1 i F2 nu se schimb n urma rotaiei
factorilor (este tot 34%!). Se schimb valoarea
saturaiilor pentru fiecare factor, dar NU se schimb
suma ptratelor acestor saturaii.
Soluia factorial optim este cea cu doi factori extrai .
Soluia (modelul) factorial iniial:

Factor Matrixa
Factor
1
S aib relatii?
S fie
S fac scoal?
bogat?
S munceasc mult?
S aib noroc/ sans?
S arate bine?
S cread n Dumnezeu?
S fure?
2
,572
,503
,565
-,324
,562
-,516
,524
,490
,492
,483
,421
,378
,367
-,428
,206

a. 2 factors extracted. 4 iterations required.
-,118
,343
Acest model este destul de

dificil de interpretat.
Oare nu am putea redistribui
variana comun explicat de
factori a ntregului set de
variabile astfel nct modelul
relaiilor dintre factori i
fiecare dintre variabile s fie
ct mai clar i adecvat unei
interpretri teoretice?
Aceasta este problema rotaiei
factorilor.
Dac presupunem c factorii sunt independeni, atunci sistemul de axe este ortogonal iar
saturaiile factorilor sunt egali cu coeficienii de corelaie Pearson dintre variabile i factori.
Corelaia dintre factori: rF1F2=F1*F2* cos 90 = F1 *F2 * 0 = 0.
Putem roti soluia factorial pstrnd independena (ortogonalitatea) factorilor.
Noi nu cunoatem lungimea vectorilor, doar valoarea coeficientului de corelaie.

Acesta poate fi descompus n funcie de saturaiile factorilor:
rX1 X2 = b11 * b21 + b12 * b22 + b11 * b22 * rF1F2 + b21 * b12 * rF1F2
Dac factorii sunt ortogonali, atunci rX1 X2 = b11 * b21 + b12 * b22
Dac presupunem c factorii sunt corelai, atunci sistemul de axe NU este ortogonal, ci
oblic. Saturaiile factorilor (efectele directe ale fiecrui factor) vor diferi de coeficienii de
corelaie dintre factori i variabile, pentru c o parte din corelaie se datoreaz corelaiei
dintre factori (efecte indirecte ale factorilor prin ceilali factori). Corelaia dintre factori:
rF1F2=F1*F2* cos
Putem roti soluia factorial presupunnd c factorii coreleaz (rotaie oblic).
Saturaiile factorilor (b11, b21 pentru F1, b12, b22 pentru F2 etc.) vor fi egale cu
coeficienii de corelaie pariali, obinui prin controlarea efectelor celorlali factori.
Saturaiile pot fi interpretate ca i coefieni de regresie multinear standardizai (beta).
efectul
efectul
efectele indirecte
direct al lui F1
direct al lui F2 datorate corelaiei dintre F1 i F2
Variana =
comunalitatea
variana datorat factorului unic U
VAR (X1) = b112 + b122 + b11 * b12 * 2 r F1F2 - d12
Dac presupunem c factorii nu sunt corelai, atunci matricea de structur

(Factor Matrix sau Structure Matrix) care prezint corelaiile dintre factori i
variabile va fi identic cu matricea saturaiilor (Pattern Matrix sau Pattern
Loadings).
Dac factorii sunt corelai, atunci acestea au att efecte directe asupra
variabilelor (prezentate n matricea saturaiilor Pattern Matrix sau Pattern
Loadings) ct i efecte indirecte.
Soluia iniial: Factor Matrix sau Matricea de Structur

Corelaiile dintre factori i variabile
Factor 1
Factor 2
conform soluiei iniiale.
s aib relaii?
,572
,503
s arate bine?
,565
-,324
s cread n Dumnezeu?
,562
-,516
s aib noroc/ans?
,524
,490
s fac coal?
,492
-,428
s fie inteligent?
,483
,206
s fure?
,421
s munceasc mult?
,378
,367
,343
Extraction Method: Maximum Likelihood. 2 Factors extracted. 4 iterations required.
Rotated Factor Matrix Matricea de structur dup rotirea ortogonal a factorilor

Factor 1
Factor 2
s fac coal?
,762
Dup rotirea factorilor, observm c
s munceasc mult?
,652
variabilele s fac coal, s
s fie deteapt/inteligent?
,641
munceasc, s fie inteligent
s cread n Dumnezeu?
,357
coreleaz puternic cu primul factor, iar
variabilele
s aib relaii, s se nasc
,291
,241
ntr-o familie bogat, s aib noroc cu
s aib relaii?
,753
cel de-al doilea factor. Celelalte variabile
,712
coreleaz doar moderat cu factorii, iar
s aib noroc/ans?
,238
,468
dou dintre ele coreleaz aproximativ la
s arate bine?
,270
,334
fel cu ambii factori extrai.
s fure?
,321
Extraction Method: Maximum Likelihood. Rotation Method: Equamax with Kaiser Normalization.
a Rotation converged in 3 iterations.
Dac renunm la condiia de independen a factorilor i realizm o rotire oblic atunci

matricea de structur (Factor matrix) va fi diferit de matricea saturaiilor (Pattern Matrix
sau factor Loadings Matrix).
Pattern Matrix: Matricea saturaiilor
Factor 1
Factor 2
s fac coal?
,783
Factor Correlation Matrix
s munceasc mult?
,668
,642
Factor
1
2
s cread n Dumnezeu?
,348
1
1,000
,233
,270
,209
2
,233
1,000
s aib relaii?
,753
,716
Rotation Method: Oblimin with Kaiser Normalization.
s aib noroc/ans?
,447
s arate bine?
,346
s fure?
,238
,306
Corelaia dintre factori este slab,
Extraction Method: Maximum Likelihood. Rotation Method: Oblimin with Kaiser Normalization.
coeficientul de corelaie a lui
a Rotation converged in 8 iterations.
Pearson ia valoarea 0.233.
Structure Matrix: Matricea corelaiilor dintre factori i variabile

Factor 1
Factor 2
s fac coal?
,752
n acest caz, este de preferat soluia
s munceasc mult?
,650
factorial ortogonal deoarece dimensiunile
,646
sugerate de cei doi factori sunt distincte i
s cread n Dumnezeu?
,372
(teoretic) independente.
,319
,272
Corelaia slab dintre factori, identificat prin
s aib relaii?
,208
,761
rotirea oblic, ne arat c modelul oblic nu
,718
difer considerabil de cel ortogonal.
s aib noroc/ans?
,294
,492
s arate bine?
,309
,362
s fure?
,302
Extraction Method: Maximum Likelihood. Rotation Method: Oblimin with Kaiser Normalization.
Interpretare?
Primul factor reflecta dimensiunea efortului personal (educaie,

munc, inteligen) pentru a reusi in viata, iar cel de-al doilea factor, a
contextului social (relaii, a fi nscut ntr-o familie bogat, a avea
noroc).
Am putea construi doi indeci, care sa reflecte acesti doi factori:
1. efortul personal (achieved) Index efort
2. elemente contingente, ce nu in de individ (ascribed, contextual)
Index factori externi
Cum s construim aceti indeci?
I.
Scale aditive simple, care nu in seama de intensitatea relaiilor dintre

factori i variabile.
Index efort = s fac coal + s munceasc mult + s fie deteapt

Index factori externi = s aib relaii + s se nasc ntr-o familie bogat + s aib noroc
Putem pstra valorile iniiale ale varibilelor, sau le putem recoda n variabile
dihotomice, unde 0 nseamn nu e important i 1 important.
Scoruri factoriale
II. Construirea unor scale aditive ce in seama de intensitatea relaiilor dintre
variabile i factori i acord ponderi diferite variabilelor.
Avnd n vedere c variabilele observate indic mai puternic sau mai modest
dimensiunea latent (factorul) cercetat, acestea capt ponderi (weights) diferite n
indicele final. Ponderea este dat de un scor (un numr) cu care multiplicm
valoarea variabilei respective pentru fiecare caz (individ statistic).
Acest scor ne este furnizat n urma analizei factoriale i apare ca o nou variabil
n baza de date (cu valori diferite pentru fiecare obiect din eantion).
Scorul poate fi determinat prin mai multe metode:
1.
2.
3.
Metoda regresiei. Scorul este o estimat a coeficientului de regresie dintre factor

i variabil. Se caut obinerea unui factor F estimat astfel nct corelaia dintre
factorul latent F i variabil s fie maxim.
Metoda Bartlett. Varianele datorate factorilor de unicitate sunt considerate erori
de eantionare, deci drept aleatoare. Se acord astfel scoruri mai sczute
variabilelor care prezint erori mai mari prin mprirea la erori.
Metoda Rubin-Anderson. Utilizeaz aceeai procedur de estimare a diferenei
ptratice dintre factorii estimai i variabilele observate, dar pune condiia c
factorii estimai sunt ortogonali doi cte doi.
Contruirea unor indici (scale) aditive

Conform modelului nostru:
Pattern Matrixa
Factor
1
S fac scoal?
S munceasc mult?
S fie
S cread n Dumnezeu?
S aib relatii?
bogat?
S aib noroc/ sans?
S fure?
S arate bine?
,785
,670
2
-,137
..
,643
,348
,269
,101
,208
,755
,717
,187
-,194
,236
S fac coala = 0.78*F1 0.13*F2 + U1

S munceasc mult =0.67*F1 + U2
S fie deteapt = 0.64*F1 + U3
S cread n Dumnezeu=0.34*F1+0.1*F2
Index efort personal =

rv7*score_F1 + rv8*score_F1
+ rv5*score_F1
,447
,348
,306

Rotation Method: Oblimin with Kaiser Normalization.
a. Rotation converged in 7 iterations.
Index factori externi =

rv2*score_F2 + rv1*score_F2
+ rv3*score_F2
Celelalte variabile nu au o apartenen clar la nici

unul dintre cei doi indeci.

Mca 2008 6

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Mca 2008 6

Încărcat de

Drepturi de autor:

Formate disponibile

Metode cantitative avansate

Recapitulare: Elementele critice intr-o analiza

Figura 1: Modelul general al analizei factoriale, cu m variabile observate, n factori

X1 = b11 F1 + b12 F2 + ... + b1n Fn + d1 U1

Pentru factori ortogonali doi cte doi (independeni):

pentru i = 1, ..., m, j = 1, ..., n

Comunalitatea variabilei Xi:

hi2 = bi12 + bi22 + ... + bin2

Realizarea unei analize factoriale

r(X1,X2) ... r(X1,Xm)

r(Xm,X2) ... r(Xm,Xm)

Figura 9. Formula de calcul al indicelui KMO.

Realizarea unei analize factoriale

Una din diferenele conceptuale fundamentale ntre aceste

n analiza componentelor principale (principal

n analiza factorial ncercm s estimm coeficienii bik, adic

Oprim descompunerea varianei n momentul n

Realizarea unei analize factoriale

Metode de rotaie a factorilor: ortogonale i oblice

Realizarea unei analize factoriale

Realizarea unei analize factoriale

(1) Examinnd matricea factorial (matricea saturaiilor

Exemplu: Care sunt factorii crora li se atribuie succesul n via?

Pentru ca o persoan din Romnia de

rv1 s se nasc ntr-o familie bogat?

Exist o varian comun n cazul acestui set de indicatori?

**. Correlation is significant at the 0.01 level (2-tailed).

Observm c exist sub-seturi de variabile care

Un model simplu ar putea fi:

r (rv1, F1) = b11 + b12 * r(F1,F2)

Efect direct al lui F2

r (rv1, F2) = b12 + b211 *r(F1,F2)

Corelaiile dintre factori i variabile sunt

VAR (rv1) = b112 + b122 + b11 * b12 * 2 r(F1, F2) - d12

Ceea ce rmne ne-explicat de

S se nasc ntr-o familie

Extraction Method: Maximum Likelihood.

Avem o diferen statistic semnificativ

Rezultatele extraciei factorilor:

KMO and Bartlett's Test

Exist o diferen statistic semnificativ ntre

37,8% din variana primei variabile

Total Variance Explained

Extraction Sums of Squared Loadings

Rotation Sums of Squared Loadings

Extraction Method: Maximum Likelihood.

Primul factor explic

Primul factor explic

Pentru soluia factorial iniial, suma ptratelor

Soluia factorial optim este cea cu doi factori extrai .

Soluia (modelul) factorial iniial:

Extraction Method: Maximum Likelihood.

Acest model este destul de

Noi nu cunoatem lungimea vectorilor, doar valoarea coeficientului de corelaie.

direct al lui F2 datorate corelaiei dintre F1 i F2

variana datorat factorului unic U

VAR (X1) = b112 + b122 + b11 * b12 * 2 r F1F2 - d12

Dac presupunem c factorii nu sunt corelai, atunci matricea de structur

Soluia iniial: Factor Matrix sau Matricea de Structur

Rotated Factor Matrix Matricea de structur dup rotirea ortogonal a factorilor

Dac renunm la condiia de independen a factorilor i realizm o rotire oblic atunci

Structure Matrix: Matricea corelaiilor dintre factori i variabile

Primul factor reflecta dimensiunea efortului personal (educaie,

S fac coala = 0.78F1 0.13F2 + U1