Mca 2008 6

Metode cantitative avansate
de cercetare sociala
Tema 5-7: Analiza factoriala (II)
Bibliografie: Capitolul 4
George H. Dunteman. 1989. Principal Components Analysis. Newbury Park,

Ca.: Sage Publications.
Jae-On Kim, Charles W. Mueller. 1978a. Introduction to Factor Analysis.
What It Is and How to Do It. Newbury Park, Ca.: Sage Publications.
Jae-On Kim, Charles W. Mueller. 1978b. Factor Analysis. Statistical Methods
and Practical Issues. Newbury Park, Ca.: Sage Publications.
J. Scott Long. 1983. Confirmatory Factor Analysis. Newbury Park, Ca.: Sage
Publications.
Recapitulare: Elementele critice intr-o analiza
factoriala
Urmarim sa identificam structuri de corelatii
puternice intre variabile, pe care le punem pe seama
unor fatori latenti
Construim un model teoretic, un care variabilele
observate Xi, i=1,m sunt determinate de factorii Fj,
j=1,n. [n<m]. corelatiile pot fi exprimate in
functie de de saturatii, pe care vrem sa le punem in
acord cu corelatiile observate empiric baza de
calcul a factorilor.
Factorii vor fi extrasi rind pe rind, astfel incit sa
explice mai mult din varianta totala a variabilelor.
[Nota: consultati prezentarea nr. 1, si prezentarile ppt de pe site-ul cursului.]
Figura 1: Modelul general al analizei factoriale, cu m variabile observate, n factori
comuni ortogonali.
X1 U1
F1
X2 U2
F2
X3 U3
... ... ...
Fn
Xm Um
F1 F2 ... Fn
X1 = b11 F1 + b12 F2 + ... + b1n Fn + d1 U1
X1 b11 b12 ... b1n
X2 = b21 F1 + b22 F2 + ... + b2n Fn + d2 U2 X2 b21 b22 ... b2n
... ...
Xm = bm1 F1 + bm2 F2 + ... + bmn Fn + dm Um Xm bm1 bm2 ... bmn
Pentru factori ortogonali doi cte doi (independeni):
bij = r(Xi,Fj) pentru i = 1, ..., m, j = 1, ..., n
Comunalitatea variabilei Xi:
hi2 = bi12 + bi22 + ... + bin2
r(Xi,Xk) = bi1 bk1 + bi2 bk2 + bi3 bk3 + ... + bin bkn
Realizarea unei analize factoriale
1. Definirea problemei de cercetare:
2. Matricea de corelaie: existena unei corelaii suficient
de mari ntre variabile.
testul de sfericitate Bartlett
matricea de corelaii anti-imagine
indicele Kaiser-Meyer-Olkin (KMO)
Figura 8. Ipoteza testului de sfericitate Bartlett.
r(X1,X1) r(X1,X2) ... r(X1,Xm) 1 0 ... 0

r(X2,X1) r(X2,X2) ... r(X2,Xm) 0 1 ... 0
... = ...
r(Xm,X1) r(Xm,X2) ... r(Xm,Xm) 0 0 ... 1
Figura 9. Formula de calcul al indicelui KMO.
r(X , X )
i ji
i j
2
KMO =
r(X , X ) a (X , X )
i ji
i j
2
i ji
i j
2
unde a(Xi, Xj) este coeficientul de corelaie parial ntre Xi i Xj cnd toate
celelalte variabile sunt controlate.
3. Extragerea factorilor.
Algoritmul de extragere pornete de la ipoteza unui factor comun
unic, dup care se testeaz discrepana dintre matricea de corelaii
observate i cea produs prin model. Dac testul este respins
(discrepana dintre cele dou seturi de corelaii este prea mare din
punct de vedere statistic), atunci se estimeaz
un model cu doi factori. Acestui nou model i se aplic de asemenea
testul discrepanei dintre matricile de corelaii. Dac testul nu este
trecut, se mai adaug nc un factor i se estimeaz
un nou model. Acest algoritm continu pn cnd testul
discrepanei este trecut.
Exist mai multe metode de extragere a factorilor, n funcie de
criteriile de testare a discrepanei dintre cele dou matrici de
corelaie.
(a) metoda celor mai mici ptrate the least squares method,
(b) metoda probabilitii maxime - the maximum likelihood method,
(c) metoda de extragere factorial Alpha Alpha factoring,
(d) analiza imaginii image factoring,
(e) metoda factorilor principali principal axis factoring,
(f) metoda componentelor principale principal component
analysis.
Una din diferenele conceptuale fundamentale ntre aceste
metode, care distinge ntre analiza componentelor
principale (f) i toate celelalte, poate fi descris n felul
urmtor. Variana total a variabilelor observate poate fi
descompus astfel:
(1) variana comun (comunalitatea), adic totalul varianei
variabilelor care se datoreaz factorilor comuni,
(2) variana specific (unicitatea), datorat factorilor unici, i
(3) eroarea introdus de msurare, eantionare, culegerea
datelor etc.
n analiza componentelor principale (principal

component analysis) se va descompune ntreaga
varian a variabilelor.
n analiza factorial propriuzis (principal axis
factoring) se va descompune doar variana
comun a variabilelor.
n analiza factorial ncercm s estimm coeficienii bik, adic
saturaiile factoriale pentru fiecare variabil observat, avnd la
dispoziie coeficienii de corelaie r(Xi,Xk).
Vom pune condiia ca matricea rezidual, adic diferena dintre
matricea de corelaie ajustat (R1) i matricea de corelaii rezultat
(B BT), s fie ct mai aproape de zero, adic diferenele dintre
corelaiile observate i cele rezultate din modelul factorial, s fie
minimizate.
ntotdeauna putem reproduce corelaiile observate printr-un model
care are exact atia factori cte variabile, iar adecvarea modelului
pentru date crete odat cu numrul de factori.
Noi dorim: o structur redus a datelor, explicarea covarianelor dintre
variabile printr-un numr ct mai mic de factori comuni.
Primul factor extras va corespunde valorii proprii celei mai mari, cu alte
cuvinte primul factor extras este cel care explic cel mai mult
din variana variabilelor observate. Urmtorul factor extras va
explica ct mai mult din restul de varian rmas neexplicat, i aa
mai departe.
La ci factori ne oprim?
De ci factori avem nevoie pentru a reprezenta datele?

Oprim descompunerea varianei n momentul n
care factorul explic mai puin dect variana unei
singure variabile, adic atunci cnd valoarea proprie
corespunztoare factorului este mai mic dect 1.
Examinarea graficului care reprezint valorile
proprii (scree plot).
Alt soluie este s stabilim un procent de varian
care s fie explicat (n mod obinuit acesta se alege
70% sau 80%), i s ne oprim atunci cnd variana
explicat de factori, cumulat, depete acest prag.
Unii autori sugereaz c nu trebuie s ne bazm
automat pe astfel de criterii formale i c numrul
de factori obinut prin aplicarea acestor teste
trebuie s ne indice doar numrul maxim de factori.
Factorii pe care i vom reine trebuie s fie
substaniali i interpretabili teoretic (ndeosebi dup
rotaie).
4. Rotaia factorilor
Prin rotaia factorilor ncercm s obinem exact acest

lucru. Prin transformri ale matricii de saturaii
iniiale urmrim s ajungem la o matrice mai simpl,
care s fie uor de interpretat.
Problema rotaiei factorilor este o problem de
transformare a datelor ntr-un model factorial lipsit de
ambiguiti n ceea ce privete semnificaia factorilor.
Astfel, o transformare care s micoreze
complexitatea factorial a variabilelor i s mreasc
gradul lor de determinare factorial ne-ar uura
substanial nelegerea, interpretarea, numirea
factorilor.
Termenul de rotaie denumete exact ceea ce implic:
sistemul de axe ortogonale reprezentat de factori este rotit
n jurul originii ntr-o alt poziie.
Figura 10. Obinerea unei structuri simple prin examinarea configuraiei grafice a
variabilelor.
Factor1 Factor2
X1 0.83 -0.15
X2 0.76 -0.24
X3 0.90 -0.35
X4 0.20 0.80
X5 0.25 0.85
1.0
X5
X4
.8
.6
.4
.2
0.0
X1
FACTOR2
-.2 X2
X3
-.4
0.0 .2 .4 .6 .8 1.0
FACTOR1
Metode de rotaie a factorilor: ortogonale i oblice
Metoda ortogonal varimax urmeaz criteriul

simplificrii coloanelor matricii factoriale, maximiznd
variana dat de ptratul saturaiilor pentru fiecare
factor. Cu alte cuvinte, minimizeaz numrul de variabile
cu saturaii factoriale mari pentru fiecare factor,
simplificnd astfel interpretarea factorilor.
Metoda ortogonal quartimax folosete alt criteriu de
simplificare, i anume maximizeaz variana dat de
ptratul saturaiilor pentru fiecare variabil. Prin aceasta
se minimizeaz numrul de factori care explic fiecare
variabil (se reduce complexitatea factorial a
variabilelor).
O metod ortogonal care aplic ambele criterii de
simplificare este equamax. Aceasta minimizeaz
numrul de variabile care satureaz un factor i numrul
de factori necesari pentru a explica variana unei
variabile.
5. Interpretarea factorilor
n general interpretarea factorilor este facilitat atunci
cnd variabilele satureaz n mod semnificativ doar unul
din factori.
Numele factorului i definiia sa nu pot fi date dect de
cercettor. El este cel care va sintetiza coninutul
variabilelor care satureaz un factor ntr-un concept
denominat printr-o etichet sau o descriere.
6. Scoruri factoriale, scale factoriale i
variabile surogat.
Odat identificate dimensiunile latente ale unui set de
date, analistul poate dori s examineze comportamentul
cazurilor n funcie de aceste dimensiuni, i nu doar n
funcie de variabilele date. Mai mult, el poate dori s
obin cte o variabil pentru fiecare dintre aceti factori,
care s poat fi folosite n continuare ca variabile
explicative n locul setului iniial de variabile, mai
numeros.
Exist dou opiuni principale pentru a face acest lucru.
(1) Examinnd matricea factorial (matricea saturaiilor
factoriale), analistul poate selecta variabila cu cel mai mare
scor factorial pentru un anume factor ca reprezentativ
pentru dimensiunea factorial respectiv (variabil
surogat).
(2) Analistul poate construi o scal factorial (o variabil
care s reprezinte factorul respectiv), dat de scoruri
factoriale pentru fiecare obiect din eantion.
Exemplu: Care sunt factorii crora li se atribuie succesul n via?
Explicai utiliznd setul de variabile vr1 vr10 din BOP 2003!
Pentru ca o persoan din Romnia de

azi s reueasc n via, ct de
important este.
rv1 s se nasc ntr-o familie bogat? Variante de rspuns:

rv2 . s aib relaii? 1. Foarte important
rv3 s aib noroc/ans? 2. Important
rv4 s cread n Dumnezeu? 3. Destul de important
rv5 s fie deteapt/inteligent? 4. Puin important
rv6 s arate bine? 5. Deloc important
rv7 s fac coal?
8. NS (recodat ca missing value)
rv8 s munceasc mult?
9. NR (recodat ca missing value)
rv9 s fure?
rv10 s tie s se descurce?
Exist o varian comun n cazul acestui set de indicatori?

Care variabile coreleaz ntre ele i n ce msur?
Care sunt direciile corelaiilor dintre variabile (pozitive sau negative)?
Corelaiile observate:
Correlations
S se nas c S aib S fie S

ntr-o familie S stie s s e S aib noroc/ S cread n des teapt/i S arate S fac munceasc
bogat? des curce? relatii? s ans? Dumnezeu? nteligent? bine? s coal? mult? S fure?
S se nas c Pears on Correlation 1 ,168** ,566** ,347** ,097** ,147** ,286** ,067** ,081** ,214**
ntr-o familie Sig. (2-tailed) , ,000 ,000 ,000 ,000 ,000 ,000 ,003 ,000 ,000
bogat? N 2027 1999 2011 2016 2015 2017 1999 2012 2015 1911
S stie s Pears on Correlation ,168** 1 ,227** ,216** ,115** ,243** ,145** ,209** ,213** ,115**
se Sig. (2-tailed) ,000 , ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
des curce?
N 1999 2025 2003 2013 2013 2014 1999 2013 2011 1927
S aib Pears on Correlation ,566** ,227** 1 ,389** ,162** ,190** ,258** ,069** ,061** ,198**
relatii? Sig. (2-tailed) ,000 ,000 , ,000 ,000 ,000 ,000 ,002 ,006 ,000
N
2011 2003 2028 2023 2014 2021 2002 2016 2015 1917
S aib Pears on Correlation ,347** ,216** ,389** 1 ,287** ,268** ,214** ,124** ,147** ,107**
noroc/ Sig. (2-tailed) ,000 ,000 ,000 , ,000 ,000 ,000 ,000 ,000 ,000
s ans? N 2016 2013 2023 2044 2030 2034 2013 2031 2033 1926
S cread n Pears on Correlation ,097** ,115** ,162** ,287** 1 ,248** ,136** ,241** ,222** -,037
Dumnezeu? Sig. (2-tailed) ,000 ,000 ,000 ,000 , ,000 ,000 ,000 ,000 ,103
N 2015 2013 2014 2030 2047 2029 2011 2029 2031 1926
S fie Pears on Correlation ,147** ,243** ,190** ,268** ,248** 1 ,240** ,474** ,402** -,059**
des teapt/in Sig. (2-tailed) ,000 ,000 ,000 ,000 ,000 , ,000 ,000 ,000 ,010
teligent? N 2017 2014 2021 2034 2029 2041 2016 2029 2029 1926
S arate Pears on Correlation ,286** ,145** ,258** ,214** ,136** ,240** 1 ,240** ,157** ,164**
bine? Sig. (2-tailed) ,000 ,000 ,000 ,000 ,000 ,000 , ,000 ,000 ,000
N 1999 1999 2002 2013 2011 2016 2021 2014 2013 1912
S fac Pears on Correlation ,067** ,209** ,069** ,124** ,241** ,474** ,240** 1 ,523** -,131**
s coal? Sig. (2-tailed) ,003 ,000 ,002 ,000 ,000 ,000 ,000 , ,000 ,000
N 2012 2013 2016 2031 2029 2029 2014 2041 2031 1925
S Pears on Correlation ,081** ,213** ,061** ,147** ,222** ,402** ,157** ,523** 1 -,104**
munceasc Sig. (2-tailed) ,000 ,000 ,006 ,000 ,000 ,000 ,000 ,000 , ,000
mult? N 2015 2011 2015 2033 2031 2029 2013 2031 2042 1926
S fure? Pears on Correlation ,214** ,115** ,198** ,107** -,037 -,059** ,164** -,131** -,104** 1
Sig. (2-tailed) ,000 ,000 ,000 ,000 ,103 ,010 ,000 ,000 ,000 ,
N 1911 1927 1917 1926 1926 1926 1912 1925 1926 1937
**. Correlation is significant at the 0.01 level (2-tailed).
Observm c exist sub-seturi de variabile care
coreleaz relativ puternic ntre ele.
Exist factori lateni care explic variana comun a

sub-seturilor de variabile observate? Cu alte cuvinte,
putem considera c exist o tipologie a rspunsurilor i
factori lateni care determin aceast tipologie?
ncercm s realizm o analiz exploratorie deoarece

nu tim ci factori avem, nici dac acetia coreleaz
sau nu.
Un model simplu ar putea fi:
rv1 U1
F1
r (rv1, F1) = b11 + b12 * r(F1,F2)
rv2 U2
r (rv1, F2) = b12 + b211 *r(F1,F2)
.
F2 . Efect direct al lui F2 Efect indirect,
. mediat de F1
rv10 U10 Corelaiile dintre factori i variabile

sunt prezentate n matricea structur
(Structure Matrix) din SPSS output.
VAR (rv1) = b112 + b122 + b11 * b12 * 2 r(F1, F2) - d12
Comunalitatea lui rv1 (partea din Ceea ce rmne ne-explicat de

varian explicat de factori) factori din variana lui rv1
b11 este saturaia lui F1 (factor loading F1) iar b12 este saturaia lui F2 (factor loading F2).
Aceste saturaii sunt prezentate n matricea saturaiilor factoriale (Factor Matrix sau
Factor Loadings Matrix) din SPSS output. Dac noi alegem un model n care factorii
sunt independeni, atunci corelaiile dintre factori i variabile se reduc la efectele directe,
deci sunt identice cu saturaiile (factor loadings).
Extracia factorilor:
Construim un model al relaiilor dintre factori i variabile astfel
nct diferena dintre corelaiile observate i cele re-construite
(reproduced correlations) s fie ct mai mic.
Reproduced Correlations
S se nas c S aib S fie S

ntr-o familie S stie s s e S aib noroc/ S cread n des teapt/i S arate S fac munceasc
bogat? des curce? relatii? s ans? Dumnezeu? nteligent? bine? s coal? mult? S fure?
Reproduced Correlation S se nas c ntr-o familie b
,515 ,197 ,546 ,354 ,135 ,137 ,261 4,165E-02 4,790E-02 ,215
bogat?
S stie s s e descurce? ,197 ,143 b ,215 ,182 ,139 ,214 ,159 ,214 ,187 3,333E-02
S aib relatii? ,546 ,215 ,580 b ,380 ,151 ,160 ,283 6,187E-02 6,590E-02 ,224
S aib noroc/ s ans? ,354 ,182 ,380 ,276 b ,153 ,206 ,221 ,165 ,149 ,114
S cread n Dumnezeu? ,135 ,139 ,151 ,153 ,148 b ,245 ,145 ,267 ,231 -7,39E-03
S fie b
,137 ,214 ,160 ,206 ,245 ,424 ,211 ,485 ,417 -6,04E-02
des teapt/inteligent?
S arate bine? ,261 ,159 ,283 ,221 ,145 ,211 ,184 b ,194 ,172 6,622E-02
S fac scoal? 4,165E-02 ,214 6,187E-02 ,165 ,267 ,485 ,194 ,582 b ,498 -,126
S munceas c mult? 4,790E-02 ,187 6,590E-02 ,149 ,231 ,417 ,172 ,498 ,426 b -,103
S fure? ,215 3,333E-02 ,224 ,114 -7,395E-03 -6,037E-02 6,622E-02 -,126 -,103 ,126 b
Res iduala S se nas c ntr-o familie
-3,280E-02 1,566E-02 -2,06E-02 -4,674E-02 -2,378E-02 2,373E-02 1,408E-02 2,268E-02 -2,29E-03
bogat?
S stie s s e descurce? -3,280E-02 5,831E-03 2,858E-02 -2,616E-02 1,697E-02 -2,14E-02 -1,02E-02 2,308E-02 7,841E-02
S aib relatii? 1,566E-02 5,831E-03 -2,85E-03 1,624E-04 2,552E-04 -2,98E-02 6,989E-03 -1,056E-02 -2,82E-02
S aib noroc/ s ans? -2,063E-02 2,858E-02 -2,85E-03 ,135 4,050E-02 -1,46E-02 -5,10E-02 -8,712E-03 -5,73E-03
S cread n Dumnezeu? -4,674E-02 -2,616E-02 1,624E-04 ,135 9,117E-03 -5,90E-03 -1,35E-02 -1,445E-02 -3,31E-02
S fie
-2,378E-02 1,697E-02 2,552E-04 4,050E-02 9,117E-03 5,076E-03 -3,40E-03 -1,279E-02 -1,94E-03
S arate bine? 2,373E-02 -2,139E-02 -2,98E-02 -1,46E-02 -5,895E-03 5,076E-03 2,904E-02 -2,041E-02 9,804E-02
S fac scoal? 1,408E-02 -1,020E-02 6,989E-03 -5,10E-02 -1,345E-02 -3,396E-03 2,904E-02 1,121E-02 -1,65E-02
S munceas c mult? 2,268E-02 2,308E-02 -1,06E-02 -8,71E-03 -1,445E-02 -1,279E-02 -2,04E-02 1,121E-02 -2,62E-03
S fure? -2,293E-03 7,841E-02 -2,82E-02 -5,73E-03 -3,315E-02 -1,942E-03 9,804E-02 -1,65E-02 -2,624E-03
Extraction Method: Maximum Likelihood.
a. Res iduals are computed between obs erved and reproduced correlations . There are 4 (8,0%) nonredundant res iduals with abs olute values greater than 0.05.
b. Reproduced communalities
Extracia factorilor:
Diferena dintre corelaiile observate i cele re-construite (reproduse) este
msurat ca suma ptratic a diferenelor i interpretat ca o msur de tip
CHI-ptrat. Se testeaz semnificaia statistic a diferenelor pe baza
distribuiei lui CHI-ptrat.
Goodness-of-fit Test
Chi-Square df Sig.
182,705 26 ,000
Avem o diferen statistic semnificativ ntre

matricea corelaiilor observate i matricea Cum au fost
corelaiilor reproduse. Modelul nostru extrai factorii?
simplific considerabil realitatea
complexitatea relaiilor dintre variabile.
Rezultatele extraciei factorilor:
Testul de adecvare a eantionrii ne
KMO a nd Bartlett's Te st arat c analiza este statistic
semnificativ.
Kaiser-Mey er-Olkin Measure of Sampling
Adequacy. ,756
Bartlet t's Test of Approx . Chi-Square 3351,885 Exist o diferen statistic semnificativ ntre
Sphericity df 45 matricea corelaiilor dintre variabile i matricea
Sig. ,000 unitate. Avem o ans apropiat de zero
(sig.=0.000) de a obine aceast valoare a lui
HI-ptrat dac variabilele supuse analizei nu ar
fi corelate ntre ele.
Comunaliti (communalities)
Iniiale Extrase
s aib relaii? ,378 ,580
s arate bine? ,165 ,184 37,8% din variana primei variabile
s cread n Dumnezeu? ,150 ,148 este datorat corelaiilor
s aib noroc/ans? ,248 ,276 (covarianei) din setul de date.
s fac coal? ,382 ,582
(comunalitatea iniial a primei
s fie inteligent? ,316 ,424
variabile este 0,378).
s fure? ,113 ,126
n urma extraciei factorilor, 58%
s munceasc mult? ,307 ,426
din variana primei variabile este
s tie s se descurce? ,128 ,143
s se nasc ntr-o familie bogat? ,360 ,515 explicat de factorii in model
Extraction Method: Maximum Likelihood. (comunalitatea extras este 0,580).
Total Variance Explained
Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings
Factor Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %
1 2,787 27,866 27,866 2,176 21,756 21,756 1,803 18,031 18,031
2 1,781 17,813 45,679 1,229 12,287 34,043 1,601 16,011 34,043
3 ,966 9,656 55,335
4 ,875 8,752 64,087
5 ,828 8,277 72,364
6 ,680 6,804 79,168
7 ,633 6,329 85,497
8 ,576 5,755 91,252
9 ,452 4,516 95,768
10 ,423 4,232 100,000
Primul factor explic

27,8% din variana Pentru soluia factorial iniial, suma ptratelor
comun total a saturaiilor factoriale este 2,176 pentru F1 i 1,229
Primul factor explic
variabilelor, iar cel de-al pentru F2. Factorul F1 explic 21,5% din variana
variana
doilea 17,8%. Cumulat, total a variabilelor, iar F2 12,8%. Cumulat,
corespunztoare a 2,78
primii doi factori extrai ptratul saturaiilor factoriale constituie 34% din
variabile, iar factorul al
explic 45% din variana total a variabilelor. Dup rotaia factorilor,
doilea variana a 1,78
variana comun suma ptratelor saturaiilor este 1,803 pentru F1 i
variabile. Toi ceilali
total a variabilelor. 1,601 pentru F2. Observm c proporia de
factori extrai explic
varian total explicat cumulat de F1 i F2 nu
mai puin dect variana
se schimb n urma rotaiei factorilor (este tot
unei unei variabile. 34%!). Se schimb valoarea saturaiilor pentru
fiecare factor, dar NU se schimb suma ptratelor
acestor saturaii.
Soluia factorial optim este cea cu doi factori extrai.

Soluia (modelul) factorial iniial:
Factor Matrixa
Factor
Acest model este destul de
1 2
S aib relatii?
dificil de interpretat.
,572 ,503
S fie Oare nu am putea redistribui
,565 -,324 variana comun explicat de
S fac scoal? ,562 -,516 factori a ntregului set de
S se nas c ntr-o familie variabile astfel nct modelul
bogat?
,524 ,490 relaiilor dintre factori i
S munceas c mult? ,492 -,428 fiecare dintre variabile s fie
S aib noroc/ sans? ,483 ,206 ct mai clar i adecvat unei
S arate bine? ,421 interpretri teoretice?
S stie s se des curce? ,378 Aceasta este problema rotaiei
S cread n Dumnezeu? ,367 -,118 factorilor.
S fure? ,343
a. 2 factors extracted. 4 iterations required.
Dac presupunem c factorii sunt independeni, atunci sistemul de axe este ortogonal
iar saturaiile factorilor sunt egali cu coeficienii de corelaie Pearson dintre variabile i
factori.
Corelaia dintre factori: rF1F2=F1*F2* cos 90 = F1 *F2 * 0 = 0.
Putem roti soluia factorial pstrnd independena (ortogonalitatea) factorilor.
Interpretarea coeficientului de corelaie ca un produs vectorial
F1
b11 X1
b21 X2
F2
b11 b22
Coeficientul de corelaie a lui Pearson rX1,X2 =X1*X2*cos

Cos 90=0
Cos 0=1
Noi nu cunoatem lungimea vectorilor, doar valoarea coeficientului de corelaie.

Acesta poate fi descompus n funcie de saturaiile factorilor:
rX1 X2 = b11 * b21 + b12 * b22 + b11 * b22 * rF1F2 + b21 * b12 * rF1F2
Dac factorii sunt ortogonali, atunci rX1 X2 = b11 * b21 + b12 * b22
Dac presupunem c factorii sunt corelai, atunci sistemul de axe NU este ortogonal, ci
oblic. Saturaiile factorilor (efectele directe ale fiecrui factor) vor diferi de coeficienii de
corelaie dintre factori i variabile, pentru c o parte din corelaie se datoreaz corelaiei
dintre factori (efecte indirecte ale factorilor prin ceilali factori). Corelaia dintre factori:
rF1F2=F1*F2* cos
Putem roti soluia factorial presupunnd c factorii coreleaz (rotaie oblic).
Interpretarea coeficientului de corelaie ca un produs vectorial
F1
b11 X1
b21 X2
F2
b11 b22
Coeficientul de corelaie a lui Pearson rX1,X2 =X1*X2*cos

Cos 90=0
Cos 0=1
Saturaiile factorilor (b11, b21 pentru F1, b12, b22 pentru F2 etc.) vor fi egale cu
coeficienii de corelaie pariali, obinui prin controlarea efectelor celorlali factori.
Saturaiile pot fi interpretate ca i coefieni de regresie multinear standardizai (beta).
efectul efectul efectele indirecte

direct al lui F1 direct al lui F2 datorate corelaiei dintre F1 i F2
Variana = comunalitatea + variana datorat factorului unic U

VAR (X1) = b112 + b122 + b11 * b12 * 2 r F1F2 - d12
Dac presupunem c factorii nu sunt corelai, atunci matricea de structur

(Factor Matrix sau Structure Matrix) care prezint corelaiile dintre factori i
variabile va fi identic cu matricea saturaiilor (Pattern Matrix sau Pattern
Loadings).
Dac factorii sunt corelai, atunci acestea au att efecte directe asupra
variabilelor (prezentate n matricea saturaiilor Pattern Matrix sau Pattern
Loadings) ct i efecte indirecte.
Soluia iniial: Factor Matrix sau Matricea de Structur
Factor 1 Factor 2 Corelaiile dintre factori i variabile
s aib relaii? ,572 ,503 conform soluiei iniiale.
s arate bine? ,565 -,324
s cread n Dumnezeu? ,562 -,516
s aib noroc/ans? ,524 ,490
s fac coal? ,492 -,428
s fie inteligent? ,483 ,206
s fure? ,421
s munceasc mult? ,378
s tie s se descurce? ,367
s se nasc ntr-o familie bogat? ,343
Extraction Method: Maximum Likelihood. 2 Factors extracted. 4 iterations required.
Rotated Factor Matrix Matricea de structur dup rotirea ortogonal a factorilor

Factor 1 Factor 2
s fac coal? ,762
Dup rotirea factorilor, observm c
s munceasc mult? ,652 variabilele s fac coal, s
s fie deteapt/inteligent? ,641 munceasc, s fie inteligent coreleaz
s cread n Dumnezeu? ,357 puternic cu primul factor, iar variabilele s
s tie s se descurce? ,291 ,241 aib relaii, s se nasc ntr-o familie
s aib relaii? ,753 bogat, s aib noroc cu cel de-al
s se nasc ntr-o familie bogat? ,712 doilea factor. Celelalte variabile coreleaz
s aib noroc/ans? ,238 ,468 doar moderat cu factorii, iar dou dintre
s arate bine? ,270 ,334 ele coreleaz aproximativ la fel cu ambii
factori extrai.
s fure? ,321
Extraction Method: Maximum Likelihood. Rotation Method: Equamax with Kaiser Normalization.
a Rotation converged in 3 iterations.
Dac renunm la condiia de independen a factorilor i realizm o rotire oblic atunci
matricea de structur (Factor matrix) va fi diferit de matricea saturaiilor (Pattern Matrix
sau factor Loadings Matrix).
Pattern Matrix: Matricea saturaiilor
Factor 1 Factor 2
s fac coal? ,783
Factor Correlation Matrix
s munceasc mult? ,668
s fie deteapt/inteligent? ,642 Factor 1 2
s cread n Dumnezeu? ,348 1 1,000 ,233
s tie s se descurce? ,270 ,209 2 ,233 1,000
s aib relaii? ,753 Extraction Method: Maximum Likelihood.
s se nasc ntr-o familie bogat? ,716 Rotation Method: Oblimin with Kaiser Normalization.
s aib noroc/ans? ,447
s arate bine? ,346
s fure? ,238 ,306 Corelaia dintre factori este slab,
Extraction Method: Maximum Likelihood. Rotation Method: Oblimin with Kaiser Normalization. coeficientul de corelaie a lui
a Rotation converged in 8 iterations. Pearson ia valoarea 0.233.
Structure Matrix: Matricea corelaiilor dintre factori i variabile

Factor 1 Factor 2
s fac coal? ,752 n acest caz, este de preferat soluia
s munceasc mult? ,650 factorial ortogonal deoarece dimensiunile
s fie deteapt/inteligent? ,646 sugerate de cei doi factori sunt distincte i
s cread n Dumnezeu? ,372 (teoretic) independente.
s tie s se descurce? ,319 ,272
s aib relaii? ,208 ,761 Corelaia slab dintre factori, identificat prin
s se nasc ntr-o familie bogat? ,718 rotirea oblic, ne arat c modelul oblic nu
s aib noroc/ans? ,294 ,492 difer considerabil de cel ortogonal.
s arate bine? ,309 ,362
s fure? ,302
Extraction Method: Maximum Likelihood. Rotation Method: Oblimin with Kaiser Normalization.
Interpretare?
Primul factor reflecta dimensiunea efortului personal (educaie,

munc, inteligen) pentru a reusi in viata, iar cel de-al doilea factor, a
contextului social (relaii, a fi nscut ntr-o familie bogat, a avea
noroc).
Am putea construi doi indeci, care sa reflecte acesti doi factori:
1. efortul personal (achieved) Index efort
2. elemente contingente, ce nu in de individ (ascribed, contextual)
Index factori externi
Cum s construim aceti indeci?
I. Scale aditive simple, care nu in seama de intensitatea relaiilor dintre
factori i variabile.
Index efort = s fac coal + s munceasc mult + s fie deteapt
Index factori externi = s aib relaii + s se nasc ntr-o familie bogat + s aib noroc
Putem pstra valorile iniiale ale varibilelor, sau le putem recoda n variabile
dihotomice, unde 0 nseamn nu e important i 1 important.
Scoruri factoriale
II. Construirea unor scale aditive ce in seama de intensitatea relaiilor dintre
variabile i factori i acord ponderi diferite variabilelor.
Avnd n vedere c variabilele observate indic mai puternic sau mai modest
dimensiunea latent (factorul) cercetat, acestea capt ponderi (weights) diferite n
indicele final. Ponderea este dat de un scor (un numr) cu care multiplicm
valoarea variabilei respective pentru fiecare caz (individ statistic).
Acest scor ne este furnizat n urma analizei factoriale i apare ca o nou variabil
n baza de date (cu valori diferite pentru fiecare obiect din eantion).
Scorul poate fi determinat prin mai multe metode:
1. Metoda regresiei. Scorul este o estimat a coeficientului de regresie dintre factor

i variabil. Se caut obinerea unui factor F estimat astfel nct corelaia dintre
factorul latent F i variabil s fie maxim.
2. Metoda Bartlett. Varianele datorate factorilor de unicitate sunt considerate erori
de eantionare, deci drept aleatoare. Se acord astfel scoruri mai sczute
variabilelor care prezint erori mai mari prin mprirea la erori.
3. Metoda Rubin-Anderson. Utilizeaz aceeai procedur de estimare a diferenei
ptratice dintre factorii estimai i variabilele observate, dar pune condiia c
factorii estimai sunt ortogonali doi cte doi.
Contruirea unor indici (scale) aditive
Conform modelului nostru:
Pattern Matrixa
S fac coala = 0.78*F1 0.13*F2 + U1
Factor
S munceasc mult =0.67*F1 + U2
1 2
S fac scoal? ,785 -,137
S fie deteapt = 0.64*F1 + U3
S munceas c mult? ,670 S cread n Dumnezeu=0.34*F1+0.1*F2
S fie
,643
..
S cread n Dumnezeu? ,348 ,101
S stie s s e descurce? ,269 ,208 Index efort personal =
S aib relatii? ,755
S se nas c ntr-o familie
rv7*score_F1 + rv8*score_F1
,717
bogat? + rv5*score_F1
S aib noroc/ s ans? ,187 ,447
S fure? -,194 ,348
S arate bine? ,236 ,306
Extraction Method: Maximum Likelihood. Index factori externi =
Rotation Method: Oblimin with Kaiser Normalization.
a. Rotation converged in 7 iterations . rv2*score_F2 + rv1*score_F2
+ rv3*score_F2
Celelalte variabile nu au o apartenen clar la nici

unul dintre cei doi indeci.

Mca 2008 6

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Mca 2008 6

Încărcat de

Drepturi de autor:

Formate disponibile

Metode cantitative avansate

Tema 5-7: Analiza factoriala (II)

George H. Dunteman. 1989. Principal Components Analysis. Newbury Park,

bij = r(Xi,Fj) pentru i = 1, ..., m, j = 1, ..., n

Comunalitatea variabilei Xi:

hi2 = bi12 + bi22 + ... + bin2

r(X1,X1) r(X1,X2) ... r(X1,Xm) 1 0 ... 0

Figura 9. Formula de calcul al indicelui KMO.

n analiza componentelor principale (principal

De ci factori avem nevoie pentru a reprezenta datele?

Prin rotaia factorilor ncercm s obinem exact acest

Metoda ortogonal varimax urmeaz criteriul

Pentru ca o persoan din Romnia de

rv1 s se nasc ntr-o familie bogat? Variante de rspuns:

Exist o varian comun n cazul acestui set de indicatori?

S se nas c S aib S fie S

Exist factori lateni care explic variana comun a

ncercm s realizm o analiz exploratorie deoarece

rv10 U10 Corelaiile dintre factori i variabile

VAR (rv1) = b112 + b122 + b11 * b12 * 2 r(F1, F2) - d12

Comunalitatea lui rv1 (partea din Ceea ce rmne ne-explicat de

S se nas c S aib S fie S

Avem o diferen statistic semnificativ ntre

Primul factor explic

Soluia factorial optim este cea cu doi factori extrai.

Interpretarea coeficientului de corelaie ca un produs vectorial

Coeficientul de corelaie a lui Pearson rX1,X2 =X1*X2*cos

Noi nu cunoatem lungimea vectorilor, doar valoarea coeficientului de corelaie.

Interpretarea coeficientului de corelaie ca un produs vectorial

Coeficientul de corelaie a lui Pearson rX1,X2 =X1*X2*cos

efectul efectul efectele indirecte

Variana = comunalitatea + variana datorat factorului unic U

Dac presupunem c factorii nu sunt corelai, atunci matricea de structur

Rotated Factor Matrix Matricea de structur dup rotirea ortogonal a factorilor

Structure Matrix: Matricea corelaiilor dintre factori i variabile

Primul factor reflecta dimensiunea efortului personal (educaie,

1. Metoda regresiei. Scorul este o estimat a coeficientului de regresie dintre factor

Celelalte variabile nu au o apartenen clar la nici

S-ar putea să vă placă și

Coeficientul de corelaie a lui Pearson rX1,X2 =X1X2cos

Coeficientul de corelaie a lui Pearson rX1,X2 =X1X2cos