Sunteți pe pagina 1din 31

Metode cantitative avansate de cercetare sociala

Tema 5-7: Analiza factoriala (II)


Bibliografie: Capitolul 4
George H. Dunteman. 1989. Principal Components Analysis. Newbury Park, Ca.: Sage Publications. Jae-On Kim, Charles W. Mueller. 1978a. Introduction to Factor Analysis. What It Is and How to Do It. Newbury Park, Ca.: Sage Publications. Jae-On Kim, Charles W. Mueller. 1978b. Factor Analysis. Statistical Methods and Practical Issues. Newbury Park, Ca.: Sage Publications. J. Scott Long. 1983. Confirmatory Factor Analysis. Newbury Park, Ca.: Sage Publications.

Recapitulare: Elementele critice intr-o analiza factoriala


Urmarim sa identificam structuri de corelatii puternice intre variabile, pe care le punem pe seama unor fatori latenti Construim un model teoretic, un care variabilele observate Xi, i=1,m sunt determinate de factorii Fj, j=1,n. [n<m]. corelatiile pot fi exprimate in functie de de saturatii, pe care vrem sa le punem in acord cu corelatiile observate empiric baza de calcul a factorilor. Factorii vor fi extrasi rind pe rind, astfel incit sa explice mai mult din varianta totala a variabilelor.
[Nota: consultati prezentarea nr. 1, si prezentarile ppt de pe site-ul cursului.]

Figura 1: Modelul general al analizei factoriale, cu m variabile observate, n factori comuni ortogonali.

X1 F1 X2 F2 ... Fn Xm X3 ...

U1 U2 U3 ...

Um
F1 b11 b21 bm1 F2 b12 b22 bm2 ... ... ... ... Fn b1n b2n bmn

X1 = b11 F1 + b12 F2 + ... + b1n Fn + d1 U1 X2 = b21 F1 + b22 F2 + ... + b2n Fn + d2 U2 ... Xm = bm1 F1 + bm2 F2 + ... + bmn Fn + dm Um

X1 X2 ... Xm

Pentru factori ortogonali doi cte doi (independeni):

bij = r(Xi,Fj)

pentru i = 1, ..., m, j = 1, ..., n

Comunalitatea variabilei Xi:

hi2 = bi12 + bi22 + ... + bin2 r(Xi,Xk) = bi1 bk1 + bi2 bk2 + bi3 bk3 + ... + bin bkn

Realizarea unei analize factoriale


1. Definirea problemei de cercetare: 2. Matricea de corelaie: existena unei corelaii suficient de mari ntre variabile. testul de sfericitate Bartlett matricea de corelaii anti-imagine indicele Kaiser-Meyer-Olkin (KMO)
Figura 8. Ipoteza testului de sfericitate Bartlett. r(X1,X1) r(X2,X1) ... r(Xm,X1) r(X1,X2) ... r(X1,Xm) r(X2,X2) ... r(X2,Xm) = r(Xm,X2) ... r(Xm,Xm) 1 0 ... 0 0 1 ... 0 ... 0 0 ... 1

Figura 9. Formula de calcul al indicelui KMO.

KMO =

r(X , X ) r(X , X ) a (X , X )
i j 2 i ji j i 2 i j i ji i ji

unde a(Xi, Xj) este coeficientul de corelaie parial ntre Xi i Xj cnd toate celelalte variabile sunt controlate.

Realizarea unei analize factoriale


3. Extragerea factorilor.
Algoritmul de extragere pornete de la ipoteza unui factor comun unic, dup care se testeaz discrepana dintre matricea de corelaii observate i cea produs prin model. Dac testul este respins (discrepana dintre cele dou seturi de corelaii este prea mare din punct de vedere statistic), atunci se estimeaz un model cu doi factori. Acestui nou model i se aplic de asemenea testul discrepanei dintre matricile de corelaii. Dac testul nu este trecut, se mai adaug nc un factor i se estimeaz un nou model. Acest algoritm continu pn cnd testul discrepanei este trecut. Exist mai multe metode de extragere a factorilor, n funcie de criteriile de testare a discrepanei dintre cele dou matrici de corelaie.
(a) metoda celor mai mici ptrate the least squares method, (b) metoda probabilitii maxime - the maximum likelihood method, (c) metoda de extragere factorial Alpha Alpha factoring, (d) analiza imaginii image factoring, (e) metoda factorilor principali principal axis factoring, (f) metoda componentelor principale principal component analysis.

Una din diferenele conceptuale fundamentale ntre aceste metode, care distinge ntre analiza componentelor principale (f) i toate celelalte, poate fi descris n felul urmtor. Variana total a variabilelor observate poate fi descompus astfel: (1) variana comun (comunalitatea), adic totalul varianei variabilelor care se datoreaz factorilor comuni, (2) variana specific (unicitatea), datorat factorilor unici, i (3) eroarea introdus de msurare, eantionare, culegerea datelor etc.

n analiza componentelor principale (principal component analysis) se va descompune ntreaga varian a variabilelor. n analiza factorial propriuzis (principal axis factoring) se va descompune doar variana comun a variabilelor.

n analiza factorial ncercm s estimm coeficienii bik, adic saturaiile factoriale pentru fiecare variabil observat, avnd la dispoziie coeficienii de corelaie r(Xi,Xk). Vom pune condiia ca matricea rezidual, adic diferena dintre matricea de corelaie ajustat (R1) i matricea de corelaii rezultat (B BT), s fie ct mai aproape de zero, adic diferenele dintre corelaiile observate i cele rezultate din modelul factorial, s fie minimizate. ntotdeauna putem reproduce corelaiile observate printr-un model care are exact atia factori cte variabile, iar adecvarea modelului pentru date crete odat cu numrul de factori. Noi dorim: o structur redus a datelor, explicarea covarianelor dintre variabile printr-un numr ct mai mic de factori comuni.
Primul factor extras va corespunde valorii proprii celei mai mari, cu alte cuvinte primul factor extras este cel care explic cel mai mult din variana variabilelor observate. Urmtorul factor extras va explica ct mai mult din restul de varian rmas neexplicat, i aa mai departe. La ci factori ne oprim? De ci factori avem nevoie pentru a reprezenta datele?

Oprim descompunerea varianei n momentul n care factorul explic mai puin dect variana unei singure variabile, adic atunci cnd valoarea proprie corespunztoare factorului este mai mic dect 1. Examinarea graficului care reprezint valorile proprii (scree plot). Alt soluie este s stabilim un procent de varian care s fie explicat (n mod obinuit acesta se alege 70% sau 80%), i s ne oprim atunci cnd variana explicat de factori, cumulat, depete acest prag. Unii autori sugereaz c nu trebuie s ne bazm automat pe astfel de criterii formale i c numrul de factori obinut prin aplicarea acestor teste trebuie s ne indice doar numrul maxim de factori. Factorii pe care i vom reine trebuie s fie substaniali i interpretabili teoretic (ndeosebi dup rotaie).

Realizarea unei analize factoriale


4. Rotaia factorilor
Prin rotaia factorilor ncercm s obinem exact acest lucru. Prin transformri ale matricii de saturaii iniiale urmrim s ajungem la o matrice mai simpl, care s fie uor de interpretat. Problema rotaiei factorilor este o problem de transformare a datelor ntr-un model factorial lipsit de ambiguiti n ceea ce privete semnificaia factorilor. Astfel, o transformare care s micoreze complexitatea factorial a variabilelor i s mreasc gradul lor de determinare factorial ne-ar uura substanial nelegerea, interpretarea, numirea factorilor. Termenul de rotaie denumete exact ceea ce implic: sistemul de axe ortogonale reprezentat de factori este rotit n jurul originii ntr-o alt poziie.

Figura 10. Obinerea unei structuri simple prin examinarea configuraiei grafice a variabilelor. X1 X2 X3 X4 X5 Factor1 0.83 0.76 0.90 0.20 0.25 Factor2 -0.15 -0.24 -0.35 0.80 0.85

1.0 X5 X4 .8

.6

.4

.2

0.0

FACTOR2

X1 -.2 X2 X3 -.4 0.0 .2 .4 .6 .8 1.0

FACTOR1

Metode de rotaie a factorilor: ortogonale i oblice


Metoda ortogonal varimax urmeaz criteriul simplificrii coloanelor matricii factoriale, maximiznd variana dat de ptratul saturaiilor pentru fiecare factor. Cu alte cuvinte, minimizeaz numrul de variabile cu saturaii factoriale mari pentru fiecare factor, simplificnd astfel interpretarea factorilor. Metoda ortogonal quartimax folosete alt criteriu de simplificare, i anume maximizeaz variana dat de ptratul saturaiilor pentru fiecare variabil. Prin aceasta se minimizeaz numrul de factori care explic fiecare variabil (se reduce complexitatea factorial a variabilelor). O metod ortogonal care aplic ambele criterii de simplificare este equamax. Aceasta minimizeaz numrul de variabile care satureaz un factor i numrul de factori necesari pentru a explica variana unei variabile.

Realizarea unei analize factoriale


5. Interpretarea factorilor
n general interpretarea factorilor este facilitat atunci cnd variabilele satureaz n mod semnificativ doar unul

din factori.
Numele factorului i definiia sa nu pot fi date dect de cercettor. El este cel care va sintetiza coninutul variabilelor care satureaz un factor ntr-un concept

denominat printr-o etichet sau o descriere.

Realizarea unei analize factoriale


6. Scoruri factoriale, scale factoriale i variabile surogat.
Odat identificate dimensiunile latente ale unui set de date, analistul poate dori s examineze comportamentul cazurilor n funcie de aceste dimensiuni, i nu doar n funcie de variabilele date. Mai mult, el poate dori s obin cte o variabil pentru fiecare dintre aceti factori, care s poat fi folosite n continuare ca variabile explicative n locul setului iniial de variabile, mai numeros. Exist dou opiuni principale pentru a face acest lucru.
(1) Examinnd matricea factorial (matricea saturaiilor factoriale), analistul poate selecta variabila cu cel mai mare scor factorial pentru un anume factor ca reprezentativ pentru dimensiunea factorial respectiv (variabil surogat). (2) Analistul poate construi o scal factorial (o variabil care s reprezinte factorul respectiv), dat de scoruri factoriale pentru fiecare obiect din eantion.

Exemplu: Care sunt factorii crora li se atribuie succesul n via? Explicai utiliznd setul de variabile vr1 vr10 din BOP 2003!

Pentru ca o persoan din Romnia de azi s reueasc n via, ct de important este.


rv1 s se nasc ntr-o familie bogat? rv2 . s aib relaii? rv3 s aib noroc/ans? rv4 s cread n Dumnezeu? rv5 s fie deteapt/inteligent? rv6 s arate bine? rv7 s fac coal? rv8 s munceasc mult? rv9 s fure? rv10 s tie s se descurce?
Variante de rspuns:
1. Foarte important
2. Important 3. Destul de important 4. Puin important 5. Deloc important 8. NS (recodat ca missing value) 9. NR (recodat ca missing value)

Exist o varian comun n cazul acestui set de indicatori? Care variabile coreleaz ntre ele i n ce msur?

Care sunt direciile corelaiilor dintre variabile (pozitive sau negative)?

Corelaiile observate:
Correlations S se nasc ntr-o familie S stie s se bogat? descurce? 1 ,168** , ,000 2027 1999 ,168** 1 ,000 1999 ,566** ,000 2011 ,347** ,000 2016 ,097** ,000 2015 ,147** ,000 2017 ,286** ,000 1999 ,067** ,003 2012 ,081** ,000 2015 ,214** ,000 1911 , 2025 ,227** ,000 2003 ,216** ,000 2013 ,115** ,000 2013 ,243** ,000 2014 ,145** ,000 1999 ,209** ,000 2013 ,213** ,000 2011 ,115** ,000 1927 S aib S fie noroc/ S cread n desteapt/i S arate sans? Dumnezeu? nteligent? bine? ,347** ,097** ,147** ,286** ,000 ,000 ,000 ,000 2016 2015 2017 1999 ,216** ,115** ,243** ,145** ,000 2013 ,389** ,000 2023 1 , 2044 ,287** ,000 2030 ,268** ,000 2034 ,214** ,000 2013 ,124** ,000 2031 ,147** ,000 2033 ,107** ,000 1926 ,000 2013 ,162** ,000 2014 ,287** ,000 2030 1 , 2047 ,248** ,000 2029 ,136** ,000 2011 ,241** ,000 2029 ,222** ,000 2031 -,037 ,103 1926 ,000 2014 ,190** ,000 2021 ,268** ,000 2034 ,248** ,000 2029 1 , 2041 ,240** ,000 2016 ,474** ,000 2029 ,402** ,000 2029 -,059** ,010 1926 ,000 1999 ,258** ,000 2002 ,214** ,000 2013 ,136** ,000 2011 ,240** ,000 2016 1 , 2021 ,240** ,000 2014 ,157** ,000 2013 ,164** ,000 1912 S S fac munceasc scoal? mult? S fure? ,067** ,081** ,214** ,003 ,000 ,000 2012 2015 1911 ,209** ,213** ,115** ,000 2013 ,069** ,002 2016 ,124** ,000 2031 ,241** ,000 2029 ,474** ,000 2029 ,240** ,000 2014 1 , 2041 ,523** ,000 2031 -,131** ,000 1925 ,000 2011 ,061** ,006 2015 ,147** ,000 2033 ,222** ,000 2031 ,402** ,000 2029 ,157** ,000 2013 ,523** ,000 2031 1 , 2042 -,104** ,000 1926 ,000 1927 ,198** ,000 1917 ,107** ,000 1926 -,037 ,103 1926 -,059** ,010 1926 ,164** ,000 1912 -,131** ,000 1925 -,104** ,000 1926 1 , 1937 S se nasc ntr-o familie bogat? S stie s se descurce? S aib relatii? Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N S aib relatii? ,566** ,000 2011 ,227** ,000 2003 1 , 2028 ,389** ,000 2023 ,162** ,000 2014 ,190** ,000 2021 ,258** ,000 2002 ,069** ,002 2016 ,061** ,006 2015 ,198** ,000 1917

S aib noroc/ sans? S cread n Dumnezeu? S fie desteapt/in teligent? S arate bine? S fac scoal? S munceasc mult? S fure?

**. Correlation is significant at the 0.01 level (2-tailed).

Observm c exist sub-seturi de variabile care coreleaz relativ puternic ntre ele.
Exist factori lateni care explic variana comun a sub-seturilor de variabile observate? Cu alte cuvinte, putem considera c exist o tipologie a rspunsurilor i factori lateni care determin aceast tipologie? ncercm s realizm o analiz exploratorie deoarece nu tim ci factori avem, nici dac acetia coreleaz sau nu.

Un model simplu ar putea fi: rv1 F1 rv2 . F2 . .


Efect direct al lui F2 Efect indirect, mediat de F1

U1 r (rv1, F1) = b11 + b12 * r(F1,F2) U2 r (rv1, F2) = b12 + b211 *r(F1,F2)

rv10

U10

Corelaiile dintre factori i variabile sunt prezentate n matricea structur (Structure Matrix) din SPSS output.

VAR (rv1) = b112 + b122 + b11 * b12 * 2 r(F1, F2) - d12


Comunalitatea lui rv1 (partea din varian explicat de factori) Ceea ce rmne ne-explicat de factori din variana lui rv1

b11 este saturaia lui F1 (factor loading F1) iar b12 este saturaia lui F2 (factor loading F2). Aceste saturaii sunt prezentate n matricea saturaiilor factoriale (Factor Matrix sau Factor Loadings Matrix) din SPSS output. Dac noi alegem un model n care factorii sunt independeni, atunci corelaiile dintre factori i variabile se reduc la efectele directe, deci sunt identice cu saturaiile (factor loadings).

Extracia factorilor:
Construim un model al relaiilor dintre factori i variabile astfel nct diferena dintre corelaiile observate i cele re-construite (reproduced correlations) s fie ct mai mic.
Reproduced Correlations S se nasc ntr-o familie bogat? Reproduced Correlation S se nasc ntr-o familie bogat? S stie s se descurce? S aib relatii? S aib noroc/ sans? S cread n Dumnezeu? S fie desteapt/inteligent? S arate bine? S fac scoal? S munceasc mult? S fure? S se nasc ntr-o familie bogat? S stie s se descurce? S aib relatii? S aib noroc/ sans? S cread n Dumnezeu? S fie desteapt/inteligent? S arate bine? S fac scoal? S munceasc mult? S fure? ,515 ,197 ,546 ,354 ,135 ,137 ,261 4,165E-02 4,790E-02 ,215
b

S stie s se descurce? ,197 ,143 b ,215 ,182 ,139 ,214

S aib relatii? ,546 ,215 ,580 b ,380 ,151 ,160

S aib noroc/ sans? ,354 ,182 ,380 ,276 b ,153 ,206 ,221 ,165 ,149 ,114 -2,06E-02

S cread n Dumnezeu? ,135 ,139 ,151 ,153 ,148 b ,245 ,145 ,267 ,231 -7,395E-03 -4,674E-02 -2,616E-02 1,624E-04 ,135

S fie desteapt/i nteligent? ,137 ,214 ,160 ,206 ,245 ,424


b

S arate bine?

S fac scoal?

S munceasc mult? 4,790E-02

S fure? ,215

,261 4,165E-02 ,159 ,214 ,283 6,187E-02 ,221 ,165 ,145 ,267 ,211
b

,187 3,333E-02 6,590E-02 ,224 ,149 ,114 ,231 -7,39E-03 ,417 -6,04E-02

,485 ,194 ,582 b ,498 -,126

,159 ,283 ,214 6,187E-02 ,187 6,590E-02 3,333E-02 ,224 -3,280E-02 1,566E-02

,211 ,184 ,485 ,194 ,417 ,172 -6,037E-02 6,622E-02

,172 6,622E-02 ,498 -,126 ,426 b -,103 -,103 ,126 b 2,268E-02 -2,29E-03

Residuala

-2,378E-02 2,373E-02 1,408E-02 1,697E-02 2,552E-04 4,050E-02 9,117E-03 -2,14E-02 -1,02E-02 -2,98E-02 6,989E-03 -1,46E-02 -5,10E-02 -5,90E-03 -1,35E-02 5,076E-03 -3,40E-03

-3,280E-02 1,566E-02 -2,063E-02 -4,674E-02 -2,378E-02 2,373E-02 1,408E-02 2,268E-02 -2,293E-03

5,831E-03 2,858E-02 5,831E-03 -2,85E-03 2,858E-02 -2,85E-03 -2,616E-02 1,624E-04 ,135 1,697E-02 2,552E-04 4,050E-02 -2,139E-02 -2,98E-02 -1,020E-02 6,989E-03 2,308E-02 -1,06E-02 7,841E-02 -2,82E-02 -1,46E-02 -5,10E-02 -8,71E-03 -5,73E-03

2,308E-02 7,841E-02 -1,056E-02 -2,82E-02 -8,712E-03 -5,73E-03 -1,445E-02 -3,31E-02 -1,279E-02 -1,94E-03

9,117E-03 -5,895E-03 -1,345E-02 -1,445E-02 -3,315E-02

5,076E-03 2,904E-02 -3,396E-03 2,904E-02 -1,279E-02 -2,04E-02 1,121E-02 -1,942E-03 9,804E-02 -1,65E-02

-2,041E-02 9,804E-02 1,121E-02 -1,65E-02 -2,62E-03 -2,624E-03

Extraction Method: Maximum Likelihood. a. Residuals are computed between observed and reproduced correlations. There are 4 (8,0%) nonredundant residuals with absolute values greater than 0.05. b. Reproduced communalities

Extracia factorilor:
Diferena dintre corelaiile observate i cele re-construite (reproduse) este msurat ca suma ptratic a diferenelor i interpretat ca o msur de tip CHI-ptrat. Se testeaz semnificaia statistic a diferenelor pe baza distribuiei lui CHI-ptrat.

Goodness-of-fit Test Chi-Square 182,705 df 26 Sig. ,000

Avem o diferen statistic semnificativ ntre matricea corelaiilor observate i matricea corelaiilor reproduse. Modelul nostru simplific considerabil realitatea complexitatea relaiilor dintre variabile.

Cum au fost extrai factorii?

Rezultatele extraciei factorilor:


KMO and Bartlett's Tes t Kais er-Mey er-Olkin Measure of Sampling Adequacy . Bartlett's Tes t of Spheric ity Approx. Chi-Square df Sig. ,756 3351,885 45 ,000

Testul de adecvare a eantionrii ne arat c analiza este statistic semnificativ.


Exist o diferen statistic semnificativ ntre matricea corelaiilor dintre variabile i matricea unitate. Avem o ans apropiat de zero (sig.=0.000) de a obine aceast valoare a lui HI-ptrat dac variabilele supuse analizei nu ar fi corelate ntre ele.

Comunaliti (communalities) Iniiale s aib relaii? s arate bine? s cread n Dumnezeu? s aib noroc/ans? s fac coal? s fie inteligent? s fure? s munceasc mult? s tie s se descurce? s se nasc ntr-o familie bogat? Extraction Method: Maximum Likelihood. ,378 ,165 ,150 ,248 ,382 ,316 ,113 ,307 ,128 ,360 Extrase ,580 ,184 ,148 ,276 ,582 ,424 ,126 ,426 ,143 ,515

37,8% din variana primei variabile este datorat corelaiilor (covarianei) din setul de date. (comunalitatea iniial a primei variabile este 0,378). n urma extraciei factorilor, 58% din variana primei variabile este explicat de factorii in model (comunalitatea extras este 0,580).

Total Variance Explaine d Initial Eigenvalues % of Varianc e Cumulativ e % 27,866 27,866 17,813 45,679 9,656 55,335 8,752 64,087 8,277 72,364 6,804 79,168 6,329 85,497 5,755 91,252 4,516 95,768 4,232 100,000 Ex traction Sums of Squared Loadings Total % of Varianc e Cumulativ e % 2,176 21,756 21,756 1,229 12,287 34,043 Rotation Sums of Squared Loadings Total % of Varianc e Cumulativ e % 1,803 18,031 18,031 1,601 16,011 34,043

Factor 1 2 3 4 5 6 7 8 9 10

Total 2,787 1,781 ,966 ,875 ,828 ,680 ,633 ,576 ,452 ,423

Ex traction Method: Max imum Likelihood.

Primul factor explic variana corespunztoare a 2,78 variabile, iar factorul al doilea variana a 1,78 variabile. Toi ceilali factori extrai explic mai puin dect variana unei unei variabile.

Primul factor explic 27,8% din variana comun total a variabilelor, iar cel de-al doilea 17,8%. Cumulat, primii doi factori extrai explic 45% din variana comun total a variabilelor.

Pentru soluia factorial iniial, suma ptratelor saturaiilor factoriale este 2,176 pentru F1 i 1,229 pentru F2. Factorul F1 explic 21,5% din variana total a variabilelor, iar F2 12,8%. Cumulat, ptratul saturaiilor factoriale constituie 34% din variana total a variabilelor. Dup rotaia factorilor, suma ptratelor saturaiilor este 1,803 pentru F1 i 1,601 pentru F2. Observm c proporia de varian total explicat cumulat de F1 i F2 nu se schimb n urma rotaiei factorilor (este tot 34%!). Se schimb valoarea saturaiilor pentru fiecare factor, dar NU se schimb suma ptratelor acestor saturaii.

Soluia factorial optim este cea cu doi factori extrai.

Soluia (modelul) factorial iniial:


Factor Matrixa Factor S aib relatii? S fie desteapt/inteligent? S fac scoal? S se nasc ntr-o familie bogat? S munceasc mult? S aib noroc/ sans? S arate bine? S stie s se descurce? S cread n Dumnezeu? S fure? 1 ,572 ,565 ,562 ,524 ,492 ,483 ,421 ,378 ,367 2 ,503 -,324 -,516 ,490 -,428 ,206

-,118 ,343

Acest model este destul de dificil de interpretat. Oare nu am putea redistribui variana comun explicat de factori a ntregului set de variabile astfel nct modelul relaiilor dintre factori i fiecare dintre variabile s fie ct mai clar i adecvat unei interpretri teoretice? Aceasta este problema rotaiei factorilor.

Extraction Method: Maximum Likelihood. a. 2 factors extracted. 4 iterations required.

Dac presupunem c factorii sunt independeni, atunci sistemul de axe este ortogonal iar saturaiile factorilor sunt egali cu coeficienii de corelaie Pearson dintre variabile i factori. Corelaia dintre factori: rF1F2=F1*F2* cos 90 = F1 *F2 * 0 = 0. Putem roti soluia factorial pstrnd independena (ortogonalitatea) factorilor.
Interpretarea coeficientului de corelaie ca un produs vectorial F1 b11 X1

b21

X2

F2 b11 b22 Coeficientul de corelaie a lui Pearson rX1,X2 =X1*X2*cos Cos 90=0 Cos 0=1

Noi nu cunoatem lungimea vectorilor, doar valoarea coeficientului de corelaie. Acesta poate fi descompus n funcie de saturaiile factorilor: rX1 X2 = b11 * b21 + b12 * b22 + b11 * b22 * rF1F2 + b21 * b12 * rF1F2 Dac factorii sunt ortogonali, atunci rX1 X2 = b11 * b21 + b12 * b22

Dac presupunem c factorii sunt corelai, atunci sistemul de axe NU este ortogonal, ci oblic. Saturaiile factorilor (efectele directe ale fiecrui factor) vor diferi de coeficienii de corelaie dintre factori i variabile, pentru c o parte din corelaie se datoreaz corelaiei dintre factori (efecte indirecte ale factorilor prin ceilali factori). Corelaia dintre factori : rF1F2=F1*F2* cos Putem roti soluia factorial presupunnd c factorii coreleaz (rotaie oblic).
Interpretarea coeficientului de corelaie ca un produs vectorial F1 b11 X1

b21

X2

F2 b11 b22 Coeficientul de corelaie a lui Pearson rX1,X2 =X1*X2*cos Cos 90=0 Cos 0=1

rX1 X2 = b11 * b21 + b12 * b22 + b11 * b22 * rF1F2 + b21 * b12 * rF1F2

Saturaiile factorilor (b11, b21 pentru F1, b12, b22 pentru F2 etc.) vor fi egale cu coeficienii de corelaie pariali, obinui prin controlarea efectelor celorlali factori. Saturaiile pot fi interpretate ca i coefieni de regresie multinear standardizai (beta).

rX1 X2 = b11 * b21 + b12 * b22 + b11 * b22 * rF1F2 + b21 * b12 * rF1F2
efectul direct al lui F1 efectul efectele indirecte

direct al lui F2 datorate corelaiei dintre F1 i F2

Variana =

comunalitatea

variana datorat factorului unic U

VAR (X1) = b112 + b122 + b11 * b12 * 2 r F1F2 - d12 Dac presupunem c factorii nu sunt corelai, atunci matricea de structur (Factor Matrix sau Structure Matrix) care prezint corelaiile dintre factori i variabile va fi identic cu matricea saturaiilor (Pattern Matrix sau Pattern Loadings). Dac factorii sunt corelai, atunci acestea au att efecte directe asupra variabilelor (prezentate n matricea saturaiilor Pattern Matrix sau Pattern Loadings) ct i efecte indirecte.

Soluia iniial: Factor Matrix sau Matricea de Structur Corelaiile dintre factori i variabile Factor 1 Factor 2 conform soluiei iniiale. s aib relaii? ,572 ,503 s arate bine? ,565 -,324 s cread n Dumnezeu? ,562 -,516 s aib noroc/ans? ,524 ,490 s fac coal? ,492 -,428 s fie inteligent? ,483 ,206 s fure? ,421 s munceasc mult? ,378 s tie s se descurce? ,367 s se nasc ntr-o familie bogat? ,343 Extraction Method: Maximum Likelihood. 2 Factors extracted. 4 iterations required.

Rotated Factor Matrix Matricea de structur dup rotirea ortogonal a factorilor Factor 1 Factor 2 s fac coal? ,762 Dup rotirea factorilor, observm c s munceasc mult? ,652 variabilele s fac coal, s s fie deteapt/inteligent? ,641 munceasc, s fie inteligent coreleaz s cread n Dumnezeu? ,357 puternic cu primul factor, iar variabilele s s tie s se descurce? ,291 ,241 aib relaii, s se nasc ntr-o familie bogat, s aib noroc cu cel de-al s aib relaii? ,753 doilea factor. Celelalte variabile coreleaz s se nasc ntr-o familie bogat? ,712 doar moderat cu factorii, iar dou dintre s aib noroc/ans? ,238 ,468 ele coreleaz aproximativ la fel cu ambii s arate bine? ,270 ,334 factori extrai. s fure? ,321 Extraction Method: Maximum Likelihood. Rotation Method: Equamax with Kaiser Normalization. a Rotation converged in 3 iterations.

Dac renunm la condiia de independen a factorilor i realizm o rotire oblic atunci matricea de structur (Factor matrix) va fi diferit de matricea saturaiilor (Pattern Matrix sau factor Loadings Matrix).
Pattern Matrix: Matricea saturaiilor Factor 1 Factor 2 s fac coal? ,783 Factor Correlation Matrix s munceasc mult? ,668 s fie deteapt/inteligent? ,642 Factor 1 2 1 s cread n Dumnezeu? ,348 1,000 ,233 s tie s se descurce? ,270 ,209 2 ,233 1,000 s aib relaii? ,753 Extraction Method: Maximum Likelihood. s se nasc ntr-o familie bogat? ,716 Rotation Method: Oblimin with Kaiser Normalization. s aib noroc/ans? ,447 s arate bine? ,346 s fure? ,238 ,306 Corelaia dintre factori este slab, Extraction Method: Maximum Likelihood. Rotation Method: Oblimin with Kaiser Normalization. coeficientul de corelaie a lui a Rotation converged in 8 iterations. Pearson ia valoarea 0.233.

Structure Matrix: Matricea corelaiilor dintre factori i variabile Factor 1 Factor 2 s fac coal? ,752 n acest caz, este de preferat soluia s munceasc mult? ,650 factorial ortogonal deoarece dimensiunile s fie deteapt/inteligent? ,646 sugerate de cei doi factori sunt distincte i s cread n Dumnezeu? ,372 (teoretic) independente. s tie s se descurce? ,319 ,272 Corelaia slab dintre factori, identificat prin s aib relaii? ,208 ,761 rotirea oblic, ne arat c modelul oblic nu s se nasc ntr-o familie bogat? ,718 difer considerabil de cel ortogonal. s aib noroc/ans? ,294 ,492 s arate bine? ,309 ,362 s fure? ,302 Extraction Method: Maximum Likelihood. Rotation Method: Oblimin with Kaiser Normalization.

Interpretare?

Primul factor reflecta dimensiunea efortului personal (educaie, munc, inteligen) pentru a reusi in viata, iar cel de-al doilea factor, a contextului social (relaii, a fi nscut ntr-o familie bogat, a avea noroc). Am putea construi doi indeci, care sa reflecte acesti doi factori: 1. efortul personal (achieved) Index efort 2. elemente contingente, ce nu in de individ (ascribed, contextual) Index factori externi Cum s construim aceti indeci? I. Scale aditive simple, care nu in seama de intensitatea relaiilor dintre factori i variabile.

Index efort = s fac coal + s munceasc mult + s fie deteapt Index factori externi = s aib relaii + s se nasc ntr-o familie bogat + s aib noroc Putem pstra valorile iniiale ale varibilelor, sau le putem recoda n variabile dihotomice, unde 0 nseamn nu e important i 1 important.

Scoruri factoriale
II. Construirea unor scale aditive ce in seama de intensitatea relaiilor dintre variabile i factori i acord ponderi diferite variabilelor. Avnd n vedere c variabilele observate indic mai puternic sau mai modest dimensiunea latent (factorul) cercetat, acestea capt ponderi (weights) diferite n indicele final. Ponderea este dat de un scor (un numr) cu care multiplicm valoarea variabilei respective pentru fiecare caz (individ statistic). Acest scor ne este furnizat n urma analizei factoriale i apare ca o nou variabil n baza de date (cu valori diferite pentru fiecare obiect din eantion). Scorul poate fi determinat prin mai multe metode: 1. 2. 3. Metoda regresiei. Scorul este o estimat a coeficientului de regresie dintre factor i variabil. Se caut obinerea unui factor F estimat astfel nct corelaia dintre factorul latent F i variabil s fie maxim. Metoda Bartlett. Varianele datorate factorilor de unicitate sunt considerate erori de eantionare, deci drept aleatoare. Se acord astfel scoruri mai sczute variabilelor care prezint erori mai mari prin mprirea la erori. Metoda Rubin-Anderson. Utilizeaz aceeai procedur de estimare a diferenei ptratice dintre factorii estimai i variabilele observate, dar pune condiia c factorii estimai sunt ortogonali doi cte doi.

Contruirea unor indici (scale) aditive


Conform modelului nostru:
Pattern Matrixa Factor S fac scoal? S munceasc mult? S fie desteapt/inteligent? S cread n Dumnezeu? S stie s se descurce? S aib relatii? S se nasc ntr-o familie bogat? S aib noroc/ sans? S fure? S arate bine? 1 ,785 ,670 ,643 ,348 ,269 ,101 ,208 ,755 ,717 ,187 -,194 ,236 ,447 ,348 ,306 2 -,137

S fac coala = 0.78*F1 0.13*F2 + U1 S munceasc mult =0.67*F1 + U2 S fie deteapt = 0.64*F1 + U3 S cread n Dumnezeu=0.34*F1+0.1*F2

.. Index efort personal = rv7*score_F1 + rv8*score_F1 + rv5*score_F1

Extraction Method: Maximum Likelihood. Rotation Method: Oblimin with Kaiser Normalization. a. Rotation converged in 7 iterations.

Index factori externi = rv2*score_F2 + rv1*score_F2 + rv3*score_F2

Celelalte variabile nu au o apartenen clar la nici unul dintre cei doi indeci.