Documente Academic
Documente Profesional
Documente Cultură
de cercetare sociala
Bibliografie: Capitolul 4
X1 U1
F1
X2 U2
F2
X3 U3
... ... ...
Fn
Xm Um
F1 F2 ... Fn
X1 = b11 F1 + b12 F2 + ... + b1n Fn + d1 U1
X1 b11 b12 ... b1n
X2 = b21 F1 + b22 F2 + ... + b2n Fn + d2 U2 X2 b21 b22 ... b2n
... ...
Xm = bm1 F1 + bm2 F2 + ... + bmn Fn + dm Um Xm bm1 bm2 ... bmn
Pentru factori ortogonali doi cte doi (independeni):
r(Xi,Xk) = bi1 bk1 + bi2 bk2 + bi3 bk3 + ... + bin bkn
Realizarea unei analize factoriale
1. Definirea problemei de cercetare:
2. Matricea de corelaie: existena unei corelaii suficient
de mari ntre variabile.
testul de sfericitate Bartlett
matricea de corelaii anti-imagine
indicele Kaiser-Meyer-Olkin (KMO)
Figura 8. Ipoteza testului de sfericitate Bartlett.
r(X , X )
i ji
i j
2
KMO =
r(X , X ) a (X , X )
i ji
i j
2
i ji
i j
2
unde a(Xi, Xj) este coeficientul de corelaie parial ntre Xi i Xj cnd toate
celelalte variabile sunt controlate.
Realizarea unei analize factoriale
3. Extragerea factorilor.
Algoritmul de extragere pornete de la ipoteza unui factor comun
unic, dup care se testeaz discrepana dintre matricea de corelaii
observate i cea produs prin model. Dac testul este respins
(discrepana dintre cele dou seturi de corelaii este prea mare din
punct de vedere statistic), atunci se estimeaz
un model cu doi factori. Acestui nou model i se aplic de asemenea
testul discrepanei dintre matricile de corelaii. Dac testul nu este
trecut, se mai adaug nc un factor i se estimeaz
un nou model. Acest algoritm continu pn cnd testul
discrepanei este trecut.
Exist mai multe metode de extragere a factorilor, n funcie de
criteriile de testare a discrepanei dintre cele dou matrici de
corelaie.
(a) metoda celor mai mici ptrate the least squares method,
(b) metoda probabilitii maxime - the maximum likelihood method,
(c) metoda de extragere factorial Alpha Alpha factoring,
(d) analiza imaginii image factoring,
(e) metoda factorilor principali principal axis factoring,
(f) metoda componentelor principale principal component
analysis.
Una din diferenele conceptuale fundamentale ntre aceste
metode, care distinge ntre analiza componentelor
principale (f) i toate celelalte, poate fi descris n felul
urmtor. Variana total a variabilelor observate poate fi
descompus astfel:
(1) variana comun (comunalitatea), adic totalul varianei
variabilelor care se datoreaz factorilor comuni,
(2) variana specific (unicitatea), datorat factorilor unici, i
(3) eroarea introdus de msurare, eantionare, culegerea
datelor etc.
Primul factor extras va corespunde valorii proprii celei mai mari, cu alte
cuvinte primul factor extras este cel care explic cel mai mult
din variana variabilelor observate. Urmtorul factor extras va
explica ct mai mult din restul de varian rmas neexplicat, i aa
mai departe.
La ci factori ne oprim?
Factor1 Factor2
X1 0.83 -0.15
X2 0.76 -0.24
X3 0.90 -0.35
X4 0.20 0.80
X5 0.25 0.85
1.0
X5
X4
.8
.6
.4
.2
0.0
X1
FACTOR2
-.2 X2
X3
-.4
0.0 .2 .4 .6 .8 1.0
FACTOR1
Metode de rotaie a factorilor: ortogonale i oblice
S aib Pears on Correlation ,347** ,216** ,389** 1 ,287** ,268** ,214** ,124** ,147** ,107**
noroc/ Sig. (2-tailed) ,000 ,000 ,000 , ,000 ,000 ,000 ,000 ,000 ,000
s ans? N 2016 2013 2023 2044 2030 2034 2013 2031 2033 1926
S cread n Pears on Correlation ,097** ,115** ,162** ,287** 1 ,248** ,136** ,241** ,222** -,037
Dumnezeu? Sig. (2-tailed) ,000 ,000 ,000 ,000 , ,000 ,000 ,000 ,000 ,103
N 2015 2013 2014 2030 2047 2029 2011 2029 2031 1926
S fie Pears on Correlation ,147** ,243** ,190** ,268** ,248** 1 ,240** ,474** ,402** -,059**
des teapt/in Sig. (2-tailed) ,000 ,000 ,000 ,000 ,000 , ,000 ,000 ,000 ,010
teligent? N 2017 2014 2021 2034 2029 2041 2016 2029 2029 1926
S arate Pears on Correlation ,286** ,145** ,258** ,214** ,136** ,240** 1 ,240** ,157** ,164**
bine? Sig. (2-tailed) ,000 ,000 ,000 ,000 ,000 ,000 , ,000 ,000 ,000
N 1999 1999 2002 2013 2011 2016 2021 2014 2013 1912
S fac Pears on Correlation ,067** ,209** ,069** ,124** ,241** ,474** ,240** 1 ,523** -,131**
s coal? Sig. (2-tailed) ,003 ,000 ,002 ,000 ,000 ,000 ,000 , ,000 ,000
N 2012 2013 2016 2031 2029 2029 2014 2041 2031 1925
S Pears on Correlation ,081** ,213** ,061** ,147** ,222** ,402** ,157** ,523** 1 -,104**
munceasc Sig. (2-tailed) ,000 ,000 ,006 ,000 ,000 ,000 ,000 ,000 , ,000
mult? N 2015 2011 2015 2033 2031 2029 2013 2031 2042 1926
S fure? Pears on Correlation ,214** ,115** ,198** ,107** -,037 -,059** ,164** -,131** -,104** 1
Sig. (2-tailed) ,000 ,000 ,000 ,000 ,103 ,010 ,000 ,000 ,000 ,
N 1911 1927 1917 1926 1926 1926 1912 1925 1926 1937
**. Correlation is significant at the 0.01 level (2-tailed).
Observm c exist sub-seturi de variabile care
coreleaz relativ puternic ntre ele.
Goodness-of-fit Test
Chi-Square df Sig.
182,705 26 ,000
Bartlet t's Test of Approx . Chi-Square 3351,885 Exist o diferen statistic semnificativ ntre
Sphericity df 45 matricea corelaiilor dintre variabile i matricea
Sig. ,000 unitate. Avem o ans apropiat de zero
(sig.=0.000) de a obine aceast valoare a lui
HI-ptrat dac variabilele supuse analizei nu ar
fi corelate ntre ele.
Comunaliti (communalities)
Iniiale Extrase
s aib relaii? ,378 ,580
s arate bine? ,165 ,184 37,8% din variana primei variabile
s cread n Dumnezeu? ,150 ,148 este datorat corelaiilor
s aib noroc/ans? ,248 ,276 (covarianei) din setul de date.
s fac coal? ,382 ,582
(comunalitatea iniial a primei
s fie inteligent? ,316 ,424
variabile este 0,378).
s fure? ,113 ,126
n urma extraciei factorilor, 58%
s munceasc mult? ,307 ,426
din variana primei variabile este
s tie s se descurce? ,128 ,143
s se nasc ntr-o familie bogat? ,360 ,515 explicat de factorii in model
Extraction Method: Maximum Likelihood. (comunalitatea extras este 0,580).
Total Variance Explained
Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings
Factor Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %
1 2,787 27,866 27,866 2,176 21,756 21,756 1,803 18,031 18,031
2 1,781 17,813 45,679 1,229 12,287 34,043 1,601 16,011 34,043
3 ,966 9,656 55,335
4 ,875 8,752 64,087
5 ,828 8,277 72,364
6 ,680 6,804 79,168
7 ,633 6,329 85,497
8 ,576 5,755 91,252
9 ,452 4,516 95,768
10 ,423 4,232 100,000
Extraction Method: Maximum Likelihood.
Factor Matrixa
Factor
Acest model este destul de
1 2
S aib relatii?
dificil de interpretat.
,572 ,503
S fie Oare nu am putea redistribui
des teapt/inteligent?
,565 -,324 variana comun explicat de
S fac scoal? ,562 -,516 factori a ntregului set de
S se nas c ntr-o familie variabile astfel nct modelul
bogat?
,524 ,490 relaiilor dintre factori i
S munceas c mult? ,492 -,428 fiecare dintre variabile s fie
S aib noroc/ sans? ,483 ,206 ct mai clar i adecvat unei
S arate bine? ,421 interpretri teoretice?
S stie s se des curce? ,378 Aceasta este problema rotaiei
S cread n Dumnezeu? ,367 -,118 factorilor.
S fure? ,343
Extraction Method: Maximum Likelihood.
a. 2 factors extracted. 4 iterations required.
Dac presupunem c factorii sunt independeni, atunci sistemul de axe este ortogonal
iar saturaiile factorilor sunt egali cu coeficienii de corelaie Pearson dintre variabile i
factori.
Corelaia dintre factori: rF1F2=F1*F2* cos 90 = F1 *F2 * 0 = 0.
Putem roti soluia factorial pstrnd independena (ortogonalitatea) factorilor.
F1
b11 X1
b21 X2
F2
b11 b22
F1
b11 X1
b21 X2
F2
b11 b22
rX1 X2 = b11 * b21 + b12 * b22 + b11 * b22 * rF1F2 + b21 * b12 * rF1F2
Saturaiile factorilor (b11, b21 pentru F1, b12, b22 pentru F2 etc.) vor fi egale cu
coeficienii de corelaie pariali, obinui prin controlarea efectelor celorlali factori.
Saturaiile pot fi interpretate ca i coefieni de regresie multinear standardizai (beta).
rX1 X2 = b11 * b21 + b12 * b22 + b11 * b22 * rF1F2 + b21 * b12 * rF1F2
Avnd n vedere c variabilele observate indic mai puternic sau mai modest
dimensiunea latent (factorul) cercetat, acestea capt ponderi (weights) diferite n
indicele final. Ponderea este dat de un scor (un numr) cu care multiplicm
valoarea variabilei respective pentru fiecare caz (individ statistic).
Acest scor ne este furnizat n urma analizei factoriale i apare ca o nou variabil
n baza de date (cu valori diferite pentru fiecare obiect din eantion).
Scorul poate fi determinat prin mai multe metode: