Sunteți pe pagina 1din 18

Analiza factorială

Curs ACC
Lect. Univ. Dr. Labăr Adrian Vicențiu

1
Analiza factorială
 Analiza factorială este o tehnică de reducere a datelor folosită pentru a reduce un număr
mare de variabile la un set redus de factori subiacenţi care să exprime informaţiile esenţiale
conţinute în variabilele iniţiale.

 Scopul general al analizei factoriale este descoperirea unui număr redus de factori latenţi
care să reprezinte cât mai bine un număr mare de variabile (observabile) care corelează
între ele.

 Direcţiile de aplicare ale analizei factoriale sunt multiple:


 (1) stabilirea validităţii de construct a unor teste sau chestionare;
 (2) reducerea unui număr mare de variabile la un număr redus de factori;
 (3) simplificarea analizei unor variabile independente puternic corelate (situaţie care poate
fi prezentă în cazul regresiei multiple sau a analizei de varianţă multivariată);
 (4) explorarea unor variabile direct observabile pentru a verifica prezenţa unor variabile
teoretice;
 (5) analiza de item în cazul construirii unor teste sau chestionare.

2
Analiza factorială
 Există două forme fundamentale de analiză factorială:

 A naliza factorială exploratorie (Exploratory factor analysis – EFA) care îşi propune
stabilirea unui număr de factori comuni pentru un set dat de variabile şi identificarea naturii
psihologice a acestora (se poate realiza în SPSS);

 Analiza factorială confirmatorie (Confirmatory factor analysis - CFA) care îşi propune
să testeze ipotezele legate de gradul de adecvare a soluţiilor obţinute în urma analizei
exploratorii (se realizează doar prin anumite programe statistice specializate precum Amos,
Lisrel, Mplus).

3
Analiza factorială

 Criterii privind adecvarea variabilelor la modelul factorial:

 1. Să existe corelaţii între variabile peste .30.

 2. Rezultatele la testul Barlett de sfericitate să fie semnificative.

 Dacă variabilele ar corela doar cu ele însele şi nu ar corela deloc cu celelalte variabile,
atunci matricea de corelaţii ar fi o matrice-identitate care ar avea 1 pe diagonală şi 0 în
rest.

 Testul Barlett verifică ipoteza nulă conform căreia matricea de corelaţii este o matrice-
identitate; dacă rezultatul la acest test este semnificativ atunci putem respinge ipoteza nulă
şi accepta ipoteza de cercetare conform căreia matricea de corelaţii diferă de o matrice-
identitate, ceea ce înseamnă că există anumite relaţii între variabile iar acestea sunt
potrivite pentru a aplica analiza factorială.

4
Analiza factorială

 Criterii privind adecvarea variabilelor la modelul factorial:

 3. Testul KMO (Kaiser-Meyer-Olkin) de măsurare a adecvării (potrivirii) eşantionului de


itemi pentru modelul factorial – peste .50. Există un KMO general, privind adecvarea per
global a itemilor la AF și un KMO pentru fiecare uitem.
 KMO pentru fiecare item se află pe diagonala principală a matricei anti-imagine a
corelaţiilor iar aceştia trebuie să fie peste .50 (în caz contrar variabila respectivă trebuie
înlăturată din modelul factorial şi refăcută analiza factorială).
 Kaiser & Rice (1974) recomandă evaluarea acestui index (KMO) astfel:
valori peste .90 superbe
valori între .80 – .90 foarte bune
valori între .70 – .80 de medie
valori între .60 – .70 mediocre
valori între .50 – .60 mizerabile
valori sub .50 inacceptabile

5
Analiza factorială

 Criterii privind adecvarea variabilelor la modelul factorial:

 4. Evitarea multicoliniarităţii şi a singularităţii. Multicoliniaritatea se referă la


corelaţiile foarte ridicate (peste .80 sau .90) între variabile iar singularitatea (singularity) se
referă la variabilele perfect corelate.

– determinantului matricei de corelaţii trebuie să fie mai mare decât .00001; în caz
contrar, există multicoliniaritate sau singularitate şi trebuie ca în matricea de corelaţii
să identificăm variabilele între care există corelaţii peste .80 pentru a proceda la
eliminarea uneia (sau mai multora) dintre aceste variabile.

6
Analiza factorială

 Criterii privind adecvarea variabilelor la modelul factorial:

 5. Comunalităţile h2 mai mari de 0.20.

 Comunalităţile ne arată cât de mult din varianţa unei variabile este explicată de factorii
extraşi.

 Comunalitatea unei variabile (notată h2) este pătratul coeficientului de corelaţie multiplă
dintre variabilă şi factori (R2 din regresia multiplă în care variabila este VD iar factorii sunt
VI) şi reprezintă proporţia din varianţa acelei variabile explicată de factorii extraşi.

7
Analiza factorială

 Criterii privind adecvarea variabilelor la modelul factorial:

 6. Coeficienţi de saturaţie în factori peste .30. Această regulă pleacă de la faptul că o


saturaţie de 0.30 ne spune că aproximativ 10% din varianţa variabilei respective este
explicată de acel factor. (acest criteriu este mai puternic decât criteriul h2 > 0.20).

 Saturaţiile factoriale reprezintă coeficienţii de corelaţie Pearson dintre variabile şi factori.

 Ce facem atunci când o variabilă are saturaţii apropiate în cel puţin doi factori? Acest fapt
ne spune că variabila X explică un procent de varianţă aproximativ egal atât din factorul A
cât şi din factorul B (aşadar nu defineste clar nici unul dintre cei doi factori) şi prin urmare
ar trebui eliminată din analiză şi refăcută analiza factorială.

8
Analiza factorială
 Criterii privind numărul de factori extraşi:
 1. Criteriul lui Kaiser – vom reţine toţi factorii care au valori eigenvalue peste 1.

 2. Criteriul procentului de varianţă cumulată explicată de toţi factorii extraşi:


peste 40 %.

 3. Minim 3 itemi per factor.

 4. Criteriul adecvări modelului teoretic la modelul empiric reprezentat de


variabile: procentul de reziduuri nonredundante mai mari decât 0.05 să fie sub 50 % (în
tabelul Reproduced Correlation). Dacă într-un model factorial cu 2 factori procentul de
reziduuri este peste 50% iar în cel cu 3 factori procentul de reziduuri este sub 50%, atunci
ar fi indicat să optăm pentru modelul cu 3 factori. (Acest criteriu este unul destul de
puternic şi poate fi trecut cu vederea, uneori.)

 5. Criteriul teoretic: dacă scala a fost construită pe baza a trei dimensiuni, atunci vom
extrage 3 factori şi nu mai mulţi.

 Criteriu suplimentar – analiza post hoc: coeficienţii alfa Cronbach pentru fiecare factor sa
fie optimi (mai mari de 0.70)! 9
Analiza factorială
 Calea în SPSS este: Analyze – Dimension Reduction – Factor.
 Trecem variabilele (C1-C14) în câmpul din dreapta Variables.

 Activăm butonul Descriptives iar aici bifăm:


– Coefficients;
– Determinant;
– Kmo and Bartlett’ test of sphericity;
– Reproduced;
– Anti-image.

 Actrivăm butonul Extraction iar aici bifăm: Fixed number of factors. Factors to
extract...... iar în căsuța activată trecem numărul de factori pe care vrem să-i extragem.

 Activăm butonul Rotation iar aici bifăm Varimax.

 Activăm butonul Options iar aici bifăm:


– Sorted by size;
– Suppress small coefficients. Absolute value below....... iar în căsuța activată
ștergem .10 și trecem .30.

10
Analiza factorială – rezultate
 Matricea de corelații și determinantul ca notă de subsol:

Correlation Matrixa

C1 C2 C3 C4 C5 C6 C7
Correlation C1 1,000 ,542 ,298 ,495 ,236 ,189 -,433
C2 ,542 1,000 ,230 ,434 ,164 ,200 -,467
C3 ,298 ,230 1,000 ,252 ,632 ,145 ,015
C4 ,495 ,434 ,252 1,000 ,280 ,064 -,331
C5 ,236 ,164 ,632 ,280 1,000 ,098 -,083
C6 ,189 ,200 ,145 ,064 ,098 1,000 -,053
C7 -,433 -,467 ,015 -,331 -,083 -,053 1,000
C8 ,107 ,116 ,291 ,115 ,066 ,448 -,031
C9 ,350 ,232 ,690 ,215 ,816 ,225 -,134
C10 ,227 ,138 ,451 ,144 ,310 ,456 ,074
C11 -,286 -,331 -,164 -,426 -,122 ,012 ,377
C12 ,433 ,273 ,236 ,582 ,275 -,027 -,310
C13 ,368 ,381 ,524 ,437 ,655 ,117 -,268
C14 ,700 ,656 ,341 ,501 ,263 ,256 -,444
a. Determinant = 7,520E-04

11
Analiza factorială – rezultate
 Rezultatul la testul de sfericitate Bartlett χ2 (91) = 773.218, p < .001.

 Indexul KMO general KMO = .817 caracterizează setul de variabilele ca fiind foarte bun
pentru analiza factorială.

KMO and Bartlett's Test


Kaiser-Meyer-Olkin Measure of Sampling
Adequacy. ,817

Bartlett's Test of Approx. Chi-Square 773,218


Sphericity df 91
Sig. ,000

12
Analiza factorială – rezultate
 Indexul KMO pentru fiecare item.
 Vom inspecta jumătatea inferioară a tabelului, respectiv diagonala principală a câmpului
Anti-image Correlation; dacă pe această diagonală principală apar valori sub .50 atunci
itemul căruia îi corespunde acea valoare are o slabă adecvare pentru modelul factorial şi
trebuie înlăturat.
Anti-image Matrices

C1 C2 C3 C4 C5 C6
Anti-image Covariance C1 ,433 -4,32E-02 -2,20E-02 -8,26E-02 3,465E-02 -6,86E-03
C2 -4,32E-02 ,470 -2,59E-02 -5,78E-02 1,713E-02 -2,94E-02
C3 -2,20E-02 -2,59E-02 ,421 5,109E-03 -5,67E-02 7,903E-02
C4 -8,26E-02 -5,78E-02 5,109E-03 ,475 -6,70E-02 1,959E-02
C5 3,465E-02 1,713E-02 -5,67E-02 -6,70E-02 ,261 9,964E-04
C6 -6,86E-03 -2,94E-02 7,903E-02 1,959E-02 9,964E-04 ,682
C7 9,464E-02 ,108 -,128 -5,68E-03 -3,37E-03 -1,75E-02
C8 8,030E-02 1,203E-02 -7,52E-02 -2,45E-02 7,179E-02 -,151
C9 -3,83E-02 2,537E-02 -7,55E-02 8,258E-02 -,150 -2,31E-02
C10 -7,13E-02 -9,30E-04 -5,71E-02 -5,64E-02 1,643E-03 -,120
C11 -2,41E-02 5,290E-02 6,809E-02 ,142 -5,40E-03 -2,44E-02
C12 -3,46E-02 ,113 5,481E-03 -,170 4,594E-03 6,024E-02
C13 3,250E-02 -8,28E-02 -4,06E-02 -6,41E-02 -7,44E-02 -6,80E-03
C14 -,143 -,157 -2,90E-02 -1,09E-02 2,602E-02 -7,35E-02
Anti-image Correlation C1 ,862a -9,59E-02 -5,14E-02 -,182 ,103 -1,26E-02
C2 -9,59E-02 ,830a -5,83E-02 -,122 4,891E-02 -5,20E-02
C3 -5,14E-02 -5,83E-02 ,879a 1,143E-02 -,171 ,148
C4 -,182 -,122 1,143E-02 ,823a -,190 3,444E-02
C5 ,103 4,891E-02 -,171 -,190 ,774a 2,361E-03
C6 -1,26E-02 -5,20E-02 ,148 3,444E-02 2,361E-03 ,788a
C7 ,184 ,202 -,254 -1,06E-02 -8,46E-03 -2,72E-02
C8 ,166 2,387E-02 -,158 -4,84E-02 ,191 -,248
13
C9 -,124 7,868E-02 -,247 ,255 -,624 -5,94E-02
C10 -,162 -2,03E-03 -,132 -,123 4,812E-03 -,218
C11 -4,34E-02 9,147E-02 ,124 ,244 -1,25E-02 -3,50E-02
Analiza factorială – rezultate
 Comunalitățile după extragere, h2 să fie mai mari de .20. Dacă un item are o comunalitate
mai mică, el ar trebui eliminat.

Communalities

Initial Extraction
C1 1,000 ,620
C2 1,000 ,593
C3 1,000 ,698
C4 1,000 ,553
C5 1,000 ,833
C6 1,000 ,612
C7 1,000 ,514
C8 1,000 ,660
C9 1,000 ,829
C10 1,000 ,744
C11 1,000 ,369
C12 1,000 ,527
C13 1,000 ,699
C14 1,000 ,726
Extraction Method: Principal Component Analys is .

14
Analiza factorială – rezultate
 Varianța explicată de cei 3 factori extrași: 64.127 %.

Total Variance Explained

Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings
Component Total % of Variance Cumulative % Total % of Variance Cumulative % Total % of Variance Cumulative %
1 5,031 35,936 35,936 5,031 35,936 35,936 3,672 26,228 26,228
2 2,317 16,547 52,483 2,317 16,547 52,483 3,154 22,531 48,759
3 1,630 11,644 64,127 1,630 11,644 64,127 2,152 15,369 64,127
4 ,892 6,368 70,495
5 ,765 5,465 75,960
6 ,634 4,526 80,486
7 ,557 3,976 84,463
8 ,502 3,587 88,049
9 ,449 3,211 91,260
10 ,313 2,233 93,493
11 ,286 2,042 95,535
12 ,263 1,882 97,417
13 ,223 1,590 99,007
14 ,139 ,993 100,000
Extraction Method: Principal Component Analys is .

15
Analiza factorială – rezultate
Reproduced Correlations

 Procentul de reziduuri C1 C2 C3 C4 C5
Reproduced Correlation C1 ,620b ,599 ,290 ,566 ,253
nonredundante mai mari de C2 ,599 ,593b ,196 ,538 ,143
0.05 să fie mai mic de 50 %. C3 ,290 ,196 ,698b ,271 ,727
C4 ,566 ,538 ,271 ,553b ,288
C5 ,253 ,143 ,727 ,288 ,833b

În cazul de față, procentul


C6 ,234 ,239 ,219 8,017E-02 2,682E-02
 C7 -,505 -,514 -1,99E-02 -,485 -8,73E-03
este 45 %. C8 ,212 ,208 ,274 5,587E-02 8,289E-02
C9 ,328 ,224 ,759 ,318 ,806
C10 ,205 ,165 ,489 7,065E-02 ,342
C11 -,432 -,426 -8,28E-02 -,433 -,102
C12 ,494 ,456 ,273 ,520 ,343
C13 ,435 ,346 ,628 ,453 ,709
C14 ,671 ,647 ,324 ,609 ,280
Res iduala C1 -5,71E-02 8,710E-03 -7,07E-02 -1,67E-02
C2 -5,71E-02 3,408E-02 -,104 2,173E-02
C3 8,710E-03 3,408E-02 -1,86E-02 -9,54E-02
C4 -7,07E-02 -,104 -1,86E-02 -8,25E-03
C5 -1,67E-02 2,173E-02 -9,54E-02 -8,25E-03
C6 -4,56E-02 -3,99E-02 -7,42E-02 -1,60E-02 7,082E-02
C7 7,181E-02 4,665E-02 3,536E-02 ,154 -7,43E-02
C8 -,105 -9,26E-02 1,690E-02 5,928E-02 -1,68E-02
C9 2,231E-02 8,090E-03 -6,83E-02 -,103 1,023E-02
C10 2,208E-02 -2,74E-02 -3,78E-02 7,335E-02 -3,17E-02
C11 ,146 9,494E-02 -8,10E-02 6,992E-03 -2,03E-02
C12 -6,03E-02 -,183 -3,67E-02 6,237E-02 -6,84E-02
C13 -6,70E-02 3,558E-02 -,104 -1,60E-02 -5,43E-02
C14 2,883E-02 9,097E-03 1,686E-02 -,108 -1,69E-02
Extraction Method: Principal Component Analys is .
a. Res iduals are computed between obs erved and reproduced correlations. There16are 41
(45,0%) nonredundant res iduals with abs olute values > 0.05.
b. Reproduced communalities
Analiza factorială – rezultate
 Itemii chestionarului: Rotated Component Matrixa
C1: Sunt o persoană vorbăreaţă.
Component
C2: Adeseori iniţiez discuţii cu colegii. 1 2 3
C3: În discuţiile cu ceilalţi am o mimică şi o gestică C14 ,787
exuberante. C2 ,737
C4: Îmi exprim cu uşurinţă opiniile. C1 ,734
C7 -,713
C5: Când discut cu cineva îmi însoţesc cuvintele de
C4 ,703
gesturi. C12 ,633
C6: Vocea îmi exprimă sentimentele de bucurie sau C11 -,599
tristeţe pe care le încerc. C5 ,908
C7: Nu vorbesc prea mult cu colegii. (item inversat) C9 ,870
C8: Îmi manifest cu uşurinţă emoţiile în discuţiile pe C3 ,787
care le am. C13 ,741
C8 ,807
C9: Obişnuiesc să gesticulez atunci când vorbesc cu
C10 ,777
alţii.
C6 ,776
C10: Îmi exprim fizic emoţiile. Extraction Method: Principal Component Analysis
C11: Îmi este greu să-mi exprim gândurile în cuvinte. Rotation Method: Varimax with Kaiser Normalizat
(item inversat) a. Rotation converged in 5 iterations.
C12: Îmi este destul de uşor să-mi expun punctele de
vedere într-o conversaţie. 17
Analiza factorială

 ZTPI în CFA.

18

S-ar putea să vă placă și