Sunteți pe pagina 1din 37

Analiza factorial exploratorie

M. Popa
Cuprins
Introducere
Aplicaiile majore ale analizei factoriale
Modele de analiz factorial
Analiza factorial exploratorie (AFE)
Analiza factorial de confirmare (AFC)
Probleme fundamentale ale analizei factoriale
Combinarea mai multor variabile ntr-un singur factor.
Alegerea metodei de extragere
Indicatori numerici ai factorilor
Rotaia factorilor.
Identificarea factorilor
Condiii
Aspecte problematice ale analizei factoriale
SPSS
Setarea procedurii AFE n SPSS
Analiza rezultatelor
Raportarea rezultatelor
1. Introducere
AF
colecie de tehnici statistice al cror obiectiv este acela de
a simplifica seturi complexe de variabile
Se bazeaz pe o ndelungat tradiie a gndirii
filosofice i tiinifice
raionalitii i atomitii greci
Aristotel
Francis Bacon
Descartes
1. Introducere
Istoria recent
Thurstone (1931) introduce termenul de analiz factorial
Pearson (1901)
Spearman (1904)
unul dintre pionierii utilizrii analizei factoriale n psihologie, fiind creditat
uneori chiar cu inventarea acestui tip de analiz statistic:
scorurile copiilor colari la diferite discipline, aparent fr legtur unele cu
altele, sunt pozitiv corelate, ceea ce l-a condus la postularea unei aptitudini
cognitive generale, care susine performana uman.
(factorul g).
Raymond Cattell
teorie multifactorial pentru a explica inteligena.
Promotor al AF, dar i al procedurilor psihometrice
aprecia c AF este un instrument care poate fi aplicat n studiul
comportamentului, cu o obiectivitate care poate rivaliza cu cea din tiinele
exacte
2. Aplicaiile majore ale analizei factoriale
Detectarea structurii n relaiile dintre variabile
Clasificarea variabilelor
Ex.: Leadership=orientare pe sarcin/pe relaii
Reducerea numrului variabilelor
Baterie de teste
Itemii unui chestionar
Rezolvarea multicoliniaritii n regresia multipl
Validarea construciei unei scale compuse din mai
muli itemi
ncrcarea fiecrui item n raport cu scala
3. Modele de AF
Ideea fundamental
anumite variabile nu pot fi observate (msurate) direct, ci
doar prin intermediul altora
v. manifeste
observate, msurate
v. latente
integreaz informaia comun a mai multor v. manifeste
3. Modele de AF
Modelul factorului comun
fiecare variabil manifest (v) are dou componente
una care decurge din variabila latent (factor)
alta, care decurge unicitatea acelei variabile (e)
3. Modele de AF
A. Analiza factorial exploratorie (AFE)
B. Analiza factorial de confirmare (AFC)
A. Analiza factorial exploratorie
Caut o structur latent n rndul mai multor
variabile
tehnic reductiv de identificare a variabilele latente care
nglobeaz anumite variabile observate
Obiective
determinarea numrului constructelor latente
suport pentru a explica variabilitatea comun
definirea coninutului i semnificaiei factorilor
Dou metode de realizare
1) Analiza factorilor comuni
prin mai multe tipuri de tehnici
2) Analiza componentelor principale
1) Analiza factorilor comuni (Thurstone)
estimarea varianei comune la nivelul variabilelor
manifeste
presupune cutarea unui anumit numr minim de
factori care absorb variana variabilelor studiate
rezult ntotdeauna mai puini factori dect numrul
variabilelor existente
2. Analiza componentelor principale (Hotteling)
analizeaz matricea corelaiilor liniare dintre variabile i
evalueaz variana comun existent
extrage factorul care nglobeaz cea mai mare cantitate de
variabilitate
al doilea factor cu cea mai mare cantitate de variabilitate din cea
rmas
i aa mai departe
soluia final: atia factori cte variabile sunt disponibile
chiar dac este puin probabil ca toi factorii s ntruneasc
criteriile de retenie
Factorii astfel identificai sunt ortogonali
FC/CP
Dei soluii similare sunt totui diferite
CP nu este o analiz factorial n adevratul neles
Analiza factorilor comuni
Urmrete identificarea unui numr relativ mic de factori
care s explice variana comun a variabilelor
Dei are caracter exploratoriu, proiecteaz un anumit
model asupra variabilelor manifeste:
modelul liniar
cnd liniaritatea nu se confirm, o foreaz
modifica variabilele (neutralizeaz tendinele curbilinii;
valorile excesive)
aspect criticat, dar este un sacrificiu util
FC/CP
Analiza componentelor principale
se limiteaz la descompunerea algebric a matricei de date
ntr-o structur de componente (factori) care acumuleaz
o cantitate ct mai mare de variabilitate comun
genereaz factori ortogonali
FC sau CP?
Subiect controversat
Unii autori susin evitarea ACP
alii o recomand
CP recomandabil atunci cnd obiectivul analizei
este acela de a investiga un volum mare de date
reducerea la o structur care reine ct mai mult
variabilitate comun
FC este recomandabil dac scopul analizei este
modelarea unei anumite structuri a corelaiilor
dintre variabilele manifeste
reprezentare ct mai economic a relaiilor dintre
variabile
B. Analiza factorial de confirmare (AFC)
cercettorul are un model aprioric cu privire la
structurarea variabilelor
obiectivul AFC este acela de a-l verifica
Abordri
Metoda tradiional
Modelarea ecuaiei de structur (Structural Equation
Modeling)
AFE logic inductiv-epiric
SEM logic ipotetic-deductiv
Are un caracter de testare a ipotezei (potrivirea modelului
cu structura variabilelor)
4. Probleme fundamentale ale AF
a) Combinarea mai multor variabile ntr-un singur
factor
b) Alegerea metodei de extragere
c) Indicatori numerici ai factorilor
d) Rotaia factorilor
e) Identificarea factorilor
a) Combinarea mai multor variabile
ntr-un singur factor
Imaginea intuitiv a combinrii (reducerii)
variabilelor este graficul scatterplot al corelaiei.
Linia de regresie trasat prin norul de puncte al
graficului reprezint cea mai bun aproximare a
relaiei liniare dintre cele dou variabile.
Valorile care se plaseaz pe linia de regresie capteaz
esena variaiei comune a celor dou variabile corelate
procedeu intuitiv echivalent cu ceea ce, n analiza
factorial, se numete extragerea componentelor
principale.
b) Alegerea metodei de extragere a factorilor
ACP sau ?
unweighted least squares
generalized least squares
maximum likelihood
Dac se respect condiia de normalitate
principal axis factoring
Dac nu se respect condiia de normalitate
alpha factoring
maximizeaz indicele de consisten intern al factorilor
image factoring
utilizeaz matricea de corelaie a variabilelor prezise pe baza
regresiei multiple
c) Indicatori numerici ai factorilor
Valorile factorilor
scorul particular compus prin contribuia variabilelor
ncrcarea factorilor
coeficientul de corelaie dintre variabile i factorii afereni
Comunalitatea
ptratul corelaiei multiple pentru fiecare variabil
manifest, utilizat drept criteriu, i toi factorii, utilizai
drept predictori
procentul varianei unei variabile explicat de factorii
reunii
poate fi interpretat ca sigurana indicatorului reprezentat
de acea variabil
d) rotaia factorilor
Soluie iniial
Factorii nglobeaz o anumit
cantitate de varian comun
Soluia final
Maximizarea varianei
ncorporate n fiecare factor
Rotaia
Modalitate de rotire a
spaiului de variaie astfel
nct variana s se distribuie
optim ntre factori
d) rotaia factorilor
Tipuri de rotaie
Ortogonal
Oblic
e) Identificarea factorilor
Alegerea numrului de factori
Denumirea factorilor
Alegerea numrului factorilor
Metoda K1 (Kaiser)
Indici eigenvalue (0-1)
suma coeficienilor r
2
dintre fiecare factor i variabilele care intr
n compunerea lor
Se rein factorii cu eigenvalue 1
Subiect controversat dar este soluia cea mai frecvent
utilizat
Cattels Scree test
Explorarea vizual a graficului valorilor eigenvalue
Principiul simplitii (economiei) i al utilitii
practice
Denumirea factorilor
Atribuirea semnificaiei psihologice
Factorii se definesc prin gradul de ncrcare (saturaie).
Cu ct un factor are o saturaie mai mare n raport cu anumite
variabile, cu att aceste variabile acoper o semnificaie comun mai
consistent
Reguli:
s fie succini, exprimai, dac este posibil, printr-unul sau dou
cuvinte;
s exprime i s comunice natura constructului la care se refer
Pentru AFC nu se pune problema
variabilele care intr n compunerea factorilor vor fi analizate sub
aspectul semnificaiei (similitudini)
analizarea variabilelor care nu intr n componena unui factor
5. Condiii preliminare
Variabile msurate la nivel cantitativ (interval/raport)
pot fi incluse n analiz i variabile ordinale sau chiar dihotomice, chiar dac,
se apreciaz c n acest ca factorii vor fi mai greu de interpretat
Distribuie normal
condiie cu att mai puin restrictiv cu ct volumul eantionului este mai
mare
Absena valorilor extreme
Alegerea atent a variabilelor
variabile nerelevante, sau excluderea unora relevante, afecteaz calitatea modelului
factorial
Liniaritatea
corelaii ntre variabile (>=0.30)
Normalitatea multivariat
n absena evalurii directe a acesteia, investigarea normalitii univariate este
obligatorie
Existena unor constructe reale
exprim dimensiuni psihologice existente n realitate
5. Condiii preliminare
Intercorelaii moderate i moderat-ridicate, fr
multicolinearitate
indicele KMO poate oferi o indicaie util cu privire la existena
multicolinearitii
exist un indice KMO pentru fiecare variabil
suma lor d indicele global KMO
acesta variaz ntre 0 i 1, iar analiza factorial este justificat dac valoarea lui
este mare (de regul peste 0.60)
Eantion adecvat
structurare factorial puternic: eantion mai mic
Structurare factorial slab: eantion mai mare
este greu de pus n eviden o structur factorial pe un eantion mai mic de 50 de
cazuri,
100 de cazuri este un eantion mic
200 de cazuri sunt suficiente
300 de cazuri este un eantion bun
500 de cazuri este un eantion foarte buna
iar 1000 de cazuri este excelent
6. Aspecte problematice ale AF
Erorile de msurare au efect asupra soluiei factoriale
Rotaia, dei acceptabil matematic, este discutabil
prin subiectivism
Interpretare dificil i dependent de intuiia
analistului
n cazul unui numr foarte mare de variabile pot
rezulta prea muli factori pentru a putea fi analizai
(nelei)
AF nu produce rezultate viabile cu itemi binari!
corelaia tetracoric (nu este efectuat n SPSS)
7. Exemplu de analiz factorial
studiu cu date reale (Popa, 2004), privitor la Inventarul de
valori profesionale elaborat de D.E. Super i adaptat de
Chelcea (1994).
15 valori importante pentru exercitarea oricrei profesiuni:
altruism, ambiana de munc, avantaje materiale, conducere,
creativitate, independen, prestigiu, relaii cu colegii, relaii
cu superiorii, reuita obiectivat, stimulare estetic, sigurana
postului, mod de via, stimulare intelectual, varietate.
Analiza preliminar a datelor a relevat faptul c mediile
variabilelor tind s fie apropiate, iar matricea de corelaie
arat corelaii pozitive i semnificative ntre aproape toate
valorile rezultate (?!).
Ca urmare, am presupus c scorurile celor 15 valori ar putea,
de fapt, s varieze concomitent, n funcie de gruparea ntr-
unul sau mai muli factori.
Al Am Av Co Cr In Pr Rc Rs Ro Se Sp Mv Si Va
Al 1 -0.17 -0.24 -0.12 -0.13 0.18 -0.12 -0.14 -0.21
Am 0,24 1 -0.23 0.11 -0.22 -0.15
Av 0,37 1 -0.27 -0.18 -0.14 -0.18 0.15 0.15 -0.16 -0.19
Co 0,21 0,26 0,18 1 -0.12 -0.26 -0.16 -0.17
Cr 0,38 0,24 0,35 1 -0.16 -0.23 0.10 -0.27 -0.17 0.23 0.27
In 0,21 0,35 0,24 0,35 0,30 1 -0.11 -0.17 -0.10 -0.15
Pr 0,27 0,35 0,30 0,48 0,31 0,30 1 -0.12 -0.19
Rc 0,44 0,30 0,11 0,19 0,30 0,16 0,30 1 -0.14
Rs 0,27 0,48 0,29 0,22 0,22 0,33 0,37 0,29 1 -0.22 -0.20
Ro 0,38 0,46 0,29 0,38 0,44 0,37 0,48 0,36 0,43 1
Se 0,34 0,34 0,15 0,29 0,48 0,29 0,36 0,28 0,30 0,40 1 -0.13
Sp 0,19 0,39 0,40 0,18 0,12 0,19 0,33 0,26 0,39 0,34 0,25 1 -0.30 -0.24
Mv 0,23 0,45 0,42 0,22 0,27 0,36 0,39 0,26 0,39 0,46 0,29 0,34 1 -0.16 -0.14
Si 0,39 0,25 0,16 0,39 0,58 0,30 0,38 0,33 0,25 0,47 0,36 0,15 0,29 1 0.19
Va 0,33 0,26 0,12 0,30 0,59 0,34 0,30 0,28 0,25 0,39 0,41 0,14 0,26 0,53 1
Procedura de calcul cu
SPSS
Soluia dup rotaia factorilor
Concluziile analizei
Factorul I
compus n principal din variabilele creativitate (0.747), stimulare
intelectual (0.716), varietate (0.705), conducere (0.665)
definiie: valori de autorealizare, dezvoltare.
Factorul II
compus din variabilele avantaje materiale (0.720), sigurana postului
(0.692), ambiana de lucru (0.684), mod de via (0.665), relaii cu
superiorii (0.627).
definiie: valori materiale, siguran i confort
Factorul III
compus din variabilele relaii cu colegii (0.752) i altruism (0.727).
definiie: valori de relaionare social
Consideraii finale
Odat ales un model factorial de reducere a variabilelor analizate, se
poate opta pentru realiza, scoruri individuale pentru fiecare factor, care
vor putea fi utilizai:
fie pentru diagnostic individual
fie pentru comparaii ntre categorii de subieci.
Procedura de analiz factorial genereaz un mare volum de date
numerice.
nu toate vor fi incluse n raportul de cercetare.
vor fi inserate informaii cu privire la variabilele supuse analizei, statistica
descriptiv sumar a fiecrei variabile (medii, abateri standard, skewness,
kurtosis), matricea de corelaie a acestora, tabelul varianei totale, factorii
selectai cu variabilele n care sunt saturai, variana total explicat de fiecare
factor n parte i a tuturor mpreun.
se va avea n vedere, totui, ca rezultatele s ofere informaii consistente, fr
a fi excesive.
Analiza factorial nu face parte dintre procedurile statistice foarte frecvent
utilizate.
Rezultatele vor fi exprimate succint, dar clar i inteligibil, astfel nct
semnificaia lor s fie ct mai accesibil.
Determinani individuali ai stilului de conducere al poliitilor
Mihaela Grigora
tefan Li
The Leader Behavior Description Questionnaire (LBDQ)
Reprezentativitate: vorbete i acioneaz ca reprezentant al grupului.
mpcarea cerinelor: mpac cerinele organizaionale contradictorii i reduce dezordinea din sistem
(entropia sistemului).
Tolerarea incertitudinii: este capabil s suporte incertitudinea i amnarea fr a deveni anxios sau nervos.
Puterea de convingere: folosete n mod eficient persuasiunea i discuia; exprim convingeri ferme.
Structurare: i definete clar propriul rol i le aduce la cunotin subalternilor ce ateapt de la ei.
Tolerarea libertii: le ofer subalternilor posibilitatea de a avea iniiative, de a lua decizii i de a aciona.
Asumarea rolului: i exercit n mod activ rolul de conductor, nu-i deleag autoritatea altora.
Consideraie: este preocupat de starea general i de statutul subalternilor.
Accent pe producie: exercit presiuni pentru a asigura producia.
Corectitudinea prediciilor: d dovad de previziune, de capacitatea de a prevedea corect rezultatele.
Integrare: menine unitatea grupului pe care l conduce; rezolv conflictele aprute ntre membrii grupului.
Orientarea spre superiori: menine relaii bune cu superiorii; are influen asupra lor; lupt pentru a-i ridica
statutul.
Dimensiuni LBDQ
Fact. 1 Fact. 2 Fact. 3
Accent pe producie 0,725
Orientarea spre superiori 0,688
Structurare 0,679
Reprezentativitate 0,595
Integrare 0,556
Asumarea rolului 0,501
mpcarea cerinelor 0,808
Tolerarea incertitudinii 0,797
Persuasiune 0,694
Corectitudinea
prediciilor
0,611
Tolerarea libertii 0,819
Consideraie 0,704
Factorul I explic 25 % din varian i este saturat n scalele Accent pe
producie, Orientare spre superiori, Structurare, Asumarea rolului,
Integrare, Reprezentativitate.
Factor tradiional (orientare spre sarcin).
Factorul II acoper 20% din varian i cuprinde scalele mpcarea
cerinelor, Tolerarea incertitudinii, Putere de convingere, Corectitudinea
prediciilor.
factor poate fi numit integrativ i inovativ
Factorul III explic 11% din varian i este saturat n scalele Tolerarea
libertii i Consideraie.
factor suportiv (orientarea spre relaii).
Fidelitatea factorilor:
consistena intern a scalelor
Dac se intenioneaz utilizarea factorilor ca variabile
de sine stttoare, este important fidelitatea lor
Metoda Alpha Factoring vizeaz amplificarea
consistenei interne
Cronbach alfa este doar unul dintre indicatorii
fidelitii; alii:
ro al lui Raykov
teta al lui Armor
ro al lui Spearman (altul dect corelaia ordinal)
lambda 2 (
2
) din seria celor 6 coeficieni lambda ai lui
Gutmann
lambda 3 (
3
) este chiar Cronbach alfa
NOU