Sunteți pe pagina 1din 50

Analiza factorial exploratorie

M. Popa

Cuprins
Introducere Aplicaiile majore ale analizei factoriale Modele de analiz factorial
Analiza factorial exploratorie (AFE) Analiza factorial de confirmare (AFC)

Probleme fundamentale ale analizei factoriale


Combinarea mai multor variabile ntr-un singur factor. Alegerea metodei de extragere Indicatori numerici ai factorilor Rotaia factorilor. Identificarea factorilor

Condiii Aspecte problematice ale analizei factoriale SPSS


Setarea procedurii AFE n SPSS Analiza rezultatelor Raportarea rezultatelor

1. Introducere
AF
colecie de tehnici statistice al cror obiectiv este acela de a simplifica seturi complexe de variabile

Se bazeaz pe o ndelungat tradiie a gndirii filosofice i tiinifice


raionalitii i atomitii greci Aristotel Francis Bacon Descartes

1. Introducere
Istoria recent
Thurstone (1931) introduce termenul de analiz factorial Pearson (1901) Spearman (1904)
unul dintre pionierii utilizrii analizei factoriale n psihologie, fiind creditat uneori chiar cu inventarea acestui tip de analiz statistic: scorurile copiilor colari la diferite discipline, aparent fr legtur unele cu altele, sunt pozitiv corelate, ceea ce l-a condus la postularea unei aptitudini cognitive generale, care susine performana uman. (factorul g).

Raymond Cattell
teorie multifactorial pentru a explica inteligena. Promotor al AF, dar i al procedurilor psihometrice aprecia c AF este un instrument care poate fi aplicat n studiul comportamentului, cu o obiectivitate care poate rivaliza cu cea din tiinele exacte

2. Aplicaiile majore ale analizei factoriale


Detectarea structurii n relaiile dintre variabile
Clasificarea variabilelor Ex.: Leadership=orientare pe sarcin/pe relaii

Reducerea numrului variabilelor


Baterie de teste Itemii unui chestionar

Rezolvarea multicoliniaritii n regresia multipl Validarea construciei unei scale compuse din mai muli itemi
ncrcarea fiecrui item n raport cu scala

3. Modele de AF
Ideea fundamental
anumite variabile nu pot fi observate (msurate) direct, ci doar prin intermediul altora v. manifeste
observate, msurate

v. latente
integreaz informaia comun a mai multor v. manifeste

3. Modele de AF
Modelul factorului comun
fiecare variabil manifest (v) are dou componente
una care decurge din variabila latent (factor) alta, care decurge unicitatea acelei variabile (e)

3. Modele de AF
A. Analiza factorial exploratorie (AFE) B. Analiza factorial de confirmare (AFC)

A. Analiza factorial exploratorie


Caut o structur latent n rndul mai multor variabile
tehnic reductiv de identificare a variabilele latente care nglobeaz anumite variabile observate

Obiective
determinarea numrului constructelor latente suport pentru a explica variabilitatea comun definirea coninutului i semnificaiei factorilor

Dou metode de realizare


1) Analiza factorilor comuni
prin mai multe tipuri de tehnici

2) Analiza componentelor principale

1) Analiza factorilor comuni (Thurstone)


estimarea varianei comune la nivelul variabilelor manifeste presupune cutarea unui anumit numr minim de factori care absorb variana variabilelor studiate rezult ntotdeauna mai puini factori dect numrul variabilelor existente

2. Analiza componentelor principale (Hotteling)


analizeaz matricea corelaiilor liniare dintre variabile i evalueaz variana comun existent
extrage factorul care nglobeaz cea mai mare cantitate de variabilitate al doilea factor cu cea mai mare cantitate de variabilitate din cea rmas i aa mai departe

soluia final: atia factori cte variabile sunt disponibile chiar dac este puin probabil ca toi factorii s ntruneasc criteriile de retenie Factorii astfel identificai sunt ortogonali

FC/CP
Dei soluii similare sunt totui diferite
CP nu este o analiz factorial n adevratul neles

Analiza factorilor comuni


Urmrete identificarea unui numr relativ mic de factori care s explice variana comun a variabilelor Dei are caracter exploratoriu, proiecteaz un anumit model asupra variabilelor manifeste:
modelul liniar cnd liniaritatea nu se confirm, o foreaz modifica variabilele (neutralizeaz tendinele curbilinii; valorile excesive) aspect criticat, dar este un sacrificiu util

FC/CP
Analiza componentelor principale
se limiteaz la descompunerea algebric a matricei de date ntr-o structur de componente (factori) care acumuleaz o cantitate ct mai mare de variabilitate comun genereaz factori ortogonali

FC sau CP?
Subiect controversat
Unii autori susin evitarea ACP alii o recomand

CP recomandabil atunci cnd obiectivul analizei este acela de a investiga un volum mare de date
reducerea la o structur care reine ct mai mult variabilitate comun

FC este recomandabil dac scopul analizei este modelarea unei anumite structuri a corelaiilor dintre variabilele manifeste
reprezentare ct mai economic a relaiilor dintre variabile

B. Analiza factorial de confirmare (AFC)


cercettorul are un model aprioric cu privire la structurarea variabilelor
obiectivul AFC este acela de a-l verifica

Abordri
Metoda tradiional Modelarea ecuaiei de structur (Structural Equation Modeling)

AFE logic inductiv-epiric SEM logic ipotetic-deductiv


Are un caracter de testare a ipotezei (potrivirea modelului cu structura variabilelor)

4. Probleme fundamentale ale AF


a) Combinarea mai multor variabile ntr-un singur factor b) Alegerea metodei de extragere c) Indicatori numerici ai factorilor d) Rotaia factorilor e) Identificarea factorilor

a) Combinarea mai multor variabile ntr-un singur factor


Imaginea intuitiv a combinrii (reducerii) variabilelor este graficul scatterplot al corelaiei. Linia de regresie trasat prin norul de puncte al graficului reprezint cea mai bun aproximare a relaiei liniare dintre cele dou variabile.
Valorile care se plaseaz pe linia de regresie capteaz esena variaiei comune a celor dou variabile corelate procedeu intuitiv echivalent cu ceea ce, n analiza factorial, se numete extragerea componentelor principale.

b) Alegerea metodei de extragere a factorilor


ACP sau ?
unweighted least squares generalized least squares maximum likelihood
Dac se respect condiia de normalitate

principal axis factoring


Dac nu se respect condiia de normalitate

alpha factoring
maximizeaz indicele de consisten intern al factorilor

image factoring
utilizeaz matricea de corelaie a variabilelor prezise pe baza regresiei multiple

c) Indicatori numerici ai factorilor


Valorile factorilor
scorul particular compus prin contribuia variabilelor

ncrcarea factorilor
coeficientul de corelaie dintre variabile i factorii afereni

Comunalitatea
ptratul corelaiei multiple pentru fiecare variabil manifest, utilizat drept criteriu, i toi factorii, utilizai drept predictori procentul varianei unei variabile explicat de factorii reunii poate fi interpretat ca sigurana indicatorului reprezentat de acea variabil

d) rotaia factorilor
Soluie iniial
Factorii nglobeaz o anumit cantitate de varian comun

Soluia final
Maximizarea varianei ncorporate n fiecare factor

Rotaia
Modalitate de rotire a spaiului de variaie astfel nct variana s se distribuie optim ntre factori

d) rotaia factorilor
Tipuri de rotaie
Ortogonal Oblic

e) Identificarea factorilor
Alegerea numrului de factori Denumirea factorilor

Alegerea numrului factorilor


Metoda K1 (Kaiser)
Indici eigenvalue (0-1)
suma coeficienilor r2 dintre fiecare factor i variabilele care intr n compunerea lor

Se rein factorii cu eigenvalue 1 Subiect controversat dar este soluia cea mai frecvent utilizat

Cattels Scree test


Explorarea vizual a graficului valorilor eigenvalue

Principiul simplitii (economiei) i al utilitii practice

Denumirea factorilor
Atribuirea semnificaiei psihologice
Factorii se definesc prin gradul de ncrcare (saturaie). Cu ct un factor are o saturaie mai mare n raport cu anumite variabile, cu att aceste variabile acoper o semnificaie comun mai consistent

Reguli:
s fie succini, exprimai, dac este posibil, printr-unul sau dou cuvinte; s exprime i s comunice natura constructului la care se refer
Pentru AFC nu se pune problema

variabilele care intr n compunerea factorilor vor fi analizate sub aspectul semnificaiei (similitudini) analizarea variabilelor care nu intr n componena unui factor

5. Condiii preliminare
Variabile msurate la nivel cantitativ (interval/raport)
pot fi incluse n analiz i variabile ordinale sau chiar dihotomice, chiar dac, se apreciaz c n acest ca factorii vor fi mai greu de interpretat

Distribuie normal
condiie cu att mai puin restrictiv cu ct volumul eantionului este mai mare

Absena valorilor extreme Alegerea atent a variabilelor


variabile nerelevante, sau excluderea unora relevante, afecteaz calitatea modelului factorial

Liniaritatea
corelaii ntre variabile (>=0.30)

Normalitatea multivariat
n absena evalurii directe a acesteia, investigarea normalitii univariate este obligatorie

Existena unor constructe reale


exprim dimensiuni psihologice existente n realitate

5. Condiii preliminare
Intercorelaii moderate i moderat-ridicate, fr multicolinearitate
indicele KMO poate oferi o indicaie util cu privire la existena multicolinearitii exist un indice KMO pentru fiecare variabil suma lor d indicele global KMO acesta variaz ntre 0 i 1, iar analiza factorial este justificat dac valoarea lui este mare (de regul peste 0.60)

Eantion adecvat
structurare factorial puternic: eantion mai mic Structurare factorial slab: eantion mai mare este greu de pus n eviden o structur factorial pe un eantion mai mic de 50 de cazuri, 100 de cazuri este un eantion mic 200 de cazuri sunt suficiente 300 de cazuri este un eantion bun 500 de cazuri este un eantion foarte buna iar 1000 de cazuri este excelent

6. Aspecte problematice ale AF


Erorile de msurare au efect asupra soluiei factoriale Rotaia, dei acceptabil matematic, este discutabil prin subiectivism Interpretare dificil i dependent de intuiia analistului n cazul unui numr foarte mare de variabile pot rezulta prea muli factori pentru a putea fi analizai (nelei) AF nu produce rezultate viabile cu itemi binari!
corelaia tetracoric (nu este efectuat n SPSS)

7. Exemplu de analiz factorial


studiu cu date reale (Popa, 2004), privitor la Inventarul de valori profesionale elaborat de D.E. Super i adaptat de Chelcea (1994). 15 valori importante pentru exercitarea oricrei profesiuni: altruism, ambiana de munc, avantaje materiale, conducere, creativitate, independen, prestigiu, relaii cu colegii, relaii cu superiorii, reuita obiectivat, stimulare estetic, sigurana postului, mod de via, stimulare intelectual, varietate. Analiza preliminar a datelor a relevat faptul c mediile variabilelor tind s fie apropiate, iar matricea de corelaie arat corelaii pozitive i semnificative ntre aproape toate valorile rezultate (?!). Ca urmare, am presupus c scorurile celor 15 valori ar putea, de fapt, s varieze concomitent, n funcie de gruparea ntrunul sau mai muli factori.

Al Al 1

Am

Av

Co

Cr

In

Pr

Rc

Rs

Ro

Se

Sp

Mv

Si

Va

-0.17 -0.24 1 0,37 0,26 0,24 0,35 0,35 0,30 0,48 0,46 0,34 0,39 0,45 0,25 0,26 1 0,18 1 0,35 1 -0.23 -0.27

-0.12 -0.13 0.18 -0.12 0.11 -0.18 -0.12 -0.16 1 -0.11 -0.17 1 1 1 1 1 -0.23

-0.14 -0.21 -0.22 -0.15 -0.14 -0.18 0.15 0.15 -0.16 -0.19 -0.26 -0.16 0.10 -0.27 -0.17 0.23 -0.10 -0.15 -0.12 -0.14 -0.22 -0.20 -0.19 -0.17 0.27

Am 0,24 Av Co 0,21 Cr 0,38 In Pr 0,21 0,27

0,24 0,35 0,30

0,30 0,48 0,31 0,30

Rc 0,44 Rs 0,27

0,11 0,19 0,30 0,16 0,30

0,29 0,22 0,22 0,33 0,37 0,29

Ro 0,38 Se Sp 0,34 0,19

0,29 0,38 0,44 0,37 0,48 0,36 0,43

0,15 0,29 0,48 0,29 0,36 0,28 0,30 0,40

-0.13 1 1 -0.30 -0.24 -0.16 -0.14 1 0.19 1

0,40 0,18 0,12 0,19 0,33 0,26 0,39 0,34 0,25

Mv 0,23 Si Va 0,39 0,33

0,42 0,22 0,27 0,36 0,39 0,26 0,39 0,46 0,29 0,34

0,16 0,39 0,58 0,30 0,38 0,33 0,25 0,47 0,36 0,15 0,29

0,12 0,30 0,59 0,34 0,30 0,28 0,25 0,39 0,41 0,14 0,26 0,53

Procedura de calcul cu SPSS

Statistics-Data reduction-Factor

Descriptives...

Extraction

Rotation:

Scores

Dac se dorete calcularea unui scor individual pentru fiecare factor, se bifeaz Save as variable. De regul, aceast opiune nu se selecteaz dect atunci cnd se dorete utilizarea factorilor ca variabile de sine stttoare. Cu Display factor score coefficient matrix, se poate solicita afiarea matricii de corelaia a factorilor. Aa cum ne amintim, factorii sunt astfel calculai nct s fie ortogonali (adic sa coreleze puin ntre ei). Ca urmare, aceast opiune poate fi, i ea, ignorat. Se finalizeaz cu Continue.

Options

Se executa procedura de analiz factorial cu comanda OK din caseta principal

Analiza rezultatelor

Comunalitatea
poriunea de variaie a unei variabile comun cu a altor variabile Valori foarte reduse ale comunalitii indic faptul c acele variabile nu sunt bine reprezentate de respectivul model factorial.

Soluia iniial

Soluia dup rotaia factorilor

Concluziile analizei
Factorul I
compus n principal din variabilele creativitate (0.747), stimulare intelectual (0.716), varietate (0.705), conducere (0.665) definiie: valori de autorealizare, dezvoltare.

Factorul II
compus din variabilele avantaje materiale (0.720), sigurana postului (0.692), ambiana de lucru (0.684), mod de via (0.665), relaii cu superiorii (0.627). definiie: valori materiale, siguran i confort

Factorul III
compus din variabilele relaii cu colegii (0.752) i altruism (0.727). definiie: valori de relaionare social

Consideraii finale
Odat ales un model factorial de reducere a variabilelor analizate, se poate opta pentru realiza, scoruri individuale pentru fiecare factor, care vor putea fi utilizai:
fie pentru diagnostic individual fie pentru comparaii ntre categorii de subieci.

Procedura de analiz factorial genereaz un mare volum de date numerice.


nu toate vor fi incluse n raportul de cercetare. vor fi inserate informaii cu privire la variabilele supuse analizei, statistica descriptiv sumar a fiecrei variabile (medii, abateri standard, skewness, kurtosis), matricea de corelaie a acestora, tabelul varianei totale, factorii selectai cu variabilele n care sunt saturai, variana total explicat de fiecare factor n parte i a tuturor mpreun. se va avea n vedere, totui, ca rezultatele s ofere informaii consistente, fr a fi excesive.

Analiza factorial nu face parte dintre procedurile statistice foarte frecvent utilizate. Rezultatele vor fi exprimate succint, dar clar i inteligibil, astfel nct semnificaia lor s fie ct mai accesibil.

Determinani individuali ai stilului de conducere al poliitilor


Mihaela Grigora tefan Li

The Leader Behavior Description Questionnaire (LBDQ)


Reprezentativitate: vorbete i acioneaz ca reprezentant al grupului. mpcarea cerinelor: mpac cerinele organizaionale contradictorii i reduce dezordinea din sistem (entropia sistemului). Tolerarea incertitudinii: este capabil s suporte incertitudinea i amnarea fr a deveni anxios sau nervos. Puterea de convingere: folosete n mod eficient persuasiunea i discuia; exprim convingeri ferme. Structurare: i definete clar propriul rol i le aduce la cunotin subalternilor ce ateapt de la ei. Tolerarea libertii: le ofer subalternilor posibilitatea de a avea iniiative, de a lua decizii i de a aciona. Asumarea rolului: i exercit n mod activ rolul de conductor, nu-i deleag autoritatea altora. Consideraie: este preocupat de starea general i de statutul subalternilor. Accent pe producie: exercit presiuni pentru a asigura producia. Corectitudinea prediciilor: d dovad de previziune, de capacitatea de a prevedea corect rezultatele. Integrare: menine unitatea grupului pe care l conduce; rezolv conflictele aprute ntre membrii grupului. Orientarea spre superiori: menine relaii bune cu superiorii; are influen asupra lor; lupt pentru a-i ridica statutul

Dimensiuni LBDQ Accent pe producie Orientarea spre superiori Structurare Reprezentativitate Integrare Asumarea rolului mpcarea cerinelor Tolerarea incertitudinii Persuasiune Corectitudinea prediciilor Tolerarea libertii Consideraie

Fact. 1 0,725 0,688 0,679 0,595 0,556 0,501

Fact. 2

Fact. 3

0,808 0,797 0,694 0,611 0,819 0,704

Factorul I explic 25 % din varian i este saturat n scalele Accent pe producie, Orientare spre superiori, Structurare, Asumarea rolului, Integrare, Reprezentativitate.
Factor tradiional

(orientare spre sarcin).

Factorul II acoper 20% din varian i cuprinde scalele mpcarea cerinelor, Tolerarea incertitudinii, Putere de convingere, Corectitudinea prediciilor. factor poate fi numit integrativ i inovativ Factorul III explic 11% din varian i este saturat n scalele Tolerarea libertii i Consideraie. factor suportiv (orientarea spre relaii).

NOU

Fidelitatea factorilor: consistena intern a scalelor

Dac se intenioneaz utilizarea factorilor ca variabile de sine stttoare, este important fidelitatea lor Metoda Alpha Factoring vizeaz amplificarea consistenei interne Cronbach alfa este unul dintre indicatorii fidelitii; alii:
ro al lui Raykov teta al lui Armor ro al lui Spearman (altul dect corelaia ordinal) lambda 2 (2) din seria celor 6 coeficieni lambda ai lui Gutmann
lambda 3 (3) este Cronbach alfa

Cteva precizri de final de semestru:


Examen: 7 iunie - PORU+SOPO, ora 18 11 iunie - PASN, ora 18 Evaluarea practic de seminar 21; 23; 24 mai la orele din program miercuri 23 mai i joi 24 mai voi fi la laborator cu o or mai devreme (pentru a ctiga timp) Workshop Introducere n modelarea ecuaiei de structur (gratuit) cei care sunt interesai, mi vor trimite un email, pn pe 24 mai, cu: Subject: Workshop SEM - 2102 precizarea opiunii de participare masterul la care sunt nscrii dup constituirea listei voi trimite pe adresa celor nscrii propuneri cu privire la data workshop-ului perioada probabil: 28 mai- 2 iunie