Sunteți pe pagina 1din 6

Suport L6L7 Analiza factoriala (AF) şi analiza path

Obiectivul metodei: a) economia, săextragăun numă r de factori redus ş i b) interpretabilitatea (să


ajungăla saturaţ ii mari pentru acelaşi indicator numai într-un singur factor. Realizarea celor două
obiective se face prin algoritmi specifici de extragere a factorilor pentru economie (prin PCA, PAF,
ML etc) si de rotire a lor pentru interpretabilitate (VARIMAX, OBLIMIN, QUARTIMAX,
EQUAMAX etc.). O structura factoriala este cu atat mai simpla cu cat are mai putini
factori/variabile latente/dimensiuni.

Introducerea metodei prin inputuri şi output-uri esenţ


iale

Intrebare: cum se grupeazăîn mentalul colectiv opiniile referitoare la „problemele actuale ale
Romaniei”?. Cum poate fi redus un set de 11 indicatori de agenda publicăla cateva dimensiuni?
Date de intrare în AF: matricea coeficienţ ilor de corelaţ ie Bravais-Pearson între toţ i itemii care
urmeazăa fi redusi la dimensiuni sau factori
Output esential:matricea rotita a factorilor FACTORI SAU VARIABILE LATENTE. Sensul
factorului este dat de itemii cu saturaţie maxima.
Este rezultat de interpretare
Rotated Component Matrix(a)

variabila Component Coeficienti de saturaţ ie


1 calitatea 2 3 (loadings) –echivalentul
vietii institutii coruptie coeficienţ ilor beta din
nume variabila
apret5 preturi ,805 ,076 ,187
regresia multiplă . Masoara
amunca5
intensitatea influenţ ei
locurile de munca ,765 ,082 ,098
factorului asupra
apensii5 pensiile ,715 ,080 ,334 indicatorului . Ex de citire:
alocuinta5 locuinte ,646 ,305 ,116 cresterea cu o abatere
asanat5 sanatatea ,591 ,300 ,301 standard pe scala factorului 1
ainstloc5 institutiile locale ,113 ,895 ,162 este insotita de creş terea cu
ainstc5 institutiile centrale ,121 ,888 ,211 0.805 abateri standard pe
aeduc5 educatie ,281 ,673 ,215
scala item-ului referitor la
ainfract5 infractionalitatea
perceptia gravitatii problemei
,198 ,177 ,820
acorupt5 coruptia ,340 ,146 ,771
ajust5 justitia ,155 ,290 ,766
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
a Rotation converged in 5 iterations. KMO=0.86 indica un potential foarte bun de factorializare a datelor (veyi mai
departe detalii de despre KMO).

DS/draft2/11/7/2006 1
Introducerea metodei prin AF confirmatorie
Doua tipuri de factorialã – exploratorie, fará model teoretic ş
i confirmatorie, cu model teoretic asociat.

Datele de intrare pentru um model didactic, simplificat fata de cel din tabelul anterior – o matrice de
corelaţii de tipul 4*4. Ingrijorarile fata de preturi si locurile de munca sunt mai puternic legate intre ele
decat cu cele referitoare la functionarea institutiilor centrale sal locale.
Date de intrare, o matrice de corelaţ
ii de tipul 4*4

Correlation Matrix
amunca5 apret5 ainstc5 ainstloc5
Correlation amunca5 1,000 ,528 ,215 ,194
apret5 ,528 1,000 ,236 ,222
ainstc5 ,215 ,236 1,000 ,816
ainstloc5 ,194 ,222 ,816 1,000
Sig. (1-tailed) amunca5 ,000 ,000 ,000
apret5 ,000 ,000 ,000
ainstc5 ,000 ,000 ,000
ainstloc5 ,000 ,000 ,000

Un model factorial confirmatoriu: exisitădouătipuri de ingrijorări majore, legate de calitatea


vietii si de instituţ
ii. Cele douătipuri de îngrijorări sunt correlate pozitiv între ele.

Coeficient path (beta): creşterea cu o unitate standard pe scala factorului „îngrijoră ţ


ri asupra calităii vieţ
ii” este
însoţ
ită, în medie, de creşterea îngrijoră
rii referitoare la preţ
uri cu 0.77 abateri standard

,48
CALIT.VIETII
amunca5 explica 48% din
,69 U1 variaţia indicelui
amunca5
CALIT.VIETII

,77 ,59
U2
apret5

,33

,75

ainstloc5
,87 U3

INSTITUTII

,94 ,88
U4
ainstc5

Figura 1.Diagrama path a unui model factorial de tip confirmatoriu (cu model teoretic pre-existent).
Chi-square = ,477, Degrees of freedom = 1, Probability level = ,490, Model construit cu Amos 6
. Modelul prezentat face parte din seria modelelor de ecuatii structurale (structural equation models SEM)
caracterizate prin faptul căopereazăsimultan cu mai multe variabile dependente. Rezolvarea unor astfel de
modele se face şi prin soft-uri de tip AMOS sau LISREL (Linear Structural Equations Models).

DS/draft2/11/7/2006 2
AF exploratorie, fara model teoretic, varianta ortogonala, cu
fatori independenti
In AF exploratorie de tip PCA (analiza componentelor principale), fatorii sunt independenti (ortogonali)
iar saturatiile sunt calculate pentru relatiile intre toate perechile indicatori-factori. Cercetatorul nu mai are
posibilitatea, precum in analiza confirmatorie as predetermine numărul de factori si relaţ iile dintre
variabilele manifeste si factori.

iilor dintre factori ş


Figura 2. Reprezentarea relaţ i variabile pentru modelul bifactorial, extragere PCA,
rotire VARIMAX

Valori KMO mai mici de 0.50 indică


date inadecvate pentru
KMO and Bartlett's Test AF.KMO=suma patratelor
Kaiser-Meyer-Olkin Measure of Sampling corelatiilor dintre variabile/(suma
patratelor corelatiilor+suma
Adequacy. ,556
patratelor corelatiilor partiale din
matrice). KMO indica valori ridicate
Bartlett's Test of Approx. Chi-Square 2987,411 ale corelatiilor partiale, semn de
Sphericity df 6 comunalitate redusa in matricea de
Sig. ,000 date. KMO=0.55 indica o adecvare
redusa a datelor pentru factorializare.

Toate cele patru variabile din model au un indice KMO mai mare de 0.50, asa cum rezulta din valorile
marcate cu a in matricea de mai jos.

Anti-image Matrices

amunca5 ainstloc5 ainstc5


loc.munca apret5 preturi instit.locale instit.centrale
Anti-image Covariance amunca5 loc.munca ,712 -,356 -,004 -,029
apret5 preturi -,356 ,704 -,020 -,026
ainstloc5 instit.locale -,004 -,020 ,334 -,267
ainstc5 instit.centrale -,029 -,026 -,267 ,330
Anti-image Correlation amunca5 loc.munca ,586 a -,502 -,007 -,060
apret5 preturi -,502 ,599 a -,042 -,054
ainstloc5 instit.locale -,007 -,042 ,537 a -,804
ainstc5 instit.centrale -,060 -,054 -,804 ,540 a
a. Measures of Sampling Adequacy(MSA)

DS/draft2/11/7/2006 3
Communalities Comunalitatile -echivalente ca
semnificatie cu determinatia múltipla
Initial Extraction din regresia múltipla. Cei dói factori
amunca5 1,000 ,768 principali explica 77% din variatia
itemului de ingrijorare fata de munca.
apret5 1,000 ,760
Itemii cu valoare redusa a comunalită ţii
ainstc5 1,000 ,907 sunt candidati la excludere din model
ainstloc5 1,000 ,909
Extraction Method: Principal Component Analysis.

Total Variance Explained

Initial Eigenvalues Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings
Component Total % of VarianceCumulative % Total % of VarianceCumulative % Total % of VarianceCumulative %
1 2,129 53,216 53,216 2,129 53,216 53,216 1,811 45,280 45,280
2 1,216 30,392 83,608 1,216 30,392 83,608 1,533 38,328 83,608
3 ,472 11,788 95,397
4 ,184 4,603 100,000
Extraction Method: Principal Component Analysis.

Valoare proprie a factorului, ponderea variatiei


variabilelor explicata de factor, data de suma
patratului saturatiilor din factor. Factorul 1 explică ,
Matricea factorilor dupa extragere, fara rotire după rotire, 45% (=1.811*100/4) din variatia
datelor. Variatia totala în matricea de date este egala
Component Matrixa cu numarul de variabile pentru ca fiecare dintre
acestea sunt standardizate, implicit, cu scorul z si, in
Component consecinta au varianta egala cu 1. Impreuna, cei doi
1 2 factori explică83.6% din variaţ ia matricei de date.
ainstc5 ,842 -,445
ainstloc5 ,831 -,467
amunca5 ,591 ,647
apret5 ,616 ,617
Extraction Method: Principal Component Analysis.
a. 2 components extracted.

Matricea factorilor dupărotire


Rotated Component Matrixa Factorul 1 este definit de îngrijorarea
fatăde funcţionarea instituţ iilor, itemii
Component cu saturaţ
ii maxime în factor
1 2
ainstc5 instit.centrale ,943 ,137
ainstloc5 instit.locale ,946 ,113
Factorul 2 este definit de îngrijorarea
amunca5 loc.munca ,096 ,871 fatăde obţ inerea locurilor de muncă
apret5 preturi ,134 ,862 şi fata de preturi
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 3 iterations.

DS/draft2/11/7/2006 4
Matricea scorurilor factoriale
Component Score Coefficient Matrix
Cresterea cu o abatere standard pe scala
Component ingrijor ării ă de
faţ funcţionarea
1 2 instituţiilor centrale duce la creş terea
îngrijor ării faţă de instituţii cu 0.53
ainstc5 instit.centrale ,535 -,063
abateri standard.
ainstloc5 instit.locale ,542 -,080
amunca5 loc.munca -,089 ,594
apret5 preturi -,066 ,581
Extraction Method: Principal Component Analysis.
Rotation Method: Varimax with Kaiser Normalization.

Scorurile factoriale permit construrea unor indici de reducere a unei multimi de variabile la
una de tip sintetic.

Pe exemplu dat, solutia ortogonală, cu factori independenti, este aplicata legitim, deoarece in
factorialã de tip oblic (prin rotire OBLIMIN) corelatia dintre cei doi factori este de 0.26, ceea ce
inseamna o determinatie simpla mai mica de 10%.

Sintaxa comenzii pentru exemplu prezentat


FACTOR
/VARIABLES amunca5 apret5 ainstloc5 ainstc5 /MISSING LISTWISE
/ANALYSIS
amunca5 apret5 ainstloc5 ainstc5
/PRINT INITIAL KMO AIC EXTRACTION ROTATION FSCORE
/FORMAT SORT
/CRITERIA MINEIGEN(1) ITERATE(25)
/EXTRACTION PC
/CRITERIA ITERATE(25)
/ROTATION VARIMAX
/METHOD=CORRELATION .

Condiţii de aplicare a AF, probleme de interpretare –


aceleaşi ca si la regresia múltipla
Variabile.
o număr relativ egal de variabile pe factor. Útil as se lucreze cu metoda step-
wise in selectia variabilelor si cu pornnire de la setul de itemi pentru care
asocierile sunt clar interpretabile.
o numarul de cazuri/variabila, cel puţ in 5 iar numarul total de cazuri cel puţin
200 (vezi detalii in Garson)
o cel puţ in trei variabile pe factor (Thurstone)
o variabile care au saturatii apropiate in factori diferiti trebuie eliminate ca
“factor de zgomot” in matricea factoriala
Datele de intrare.
o KMO as fie mai maré de 0.60. datele nu sunt factorializabile daca valoarea
KMO este mai mica de 0.50. Pentru KMO acceptabil se studiaza valorile de
variabila ale indicelui aflate pe diagonala matricei de corelatii anti-imagine.
o Cumularea unor esantioane diferite pentru factorializare se poate face numai
daca acestea au, independent, structura factorialã asemanatoare (Garson)

Semnificatie.
o Factorii trebuie sa aiba validitate intuitiva (face validity). Útil as fie folositi mai
multi judecatori pentru a defini factorii.
o Varianta PCA nu are test de semnificatie. Extrageri de tipul ML, GLS etc. au
asociate teste de semnificatie
o Rotirea prin VARIMAX maximizeaza variaţ iile pe coloana, între saturatiile
aceluiasi factor iar QUARTIMAX maximizeaza variaţ iile interfactoriale pentru

DS/draft2/11/7/2006 5
aceasi variabilă. Prima metoda sporeste interpretabilitatea factorilor iar cea
de-a doua sporeste interpretabilitatea variabilelor functie de factori.
EQUAMAX este o metoda intermediara intre QUARTIMAX si VARIMAX.
o OBLIMIN se adopta pentru ipoteza factorilor corelati (factorialã oblica) dar si
pentru a testa independenta lor, ca etapa premergatoare in adoptarea
factorialei ortogonale.

Variante importante de AF: R –grupare de variabile şi


Q- grupare de cazuri

Referinţe
Pentru introducere în AF, vezi
David Garson
http://www2.chass.ncsu.edu/garson/pa765/factor.htm ,
Dumitru Sandu, “Analiza factorială”, în Catalin Zamfir, Lază
r
Vlasceanu (coord) Dictionar de sociologie, Bucuresti :Babel, 1993 .
Pentru detalii de interpretare în analiza factorială pe o temă
specifică vezi Dumitru Sandu , „Agenda publica în
Romania de azi”, în Barometrul de Opinie Publică. Mai
2006. Percepţii despre mass-media , FSD, 2006.
Pentru o aplicatie a analizei path , vezi Dumitru Sandu
Sociologia tranzitiei. Valori şi tipuri sociale în
România , Bucuresti:Staff, 1996, cap.7

DS/draft2/11/7/2006 6

S-ar putea să vă placă și