Sunteți pe pagina 1din 6

Suport L6L7 Analiza factoriala (AF) i analiza path

Obiectivul metodei: a) economia, sextragun num


r de factori redus
i b) interpretabilitatea (s
ajungla satura
ii mari pentru acela
i indicator numai ntr-un singur factor. Realizarea celor dou
obiective se face prin algoritmi specifici de extragere a factorilor pentru economie (prin PCA, PAF,
ML etc) si de rotire a lor pentru interpretabilitate (VARIMAX, OBLIMIN, QUARTIMAX,
EQUAMAX etc.). O structura factoriala este cu atat mai simpla cu cat are mai putini
factori/variabile latente/dimensiuni.

Introducerea metodei prin inputuri i output-uri esen


iale
Intrebare: cum se grupeazn mentalul colectiv opiniile referitoare la problemele actuale ale
Romaniei?. Cum poate fi redus un set de 11 indicatori de agenda publicla cateva dimensiuni?
Date de intrare n AF: matricea coeficien
ilor de corela
ie Bravais-Pearson ntre to
i itemii care
urmeaza fi redusi la dimensiuni sau factori
Output esential:matricea rotita a factorilor
FACTORI SAU VARIABILE LATENTE. Sensul
factorului este dat de itemii cu satura
ie maxima.
Este rezultat de interpretare
Rotated Component Matrix(a)
variabila
nume variabila

Component
1 calitatea 2
3
vietii
institutii coruptie

apret5

preturi

,805

,076

,187

amunca5

locurile de munca
pensiile
locuinte

,765

,082

,098

,715

,080

,334

,646

,305

,116

sanatatea
institutiile locale
institutiile centrale

,591

,300

,301

,113

,895

,162

,121

,888

,211

educatie
infractionalitatea
coruptia
justitia

,281

,673

,215

,198

,177

,820

,340

,146

,771

,155

,290

,766

apensii5
alocuinta5
asanat5
ainstloc5
ainstc5
aeduc5
ainfract5
acorupt5
ajust5

Coeficienti de satura
ie
(loadings) echivalentul
coeficien
ilor beta din
regresia multipl
. Masoara
intensitatea influen
ei
factorului asupra
indicatorului . Ex de citire:
cresterea cu o abatere
standard pe scala factorului 1
este insotita de cre
terea cu
0.805 abateri standard pe
scala item-ului referitor la
perceptia gravitatii problemei

Extraction Method: Principal Component Analysis.


Rotation Method: Varimax with Kaiser Normalization.
a Rotation converged in 5 iterations. KMO=0.86 indica un potential foarte bun de factorializare a datelor (veyi mai
departe detalii de despre KMO).

DS/draft2/11/7/2006

Introducerea metodei prin AF confirmatorie


Doua tipuri de factorial exploratorie, far model teoretic
i confirmatorie, cu model teoretic asociat.
Datele de intrare pentru um model didactic, simplificat fata de cel din tabelul anterior o matrice de
corela
ii de tipul 4*4. Ingrijorarile fata de preturi si locurile de munca sunt mai puternic legate intre ele
decat cu cele referitoare la functionarea institutiilor centrale sal locale.
Date de intrare, o matrice de corela
ii de tipul 4*4
Correlation Matrix
Correlation

Sig. (1-tailed)

amunca5
1,000

apret5
,528

ainstc5
,215

ainstloc5
,194

apret5

,528

1,000

,236

,222

ainstc5

,215

,236

1,000

,816

ainstloc5

,194

,222

,816

1,000

,000

,000

,000

,000

,000

amunca5

amunca5
apret5

,000

ainstc5

,000
,000

ainstloc5

,000
,000

,000
,000

Un model factorial confirmatoriu: exisitdoutipuri de ingrijorri majore, legate de calitatea


vietii si de institu
ii. Cele doutipuri de ngrijorri sunt correlate pozitiv ntre ele.
Coeficient path (beta): cre
terea cu o unitate standard pe scala factorului ngrijor
ri asupra calit

ii vie
ii este
nso
it
, n medie, de cre
terea ngrijor
rii referitoare la pre
uri cu 0.77 abateri standard
,48
amunca5

,69

U1

CALIT.VIETII
explica 48% din
varia
ia
indicelui
amunca5

CALIT.VIETII

,59

,77

U2

apret5

,33
,75
ainstloc5

,87

U3

INSTITUTII

,88

,94

U4
ainstc5

Figura 1.Diagrama path a unui model factorial de tip confirmatoriu (cu model teoretic pre-existent).

Chi-square = ,477, Degrees of freedom = 1, Probability level = ,490, Model construit cu Amos 6
. Modelul prezentat face parte din seria modelelor de ecuatii structurale (structural equation models SEM)
caracterizate prin faptul copereazsimultan cu mai multe variabile dependente. Rezolvarea unor astfel de
modele se face i prin soft-uri de tip AMOS sau LISREL (Linear Structural Equations Models).

DS/draft2/11/7/2006

AF exploratorie, fara model teoretic, varianta ortogonala, cu


fatori independenti
In AF exploratorie de tip PCA (analiza componentelor principale), fatorii sunt independenti (ortogonali)
iar saturatiile sunt calculate pentru relatiile intre toate perechile indicatori-factori. Cercetatorul nu mai are
posibilitatea, precum in analiza confirmatorie as predetermine numrul de factori si rela
iile dintre
variabilele manifeste si factori.

Figura 2. Reprezentarea rela


iilor dintre factori
i variabile pentru modelul bifactorial, extragere PCA,
rotire VARIMAX

KMO and Bartlett's Test


Kaiser-Meyer-Olkin Measure of Sampling
Adequacy.
Bartlett's Test of
Sphericity

,556

Approx. Chi-Square
df
Sig.

2987,411
6
,000

Valori KMO mai mici de 0.50 indic


date inadecvate pentru
AF.KMO=suma patratelor
corelatiilor dintre variabile/(suma
patratelor corelatiilor+suma
patratelor corelatiilor partiale din
matrice). KMO indica valori ridicate
ale corelatiilor partiale, semn de
comunalitate redusa in matricea de
date. KMO=0.55 indica o adecvare
redusa a datelor pentru factorializare.

Toate cele patru variabile din model au un indice KMO mai mare de 0.50, asa cum rezulta din valorile
marcate cu a in matricea de mai jos.
Anti-image Matrices

Anti-image Covariance amunca5 loc.munca


apret5 preturi
ainstloc5 instit.locale
ainstc5 instit.centrale
Anti-image Correlation amunca5 loc.munca
apret5 preturi
ainstloc5 instit.locale
ainstc5 instit.centrale

amunca5
ainstloc5
ainstc5
loc.munca apret5 preturi instit.locale instit.centrale
,712
-,356
-,004
-,029
-,356
,704
-,020
-,026
-,004
-,020
,334
-,267
-,029
-,026
-,267
,330
,586 a
-,502
-,007
-,060
-,502
,599 a
-,042
-,054
-,007
-,042
,537 a
-,804
-,060
-,054
-,804
,540 a

a. Measures of Sampling Adequacy(MSA)

DS/draft2/11/7/2006

Comunalitatile
-echivalente
ca
semnificatie cu determinatia mltipla
din regresia mltipla. Cei di factori
principali explica 77% din variatia
itemului de ingrijorare fata de munca.
Itemii cu valoare redusa a comunalit

ii
sunt candidati la excludere din model

Communalities
amunca5
apret5
ainstc5
ainstloc5

Initial
1,000
1,000

Extraction
,768
,760

1,000
1,000

,907
,909

Extraction Method: Principal Component Analysis.

Total Variance Explained

Component
1
2
3
4

Initial Eigenvalues
Extraction Sums of Squared Loadings Rotation Sums of Squared Loadings
Total % of VarianceCumulative % Total % of VarianceCumulative %
Total % of VarianceCumulative %
2,129
53,216
53,216
2,129
53,216
53,216
1,811
45,280
45,280
1,216
30,392
83,608
1,216
30,392
83,608
1,533
38,328
83,608
,472
11,788
95,397
,184
4,603
100,000

Extraction Method: Principal Component Analysis.

Matricea factorilor dupa extragere, fara rotire


Component Matrixa

ainstc5
ainstloc5
amunca5
apret5

Component
1
2
,842
-,445
,831
-,467
,591
,647
,616
,617

Valoare proprie a factorului, ponderea variatiei


variabilelor explicata de factor, data de suma
patratului saturatiilor din factor. Factorul 1 explic
,
dup rotire, 45% (=1.811*100/4) din variatia
datelor. Variatia totala n matricea de date este egala
cu numarul de variabile pentru ca fiecare dintre
acestea sunt standardizate, implicit, cu scorul z si, in
consecinta au varianta egala cu 1. Impreuna, cei doi
factori explic83.6% din varia
ia matricei de date.

Extraction Method: Principal Component Analysis.


a. 2 components extracted.

Matricea factorilor duprotire


Rotated Component Matrixa

ainstc5 instit.centrale
ainstloc5 instit.locale
amunca5 loc.munca
apret5 preturi

Component
1
2
,943
,137
,946
,113
,096
,871
,134
,862

Extraction Method: Principal Component Analysis.


Rotation Method: Varimax with Kaiser Normalization.
a. Rotation converged in 3 iterations.

DS/draft2/11/7/2006

Factorul 1 este definit de ngrijorarea


fatde func
ionarea institu
iilor, itemii
cu satura
ii maxime n factor

Factorul 2 este definit de ngrijorarea


fatde ob
inerea locurilor de munc

i fata de preturi

Matricea scorurilor factoriale


Component Score Coefficient Matrix

ainstc5 instit.centrale
ainstloc5 instit.locale
amunca5 loc.munca
apret5 preturi

Component
1
2
,535
-,063
,542
-,080
-,089
,594
-,066
,581

Cresterea cu o abatere standard pe scala


ingrijor
rii
fa
de
func
ionarea
institu
iilor centrale duce la cre
terea
ngrijor
rii fa
de institu
ii cu 0.53
abateri standard.

Extraction Method: Principal Component Analysis.


Rotation Method: Varimax with Kaiser Normalization.

Scorurile factoriale permit construrea unor indici de reducere a unei multimi de variabile la
una de tip sintetic.
Pe exemplu dat, solutia ortogonal, cu factori independenti, este aplicata legitim, deoarece in
factorial de tip oblic (prin rotire OBLIMIN) corelatia dintre cei doi factori este de 0.26, ceea ce
inseamna o determinatie simpla mai mica de 10%.
Sintaxa comenzii pentru exemplu prezentat
FACTOR
/VARIABLES amunca5 apret5 ainstloc5 ainstc5 /MISSING LISTWISE
/ANALYSIS
amunca5 apret5 ainstloc5 ainstc5
/PRINT INITIAL KMO AIC EXTRACTION ROTATION FSCORE
/FORMAT SORT
/CRITERIA MINEIGEN(1) ITERATE(25)
/EXTRACTION PC
/CRITERIA ITERATE(25)
/ROTATION VARIMAX
/METHOD=CORRELATION .

Condi
ii de aplicare a AF, probleme de interpretare
aceleai ca si la regresia mltipla
Variabile.
o numr relativ egal de variabile pe factor. til as se lucreze cu metoda stepwise in selectia variabilelor si cu pornnire de la setul de itemi pentru care
asocierile sunt clar interpretabile.
o numarul de cazuri/variabila, cel pu
in 5 iar numarul total de cazuri cel pu
in
200 (vezi detalii in Garson)
o cel pu
in trei variabile pe factor (Thurstone)
o variabile care au saturatii apropiate in factori diferiti trebuie eliminate ca
factor de zgomot in matricea factoriala
Datele de intrare.
o KMO as fie mai mar de 0.60. datele nu sunt factorializabile daca valoarea
KMO este mai mica de 0.50. Pentru KMO acceptabil se studiaza valorile de
variabila ale indicelui aflate pe diagonala matricei de corelatii anti-imagine.
o Cumularea unor esantioane diferite pentru factorializare se poate face numai
daca acestea au, independent, structura factorial asemanatoare (Garson)
Semnificatie.
o Factorii trebuie sa aiba validitate intuitiva (face validity). til as fie folositi mai
multi judecatori pentru a defini factorii.
o Varianta PCA nu are test de semnificatie. Extrageri de tipul ML, GLS etc. au
asociate teste de semnificatie
o Rotirea prin VARIMAX maximizeaza varia
iile pe coloana, ntre saturatiile
aceluiasi factor iar QUARTIMAX maximizeaza varia
iile interfactoriale pentru

DS/draft2/11/7/2006

aceasi variabil. Prima metoda sporeste interpretabilitatea factorilor iar cea


de-a doua sporeste interpretabilitatea variabilelor functie de factori.
EQUAMAX este o metoda intermediara intre QUARTIMAX si VARIMAX.
OBLIMIN se adopta pentru ipoteza factorilor corelati (factorial oblica) dar si
pentru a testa independenta lor, ca etapa premergatoare in adoptarea
factorialei ortogonale.

Variante importante de AF: R grupare de variabile i


Q- grupare de cazuri

Referine
Pentru introducere n AF, vezi
David Garson
http://www2.chass.ncsu.edu/garson/pa765/factor.htm ,
Dumitru Sandu, Analiza factorial, n Catalin Zamfir, Laz
r

Vlasceanu (coord) Dictionar de sociologie, Bucuresti :Babel, 1993 .


Pentru detalii de interpretare n analiza factorial pe o tem
specific vezi Dumitru Sandu , Agenda publica n
Romania de azi, n Barometrul de Opinie Public. Mai
2006. Percepii despre mass-media , FSD, 2006.
Pentru o aplicatie a analizei path , vezi Dumitru Sandu
Sociologia tranzitiei. Valori i tipuri sociale n
Romnia , Bucuresti:Staff, 1996, cap.7

DS/draft2/11/7/2006

S-ar putea să vă placă și