Analiza Factorială Şi Indecşi

Analiza factorială exploratorie
Construcţia şi alegerea modelului factorial. Construcţia de

indecşi
Lecturi:
Culic. I. (2004): Cap. 4., pp. 79-128.
Rotariu, T. et. al. (1999): Cap. 14, pp. 304-333.
Tabachnick and Fidell (2006): Cap 13, pp. 607-675
Un posibil model al procesului cunoaşterii:
Conceptul
Realitatea
(un model
percepută
al realităţii)
Construcţia, analiza Operaţionalizarea

conceptului
şi interpretarea (dimensiuni şi
indicelui sintetic indicatori)
Măsurarea
empirică a
indicatorilor
(variabilelor)
RV. Cât de importante sunt fiecare din următoarele pentru ca o persoană din
România de azi să reuşească în viaţă?
Foarte Destul de Nu prea Deloc

important
Important
important important important
NŞ NR
1
Să se nască într-o 1 2 3 4 5 8 9
familie bogată
2 Să aibă relaţii 1 2 3 4 5 8 9
3
Să aibă noroc / 1 2 3 4 5 8 9
şansă
Să creadă în
4 1 2 3 4 5 8 9
Dumnezeu
Să fie deşteaptă /
5 1 2 3 4 5 8 9
inteligentă
6 Să arate bine 1 2 3 4 5 8 9
7 Să facă şcoală 1 2 3 4 5 8 9
8 Să muncească mult 1 2 3 4 5 8 9
9 Să fure 1 2 3 4 5 8 9
Să ştie să se
10 1 2 3 4 5 8 9
descurce
Analiza validităţii interne –
consistenţei interne a scalei
• Am dori să înţelegem care cred oamenii ca sunt determinanţii reuşitei în
viaţă. Am operaţionalizat conceptul printr-un set de item pe care dorim să îi
sintetizăm într-o scală aditivă (indice aditiv).
• În afară de validitatea şi fidelitatea indicatorilor utilizaţi, trebuie să testăm şi
validitatea internă a setului de itemi.
• Dacă setul nostru de indicatori are validitate internă, atunci varianţele lor
sunt explicate în mare măsură de covarianţele lor cu factorul latent. Acest
lucru presupune că ele covariază puternic. Dar fiecare variabilă are şi o parte
de varianţă unică, care nu se datorează factorului latent.
• Atunci când construim indicele aditiv, noi includem nu doar covarianţele cu
factorul latent (scorurile adevărate) ci şi varianţele unice (erorile).
De exemplu, este foarte probabil că variabila “să ştie să se descurce” indică
nu doar abilităţile pe care le are o persoană (scor adevărat), dar şi evaluarea
contextului mai general în care poate să acţioneze, factori ce nu ţin de
conceptul pe care-l măsurăm (erori de măsurare).
VAR (xi) = σ2X = COV (xi, factor) + Error Ui
i
sau: σXi = Cor (xi, factor) + Error Ui
Validitatea internă: Chronbach’s alpha
• Considerăm că indicele aditiv reflectă un factor latent;

• Putem estima ce proporţie din varianţa factorului latent este cuprinsă în
varianţa setului de itemi dacă comparăm varianţa indicelui aditiv cu suma
varianţelor itemilor, ţinând cont de numărul de itemi.
= (k/(k-1)) * [1- (s2i)/s2sum]
Aceasta este formula celui mai cunoscut coeficient de validitate internă:
Cronbach's coefficient alpha (α).
• k – numărul de itemi (variabile incluse în indice)
• Σ s2i –suma varianţelor itemilor i
• Σ s2 suma itemilor (index) - varianţa indicelui aditiv (obţinut prin însumarea itemilor)
• Dacă indicele nu reflectă un factor latent, adică nu există un scor adevărat
măsurat de scala noastră atunci toată varianţa este datorată factorilor unici
(erorilor) iar variabilele nu covariază. În acest caz valoarea lui alpha este 0.
• Dacă toate variabilele covariază perfect, factorii unici (erorile) au valoarea 0 iar
alpha va avea valoarea 1.
Validitate internă: Chronbach’s alpha
Utilizând notaţiile anterioare, putem scrie:
α = k/(k-1) * [1 – (Σ σ2Xi) / σ2scale xi)]
De exemplu, dacă dorim să construim un indice bazat pe doar două variabile (să se
descurce şi să aibă relaţii) atunci putem calcula ALPHA în felul următor.
α = 2/(2-1) * [1 – (σ2rv2 + σ2rv10) / σ2index1]
α = 2 * (1 – (2.103+2.003)/6.378) = 2 * (1-0.644) = 2*0.356 = 0.712
Scale Reliability Statistics

Cronbach's α
scale 0.712
Note. Of the observations, 2100 were used, 0 were

excluded listwise, and 2100 were provided.
Interpretare: ne aşteptăm ca varianţa reuşitei în viaţă pe bază de capacităţi de a se descurca şi pe bază

de relaţii să indice, cumulativ, 71% din varianţa reuşitei pe bază de capital social.
ATENŢIE: Aici variabila explicată (reuşita pe bază de capital social) NU ESTE MĂSURATĂ DIRECT! Este un
factor latent, iar semnificaţia lui ŢINE DE INTERPRETAREA NOASTRĂ!
Validitatea internă: Split half reliability
O modalitate alternativă de a evalua validitatea internă a unei scale este a

împărţi în mod aleator setul de itemi în două şi de a măsura corelaţiile dintre
scalele aditive obţinute pe baza celor două sub-seturi.
Dacă scala are o validitate internă perfectă, atunci cele două sub-scale trebuie
să fie perfect corelate (i.e., r = 1.0).
Coeficientul Spearman-Brown:
rsb = 2rxy /(1+rxy)
In această formulă, rsb este coeficientul Spearman-Brown (split-half

reliability), iar rxy reprezintă coeficientul de corelaţie dintre cele două sub-
scale.
Validitatea internă: Chronbach’s alpha
O altă modalitate de a construi coeficientul alpha se bazează tot pe împărţirea

aleatoare a setului de itemi în două.
Setul de itemi este împărţit aleator în două şi se calculează coeficienţii de corelaţie
mediu dintre itemii cuprinşi în fiecare subset. Apoi setul se împarte din nou aleator
în două, se calculează coeficienţii de corelaţie dintre itemii din noile sub-seturi iar
procesul se repetă până toate combinaţiile posibile sunt epuizate.
Chronbach’s alpha poate fi calculat ca şi media corelaţiilor medii dintre toate sub-
seturile posibile de itemi.
α = k * corelaţia medie / [1+(k-1) * corelaţia medie]
k – numărul itemilor
Corelaţia medie – corelaţia medie dintre itemi
Reliability analysis: Chronbach’s alpha
Am construit o scală aditivă bazată pe toţi itemii cuprinşi în chestionar:
Reusita = rv1+ rv2 + … + rv10
Indicele aditiv este măsurat pe o scală de la 10 la 50 (10 itemi * 5 puncta pe fiecare
scala)
Descriptive Statistics
Reusita
Valid 1781
Missing 0
Mean 20.887
Std. Deviation 4.786
Minimum 10.000
Maximum 39.000
Pears
—
on's r
rv1
p- —
value
Pears 0.685 —
on's r
rv2
p-
value < .001 —
Pears
0.556 0.630 —
on's r
rv3
p-
< .001 < .001 —
value
Pears
0.384 0.416 0.525 —
on's r
rv4
p-
< .001 < .001 < .001 —
value
Pears
0.501 0.580 0.633 0.530 —
on's r
rv5
p-
< .001 < .001 < .001 < .001 —
value
Pears 0.486 0.504 0.482 0.392 0.547 —
on's r
rv6
p-
value < .001 < .001 < .001 < .001 < .001 —
Pears 0.409 0.479 0.535 0.508 0.692 0.523 —
on's r
rv7
p-
< .001 < .001 < .001 < .001 < .001 < .001 —
value
Pears 0.417 0.431 0.526 0.504 0.643 0.458 0.711 —
on's r
rv8
p-
< .001 < .001 < .001 < .001 < .001 < .001 < .001 —
value
Pears
on's r 0.308 0.330 0.269 0.193 0.264 0.299 0.226 0.213 —
rv9
p-
< .001 < .001 < .001 < .001 < .001 < .001 < .001 < .001 —
value
Pears
0.469 0.553 0.525 0.436 0.607 0.472 0.549 0.501 0.365 —
on's r
rv10
p- < .001 < .001 < .001 < .001 < .001 < .001 < .001 < .001 < .001 —
value
Reliability analysis: Chronbach’s alpha
Item Reliability Statistics

If item dropped
Cronbach's α
rv1 0.651
Scale Reliability rv2 0.643
Statistics rv3 0.647
Cronbach's rv4 0.673
α rv5 0.652
scale 0.687 rv6 0.654
rv7 0.662
rv8 0.667
rv9 0.718
rv10 0.665
Construirea unei scale cu validiate internă prin intermediul lui Chronbach’s alpha
În practică, trebuie să facem un compromis între numărul

de itemi dezirabili din pdv statistic (cât mai mulţi!) şi
numărul dezirabil din pdv al costurilor (cât mai puţini!).
1. Crearea setului de itemi – un proces creativ, se pot organiza focus
group-uri pentru a elabora cât mai mulţi indicatori.
2. Selectarea itemilor relevaţi. Se realizează un studiu pilot în care

itemii cu abateri standard reduse şi medii extreme sunt eliminaţi. De
asemenea, se elimină itemii despre care respondenţii declară că nu
i-au înţeles sau pe care i-au interpretat în mod diferit.
3. Alegerea itemilor care au consistenţă internă
4. Eliminarea itemilor care prezintă corelaţii reduse şi recalcularea

coeficientului alpha. ATENŢE: Se poate întâmpla ca, eliminând mai
mulţi itemi, validitatea internă a scalei să se reducă!
In cazul nostru, dacă ştergem rv9 să fure avem Alpha = ,718

Analiza factorială
Analiza factorială – “o colecţie de metode statistice multivariate al căror scop principal este
identificarea structurii latente a unui set de date care descriu un concept ori un fenomen sau
care caracterizează o populaţie de obiecte” (Culic, 2004: 79).
Exemple: încrederea în instituţii, gradul de satisfacie faţă de activitatea guvernului, reţelele

sociale la care au acces indivizii, condiţiile mediului de viaţă, iniţiativa civică, etc.
Analiza factorială poate fi utilizată:

a. Într-un demers exploratoriu: avem un set de date empirice (variabile) şi dorim să clarificăm
modul în care aceste date se structurează şi co-variază. Cu ajutorul analizei factoriale, putem
identifica posibili factori latenţi care determină co-variaţia variabilelor observate.
b. Într-un demers confirmativ, în care testăm o ipoteză privind relaţia dintre variabilele
observate.
c. În validarea unei scale de măsură (indice) al unui concept abstract undimensional sau a unei
dimensiuni a unui concept abstract. Dimensiunea este operaţionalizată printr-un set de itemi,
fiecare item având drept corespondent empiric o variabilă măsurată. Prin analiza factorială
putem testa validitatea internă a scalei de măsură, adică faptul că toate variabilele indică
aceeaşi dimensiune a conceptului.
Logica analizei factoriale
Puncte critice la care trebuie să răspundem într-o analiză
factorială:
- care dintre variabilele observate (itemi) indică aceeași
dimensiune latentă (același factor)? –> variabilele care
compun aceeași dimensiune latentă trebuie sa fie
puternic corelate între ele;
- care este intensitatea asocierii dintre factorul latent şi
fiecare variabilă observată care ii corespunde? ->
identificarea și denumirea factorilor;
- care este relația dintre factorii latenţi? Sunt aceștia
independenți, sau sunt corelați?
Modelul general al analizei factoriale:
Putem observa o corelaţie puternică între să se nască într-o familie bogată (X1) şi să
aibă relaţii (X2), coeficientul de corelaţie al lui Pearson r(X1, X2)=0.685.
Presupoziţia noastră:
X1 U1 d1
b11
F1
X2 U2
b21 d2
Analiza factorială înseamnă că noi încercăm să realizăm o regresie a
variabilei obsevate (variabila dependentă) asupra unui factor latent (variabila
independentă, explicativă) pe care nu o putem însă măsura direct şi astfel
trebuie să o construim, să o “extragem” din datele pe care le avem.
X1= b11 * F1 + d1 * U1 În afară de factorul comun (F1), variabilele
X2= b21 * F1 + d2 * U2 noastre sunt explicate şi de nişte determinanţi
unici (U1 and U2), independenţi şi necorelaţi
cu factorii.
Prima A doua Deci: r(U1, U2)=0
cifră cifră
indică indică r(U1, F1)=0, r(U2, F1)=0
variabila factorul
Discuţie I:
Cum poate fi exprimată varianţa variabilei X1 (să se nască într-o familie bogată)?
X1= b11 * F1 + d1 * U1 b11 se numeşte saturaţia lui F1 pentru X1 (factor loading
sau pattern loading) şi este interpretat ca un coeficient de regresie standardizat
BETA
X1, F1, U1 sunt standardizate, deci au media=0 iar varianţa=1
VAR (x1) = Σ [x1i – media(x1)]2/n VAR (X1) = b211 * VAR(F1) + d21* VAR(U1)
VAR (X1) = b211 + d21
Partea de varianţă a lui Partea de varianţă care se

X1 explicată de F1, datorează unor determinanţi unici
numită comunalitate
Care este corelaţia dintre variabilă măsurată şi factorul latent?
r(x1, F1) = Σ[ x1i – media(x1)]*[F1i – media(F1)]/n (pt. că abaterile standard=1)
r(X1, F1) = Σ(x1i*F1i)/n
r(x1, F1) = b11

Comunalitati
Mov: comunalitate = 1 pentru ca e subsumata complet celorlalte doua variabile

(galben si gri)
Portocaliu: comunalitate = 0 pentru ca nu este legat de ceilalti itemi
Discuţie II:
Cum poate fi exprimată corelaţia observată dintre X1 şi X2 pe baza corelaţiilor lor
cu factorul F1?
X1= b11 * F1 + d1 * U1
X2= b21 * F1 + d2 * U2
r(X1, X2)=Σ[(x1i-media(x1)][x2i-media(x2)]/n
r(X1, X2) = b11*b21
! În analiza factorială, factorii sunt “extraşi” astfel încât corelaţiile re-construite

dintre variabile pe baza corelaţiilor lor cu factorii latenţi să se apropie cât mai mult
de corelaţiile observate. Corelaţiile observate sunt prezentate în matricea
corelaţiilor bivariate (dintre variabile luate două câte două).
Softurile de analiză calculează suma diferenţelor pătratice dintre corelaţiile observate şi cele
obţinute (construite) pe baza modelului factorial şi se obţine astfel o măsură similară cu HI-
pătrat. Aceasta testează adecvarea modelului factorial (the goodness of fit of the model). În
practică este de preferat un model factorial mai simplu, chiar dacă acesta este mai puţin
adecvat (există diferenţe semnificative între matricea corelaţiilor re-construite şi matricea
corelaţiilor observate).
Ce presupoziţii putem face despre factorii latenţi?
Corelaţia dintre x1 şi x2 se datorează în întregime factorilor latenţi:
COV (X1,X2)
r(X1 X2) = I. Doi factori independenţi:
X X1 2
F1 X1 U1
X2 U2
r(X1 X2) =
Σ(X1i –media(X1))*(X2i-media(X2)) X3 U3
F2 X4 U4
 X X
1 2
X5 U5
X1 şi X2 sunt standardizate, deci: media (X1) = media (X2)=0, iar X1 =X2=1.
X1=b11*F1 + b12*F2+ d1U1

X2=b21*F1 + b22*F2+ d1U1 (Pentru demonstraţii, vezi Culic, 2004: pp. 86-94)
În general: r(X1 X2) = b11 * b21 + b12 * b22 + b11 * b22 * rF1F2 + b21 * b12 * rF1F2
Dacă factorii sunt independenţi r(F1, F2)=0, atunci r(X1, X2)=b11*b21+b12*b22

Doi factori corelaţi:
X1 U1
F1 r (X1, F1) = b11 + b12 * r(F1,F2)
X2 U2
r (X1, F2) = b12 + b11 *r(F1,F2)
F2
Efect direct al lui F2 Efect indirect,
mediat de F1
X3 U3
VAR (X1) = b112 + b122 + b11 * b12 * 2 r(F1, F2) - d12
Comunalitatea lui X1 (partea din Ceea ce rămâne ne-explicat de

varianţă explicată de factori) factori din varianţa lui x1
b11 este saturaţia lui F1 (factor loading F1) iar b12 este saturaţia lui F2 (factor loading F2).
Dacă noi alegem un model în care factorii sunt independenţi, atunci corelaţiile dintre factori
şi variabile se reduc la efectele directe, deci sunt identice cu saturaţiile (factor loadings).
Pe scurt - logica analizei factoriale
X1=b11*F1 + b12*F2+ b13*F3 + …+ b1n*Fn + d1*U1

………………
Xm=bm1*F1 + bm2*F2+ bm3*F3 + …+ bmn*Fn + dm*Um
F1, F2, … Fn sunt factorii comuni care determină fiecare dintre variabilele X1, X2, … Xm, iar U1,
U2, … Um sunt factorii lor de unicitate.
Analiza factorială urmăreşte reducerea variabilelor observate la un număr mai redus de factori
latenţi, aşadar n < m.
Factorii de unicitate U1, U2, … Um sunt independenţi de factorii comuni F1, F2,… Fn şi sunt
independenţi (ne-corelaţi) între ei.
Întreaga varianţă comună a variabilelor X1, X2,… Xm este datorată factorilor comuni F1, F2, … Fn.
Coeficienţii bi1, bi2,… bin se numesc saturaţii ale factorilor (pattern loadings sau factor loadings)
F1, F2, … Fn pentru fiecare variabilă i (i < = n).
Având în vedere că modelul factorial se bazează pe ecuaţii multiple, coeficienţii b pot fi
interpretaţi drept coeficienţi de regresie multilpla.
Extracţia factorilor: soluţia initială (Parallel analysis)
Factor Loadings
Factor 1 Factor 2 Factor 3 Uniqueness
rv1 . 0.751 . 0.448
rv10 . . . 0.858
rv2 . 0.660 . 0.474
rv3 . . 0.751 0.448
rv4 . . 0.388 0.783
rv5 0.575 . . 0.580
rv6 . 0.348 . 0.800
rv7 0.890 . . 0.355
rv8 0.672 . . 0.586
rv9 . 0.381 . 0.859
Note. Applied rotation method is promax.
Parallel analysis ia datele si le amesteca apoi apoi compara eigenvalues ale datelor
amestecate random cu cele ale datelor noastre şi le compară şi ne spune câţi factori
sunt mai mari decât şansa/întâmplarea. Aşadar, câţi factori extraşi sunt mai buni
decât într-un set de date amestecat aleatoriu.
Extracţia factorilor:
Diferenţa dintre corelaţiile observate şi cele re-construite (reproduse) este

măsurată ca suma pătratică a diferenţelor şi interpretată ca o măsură de tip
CHI-pătrat. Se testează semnificaţia statistică a diferenţelor pe baza
distribuţiei lui CHI-pătrat.
Chi-squared Test
Value df p
Model 83.735 18 < .001
Avem o diferenţă statistic semnificativă între

matricea corelaţiilor observate şi matricea
Cum au fost
corelaţiilor reproduse. Modelul nostru simplifică extraşi factorii?
considerabil realitatea – complexitatea relaţiilor
dintre variabile.
Metode de extracţie a factorilor
Analiza factorială exploratorie şi confirmativă: explicarea varianţei

comune a variabilelor (covarianţei acestora).
Metode de extragere a factorilor latenţi:
1.1 Metoda celor mai mici pătrate (the least squares method)
1.2 Metoda probabilităţii maxime (the maximum likelyhood method)
1.3 Metoda de extragere factorială Alpha (Alpha factoring)
1.4 Analiza imaginii (Image factoring)
1.5 Metoda factorilor principali (principal axis factoring)
În analiza factorială (spre deosebire de analiza componentelor principale!)

modelul în funcţie de care evaluăm modelul factorial este matricea corelaţiilor
(covarianţelor) ajustate, care ţine seama de factorii unici şi erorile de
eşantionare.
EFA vs. PCA
• EFA factorii latenţi cauzează raspunsurile la
întrebări
ex. IQ-ul cauzează modul în care răspund la un test
- Se analizează şi explică doar varianţa comună a variabilelor,
restul varianţei fiind considerate eroare.
• PCA întrebările cauzează componentele
Ex. Întrebările puse determină patternul de răspunsuri la care
ajung, deci componetele sunt combinaţii de variabile corelate şi
se asumă că variabilele cauzează componentele.
- E analizata întreaga varianţă variabilelor, adică varianţa comună
dintre şi unicitatea (eroarea).
Ambele metode sunt mai degrabă descriptive folosite pentru
reducerea datelor.
EFA vs. PCA vs. CFA
• Daca dorim reducerea datelor sau sortarea lor pornind de la
corelatiile dintre itemi folosim PCA
• EFA (si CFA) e un model care asuma ca exista niste variabile
latente/neobservate care cauzeaza raspunsul la itemi si de aici
rezulta si corelatia dintre itemi.
• Asta nu inseamna neaparat ca EFA e “mai teoretic” decat PCA
• Are sens sa validam EFA cu CFA (confirmatory factor analysis)
dar nu si PCA cu CFA.
• PCA construieste componente care incearca sa maximizeze
intreaga varianta explicata, iar EFA construieste factori care
maximizeaza varianta comuna a variabilelor.
• CFA permite sa testez ipotezele rezultate in urma analizei
exploratorii facuta ca EFA.
Testarea semnificaţiei statistice a matricei de corelaţie
Kaiser-Meyer-Olkin test Bartlett's test
MSA Χ² df p
Overa 20011.406 66.000 < .001
ll 0.739
MSA
v16a 0.793 Modalităţi de testare a corelaţiei dintre variabilele supuse analizei
v16b 0.662 factoriale:
v16c 0.691 1. Măsuri de adecvare a eşantionării – metoda Kaiser-Meyer-Olkin
v16d 0.756 (KMO), compară mărimea corelaţiilor observate cu mărimea
v16e 0.766 corelaţiilor parţiale (când toate celelalte variabilele sunt controlate).
v16f 0.753 Dacă KMO are o valoare ridicată (apropiată de 1), înseamnă că avem
factori comuni. Se acceptă modelul pentru valori mai mari decât 0.6.
v16g 0.711
v16h 0.803 2. Testul de sfericitate Bartlett - testează ipoteza că matricea de
v16i 0.816
corelaţie este identică cu matricea unitate (adică toate corelaţiile sunt
zero). Se calculează Χ2 (Chi-pătrat) pentru diferenţa dintre cele două
v16j 0.768
matrici şi se testează semnificaţia statistică a valorii sale pentru
v16k 0.689 gradele de libertate date. “p” arată care ar fi probabilitatea să
v16l 0.778 obţinem valoarea dată a lui Χ2 dacă ipoteza nulă (matricea
corespunde matricei unitate) este adevărată. Dacă p < 0.05 putem
respinge ipoteza nulă.
Additional fit indices
RMSEA 90%
RMSEA confidence TLI BIC
0.035 -
Model 0.044 0.950 -51.795
0.054
Este soluţia factorială optimă este cea cu trei factori extraşi?

Solutia: Cronbach’s alpha
Scale Reliability Statistics Scale Reliability Statistics Scale Reliability Statistics
Cronbach's Cronbach's Cronbach's

α α α
scale 0.720 scale 0.596 scale 0.446
Item Reliability Statistics Item Reliability Statistics Item Reliability Statistics

If item If item If item
dropped dropped dropped
Cronbach's α Cronbach's α Cronbach's

rv5 0.671 rv1 0.426 α
rv7 0.570 rv2 0.460 rv3 0.288
rv8 0.650 rv6 0.577 rv4 0.083
rv9 0.621
Rotirea factorilor
Adesea relaţiile dintre factori şi variabile nu se configurează suficient de clar. Rotaţia

factorilor este o problemă de transformare a datelor într-un model factorial mai simplu
şi mai clar, prin transformări ale matricei de saturaţii.
Efectul cel mai important al rotaţiei matricei de saturaţii este redistribuirea varianţei
explicate în soluţia de factori iniţială astfel încât factorii capătă o configuraţie mai
clară.
Rotaţia factorilor se poate realiza:

1. presupunând că factorii sunt necorelaţi (ortogonali):
1.1 metoda varimax – minimizarea numărului de variabile cu saturaţii mari pentru
mai mulţi factori (minimizarea variabilelor cu o apartenenţă ambiguă);
1.2 metoda quartimax – minimizează numărul de factori ce explică o variabilă
(minimizează componenţa factorială a variabilelor);
1.3 metoda equamax – aplică ambele criterii: minimizează numărul de variabile
care saturează un factor şi numărul de factori necesari pentru a explica o variabilă.
2. presupunând că factorii sunt corelaţi (oblici):
- rotaţia oblică direct oblim. Gradul de oblicitate este dat de valoarea lui δ (delta):
cu cât mai mare, cu atât mai accentuată este oblicitatea (corelaţia dintre factori).
Dacă presupunem că factorii sunt independenţi, atunci sistemul de axe este ortogonal
iar saturaţiile factorilor sunt egali cu coeficienţii de corelaţie Pearson dintre variabile şi
factori.
Corelaţia dintre factori: rF1F2=F1*F2* cos 90˚ = F1 *F2 * 0 = 0.
Putem roti soluţia factorială păstrând independenţa (ortogonalitatea) factorilor.
Interpretarea coeficientului de corelaţie ca un produs vectorial
F1
b11 X1
b21 X2
F2
b11 b22
Coeficientul de corelaţie a lui Pearson rX1,X2 =X1*X2*cosα

Cos 90˚=0
Cos 0˚=1
Noi nu cunoaştem lungimea vectorilor, doar valoarea coeficientului de corelaţie.

Acesta poate fi descompus în funcţie de saturaţiile factorilor:
rX1 X2 = b11 * b21 + b12 * b22 + b11 * b22 * rF1F2 + b21 * b12 * rF1F2
Dacă factorii sunt ortogonali, atunci rX1 X2 = b11 * b21 + b12 * b22
Dacă presupunem că factorii sunt corelaţi, atunci sistemul de axe NU este ortogonal, ci
oblic. Saturaţiile factorilor (efectele directe ale fiecărui factor) vor diferi de coeficienţii de
corelaţie dintre factori şi variabile, pentru că o parte din corelaţie se datorează corelaţiei
dintre factori (efecte indirecte ale factorilor prin ceilalţi factori). Corelaţia dintre factori:
rF1F2=F1*F2* cos α
Putem roti soluţia factorială presupunând că factorii corelează (rotaţie oblică).
Interpretarea coeficientului de corelaţie ca un produs vectorial
F1
b11 X1
b21 X2
F2
b11 b22
Coeficientul de corelaţie a lui Pearson rX1,X2 =X1*X2*cosα

Cos 90˚=0
Cos 0˚=1
Saturaţiile factorilor (b11, b21 – pentru F1, b12, b22 – pentru F2 etc.) vor fi egale cu coeficienţii de
corelaţie parţiali, obţinuţi prin controlarea efectelor celorlalţi factori.
Saturaţiile pot fi interpretate ca şi coefienţi de regresie multineară standardizaţi (beta).
efectul efectul efectele indirecte

direct al lui F1 direct al lui F2 datorate corelaţiei dintre F1 şi F2
Varianţa = comunalitatea + varianţa datorată factorului unic U

VAR (X1) = b112 + b122 + b11 * b12 * 2 r F1F2 - d12
Dacă factorii sunt corelaţi, atunci acestea au atât efecte directe asupra variabilelor
(prezentate în matricea saturaţiilor Pattern Matrix sau Pattern Loadings) cât şi efecte
indirecte.
Solutie cu doi factori?
Factor Loadings
Factor 1 Factor 2 Uniqueness
rv1 . 0.725 0.484
rv2 . 0.743 0.448
rv3 . 0.455 0.714
rv4 0.352 . 0.840
rv5 0.639 . 0.574
rv6 . 0.331 0.809
rv7 0.789 . 0.414
rv8 0.658 . 0.590
rv9 . 0.355 0.868
RMSEA RMSEA 90% TLI BIC

confidence
Model 0.062 0.053 - 0.917 10.556

0.071
Alpha….din nou
Scale Reliability Statistics Scale Reliability Statistics

Cronbach's α Cronbach's α
scale 0.671 scale 0.639
Item Reliability Statistics Item Reliability Statistics
If item dropped If item dropped

Cronbach's α
Cronbach's α
rv1 0.512
rv4 0.720
rv2 0.526
rv5 0.578
rv3 0.596
rv7 0.539
rv6 0.620
rv8 0.577 rv9 0.659
Solutie cu doi factori!
Factor Loadings
Factor 1 Factor 2 Uniqueness
rv1 . 0.714 0.514
rv2 . 0.815 0.365
rv3 . 0.463 0.742
rv5 0.616 . 0.579
rv7 0.780 . 0.417
rv8 0.664 . 0.573

RMSEA 90%
RMSEA TLI BIC
confidence
0.043
Model 0.061 - 0.954 1.800
0.082
Interpretare?
Putem considera că primul factor corespunde accentuării rolului

efortului personal (educaţie, muncă, inteligenţă) pentru a avea o viaţă
reuşită, iar cel de-al doilea factor a contextului social, ce nu este în
mod necesar sub controlul individului (relaţii, a fi născut într-o familie
bogată, a avea noroc).
Am putea construi doi indecşi:
1. încredere în efortul personal (achieved) – Index efort
2. accent pe rolul unor factori ce nu ţin de individ (ascribed, contextual)
– Index factori externi
Cum să construim aceşti indecşi?
I. Scale aditive simple, care nu ţin seama de intensitatea relaţiilor dintre
factori şi variabile.
Index efort = să facă şcoală + să muncească mult + să fie deşteaptă
Index factori externi = să aibă relaţii + să se nască într-o familie bogată + să aibă noroc
Putem păstra valorile iniţiale ale variabilelor, sau le putem recoda în variabile
dihotomice, unde 0 înseamnă “nu e important” şi 1 “important”.
II. Contruirea unor indici (scale) aditive
Factor Loadings
Factor 1 Factor 2
rv1 . 0.714 Index factori externi =

rv1*score_F2 + rv2*score_F2 +
rv2 . 0.815 rv3*score_F2
rv3 . 0.463
rv5 0.616 .
Index efort personal =
rv7 0.780 . rv7*score_F1 + rv8*score_F1 +
rv5*score_F1
rv8 0.664 .
Celelalte variabile nu au o apartenenţă clară la nici unul dintre cei doi indecşi.

Analiza Factorială Şi Indecşi

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Analiza Factorială Şi Indecşi

Încărcat de

Drepturi de autor:

Formate disponibile

Analiza factorială exploratorie

Construcţia şi alegerea modelului factorial. Construcţia de

Construcţia, analiza Operaţionalizarea

Foarte Destul de Nu prea Deloc

• Considerăm că indicele aditiv reflectă un factor latent;

Scale Reliability Statistics

Note. Of the observations, 2100 were used, 0 were

Interpretare: ne aşteptăm ca varianţa reuşitei în viaţă pe bază de capacităţi de a se descurca şi pe bază

O modalitate alternativă de a evalua validitatea internă a unei scale este a

In această formulă, rsb este coeficientul Spearman-Brown (split-half

O altă modalitate de a construi coeficientul alpha se bazează tot pe împărţirea

Item Reliability Statistics

În practică, trebuie să facem un compromis între numărul

2. Selectarea itemilor relevaţi. Se realizează un studiu pilot în care

3. Alegerea itemilor care au consistenţă internă

4. Eliminarea itemilor care prezintă corelaţii reduse şi recalcularea

In cazul nostru, dacă ştergem rv9 să fure avem Alpha = ,718

Exemple: încrederea în instituţii, gradul de satisfacie faţă de activitatea guvernului, reţelele

Analiza factorială poate fi utilizată:

Partea de varianţă a lui Partea de varianţă care se

r(X1, F1) = Σ(x1i*F1i)/n

r(x1, F1) = b11

Mov: comunalitate = 1 pentru ca e subsumata complet celorlalte doua variabile

r(X1, X2) = b11*b21

! În analiza factorială, factorii sunt “extraşi” astfel încât corelaţiile re-construite

X1=b11*F1 + b12*F2+ d1U1

Dacă factorii sunt independenţi r(F1, F2)=0, atunci r(X1, X2)=b11*b21+b12*b22

VAR (X1) = b112 + b122 + b11 * b12 * 2 r(F1, F2) - d12

Comunalitatea lui X1 (partea din Ceea ce rămâne ne-explicat de

X1=b11*F1 + b12*F2+ b13*F3 + …+ b1n*Fn + d1*U1

Note. Applied rotation method is promax.

Diferenţa dintre corelaţiile observate şi cele re-construite (reproduse) este

Avem o diferenţă statistic semnificativă între

Analiza factorială exploratorie şi confirmativă: explicarea varianţei

În analiza factorială (spre deosebire de analiza componentelor principale!)

Este soluţia factorială optimă este cea cu trei factori extraşi?

Item Reliability Statistics Item Reliability Statistics Item Reliability Statistics

Adesea relaţiile dintre factori şi variabile nu se configurează suficient de clar. Rotaţia

Rotaţia factorilor se poate realiza:

Coeficientul de corelaţie a lui Pearson rX1,X2 =X1*X2*cosα

Noi nu cunoaştem lungimea vectorilor, doar valoarea coeficientului de corelaţie.

Coeficientul de corelaţie a lui Pearson rX1,X2 =X1*X2*cosα

efectul efectul efectele indirecte

Varianţa = comunalitatea + varianţa datorată factorului unic U

Note. Applied rotation method is promax.

Additional fit indices

RMSEA RMSEA 90% TLI BIC

Model 0.062 0.053 - 0.917 10.556

Scale Reliability Statistics Scale Reliability Statistics

Item Reliability Statistics Item Reliability Statistics

If item dropped If item dropped

Note. Applied rotation method is promax.

Additional fit indices

Putem considera că primul factor corespunde accentuării rolului

rv1 . 0.714 Index factori externi =

S-ar putea să vă placă și

X1=b11F1 + b12F2+ d1U1

Dacă factorii sunt independenţi r(F1, F2)=0, atunci r(X1, X2)=b11b21+b12b22

X1=b11F1 + b12F2+ b13F3 + …+ b1nFn + d1*U1

Coeficientul de corelaţie a lui Pearson rX1,X2 =X1X2cosα

Coeficientul de corelaţie a lui Pearson rX1,X2 =X1X2cosα