Documente Academic
Documente Profesional
Documente Cultură
Construcţia
de indici sintetici, testarea validităţii interne a
indicilor. Introducere în analia factorială
Lecturi:
Culic, I. (2004): pp. 50-53;
Culic. I. (2004): Cap. 4., pp. 79-128.
Rotariu, T. et. al. (1999, 2006): Cap. 14, pp. 304-333.
Tabachnick şi Fidell (2007): Cap. 13: Principal Components and Factor Analysis, pp-
607 - 651
Un posibil model al procesului cunoaşterii:
Conceptul
Realitatea
(un model
percepută
al realităţii)
Măsurarea
empirică a
indicatorilor
(variabilelor)
RV. Cât de importante sunt fiecare din următoarele pentru ca o persoană din
România de azi să reuşească în viaţă?
1
Să se nască într-o 1 2 3 4 5 8 9
familie bogată
2 Să aibă relaţii 1 2 3 4 5 8 9
3
Să aibă noroc / 1 2 3 4 5 8 9
şansă
Să creadă în
4 1 2 3 4 5 8 9
Dumnezeu
Să fie deşteaptă /
5 1 2 3 4 5 8 9
inteligentă
6 Să arate bine 1 2 3 4 5 8 9
7 Să facă şcoală 1 2 3 4 5 8 9
8 Să muncească mult 1 2 3 4 5 8 9
9 Să fure 1 2 3 4 5 8 9
Să ştie să se
10 1 2 3 4 5 8 9
descurce
Analiza validităţii interne –
consistenţei interne a scalei
• Am dori să înţelegem care cred oamenii ca sunt determinanţii reuşitei în
viaţă. Am operaţionalizat conceptul printr-un set de item pe care dorim să îi
sintetizăm într-o scală aditivă (indice aditiv).
• În afară de validitatea şi fidelitatea indicatorilor utilizaţi, trebuie să testăm şi
validitatea internă a setului de itemi.
• Dacă setul nostru de indicatori are validitate internă, atunci varianţele lor
sunt explicate în mare măsură de covarianţele lor cu factorul latent. Acest
lucru presupune că ele covariază puternic. Dar fiecare variabilă are şi o parte
de varianţă unică, care nu se datorează factorului latent.
• Atunci când construim indicele aditiv, noi includem nu doar covarianţele cu
factorul latent (scorurile adevărate) ci şi varianţele unice (erorile).
De exemplu, este foarte probabil că variabila “să ştie să se descurce” indică
nu doar abilităţile pe care le are o persoană (scor adevărat), dar şi evaluarea
contextului mai general în care poate să acţioneze, factori ce nu ţin de
conceptul pe care-l măsurăm (erori de măsurare).
VAR (xi) = σ2X = COV (xi, factor) + Error Ui
i
sau: σXi = Cor (xi, factor) + Error Ui
Validitatea internă: Chronbach’s alpha
Coeficientul Spearman-Brown:
rsb = 2rxy /(1+rxy)
Descriptive Statistics
Reusita
Valid 1781
Missing 0
Mean 20.887
Std. Deviation 4.786
Minimum 10.000
Maximum 39.000
Pears
—
on's r
rv1
p- —
value
Pears 0.685 —
on's r
rv2
p-
value < .001 —
Pears
0.556 0.630 —
on's r
rv3
p-
< .001 < .001 —
value
Pears
0.384 0.416 0.525 —
on's r
rv4
p-
< .001 < .001 < .001 —
value
Pears
0.501 0.580 0.633 0.530 —
on's r
rv5
p-
< .001 < .001 < .001 < .001 —
value
Pears 0.486 0.504 0.482 0.392 0.547 —
on's r
rv6
p-
value < .001 < .001 < .001 < .001 < .001 —
Pears 0.409 0.479 0.535 0.508 0.692 0.523 —
on's r
rv7
p-
< .001 < .001 < .001 < .001 < .001 < .001 —
value
Pears 0.417 0.431 0.526 0.504 0.643 0.458 0.711 —
on's r
rv8
p-
< .001 < .001 < .001 < .001 < .001 < .001 < .001 —
value
Pears
on's r 0.308 0.330 0.269 0.193 0.264 0.299 0.226 0.213 —
rv9
p-
< .001 < .001 < .001 < .001 < .001 < .001 < .001 < .001 —
value
Pears
0.469 0.553 0.525 0.436 0.607 0.472 0.549 0.501 0.365 —
on's r
rv10
p- < .001 < .001 < .001 < .001 < .001 < .001 < .001 < .001 < .001 —
value
Reliability analysis: Chronbach’s alpha
In cazul nostru, dacă ştergem rv9 “să fure” avem Alpha = ,718
Analiza factorială
Analiza factorială – “o colecţie de metode statistice multivariate al căror scop principal este
identificarea structurii latente a unui set de date care descriu un concept ori un fenomen sau
care caracterizează o populaţie de obiecte” (Culic, 2004: 79).
Presupoziţia:
Există un număr redus de variabile latente (factori) care determină covariaţia dintre
variabilele observate.
Varianţa fiecărei variabile observate (Xi) se datorează factorilor latenţi (F1, F2,…, Fn)
şi unor determinanţi unici proprii (Ui). Factorii de unicitate sunt independenţi între
ei şi, de asemenea, de fiecare dintre dintre factorii latenţi.
De exemplu, în BOP Mai 2004 există un set de variabile care măsoară gradul de
încredere în diferite instituţii. Putem considera că aceştia sunt, de fapt, indicatorii
unei dispoziţii (atitudini) latente de încredere în instituţii?
Utilizând baza de date BOP 2004, construiţi un indice simplu aditiv al încrederii
în instituţii. Testaţi validitatea internă a indicelui utilizând coeficientul alpha al
lui Chronbach. Ce puteţi observa?
Mass
Câtã media
încredere (TV,
aveþi dvs. radio, Organizaþii Primãria
în_Bisericã Sindicate Bãnci presã) neguvernamentale Preºedinþie Guvern Parlament Justiþie Armatã Poliþie localitãþii
Correlation Câtã încredere
aveþi dvs. 1,000 ,251 ,159 ,222 ,155 ,271 ,251 ,217 ,220 ,325 ,280 ,243
în_Bisericã
Sindicate ,251 1,000 ,488 ,316 ,487 ,402 ,448 ,495 ,467 ,377 ,512 ,532
Bãnci ,159 ,488 1,000 ,411 ,497 ,373 ,382 ,412 ,450 ,334 ,463 ,426
Mass media (TV,
,222 ,316 ,411 1,000 ,406 ,338 ,334 ,304 ,298 ,426 ,362 ,385
radio, presã)
Organizaþii
,155 ,487 ,497 ,406 1,000 ,356 ,366 ,402 ,402 ,332 ,404 ,381
neguvernamentale
Preºedinþie ,271 ,402 ,373 ,338 ,356 1,000 ,800 ,683 ,558 ,457 ,518 ,474
Guvern ,251 ,448 ,382 ,334 ,366 ,800 1,000 ,846 ,641 ,437 ,569 ,485
Parlament ,217 ,495 ,412 ,304 ,402 ,683 ,846 1,000 ,659 ,401 ,568 ,493
Justiþie ,220 ,467 ,450 ,298 ,402 ,558 ,641 ,659 1,000 ,454 ,712 ,508
Armatã ,325 ,377 ,334 ,426 ,332 ,457 ,437 ,401 ,454 1,000 ,561 ,491
Poliþie ,280 ,512 ,463 ,362 ,404 ,518 ,569 ,568 ,712 ,561 1,000 ,612
Primãria localitãþii ,243 ,532 ,426 ,385 ,381 ,474 ,485 ,493 ,508 ,491 ,612 1,000
Sig. Câtã încredere
(1-tailed) aveþi dvs. ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
în_Bisericã
Sindicate ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Bãnci ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Mass media (TV,
,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
radio, presã)
Organizaþii
,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
neguvernamentale
Preºedinþie ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Guvern ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Parlament ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Justiþie ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Armatã ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Poliþie ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Primãria localitãþii ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000 ,000
Observăm că încrederea în Biserică prezintă corelaţii modeste (sub 0.30) pentru 10 din
cele 11 variabile, aşadar îl putem excludem din scală.
Efectuăm testul de validitate internă pentru construcţia unei scale aditive a
încrederii în instituţii: calculăm Cronbach’s Alpha:
• R E L I A B I L I T Y A N A L Y S I S - S C A L E (A L P H A)
• N of
• Statistics for Mean Variance Std Dev Variables
• Scale 23,3647 64,4095 8,0256 11
Valoarea coeficientului Alpha este ridicată, aşadar putem considera că putem construi o scală ce
are validitate internă.
DAR:
X1 U1 d1
b11
F1
X2 U2
b21 d2
Analiza factorială înseamnă că noi încercăm să realizăm o regresie a
variabilei obsevate (variabila dependentă) asupra unui factor latent (variabila
independentă, explicativă) pe care nu o putem însă măsura direct şi astfel
trebuie să o construim, să o “extragem” din datele pe care le avem.
X1= b11 * F1 + d1 * U1 În afară de factorul comun (F1), variabilele
X2= b21 * F1 + d2 * U2 noastre sunt explicate şi de nişte determinanţi
unici (U1 and U2), independenţi şi necorelaţi
cu factorii.
Prima A doua Deci: r(U1, U2)=0
cifră cifră
indică indică r(U1, F1)=0, r(U2, F1)=0
variabila factorul
Demonstraţii:
1. Cum poate fi exprimată varianţa variabilei X1 (încrederea în guvern)?
X1= b11 * F1 + d1 * U1 b11 se numeşte saturaţia lui F1 pentru X1 (factor loading
sau pattern loading) şi este interpretat ca un coeficient de regresie standardizat
BETA
X1, F1, U1 sunt standardizate, deci au media=0 iar varianţa=1
VAR (x1) = Σ [x1i – media(x1)]2/n VAR (X1) = b211 * VAR(F1) + d21* VAR(U1)
VAR (X1) = b211 + d21
X1= b11 * F1 + d1 * U1
X2= b21 * F1 + d2 * U2
r(X1, X2)=Σ[(x1i-media(x1)][x2i-media(x2)]/n
COV (X1,X2)
r(X1 X2) = I. Doi factori independenţi:
X X1 2
F1 X1 U1
X2 U2
r(X1 X2) =
Σ(X1i –media(X1))*(X2i-media(X2)) X3 U3
F2 X4 U4
X X
1 2
X5 U5
X1 şi X2 sunt standardizate, deci: media (X1) = media (X2)=0, iar X1 =X2=1.
În general: r(X1 X2) = b11 * b21 + b12 * b22 + b11 * b22 * rF1F2 + b21 * b12 * rF1F2
F2
Efect direct al lui F2 Efect indirect,
mediat de F1
X3 U3
F1, F2, … Fn sunt factorii comuni care determină fiecare dintre variabilele X1, X2, … Xm, iar U1,
U2, … Um sunt factorii lor de unicitate.
Analiza factorială urmăreşte reducerea variabilelor observate la un număr mai redus de factori
latenţi, aşadar n < m.
Factorii de unicitate U1, U2, … Um sunt independenţi de factorii comuni F1, F2,… Fn şi sunt
independenţi (ne-corelaţi) între ei.
Întreaga varianţă comună a variabilelor X1, X2,… Xm este datorată factorilor comuni F1, F2, … Fn.
Coeficienţii bi1, bi2,… bin se numesc saturaţii ale factorilor (pattern loadings sau factor loadings)
F1, F2, … Fn pentru fiecare variabilă i (i < = n).
Având în vedere că modelul factorial se bazează pe ecuaţii multilineare, coeficienţii b pot fi
interpretaţi drept coeficienţi de regresie multiplă standardizaţi.