Documente Academic
Documente Profesional
Documente Cultură
Lecturi:
Culic. I. (2004): Cap. 4., pp. 79-128.
Rotariu, T. et. al. (1999): Cap. 14, pp. 304-333.
Tabachnick and Fidell (2006): Cap 13, pp. 607-675
Un posibil model al procesului cunoaşterii:
Conceptul
Realitatea
(un model
percepută
al realităţii)
Măsurarea
empirică a
indicatorilor
(variabilelor)
RV. Cât de importante sunt fiecare din următoarele pentru ca o persoană din
România de azi să reuşească în viaţă?
1
Să se nască într-o 1 2 3 4 5 8 9
familie bogată
2 Să aibă relaţii 1 2 3 4 5 8 9
3
Să aibă noroc / 1 2 3 4 5 8 9
şansă
Să creadă în
4 1 2 3 4 5 8 9
Dumnezeu
Să fie deşteaptă /
5 1 2 3 4 5 8 9
inteligentă
6 Să arate bine 1 2 3 4 5 8 9
7 Să facă şcoală 1 2 3 4 5 8 9
8 Să muncească mult 1 2 3 4 5 8 9
9 Să fure 1 2 3 4 5 8 9
Să ştie să se
10 1 2 3 4 5 8 9
descurce
Analiza validităţii interne –
consistenţei interne a scalei
• Am dori să înţelegem care cred oamenii ca sunt determinanţii reuşitei în
viaţă. Am operaţionalizat conceptul printr-un set de item pe care dorim să îi
sintetizăm într-o scală aditivă (indice aditiv).
• În afară de validitatea şi fidelitatea indicatorilor utilizaţi, trebuie să testăm şi
validitatea internă a setului de itemi.
• Dacă setul nostru de indicatori are validitate internă, atunci varianţele lor
sunt explicate în mare măsură de covarianţele lor cu factorul latent. Acest
lucru presupune că ele covariază puternic. Dar fiecare variabilă are şi o parte
de varianţă unică, care nu se datorează factorului latent.
• Atunci când construim indicele aditiv, noi includem nu doar covarianţele cu
factorul latent (scorurile adevărate) ci şi varianţele unice (erorile).
De exemplu, este foarte probabil că variabila “să ştie să se descurce” indică
nu doar abilităţile pe care le are o persoană (scor adevărat), dar şi evaluarea
contextului mai general în care poate să acţioneze, factori ce nu ţin de
conceptul pe care-l măsurăm (erori de măsurare).
VAR (xi) = σ2X = COV (xi, factor) + Error Ui
i
sau: σXi = Cor (xi, factor) + Error Ui
Validitatea internă: Chronbach’s alpha
Coeficientul Spearman-Brown:
rsb = 2rxy /(1+rxy)
Descriptive Statistics
Reusita
Valid 1781
Missing 0
Mean 20.887
Std. Deviation 4.786
Minimum 10.000
Maximum 39.000
Pears
—
on's r
rv1
p- —
value
Pears 0.685 —
on's r
rv2
p-
value < .001 —
Pears
0.556 0.630 —
on's r
rv3
p-
< .001 < .001 —
value
Pears
0.384 0.416 0.525 —
on's r
rv4
p-
< .001 < .001 < .001 —
value
Pears
0.501 0.580 0.633 0.530 —
on's r
rv5
p-
< .001 < .001 < .001 < .001 —
value
Pears 0.486 0.504 0.482 0.392 0.547 —
on's r
rv6
p-
value < .001 < .001 < .001 < .001 < .001 —
Pears 0.409 0.479 0.535 0.508 0.692 0.523 —
on's r
rv7
p-
< .001 < .001 < .001 < .001 < .001 < .001 —
value
Pears 0.417 0.431 0.526 0.504 0.643 0.458 0.711 —
on's r
rv8
p-
< .001 < .001 < .001 < .001 < .001 < .001 < .001 —
value
Pears
on's r 0.308 0.330 0.269 0.193 0.264 0.299 0.226 0.213 —
rv9
p-
< .001 < .001 < .001 < .001 < .001 < .001 < .001 < .001 —
value
Pears
0.469 0.553 0.525 0.436 0.607 0.472 0.549 0.501 0.365 —
on's r
rv10
p- < .001 < .001 < .001 < .001 < .001 < .001 < .001 < .001 < .001 —
value
Reliability analysis: Chronbach’s alpha
X1 U1 d1
b11
F1
X2 U2
b21 d2
Analiza factorială înseamnă că noi încercăm să realizăm o regresie a
variabilei obsevate (variabila dependentă) asupra unui factor latent (variabila
independentă, explicativă) pe care nu o putem însă măsura direct şi astfel
trebuie să o construim, să o “extragem” din datele pe care le avem.
X1= b11 * F1 + d1 * U1 În afară de factorul comun (F1), variabilele
X2= b21 * F1 + d2 * U2 noastre sunt explicate şi de nişte determinanţi
unici (U1 and U2), independenţi şi necorelaţi
cu factorii.
Prima A doua Deci: r(U1, U2)=0
cifră cifră
indică indică r(U1, F1)=0, r(U2, F1)=0
variabila factorul
Discuţie I:
Cum poate fi exprimată varianţa variabilei X1 (să se nască într-o familie bogată)?
X1= b11 * F1 + d1 * U1 b11 se numeşte saturaţia lui F1 pentru X1 (factor loading
sau pattern loading) şi este interpretat ca un coeficient de regresie standardizat
BETA
X1, F1, U1 sunt standardizate, deci au media=0 iar varianţa=1
VAR (x1) = Σ [x1i – media(x1)]2/n VAR (X1) = b211 * VAR(F1) + d21* VAR(U1)
VAR (X1) = b211 + d21
X1= b11 * F1 + d1 * U1
X2= b21 * F1 + d2 * U2
r(X1, X2)=Σ[(x1i-media(x1)][x2i-media(x2)]/n
COV (X1,X2)
r(X1 X2) = I. Doi factori independenţi:
X X1 2
F1 X1 U1
X2 U2
r(X1 X2) =
Σ(X1i –media(X1))*(X2i-media(X2)) X3 U3
F2 X4 U4
X X
1 2
X5 U5
X1 şi X2 sunt standardizate, deci: media (X1) = media (X2)=0, iar X1 =X2=1.
În general: r(X1 X2) = b11 * b21 + b12 * b22 + b11 * b22 * rF1F2 + b21 * b12 * rF1F2
F2
Efect direct al lui F2 Efect indirect,
mediat de F1
X3 U3
F1, F2, … Fn sunt factorii comuni care determină fiecare dintre variabilele X1, X2, … Xm, iar U1,
U2, … Um sunt factorii lor de unicitate.
Analiza factorială urmăreşte reducerea variabilelor observate la un număr mai redus de factori
latenţi, aşadar n < m.
Factorii de unicitate U1, U2, … Um sunt independenţi de factorii comuni F1, F2,… Fn şi sunt
independenţi (ne-corelaţi) între ei.
Întreaga varianţă comună a variabilelor X1, X2,… Xm este datorată factorilor comuni F1, F2, … Fn.
Coeficienţii bi1, bi2,… bin se numesc saturaţii ale factorilor (pattern loadings sau factor loadings)
F1, F2, … Fn pentru fiecare variabilă i (i < = n).
Având în vedere că modelul factorial se bazează pe ecuaţii multiple, coeficienţii b pot fi
interpretaţi drept coeficienţi de regresie multilpla.
Extracţia factorilor: soluţia initială (Parallel analysis)
Factor Loadings
Factor 1 Factor 2 Factor 3 Uniqueness
rv1 . 0.751 . 0.448
rv10 . . . 0.858
rv2 . 0.660 . 0.474
rv3 . . 0.751 0.448
rv4 . . 0.388 0.783
rv5 0.575 . . 0.580
rv6 . 0.348 . 0.800
rv7 0.890 . . 0.355
rv8 0.672 . . 0.586
rv9 . 0.381 . 0.859
Parallel analysis ia datele si le amesteca apoi apoi compara eigenvalues ale datelor
amestecate random cu cele ale datelor noastre şi le compară şi ne spune câţi factori
sunt mai mari decât şansa/întâmplarea. Aşadar, câţi factori extraşi sunt mai buni
decât într-un set de date amestecat aleatoriu.
Extracţia factorilor:
Chi-squared Test
Value df p
Model 83.735 18 < .001
1.1 Metoda celor mai mici pătrate (the least squares method)
1.2 Metoda probabilităţii maxime (the maximum likelyhood method)
1.3 Metoda de extragere factorială Alpha (Alpha factoring)
1.4 Analiza imaginii (Image factoring)
1.5 Metoda factorilor principali (principal axis factoring)
0.035 -
Model 0.044 0.950 -51.795
0.054
F1
b11 X1
b21 X2
F2
b11 b22
F1
b11 X1
b21 X2
F2
b11 b22
rX1 X2 = b11 * b21 + b12 * b22 + b11 * b22 * rF1F2 + b21 * b12 * rF1F2
Saturaţiile factorilor (b11, b21 – pentru F1, b12, b22 – pentru F2 etc.) vor fi egale cu coeficienţii de
corelaţie parţiali, obţinuţi prin controlarea efectelor celorlalţi factori.
Saturaţiile pot fi interpretate ca şi coefienţi de regresie multineară standardizaţi (beta).
rX1 X2 = b11 * b21 + b12 * b22 + b11 * b22 * rF1F2 + b21 * b12 * rF1F2
Dacă factorii sunt corelaţi, atunci acestea au atât efecte directe asupra variabilelor
(prezentate în matricea saturaţiilor Pattern Matrix sau Pattern Loadings) cât şi efecte
indirecte.
Solutie cu doi factori?
Factor Loadings
Factor 1 Factor 2 Uniqueness
rv1 . 0.725 0.484
rv2 . 0.743 0.448
rv3 . 0.455 0.714
rv4 0.352 . 0.840
rv5 0.639 . 0.574
rv6 . 0.331 0.809
rv7 0.789 . 0.414
rv8 0.658 . 0.590
rv9 . 0.355 0.868
Factor 1 Factor 2
rv5 0.616 .
Index efort personal =
rv7 0.780 . rv7*score_F1 + rv8*score_F1 +
rv5*score_F1
rv8 0.664 .
Celelalte variabile nu au o apartenenţă clară la nici unul dintre cei doi indecşi.