Documente Academic
Documente Profesional
Documente Cultură
Corelatia Statistica PDF
Corelatia Statistica PDF
Capitolul 5
CORELAIA STATISTIC
P
n la acest capitol au fost tratate proceduri i statistici univariate ca
aspecte referitoare la distribuia de frecvene a unei variabile,
tendina central i variabilitatea. n acest capitol vom prezenta
elemente de lume bivariat, n care interesul va fi focalizat pe examinarea
simultan a dou variabile.
Se gsesc performanele pe care le nregistreaz studenii la examenul de
licen ntr-un anumit raport cu rezultatele obinute la examenul de admitere n
facultate? Ce relaie exist ntre cheltuielile pe copil i realizrile academice
ale acestuia? Aceste ntrebri i multe altele care se pot pune n aceeai
manier au n vedere modul n care valorile unei variabile X merg cu valorile
celeilalte variabile Y. Se asociaz valori sczute ale statusului socioeconomic
cu valori sczute ale coeficienilor IQ i invers, valori ridicate ale statusului
socioeconomic cu valori ridicate ale coeficienilor IQ?
Cu alte cuvinte, sunt variabilele acestui exemplu variate sau covariate?
La ntrebrile expuse nu se poate rspunde folosind informaii univariate, sau
altfel exprimat, nu se poate spune ceva legat de asocierea dintre dou variabile
doar prin simpla examinare a dou distribuii de frecvene, a dou medii sau
variane. Pentru acest scop trebuie folosite metodele bivariate.
Coeficientul de corelaie este o statistic bivariat care msoar gradul de
asociere liniar dintre dou variabile cantitative i se bucur de o mare
popularitate n tiinele comportamentale. n cadrul acestui capitol vom acorda
o atenie special unei msuri particulare de asociere. Este vorba de
coeficientul de corelaie Pearson.
42
Statistic i aplicaii n tiinele sociale
43
Statistic i aplicaii n tiinele sociale
120
100
Abilitate matematic (Y)
80
60
40
20
0
0 20 40 60 80 100 120
5.2.1 Asocierea
44
Statistic i aplicaii n tiinele sociale
5.2.2 Direcia
5.2.3 Nonliniaritatea
45
Statistic i aplicaii n tiinele sociale
5.3 Covariana
Cov
X X Y Y ,
n
unde n este numrul perechilor de observaii.
Paii necesari calculrii covarianei sunt:
Pasul 1: Evaluarea mediilor X i Y ;
Pasul 2: Evaluarea abaterilor X X , respectiv Y Y ;
Pasul 3: Evaluarea sumei X X Y Y ;
Pasul 4: mprirea sumei obinute la numrul perechilor de observaii.
Exemplu:
Scorurile nregistrate de ctre un grup de patru persoane la testul de
evaluare a ateniei distributive (X) i la testul de atenie concentrat (Y),
precum i calculul covarianei scorurilor sunt prezentate n tabelul de mai jos:
Subiect X Y X X Y Y X X Y Y
1 4 5 2 1,5 3
2 5 7 1 0,5 0,5
3 7 9 1 2,5 2,5
4 8 5 2 1,5 3
n=4 X 6 Y 6 ,5 X X Y Y 2
2
Cov 0 ,5
4
46
Statistic i aplicaii n tiinele sociale
80
63,2
60
40
20
III(+) IV(-)
0
0 20 40 60 80 100 120
47
Statistic i aplicaii n tiinele sociale
Raionamentul Abilitate
Studentul spaial matematic X X
Y Y X X Y Y
(scoruri) (scoruri)
1 20 30 35,8 33,2 1.188,56
2 24 29 31,8 34,2 1.087,56
3 50 58 5,8 5,2 30,16
4 80 84 24,2 20,8 503,36
5 70 79 14,2 15,8 224,36
6 55 62 0,8 1,2 0,96
7 46 50 9,8 13,2 129,36
8 23 48 32,8 15,2 498,56
9 98 98 42,2 34,8 1.468,56
10 92 94 36,2 30,8 1.114,96
Total 6.246,4
6246 , 4
Cov 624 , 64
10
Subiect X Y X X Y Y X X Y Y
1 22 30 10 10 100
2 18 26 6 6 36
3 14 22 2 2 4
4 10 18 2 2 4
5 6 14 6 6 36
6 2 10 10 10 100
X 12 Y 20 X X Y Y 280
sX 6,831 sY 6,831 280
C ov 46, 6
6
48
Statistic i aplicaii n tiinele sociale
Subiect X Y X X Y Y X X Y Y
1 22 10 10 10 100
2 18 14 6 6 36
3 14 18 2 2 4
4 10 22 2 2 4
5 6 26 6 6 36
6 2 30 10 10 100
X 12 Y 20 X X Y Y 280
sX 6,831 sY 6,831 280
Cov 46, 6
6
Subiect X Y X X Y Y X X Y Y
1 22 30 10 10 100
2 22 10 10 10 100
3 12 20 0 0 0
4 12 20 0 0 0
5 2 30 10 10 100
6 2 10 10 10 100
X 12 Y 20 X X Y Y 0
sX 8,165 sY 8,165 Cov 0
49
Statistic i aplicaii n tiinele sociale
(= 624,64)? Este mare? Este mic? Mai mult, covarianele nu sunt uor de
comparat. Chiar dac mrimea covarianei de 624,64 este mai mare dect
46,(6), nu putem trage concluzia c n primul caz asocierea este mai puternic
dect n al doilea caz.
r
X X Y Y Cov
ns X sY s X sY
Pentru distribuiile bivariate A i B valorile coeficienilor de corelaie sunt:
46 , ( 6 )
rA 1
6,831 6,831
46 , ( 6 )
rB 1
6,831 6,831
50
Statistic i aplicaii n tiinele sociale
XY
XY n
r
X 2
Y 2
X Y
2 2
n n
Formula de calcul de mai sus elimin necesitatea evalurii diferenelor
X X , respectiv Y Y . Pentru distribuia bivariat A, calculul
coeficientului Pearson, folosind ultima relaie de calcul, presupune dispunerea
operaiilor n maniera indicat de tabelul de mai jos.
51
Statistic i aplicaii n tiinele sociale
X Y 72120
XY n
1720
6
r 1
X 2
Y
1144 2680
2
722
1202
X Y2
2
6 6
n n
52
Statistic i aplicaii n tiinele sociale
53
Statistic i aplicaii n tiinele sociale
54
Statistic i aplicaii n tiinele sociale
Probleme propuse:
55
Statistic i aplicaii n tiinele sociale
56
Statistic i aplicaii n tiinele sociale
57
Statistic i aplicaii n tiinele sociale
X Y
89 199
89 199
87 197
86 196
85 195
83 193
83 193
82 192
80 190
79 189
77 187
a) Ce direcie de asociere sugereaz norul de puncte?
b) Exist abateri de la liniaritate?
c) Estimai dac este posibil coeficientul r
d) Interpretai r contextul coeficientului de determinare
e) Utiliznd aceste date, mprii fiecare valoare X la 10, construii
norul de puncte i analizai relaia dintre X/10 i Y
f) Calculai coeficientul r ntre X/10 i Y. Comparai cu coeficientul
r calculat anterior
7. Cov(X, Y) = 55, SX = 8, SY = 11. Calculai r.
8. r = 0,36, SX = 8, SY = 7. Calculai Cov(X, Y).
9. Apreciai afirmaia: Un coeficient r mic nseamn o asociere redus
ntre dou variabile.
58