Documente Academic
Documente Profesional
Documente Cultură
a Pearson
Asist. drd. Adrian Gorbanescu
2 Ianuarie 2015
Introducere
xy
N
Cel mai mare dezavantaj al coeficientului de covariant, a este reprezentat de
faptul ca variabilele analizate trebuie sa aiba aceeas, i unitate de masura. Daca
variabilele au unitat, i de masura diferite produsul valorilor nu mai are sens. De
exemplu, nu putem calcula coeficientul de covariat, ie dintre anxietate s, i preferint, a
pentru risc. Pentru ca produsul dintre doua variabile cu unitat, i de masura diferite
sa aiba sens trebuie sa transformam valorile n scoruri standardizate. Astfel, vom
ajunge la coeficientul de corelat, ie liniara, notat cu r. Acesta este cunoscut s, i
sub numele de coeficient de corelat, ie Pearson.
covxy =
As, a cum am ment, ionat n unul din paragrafele de mai sus, n cazul corelat, iei
pozitive valorile mari ale unei variabile se asociaza cu valori mari ale celeilalte
variabile. Atunci cand valorile variabilei x sunt egale cu valorile variabilei y ne
aflam ntr-o situat, ie particulara, iar valoarea coeficientului de corelat, ie este r =
+1. In aceasta situat, ie, punctele celor doua variabile se plaseaza pe o linie dreapta,
nclinata la un unghi de 45 de grade. Dupa cum se poate observa, reprezentarea
grafica scatterplot are forma unui nor de puncte. Cu cat coeficientul de corelat, ie
este mai mare, cu atat acest nor de puncte este mai restrans. In plus, n cazul
corelat, iei pozitive graficul ncepe n partea stanga jos s, i se finalizeaza n partea
dreapta sus.
Grafic 4 - Corelat, ia negativa perfecta r = 1
Atunci cand valorile mari ale unei variabile sunt asociate cu scoruri mici ale
celeilalte variabile ntre ele exista o corelat, ie negativa. In acest caz, norul de puncte
ncepe n partea stanga sus s, i se ncheie n partea dreapta jos.
3
In situat, ia n care corelat, ia dintre cele doua variabile tinde spre 0, norul de
puncte are o forma circulara s, i nu se poate observa nici o tendint, a de grupare a
punctelor.
Grafic 7 - Corelat, ie liniara r = 0
In toate cele patru situat, ii de mai sus avem urmatorii indicatori statistici ai
variabilelor:
Media X = 9
Dispersia X = 11
4
Media Y = 7,50
Dispersia Y = 4,12
Prin acest exemplu, Anscombe a dorit sa evident, ieze important, a analizei grafice
a datelor s, i efectul valorilor extreme. In al treilea grafic se poate observa cum o valoare extrema reduce valoarea coeficientului de corelat, ie, iar n al patrulea exemplu
se poate observa cum o corelat, ie egala cu 0 este crescuta la 0,81 prin intermediul
unei astfel de valori.
Pot exista situat, ii n care, des, i se poate observa o tendint, a de asociere a
perechilor de valori, corelat, ia dintre acestea este inexistenta. Un astfel de caz
este reprezentat de funct, iile sinus s, i cosinus. Pe masura ce marimea unghiului
cres, te s, i se apropie de 90 de grade valoarea lui sinus pornes, te de la 0 s, i crets, te
pana la 1. Apoi, pe masura ce unghiul depas, es, te 90 de grade s, i se apropie de
180 de grade valoarea lui sinus descres, te pana la 0. Intre variabilele analizate n
graficul de mai jos avem un coeficient de corelat, ie r = 0, des, i exista tendint, a de
asociere a perechilor de valori.
Grafic 9 - Graficul scatterplot pentru un set de valori simetrice
odata cu cresterea scorurilor celeilalte variabile. Semnul indica o crelatie negativa anume ca, n timp ce scorurile unei variable descresc, scorurile celeilalte
varibile cresc.
Un cercetator este interesat sa studieze respectul normelor s, i asocierea acestora
cu nivelul de flexibilitate.
Pentru a realiza acest lucru cercetatorul a masurat cele doua constructe cu
ajutorul unor intstumente raportandu-le la o scala de interval/raport. In cadrul
analizei de corelat, ie nu avem variabile independente sau dependente, deoarece
rezultatul obt, inut va pune n evident, a dependent, a reciproca a celor doua variabile.
In sect, iunile anterioare am aratat cum valorile extreme pot afecta coeficientul
de corelat, ie. Din acest motiv, ne vom asigura ca variabilele analizate nu au valori
extreme. De asemenea, vom verifica s, i ndeplinirea condit, iei de normalitate.
In SPSS vom crea doua variabile masurate pe scala de interval/raport precum
n imaginea de mai jos:
Grafic 10 - Aranjarea bazei de date n SPSS
2. Se act, ioneaza butonul Paste marcat prin sageata. Ca urmare a act, ionarii
acestui buton se va deschide fereastra Syntax unde se vor respecta urmatorii
pas, i:
Pe linia /VARIABLES = flexibiliate responsabilitate norme se introduce
cuvantul WITH ntre responsabilitate s, i norme, astfel ncat sa existe spat, i
ntre cuvinte.
Cu ajutorul mouse-lui vom selecta ntreaga procedura s, i vom act, iona butonul
Run din baza de comenzi a ferestrei (indicat prin sageata).
Ca urmare a realizarii acestei operat, ii, n output vom obt, ine urmatorul tabel:
4.1
Graficul Scatterplot
In caseta Simple Scatterplot vom transfera cele doua variabile n zona X Axis,
respectiv Y Axis. Deoarece corelat, ia ne indica variat, ia reciproca dintre cele
doua variabile, nu are important, a modul n care vom repartiza variabilele pe
9
Graficul obt, inut ne arata prezent, a unei asocieri negative ntre flexibilitate
s, i respectarea normelor. Graficul Scatterplot ne ofera informat, ii cu privire la
natura relat, iei dintre variabile s, i este recomandata utilizarea acestuia alaturi de
prezentarea coeficentului de corelat, ie.
M
arimea efectului pentru coeficientul de corelat, ie
10
Exemplu de calcul
Pe baza problemei enunt, ate mai sus vom explica procedura de calcul a analizei de
corelat, ie liniare Pearson. In tabelul de mai jos sunt prezentate scorurile pentru
cele doua variabile analizate. Cu X vom marca variabila flexibilitate, iar cu Y vom
nota variabila respectarea normelor.
X Y X mx (X mx )2 Y my (Y my )2 (X mx ) (Y my )
45 56
-6,08
36,97
4,50
20,25
-27,36
40 59
-11,08
122,77
7,50
56,25
-83,10
50 51
-1,08
1,17
-0,50
0,25
0,54
44 60
-7,08
50,13
8,50
72,25
-60,81
48 48
-3,08
9,49
-3,50
12,25
10,78
53 53
1,92
3,69
1,50
2,25
2,88
58 45
6,92
47,89
-6,50
42,25
-44,98
60 46
8,92
79,57
-5,50
30,25
-49,06
55 48
3,92
15,37
-3,50
12,25
-13,72
60 52
8,92
79,57
0,50
0,25
4,46
48 50
-3,08
9,49
-1,50
2,25
4,62
52 50
0,92
0,85
-1,50
2,25
-1,38
1.
2.
3.
4.
11
(X mx )2 = 456, 96.
(Y my )2 = 253.
rP
r
(X mx )2
456, 96
sx =
sx = 6, 44
sx =
N 1
11
rP
r
253
(Y my )2
sy =
sy =
sx = 4, 79
N 1
11
X
(X mx ) (Y my ) = 256, 50
(1)
(2)
Ca urmare, r devine:
r=
256, 50
256, 50
r=
r = 0, 69.
12 6, 44 4, 79
370, 17
Valoarea calculata este put, in mai mica decat cea obt, inuta n SPSS ca urmare a
aproximarilor utilizate.
Respectarea normelor (Y )
55
50
45
40
45
50
55
Flexibilitate (X)
12
60
Coeficientul de corelat, ie obt, inut (r = 0,69) este mare, iar coeficientul de determinare (r2 = 0.47) ne indica faptul ca 47din variabilitatea respectarii normelor
este explicata de flexibilitate.
V
a doresc spor la nv
at, at s, i s
a obt, inet, i note c
at mai mari la part, ialul
de s
apt
am
ana viitoare.
13