Sunteți pe pagina 1din 50

Corelaia i regresia

Subiecte n discuie
Noiunea de corelaie. Tipurile de corelaii
Calcularea i interpretarea coeficientului de
corelatie. Corelograma.
Noiunea de regresie. Tipuri. Calcularea i
interpretarea coeficientului de regresie.

CORELAIA
n majoritatea domeniilor de activitate exist
interdependene ntre fenomene.
Apariia i evoluia unui fenomen este n
strns legtur cu o serie de alte fenomene ce
l determin.
Corelaia este o metod care ne permite s
cunoatem fenomenele din natur i societate
sub raportul conexiunilor n care se gsesc.

n statistic, pentru studierea legturilor


multiple ce au loc ntre diferite fenomene, se
folosete noiunea de funcie f , care const n
faptul c fiecrei valori a variabilei
independente (X), numit argument, i
corespunde valoarea altei variabile numit
funcie (Y).

Tipuri de corelaii
corelaii funcionale sau matematice
corelaii statistice sau stohastice.

Corelaiile funcionale
sunt perfecte, rigide, exprimnd legtura de la
cauz la efect ntre fenomene.
ele sunt studiate n cadrul tiinelor exacte, unde
legtura de la cauz la efect se exprim sub
form de lege.
n cazul lor unei valori determinate a unei
variabile independente X (argument) i
corespunde strict o valoare
a variabilei
dependente Y (funcie).

Corelaiile statistice
sunt mai puin perfecte
se evideniaz mai greu
n cazul lor, fiecrei valori numerice a
variabilei X corespund nu una ci mai multe
valori a variabilei Y, adic o totalitate
statistic a acestei valori, care se grupeaz
n jurul mediei Yx.

Legtura de corelaie

dup form poate fi:


1. linear (rectilinie)
2. nelinear (curbilinie)

dup sens:
1. direct (pozitiv)
2. invers (negativ).

n corelaiile lineare

schimbrilor uniforme a valorilor medii a


unei variabile le corespund schimbri egale
a altei variabile.

n corelaia nelinear
schimbrilor uniforme a unei valori i
corespund valori medii a altei variabile,
care poart caracter de cretere ori de
micorare.

Aprecierea legturilor de corelaie lineare se


realizeaz cu ajutorul coeficientului de
corelaie rxy,
iar a celor nelineare cu raportul de
corelaie (eta).

Corelaiile directe
se stabilesc ntre fenomene care evolueaz
n acelai sens. Crete unul, crete i cel cu
care are legtur de dependen; sau scade
un fenomen, scade i cel cu care coreleaz.
Exemplu: majorarea nlimii copiilor
determin mrirea greutii lor.

Corelaiile inverse
se stabilesc ntre fenomene care evolueaz n sens
opus. Crete un fenomen i scade cel cu care are o
legtur de dependen; sau scade un fenomen i
crete cel cu care se coreleaz.
Exemplu: cu ct e mai mare vrsta copiilor, cu
att e mai mic mortalitatea lor.

Corelaiile statistice directe


presupun evoluia n acelai sens a
fenomenelor ce se coreleaz, dar nu cu
aceeai unitate de msur.
Exemplu: crete nivelul de trai al populaiei
unei colectiviti de dou ori, crete i
rezistena organismului la mbolnviri dar
nu n aceeai msur

Corelaiile statisitice inverse


presupun creterea unui fenomen i scderea celui
cu care se coreleaz, dar nu n aceeai msur.
Spre exemplu, dac ntr-o colectivitate am efectuat
un numr dublu de vaccinri, numrul copiilor ce
vor contracta boala, n anul urmtor, va fi cu
siguran mai sczut, dar nu va fi de dou ori mai
mic dect n anul premergtor.

Corelaiile statistice, spre deosebire de


cele funcionale, pot fi numai
vremelnice i ntr-un singur sens.

Legtura de dependen dintre dou


sau mai multe fenomene, sensul i
intensitatea acesteia, se stabilesc cu
ajutorul coeficientului de corelaie
linear (simpl sau multipl) al lui
Bravais-Pearson.

Pentru seriile statistice simple


Formula de calcul:
dxdy
rxy =
dx2dy2
n care:

rxy = coeficientul de corelaie;


dxdy = suma produselor dintre abaterile de la
media aritmetic a valorilor frecvenelor celor
dou fenomene (x i y) ce se coreleaz;
dx2 = suma ptratelor abaterilor de la media
aritmetic a valorilor frecvenelor fenomenului x;
dy2 = suma ptratelor abaterilor de la media
aritmetic a valorilor frecvenelor fenomenului y.

Exemple:
1. Timpul trecut din momentul accesului de pancreatit
acut (x) i numrul complicaiilor postoperatorii (y)
Nr.
1
2
3
4
5
6
Total

Timpul
Numr
x
complicaii
y
3
6
5
8
7
12
10
19
13
20
16
24
54
89
9
14,8

dX

dY

-6
-4
-2
1
4
7

-8,8
-6,8
-2,8
4,2
5,2
9,2

d2X

d2Y

36
77,4
16
46,2
4
7,8
1
17,6
16
27
49
84,6
122
260,6
178,3

dXdY
52,8
27,2
5,6
4,2
20,8
64,4
175
RXY =0,98

2. Nivelul de asigurare cu medici stomatologi (x) i


ponderea copiilor sanai n cadrul a 5 raioane (y)
Nr.
1
2
3
4
5
Total

Asigurare
medici
x
2,3
3,2
3,4
3,6
3,9
16,4
3,3

Copii
sanai
y
65,7
91,7
88,0
91,4
90,3
427,1
85,4

dX

dY

-1
-0,1
0,2
0,3
0,6

-19,7
6,3
2,6
6,0
4,9

d2X

d2Y

1
388,1
0,01
39,7
0,04
6,8
0,09
36
0,36
24,0
1,5
494,6
27,2

dXdY
19,7
-0,63
0,52
1,8
2,94
24,3
rXY=0,89

pentru seriile statistice grupate


Formula de calcul:
dxdyfxy
rxy =
(dx2fx)(dy2fy)
n care:

rxy = coeficientul de corelaie;


dxdyfxy = produsul dintre abaterile de la media
ponderat a variantelor celor dou fenomene ce
se
coreleaz
i
frecvenele
perechi
corespunztoare variantelor fenomenelor x i y;
dx2fx = produsul dintre ptratele abaterilor de la
media ponderat a valorilor variantelor
fenomenului x i numrul de frecvene
corespunztoare fiecrei variante;
dy2fy = produsul dintre ptratele abaterilor de la
media ponderat a valorilor variantelor

Coeficientul de corelaie
poate fi cuprins ntre:
minus unu
zero
plus unu.

Interpretarea coeficientului de corelaie


Cnd valoarea coeficientului de corelaie se apropie de
+1, nseamn c ntre cele dou fenomene ce se
coreleaz exist o legtur foarte puternic.
Semnul + al coeficientului de corelaie denot c
legtura de dependen dintre fenomene este direct.
Deci ambele fenomene evolueaz n acelai sens, n
aceeai direcie.
Cnd valoarea coeficientului de corelaie se apropie de
1, nseamn c ntre cele dou fenomene exist o
legtur foarte puternic, dar invers, n sens opus:
crete un fenomen, scade cel cu care se coreleaz.

Interpretarea coeficientului
de corelaie
Pentru interpretarea intensitii legturii de
dependen dintre fenomene, Guilford indic
urmtoarele CRITERII:
valoarea coeficientului de corelaie cuprins
ntre 1 denot o corelaie foarte puternic ntre
fenomene;
valoarea coeficientului de corelaie cuprins
ntre 0,99 i 0,70 denot o corelaie puternic;

Interpretarea coeficientului de
corelaie
valoarea coeficientului de corelaie cuprins ntre
0,69 i 0,30 denot o corelaie medie ntre fenomene;
valoarea coeficientului de corelaie cuprins ntre 0,0
i 0,29 exprim existena unei corelaii slabe ntre
fenomene;
valoarea coeficientului de corelaie 0 denot c
legtura dintre fenomene n mod practic o considerm
inexistent. Cele dou fenomene evolueaz deci
independent unul de altul.

Coeficientul de corelaie ntre fenomene poate fi


corect interpretat dac se ine seama de
urmtoarele ASPECTE:

ntre fenomenele ce se coreleaz s existe, n


mod
logic, o legtur;
cele dou fenomene s fie cercetate pe eantioane
omogene;

alegerea
sau
selecionarea
frecvenei
eantioanelor
s se fac la ntmplare.

Pentru a ne
coeficientului de
legturii dintre
eantioane,
ne
coeficientului de
cu mr.

convinge de fidelitatea
corelaie, n interpretarea
fenomene obinute pe
servim
de
eroarea
corelaie, care se noteaz

pentru n > 100:


1 r2xy
mr =
n
n care:
mr = eroarea coeficientului de corelaie;
r2xy = ptratul valorii coeficientului de corelaie,
obinut pe eantioane;
1 = valoarea absolut a coeficientului de corelaie,
obinut pe univers, pe ntreaga populaie;
n = numrul variantelor perechi ale fenomenelor

pentru n < 30, se utilizeaz

n-2

cnd 30 < n < 100 se utilizeaz

n-1

Dac valoarea coeficientului de corelaie


obinut pe eantioane este mai mare dect
triplul erorii sale, nseamn c acesta a fost
obinut pe eantioane reprezentative, este
deci real i ne putem bizui pe el n
interpretarea legturii de dependen ntre
fenomene.

Raportul dintre coeficientul de corelaie i


eroarea lui se numete criteriu de exactitate
al coeficientului de corelaie - t r. Criteriul
n cauz se stabilete cu ajutorul tabelului
valorilor criteriului t. Dac treal > ttabel,
coeficientul de corelaie se consider
semnificativ.

CORELOGRAMA
Existena sau inexistena unei corelaii
ntre fenomene se poate evidenia
aproximativ cu ajutorul reprezentrilor
grafice. n acest caz, folosim un grafic cu
dou scri, ordonat i abscis, pe care
nscriem valorile variantelor celor dou
fenomene x i y.

Se realizeaz astfel norul de puncte.


Dac norul de puncte se va dispune fuziform, oblic
de jos n sus i de la stnga la dreapta, ntre cele
dou fenomene exist o corelaie direct. Crete un
fenomen, crete i cel de al doilea, cu care se
coreleaz, sau ambele fenomene scad, evolund n
aceeai direcie.

Dac norul de puncte se dispune fuziform,


oblic de sus n jos i de la stnga la dreapta,
ntre cele dou fenomene exist o corelaie
invers.

Dac punctele se dispun pe toat reeaua grafic,


neavnd nici o tendin de a se grupa, nseamn c
ntre fenomene nu exist nici o legtur de
dependen, fenomenele evolund independent
unul fa de cellalt.
n cazul acesta, dreapta care trece prin mijlocul
punctelor este paralel fie cu ordonata, fie cu
abscisa.

CORELAIA MULTIPL
Se stabilete ntre mai mult de dou fenomene,
care au legtur de dependen ntre ele.
n asemenea situaii, existena legturii de
dependen ntre fenomene, sensul i intensitatea
acestei legturi, se stabilesc cu ajutorul
coeficientului de corelaie linear multipl.

FORMULA DE CALCUL

rxyz =

r2xy + r2xz 2(rxy) ryz rxz


1 r2xz

rxyz=coeficientul de corelaie linear multipl ntre cele trei


fenomene;
rxy=coeficientul de corelaie linear simpl ntre fenomenele
x i y;
ryz=coeficientul de corelaie linear simpl ntre fenomenele
y i z;
rxz=coeficientul de corelaie linear simpl ntre fenomenele
x i z;
Interpretarea intensitii corelaiei multiple ine seama de
aceleai criterii enunate la interpretarea coeficientului de
corelaie linear simpl.

CORELAIA RANGURILOR (SPEARMAN)


n cazul n care dorim s stabilim legtura de
dependen ntre fenomene cercetate pe eantioane
mici, utilizm coeficientul de corelaie al
rangurilor, propus de Spearman (1904).
Acest coeficient se noteaz cu litera greac (ro) i
se determin dup formula propus de Spearman:

6 d2
=1
n (n2 1)
n care:
1 = valoarea absolut a coeficientului de corelaie;
= coeficientul de corelaie Spearman;
6 = valoare constant;
d2 = suma ptratelor diferenelor dintre rangurile
primului ir de variante i rangurile celui de al
doilea ir de variante, cu care se coreleaz;
n = numrul variantelor perechi variantelor ce se

Coeficientul de corelaie al rangurilor poate


avea valori cuprinse ntre 1 -0- +1. El
exprim o legtur perfect cnd are
valoarea +1. n aceast situaie, rangurile
au valori egale, iar diferena ntre ranguri
este egal cu 0.

Exemple:
1. Timpul trecut din momentul accesului de pancreatit
acut (x) i numrul complicaiilor postoperatorii (y)
Nr.
1
2
3
4
5
6
Total

Timpul
Numr
Rangul Rangul
x
complicaii
x
y
y
3
6
1
1
5
8
2
2
7
12
3
3
10
19
4
4
13
20
5
5
16
24
6
6
54
89

d2

0
0
0
0
0
0

0
0
0
0
0
0
0
=1

2. Legtura de corelaie ntre copiii cu deficien mintal (la 100


mii
copiilor
100 mii
copii)
Nr. copii)
arai invaliditatea
Deficien Invaliditatea
Rangul(la
Rangul
d
d
2

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Total

Armenia
Tadjikistan
Azerbaidjan
Turkmenistan
Georgia
Krgzstan
Uzbekistan
Kazahstan
Bielarusi
Ucraina
Rusia
Moldova
Estonia
Lituania
Letonia

mintal
x
120
138
167
198
245
318
342
455
538
625
795
1018
1110
1021
1127

copiilor
y
33
27
38
30
43
28
30
29
36
48
38
44
47
57
33

1
2
3
4
5
6
7
8
9
10
11
12
14
13
15

6,5
1
9,5
4,5
11
2
4,5
3
8
14
9,5
12
13
15
6,5

-5,5
30,25
1
1
-6,5
42,25
-0,5
0,25
-6
36
4
16
2,5
6,25
5
25
1
1
-4
16
1,5
2,25
0
0
1
1
-2
4
8,5
72,25
=-24,5 =253,5
=+24,5
= 0,55

REGRESIA

Termenul de regresie a fost introdus de


F.Galton, care a observat c nlimea
descendenilor regreseaz ctre nlimea
prinilor.

Regresia
completeaz corelaia i prin intermediul
coeficientului de regresie, se stabilete cu ct
crete sau descrete sub aspect cantitativ, un
fenomen, cnd cel cu care se coreleaz
crete sau descrete cu o unitate de msur.

Regresia poate fi:


simpl i multipl
liniar i neliniar
direct, cnd fenomenele evolueaz n acelai sens
(crete x, crete y sau scade x scade i y)
indirect, cnd fenomenul evolueaz n sens opus
(crete x scade y sau scade x crete y)

Formula coeficientului de regresie este:


y
Rgyx = rxy
x
sau
x
Rgxy = rxy
y
n care:

Rgxy = coeficientul de regresie a lui x n funcie


de y. El exprim, cantitativ, cu ct crete sau
scade fenomenul x cnd y crete sau scade cu o
unitate de msur;
Rgyx = coeficientul de regresie a lui y n funcie
de x. El exprim, cantitativ, cu ct crete sau
scade fenomenul y cnd x crete sau scade cu o
unitate de msur;
rxy = coeficientul de corelaie liniar BravaisPearson;