Sunteți pe pagina 1din 50

Corelaia i regresia

Subiecte n discuie
Noiunea de corelaie. Tipurile de corelaii
Calcularea i interpretarea coeficientului de
corelatie. Corelograma.
Noiunea de regresie. Tipuri. Calcularea i
interpretarea coeficientului de regresie.
CORELAIA

n majoritatea domeniilor de activitate exist


interdependene ntre fenomene.
Apariia i evoluia unui fenomen este n
strns legtur cu o serie de alte fenomene ce
l determin.
Corelaia este o metod care ne permite s
cunoatem fenomenele din natur i societate
sub raportul conexiunilor n care se gsesc.
n statistic, pentru studierea legturilor
multiple ce au loc ntre diferite fenomene, se
folosete noiunea de funcie f , care const n
faptul c fiecrei valori a variabilei
independente (X), numit argument, i
corespunde valoarea altei variabile numit
funcie (Y).
Tipuri de corelaii

corelaii funcionale sau matematice


corelaii statistice sau stohastice.
Corelaiile funcionale
sunt perfecte, rigide, exprimnd legtura
de la cauz la efect ntre fenomene.
ele sunt studiate n cadrul tiinelor
exacte, unde legtura de la cauz la efect
se exprim sub form de lege.
n cazul lor unei valori determinate a
unei variabile independente X
(argument) i corespunde strict o valoare
a variabilei dependente Y (funcie).
Corelaiile statistice

sunt mai puin perfecte


se evideniaz mai greu
n cazul lor, fiecrei valori numerice a
variabilei X corespund nu una ci mai multe
valori a variabilei Y, adic o totalitate
statistic a acestei valori, care se grupeaz
n jurul mediei Yx.
Legtura de corelaie
dup form poate fi:
1. linear (rectilinie)
2. nelinear (curbilinie)

dup sens:
1. direct (pozitiv)
2. invers (negativ).
n corelaiile lineare

schimbrilor uniforme a valorilor medii a


unei variabile le corespund schimbri egale
a altei variabile.
n corelaia nelinear

schimbrilor uniforme a unei valori i


corespund valori medii a altei variabile,
care poart caracter de cretere ori de
micorare.
Aprecierea legturilor de corelaie lineare se
realizeaz cu ajutorul coeficientului de
corelaie rxy,
iar a celor nelineare cu raportul de
corelaie (eta).
Corelaiile directe

se stabilesc ntre fenomene care evolueaz


n acelai sens. Crete unul, crete i cel cu
care are legtur de dependen; sau scade
un fenomen, scade i cel cu care coreleaz.
Exemplu: majorarea nlimii copiilor
determin mrirea greutii lor.
Corelaiile inverse
se stabilesc ntre fenomene care evolueaz n sens
opus. Crete un fenomen i scade cel cu care are o
legtur de dependen; sau scade un fenomen i
crete cel cu care se coreleaz.

Exemplu: cu ct e mai mare vrsta copiilor, cu


att e mai mic mortalitatea lor.
Corelaiile statistice directe
presupun evoluia n acelai sens a
fenomenelor ce se coreleaz, dar nu cu
aceeai unitate de msur.
Exemplu: crete nivelul de trai al populaiei
unei colectiviti de dou ori, crete i
rezistena organismului la mbolnviri dar
nu n aceeai msur

Corelaiile statistice inverse

presupun creterea unui fenomen i scderea celui


cu care se coreleaz, dar nu n aceeai msur.
Spre exemplu, dac ntr-o colectivitate am efectuat
un numr dublu de vaccinri, numrul copiilor ce
vor contracta boala, n anul urmtor, va fi cu
siguran mai sczut, dar nu va fi de dou ori mai
mic dect n anul premergtor.
Corelaiile statistice, spre deosebire de
cele funcionale, pot fi numai
vremelnice i ntr-un singur sens.
Legtura de dependen dintre dou
sau mai multe fenomene, sensul i
intensitatea acesteia, se stabilesc cu
ajutorul coeficientului de corelaie
linear (simpl sau multipl) al lui
Bravais-Pearson.
Pentru seriile statistice simple
Formula de calcul:
dxdy
rxy =
dx2dy2

n care:
rxy = coeficientul de corelaie;
dxdy = suma produselor dintre abaterile de la
media aritmetic a valorilor frecvenelor celor
dou fenomene (x i y) ce se coreleaz;
dx2 = suma ptratelor abaterilor de la media
aritmetic a valorilor frecvenelor fenomenului x;
dy2 = suma ptratelor abaterilor de la media
aritmetic a valorilor frecvenelor fenomenului y.
Exemple:
1. Timpul trecut din momentul accesului de pancreatit
acut (x) i numrul complicaiilor postoperatorii (y)
Nr. Timpul Numr dX dY d2 X d2 Y d Xd Y
x complicaii
y
1 3 6 -6 -8,8 36 77,4 52,8
2 5 8 -4 -6,8 16 46,2 27,2
3 7 12 -2 -2,8 4 7,8 5,6
4 10 19 1 4,2 1 17,6 4,2
5 13 20 4 5,2 16 27 20,8
6 16 24 7 9,2 49 84,6 64,4
Total 54 89 122 260,6 175
9 14,8 178,3
RXY =0,98
2. Nivelul de asigurare cu medici stomatologi (x) i
ponderea copiilor sanai n cadrul a 5 raioane (y)
2 2
Nr. Asigurare Copii dX dY d X d Y d Xd Y
medici sanai
x y
1 2,3 65,7 -1 -19,7 1 388,1 19,7
2 3,2 91,7 -0,1 6,3 0,01 39,7 -0,63
3 3,4 88,0 0,2 2,6 0,04 6,8 0,52
4 3,6 91,4 0,3 6,0 0,09 36 1,8
5 3,9 90,3 0,6 4,9 0,36 24,0 2,94
Total 16,4 427,1 1,5 494,6 24,3
3,3 85,4 27,2
rXY=0,89
pentru seriile statistice grupate
Formula de calcul:
dxdyfxy
rxy =
(dx2fx)(dy2fy)
n care:
rxy = coeficientul de corelaie;
dxdyfxy = produsul dintre abaterile de la media
ponderat a variantelor celor dou fenomene ce se
coreleaz i frecvenele perechi corespunztoare
variantelor fenomenelor x i y;
dx2fx = produsul dintre ptratele abaterilor de la
media ponderat a valorilor variantelor fenomenului
x i numrul de frecvene corespunztoare fiecrei
variante;
dy2fy = produsul dintre ptratele abaterilor de la
media ponderat a valorilor variantelor fenomenului
y i numrul de frecvene corespunztoare fiecrei
variante.
Coeficientul de corelaie

poate fi cuprins ntre:


minus unu
zero
plus unu.
Interpretarea coeficientului de corelaie
Cnd valoarea coeficientului de corelaie se apropie de
+1, nseamn c ntre cele dou fenomene ce se
coreleaz exist o legtur foarte puternic.
Semnul + al coeficientului de corelaie denot c
legtura de dependen dintre fenomene este direct.
Deci ambele fenomene evolueaz n acelai sens, n
aceeai direcie.
Cnd valoarea coeficientului de corelaie se apropie de
1, nseamn c ntre cele dou fenomene exist o
legtur foarte puternic, dar invers, n sens opus:
crete un fenomen, scade cel cu care se coreleaz.
Interpretarea coeficientului
de corelaie
Pentru interpretarea intensitii legturii de
dependen dintre fenomene, Guilford indic
urmtoarele CRITERII:
valoarea coeficientului de corelaie cuprins
ntre 1 denot o corelaie foarte puternic ntre
fenomene;
valoarea coeficientului de corelaie cuprins
ntre 0,99 i 0,70 denot o corelaie puternic;
Interpretarea coeficientului de
corelaie
valoarea coeficientului de corelaie cuprins ntre
0,69 i 0,30 denot o corelaie medie ntre fenomene;
valoarea coeficientului de corelaie cuprins ntre 0,0
i 0,29 exprim existena unei corelaii slabe ntre
fenomene;
valoarea coeficientului de corelaie 0 denot c
legtura dintre fenomene n mod practic o considerm
inexistent.
Cele dou fenomene evolueaz deci independent unul de
altul.
Coeficientul de corelaie ntre fenomene
poate fi corect interpretat dac se ine
seama de urmtoarele ASPECTE:

ntre fenomenele ce se coreleaz s existe, n


mod logic, o legtur;
cele dou fenomene s fie cercetate pe
eantioane omogene;
selecia frecvenei eantioanelor s se fac la
ntmplare.
Pentru a analiza fidelitatea
coeficientului de corelaie, n
interpretarea legturii dintre
fenomenele obinute pe eantioane, se
apreciaz eroarea coeficientului de
corelaie, care se noteaz cu mr.
pentru n > 100:
1 r2xy
mr =
n
n care:
mr = eroarea coeficientului de corelaie;
r2xy = ptratul valorii coeficientului de corelaie,
obinut pe eantioane;
1 = valoarea absolut a coeficientului de corelaie,
obinut pe univers, pe ntreaga populaie;
n = numrul variantelor perechi ale fenomenelor
ce se coreleaz.
pentru n < 30, se utilizeaz n-2

cnd 30 < n < 100 se utilizeaz n-1


Dac valoarea coeficientului de corelaie
obinut pe eantioane este mai mare dect
triplul erorii sale, nseamn c acesta a fost
obinut pe eantioane reprezentative, este
deci real i ne putem bizui pe el n
interpretarea legturii de dependen ntre
fenomene.
Raportul dintre coeficientul de corelaie i
eroarea lui se numete criteriu de exactitate
al coeficientului de corelaie - tr. Criteriul n
cauz se stabilete cu ajutorul tabelului
valorilor criteriului t. Dac treal > ttabel,
coeficientul de corelaie se consider
semnificativ.
CORELOGRAMA
Existena sau inexistena unei corelaii
ntre fenomene se poate evidenia
aproximativ cu ajutorul reprezentrilor
grafice. n acest caz, folosim un grafic cu
dou scri, ordonat i abscis, pe care
nscriem valorile variantelor celor dou
fenomene x i y.
Se realizeaz astfel norul de puncte.

Dac norul de puncte se va dispune fuziform,


oblic de jos n sus i de la stnga la dreapta,
ntre cele dou fenomene exist o corelaie
direct. Crete un fenomen, crete i cel de al
doilea, cu care se coreleaz, sau ambele
fenomene scad, evolund n aceeai direcie.
Dac norul de puncte se dispune
fuziform, oblic de sus n jos i de la
stnga la dreapta, ntre cele dou
fenomene exist o corelaie invers.
Dac punctele se dispun pe toat reeaua
grafic, neavnd nici o tendin de a se
grupa, nseamn c ntre fenomene nu
exist nici o legtur de dependen,
fenomenele evolund independent unul fa
de cellalt.
n cazul acesta, dreapta care trece prin
mijlocul punctelor este paralel fie cu
ordonata, fie cu abscisa.
CORELAIA MULTIPL

Se stabilete ntre mai mult de dou fenomene,


care au legtur de dependen ntre ele.

n asemenea situaii, existena legturii de


dependen ntre fenomene, sensul i intensitatea
acestei legturi, se stabilesc cu ajutorul
coeficientului de corelaie linear multipl.
FORMULA DE CALCUL
rxyz = r2xy + r2xz 2(rxy) ryz rxz
1 r2xz
n care:
rxyz=coeficientul de corelaie linear multipl ntre cele trei
fenomene;
rxy=coeficientul de corelaie linear simpl ntre
fenomenele x i y;
ryz=coeficientul de corelaie linear simpl ntre
fenomenele y i z;
rxz=coeficientul de corelaie linear simpl ntre
fenomenele x i z;

Interpretarea intensitii corelaiei multiple ine seama de


aceleai criterii enunate la interpretarea coeficientului de
corelaie linear simpl.
CORELAIA RANGURILOR (SPEARMAN)

n cazul n care dorim s stabilim legtura de


dependen ntre fenomenele cercetate pe
eantioane mici, utilizm coeficientul de corelaie
al rangurilor, propus de Spearman (1904).
Acest coeficient se noteaz cu litera greac (ro) i
se determin dup formula propus de Spearman:
6 d2
= 1-
n (n2 1)
n care:
1 = valoarea absolut a coeficientului de corelaie;
= coeficientul de corelaie Spearman;
6 = valoare constant;
d2 = suma ptratelor diferenelor dintre rangurile
primului ir de variante i rangurile celui de al doilea
ir de variante, cu care se coreleaz;
n = numrul variantelor perechi variantelor ce se
coreleaz.
Coeficientul de corelaie al rangurilor poate
avea valori cuprinse ntre 1 -0- +1. El
exprim o legtur perfect cnd are
valoarea +1. n aceast situaie, rangurile au
valori egale, iar diferena ntre ranguri este
egal cu 0.

Exemple:
1. Timpul trecut din momentul accesului de pancreatit
acut (x) i numrul complicaiilor postoperatorii (y)
2
Nr. Timpul Numr Rangul Rangul d d
x complicaii x y
y
1 3 6 1 1 0 0
2 5 8 2 2 0 0
3 7 12 3 3 0 0
4 10 19 4 4 0 0
5 13 20 5 5 0 0
6 16 24 6 6 0 0
Total 54 89 0
=1
2. Legtura de corelaie ntre copiii cu deficien mintal (la 100
mii copii) i invaliditatea copiilor (la 100 mii copii)
Nr. ara Deficien Invaliditatea Rangul Rangul d d2
mintal copiilor x y
x y
1 Armenia 120 33 1 6,5 -5,5 30,25
2 Tadjikistan 138 27 2 1 1 1
3 Azerbaidjan 167 38 3 9,5 -6,5 42,25
4 Turkmenistan 198 30 4 4,5 -0,5 0,25
5 Georgia 245 43 5 11 -6 36
6 Krgzstan 318 28 6 2 4 16
7 Uzbekistan 342 30 7 4,5 2,5 6,25
8 Kazahstan 455 29 8 3 5 25
9 Bielarusi 538 36 9 8 1 1
10 Ucraina 625 48 10 14 -4 16
11 Rusia 795 38 11 9,5 1,5 2,25
12 Moldova 1018 44 12 12 0 0
13 Estonia 1110 47 14 13 1 1
14 Lituania 1021 57 13 15 -2 4
15 Letonia 1127 33 15 6,5 8,5 72,25
Total =-24,5 =253,5
=+24,5
= 0,55
REGRESIA

Termenul de regresie a fost introdus de


F. Galton, care a observat c nlimea
descendenilor regreseaz ctre nlimea
prinilor.
Regresia

completeaz corelaia i prin intermediul


coeficientului de regresie, se stabilete cu ct
crete sau descrete sub aspect cantitativ, un
fenomen, cnd cel cu care se coreleaz
crete sau descrete cu o unitate de msur.
Regresia poate fi:
simpl i multipl
liniar i neliniar
direct, cnd fenomenele evolueaz n acelai
sens (crete x, crete y sau scade x scade i y)
indirect, cnd fenomenul evolueaz n sens
opus (crete x scade y sau scade x crete y)
Formula coeficientului de regresie este:
y
Rgyx = rxy
x
sau
x
Rgxy = rxy
y
n care:
Rgxy = coeficientul de regresie a lui x n funcie de y. El
exprim, cantitativ, cu ct crete sau scade fenomenul x
cnd y crete sau scade cu o unitate de msur;
Rgyx = coeficientul de regresie a lui y n funcie de x. El
exprim, cantitativ, cu ct crete sau scade fenomenul y
cnd x crete sau scade cu o unitate de msur;
rxy = coeficientul de corelaie liniar Bravais-Pearson;
x = deviaia standard a fenomenului x;
y = deviaia standard a fenomenului y.