Sunteți pe pagina 1din 50

Corelaia i regresia

Subiecte n discuie
Noiunea de corelaie. Tipurile de corelaii
Calcularea i interpretarea coeficientului de
corelatie. Corelograma.
Noiunea de regresie. Tipuri. Calcularea i
interpretarea coeficientului de regresie.

CORELAIA
n majoritatea domeniilor de activitate exist
interdependene ntre fenomene.
Apariia i evoluia unui fenomen este n
strns legtur cu o serie de alte fenomene ce
l determin.
Corelaia este o metod care ne permite s
cunoatem fenomenele din natur i societate
sub raportul conexiunilor n care se gsesc.

n statistic, pentru studierea legturilor


multiple ce au loc ntre diferite fenomene, se
folosete noiunea de funcie f , care const n
faptul c fiecrei valori a variabilei
independente (X), numit argument, i
corespunde valoarea altei variabile numit
funcie (Y).

Tipuri de corelaii
corelaii funcionale sau matematice
corelaii statistice sau stohastice.

Corelaiile funcionale
sunt perfecte, rigide, exprimnd legtura de la
cauz la efect ntre fenomene.
ele sunt studiate n cadrul tiinelor exacte, unde
legtura de la cauz la efect se exprim sub
form de lege.
n cazul lor unei valori determinate a unei
variabile independente X (argument) i
corespunde strict o valoare
a variabilei
dependente Y (funcie).

Corelaiile statistice
sunt mai puin perfecte
se evideniaz mai greu
n cazul lor, fiecrei valori numerice a
variabilei X corespund nu una ci mai multe
valori a variabilei Y, adic o totalitate
statistic a acestei valori, care se grupeaz
n jurul mediei Yx.

Legtura de corelaie

dup form poate fi:


1. linear (rectilinie)
2. nelinear (curbilinie)

dup sens:
1. direct (pozitiv)
2. invers (negativ).

n corelaiile lineare

schimbrilor uniforme a valorilor medii a


unei variabile le corespund schimbri egale
a altei variabile.

n corelaia nelinear
schimbrilor uniforme a unei valori i
corespund valori medii a altei variabile,
care poart caracter de cretere ori de
micorare.

Aprecierea legturilor de corelaie lineare se


realizeaz cu ajutorul coeficientului de
corelaie rxy,
iar a celor nelineare cu raportul de
corelaie (eta).

Corelaiile directe
se stabilesc ntre fenomene care evolueaz
n acelai sens. Crete unul, crete i cel cu
care are legtur de dependen; sau scade
un fenomen, scade i cel cu care coreleaz.
Exemplu: majorarea nlimii copiilor
determin mrirea greutii lor.

Corelaiile inverse
se stabilesc ntre fenomene care evolueaz n sens
opus. Crete un fenomen i scade cel cu care are o
legtur de dependen; sau scade un fenomen i
crete cel cu care se coreleaz.
Exemplu: cu ct e mai mare vrsta copiilor, cu
att e mai mic mortalitatea lor.

Corelaiile statistice directe


presupun evoluia n acelai sens a
fenomenelor ce se coreleaz, dar nu cu
aceeai unitate de msur.
Exemplu: crete nivelul de trai al populaiei
unei colectiviti de dou ori, crete i
rezistena organismului la mbolnviri dar
nu n aceeai msur

Corelaiile statistice inverse


presupun creterea unui fenomen i scderea celui
cu care se coreleaz, dar nu n aceeai msur.
Spre exemplu, dac ntr-o colectivitate am efectuat
un numr dublu de vaccinri, numrul copiilor ce
vor contracta boala, n anul urmtor, va fi cu
siguran mai sczut, dar nu va fi de dou ori mai
mic dect n anul premergtor.

Corelaiile statistice, spre deosebire de


cele funcionale, pot fi numai
vremelnice i ntr-un singur sens.

Legtura de dependen dintre dou


sau mai multe fenomene, sensul i
intensitatea acesteia, se stabilesc cu
ajutorul coeficientului de corelaie
linear (simpl sau multipl) al lui
Bravais-Pearson.

Pentru seriile statistice simple


Formula de calcul:
dxdy
rxy =
dx2dy2
n care:

rxy = coeficientul de corelaie;


dxdy = suma produselor dintre abaterile de la
media aritmetic a valorilor frecvenelor celor
dou fenomene (x i y) ce se coreleaz;
dx2 = suma ptratelor abaterilor de la media
aritmetic a valorilor frecvenelor fenomenului x;
dy2 = suma ptratelor abaterilor de la media
aritmetic a valorilor frecvenelor fenomenului y.

Exemple:
1. Timpul trecut din momentul accesului de pancreatit
acut (x) i numrul complicaiilor postoperatorii (y)
Nr.
1
2
3
4
5
6
Total

Timpul
Numr
x
complicaii
y
3
6
5
8
7
12
10
19
13
20
16
24
54
89
9
14,8

dX

dY

-6
-4
-2
1
4
7

-8,8
-6,8
-2,8
4,2
5,2
9,2

d2X

d2Y

36
77,4
16
46,2
4
7,8
1
17,6
16
27
49
84,6
122
260,6
178,3

dXdY
52,8
27,2
5,6
4,2
20,8
64,4
175
RXY =0,98

2. Nivelul de asigurare cu medici stomatologi (x) i


ponderea copiilor sanai n cadrul a 5 raioane (y)
Nr.
1
2
3
4
5
Total

Asigurare
medici
x
2,3
3,2
3,4
3,6
3,9
16,4
3,3

Copii
sanai
y
65,7
91,7
88,0
91,4
90,3
427,1
85,4

dX

dY

-1
-0,1
0,2
0,3
0,6

-19,7
6,3
2,6
6,0
4,9

d2X

d2Y

1
388,1
0,01
39,7
0,04
6,8
0,09
36
0,36
24,0
1,5
494,6
27,2

dXdY
19,7
-0,63
0,52
1,8
2,94
24,3
rXY=0,89

pentru seriile statistice grupate


Formula de calcul:
dxdyfxy
rxy =
(dx2fx)(dy2fy)
n care:

rxy = coeficientul de corelaie;


dxdyfxy = produsul dintre abaterile de la media
ponderat a variantelor celor dou fenomene ce se
coreleaz i frecvenele perechi corespunztoare
variantelor fenomenelor x i y;
dx2fx = produsul dintre ptratele abaterilor de la
media ponderat a valorilor variantelor fenomenului
x i numrul de frecvene corespunztoare fiecrei
variante;
dy2fy = produsul dintre ptratele abaterilor de la
media ponderat a valorilor variantelor fenomenului
y i numrul de frecvene corespunztoare fiecrei
variante.

Coeficientul de corelaie
poate fi cuprins ntre:
minus unu
zero
plus unu.

Interpretarea coeficientului de corelaie


Cnd valoarea coeficientului de corelaie se apropie de
+1, nseamn c ntre cele dou fenomene ce se
coreleaz exist o legtur foarte puternic.
Semnul + al coeficientului de corelaie denot c
legtura de dependen dintre fenomene este direct.
Deci ambele fenomene evolueaz n acelai sens, n
aceeai direcie.
Cnd valoarea coeficientului de corelaie se apropie de
1, nseamn c ntre cele dou fenomene exist o
legtur foarte puternic, dar invers, n sens opus:
crete un fenomen, scade cel cu care se coreleaz.

Interpretarea coeficientului
de corelaie
Pentru interpretarea intensitii legturii de
dependen dintre fenomene, Guilford indic
urmtoarele CRITERII:
valoarea coeficientului de corelaie cuprins
ntre 1 denot o corelaie foarte puternic ntre
fenomene;
valoarea coeficientului de corelaie cuprins
ntre 0,99 i 0,70 denot o corelaie puternic;

Interpretarea coeficientului de
corelaie
valoarea coeficientului de corelaie cuprins ntre
0,69 i 0,30 denot o corelaie medie ntre fenomene;
valoarea coeficientului de corelaie cuprins ntre 0,0
i 0,29 exprim existena unei corelaii slabe ntre
fenomene;
valoarea coeficientului de corelaie 0 denot c
legtura dintre fenomene n mod practic o considerm
inexistent.
Cele dou fenomene evolueaz deci independent unul de
altul.

Coeficientul de corelaie ntre fenomene


poate fi corect interpretat dac se ine
seama de urmtoarele ASPECTE:
ntre fenomenele ce se coreleaz s existe, n
mod logic, o legtur;
cele dou fenomene s fie cercetate pe
eantioane omogene;
selecia frecvenei eantioanelor s se fac la
ntmplare.

Pentru
a
analiza
fidelitatea
coeficientului
de
corelaie,
n
interpretarea
legturii
dintre
fenomenele obinute pe eantioane, se
apreciaz eroarea coeficientului de
corelaie, care se noteaz cu m r.

pentru n > 100:


1 r2xy
mr =
n
n care:
mr = eroarea coeficientului de corelaie;
r2xy = ptratul valorii coeficientului de corelaie,
obinut pe eantioane;
1 = valoarea absolut a coeficientului de corelaie,
obinut pe univers, pe ntreaga populaie;
n = numrul variantelor perechi ale fenomenelor
ce se coreleaz.

pentru n < 30, se utilizeaz

n-2

cnd 30 < n < 100 se utilizeaz

n-1

Dac valoarea coeficientului de corelaie


obinut pe eantioane este mai mare dect
triplul erorii sale, nseamn c acesta a fost
obinut pe eantioane reprezentative, este
deci real i ne putem bizui pe el n
interpretarea legturii de dependen ntre
fenomene.

Raportul dintre coeficientul de corelaie i


eroarea lui se numete criteriu de exactitate
al coeficientului de corelaie - t r. Criteriul
n cauz se stabilete cu ajutorul tabelului
valorilor criteriului t. Dac treal > ttabel,
coeficientul de corelaie se consider
semnificativ.

CORELOGRAMA
Existena sau inexistena unei corelaii
ntre fenomene se poate evidenia
aproximativ cu ajutorul reprezentrilor
grafice. n acest caz, folosim un grafic cu
dou scri, ordonat i abscis, pe care
nscriem valorile variantelor celor dou
fenomene x i y.

Se realizeaz astfel norul de puncte.


Dac norul de puncte se va dispune fuziform,
oblic de jos n sus i de la stnga la dreapta,
ntre cele dou fenomene exist o corelaie
direct. Crete un fenomen, crete i cel de al
doilea, cu care se coreleaz, sau ambele
fenomene scad, evolund n aceeai direcie.

Dac norul de puncte se dispune


fuziform, oblic de sus n jos i de la
stnga la dreapta, ntre cele dou
fenomene exist o corelaie invers.

Dac punctele se dispun pe toat reeaua


grafic, neavnd nici o tendin de a se
grupa, nseamn c ntre fenomene nu
exist nici o legtur de dependen,
fenomenele evolund independent unul fa
de cellalt.
n cazul acesta, dreapta care trece prin
mijlocul punctelor este paralel fie cu
ordonata, fie cu abscisa.

CORELAIA MULTIPL
Se stabilete ntre mai mult de dou fenomene,
care au legtur de dependen ntre ele.
n asemenea situaii, existena legturii de
dependen ntre fenomene, sensul i intensitatea
acestei legturi, se stabilesc cu ajutorul
coeficientului de corelaie linear multipl.

FORMULA DE CALCUL
rxyz =
r2xy + r2xz 2(rxy) ryz rxz
1 r2xz
n care:

rxyz=coeficientul de corelaie linear multipl ntre cele trei


fenomene;
rxy=coeficientul de corelaie linear simpl ntre fenomenele x
i y;
ryz=coeficientul de corelaie linear simpl ntre fenomenele y
i z;
rxz=coeficientul de corelaie linear simpl ntre fenomenele x
i z;
Interpretarea intensitii corelaiei multiple ine seama de
aceleai criterii enunate la interpretarea coeficientului de
corelaie linear simpl.

CORELAIA RANGURILOR (SPEARMAN)


n cazul n care dorim s stabilim legtura de
dependen ntre fenomenele cercetate pe
eantioane mici, utilizm coeficientul de corelaie
al rangurilor, propus de Spearman (1904).
Acest coeficient se noteaz cu litera greac (ro) i
se determin dup formula propus de Spearman:

6 d2
= 1n (n2 1)
n care:
1 = valoarea absolut a coeficientului de corelaie;
= coeficientul de corelaie Spearman;
6 = valoare constant;
d2 = suma ptratelor diferenelor dintre rangurile
primului ir de variante i rangurile celui de al doilea
ir de variante, cu care se coreleaz;
n = numrul variantelor perechi variantelor ce se
coreleaz.

Coeficientul de corelaie al rangurilor poate


avea valori cuprinse ntre 1 -0- +1. El
exprim o legtur perfect cnd are
valoarea +1. n aceast situaie, rangurile
au valori egale, iar diferena ntre ranguri
este egal cu 0.

Exemple:
1. Timpul trecut din momentul accesului de pancreatit
acut (x) i numrul complicaiilor postoperatorii (y)
Nr.
1
2
3
4
5
6
Total

Timpul
Numr
Rangul Rangul
x
complicaii
x
y
y
3
6
1
1
5
8
2
2
7
12
3
3
10
19
4
4
13
20
5
5
16
24
6
6
54
89

d2

0
0
0
0
0
0

0
0
0
0
0
0
0
=1

2. Legtura de corelaie ntre copiii cu deficien mintal (la 100


mii copii) i invaliditatea copiilor (la 100 mii copii)
Nr.
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
Total

ara

Deficien Invaliditatea Rangul Rangul


mintal
copiilor
x
y
x
y
Armenia
120
33
1
6,5
Tadjikistan
138
27
2
1
Azerbaidjan
167
38
3
9,5
Turkmenistan
198
30
4
4,5
Georgia
245
43
5
11
Krgzstan
318
28
6
2
Uzbekistan
342
30
7
4,5
Kazahstan
455
29
8
3
Bielarusi
538
36
9
8
Ucraina
625
48
10
14
Rusia
795
38
11
9,5
Moldova
1018
44
12
12
Estonia
1110
47
14
13
Lituania
1021
57
13
15
Letonia
1127
33
15
6,5

d2

-5,5
30,25
1
1
-6,5
42,25
-0,5
0,25
-6
36
4
16
2,5
6,25
5
25
1
1
-4
16
1,5
2,25
0
0
1
1
-2
4
8,5
72,25
=-24,5 =253,5
=+24,5
= 0,55

REGRESIA

Termenul de regresie a fost introdus de


F. Galton, care a observat c nlimea
descendenilor regreseaz ctre nlimea
prinilor.

Regresia
completeaz corelaia i prin intermediul
coeficientului de regresie, se stabilete cu ct
crete sau descrete sub aspect cantitativ, un
fenomen, cnd cel cu care se coreleaz
crete sau descrete cu o unitate de msur.

Regresia poate fi:


simpl i multipl
liniar i neliniar
direct, cnd fenomenele evolueaz n acelai
sens (crete x, crete y sau scade x scade i y)
indirect, cnd fenomenul evolueaz n sens
opus (crete x scade y sau scade x crete y)

Formula coeficientului de regresie este:


y
Rgyx = rxy
x
sau
x
Rgxy = rxy
y
n care:

Rgxy = coeficientul de regresie a lui x n funcie de y. El


exprim, cantitativ, cu ct crete sau scade fenomenul x
cnd y crete sau scade cu o unitate de msur;
Rgyx = coeficientul de regresie a lui y n funcie de x. El
exprim, cantitativ, cu ct crete sau scade fenomenul y
cnd x crete sau scade cu o unitate de msur;
rxy = coeficientul de corelaie liniar Bravais-Pearson;
x = deviaia standard a fenomenului x;
y = deviaia standard a fenomenului y.

S-ar putea să vă placă și