Corelatia N

S-ar putea să vă placă și

Sunteți pe pagina 1din 50

Corelaia i regresia

Subiecte n discuie
Noiunea de corelaie. Tipurile de
corelaii
Calcularea i interpretarea coeficientului
de corelatie. Corelograma.
Noiunea de regresie. Tipuri. Calcularea
i interpretarea coeficientului de
regresie.
CORELAIA

n majoritatea domeniilor de activitate exist


interdependene ntre fenomene.
Apariia i evoluia unui fenomen este n strns
legtur cu o serie de alte fenomene ce l determin.
Corelaia este o metod care ne permite s
cunoatem fenomenele din natur i societate sub
raportul conexiunilor n care se gsesc.
n statistic, pentru studierea legturilor multiple ce
au loc ntre diferite fenomene, se folosete noiunea
de funcie f , care const n faptul c fiecrei valori a
variabilei independente (X), numit argument, i
corespunde valoarea altei variabile numit funcie
(Y).
Tipuri de corelaii

corelaii funcionale sau


matematice
corelaii statistice sau stohastice.
Corelaiile funcionale
sunt perfecte, rigide, exprimnd legtura de la
cauz la efect ntre fenomene.
ele sunt studiate n cadrul tiinelor exacte, unde
legtura de la cauz la efect se exprim sub
form de lege.
n cazul lor unei valori determinate a unei
variabile independente X (argument) i
corespunde strict o valoare a variabilei
dependente Y (funcie).
Corelaiile statistice
sunt mai puin perfecte
se evideniaz mai greu
n cazul lor, fiecrei valori numerice a
variabilei X corespund nu una ci mai
multe valori a variabilei Y, adic o
totalitate statistic a acestei valori, care se
grupeaz n jurul mediei Yx.
Legtura de corelaie
dup form poate fi:
1. linear (rectilinie)
2. nelinear (curbilinie)

dup sens:
1. direct (pozitiv)
2. invers (negativ).
n corelaiile lineare

schimbrilor uniforme a valorilor medii


a unei variabile le corespund schimbri
egale a altei variabile.
n corelaia nelinear

schimbrilor uniforme a unei valori i


corespund valori medii a altei variabile,
care poart caracter de cretere ori de
micorare.
Aprecierea legturilor de corelaie
lineare se realizeaz cu ajutorul
coeficientului de corelaie rxy,
iar a celor nelineare cu raportul de
corelaie (eta).
Corelaiile directe
se stabilesc ntre fenomene care
evolueaz n acelai sens. Crete unul,
crete i cel cu care are legtur de
dependen; sau scade un fenomen,
scade i cel cu care coreleaz.
Exemplu: majorarea nlimii copiilor
determin mrirea greutii lor.
Corelaiile inverse
se stabilesc ntre fenomene care evolueaz n
sens opus. Crete un fenomen i scade cel cu
care are o legtur de dependen; sau scade
un fenomen i crete cel cu care se coreleaz.

Exemplu: cu ct e mai mare vrsta copiilor, cu


att e mai mic mortalitatea lor.
Corelaiile statistice directe
presupun evoluia n acelai sens a fenomenelor
ce se coreleaz, dar nu cu aceeai unitate de
msur.
Exemplu: crete nivelul de trai al populaiei
unei colectiviti de dou ori, crete i rezistena
organismului la mbolnviri dar nu n aceeai
msur

Corelaiile statisitice
inverse
presupun creterea unui fenomen i scderea
celui cu care se coreleaz, dar nu n aceeai
msur.
Spre exemplu, dac ntr-o colectivitate am
efectuat un numr dublu de vaccinri, numrul
copiilor ce vor contracta boala, n anul urmtor,
va fi cu siguran mai sczut, dar nu va fi de
dou ori mai mic dect n anul premergtor.
Corelaiile statistice, spre deosebire
de cele funcionale, pot fi numai
vremelnice i ntr-un singur sens.
Legtura de dependen dintre dou
sau mai multe fenomene, sensul i
intensitatea acesteia, se stabilesc cu
ajutorul coeficientului de corelaie
linear (simpl sau multipl) al lui
Bravais-Pearson.
Pentru seriile statistice simple
Formula de calcul:
dxdy
rxy =
dx2dy2

n care:
rxy = coeficientul de corelaie;
dxdy = suma produselor dintre abaterile de la
media aritmetic a valorilor frecvenelor celor
dou fenomene (x i y) ce se coreleaz;
dx2 = suma ptratelor abaterilor de la media
aritmetic a valorilor frecvenelor fenomenului x;
dy2 = suma ptratelor abaterilor de la media
aritmetic a valorilor frecvenelor fenomenului y.
Exemple:
1. Timpul trecut din momentul accesului de pancreatit acut (x)
i numrul complicaiilor postoperatorii (y)
Nr. Timpul Numr dX dY d2X d2Y dXdY
x complicaii
y
1 3 6 -6 -8,8 36 77,4 52,8
2 5 8 -4 -6,8 16 46,2 27,2
3 7 12 -2 -2,8 4 7,8 5,6
4 10 19 1 4,2 1 17,6 4,2
5 13 20 4 5,2 16 27 20,8
6 16 24 7 9,2 49 84,6 64,4
Total 54 89 122 260,6 175
9 14,8 178,3
RXY=0,98
2. Nivelul de asigurare cu medici stomatologi (x) i ponderea
copiilor sanai n cadrul a 5 raioane (y)

Nr. Asigurare Copii dX dY d2X d2Y dXdY


medici sanai
x y
1 2,3 65,7 -1 -19,7 1 388,1 19,7
2 3,2 91,7 -0,1 6,3 0,01 39,7 -0,63
3 3,4 88,0 0,2 2,6 0,04 6,8 0,52
4 3,6 91,4 0,3 6,0 0,09 36 1,8
5 3,9 90,3 0,6 4,9 0,36 24,0 2,94
Total 16,4 427,1 1,5 494,6 24,3
3,3 85,4 27,2
rXY=0,89
pentru seriile statistice cu frecvene
Formula de calcul:
dxdyfxy
rxy =
(dx2fx)(dy2fy)
n care:
rxy = coeficientul de corelaie;
dxdyfxy = produsul dintre abaterile de la media ponderat
a variantelor celor dou fenomene ce se coreleaz i
frecvenele perechi corespunztoare variantelor
fenomenelor x i y;
dx2fx = produsul dintre ptratele abaterilor de la media
ponderat a valorilor variantelor fenomenului x i
numrul de frecvene corespunztoare fiecrei variante;
dy2fy = produsul dintre ptratele abaterilor de la media
ponderat a valorilor variantelor fenomenului y i
numrul de frecvene corespunztoare fiecrei variante.
Coeficientul de corelaie

poate fi cuprins ntre:


minus unu
zero
plus unu.
Interpretarea coeficientului de
corelaie
Cnd valoarea coeficientului de corelaie se apropie de
+1, nseamn c ntre cele dou fenomene ce se
coreleaz exist o legtur foarte puternic.
Semnul + al coeficientului de corelaie denot c
legtura de dependen dintre fenomene este direct.
Deci ambele fenomene evolueaz n acelai sens, n
aceeai direcie.
Cnd valoarea coeficientului de corelaie se apropie de
1, nseamn c ntre cele dou fenomene exist o
legtur foarte puternic, dar invers, n sens opus:
crete un fenomen, scade cel cu care se coreleaz.
Interpretarea
coeficientului de corelaie
Pentru interpretarea intensitii legturii de
dependen dintre fenomene, Guilford indic
urmtoarele CRITERII:
valoarea coeficientului de corelaie de 1
denot o corelaie foarte puternic ntre
fenomene;
valoarea coeficientului de corelaie
cuprins ntre 0,99 i 0,70 denot o corelaie
puternic;
Interpretarea
coeficientului de corelaie
valoarea coeficientului de corelaie cuprins ntre
0,69 i 0,30 denot o corelaie medie ntre fenomene;
valoarea coeficientului de corelaie cuprins ntre
0,01 i 0,29 exprim existena unei corelaii slabe
ntre fenomene;
valoarea coeficientului de corelaie 0 denot c
legtura dintre fenomene n mod practic o considerm
inexistent. Cele dou fenomene evolueaz deci
independent unul de altul.
Coeficientul de corelaie ntre fenomene poate
fi corect interpretat dac se ine seama de
urmtoarele ASPECTE:
ntre fenomenele ce se coreleaz s existe, n
mod logic, o legtur;
cele dou fenomene s fie cercetate pe
eantioane omogene;
alegerea sau selecionarea frecvenei
eantioanelor s se fac la ntmplare.
Pentru a ne convinge de fidelitatea
coeficientului de corelaie, n
interpretarea legturii dintre fenomene
obinute pe eantioane, ne servim de
eroarea coeficientului de corelaie, care
se noteaz cu mr.
pentru n > 100:
1 r2xy
mr =
n
n care:
mr = eroarea coeficientului de corelaie;
r2xy = ptratul valorii coeficientului de corelaie, obinut pe
eantioane;
1 = valoarea absolut a coeficientului de corelaie, obinut
pe univers, pe ntreaga populaie;
n = numrul variantelor perechi ale fenomenelor ce se
coreleaz.
pentru n < 30, se utilizeaz n-2

cnd 30 < n < 100 se utilizeaz n-1


Dac valoarea coeficientului de corelaie
obinut pe eantioane este mai mare
dect triplul erorii sale, nseamn c
acesta a fost obinut pe eantioane
reprezentative, este deci real i ne putem
bizui pe el n interpretarea legturii de
dependen ntre fenomene.
Raportul dintre coeficientul de corelaie
i eroarea lui se numete criteriu de
exactitate al coeficientului de corelaie -
tr. Criteriul n cauz se stabilete cu
ajutorul tabelului valorilor criteriului t.
Dac treal > ttabel, coeficientul de corelaie
se consider semnificativ.
CORELOGRAMA
Existena sau inexistena unei corelaii
ntre fenomene se poate evidenia
aproximativ cu ajutorul reprezentrilor
grafice. n acest caz, folosim un grafic cu
dou scri, ordonat i abscis, pe care
nscriem valorile variantelor celor dou
fenomene x i y.
Se realizeaz astfel norul de puncte.

Dac norul de puncte se va dispune fuziform,


oblic de jos n sus i de la stnga la dreapta,
ntre cele dou fenomene exist o corelaie
direct. Crete un fenomen, crete i cel de al
doilea, cu care se coreleaz, sau ambele
fenomene scad, evolund n aceeai direcie.
Dac norul de puncte se dispune
fuziform, oblic de sus n jos i de la
stnga la dreapta, ntre cele dou
fenomene exist o corelaie invers.
Dac punctele se dispun pe toat reeaua grafic,
neavnd nici o tendin de a se grupa,
nseamn c ntre fenomene nu exist nici o
legtur de dependen, fenomenele evolund
independent unul fa de cellalt.
n cazul acesta, dreapta care trece prin mijlocul
punctelor este paralel fie cu ordonata, fie cu
abscisa.
CORELAIA MULTIPL

Se stabilete ntre mai mult de dou fenomene,


care au legtur de dependen ntre ele.

n asemenea situaii, existena legturii de


dependen ntre fenomene, sensul i
intensitatea acestei legturi, se stabilesc cu
ajutorul coeficientului de corelaie linear
multipl.
FORMULA DE CALCUL

rxyz = r2xy + r2xz 2(rxy) ryz rxz


1 r2xz

n care:
rxyz=coeficientul de corelaie linear multipl ntre cele trei
fenomene;
rxy=coeficientul de corelaie linear simpl ntre fenomenele
x i y;
ryz=coeficientul de corelaie linear simpl ntre fenomenele
y i z;
rxz=coeficientul de corelaie linear simpl ntre fenomenele
x i z;

Interpretarea intensitii corelaiei multiple ine seama de


aceleai criterii enunate la interpretarea coeficientului de
corelaie linear simpl.
CORELAIA RANGURILOR
(SPEARMAN)

n cazul n care dorim s stabilim legtura de


dependen ntre fenomene cercetate pe
eantioane mici, utilizm coeficientul de
corelaie al rangurilor, propus de Spearman
(1904).
Acest coeficient se noteaz cu litera greac
(ro) i se determin dup formula propus de
Spearman:
6 d2
=1
n (n2 1)
n care:
1 = valoarea absolut a coeficientului de corelaie;
= coeficientul de corelaie Spearman;
6 = valoare constant;
d2 = suma ptratelor diferenelor dintre rangurile
primului ir de variante i rangurile celui de al doilea ir de
variante, cu care se coreleaz;
n = numrul variantelor perechi variantelor ce se coreleaz.
Coeficientul de corelaie al rangurilor
poate avea valori cuprinse ntre 1 -0-
+1. El exprim o legtur perfect cnd
are valoarea +1. n aceast situaie,
rangurile au valori egale, iar diferena
ntre ranguri este egal cu 0.

Exemple:
1. Timpul trecut din momentul accesului de pancreatit acut (x)
i numrul complicaiilor postoperatorii (y)

Nr. Timpul Numr Rangul Rangul d d2


x complicaii x y
y
1 3 6 1 1 0 0
2 5 8 2 2 0 0
3 7 12 3 3 0 0
4 10 19 4 4 0 0
5 13 20 5 5 0 0
6 16 24 6 6 0 0
Total 54 89 0
=1
2. Legtura de corelaie ntre copiii cu deficien mintal (la 100 mii copii) i
invaliditatea copiilor (la 100 mii copii)
Nr. ara Deficien Invaliditatea Rangul Rangul d d2
mintal copiilor x y
x y
1 Armenia 120 33 1 6,5 -5,5 30,25
2 Tadjikistan 138 27 2 1 1 1
3 Azerbaidjan 167 38 3 9,5 -6,5 42,25
4 Turkmenistan 198 30 4 4,5 -0,5 0,25
5 Georgia 245 43 5 11 -6 36
6 Krgzstan 318 28 6 2 4 16
7 Uzbekistan 342 30 7 4,5 2,5 6,25
8 Kazahstan 455 29 8 3 5 25
9 Bielarusi 538 36 9 8 1 1
10 Ucraina 625 48 10 14 -4 16
11 Rusia 795 38 11 9,5 1,5 2,25
12 Moldova 1018 44 12 12 0 0
13 Estonia 1110 47 14 13 1 1
14 Lituania 1021 57 13 15 -2 4
15 Letonia 1127 33 15 6,5 8,5 72,25
Total =-24,5 =253,5
=+24,5
=0,55
REGRESIA

Termenul de regresie a fost introdus de


F.Galton, care a observat c nlimea
descendenilor regreseaz ctre
nlimea prinilor.
Regresia

completeaz corelaia i prin intermediul


coeficientului de regresie, se stabilete cu
ct crete sau descrete sub aspect
cantitativ, un fenomen, cnd cel cu care
se coreleaz crete sau descrete cu o
unitate de msur.
Regresia poate fi:
simpl i multipl
liniar i neliniar
direct, cnd fenomenele evolueaz n acelai
sens (crete x, crete y sau scade x scade i y)
indirect, cnd fenomenul evolueaz n sens
opus (crete x scade y sau scade x crete y)
Formula coeficientului de regresie este:
y
Rgyx = rxy
x
sau
x
Rgxy = rxy
y
n care:
Rgxy = coeficientul de regresie a lui x n funcie de y. El
exprim, cantitativ, cu ct crete sau scade fenomenul x
cnd y crete sau scade cu o unitate de msur;
Rgyx = coeficientul de regresie a lui y n funcie de x. El
exprim, cantitativ, cu ct crete sau scade fenomenul y
cnd x crete sau scade cu o unitate de msur;
rxy = coeficientul de corelaie liniar Bravais-Pearson;
x = deviaia standard a fenomenului x;
y = deviaia standard a fenomenului y.

S-ar putea să vă placă și