Sunteți pe pagina 1din 12

9/10/2023

Conceptul de corelație
Teoria corelaţiei în analiza
econometrică Procesele social-economice se formează
sub influența unui număr mare de factori.
Acești factori pot fi împărțiți în:
 Corelația-esenţa
- de bază care determină principalele
 indicatorii sintetici ai corelaţiei caracteristici;
 Măsurarea şi limita coeficientului de - secundare, provocând o dispersare a
corelaţie caracteristicilor.
 Testarea semnificaţiei coeficientului Astfel de procese se numesc stocastice
de corelaţie. (probabilistice sau aleatorii).
Prof.univ.dr.Ion Partachi 1 Prof.univ.dr.Ion Partachi 2

1 2

Corelația este un caz special de relație


Analiza de corelație rezolvă următoarele
stocastică. probleme:
În acest caz, fiecare valoare a - stabilirea naturii dependenței caracteristicii
caracteristicii (variabilă aleatoare) X cauză - efect;
corespunde setului valorii - studiul gradului de strângere a dependenței;
caracteristicilor lui Y, adică distribuției - identificarea dependențelor cauzale
lor. necunoscute.
X - criteriu cauză, Prima problemă este rezolvată prin
alegerea tipului de ecuație, care se numește
Y - criteriu efect.
Prof.univ.dr.Ion Partachi 3
corelație.
Prof.univ.dr.Ion Partachi 4

3 4
9/10/2023

Algoritmul pentru determinarea corelației liniare:

Dependența poate fi:


Datele experimentale (observațiile) sunt
Liniară, prezentate sub forma unui tabel de corelație
Parabolică, Punctele sunt aplicate pe planului de
Hiperbolică, coordonate, depunând valoarea
Logaritmică x
caracteristicii factorului i de-a lungul
y
axei abscisei, iar caracteristica efect de-a
Putere, lungul axei ordonate.
i

Exponențială.
Prof.univ.dr.Ion Partachi 5 Prof.univ.dr.Ion Partachi 6

5 6

Dependența (corelația) liniară dintre


Setul de puncte obținute în acest mod criteriile X și Y este exprimată printr-o
se numește câmp de corelație sau "nor" ecuație de forma:
de corelație. Y = bx + a.
În funcție de forma distribuției O astfel de ecuație se numește ecuația de
punctelor, natura dependenței este regresie Y de X, iar linia dreaptă
aproximativ determinată. corespunzătoare se numește linia de
Se calculează parametrul ecuației de regresie a eșantionului. În acest caz,
regresie liniară aceleași creșteri ale oricărei valori a
caracteristicii factorului X determină
Prof.univ.dr.Ion Partachi 7 aceleași modificări ale caracteristicii
Prof.univ.dr.Ion Partachi 8

efective Y.
7 8
9/10/2023

Dacă trăsătura lui Y are schimbări


inegale, regresia se numește curbilinie Formula pentru calcularea
(parabolică, de putere etc.). parametrului ecuației de regresie
liniară este:
Regresia liniară a lui Y pe X arată cum se
schimbă Y în medie la o schimbare în X.
Dacă Y crește și cu o creștere a lui X,
atunci corelația și regresia se numesc
У У   УХ
(Х  Х )
pozitive, dacă Y scade - negativ (invers). unde УХ este coeficientul de regresie
al eșantionului.
Prof.univ.dr.Ion Partachi 9 Prof.univ.dr.Ion Partachi 10

9 10

Coeficientul  yx arată cât de mult se va


Din sistemul de ecuații normale schimba Y atunci când X se schimbă cu o
pentru dependența liniară obținută unitate.
prin metoda celor mai mici pătrate, Dacă  yx> 0, relația dintre semne este pozitivă.
putem deduce formula pentru
coeficientul de regresie: Dacă  yx < 0, relația dintre semne este
negativă.

 ( x  x )( y  y ) Coeficientul de regresie este măsurat prin

  i i raportul dintre unitățile de măsură Y și unitățile


 (x  x)
УХ
Prof.univ.dr.Ion Partachi
i 11
2
de măsură X.
Prof.univ.dr.Ion Partachi 12

11 12
9/10/2023

A doua problemă a analizei corelației


este calcularea coeficientului de
Se reprezentă ecuația de regresie corelație. Coeficientul de corelație
este o măsură a intensității relației
pe fundalul câmpului de liniare dintre criterii.
corelare. Se calculează după formula:

r
 ( x  x )( y  y )
i i

Prof.univ.dr.Ion Partachi 13 Prof.univ.dr.Ion Partachi

 ( x  x )  ( y  y)
i
2
i
14
2

13 14

Având în vedere formula de mai sus,


r   S x ecuația de regresie poate fi
sau yx
S y reprezentată ca:
,
unde S x , S y sunt abaterile У У  r S x
(Х  Х )
standard ale lui X și Y. S y

Coeficientul de corelație este o


Prof.univ.dr.Ion Partachi 15
cantitate adimensională.
Prof.univ.dr.Ion Partachi 16

15 16
9/10/2023

Proprietățile coeficientului de corelație:


1.
r 1 Odată cu creșterile r
, relația dintre
X și Y devine mai strânsă.
2. Dacă r = 1, atunci relația dintre La - r  0,3 relația dintre semne este
entitățile X și Y este funcțională
slabă,
la 0,3  r  0,7 - medie,
3. Dacă r = 0, atunci caracteristicile
X și Y nu sunt conectate printr-o la - r  0,7 puternică.
corelație liniară, dar dependența Dacă r este pozitiv, atunci relația
poate fi de natură curbilinie. dintre criterii este directă, iar dacă
Prof.univ.dr.Ion Partachi 17 Prof.univ.dr.Ion Partachi 18

este negativă, este inversă.


17 18

Acesta arată proporția (sau procentul


Coeficientul de corelație la dacă r²·100) modificărilor cauzate de o
pătrat se numește coeficient caracteristică a factorului. Coeficientul de
determinare r² este o modalitate directă
de determinare r². de exprimare a dependenței unei
caracteristici de alta. Dacă se știe că Y
este legat cauzal de X, atunci r² este
proporția variațiilor lui Y datorate
influenței lui X.
Prof.univ.dr.Ion Partachi 19 Prof.univ.dr.Ion Partachi 20

19 20
9/10/2023

Eroarea standard a coeficientului de


Analiza de regresie se efectuează pe corelație se determină prin formula
date de eșantion, astfel încât trebuie
1  r2
verificată semnificația coeficientului
de corelație a eșantionului.  r

n  2 ,

unde n este dimensiunea eșantionului.


Odată cu creșterea numărului de observații

Prof.univ.dr.Ion Partachi 21
n se micțorează r
, iar precizia
Prof.univ.dr.Ion Partachi
 22

Y determinării r crește.
21 22

INDICATORII SINTETICI AI CORELAȚIEI


În cazul în care datele statistice sunt înregistrate pentru un eșantion
extras din populația generală, atunci relația ia forma:

n
n
 (x  X )( y i  Y )
 (x
i
i  X )( y i  Y ) cov( x , y )  i 1

cov( x , y )  i 1 n 1
n
cov(x,y)>0 – corelație directă, ambele variabile x și y tind sa se modifice în
aceiași direcție
cov(x,y)<0 – corelație indirectă, ambele variabile x și y tind sa se modifice în
direcții opuse
cov(x,y)=0 – independența variabilelor x și y
Prof.univ.dr.Ion Partachi 23 Prof.univ.dr.Ion Partachi 24

23 24
9/10/2023

Coeficient de corelaţie

 Puterea asocierii dintre două variabile prin


măsurarea gradului în care punctele unui
grafic de tip scatter (nor de puncte) se întind
de-a lungul unei linii.
 Să se stabilească dacă există o legătură între
variabilele X şi Y (cantitative continue) şi să se
determine o modalitate de a măsura intensitatea
acestei legături.
 Coeficientul de corelatie
Prof.univ.dr.Ion Partachi Prof.univ.dr.Ion Partachi 26

25

25 26

Corelaţia Pearson (r) Corelaţia Pearson (r)


 Scop: cuantifică puterea şi direcţia legăturii
liniare dintre două variabile prin descrierea
direcţiei şi a gradului în care o variabilă este
 H0: coeficientul de corelaţie = 0
r X  XY  Y
X  X Y  Y
 H1: coeficientul de corelaţie ≠ 0
2 2
în relaţie de liniaritate cu cealaltă variabilă de  Testul statistic aplicat pentru
obţinerea semnificaţiei
interes (Pearson, 1896). coeficientului de corelaţie:
Student
 Condiţii de aplicare:
 unde X, Y = valori ale
 Ambele caractere sunt de tip interval sau raţie caracterului pentru
fiecare măsurătoare i (i =
 Ambele variabile urmează o distribuţie normală 1, 2, …, n); Xm, Ym =
şi distribuţia lor comună este bivariată normală medii ale măsurătorilor
celor două caractere.
Prof.univ.dr.Ion Partachi Prof.univ.dr.Ion Partachi

27 28

27 28
9/10/2023

Coeficientul de corelație liniară simplă (r) – măsoară intensitatea Coeficientul de corelație ia valori
(puterea) legăturii liniare dintre două variabile.
între (-1 și +1).
cov( x , y )  Semnul algebric al indicatorului prezintă sensul legăturii
r
 x  y - pozitiv – legătură directă;
- negativ – legătură inversă.
n

 (x  X )
i
2

 Atunci când coeficientul ia valoarea zero, cele două


unde: x  i 1
abaterea medie pătratică a variabilei x
n variabile nu sunt corelate liniar. Valorile intermediare ale
indicatorului ( între 0 și +1) corespund unor intensități
n

(y i  Y )2 diferite ale corelației, de la slab (<0,5)


y  i 1 abaterea medie pătratică a variabilei y
n  până la o legătură puternică (>0,75).
Prof.univ.dr.Ion Partachi 29 Prof.univ.dr.Ion Partachi 30

29 30

Proprietățile coeficientului de corelație Corelograma pentru diferite mărimi ale Coeficientului de


 nu are unitate de măsură
corelație
 ia valorii in intervalul [-1:1]
 r<0 corelație indirectă între variabile Y Y Y
 r>0 corelație directă între variabile
 r=0 independența variabilelor
 cu cit se apropie de valorile extreme cu atât intensitatea corelației
crește X X X
0  r  0 , 25 corelație foarte slabă r = -1 r = -0,6 r=0

0 , 25  r  0 ,5 corelație relativ slabă


Y
Y Y
0 ,5  r  0 , 75 corelație de intensitate medie

0 ,75  r  0 ,95 corelație puternică

0 ,95  r  1
Prof.univ.dr.Ion Partachi
corelație foarte puternică
31 sau funcțională Prof.univ.dr.Ion Partachi
X X X
r = +1 rChap
= 3-32
+0,3 r=0

31 32
9/10/2023

Coeficient de corelaţie Coeficient de corelaţie

Prof.univ.dr.Ion Partachi Prof.univ.dr.Ion Partachi

33 34

33 34

Utilizarea Excel în calcularea Coeficientului de corelație


Coeficient de corelaţie

 Selectați
Tools/Data Analysis
 Alegeți Correlation din
meniul selectat
 Apasați OK . . .

Prof.univ.dr.Ion Partachi Prof.univ.dr.Ion Partachi 36

35

35 36
9/10/2023

Utilizarea Excel în calcularea Coeficientului de corelație TESTAREA SEMNIFICAȚIEI COEFICIENTULUI


DE CORELAȚIE

Testarea semnificației coeficientului de corelație are la bază testul t-Student


și presupune parcurgerea următoarelor etape:

1) Formularea ipotezelor

H0 : r = 0 - nu există corelație între variabile (ipoteza nulă)


H1 : r ≠ 0 - între variabile există corelație (ipoteza alternativă)

2) Se determină valoarea t statistic ||


 Selectați șirul de date și
opțiunile corespunzătoare
tcalc 
 Apăsați OK pentru a obține
1  2
rezultatul
Prof.univ.dr.Ion Partachi 37 Prof.univ.dr.Ion Partachi
n2
38

37 38

3) În funcție de nivelul de semnificație α (α=5% sau o valoare mai mică de


5%) și numărul gradelor de libertate df =n-2, din tabelul valorilor repartiției
Student se preria valoarea critică.

ttab(α/2;n-2)
4) Prin compararea valorilor se ia decizia:

Dacă tcalc ≤ ttab(α/2;n-2) vom accepta ipoteza H0 (vom respinge


H1), între variabile nu există corelație.
Dacă tcalc > ttab(α/2;n-2 vom respinge ipoteza H0 (vom accepta
H1), astfel între variabile există corelație,
deci şi coeficientul de corelaţie este
semnificativ diferit de zero, la un prag de
semnificație de 5%.
Prof.univ.dr.Ion Partachi 39 Prof.univ.dr.Ion Partachi 40

39 40
9/10/2023

Exemplu: Exemplu: Testarea semnificației


coeficientului de corelație continuare
Nr. Salariu Productivita 24747 ,5
angajat (USD) te cov( x , y )   2474 ,75 Există dovezi pentru a afirma că între salariu și productivitate
(articole) 10
există o corelație liniară?
i yi xi cov( x , y )
1 52 400 r ; 1) ipotezele
2 60 385  x  y H0: r = 0 (nu avem o corelație liniară)
3 74 620
2474 ,5 H1: r ≠ 0 (corelație între variabile există)
4 20 155   0,931
5 25 210 147 , 48 18,02 2) t-statistic
6 34 220
|ρ| 0,931
7 49 230 t   7,227
8 38 215 1 ρ 2
1  0,9312
9 45 320 n2 10  2
10 12 70
În baza datelor observate s-a
σ 18,02 147,48
Prof.univ.dr.Ion Partachi
constatat o corelație41directă puternică 3) t-critic
Prof.univ.dr.Ion Partachi 42
pentru  =0,05 și df = 10 - 2 = 8 avem: t0,025;8=2,306

41 42

Exemplu: Decizia testului


continuare Coeficient de determinare r2
|ρ| 0,931 Decizia:
t   7,227 7,227>2,306
1  ρ2 1  0,9312
Respingem H0  Măsura în care variaţia unei variabile poate fi explicată
n2 10  2 variaţiei celei de a doua variabile
Concluzie:  Proporţia prin care variaţia unei variabile poate fi
Cu o încredere de explicată de relaţia liniară cu cealaltă variabilă.
95% putem afirma ca  Defineşte mărimea asocierii
d.f. = 10-2 = 8 între variabile există  Nu defineşte direcţia asocierii
corelație liniară
a/2=0,025 a/2=0,025 directă (ρ=0,93>0)
puternică
(0,75<ρ=0,93<0,95)
Respingem H0 Nu respingem H0 Respingem H0
-tα/2 tα/2
0
-2,306 2,306 43
Prof.univ.dr.Ion Partachi
7,227 Prof.univ.dr.Ion Partachi

44

43 44
9/10/2023

Coeficient de determinare r2
 r2=0 variaţia lui Y nu poate fi atribuită modificărilor lui X
 r2=1 variaţia lui Y este atribuită relaţiei liniare dintre Y şi X
 când r este semnificativ statistic şi r2 este semnificativ
 Într-un studiu de asociere dintre psihoza indusă ce consumul de amfetamine şi nivelul
plasmatic de amfetamine s-a determinat un r=0,94 —› r2=0,942 = 0.8836.
 —› 88% din variaţia psihozei poate fi atribuită variaţiei nivelului plasmatic al
amfetaminei.

Prof.univ.dr.Ion Partachi

45

45

S-ar putea să vă placă și