Sunteți pe pagina 1din 24

CORELAȚIA STATISTICĂ

PLAN:

1. CORELAȚIA DINTRE VARIABILELE ECONOMICE.


CLASIFICARE

2. INDICATORII SINTETICI AI CORELAȚIEI

3.TESTAREA SEMNIFICAȚIEI COEFICIENTULUI DE


CORELAȚIE
CORELAȚIA DINTRE VARIABILELE
ECONOMICE. CLASIFICARE
Statistica studiază relațiile cauzale dintre fenomenele și procesele
economice.
Datorită caracterului complex al fenomenelor şi datorită multitudinii de
factori care intervin, aceste relații de dependență se manifestă sub formă de
tendinţă.
Prin diverse procedee şi metode studiază manifestarea acestor legături,
le poate exprima cantitativ şi măsura intensitatea cu care se produc.

Vom nota prin:


y – variabilă endogenă, dependentă sau rezultativă, adică variabila a cărui
variaţie este influenţată
x – variabila exogenă, independentă sau factorială, adică variabila ce are o
oarecare influenţa aupra variabilei y
Forme de corelații între variabile

A. După numărul variabilelor care se iau în studiu avem:


 Corelație simplă, corelația existentă între două variabile.
(exemplu: corelația între suprafaţa comercială şi valoarea vânzărilor,
corelația dinte productivitate și salariu)

 Corelație multiplă, corelația prin care se analizează intensitatea


legăturii dintre o variabilă rezultativă y și o multitudine de variabile
factoriale x1, x2,…xn (exemplu: corelația dintre producţie, capital şi
forţă de muncă.
Forme de corelații între variabile

B. După direcţia legăturii dintre variabile:


 Corelație directă – când variabilele au tendința de a se modifica în
același sens, adică tendința de creştere respectiv scădere a unei
variabile determină creştere respectiv scădere celeilalte

 Corelație indirectă sau inversă – există atunci când modificarea într-


un anumit sens a unei variabile determină o modificare în sens
contrar a altei variabile.
Forme de corelații între variabile

C. După expresia analitică a relației dintre variabile:


 Corelație liniară – când relația dintre variabilele poate fi exprimată
sau descrisă printr-o funcție liniară (funcția dreptei)
y = a+b*x
 Corelație neliniară sau curblinie – când relația dintre variabilele poate
fi exprimată prin ecuaţia unei curbe (funcție exponenţială,
hiperbolică, parabolică)
y=a*bx
y=a+b*1/x
y=a+bx+cx2
Corelație liniară Corelație neliniară

Y Y

Corelație directă

X X

Y Y

Corelație indirectă

X X
Corelație puternică Corelație slabă

Y Y

Corelație directă

X X

Y Y

Corelație indirectă

X X
Inexistenta corelației

X
INDICATORII SINTETICI AI CORELAȚIEI
Covarianța – exprimă variația simultană a 2 variabile numerice în jurul
mediilor individuale
n

 (x i  X )( yi  Y )
cov( x, y )  i 1
n
cov(x,y)>0 – corelație directă, ambele variabile x și y tind sa se modifice în
aceiași direcție
cov(x,y)<0 – corelație indirectă, ambele variabile x și y tind sa se modifice în
direcții opuse
cov(x,y)=0 – independența variabilelor x și y
Prin dezvoltarea formulei de mai sus obținem relația:

 (x  y )
i i
cov( x, y )  i 1
 X Y
n
Coeficientul de corelație liniar simplu (r) – măsoară intensitatea
(puterea) legăturilor liniare dintre două variabile.

cov( x, y )
r
 x  y

n n

 (x  X )
i
2
x 2
i
unde:  x  i 1
 i 1
 X 2 abaterea medie pătratică a variabilei x
n n

n n

(y i Y ) 2
y 2
i
y  i 1
 i 1
 Y 2 abaterea medie pătratică a variabilei y
n n
Prin dezvoltarea formulei de mai sus obținem relația:

n xi yi   xi  yi
r
[n xi2  ( xi ) 2 ][n yi2  ( yi ) 2 ]
Proprietățile coeficientului de corelație
 nu are unitate de măsură
 ia valorii in intervalul [-1:1]
 r<0 – corelație inversa între variabile
 r>0 – corelație directă între variabile
 r=0 – independența variabilelor
 cu cit se apropie de valorile extreme cu atât intensitatea corelației
crește
0  r  0,25 corelație foarte slabă

0,25  r  0,5 corelație relativ slabă

0,5  r  0,75 corelație de intensitate medie

0,75  r  0,95 corelație puternică

0,95  r  1 corelație foarte puternică sau funcțională


Corelograma pentru diferite mărimi ale Coeficientului de
corelație

Y Y Y

X X X
r = -1 r = -0,6 r=0
Y
Y Y

X X X
r = +1 rChap
= 3-15
+0,3 r=0
Utilizarea Excel în calcularea Coeficientului de corelație

• Selectați
Tools/Data Analysis
• Alegeți Correlation din
meniul selectat
• Apasați OK . . .
Utilizarea Excel în calcularea Coeficientului de corelație

• Selectați șirul de date și opțiunile


corespunzătoare
• Apăsați OK pentru a obține
rezultatul
TESTAREA SEMNIFICAȚIEI COEFICIENTULUI
DE CORELAȚIE

Testarea semnificației coeficientului de corelație are la bază testul t-Student


și presupune parcurgerea următoarelor etape:

1) Formularea ipotezelor

H 0: r = 0 - nu există corelație între variabile (ipoteza nulă)


H 1: r ≠ 0 - între variabile există corelație (ipoteza alternativă)

2) Se determină valoarea t statistic


IrI
t=
1 − r2
n−2
3) În funcție de nivelul de semnificație α (α=5% sau o valoare mai mică de
5%) și numărul gradelor de libertate df = (n–2), din tabelul valorilor
repartiției Student se preia valoarea critică.
tα/2;(n–2)

4) Prin compararea valorilor t se ia decizia:

dacă | t | < tα/2;(n–2) nu vom respinge ipoteza H0 între


variabile nu există corelație
dacă | t | > tα/2;(n–2) vom respinge ipoteza H0 astfel
între variabile există corelație,
deci şi coeficientul de corelaţie
este semnificativ.
Exemplu
Salariu Productivitate
($) (artic.)
yi xi
52 400
60 385 24747,5
74 620 cov( x, y )   2474,75
20 155 10
25 210
34 220
49 230
cov( x, y ) 2474,5
38 215 r   0,931
45 320  x  y 147,48 18,02
12 70
σ 18,02 147,48
În baza datelor observate s-a
constatat o Corelație directă puternică
Exemplu: Testarea semnificației
coeficientului de corelație continuare

Există dovezi pentru a afirma că între salariu și productivitate


există o corelație liniară?
1) ipotezele
H 0: r = 0 (nu avem o corelație liniară)
H 1: r ≠ 0 (corelație între variabile există)

2) t-statistic
IrI 0,931
t= = = 7,227
1 − r2 1 − 0,9312
n−2 10 − 2

3) t-critic
pentru  =0,05 și df = 10 – 2 = 8 t0,025;8=2,306
avem:
Exemplu: Decizia testului
continuare

IrI 0,931
t= = = 7,227
1− r2 1− 0,9312
n−2 10 − 2 Decizia:
7,227>2,306
Respingem H0

d.f. = 10-2 = 8 Concluzie:


Cu o încredere
a/2=0,025 a/2=0,025
de 95% putem
afirma ca între
variabile există o
Respingem H0 Nu respingem H0 Respingem H0
-tα/2
0
tα/2 corelație liniară
-2,306 2,306
7,227
SFÂRȘIT

S-ar putea să vă placă și