Sunteți pe pagina 1din 8

4.

REGRESIA MULTIPLĂ LINEARĂ

În cele mai multe situaţii din teoria economică, evoluţia variabilei rezultative
supusă studiului este influenţătă de mai mulţi factori.

4.1. Regresia multiplă lineară

Regresia multiplă lineară extinde analiza regresiei, utilizând două sau mai
multe variabile independente. Astfel, dacă se ia în consideraţie o variabilă
dependentă (y) şi două variabile independente x1 şi x2 , modelul de regresie
multiplă lineară în formă generală este:

yi    1 x1i   2 x2 i  ui i  1, n (4.1)

unde:
coeficienţii 1 şi  2 sunt numiţi coeficienţi de regresie parţiali şi ei arată
doar influenţa parţială a fiecărei variabile independente, atunci când influenţa
tuturor celorlalte variabile independente este considerată constantă.
ui este termenul de eroare al ecuaţiei.
cu componenta predictibilă:

yˆ i  ˆ  ˆ1 x1i  ˆ2 x2i i  1, n (4.2)

Aplicând metoda celor mai mici pătrate, sistemul de 3 ecuaţii cu 3


necunoscute, pentru determinarea estimatorilor ˆ , ˆ1 , ˆ2 se obţine din minimizarea
funcţiei:

   
n 2
F ˆ , ˆ1 , ˆ2   yi  ˆ  ˆ1 x1i  ˆ2 x2 i (4.3)
i 1

şi anume:

71


 F ˆ , ˆ , ˆ
1 2
 n

 0  2 yi  ˆ  ˆ1 x1i  ˆ2 x2 i  1  0 
 ˆ i 1



 F ˆ , ˆ , ˆ
1 2
 0  2 
n
 
yi  ˆ  ˆ1 x1i  ˆ2 x2 i  x1i   0
 ˆ
 1
i 1



 F ˆ , ˆ , ˆ
1 2
 n

 0  2 yi  ˆ  ˆ1 x1i  ˆ2 x2 i  x2i   0
  2ˆ i 1

sau

 ˆ ˆ n n n

 n     1   x1i  ˆ x   y
2 2i i
i 1 i 1 i 1

 n n n n
(4.4)
ˆ   x1i  ˆ1   x1i  ˆ 2   x1i x 2i   x1i yi
2

 i 1 i 1 i 1 i 1

 n n n n

ˆ   x 2i   1   x1i x 2i   2   x 2i   x 2i yi
ˆ ˆ 2

 i 1 i 1 i 1 i 1

Dacă ecuaţia (4.4)1 se împarte la n şi se folosesc relaţiile care dau mediile


seriilor considerate:

 n

  yi
y 
i 1

 n
 n

  x1i
 x1 
i 1
(4.5)
 n
 n

  x2i
 x2  i 1
 n


atunci poate fi scrisă sub forma:


y  ˆ  ˆ1 x1  ˆ2 x2

72
În ecuaţia (4.4)2 şi (4.4)3 se fac subsituţiile:
S1 y   x12i  nx1 y
 
S11   x1i  nx1
2 i
 S   x x  nx y
 i
 2y 1i 2 i 2

S12   x1i x2i  nx1 x2


i
şi  (4.6)
S yy   yi  ny
2 2
 i

S 22   x22i  nx 2  i

 i
2
S xx   xi2  nx 2
 i

atunci acestea pot fi scrise sub forma:

S1 y  ˆ1 S11  ˆ2 S12 şi S 2 y  ˆ1 S12  ˆ2 S 22 (4.7)

Rezolvarea sistemului astfel obţinut conduce la obţinerea parametrilor sub


forma:

 ˆ S 22 S1 y  S12 S 2 y
1  
 (4.8)
ˆ  S11 S 2 y  S12 S1 y
 2 

unde   S11 S 22  S 122

Cu valorile determinate pentru ˆ1 , ˆ2 din relaţiile (4.7), se poate afla
valoarea lui ̂ şi anume:
ˆ  y  ˆ1 x1  ˆ2 x2 (4.9)

În concluzie, pentru determinarea parametrilor ˆ , ˆ1 , ˆ2 se parcurg


următoarele etape:
 se calculează mediile: y , x1 , x2 ;
n n n
 se calculează sumele:  x12i ,  x22i ,  x1i x2i ;
i 1 i 1 i 1

 se calculează sumele: S11 , S12 , S 22 , S1y , S 2y , S yy ;

 se rezolvă sistemul (4.7) şi se obţin valorile parametrilor ˆ1 , ˆ2 ;

73
 se substiuie valorile obţinute pentru ˆ1 , ˆ2 în relaţia (4.9) şi se determină
valorile lui ̂ .

Pentru suma pătratelor erorilor, din ecuţia de regresie multiplă se obţine:


n

u i
2
 S yy  ˆ1 S1 y  ˆ2 S 2 y
i 1

4.2. Corelaţia multiplă lineară


Pentru a studia intensitatea legăturii dintre o caracteristică dependentă (y) şi
mai multe caracteristici independente utilizând metoda corelaţiei, se calculează
raportul de corelaţie multiplă, cu ajutorul relaţiei:
n n
  yˆ  y    yi  yˆ i 
2 2

i 1
R y , x1 , x 2 ,... x p  n
 1  i n1 (4.10)
  yi  y    yi  y 
2 2

i 1 i 1

care, pentru cazul a două caracacteristici independente devine:

ˆ1 S1 y  ˆ2 S 2 y
R 2
y ,1, 2  (4.11)
S yy
Raportul (coeficientul) de corelaţie multiplă are valori cuprinse între 0 (dacă
nu există legătură între variabilă dependentă şi variabilele independente) şi 1 (dacă
există legătură perfectă).

R y , x1 , x 2 ,... x p  ryx , j  1, p (4.12)


j

Pătratul raportului de corelaţie multiplă este coeficientul de determinaţie


multiplă (R2). El arată proporţia din variaţia totală a variabilei y , care este
explicată prin variabilele independente x1 , x2 ,..., x p .

74
Exemplu 4.1: să se determine ecuaţia de regresie multiplă pentru datele din tabelul
4.1 :
Tabelul 4.1.
y x1 x2 y y x1  x x2  x
30 4 10 0 -1 0
20 3 8 -10 -2 -2
36 6 11 6 1 1
24 4 9 -6 -1 -1
40 8 12 10 3 2

unde y = salariul anual y  30


x1 = anii de educaţie x1  5
x2 = ani de experienţă x2  10

Aplicând relaţiile (4.6), se obţine:


S11 S12 S22 S1y S2y Syy
16 12 10 62 52 272

iar sistemul (4.7) devine:


16  βˆ1  12  βˆ 2  62

12  βˆ1  10  βˆ 2  52
a cărui rezolvare conduce la obţinerea următoarelor valori:
 βˆ1  0,25
 , iar ˆ  y  ˆ1 x1  ˆ2 x2  30   1,25  5,5  23,75
ˆ
 β2  5,5

ˆ1S1 y  ˆ2 S 2 y  0,25  62  5,5  52


R y2,1, 2    0,998
S yy 272

ceea ce indică că variabilele sunt puternic corelate între ele.

În aceste condiţii, ecuaţia de regresie devine:


yˆ  23,75  0,25 x1  5,5 x2

75
Numărul mare de factori economici care influenţează caracteristicile
variabilei face de multe ori imposibilă studierea acţiunii tuturor acestora. De aceea,
de cele mai multe ori se iau în consideratie numai legăturile cele mai importante
dintre caracteristica rezultativă şi factorii studiaţi şi pe baza datelor de selecţie se
determină coeficienţii de corelaţie.
Testarea semnificaţiei raportului de corelaţie multiplă se poate face utilizând
statistica F, definită cu ajutorul relaţiei:

n  p  1 R2
F  (4.13)
p 1  R2

unde p reprezintă numărul variabilelor independente.


Dacă: Fcalculat  F , n p 1 atunci se acceptă ipoteza conform căreia variabilele
x1 , x2 ,...x p au o influenţă semnificativă asupra variabilei rezultative, y .
În afara coeficienţilor de corelaţie simplă şi multiplă, în analiza corelaţiei
dintre variabile se mai pot calcula şi coeficienţii de corelaţie parţială, ce
caracterizează intensitatea legăturii dintre două variabile, în ipoteza că celelalte
variabile rămân constante.
De pildă, în cazul a două variabile independente, coeficientul de corelaţie
parţială între y şi x1 , eliminând influenţa variabilei x2 mai poate fi scris şi sub
forma:
ryx1  ryx2  rx1x2
ry x1x2  (4.14)
1  r   1  r 
2
yx2
2
x1x2

şi coeficientul de corelaţie parţială între y şi x2 ,, eliminând influenţa variabilei x1


este:
ryx2  ryx1  rx1x2
ry x2 x1 
1  r   1  r 
2
yx1
2
x1x2

(4.15)

4.3. Implicaţii statistice în regresia multiplă


Dacă se consideră un model cu două variabile explicative şi cu ipoteza că
erorile sunt normal distribuite, atunci, utilizând şi alte ipoteze statiste se obţine:

 
var ˆ1 
2
S11 1  r122 

76
 
var ˆ2 
2
S 22 1  r122 


cov ˆ1 , ˆ2    2 r122
S12 1  r122 

var ˆ  
2
n
   
 x12 var ˆ1  2 x1 x2 cov ˆ1 , ˆ2  x22 var ˆ2   (4.16)

      
cov ˆ , ˆ1   x1var ˆ1  x2 cov ˆ1 , ˆ2

covˆ , ˆ   x covˆ , ˆ   x var ˆ 


2 1 1 2 2 2

Observaţie: în cazul în care pentru r12 se obţin valori ridicate, atunci


estimarea lui ˆ1 , ˆ2 nu se poate realiza cu multă precizie.

4.4. Predicţie în modelul de regresie multiplă


Fie ecuaţia de regresie estimată :
yˆ i  ˆ  ˆ1 x1  ˆ2 x2 (4.17)
Dacă se consideră că y0 este valoarea prognozată pentru y , dată de
componenta x1,0 a lui variabilei x1 şi respectiv x2,0 pentru x2 , atunci, valoarea
prognozată poate fi determinată cu ajutorul relaţiei:

y0    1 x1,0   2 x2,0  v prev (4.18)

a cărei estimaţie este:

yˆ 0  ˆ  ˆ1 x1,0  ˆ2 x2,0

În acest caz, eroarea de previziune este dată de relaţia:

 
v prev  yˆ 0  y0  ˆ    ˆ1  1 x1,0  ˆ2   2 x2,0   (4.19)

Eroarea de previziune are următoarele proprietăţi ;


i) media erorilor de previziune este nulă ;
ii) varianţa erorilor de previziune est dată de relaţia :

77
var v prev   σ 2  1 
 1
 
  x1,0  x1  var βˆ1 
2

 n (4.20)
 2x1,0    
 x1 x2,0  x2 cov βˆ1 , ˆ2  x2,0  x2  var ˆ2
2

78

S-ar putea să vă placă și