Sunteți pe pagina 1din 19

REGRESIE MULTIFACTORIALĂ

1. Concepte generale privind definirea,


specificarea şi identificarea modelului
multifactorial

Sub formă generală, un model multifactorial se


defineşte prin următoarea relaţie:
y = f(xj)+e
unde:
y = variabila endogenă, efect sau rezultativă;
xj = variabilele exogene sau factoriale sau cauzale;
, k = numărul variabilelor exogene;
e = variabila reziduală, aleatoare sau eroare;
f(xj) = funcţia de regresie cu ajutorul căreia vor fi
estimate (aproximate) valorile variabilei y,
determinate numai de influenţa factorilor xj,
consideraţi esenţiali, principali, hotărâtori,
exceptând influenţa celorlalţi factori ai fenomenului
y, care sunt consideraţi factori neesenţiali,
nesemnificativi de explicare a apariţiei şi a evoluţiei
în timp şi în spaţiu a fenomenului y, aceştia fiind
trataţi separat cu ajutorul variabilei reziduale e.
2. Specificarea unui model
econometric

 se face pe baza teoriei economice. Fenomenul economic y


se precizează pe baza conceptelor, definiţiilor şi a relaţiilor
cauză-efect elaborate de către aceasta şi se acceptă
fenomenul xj ca factor esenţial, sau se respinge şi se trece
în categoria factorilor întâmplători prin intermediul variabilei
aleatoare e.
 dimensiunea pachetului de variabile explicative xj depinde
însă şi de banca de date statistice a variabilelor respective,
de cantitatea şi de calitatea acestora.
Exemplu

În economie, modelele multifactoriale au o arie vastă de


aplicare, acestea putând fi utilizate în mai multe situaţii şi
sub diverse forme, ca, de exemplu:
1) Modelarea consumului
C = f (V, P, N) + ε
unde:
C = consumul unui produs sau grupe de produse;
V = venitul pe familie;
P = preţul produsului sau indicele preţurilor grupei de
produse;
N = numărul membrilor unei familii.
Exemplu

2) Funcţia de producţie Cobb-Douglas

Q = f (K, L) + ε

unde:
Q = volumul (valoarea) producţiei;
K = capitalul;
L = forţa de muncă.
Exemplu

3) Modelarea evoluţiei preţurilor

I p = f (I v, I cv, I m) + ε

unde:
I p = indicele preţurilor;
I v = indicele veniturilor (salariilor) consumatorilor;
I cv = indicele cursului valutar;
I m = indicele masei monetare.
3. Estimarea parametrilor modelului

Un model bifactorial se prezintă astfel:

Yi   0  1  X 1i   2  X 2i   i
cu componenta predictibilă:

yˆ i  bˆ0  bˆ1  x1i  bˆ2  x2i

unde:
i=1…n; n = numărul termenilor seriilor statistice;
k = numărul parametrilor (3, în cazul modelului bifactorial).
 MCMMP presupune:

   
n
F bˆ j  min  yi  bˆ0  bˆ1 x1i  bˆ2 x2i
2

i 1

 Minimul acestei funcţii este dat de calculul derivatelor parţiale în


raport cu parametrii modelului:

   
F  bˆ0  0  2 yi  bˆ0  bˆ1 x1i  bˆ2 x2i  1  0 nbˆ0  bˆ1  x1i  bˆ2  x2i   yi
i

ˆ
    0  1i  ˆ
1  1i  b2  x1i x2 i   x1i yi
ˆ
2
F  bˆ1  0  2 yi  bˆ0  bˆ1 x1i  bˆ2 x2i  x1i   0
b x b x
ˆ
 0  2i 1  1i 2 i 2  2 i   x 2 i yi
ˆ ˆ
i

b x  b x x  b x 2

   
F  bˆ2  0  2 yi  bˆ0  bˆ1 x1i  bˆ2 x2i  x2i   0
i

 Sistemul scris în formă matriceală:

 X X   Bˆ   X Y 
Definind cu:

y1
 
y 2
Y  

  vectorul coloană al variabilei dependente (y t) t  1, n de
y 
 n
dimensiune (n, 1);

1 x 
 11 x 21 
 
1 x 12 x 22 
 
X  1 x 13 x 23 
  matricea variabilelor independente (x ) de
.  j j  0, k - 1
 
1 x 1 n x 2 n 
 
 

dimensiune (n, k);


 bˆ0 
 
Bˆ   bˆ1 
  vectorul coloană al coeficienţilor (b j) j  0, k - 1 de
 bˆ 
 2
dimensiune (k, 1);
unde:

 eˆ 1 
 
 eˆ 2 
eˆ   eˆ 3  vectorul coloană al variabilei aleatoare (e t ) t  1, n de
 
 
 
 eˆ n 

dimensiune (n, 1).


 bˆ1 
 
B   X X   X Y    bˆ2 
ˆ 1

 ˆ 
 b3 
3. Verificarea semnificaţiei parametrilor
modelului multifactorial

Estimatorul abaterii medii pătratice (standard


error) al variabilei reziduale:
2
seˆ 
t
e

SSE
 MSE
unde: k reprezintă numărul parametrilor, iar
(n-k) reprezintă numărul gradelor de libertate.
nk nk

Estimatorii abaterilor medii pătratice (standard


error) ale parametrilor:
unde: aij = elementul (j+1) situat pe
s s  a
bˆ j eˆ ij
diagonala principală a matricei
inverse (X’X)-1
Se verifică dacă parametrii bj sunt semnificativ diferiţi de
zero :

H0 :  j  0 ;
 Ipoteze
H1 :  j  0, j  1, k .

 Testul t pentru eşantioane de volum mic n  30 


bˆ j  0
tbˆ  ,
sbˆ j
j

 Regiunea critică:
tbˆ  t 2;n  k
j

 Interval de încredere: bˆ j  t / 2,n  k  sbˆ   j  bˆ j  t / 2,n  k  sbˆ


j j
4. Verificarea semnificaţiei (validităţii)
modelului multifactorial

 Verificarea semnificaţiei modelului econometric multifactorial se face cu ajutorul metodei


analizei dispersionale sau a variaţiei (ANOVA) şi a testului Fisher-Snedecor (F).
 Ipoteze:
toţi coeficienţii de regresie egali cu 0
H0 :
=> R2 nesemnificativ, cele două dispersii sunt aproximativ egale
(SSR=SSE), respectiv influenţa variabilelor exogene X nu este diferită de cea a factorilor
întâmplători, deci modelul nu poate fi validat;

H0 : cel puţin un coeficient de regresie diferit de 0

=> R2 semnificativ, influenţa variabilelor exogene X şi a factorilor


întâmplători – măsurată prin cele două dispersii – diferă semnificativ şi, deci, modelul poate
fi validat.
Testul F:
MSR  yˆ  y    y  yˆ 
 2 2

F  : i i i

MSE k 1 nk

MSR R2 n  k
Fcal   
MSE 1  R k  1
2

 Regiunea critică:
 Dacă Fcalc≤ Fα,k-1,n-k, atunci se acceptă H0 şi deci modelul nu este
semnificativ statistic;
 Dacă Fcalc> Fα,k-1,n-k, atunci se respinge H0 şi se acceptă H1, deci
modelul este semnificativ statistic (valid).
 Corelaţia parţială în eşantion:
 Studiază intensitatea dependenței dintre variabila endogenă și o
parte din variabilele exogene, în condițiile în care celelalte sunt cu
acțiune constantă;
 În cazul a trei variabile y, x1 și x2 coeficientul corelației parțiale
dintre y și x1 când x2 rămâne constant se calculează după relația:

ryx1  ryx2 rx1x2


ryx1 , x2 
(1  r )(1  r
2
yx2
2
x1 x2 )
5. Prognoza

 Estimaţia punctuală a valorii de prognoză pentru


variabila y:
Yn 1  bˆ0  bˆ1 xn 1,1  bˆ2 xn 1, 2

sau
Yn 1  X n 1 Bˆ  X n 1  X X  X Y
1

unde:  1 
 
X n 1   xn 1,1 
x 
 n 1, 2 
 Estimaţia pe interval de încredere pentru variabila
y:

 
P Yn 1  t / 2 sY   Yn*1  Yn1  t / 2 sY   1  
n 1 n 1

unde:

s2
Yn1
2
e 
 s 1  X n 1  X X  X n 1
1

reprezintă dispersia de prognoză.

S-ar putea să vă placă și