Sunteți pe pagina 1din 23

Curs 5

Regresia liniară multifactorială


Sub formă generală, un model multifactorial de
regresie se defineşte prin următoarea relaţie:

y = f(xj)+𝜺
unde:
y = variabila endogenă, efect sau rezultativă;
xj = variabilele exogene, factoriale sau cauzale;
𝜺 = variabila reziduală, aleatoare sau eroare.
Descrierea modelului:
f(xj) = funcţia de regresie cu ajutorul căreia
vor fi estimate (aproximate) valorile variabilei y,
determinate numai de influenţa factorilor xj,
consideraţi esenţiali, principali, hotărâtori,
exceptând influenţa celorlalţi factori ai
fenomenului y, care sunt consideraţi factori
neesenţiali, nesemnificativi de explicare a apariţiei
şi a evoluţiei în timp şi în spaţiu a fenomenului y,
aceştia fiind trataţi separat cu ajutorul variabilei
reziduale 𝜺.
În economie, modelele multifactoriale au o arie vastă de
aplicare, acestea putând fi utilizate în mai multe situaţii şi
sub diverse forme, ca, de exemplu:

1) Modelarea venitului
În medie ne-am aştepta ca la un nivel mai ridicat de
educaţie, nivelul venitului să crească:
venit = bo + b1educaţie + 
Dar în acest caz nu se tine seama de faptul că venitul
depinde şi de vârstă:
venit = bo + b1educaţie +b2vârstă + 
care este un model liniar multifactorial.
2) Modelarea consumului

C = f (V, P, N) + ε
unde:
C = consumul unui produs sau grupe de produse;
V = venitul pe familie;
P = preţul produsului sau indicele preţurilor grupei
de produse;
N = numărul membrilor unei familii.
3) Funcţia de producţie Cobb-Douglas

Q = f (K, L) + e
unde:
 Q = volumul (valoarea) producţiei;
 K = capitalul;
 L = forţa de muncă.
Un model multifactorial, în formă generală, se
prezintă astfel:
𝒚𝒊 = 𝒃𝟎 + 𝒃𝟏 ∙ 𝒙𝒊𝟏 + 𝒃𝟐 ∙ 𝒙𝒊𝟐 + ⋯ + 𝒃𝒋 ∙ 𝒙𝒊𝒋 + ⋯ + 𝒃𝒑 ∙ 𝒙𝒊𝒑 + 𝜺𝒊

unde:
 i = 1,…, n
 n= numărul termenilor seriei;
 p = numărul variabilelor exogene.
 Expresia analitică:

𝒚𝟏 = 𝒃𝟎 + 𝒃𝟏 ∙ 𝒙𝟏𝟏 + 𝒃𝟐 ∙ 𝒙𝟏𝟐 + ⋯ + 𝒃𝒑 ∙ 𝒙𝟏𝒑 + 𝜺𝟏


𝒚𝟐 = 𝒃𝟎 + 𝒃𝟏 ∙ 𝒙𝟐𝟏 + 𝒃𝟐 ∙ 𝒙𝟐𝟐 + ⋯ + 𝒃𝒑 ∙ 𝒙𝟐𝒑 + 𝜺𝟐
…………………………………………………………
𝒚𝒏 = 𝒃𝟎 + 𝒃𝟏 ∙ 𝒙𝒏𝟏 + 𝒃𝟐 ∙ 𝒙𝒏𝟐 + ⋯ + 𝒃𝒑 ∙ 𝒙𝒏𝒑 + 𝜺𝒏

 Scrierea sub forma matriceala:

Y = X·B + E
 unde:
y 
 1

y 2 
vectorul coloana al variabilei
Y 
  endogene, de dimensiune n x 1
 
y 
 n 

1 x 11 x 1 p 
 
1 x 21 x 2 p  matricea variabilelor

X  1 x 31 x 3 p
 exogene, de dimensiune

  n x (p+1)
 
1 x n1 x n p 
 
b 0 
 
b 1 
 
B   b 2  vectorul coloana al parametrilor, de
   dimensiune (p+1) x 1
 
b p 
𝜀1
𝜀2
vectorul coloana al variabilei
𝐸= 𝜀3
⋮ aleatoare, de dimensiune n x 1
𝜀𝑛
 Scrierea matriceala:
Y = X·B + E
este echivalenta cu:
 y 1  1 x 11 x 1 p   b 0   e1 
     
 y 2  1 x 21 x 2 p   b 1  e 2 
            
       
 y  1 x  x  b  en 
  
n n1 np    p  
( n  1) n  ( p  1) ( p  1) 1 ( n  1 )
 Funcţia de regresie corespunzătoare
modelului, scrisă sub forma unei ecuaţii
matriceale, este:
Yˆ  X  B̂
 Reziduurile 𝑒𝑖 (estimaţiile variabilei aleatoare)
se definesc astfel:

𝐸 =𝑌 − 𝑌 =𝑌 −𝑋∙𝐵
unde: Yˆ = valorile estimate (ajustate) ale variabilei Y.
Metoda celor mai mici patrate presupune
minimizarea sumei patratelor erorilor:
2 ′ ′
F 𝐵 = min 𝑒 = min 𝐸 𝐸 = min 𝑌 − 𝑋 ∙ 𝐵 𝑌−𝑋∙𝐵


 min Y Y  2B  X Y   B  X X  B 
Egaland cu zero derivatele partiale in raport cu
estimatorii, obtinem:
F B 
 0  2 X Y   2 X X  B  0   X X Bˆ  X Y
B
 X X  1
 X X B   X X   X Y 
 1
 Estimatorii parametrilor modelului de regresie
multifactoriala sunt calculati pa baza relatiei:
 bˆ1 
 
 bˆ 
Bˆ   X X   X Y    
1 2


 
 bˆ 
 p
 Pentru a interpreta semnificaţia parametrilor modelului de
regresie considerăm modelul:
𝑦𝑖 = 𝑏0 + 𝑏1 ∙ 𝑥1𝑖 + ⋯ + 𝑏𝑝 ∙ 𝑥𝑝𝑖
 Atunci, dacă x2, … xp sunt constante se obţine:
∆𝑦𝑖 = 𝑏1 ∆𝑥1𝑖
 Rezolvând ecuaţia de mai sus se obţine că estimatorul
parametrului b1 este rata marginală de substituţie a
variabilei endogene în raport cu variabila exogenă X1:
∆𝑦𝑖
𝑏1 =
∆𝑥𝑖
Coefcientul 𝑏1 arata cu cate unitati se modifica in medie
Y daca X1 se modifica cu ∆𝑥𝑖1 unitati, in conditiile in care
celalalte variabile X2, …, Xp raman constante.
 Ipotezele: H0: 𝑏𝑗 = 0
H1: 𝑏𝑗 ≠ 0, cu j = 1,…, k (k=nr parametri)
 Testul statistic:
𝑏𝑗
𝑡𝑐𝑎𝑙𝑐 =
𝑠𝑏𝑗
 Regiunea critica
𝑡𝑐𝑎𝑙𝑐 >𝑡𝛼,𝑛−𝑘
2

 Intervalele de incredere
bˆ j  t / 2,n k  sbˆ  b j  bˆ j  t / 2,n k  sbˆ
j j
 Estimatorul abaterii medii pătratice (standard error) al
variabilei reziduale:

unde: k reprezintă numărul parametrilor, iar (n-k) reprezintă numărul


gradelor de libertate

 Estimaţiile abaterilor medii pătratice (standard error) ale


parametrilor:

unde: aij = elementul (j+1) situat pe


diagonala principală a matricei (X’X)-1
 Verificarea semnificaţiei modelului econometric multifactorial se face
cu ajutorul metodei analizei dispersionale (ANOVA) şi a testului Fisher-
Snedecor (F).
Ipotezele:
H0: 𝒃𝒋 = 𝟎 (toţi coeficienţii de regresie egali cu 0)
 R2 nesemnificativ, cele două dispersii sunt aproximativ
egale (MSR=MSE), respectiv influenţa variabilelor exogene
X nu este diferită de cea a factorilor întâmplători, deci
modelul nu poate fi validat
H1: ∃ 𝒃𝒋 ≠ 𝟎 (cel puţin un coeficient de regresie e diferit de 0)
 R2 semnificativ, influenţa variabilelor exogene X şi a
factorilor întâmplători – măsurată prin cele două dispersii
– diferă semnificativ şi, deci, modelul poate fi validat.
 Testul F:

 Regiunea critică:
Sursa Suma pătratelor Grade de libertate Media pătratelor Testul Fisher
variaţiei (SS-Sum of (df- degree of (MS- Mean of (testul F)
Squares) freedom) Squares)
Datorată
 
n
SSR MSR
SSR   yˆ i  y
2
regresiei k-1 MSR  Fcalc 
i 1 k 1 MSE
Reziduală n
SSE
SSE    yi  yˆ i  MSE 
2
n–k
i 1 nk
Totală
 
n
SST   yi  y
2
n–1
i 1

unde: k – numarul de parametri


n – numarul de observatii
Pentru α = 0,05

Puteti gasi valorile critice


pentru alte praguri de
semnificatie la adresa:
http://www.stat.ufl.edu/~a
a/sta6126/tables.pdf
 Estimaţia punctuală a valorii de prognoză pentru
variabila y:
 Estimaţia pe interval de încredere pentru variabila y:

S-ar putea să vă placă și