Sunteți pe pagina 1din 22

Probleme rezolvate Bazele Econometriei

Modelul liniar simplu

Problema 1
Un produs a fost propus spre vânzare pe 20 de pieţe (zone geografice) la preţuri diferite, cu
venituri (medii) ale consumatorilor diferite, înregistrându-se valori diferite ale cererii pentru
fiecare piaţă.

Tabelul 1
Nr. crt. Cerere Venit Nr. crt. Cerere Venit

1 11,7 777 11 11,0 814


2 9,3 802 12 7,6 801
3 13,4 635 13 12,6 768
4 16,1 952 14 16,4 965
5 14,5 998 15 9,4 990
6 11,9 988 16 17,6 806
7 9,0 586 17 12,9 820
8 16,1 658 18 5,3 553
9 11,0 520 19 14,6 684
10 15,8 960 20 14,5 756

Notăm: yt = cererea (variabila endogenă) xt = venitul (variabilă exogenă)


Se cere :

1) În ipoteza unui model liniar simplu între cerere şi venit, să se estimeze parametrii
acestuia, să se interpreteze, să se scrie ecuaţia modelului şi să se reprezinte grafic.

2) Să se estimeze cu ajutorul modelului mediile condiţionale şi să se interpreteze una din


valori

3) Să se estimeze reziduurile modelului şi să se interpreteze prima valoare

4) Să se estimeze dispersia modelului şi să se interpreteze

5) Să se estimeze erorile parametrilor â0 şi â1

6) Să se testeze semnificativitatea parametrilor modelului

7) Să se stabilească intervale de încredere la un prag de risc de 95% pentru cei doi


parametri.

8) Să se estimeze coeficientul de determinaţie şi coeficientul de determinaţie ajustat

9) La ce foloseşte testul F (testul Fisher)? Calculaţi şi interpretaţi valoarea găsită pentru


un prag de risc de 95%.
10) Să se facă o previziune a cererii pentru o valoare a venitului de 600

Rezolvare:

1) Un grafic adecvat, de exemplu norul de puncte permite evidenţierea legăturii dintre cele
două variabile:

Figura 1. Legătura liniară dintre cerere şi venit

20

18

16

14

12
cerere (Y)

10

0
400 500 600 700 800 900 1000 1100
venit (X1)

1 20
y  yt  12,535
20 t 1
1 20
x  xt  791,65
20 t 1
20

 (x
t 1
t  x ) 2  435358,6
20

 (x
t 1
t  x )( yt  y )  3396,345
20

cov( x, y ) (x t  x )( yt  y )
 aˆ1   t 1
 0,007801
 x2 20

(x
t 1
t  x) 2

aˆ0  y  aˆ1 x  12,535  0,007801  791,65  6,3591


Desigur aceste calcule se pot face foarte repede, utilizând soft-ware adecvat de statistică şi
econometrie: SPSS, Stata, SAS, Eviews, Limdep, etc.
Interpretare parametri :

 â0 (constanta) – reprezintă nivelul mediu al variabilei y când nivelul variabilei x este
zero. În acest exemplu, la un venit al consumatorilor egal cu zero cererea medie este
6,3591.
 â1 (coeficientul de regresie) – arată cu cât se modifică în medie y la modificarea cu o
unitate a lui x. Dacă valoarea lui â1 este pozitivă înseamnă că legătura dintre x şi y este
una directă ; în caz contrar, legătura este una inversă. În acest exemplu, interpretarea
coeficientului de regresie este următoarea : la o creştere sau scădere a venitului
consumatorului cu o unitate, ne aşteptăm ca cererea să crească sau să scadă în medie
cu 0,007801 unităţi.
Ecuaţia modelului va fi : yˆt  6,359  0,0078  xt
Pentru a reprezenta grafic ecuaţia modelului avem nevoie de coordonatele a două puncte.
Pentru a simplifica calculele, vom determina punctele de intersecţie cu axele :
x  0  y  6,359 - punctul A (0 ;6,359)
y  0  x  815,256 - punctul B (-815,256 ;0)

Figura 2. Reprezentarea grafică a regresiei dintre x şi y

2) Pentru a calcula mediile condiţionale, se va înlocui în ecuaţia estimată la punctul precedent


x cu valorile din tabelul 6.2.
yˆ / x1  6,359  0,0078  777  12,42
yˆ / x2  6,359  0,0078  802  12,615

yˆ / x20  6,359  0,0078  756  12,256
Prima valoare obţinută se interpretează astfel : nivelul mediu al cererii pentru un venit de 777
unităţi monetare este 12,4196.

3) Reziduurile se calculează ca diferenţa dintre valoarea observată şi valoarea estimată a


variabilei y : ˆt  yt  yˆ t

Tabelul 2. Calculul reziduurilor din estimare


Nr. crt. yt yˆt  6,359  0,0078  xt ˆt  yt  yˆ t ˆt2
1 11,7 12,42 -0,72 0,518
2 9,3 12,615 -3,315 10,989
3 13,4 11,312 2,088 4,36
4 16,1 13,785 2,315 5,359
5 14,5 14,143 0,357 0,127
6 11,9 14,065 -2,165 4,687
7 9,0 10,93 -1,93 3,725
8 16,1 11,491 4,609 21,243
9 11,0 10,415 0,585 0,342
10 15,8 13,847 1,953 3,814
11 11,0 12,708 -1,708 2,917
12 7,6 12,607 -5,007 25,07
13 12,6 12,349 0,251 0,063
14 16,4 13,886 2,514 6,32
15 9,4 14,081 -4,681 21,912
16 17,6 12,646 4,954 24,542
17 12,9 12,755 0,145 0,021
18 5,3 10,672 -5,372 28,858
19 14,6 11,694 2,906 8,445
20 14,5 12,256 2,244 5,036

ˆ1  0,72 - în cazul primului consumator, cererea este mai mică cu 0,72 decât cererea medie
înregistrată la consumatorii cu acelaşi nivel al venitului (777 unităţi monetare) din cauza altor
factori.

4) Dispersia modelului este dispersia reziduurilor care se calculează folosind formula de


calcul a dispersiei şi ţinând cont de faptul că media reziduurilor este egală cu zero :
20

 ˆ t
2

178,348
ˆ 2  t 1
  9,9082 - dispersia lui y datorată altor factori
T 2 20  2
ˆ   9,9082  3,15 - cererea se abate în medie de la mediile condiţionale cu 3,15 sub
influenţa altor factori
T

x 2
t
12969553
5) Varianţa estimată a lui â0 : ˆ a2ˆ0  t 1
ˆ 2  9,9082  14,7585
T
20  435358,6
T  ( xt  x ) 2
t 1

şi respectiv eroarea standard ˆ aˆ0  14.7585  3,841681 - valorile lui â0 se abat în medie de
la a0 cu 3,841681
ˆ 2 9,9082
Varianţa estimată a lui â1 : ˆ a2ˆ1  T
  0,000022759
 (x
435358,6
t  x)2
t 1

şi respectiv eroarea standard : ˆ aˆ  0,000022759  0,0047706 - valorile lui â1 se


1

abat în medie de la a1 cu 0,0047706

6) Este foarte important să testăm îndeosebi nulitatea parametrului a1 , deoarece dacă el nu


este semnificativ diferit de 0, variabila « venit » nu poate fi considerată explicativă pentru
variabila endogenă « cerere ». Formulăm o ipoteză nulă, cu alternativa ei:
H 0 : a1  0
H1 : a1  0
Dacă respingem ipoteza H 0 la un prag de semnificaţie  fixat, a1 este considerat
semnificativ diferit de 0. Pragul cel mai adesea utilizat este   0,05 adică un risc de eroare
de 5%.
Cunoaştem că:
aˆ1  a1
urmează o distribuţie Student cu T-2 grade de libertate
ˆ aˆ1
Sub ipoteza H 0 , relaţia devine:
aˆ1  0 aˆ1
  t ˆ care urmează o distribuţie Student cu 20-2=18 grade de libertate.
ˆ aˆ1 ˆ aˆ1 a1
Figura 3 : Distribuţia de eşantionare sub ipoteza H 0

Regula de decizie pentru un prag   0,05 devine:

aˆ1
 dacă  t aˆ1  t n0,05
2 respingem ipoteza H 0 , coeficientul a1 este semnificativ diferit de 0
ˆ aˆ1
(acceptăm a1  0 ), venitul este deci o variabilă explicativă pentru cerere.

aˆ1
 dacă  t aˆ1  t n0,05
2 acceptăm ipoteza H 0 , coeficientul a1 nu este semnificativ diferit de
ˆ aˆ1
0 (acceptăm a1  0 ), venitul nu este deci o variabilă explicativă pentru cerere.
Calculăm:
aˆ1 0,007801
t aˆ1    1,64
ˆ aˆ1 0,0047706
0, 05
t18  2,101
t aˆ1  t18
0, 05
ceea ce înseamnă că din punct de vedere statistic, a1  0 .
Acelaşi demers se poate urma şi pentru coeficientul a0 , dar vom lăsa calculele la latitudinea
cititorului.

7) Pentru construirea intervalului de încredere pentru a1  0 , cunoaştem că:



Prob aˆ1  t ˆ aˆ1  a1  aˆ1  t ˆ aˆ1  1   
Aplicând pentru o probabilitate de 95%:
Prob0,0078  2,101  0,00477  a1  0,0078  2,101  0,00477  95%
Prob- 0,00222  a1  0,01782  95%
Exită deci un risc de 5% ca adevăratul coeficient a1 să se afle în afara intervalului
- 0,00222 ; 0,01782. Valoarea 0 se află în interval, ceea ce ne duce la aceeaşi concluzie ca
mai înainte, respectiv a1  0 .
Acelaşi demers se poate urma şi pentru coeficientul a0 , dar vom lăsa calculele la latitudinea
cititorului.

8) Coeficientul de determinaţie se determină folosind una din formulele de mai jos :


SPE SPR
R2  1
SPT SPT
T T

 ( yˆ  y ) 2  t
2

R2  t 1
T
 1 T
t 1

 ( y  y)
t 1
2
 ( y  y)
t 1
2

Tabelul 4. Analiza varianţei


Sursa variaţiei Suma pătratelor Numărul gradelor de
libertate
Variabila explicativă (X) 20
1
SPE   ( yˆ t  y ) 2  26,4957
t 1

Variabila reziduală (  ) 20 20-2


SPR    t2  178,349
t 1

Total 20 20-1
SPT   ( yt  y ) 2  204,845
t 1

Aşadar, înlocuind în formula de mai sus vom avea :


SPE SPR 26,4957 178,394
R2   1   1  0,1293 - 12,93% din variaţia lui y (a cererii)
SPT SPT 204,845 204,845
este explicată prin intermediul modelului estimat.
Este important de precizat faptul că în cazul modelului liniar simplu coeficientul de
determinaţie se mai poate calcula şi folosind formula :
aˆ 2   2 0,0078012  21767,93
R2  1 2 x   0,1293
y 10,24225
20

(x t  x)2
435358,6
 x2  t 1
  21767,93
20 20
20

( y t  y)2
204,845
 y2  t 1
 10,24225
20 20
Plecând de la relaţia de mai sus şi înlocuind â1 cu formula sa de calcul, se poate arăta că în
cazul modelului liniar simplu coeficientul de determinaţie este egal cu coeficientul de
corelaţie liniară simplă ridicat la pătrat :
  xy
2
  xy2
 2    x2 2
ˆ 2
  2
  x2   xy 
R2  1 2 x   x 
a    2 , unde  este coeficientul de corelaţie
 
y  y2  y2   x y 

T

 (x t  x )( yt  y )
liniară simplă :  xy  xy  t 1
, iar  xy este cov(x,y)
 x y T T

(x
t 1
t  x )   ( yt  y )
2

t 1
2

Coeficientul de determinaţie ajustat ţine cont de gradele de libertate şi are relevanţă mai ales
T în cazul modelului liniar multiplu
  t
2
/(T  k )
T 1
R  1 T
2 t 1
 1  (1  R 2 )
T k
 ( y  y ) 2 /(T  1)
t 1

Înlocuind numeric vom obţine întotdeauna o valoare mai mică decât cea a lui R 2 :
178,349 /( 20  2) 20  1
R 2  1  1  (1  0,1293)  0,08093
204,845 /( 20  1) 20  2

9) Testul F se foloseşte pentru a testa semnificaţia globală sau de ansamblu a parametrilor


unui model. În cazul modelului simplu, testarea semnificaţiei globale coincide de fapt cu
testarea semnificaţiei coeficientului de regresie. Astfel, formulăm o ipoteză nulă, cu
alternativa ei:
H 0 : a1  0
H1 : a1  0
SPE / 1 R2 2
F sau F  
SPR /(T  2) (1  R 2 ) /(T  2) (1   2 ) /(T  2)
26,4957 / 1 0,1293
F  2,67 sau F   2,67
178,349 /( 20  2) (1  0,1293) /( 20  2)
In cazul modelului liniar simplu, valoarea testului F se poate calcula şi după următoarea
T
aˆ12  ( xt  x ) 2
0,0078012  435358,6
formulă : F  t 1
  2,67
ˆ 2 9,9082
Din tabelele cu distribuţia Fisher-Snedecor avem:
18)  4,41
F(10;,05
F *  F(10;,05
18) deci variabila « venit » nu este seminificativă din punct de vedere statistic, deci nu

poate fi considerată ca fiind explicativă pentru variabila endogenă, «cerere »


Observaţie
Cele trei teste sunt echivalente:
H 0 : a1  0 H 0 :  x, y  0 H 0 : SPE  0
 
H1 : a1  0 H1 :  x, y  0 H1 : SPE  0
10) Pentru observaţia de rangul t  1 avem xt 1  600 .
E( y / xt 1 )  yˆ t 1  aˆ0  aˆ1 xt 1  6,359  0,007801 600  11,0396
 
1 (x  x) 2 
Eroarea de estimare este: ˆ y2t 1  ˆ 2   T t 1 
T 2
 t 1
( xt  x )


 1 (600  791,65) 2 
ˆ y2  9,9082
t 1
   1,3313 de unde rezultă că ˆ yt 1  1,1538
 20 435358,6 
Intervalul de încredere pentru yt 1 se scrie:
 
Prob yˆ t 1  tT2ˆ yt 1  yt 1  yˆ t 1  tT2ˆ yt 1  1  
ceea ce pentru o probabilitate de 95% devine:
Prob11,0396  2,09  1,1538  yt 1  11,0396  2,09  1,1538  95%
Prob8,6281  yt 1  13,4511  95%

Problema a fost rezolvată până aici într-o manieră didactică, cu calcule făcute fără a utiliza
programe informatice de specialitate. Prin software-ul Eviews, de exemplu, toate aceste
rezultate sunt furnizate imediat. Informaţiile de bază redate pentru o regresie simplă, fără a
utiliza opţiuni suplimentare sunt următoarele:

Variable Coefficient Std. Error t-Statistic Prob.

C 6.35913 3.84170 1.66 0.115


X 0.007801 0.004770 1.64 0.119

R-squared 0.1293 Mean dependent var 12.535


Adjusted R-squared 0.0810 S.D. dependent var 3.2004
S.E. of regression 3.15
Sum squared resid 178.348
F-statistic 2.67
Prob(F-statistic) 0.1194

În prima parte a tabelului, prima coloană declară variabilele exogene care se regăsesc în
regresie (în exemplul nostru, C=constanta, X=variabila venit), pe cea de-a doua coloană sunt
estimaţiile punctuale ale parametrilor din model (calculate la subpunctul 1), pe cea de-a treia
coloană sunt erorile de estimare ale parametrilor (calculate la subpunctul 5), iar pe ultimele 2
coloane avem statistica calculată Student şi riscul de nulitate al parametrilor (calculate la
subpunctul 6).

În cea de-a doua parte a tabelului avem valorile calculate ale coeficientului de determinaţie,
coeficientului de determinaţie ajustat (calculate la subpunctul 8), eroarea standard a regresiei,
care este de fapt abaterea medie pătratică a reziduurilor, suma pătratelor reziduurilor
(calculate la subpunctul 4), testul F cu probabilitatea asociată (calculat la subpunctul 9), media
şi abaterea medie pătratică a variabilei dependente y.

Se observă că rezultatele din tabel sunt identice cu cele prezentate de noi.

Tabelul de mai sus transpus cu notaţiile pe care le-am folosit are următoarea formă (pentru
fiecare notaţie, formulele au fost prezentate pe parcursul rezolvării):

Variable Coefficient Std. Error t-Statistic Prob.

C â0 ˆ a
0
t â0

X â1 ˆ a
1
t â1

R-squared R2 Mean dependent var y


Adjusted R-squared R2 S.D. dependent var
y
S.E. of regression ˆ 
Sum squared resid  t
2

F-statistic F
Prob(F-statistic)

Problema 2
Un analist este interesat de relaţia dintre cheltuielile cu resursa umană (x) si profitul net (y) a
unor companii din domeniul distribuţiei de produse de larg consum. Acesta extrage aleator un
eşantion de 40 companii, iar în urma prelucrării datelor obţine urmatoarele rezultate:

 ̅ şi ̅ ;̂

 matricea de variaţie şi covariaţie dintre y şi x are elementele:


( );

 matricea de variaţie şi covariaţie a estimatorilor parametrilor modelului de regresie


liniar simplu are elementele : ( );
Se cere:

1) In ipoteza unei relaţii liniare între cele 2 variabile, să se estimeze parametrii


modelului; să se scrie ecuaţia modelului şi să se reprezinte grafic; interpretaţi
coeficientul de regresie.

2) Ştiind că valoarea tabelată Student pentru un anumit prag de risc este 2, să se testeze
dacă coeficientul de regresie diferă semnificativ de 1,2.

3) Găsiţi şi interpretaţi coeficientul de determinaţie şi coeficientul de corelare liniară;


prin ce se deosebesc cei doi din punct de vedere conceptual?

4) Construiţi intervalul de încredere pentru valoarea previzionată a profitului net în cazul


în care cheltuielile cu resursa umană sunt egale cu (valoarea tabelată
Student pentru un anumit prag de risc este 2.

Rezolvare:

  y2 cov( x, y ) 
1) Matricea de variaţie şi covariaţie dintre y şi x are forma  
 cov( x, y )  x2 

Matricea de variaţie şi covariaţie a estimatorilor parametrilor are forma


 ˆ 2
cov(aˆ 0 , aˆ1 ) 
 aˆ0

 cov(aˆ 0 , aˆ1 ) ˆ 2 
 aˆ1 

cov( x, y)  2611312
aˆ1    0,884
 2
x 2954194
aˆ0  y  aˆ1 x  3878,179  (0,884)  5146,34  8427,544
Interpretare parametrii :

 â0 (constanta) – la un nivel al cheltuielilor cu resursa umană egal cu zero, profitul net
mediu este 8427,544 mii lei.
 â1 (coeficientul de regresie) –la o creştere sau scădere a cheltuielilor cu resursa umană
cu o unitate, ne aşteptăm ca profitul net să scadă sau să crească în medie cu 0,884
unităţi (relaţie inversă între variabile deoarece semnul coeficientului este negativ).
Ecuaţia modelului va fi : yˆ t  8427,544  0,884  xt
Pentru a reprezenta grafic ecuaţia modelului avem nevoie de coordonatele a două puncte. Pentru a
simplifica calculele, vom determina punctele de intersecţie cu axele :
x  0  y  8427,544 - punctul A (0 ; 8427,544)
y  0  x  9534,134 - punctul B (9534,134 ;0)

H 0 : a1  1,2
2) Formulăm ipoteza nulă, cu alternativa ei:
H 1 : a1  1,2

Dacă respingem ipoteza H 0 la un prag de semnificaţie  fixat, a1 este considerat


semnificativ diferit de 1,2.
aˆ  a  0,884  1,2
t aˆ1  1 1   46,095
ˆ aˆ1 0,002044
t  2
t aˆ1  t  ceea ce înseamnă că din punct de vedere statistic, a1  1,2 (se acceptă ipoteza H 1 )

aˆ12   x2 (0,884) 2  2954194


3) R 2    0,907 - 90,7% din variaţia profitului net este explicată
 y2 2543701
de acest model
cov( x, y)  2611312
 xy    0,9526 - există o relaţie inversă între variabile de
 x y 2954194  2543701
intensitate puternică
Coeficientul de determinaţie sau coeficientul de corelaţie liniară se mai putea calcula ţinând
cont de relaţia R 2   2 ( 0,907  (0,9526) 2 ).
Între cele două măsuri există diferenţe din punct de vedere conceptual, şi anume : coeficientul
de determinaţie este o măsură parametrică, se calculează în urma estimării unui model între
variabile, model care presupune respectarea unor ipoteze, care consideră că y este o variabilă
aleatoare şi x o variabilă deterministă, în timp ce coeficientul de corelaţie liniară este o măsură
neparametrică, nu se bazează pe estimarea unui model econometric, nu trebuie să respecte nici
o ipoteză, considerând ambele variabile pentru care se calculează ca fiind aleatoare.

4) Intervalul de încredere pentru valoarea previzionată are forma :


 
Prob yˆ t 1  tT2ˆ yt 1  yt 1  yˆ t 1  tT2ˆ yt 1  1  
Pentru a calcula limitele intervalului, trebuie estimate valoarea lui yˆ t 1 şi eroarea medie de
previziune
E( y / xt 1 )  yˆ t 1  aˆ0  aˆ1 xt 1  8427,544  0,884  4000  4891,544
Eroarea de estimare este:
 
1 (x  x) 2 
ˆ y2t 1  ˆ 2   T t 1  . Din acestă formulă nu cunoaştem numitorul. Il vom determina
T 2
 t 1
( xt  x )

din relaţia de calcul a varianţei lui x :
T

(x t  x)2 T
 x2  t 1
  ( xt  x ) 2  T   x2  40  2954194  118167760
T t 1

 1 (4000  5146,34) 2 
ˆ y2  254065
t 1
   9176,978 de unde rezultă că ˆ yt 1  95,7965
 40 118167760 
Prob4891,544  2  95,7965  yt 1  4891,544  2,09  95,7965  1  
Prob4699,951  yt 1  5083,137  1  
Aşadar, la un nivel al cheltuielilor cu resursa umană de 4000, profitul net se situează în
intervalul 4699,951;5083,137cu o probabilitate de garantare de 1   (sau cu un prag de risc
)
Problema 3

Un eşantion de 15 ţări din America Centrală şi de Sud este observat în raport cu venitul
net/locuitor (y – exprimat în sute de dolari) şi ponderea agriculturii în economie (x – exprimat
în procente). In ipoteza unui model econometric liniar între cele 2 variabile, se cunosc
umătoarele informaţii:
15 15 15 15

y
i 1
i  458, x
i 1
i  165, (x
i 1
i  x ) 2  442 ,  ( yi  y ) 2  5859,73 ,
i 1

15 15

 (x
i 1
i  x )( yi  y )  1149, ˆ
i 1
i
2
 2872,85

Se cere:

1) Să se estimeze parametrii modelului econometric liniar simplu; să se scrie ecuaţia


modelului; să se reprezinte grafic; să se interpreteze coeficientul de regresie; cum
explicaţi semnul acestuia în context macroeconomic?

2) Estimaţi cu ajutorul modelului venitul net/locuitor al unei tări a cărei pondere a


agriculturii în economie este de 12%. Care este semnificaţia acestei valori?

3) Estimaţi eroarea medie de estimare a lui a1 şi interpretaţi valoarea găsită. Ştiind că


pentru un prag de risc valoarea teoretică a statisticii Student este 2, testaţi
semnificaţia coeficientului de regresie şi construiţi intervalul de încredere al acestuia;
ce semnifică acest interval de încredere?

4) Găsiţi şi interpretaţi coeficientul de determinaţie.

Rezolvare:
15

cov( x, y )
 (x i  x )( y i  y )
 1149
1) aˆ1   i 1
  2,599
 2 15

 (x
442
x
i  x)2
t 1

aˆ 0  y  aˆ1 x 
y i
 aˆ1 
x i

458
 (2,599) 
165
 59,12
n n 15 15

Interpretare parametri :

 â0 (constanta) – la o pondere a agriculturii în economie egală cu zero, nivelul mediu al


venitului net/loc este 59,12 sute dolari.

 â1 (coeficientul de regresie) – la o creştere sau scădere a ponderii agriculturii în


economie cu o unitate (1 procent), ne aşteptăm ca venitul net/loc să scadă sau să
crească în medie cu 2,599 unităţi (259,9 dolari). Coeficientul fiind negativ, relaţia între
cele două variabile este una innversă. De ce? Pentru că cu cât o ţară este mai puternic
industrializată, adică are o pondere a agriculturii în economie mai mica, cu atât venitul
său net/loc este mai mare, agricultura fiind o ramură economică ce nu aduce o plus
valoare ridicată comparativ cu celelalte industrii.

Ecuaţia modelului va fi : yˆ i  59,12  2,599  xi


Pentru a reprezenta grafic ecuaţia modelului avem nevoie de coordonatele a două puncte. Pentru a
simplifica calculele, vom determina punctele de intersecţie cu axele :
x  0  y  59,12 - punctul A (0 ; 59,12)
y  0  x  22,74 - punctul B (22,74 ;0)

2) yˆ / x  12  59,12  2,599  12  27,93 - în medie, venitul net/locuitor al unei ţări care are o
pondere a agriculturii în economie de 12% este 2793 dolari.

3) Pentru a calcula eroarea standard de estimare a coeficientului de regresie trebuie calculată


mai întâi varianţa reziduurilor:
n

 ˆ t
2

2872,85
ˆ 2  i 1
  220,98
n2 15  2

ˆ 2 220,98
Varianţa estimată a lui â1 : ˆ a2ˆ1  T
  0,49
 (x
442
t  x)2
t 1

şi respectiv eroarea standard : ˆ aˆ  0,49  0,7 - valorile lui â1 se abat în medie de la
1

a1 cu 0,7.
Testarea semnificativităţii coeficientului de regresie :
H 0 : a1  0 aˆ1  a1  2,599  0
t aˆ1    3,71
H 1 : a1  0 ˆ aˆ1 0,7

t  2
t aˆ1  t  ceea ce înseamnă că din punct de vedere statistic, a1  0 (se acceptă ipoteza H 1 , x îl

influenţează pe y)
Intervalul de încredere: Probaˆ1  t ˆ aˆ1  a1  aˆ1  t ˆ aˆ1   1  
Prob 2,599  2  0,7  a1  2,599  2  0,7  1  
Prob- 3,99  a1  -1,19  1  
Seminificaţia intervalului de încredere : adevărata valoare a coeficientului de regresie se
situează în intervalul [-3,99; -1,19] cu o probabilitate de garantare de de 1   (sau cu un prag
de risc  ).

aˆ12   x2
4) Pentru a calcula coeficientul de determinaţie folosim formula : R 2 
 y2

Varianţele lui x şi y sunt necunoscute şi se determină astfel:

n n

 ( xi  x ) 2 442
(y i  y) 2
5859,73
 x2  i 1
  29,47 ;  y2  i 1
  390,65
n 15 n 15
aˆ12   x2 (2,599) 2  29,47
Înlocuind apoi în formula lui R 2 obţinem: R 2    0,51 - 51% din
 y2 390,65
variaţia lui y este explicată de variaţia lui x prin intermediul acestui model.
Modelul liniar multiplu

Problema 1

Presupunem că o variabilă yt este influenţată de factorii x1t , x2t , x3t . Dispunem de 23 de


observaţii cu privire la realizările acestor variabile.

Tabelul 1
Nr. yt x1t x2 t x3 t Nr. yt x1t x2 t x3 t
crt. crt.
1 163 669 17,4 69 13 295 869 10,3 67
2 381 872 10,5 75 14 256 824 17,5 88
3 455 1191 14,3 64 15 309 676 13,0 64
4 451 933 12,5 85 16 286 885 13,2 67
5 373 668 15,3 90 17 379 1179 11,8 60
6 321 733 13,8 61 18 425 1161 13,9 86
7 316 933 15,0 85 19 404 1074 11,5 64
8 410 1165 10,7 74 20 330 775 16,0 89
9 348 932 8,2 70 21 354 752 8,9 76
10 383 840 8,1 66 22 384 740 15,1 85
11 386 901 12,0 87 23 233 590 9,3 62
12 163 669 17,4 64

Se cere:

1) În ipoteza unei legături liniare multiple dintre yt şi factorii x1t , x2t , x3t să se
calculeze estimatorii parametrilor, să se interpreteze aceştia şi să se scrie ecuaţia
modelului.

2) Să se estimeze reziduurile modelului şi să se interpreteze prima valoare.

3) Să se estimeze dispersia modelului şi să se interpreteze.

4) Să se estimeze erorile parametrilor.

5) Să se testeze semnificativitatea parametrilor modelului.

6) Să se stabilească intervale de încredere la un prag de risc de 95% pentru parametrii


modelului.

7) Să se estimeze coeficientul de determinaţie şi coeficientul de determinaţie ajustat.

8) Să se testeze simultan nulitatea tuturor coeficienţilor din modelul de regresie.

1) Estimatorii parametrilor se obţin prin:


aˆ  ( X ' X ) 1 X ' Y
În cazul aplicaţiei noastre avem:
 1 x11 x21 x31   1 669 17,4 69 
   
 1 x12 x22 x32   1 872 10,5 75 
X  
... ... ... ...   ... ... ... ... 
   
1 x
 1T x 2T x3T   1 590 9,3 62 

 y1   163 
   
 y 2   381 
Y   unde T  23 .
... ... 
   
 y   233 
 T  
aˆ  ( X ' X ) 1 X ' Y
1
 1 1 ... 1   1 669 17,4 69   1 1 ... 1   163 
       
 669 872 ... 590   1 872 10,5 75   669 872 ... 590   381 
aˆ     
 17,4 10,5 ... 9,3   ... ... ... ...  17,4 10,5 ... 9,3   ... 
  
 
    
 69 75 ... 62   1 590 9,3 62   69 75 ... 62   233 

 20,530 
 
 0,2643 
â  
- 11,065 
 
 3,1281 
 
Estimatorii parametrilor sunt deci:
aˆ0  20,530

aˆ1  0,2643
aˆ2  11,065
aˆ3  3,1281
Interpretare parametri :

 â0 (constanta) – reprezintă nivelul mediu al variabilei y când nivelul variabilelor


exogene este zero

 â1 (coeficient de regresie parţial) – arată cu cât se modifică în medie y la modificarea


cu o unitate a lui x1 , ceilalţi factori rămânând constanţi. Dacă valoarea lui â1 este
pozitivă înseamnă că legătura dintre x1 şi y este una directă ; în caz contrar, legătura
este una inversă. În acest exemplu, interpretarea următoarea : la o creştere sau scădere
a variabilei x1 cu o unitate, ne aşteptăm ca variabila y să crească sau să scadă în medie
cu 0,2643 unităţi, ceilalţi factori rămânând constanţi.
 â 2 (coeficient de regresie parţial) – analog cu interpretarea precedentă, la o creştere
sau scădere a variabilei x 2 cu o unitate, ne aşteptăm ca variabila y să scadă sau să
crească în medie cu 11,065 unităţi, ceilalţi factori rămânând constanţi.

 â 3 (coeficient de regresie parţial) – la o creştere sau scădere a variabilei x3 cu o


unitate, ne aşteptăm ca variabila y să crească sau să scadă în medie cu 3,1281 unităţi,
ceilalţi factori rămânând constanţi.

Ecuaţia modelului este: yˆ t  20,530  0,2643  x1t 11,065  x 2t  3,1281 x3t

2) Reziduurile se calculează ca diferenţa dintre valoarea observată şi valoarea estimată a


variabilei y : ˆt  yt  yˆ t

Tabelul 2 : Calculul reziduurilor din estimare


Nr. crt. yt yˆ t  20,530  0,2643  x1t 11,065  x 2t  3,1281 x3t ˆt  yt  yˆ t ˆt2

1 163 220.65 -57.65 3323.523


2 381 369.42 11.58 134.096
3 455 377.28 77.72 6040.398
4 451 394.7 56.3 3169.690
5 373 309.32 63.68 4055.142
6 321 252.38 68.62 4708.704
7 316 367.04 -51.04 2605.082
8 410 441.52 -31.52 993.510
9 348 395.09 -47.09 2217.468
10 383 359.37 23.63 558.377
11 386 398.03 -12.03 144.721
12 163 205.01 -42.01 1764.840
13 295 345.82 -50.82 2582.672
14 256 319.95 -63.95 4089.603
15 309 255.55 53.45 2856.903
16 286 317.96 -31.96 1021.442
17 379 389.26 -10.26 105.268
18 425 442.6 -17.6 309.760
19 404 377.34 26.66 710.756
20 330 326.72 3.28 10.758
21 354 358.54 -4.54 20.612
22 384 314.92 69.08 4772.046
23 233 267.5 -34.5 1190.250

ˆ1  57,65 - în cazul primei unităţi statistice, valoarea variabilei y este mai mică cu 57,65
decât valoarea medie a lui y medie înregistrată la unităţile statistice cu acelaşi nivel al
variabilelor x1t , x2t , x3t din cauza altor factori.
3) Dispersia modelului este dispersia reziduurilor care se calculează folosind formula de
calcul a dispersiei şi ţinând cont de faptul că media reziduurilor este egală cu zero :
 ' 1 23
1 23 2
ˆ 2    t 19 
T  k  1 T  k  1 t 1
 2

t 1
t

ˆ 2  2494,055 - dispersia lui y datorată altor factori

ˆ   2494,055  49,95 - y se abate în medie de la mediile condiţionale cu 49,95 sub


influenţa altor factori.

4) Varianţa fiecărui estimator se poate deduce din matricea de varianţe şi covarianţe a


ˆ ˆ  ˆ 2 ( X ' X ) 1
parametrilor:  a 

1
 1 1 ... 1   1 669 17,4 69 
   
ˆ ˆ  ˆ ( X ' X )  2494,055  
  669 872 ... 590   1 872 10 ,5 75 
 2 1

a 
17,4 10,5 ... 9,3   ... ... ... ... 
   
 69 75 ... 62   1 590 9,3 62 

 9656,855 - 3,557957 - 137,9706 - 63,33703 


 
ˆ   - 3,557957 0,0035984 0,049006 - 0,002791 
 â  - 137,9706 0,049006 15,91290 - 1,480421 
 
 - 63,33703 - 0,002791 - 1.480421 1,148658 
 

Pe diagonala principală se află varianţele fiecărui estimator. Extrăgând rădăcina pătrată,


obţinem eroarea medie pătratică a estimatorilor :

 ˆ a2ˆ  9656,855  ˆ aˆ  9656,855  98,269 - valorile lui â 0 se abat în medie de la


0 0

valoarea lui a0 cu 98,269.

 ˆ a2ˆ  0,0035984  ˆ aˆ  0,0035984  0,059 - valorile lui â1 se abat în medie de la


1 1

valoarea lui a1 cu 0,059.

 ˆ a2ˆ  15,91290  ˆ aˆ  15,91290  3,989 - valorile lui â 2 se abat în medie de la


2 2

valoarea lui a 2 cu 3,989.

 ˆ a2ˆ  1,148658  ˆ aˆ  1,148658  1,072 - valorile lui â 3 se abat în medie de la valoarea


3 2

lui a 3 cu 1,072.

5) Pentru a testa seminificativitatea parametrilor la nivel individual vom folosi testul Student.

H 0 : ak  0
Formulăm o ipoteză nulă, cu alternativa ei:
H 1 : ak  0
Dacă valoarea absolută calculată a testului este mai mare decât valoarea teoretică
corespunzătoare, atunci se acceptă ipoteza alternativă. Pentru toate testele cu privire la câte un
parametru, vom avea următoarea valoarea teoretică a testului

tTk 1  t 23
0, 05
 2,093

 Pentru parametrul a0 :
aˆ 0 20,53
t   0,21  2,093 - acceptăm că a0 nu este semnificativ diferit de 0.
ˆ aˆ0 9656,855

 Pentru parametrul a1 :
aˆ1 0,2643
t   4,41  2,093 - acceptăm că a1 este semnificativ diferit de 0.
ˆ aˆ1 0,0035984

 Pentru parametrul a2 :
aˆ 2 11,065
t   2,77  2,093 - acceptăm că a2 este semnificativ diferit de 0.
ˆ aˆ2 15,9129

 Pentru parametrul a3 :
aˆ 3 3,1281
t   2,92  2,093 - acceptăm că a3 este semnificativ diferit de 0.
ˆ aˆ3 1,1486

6) Intervalul de încredere pentru parametri are următoarea formă generală


Prob(aˆ k  tTk 1ˆ aˆk  ak  aˆ k  tTk 1ˆ aˆk )  1  

 Pentru parametrul a0 :
Prob(aˆ0  t19
0, 05
ˆ aˆ0  a0  aˆ0  t190,05ˆ aˆ0 )  0,95
Prob(20,53  2,093  98,2693  a0  20,53  2,093  98,2693)  0,95
Prob( - 185,15  a0  226,21)  0,95

 Pentru parametrul a1 : Prob( 0,1387  a1  0,3898)  0,95

 Pentru parametrul a2 : Prob( - 19,414  a2  -2,715)  0,95

 Pentru parametrul a3 : Prob( 0,884  a3  5,371)  0,95

7) Pentru calculul lui R 2 folosim una din formulele:


SPE SPR
R2   1
SPT SPT
T T

 ( yˆ t  y ) 2  t
2

R2  t 1
T
 1 T
t 1

(y
t 1
t  y) 2 (y
t 1
t  y) 2

Tabelul 3. Analiza varianţei


Sursa variaţiei Suma patratelor Numărul gradelor
de libertate
Variabilele explicative
23
( x1 , x2 ,..., xk ) SPE   ( yˆ t  y ) 2  92924,15 3
t 1

Variabila reziduală 23
SPR    t2  47387,5 19
t 1

23
SPT   ( yt  y ) 2  140311,2
Total 22
t 1

 t
2

47387,05
R2  1  T
t 1
 1  0,6623
(y
140311,2
t  339,35) 2
t 1

Pentru calculul lui R 2 ajustat ( R 2 ), folosim:


T 1
R 2  1 (1  R 2 )
T  k 1
23  1
R 2  1 (1  0,6623)  0,6089 - 60,89% din variaţia lui y este explicată prin
23  3  1
intermediul acestui model.

8) Testarea globală a nulităţii parametrilor se realizează cu ajutorul testului F. Formulăm


ipotezele :
H 0 : a1  a 2  a3  0
H 1 : cel putin un coeficient  0
T 2
 ( yˆ t  y )  / k R2 / k
F *  Tt 1  
 2 (1  R 2 ) /(T  k  1)
 t  /(T  k  1 )
 t 1 
SPE / 3
F*   12,419
SPR / 19
Din tabelele cu distribuţia Fisher-Snedecor avem:
F(k ,T k 1)  F(03,;05
19)  3,13

F *  F(k ,T k 1)  acceptăm ipoteza H 1 , modelul este global explicativ.

Aceleaşi rezultate cu privire la model, obţinute prin software-ul Eviews sunt următoarele:

Variable Coefficient Std. Error t-Statistic Prob.

C 20.529 98.269 0.21 0.837


X1 0.2642 0.05998 4.41 0.000
X2 -11.065 3.9890 -2.77 0.012
X3 3.1280 1.0717 2.92 0.009

R-squared 0.6623 Mean dependent var 339.348


Adjusted R-squared 0.6089 S.D. dependent var 79.861
S.E. of regression 49.95
Sum squared resid 47387.5
F-statistic 12.42
Prob(F-statistic) 0.0001

S-ar putea să vă placă și