Sunteți pe pagina 1din 15

RADU DIANA LAVINIA

PROIECT
ECONOMETRIE

STUDENT: RADU DIANA LAVINIA

GRUPA: 956 C

1|P ag e
RADU DIANA LAVINIA

Cerinte:

Înregistrați pentru cel puțin 15 unități, valorile specifice ale unei perechi de
caracteristici (X si Y) între care există o legătură logică. Datele prezentate sub forma tabelară
fac parte din lucrare.

a) prezentarea problemei;

b) definirea modelului de regresie simpla liniara;

 forma, variabilele si parametrii modelului de regresie


 aproximarea grafica a modelului legăturii dintre variabile

c) estimarea parametrilor modelului;

 estimarea punctuala a parametrilor


 estimarea parametrilor prin interval de încredere

d) testarea ipotezelor clasice asupra modelului de regresie simpla;

 testarea liniarității modelului propus


 testarea normalității erorilor
 testarea ipotezei de homoscedasticitate

2|P ag e
RADU DIANA LAVINIA

Înregistrați pentru cel puțin 15 unități, valorile specifice ale unei perechi de caracteristici
(X si Y) între care există o legătură logică. Datele prezentate sub forma tabelară fac parte
din lucrare.

Pct.a) prezentarea problemei:

Am înregistrat mai jos 16 valori, specifice cheltuielilor totale (caracteristica Y) și


veniturilile totale(caracteristica X) din Romania pentru a evidenția legătura dintre cele
douăcaracteristici. Cele 15 valori sunt din perioada 2005-2020. Datele din tabel au fost
preluate de pe site-ul http://statistici.insse.ro/.

Cheltuieli totale Venituri totale


(Y)/lei (X)/lei

1149.33 1212.18

1304.66 1386.32

1541.96 1686.74

1915.19 2131.67

2047.33 2315.99

2062.95 2304.28

2183.76 2417.26

2244.47 2475.04

2317.4 2559.05

2269.25 2500.72

2351.53 2686.77

2523.99 2944.6

2874.14 3391.67

3666.59 4251.26

4091.83 4789.83

4371.86 5216.38

38916.24 44269.76

3|P ag e
RADU DIANA LAVINIA

Pct.b) definirea modelului de regresie simpla liniara;

Pe baza datelor se poate construi un model econometric unifactorial de forma:

y= f(x) + u

y = variabila dependenta (Cheltuielile totale medii lunare pe o gospodarie);

x = variabila independenta (Veniturilile totale medii lunare pe o gospodarie);

u = variabila reziduală.

6000

5000

4000
CHELTUIELI LUNARE

3000

2000

1000

0
500 1000 1500 2000 2500 3000 3500 4000 4500 5000

VENITURI LUNARE

Din grafic se poate observa ca distribuția punctelor empirice poate fi aproximata cu o


dreapta.

4|P ag e
RADU DIANA LAVINIA

Pct.c) estimarea parametrilor modelului;

ESTIMAREA PUNCTUALA A PARAMETRILOR

Deoarece parametrii modelului sunt necunoscuți, valorile acestora se pot estima cu ajutorul
mai multor momente, in mod curent fiind folosita M.C.M.M.P. Utilizarea metodei pornește
de la următoarea relație:

y t =a+ b x t + ut ; t=1 , n

y t =a^ + b^ x t
^

unde:
^
y t =¿ valorile teoretice ale variabilei „y” obținute numai in funcție de valorile factorului „x”
si de valorile estimatorilor parametrilor „a” si „b”, respectiv „a^ ”si „b^ ”.

Estimațiile valorilor variabilei reziduale:

ut = y t −^
y t =¿

Se determina a^ si b^ :
a^ = 197,4495

b^ = 0,8077

Dispunând de estimațiile parametrilor se pot calcula valorile teoretice (estimate) ale variabilei
endogene ^
y t cu ajutorul relației:

^
y t =197.45+0.8077 x i

Valorile variabilei reziduale se calculează după relația:


ut = y t −^
yt

Pe baza acestor valori se pot calcula abaterea medie pătratica a variabilei reziduale si abaterile medii pătratice
ale celor doi estimatori:

5|P ag e
RADU DIANA LAVINIA

Abaterea medie pătratica a valorii reziduale:

s=
2∑ ( y t − ^y t )
2

u^
n−k

su^ = √ s2u^ =38.672


k= nr. Parametrilor=16

Abaterea medie pătratica a estimatorului a


^:
2 2 1 x2
sa^ =s u^ [ + ]
n ∑ ( x t−x )2

sa^ =√ s ^a=26.172
2

^:
Abaterea medie pătratica a estimatorului b
1
s2b^ =s 2u^
∑ ( xt −x t )2
sb^ =√ s ^b=0.008
2

In urma acestor calcule, modelul econometric se poate scrie:

^
y t =197.45+0.8077 x i su^ =38.6723

(26.172) (0.00879)

Estimarea parametrilor modelului se poate face și cu ajutorul tabelului ANOVA:

  Coefficients Standard Error

197.449510
Intercept 5 26.1720599
0.80770819
X Variable 1 3 0.008790061

Astfel, valorile parametrilor sunt:

a^ = 197,4495

6|P ag e
RADU DIANA LAVINIA

b^ = 0,8077

De asemenea, abaterile medii pătratice (standard error) ale celor doi parametri se regăsesc în
tabelul ANOVA:

S ̂a= 26.172

S ̂b= 0.008

Abaterea medie pătratică a variabilei reziduale( S ̂u ) o găsim în tabelul de regresie:

Regression Statistics

Multiple R 0.999171994
R Square 0.998344675
Adjusted R Square 0.998226437
Standard Error 38.67237219
Observations 16

su^ =38.6723

Prin urmare: ^y t =197.45+0.8077 x i su^ =38.6723

(26.172) (0.00879)

ESTIMAREA PARAMETRILOR PRIN INTERVAL DE INCREDERE

Estimarea prin interval de încredere a parametrilor modelului de regresie liniara.

[
a^ ± t α ∙ sa^
2
; ( n−2) ]
[ b^ ±t α ∙ s ^b ]
; ( n−2 )
2

  Coefficients Standard Error t Stat P-value Lower 95% U


Intercept 197.4495105 26.1720599 7.544286207 2.6921E-06 141.3160248
X Variable 1 0.807708193 0.008790061 91.88879881 7.13881E-21 0.788855386

7|P ag e
RADU DIANA LAVINIA

tα =1.761310
; ( n−2)
2

Astfel, obținem:

a^ =[141.3160248; 253.5829961]

b^ = [0.788855386;0.826560999]

 Testarea semnificației corelației și a parametrilor modelului de regresie

Verificarea semnificației raportului de corelație si, implicit, a coeficientului de corelație


liniara se face cu ajutorul testului Fisher-Snedecor:

R2
F calc=(n−2) 2
1−R

Rx,y este semnificativ daca: F calc ≥ F α ;v 1 ;v 2

F 0,05 ;1; 14=4,6001 (testului Fisher-Snedecor)

Regression Statistics
0.999171
Multiple R 994
0.998344
R Square 675
0.998226
Adjusted R Square 437
38.67237
Standard Error 219
Observations 16

ANOVA
  df SS MS F Significance F
Regression 1 12627773.24 12627773.24 8443.551346 7.13881E-21
Residual 14 20937.73319 1495.552371
Total 15 12648710.97      

Pentru exemplul nostru, avem:

8|P ag e
RADU DIANA LAVINIA

R Square= 0.99834

Fcalc=14*(0.99834/1-0.99834)=8419.735> F 0,05 ;1; 14=4,6001


 Deoarece raportul de corelație este semnificativ diferit de zero cu un prag de
semnificație α =0,05 modelul Ne arată ca modelul descrie dependența dintre
cheltuieli și venituri, explicând în măsură de 99.83% influența factorului
independent asupra variabilei dependente.

 Testarea parametrilor unui model de regresie

Estimatorii sunt semnificativ diferiți de zero, cu un prag de semnificație α =0.05, daca se


verifica următoarele relații:

|a^|
t ^a= >t α ;v
sa^

|b^|
t ^b= >t α ;v
sb^

in exemplul nostru:

197.45
t ^a= =7.5443=¿ t a^ >t 0,05 ;14 =1.761310
26.172

0.8077
t ^b= =100.96=¿ t b^ > t 0,05 ;14 =1.761310
0.008

Pe baza calculelor se observa faptul ca ambii estimatori sunt semnificativ diferiți de zero, cu
un prag de semnificație α =0.05.

Pct.d) Testarea ipotezelor clasice asupra modelului de regresie simpla

Ipoteze statistice clasice asupra modelului de regresie

9|P ag e
RADU DIANA LAVINIA

Această condiție se verifică cu regula celor trei sigma, regula care constă în verificarea
următoarelor relații:

CHELTUIELI VENITURI
LUNARE (Y)   LUNARE(X)  

Mean 2432.265 Mean 2766.86


Standard Standard
Deviation 918.2850308 Deviation 1135.960603

x t ∈( x ± 3 σ x )

y t ∈( y ±3 σ y ) qx=918.285

̅
Din tabel observa ca: y=2766.86

̅x=2432.265 qy=1135.96

x t ∈( x ± 3 σ x ) = Xi=(-641.0218; 6174.74)

y t ∈( y ±3 σ y )=Yi=(-322.59;5187.12)

Aceste două se relații se verifică, întrucât toate valorile veniturilor, cât și cele ale
cheltuielilor se încadrează în intervalele de mai sus, nefiind afectate de erorile de
măsură.

 Testarea liniarității modelului propus

Pentru a verifica ipoteza de liniaritate se calculează coeficientul de corelatie liniara:

Am calculat acest coeficient de corelație liniară în excel cu ajutorul funcției correl, obținând
rx;y=0.99917, care aparține intervalului (0.95; 1], ceea ce indică o legătură directă, foarte
puternică între cheltuielile totale și venituril totale.

Verificarea verosimilitatii modelului se face cu ajutorul analizei dispersionale.

Regression Statistics
Multiple R 0.999171

10 | P a g e
RADU DIANA LAVINIA

994
0.998344
R Square 675
0.998226
Adjusted R Square 437
38.67237
Standard Error 219
Observations 16

Rx;y=√R2 =√ 0.99834=0.99916965

În cazul unei legături liniare, raportul de corelație Rx;y este egal cu coeficientul de corelație r x;y.
Se poate spune că între cele două variabile există o legătură liniară, întrucat:

0.99917~0.99916965

 Testarea normalității erorilor

RESIDUAL OUTPUT

Predict Residu
Observation ed Y als
-
1176.5 27.207
1 37 2
-
1317.1 12.531
2 92 5
-
1559.8 17.883
3 43 2
-
1919.2 4.0268
4 17 3
-
2068.0 20.763
5 94 6
2058.6 4.3146
6 35 56
2149.8 33.869
7 9 78
2196.5 47.910
8 6 4
2264.4 52.984
9 15 84
2217.3 51.948
10 02 46
11 2367.5 -
76 16.045

11 | P a g e
RADU DIANA LAVINIA

7
-
2575.8 51.837
12 27 1
-
2936.9 62.789
13 29 2
3631.2 35.362
14 27 96
4066.2 25.595
15 34 56
-
4410.7 38.902
16 62 4

Cu ajutorul acestor date, testarea ipotezei normalității erorilor se face pe baza următorului
grafic în care pe axa Ox se trec valorile ajustate ale variabilei Y, iar pe axa Oy se trec valorile
variabilei reziduale ut.

Testarea normalității erorilor


60

40

20

0
1000 1500 2000 2500 3000 3500 4000 4500 5000
-20

-40

-60

-80

Din tabel se observă că valorile variabilei reziduale se înscriu în banda construită pentru
𝘢=0.05. Ca urmare, ipoteza de normalitate a variabilei reziduale poate fi acceptată numai cu
acest prag de semnificație(𝘢=0.05).

 Testarea ipotezei de homoscedasticitate

Testarea acestei ipoteze se poate face folosind procedeul grafic(corelogramă) dintre variabila
factorială X și variabila reziduală u, trecând valorile variabilei factoriale pe axa Ox, iar
valorile variabilei reziduale pe O

12 | P a g e
RADU DIANA LAVINIA

Testarea ipotezei de
homoscedasticitate
60

40

20
Residual

0
1000 1500 2000 2500 3000 3500 4000 4500 5000 5500
-20

-40

-60

-80

Deoarece graficul punctelor prezintă o distribuție oscilantă, se poate accepta ipoteza că cele
două variabile sunt independente și nu sunt corelate.

 Testarea ipotezei de autocorelare a erorilor

Putem testa această ipoteză și cu ajutorul testului Durbin-Watson(DW) care constă în


calcularea termenului empiric:

Testul Durbin-Watson (DW) consta in calcularea termenului empiric:


n

∑ (^ut −^ut −1 )2
t =2
d= n

∑ u^ 2t
t =1

si compararea acestei mărimi „d” cu doua valori teoretice d1 si d2, preluate din tabela Durbin-
Watson in funcție de un prag de semnificație α , arbitrar ales, de numărul variabilelor
exogene (k) si de valorile observate n (n≥ 15 ¿.

Acceptarea sau respingerea ipotezei de independenta a erorilor se bazează pe o anumita


regula, care consta in:

 0< d< d 1 → autocorelare pozitiva;

13 | P a g e
RADU DIANA LAVINIA

 d 1 ≤d ≤ d 2 → indecizie;

 d 2 <d < 4−d 2 → erorile sunt independente;

 4−d 2 ≤ d ≤ 4−d 1 → indecizie;

 4−d 1< d< 4 → autocorelare negativa;

Stiind ca:

Pt.ex. (vezi excel)

n=15

∑ ( u^ t −^ut−1 )2 22112.30
d= t =2
n=15
=
20937.7
=1.056098263
∑ u^ 2t
t=1

Această valoare o vom compara cu două valori teoretice d1 și d2, preluate din tabelul Durbin-
Watson pentru un prag de semnificație =0.05, un număr de variabile exogene k=1 și un n=15.

Valorile din tabel sunt:

d1=1.1062

d2=1.3709

14 | P a g e
RADU DIANA LAVINIA

u (t-1) u(t)-u(t-1) (u(t)-u(t-1))^2 u2

      740.23
d=1.056; d1=1,1062; d2=1,3709
-27.21 14.7 215.46 157.0

-12.53 -5.4 28.66 319.8


0<1.056<1,1062 autocorelare
-17.88 13.9 191.91 16.2
pozitiva, deci nu se accepta ipoteza de
independenta a val. var. reziduale
-4.03 -16.7 280.01 431.1

-20.76 25.1 628.74 18.6 Tot pentru a testa ipoteza de


4.31 29.6 873.78 1147.2
autocorelare a erorilor poate fi utilizat și
coeficientul de autocorelație de ordin 1.
33.87 14.0 197.13 2295.4
Coeficientul de autocorelație de ordinul 1
47.91 5.1 25.75 2807.4
este:
52.98 -1.0 1.06 2698.6
n
51.95 -68.0 4623.41 257.5 ∑ u^ t u^ t−1
-16.05 -35.8 1280.71 2687.1 r 1= t=2n −1

-51.84 -10.9 119.88 3942.5


∑ u^ 2t
t =1

-62.79 98.2 9634.00 1250.5


Intre coeficientul de autocorelație de
35.36 -9.8 95.34 655.1
ordinul 1si variabila Durbin-Watson
25.6 -64.5 4160.56 1513.4
exista relația:
  TOTAL 22112.30 20937.7
d
d=2 ( 1−r 1 ) →r 1=1−
2
d
r1=1- 2 => r1= 0.472 Observam că: Valoarea coeficientului de autocorelare este

apropiată de 0, putând astfel să apreciem că erorile nu sunt autocorelate, adică sunt


independente.

15 | P a g e

S-ar putea să vă placă și