Documente Academic
Documente Profesional
Documente Cultură
ECONOMETRIE
Planul cursului
1. Introducere
2. Modelul de regresie liniară simplă
3. Modelul de regresie liniară multiplă
4. Modele de regresie neliniară
5. Ipoteze statistice: normalitatea erorilor,
homoscedasticitatea, necorelarea erorilor,
multicoliniaritatea.
1
1/31/2018
2
1/31/2018
I. Modelul Compound
Y 0 1 e
X
ln Y ln 0 X ln 1
3
1/31/2018
Parametrii modelului:
- β0 este valoarea lui Y pentru X=0. Variabila Y are
numai valori pozitive, deci β0 satisface condiţia β0
>0.
- β1 arată variaţia medie procentuală a lui Y la o
variaţie absolută a lui X cu o unitate. Reprezintă rata
de creştere sau reducere a variabilei Y în raport cu
variabila X.
Observaţii:
- Dacă β1>1, atunci legătura dintre cele două variabile
este directă.
4
1/31/2018
ln b0 x i + ln b1 x i2 = x iln y i
n xi ln yi xi ln yi
ln b1 ;
n xi2 xi
2
ln b0
ln yi xi2 xi xi ln yi
n xi2 xi
2
5
1/31/2018
Interpretare
5. Exemplu
6
1/31/2018
Coefficients
Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
X 1.139 .039 2.488 29.566 .000
(Constant) 15.175 2.726 5.568 .011
The dependent variable is ln(Y).
Rezolvare:
Ecuaţia estimată a legăturii dintre cele două
variabile este:
y xi 15,175 1,139 xi
7
1/31/2018
Interpretare:
- valoarea parametrului β1 arată că la o creştere cu o
mie de lei a investiţiilor (X), producţia (Y) creşte în
medie cu o rată de 0,13 sau cu 13%.
Y e 0 1 X
ln Y 0 1 X
8
1/31/2018
Parametrii modelului:
Exemplu
În urma analizei legăturii dintre valoarea investiţiilor
(mii lei) şi valoarea producţiei (mil. lei) înregistrate pe
un eşantion de 5 firme, folosind modelul Growth, s-au
obţinut următoarele rezultate:
9
1/31/2018
Coefficients
Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
X .130 .034 .912 3.843 .031
(Constant) 2.720 .180 15.142 .001
The dependent variable is ln(Y).
YX e 2 ,720 ,13 X
10
1/31/2018
Y 0 e 1 X e
Ecuaţia se liniarizează prin logaritmare:
ln Y ln 0 1 X
11
1/31/2018
Coefficients
Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
X .130 .034 .912 3.843 .031
(Constant) 15.175 2.726 5.568 .011
The dependent variable is ln(Y).
Ecuaţia estimată:
YX 15,175 e0 ,13 X
Interpretare:
La o creştere a investiţiilor cu o mie de lei,
producţia creşte, în medie, cu 13%.
12
1/31/2018
Y 0 1 ln X
Exemplu
Se consideră legătura dintre valoarea investiţiilor (mii
lei) şi valoarea producţiei (mil. lei).
Coefficients
Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
ln(X) 20.535 3.396 .961 6.047 .009
(Constant) -1.799 5.388 -.334 .760
13
1/31/2018
Y X 1,799 20 ,535 ln X
Interpretare:
La o creştere a investiţiilor cu 1 % producţia creşte, în
medie, cu 0,20535 mil. lei (20,535/100).
Y 0 X 1 e
ln Y ln 0 1 ln X
14
1/31/2018
15
1/31/2018
n ln b0 + b1 ln x i = ln y i , i 1, n
4. Exemplu
În urma prelucrării datelor privind valoarea
producţiei industriale (mil. lei) şi nivelul
investiţiilor nete din industrie (mii lei) în România,
în perioada 1990-2010, s-au obţinut următoarele
rezultate:
16
1/31/2018
Coefficients
Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
ln(X) ,960 ,012 ,999 79,735 ,000
(Constant) 1,603 ,143 11,204 ,000
The dependent variable is ln(Y).
Model Summary
17
1/31/2018
ANOVA
Sum of
Squares df Mean Square F Sig.
Regression 86,240 1 86,240 6357,625 ,000
Residual ,190 14 ,014
Total 86,429 15
The independent variable is X.
Rezolvare:
1. Ecuaţia estimată a modelului putere este:
YX 1,603 X 0 ,960
18
1/31/2018
Interpretare:
Producţia industrială creşte în medie cu 0,96%, la o creştere
cu 1% a investiţiilor nete în industrie.
3. Analiza de corelaţie
Y 0 1 X 2 X 2
La nivelul eşantionului:
YX b0 b1 X b2 X 2
19
1/31/2018
Exemplu
Cost unitar
50.00 Observed
Quadratic
40.00
30.00
20.00
10.00
Productia
20
1/31/2018
Exemplu
În studiul legăturii dintre costul unitar şi producţia
unui bun (sute bucăţi), înregistrate pentru un
eşantion de firme, s-au obţinut următoarele rezultate:
Exemplu
Coefficients
Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
Productia -25.795 3.895 -5.322 -6.623 .000
Productia ** 2 2.114 .351 4.842 6.026 .001
(Constant) 89.041 9.231 9.646 .000
21
1/31/2018
Exemplu
Model Summary
ANOVA
Sum of
Squares df Mean Square F Sig.
Regression 1091.326 2 545.663 27.133 .001
Residual 140.774 7 20.111
Total 1232.100 9
The independent variable is Productia.
Interpretare:
β2>o, deci legătura de tip parabolic admite un punct de
minim.
22
1/31/2018
b. Modelul cubic
Y 0 1 X 2 X 2 3 X 3
În economie acest model este folosit pentru descrierea
relaţiei dintre costul total şi valoarea producţiei.
80
60
40
20
PIB / loc
23
1/31/2018
Coefficients
Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
PIB 2,931 ,071 1,197 41,218 ,000
PIB ** 2 -3,9E-007 ,000 -,361 -4,932 ,000
PIB ** 3 7,73E-014 ,000 ,165 . .
(Constant) -3962,660 11506,083 -,344 ,737
2 p
Y 0 X 1 1 X 2 X p e
Ecuaţia se liniarizează prin logaritmare:
lnY ln 0 1 ln X 1 2 ln X 2 p ln X p
24
1/31/2018
Interpretare:
25
1/31/2018
Y 0 X 1 1 X 2 2 e
unde:
Variabilele modelului sunt:
Y este producţia finală sau output-ul;
X1 sunt fondurile fixe, capitalul sau input-ul;
X2 este forţa de muncă (input).
Coeficienţii modelului:
β0 este nivelul mediu al producţiei (Y) când Xi=1.
26
1/31/2018
Interpretare:
(β1+ β2)<1: un spor al factorilor de producţie generează o
creştere a output-ului dar într-o proporţie mai mică (proces de
producţie cu randament de scară descrescător);
(β1_+ β2)>1: un spor al factorilor de producţie generează o
creştere a output-ului dar într-o proporţie mai mare (proces
de producţie cu randament de scară crescător);
(β1_+ β2) =1: sporul factorilor de producţie generează
creşterea output-ului în aceeaşi proporţie (randament de scară
constant).
27
1/31/2018
Interpretare:
- pentru perioada analizată, dacă se consideră constantă
valoarea capitalului fix (K), atunci o creştere cu un procent a
nivelului variabilei L duce la creşterea medie cu 1,35% a
valorii producţiei obţinute.
- pentru perioada analizată, dacă se consideră constantă
valoarea forţei de muncă (L), atunci o creştere cu un procent a
valorii capitalului fix (K) duce la creşterea medie cu 0,63% a
valorii producţiei obţinute.
28
1/31/2018
ECONOMETRIE
Planul cursului
1. Introducere
2. Modelul de regresie liniară simplă
3. Modelul de regresie liniară multiplă
4. Modele de regresie neliniară
5. Ipoteze statistice: normalitatea erorilor,
homoscedasticitatea, necorelarea erorilor,
multicoliniaritatea.
29
1/31/2018
30
1/31/2018
Decizie
31
1/31/2018
4. Exemplu
Residuals Statisticsa
One-Sample Statistics
Std. Error
N Mean Std. Deviation Mean
Unstandardized Residual 15 ,0000000 73271,63549 18918,65
32
1/31/2018
One-Sample Test
Test Value = 0
95% Confidence
Interval of the
Mean Difference
t df Sig. (2-tailed) Difference Lower Upper
Unstandardized Residual ,000 14 1,000 ,00000000 -40576,5 40576,48
5. Corectarea modelului
Modelul iniţial se corectează cu ajutorul estimaţiei
erorilor calculate la nivelul eşantionului.
Modelul corectat este de forma:
y*i 0 i xi ui
, unde:
y*i yi M ( i )
33
1/31/2018
1. Definire
- ipoteza de homoscedasticitate presupune ca varianţa
erorilor să fie constantă:
V(i ) 2
3. Identificarea heteroscedasticităţii
34
1/31/2018
1
X
0 Residuals
0 5 10 15 20 25 30 35
-1
-2
-3
Etapele testării:
1. Se estimează modelul de regresie de forma:
Y 0 1 X
2. Se calculează erorile estimate ei.
3. Se construieşte un model de regresie pe baza erorilor
estimate în valoare absolută şi variabila
35
1/31/2018
independentă. Exemplu:
i 0 1 xi ui
4. Se testează parametrii acestui model: dacă parametrul α1
este semnificativ, atunci modelul iniţial este
heteroscedastic.
Exemplu:
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 50921,663 12000,771 4,243 ,001
PIB ,016 ,012 ,348 1,337 ,204
a. Dependent Variable: erori
36
1/31/2018
Ipoteze statistice:
H0: ipoteza de homoscedasticitate
H1: ipoteza de heteroscedasticitate
Statistica test: ˆ n 2
t
1 ˆ 2
37
1/31/2018
Regula de decizie:
tcalc>tteor sau o valoare a lui Sig. asociată statisticii test t
Student calculate < 0,05 duce la respingerea ipotezei Ho.
Exemplu:
În studiul legăturii dintre două variabile, X şi Y, s-au obţinut
următoarele rezultate:
Correlations
Unstandardiz
X ed Residual
Spearman's rho X Correlation Coefficient 1,000 ,000
Sig. (2-tailed) . 1,000
N 5 5
Unstandardized Residual Correlation Coefficient ,000 1,000
Sig. (2-tailed) 1,000 .
N 5 5
38
1/31/2018
Rezolvare:
Pentru aceasta, se formulează următoarele ipoteze statistice:
H0: ipoteza de homoscedasticitate
H1: ipoteza de heteroscedasticitate
39
1/31/2018
r 0
r n2 0 52
tcalc 0
1 r 2 10
Regula de decizie:
- pentru exemplul dat:
40
1/31/2018
c. Testul Goldfeld-Quandt
Are la bază ideea că între valorile varianţei erorilor la nivelul
repartiţiilor condiţionate şi valorile variabilei dependente
există o legătură pozitivă de forma:
i2 2 xi2
Ipoteze statistice:
H0: ipoteza de homoscedasticitate
H1: ipoteza de heteroscedasticitate
41
1/31/2018
RSS 2
Fcalc
RSS1
Regula de decizie:
Exemplu:
42
1/31/2018
xi yi
2 15
3 20
1 10
4 19
6 25
5 23
7 30
8 35
9 38
10 40
Rezolvare:
1. Se ordonează crescător şirul valorilor xi.
2. Se împarte seria valorilor xi în două serii: prima serie este
reprezentată de valorile 1, 2, …, 5; iar a doua serie este
reprezentată de valorile 6, 7, …, 10.
43
1/31/2018
Seria 1: Yx=8,3+3X
Seria 2: Yx=3,2+3,8X
44
1/31/2018
7. Interpretare:
4. Corectarea heteroscedasticităţii
4.1. Dacă se cunosc parametrii i2
Corecţia heteroscedasticităţii este aplicată modelului
de regresie liniară simplă:
yi 0 1 xi i
Corectarea heteroscedasticităţii presupune
1
ponderarea modelului iniţial cu variabila .
i
45
1/31/2018
i2 2 xi2
Corectarea heteroscedasticităţii presupune
ponderarea modelului iniţial cu variabila 1/xi.
46
1/31/2018
yi 0
1 i
xi xi xi
i ~ N (0, 2 )
2. Efectele încălcării acestei ipoteze
- ipoteza de normalitate a erorilor este importantă pentru
stabilirea proprietăţilor estimatorilor parametrilor
modelului de regresie.
47
1/31/2018
48
1/31/2018
Exemplu:
Histogram
2,0
1,5
1,0
0,5
0,0
Mean = -1,85E-15
-2 -1 0 1 2 Std. Dev. = 0,943
N = 10
Regression Standardized Residual
49
1/31/2018
b. P-P Plot
Normal P-P Plot of Regression Standardized
Residual
0,6
0,4
0,2
0,0
0,0 0,2 0,4 0,6 0,8 1,0
c. Box-plot
70
65
60
55
50
45
greut
50
1/31/2018
Ipoteze statistice:
H0: ipoteza de normalitate
H1: distribuţia erorilor nu urmează o lege normală
Regula de decizie:
Exemplu:
51
1/31/2018
greut
N 10
Normal Parameters a,b Mean 58,5000
Std. Deviation 7,83511
Most Extreme Absolute ,276
Differences Positive ,161
Negative -,276
Kolmogorov-Smirnov Z ,873
Asymp. Sig. (2-tailed) ,432
a. Test distribution is Normal.
b. Calculated from data.
b. Testul Jarque-Bera
- se bazează pe verificarea simultană a proprietăţilor de
asimetrie şi boltire ale seriei reziduurilor. Pentru o
distribuţie normală, valoarea coeficientului de asimetrie
Fisher (sw) este zero, iar valoarea coeficientului de
boltire Fisher (k) este zero.
Ipoteze statistice
H0: ipoteza de normalitate
H1: distribuţia erorilor nu urmează o lege normală
52
1/31/2018
n 2 k 2
JB sw
6 4
4
k 3
22
ei4
n2
k i
3
e2
( i ) 2
i n2
53
1/31/2018
unde: ei y i y x i
Regula de decizie:
Statistica JB urmează o lege 2 , 2 .
- dacă valoarea calculată a statisticii test JB > 2 ; 2
sau Sig.<0,05, atunci se respinge ipoteza Ho.
Exemplu.
Descriptive Statistics
54
1/31/2018
ECONOMETRIE
109
b. Coeficientul de autocorelaţie
- coeficientul de autocorelaţie între erorile εi şi εi-1 ale
unui model de regresie se calculează după
110
55
1/31/2018
111
112
56
1/31/2018
(ˆ ˆ i i 1 )2
DW d i 2
ˆ i 1
i
2
113
ˆ i 2 ˆ i ˆ i 1 ˆ i 1
2 2
ˆ i ˆ i ˆ i 1
2 ˆ i ˆ i 1
d i i i
2 i i
2 1 i 2 2 ( 1 ˆ )
ˆ i ˆ i ˆ i
2 2
i i i
114
57
1/31/2018
Interpretare:
Dacă ˆ 1 d 0 , atunci există autocorelare pozitivă
maximă a erorilor;
Dacă ˆ 1 d 4 , atunci există autocorelare negativă
maximă a erorilor;
Dacă ˆ 0 d 2 , atunci nu există autocorelare.
115
Regula de decizie:
Valorile teoretice ale statisticii DW sunt calculate şi tabelate
în funcţie de pragul de semnificaţie, de volumul eşantionului
şi de numărul de parametri ai modelului.
116
58
1/31/2018
117
Exemplu:
În studiul legăturii dintre două variabile, X şi Y, observate
pentru un eşantion format din 25 unităţi statistice, s-a estimat
un model de regresie liniară simplă şi s-au obţinut
următoarele rezultate:
118
59
1/31/2018
Model Summaryb
119
120
60
1/31/2018
Ipoteze statistice
H0: k este distribuit normal (nu există autocorelare a erorilor)
H1: k nu este distribuit normal (ipoteza este încălcată)
121
n1 n2
M( k ) 2 1
n1 n2
2n1n2 n1 n2
sk2 2n1n2
( n1 n2 ) 2 ( n1 n2 1)
122
61
1/31/2018
cu n1 + n2 = n .
Regula de decizie:
- dacă |tcalc| ta/2,n-2 , atunci se acceptă ipoteza H0.
123
Exemplu:
Pentru două variabile, X şi Y, s-au obţinut următoarele
rezultate: Runs Test 2
Unstandardiz
ed Residual
Test Valuea ,0000000
Cases < Test Value 17
Cases >= Test Value 15
Total Cases 32
Number of Runs 3
Z -4,849
Asymp. Sig. (2-tailed) ,000
a. Mean
62
1/31/2018
YX1 , Xp 0 1 X1 2 X 2 p X p
a.1. Coliniaritate perfectă
126
63
1/31/2018
1 X 1 2 X 2 p X p 0
unde: λi, cu i=1, ..., p, valori constante care nu sunt toate, în mod
simultan, nule.
127
1 X 1 2 X 2 p X p u 0
128
64
1/31/2018
b. Efectele coliniarităţii
Varianţa estimatorilor parametrilor modelului de regresie
creşte, adică estimatorii pierd proprietatea de eficienţă.
În cazul unei coliniarităţi perfecte, varianţa estimatorilor este
infinită (parametrii modelului nu pot fi estimaţi).
În cazul unei coliniarităţi imperfecte, varianţele estimatorilor
sunt mari.
129
c. Testarea coliniarităţii
c.1. Folosind procedee grafice
20,00
15,00
X2
10,00
5,00
R Sq Linear = 1
0,00
X1
130
65
1/31/2018
20,00
15,00
X2
10,00
5,00
X1
131
132
66
1/31/2018
Interpretare:
Atunci când legăturile dintre variabilele independente sunt
puternice, valoarea raportului de determinaţie se apropie de
unu, iar raportul VIF este infinit.
133
2. Toleranţa (Tolerance)
- se calculează după relaţia: TOL=1/VIF=1-R2j
Interpretare:
- Dacă valoarea TOL=1, atunci nu există coliniaritate;
- Dacă valoarea TOL=0, atunci există coliniaritate perfectă.
134
67
1/31/2018
d. Corectarea coliniarităţii
metodele de corecţie ţin cont de tipul de coliniaritate, de
numărul de variabile din model şi de informaţiile
suplimentare despre fenomenul studiat.
Cea mai simplă metodă constă în eliminarea variabilei care
introduce coliniaritatea.
Altă metodă constă în construirea unui model cu variabile
transformate prin diverse funcţii sau operatori (de exemplu,
operatorul decalaj, diferenţă).
135
Exemplu:
În urma analizei legăturilor dintre variabilele independente ale
unui model de regresie, s-au obţinut următoarele rezultate:
Coefficientsa
Unstandardized Standardized
Coefficients Coefficients Collinearity Statistics
Model B Std. Error Beta t Sig. Tolerance VIF
1 (Constant) 65,705 27,731 2,369 ,037
X1 48,979 10,658 ,581 4,596 ,001 ,950 1,052
X2 59,654 23,625 ,359 2,525 ,028 ,753 1,328
X3 -1,838 ,814 -,324 -2,258 ,045 ,738 1,355
a. Dependent Variable: Y
136
68