Cursuri Pentru Econometrie Sesiune

1/31/2018
ECONOMETRIE
Planul cursului
1. Introducere
2. Modelul de regresie liniară simplă
3. Modelul de regresie liniară multiplă
4. Modele de regresie neliniară
5. Ipoteze statistice: normalitatea erorilor,
homoscedasticitatea, necorelarea erorilor,
multicoliniaritatea.
1
1/31/2018

4.1. Tipuri de modele
4.2. Modele liniarizabile
4.3. Modele polinomiale
4.4. Modele neliniare multiple
4.1. Tipuri de modele neliniare

 Putem distinge două mari clase de modele neliniare:
I. Modelele liniarizabile sunt acele modele neliniare care se
pot transforma în modele liniare prin logaritmare sau alte
transformări: modele semi-logaritmice şi modelul putere.
II. Modele polinomiale sunt acele modele care exprimă relaţia

dintre variabilele X şi Y cu ajutorul unui polinom de gradul
2, 3, etc.
2
1/31/2018
4.2. Modele liniarizabile

a. Modele semi-logaritmice
a.1 Modele cu variabila dependentă logaritmată

I. Modelul Compound (compus)
II. Modelul Growth (de creştere)
III. Modelul exponenţial
a.2 Modele cu variabila independentă logaritmată:

modelul Logarithmic.
I. Modelul Compound
1. Forma generală a modelului:
Y   0  1  e
X
Ecuaţia se liniarizează prin logaritmare:
ln Y  ln  0  X  ln 1  
3
1/31/2018
Parametrii modelului:
- β0 este valoarea lui Y pentru X=0. Variabila Y are
numai valori pozitive, deci β0 satisface condiţia β0
>0.
- β1 arată variaţia medie procentuală a lui Y la o
variaţie absolută a lui X cu o unitate. Reprezintă rata
de creştere sau reducere a variabilei Y în raport cu
variabila X.
Observaţii:
- Dacă β1>1, atunci legătura dintre cele două variabile
este directă.
- Dacă 0<β1<1, atunci legătura dintre cele două

variabile este indirectă.
4
1/31/2018
2. Estimarea parametrilor modelului

2
Se face prin MCMMP:  ei  min im
Sistemul de ecuaţii normale:

n ln b0 + ln b1  xi =  ln yi , i  1,n
ln b0  x i + ln b1  x i2 =  x iln y i
n xi ln yi   xi  ln yi
ln b1  ;
n xi2   xi 
2
ln b0 
 ln yi  xi2   xi  xi ln yi
n xi2   xi 
2
5
1/31/2018
 Valorile estimaţiilor b0 şi b1 sunt prezentate în output-ul

Coefficients, coloana Unstandardized Coefficients.
3. Testarea semnificaţiei parametrilor

 Ipoteze
 Interpretare
4. Intensitatea legăturii dintre variabile

Exemplu: raportul de determinaţie (R square).
5. Exemplu
În urma analizei legăturii dintre valoarea investiţiilor (mii

lei) şi valoarea producţiei (mil. lei) înregistrate pe un
eşantion de 5 firme, folosind modelul Compound, s-au
obţinut următoarele rezultate:
6
1/31/2018
Coefficients
Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
X 1.139 .039 2.488 29.566 .000
(Constant) 15.175 2.726 5.568 .011
The dependent variable is ln(Y).
Rezolvare:
Ecuaţia estimată a legăturii dintre cele două
variabile este:
y xi  15,175  1,139 xi
Logaritmând ecuaţia de mai sus, se obţine:

lnyxi=ln15,175+xiln1,139=2,719+0,13xi
7
1/31/2018
Interpretare:
- valoarea parametrului β1 arată că la o creştere cu o
mie de lei a investiţiilor (X), producţia (Y) creşte în
medie cu o rată de 0,13 sau cu 13%.
3. Estimarea şi testarea intensităţii legăturii dintre

variabile

 Forma generală a modelului:
Y  e 0  1 X 
ln Y   0   1  X  
8
1/31/2018
- eβ0 este valoarea medie a lui Y pentru X=0.

variaţie absolută a lui X cu o unitate.
Exemplu
În urma analizei legăturii dintre valoarea investiţiilor
(mii lei) şi valoarea producţiei (mil. lei) înregistrate pe
un eşantion de 5 firme, folosind modelul Growth, s-au
obţinut următoarele rezultate:
9
1/31/2018
Coefficients
X .130 .034 .912 3.843 .031
(Constant) 2.720 .180 15.142 .001
Ecuaţia estimată a legăturii dintre cele două variabile

este:
YX  e 2 ,720 ,13 X
Logaritmând ecuaţia de mai sus, se obţine:

lnYX=2,72+0.13X
10
1/31/2018
 Forma generală a modelului:
Y  0  e 1 X  e
ln Y  ln 0  1  X  

- β0 este valoarea medie a lui Y pentru X=0.

variaţie absolută a lui X cu o unitate.
11
1/31/2018

Exemplu
Se consideră legătura dintre valoarea investiţiilor (mii lei) şi
valoarea producţiei (mil. lei).
Coefficients
X .130 .034 .912 3.843 .031
(Constant) 15.175 2.726 5.568 .011
 Ecuaţia estimată:
YX  15,175  e0 ,13 X
Interpretare:
 La o creştere a investiţiilor cu o mie de lei,
producţia creşte, în medie, cu 13%.
12
1/31/2018
a.2 Modele cu variabila independentă logaritmată

Modelul Logarithmic
 Forma generală a modelului:
Y  0  1  ln X  
- β0 este valoarea medie a lui Y pentru X=1.

- β1 arată variaţia medie absolută a lui Y la o
variaţie procentuală a lui X cu o unitate.
Exemplu
Se consideră legătura dintre valoarea investiţiilor (mii
lei) şi valoarea producţiei (mil. lei).
Coefficients
ln(X) 20.535 3.396 .961 6.047 .009
(Constant) -1.799 5.388 -.334 .760
13
1/31/2018
 Ecuaţia estimată a legăturii dintre cele două variabile este:
Y X  1,799  20 ,535  ln X
Interpretare:
 La o creştere a investiţiilor cu 1 % producţia creşte, în
medie, cu 0,20535 mil. lei (20,535/100).
b. Modelul de tip putere (Power) (log-liniar)

1. Forma generală a modelului:
Y  0  X 1  e
ln Y  ln  0  1  ln X  
14
1/31/2018
 În modelul putere, parametrul β1 este elasticitatea variabilei

dependente Y în raport cu variabila independentă X.
• Elasticitatea unei variabile Y în raport cu o altă variabilă X

reprezintă modificarea relativă (procentuală) a variabilei Y la
o modificare relativă (procentuală) a lui X cu o unitate.
Elasticitatea poate fi determinată prin relaţia:

Y
 100
% mod if . Y Y X
E  Y  
% mod if . X X X Y
 100
X
15
1/31/2018
2. Estimarea parametrilor modelului

 Prin MCMMP
n ln b0 + b1  ln x i =  ln y i , i  1, n
ln b0  ln xi + b1  (ln xi )2 = ln xiln y i
4. Exemplu
În urma prelucrării datelor privind valoarea
producţiei industriale (mil. lei) şi nivelul
investiţiilor nete din industrie (mii lei) în România,
în perioada 1990-2010, s-au obţinut următoarele
rezultate:
16
1/31/2018
Coefficients
ln(X) ,960 ,012 ,999 79,735 ,000
(Constant) 1,603 ,143 11,204 ,000
Model Summary
Adjusted Std. Error of

R R Square R Square the Estimate
,999 ,998 ,998 ,116
The independent variable is X.
17
1/31/2018
ANOVA
Sum of
Squares df Mean Square F Sig.
Regression 86,240 1 86,240 6357,625 ,000
Residual ,190 14 ,014
Total 86,429 15
The independent variable is X.
Rezolvare:
1. Ecuaţia estimată a modelului putere este:
YX  1,603  X 0 ,960
Prin logaritmare se obţine:
ln YX  ln 1,603  0 ,960  ln X  0 ,472  0 ,960  ln X
18
1/31/2018
Interpretare:
 Producţia industrială creşte în medie cu 0,96%, la o creştere
cu 1% a investiţiilor nete în industrie.
 Panta dreptei (parametrul β1) reprezintă elasticitatea (E)

investiţiilor în raport cu producţia.
3. Analiza de corelaţie
4.3. Modele polinomiale

a. Modelul parabolic: cel mai simplu model polinomial este
modelul parabolic (Quadratic).
Y  0  1  X  2  X 2  
La nivelul eşantionului:
YX  b0  b1  X  b2  X 2
19
1/31/2018
 În economie, modelul polinomial este folosit pentru

descrierea relaţiei dintre costul unitar şi producţia realizată:
costul unitar scade concomitent cu creşterea producţiei până
la un nivel optim al producţiei, după care, dacă producţia
continuă să crească, începe să crească şi costul unitar.
Exemplu
Cost unitar
50.00 Observed
Quadratic
40.00
30.00
20.00
10.00
2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00
Productia
20
1/31/2018
Exemplu
 În studiul legăturii dintre costul unitar şi producţia
unui bun (sute bucăţi), înregistrate pentru un
eşantion de firme, s-au obţinut următoarele rezultate:
Exemplu
Coefficients
Productia -25.795 3.895 -5.322 -6.623 .000
Productia ** 2 2.114 .351 4.842 6.026 .001
(Constant) 89.041 9.231 9.646 .000
21
1/31/2018
Exemplu
Model Summary
Adjusted Std. Error of

R R Square R Square the Estimate
.941 .886 .853 4.484
The independent variable is Productia.
ANOVA
Sum of
Squares df Mean Square F Sig.
Regression 1091.326 2 545.663 27.133 .001
Residual 140.774 7 20.111
Total 1232.100 9
The independent variable is Productia.
Interpretare:
 β2>o, deci legătura de tip parabolic admite un punct de
minim.
 Coordonatele punctului de minim arată nivelul producţiei

optim pentru care costul unitar este minim. Abscisa acestui
punct este:
-b1/2b2=25,79/4,22=6,11. Pentru o producţie de 611 bucăţi
din produsul A, costul este minim.
22
1/31/2018
b. Modelul cubic
Y  0  1  X  2  X 2  3  X 3  
În economie acest model este folosit pentru descrierea
relaţiei dintre costul total şi valoarea producţiei.
Pentru acest tip de legătură se poate determina punctul de

inflexiune al curbei, prin anularea derivatei de ordinul 2 in X.
Grad de urbanizare (%)

100
80
60
40
20
0 5000 10000 15000 20000 25000
PIB / loc
23
1/31/2018
Coefficients
PIB 2,931 ,071 1,197 41,218 ,000
PIB ** 2 -3,9E-007 ,000 -,361 -4,932 ,000
PIB ** 3 7,73E-014 ,000 ,165 . .
(Constant) -3962,660 11506,083 -,344 ,737
4.4. Modele de regresie neliniară multiplă.

Modelul putere
a. Forma generală a modelului:
 2 p
Y  0  X 1 1  X 2   X p  e
lnY  ln 0  1  ln X 1  2  ln X 2     p  ln X p  
24
1/31/2018
Interpretare:
 parametrul β0 este nivelul mediu al lui Y atunci când Xi=1.
 parametrii βi reprezintă elasticitatea variabilei dependente Y

în raport cu variabilele independente Xi.
b. Exemplu din economie
- funcţia de producţie de tip Cobb-Douglas.
b.1. Prezentarea modelului
25
1/31/2018
 
Y   0  X 1 1  X 2 2  e
unde:
Variabilele modelului sunt:
Y este producţia finală sau output-ul;
X1 sunt fondurile fixe, capitalul sau input-ul;
X2 este forţa de muncă (input).
Coeficienţii modelului:
β0 este nivelul mediu al producţiei (Y) când Xi=1.
β1 este elasticitatea parţială a producţiei în raport cu fondurile

fixe sau factorul capital.
β2 este elasticitatea parţială a producţiei în raport cu forţa de

muncă.
(β1+ β2) este elasticitatea totală a producţiei în raport cu cei doi

factori. Această valoare poartă numele de randament de scară.
26
1/31/2018
Interpretare:
 (β1+ β2)<1: un spor al factorilor de producţie generează o
creştere a output-ului dar într-o proporţie mai mică (proces de
producţie cu randament de scară descrescător);
 (β1_+ β2)>1: un spor al factorilor de producţie generează o
creştere a output-ului dar într-o proporţie mai mare (proces
de producţie cu randament de scară crescător);
 (β1_+ β2) =1: sporul factorilor de producţie generează
creşterea output-ului în aceeaşi proporţie (randament de scară
constant).
b.2. Exemplu numeric

Să presupunem că, în urma prelucrării datelor privind
valoarea input-urilor (L, forţa de muncă; K, valoarea
capitalului fix) şi a output-urilor obţinute într-un anumit
domeniu de activitate (Y, valoarea producţiei), s-au obţinut
următoarele rezultate:
ln Y  4 ,28  1,35  ln L  0 ,63  ln K

R square=0,878.
27
1/31/2018
Interpretare:
- pentru perioada analizată, dacă se consideră constantă
valoarea capitalului fix (K), atunci o creştere cu un procent a
nivelului variabilei L duce la creşterea medie cu 1,35% a
valorii producţiei obţinute.
- pentru perioada analizată, dacă se consideră constantă
valoarea forţei de muncă (L), atunci o creştere cu un procent a
valorii capitalului fix (K) duce la creşterea medie cu 0,63% a
valorii producţiei obţinute.
- suma elasticităţilor parţiale este egală cu 1,98 ceea ce arată

că, în perioada analizată, procesul de producţie s-a
caracterizat printr-un randament de scară crescător.
- 87,8% din variaţia producţiei este datorată influenţei

simultane a forţei de muncă şi a valorii capitalului fix în
domeniul considerat.
28
1/31/2018
ECONOMETRIE
Planul cursului
1. Introducere
2. Modelul de regresie liniară simplă
3. Modelul de regresie liniară multiplă
5. Ipoteze statistice: normalitatea erorilor,
homoscedasticitatea, necorelarea erorilor,
multicoliniaritatea.
29
1/31/2018
5. Verificarea ipotezelor modelului de

regresie
Ipotezele statistice care se formulează în modelarea
econometrică sunt ipoteze asupra componentei aleatoare
(erorilor) şi ipoteze asupra componentei deterministe
(variabilelor independente).
5.1. Ipotezele asupra componentei aleatoare (erorilor) sunt

următoarele:
a. Media erorilor este nulă: M(εi)=0.
b. Ipoteza de homoscedasticitate: V(εi)=σ2
c. Ipoteza de normalitate:  i ~ N (0,  2 )
d. Ipoteza de necorelare sau de independenţă a erorilor:

cov(εi, εi)=0.
30
1/31/2018
a. Media erorilor este nulă

1. Definire: M(εi)=0 care este echivalentă cu M(Y/X)=β0+ β1X.
2. Efectele încălcării acestei ipoteze:

- dacă această ipoteză este încălcată, atunci se modifică
proprietăţile estimatorilor parametrilor modelului de regresie
(parametrii sunt estimaţi deplasat sau cu o eroare
sistematică).
3. Testarea ipotezei cu privire la media erorilor

 Ipoteze:
H0: M(ε)=0
H1: M(ε)#0
 Alegerea testului: t  M̂ (  )  M (  )
V̂ ( M̂ (  ) )
 Calculul statisticii test:
M ( ei )
tcalc 
sM̂ (  )
 Decizie
31
1/31/2018
4. Exemplu
Residuals Statisticsa
Minimum Maximum Mean Std. Deviation N

Predicted Value 58508,12 6084511 1582428 1957596,554 15
Residual -98125,2 131202,7 ,00000 73271,63549 15
Std. Predicted Value -,778 2,300 ,000 1,000 15
Std. Residual -1,290 1,725 ,000 ,964 15
a. Dependent Variable: salariu
One-Sample Statistics
Std. Error
N Mean Std. Deviation Mean
Unstandardized Residual 15 ,0000000 73271,63549 18918,65
32
1/31/2018
One-Sample Test
Test Value = 0
95% Confidence
Interval of the
Mean Difference
t df Sig. (2-tailed) Difference Lower Upper
Unstandardized Residual ,000 14 1,000 ,00000000 -40576,5 40576,48
5. Corectarea modelului
 Modelul iniţial se corectează cu ajutorul estimaţiei
erorilor calculate la nivelul eşantionului.
 Modelul corectat este de forma:
y*i  0  i xi  ui
 , unde:
y*i  yi  M (  i )
33
1/31/2018
b. Ipoteza de homoscedasticitate a erorilor
1. Definire
- ipoteza de homoscedasticitate presupune ca varianţa
erorilor să fie constantă:
V(i )   2
- această ipoteză presupune o varianţă constantă şi egală a

erorilor la nivelul distribuţiilor condiţionate de forma
Y X  xi
2. Efectele încălcării acestei ipoteze

 pierderea eficienţei estimatorilor parametrilor modelului de
regresie (estimează parametrul cu o varianţă mai mare).
3. Identificarea heteroscedasticităţii
3.1. Procedee grafice

- presupun reprezentarea distribuţiei erorilor şi aprecierea
varianţei acesteia.
34
1/31/2018
- cazul existenţei heteroscedasticităţii:
1
X
0 Residuals
0 5 10 15 20 25 30 35
-1
-2
-3
3.2. Procedee numerice

a. Testul Glejser
 are la bază un model de regresie între variabila reziduală

estimată şi variabila independentă.
Etapele testării:
1. Se estimează modelul de regresie de forma:
Y   0  1  X  
2. Se calculează erorile estimate ei.
3. Se construieşte un model de regresie pe baza erorilor
estimate în valoare absolută şi variabila
35
1/31/2018
independentă. Exemplu:
 i   0  1  xi  ui
4. Se testează parametrii acestui model: dacă parametrul α1
este semnificativ, atunci modelul iniţial este
heteroscedastic.
Exemplu:
Coefficientsa
Model B Std. Error Beta t Sig.
1 (Constant) 50921,663 12000,771 4,243 ,001
PIB ,016 ,012 ,348 1,337 ,204
a. Dependent Variable: erori
36
1/31/2018
b. Testul Spearman (coeficient al corelaţiei neparametrice)

- se bazează pe calculul rangurilor valorilor estimate ale
erorilor, εi , şi a valorilor Xi .
Ipoteze statistice:
H0: ipoteza de homoscedasticitate
H1: ipoteza de heteroscedasticitate
Statistica test: ˆ n  2
t
1  ˆ 2
 Valoarea calculată a statisticii test:

r n2
tcalc 
1 r2
unde: r este o estimaţie a coeficientului Spearman.
37
1/31/2018
Regula de decizie:
 tcalc>tteor sau o valoare a lui Sig. asociată statisticii test t
Student calculate < 0,05 duce la respingerea ipotezei Ho.
Exemplu:
În studiul legăturii dintre două variabile, X şi Y, s-au obţinut
Correlations
Unstandardiz
X ed Residual
Spearman's rho X Correlation Coefficient 1,000 ,000
Sig. (2-tailed) . 1,000
N 5 5
Unstandardized Residual Correlation Coefficient ,000 1,000
Sig. (2-tailed) 1,000 .
N 5 5
38
1/31/2018
Se cere să se testeze ipoteza de homoscedasticitate,

considerând un risc de 0,05.
Rezolvare:
Pentru aceasta, se formulează următoarele ipoteze statistice:
Statistica test : r n2

t
1 r2
39
1/31/2018
 Coeficientul Spearman este:
r 0
 Statistica test t Student se calculează astfel:
r n2 0 52
tcalc   0
1 r 2 10
Regula de decizie:
- pentru exemplul dat:
(t calc  0)  (t 0, 025;3  3,182 )
Deci, se acceptă, cu o probabilitate de 0,95, ipoteza Ho,

ipoteza de homoscedasticitate.
40
1/31/2018
c. Testul Goldfeld-Quandt
Are la bază ideea că între valorile varianţei erorilor la nivelul
repartiţiilor condiţionate şi valorile variabilei dependente
există o legătură pozitivă de forma:
 i2   2 xi2
Ipoteze statistice:
Etape pentru calculul statisticii test:

- se ordonează crescător valorile xi .
- se împarte seria în două părţi egale, după omiterea unui set de

date din centrul seriei (în cazul seriilor cu un număr mare de
termeni);
- se estimează parametrii ecuaţiei de regresie pentru fiecare din

cele două seturi de date şi se calculează variaţia reziduală
(RSS) pentru fiecare model în parte;
41
1/31/2018
- se calculează statistica test Fisher care compară cele două

variaţii reziduale:
RSS 2
Fcalc 
RSS1
unde: RSS1 corespunde celei mai mici valori a variaţiei

reziduale.
Regula de decizie:
- dacă Fcalc  F0, 05;n  k ;n  k sau Sig.<0.05, atunci se

respinge ipoteza Ho.
Exemplu:
Pentru două variabile, X şi Y, se cunosc următoarele valori:
42
1/31/2018
xi yi
2 15
3 20
1 10
4 19
6 25
5 23
7 30
8 35
9 38
10 40
 Se cere să se testeze ipoteza de homoscedasticitate, folosind

testul Goldfeld-Quandt.
Rezolvare:
1. Se ordonează crescător şirul valorilor xi.
2. Se împarte seria valorilor xi în două serii: prima serie este
reprezentată de valorile 1, 2, …, 5; iar a doua serie este
reprezentată de valorile 6, 7, …, 10.
43
1/31/2018
3. Pentru fiecare din cele două serii se estimează parametrii

modelului de regresie. Se obţine:
Seria 1: Yx=8,3+3X
Seria 2: Yx=3,2+3,8X
4. Pentru aceste modele, se estimează variaţia reziduală (valoare

prezentată în output-ul ANOVA):
- pentru seria 1: RSS=3,73;
- pentru seria 2: RSS=1,6.
5. Se calculează raportul F, considerând RSS1 cea mai mică

valoare, şi anume RSS1=1,6:
Fcalc=3,73/1,6=2,33.
6. Se compară valoarea calculată a statisticii test F cu

valoarea teoretică:
F0,05;n1 k ;n2 k  F0,05;52;52  9,277.

(k este numărul de parametri estimaţi).
44
1/31/2018
7. Interpretare:
( Fcalc  2,33)  ( F0,05;3;3  9,277)

Pentru exemplul dat, se acceptă ipoteza de
homoscedasticitate, cu o probabilitate de 0,95.
4. Corectarea heteroscedasticităţii
4.1. Dacă se cunosc parametrii  i2
Corecţia heteroscedasticităţii este aplicată modelului
de regresie liniară simplă:
yi  0  1 xi   i
Corectarea heteroscedasticităţii presupune
1
ponderarea modelului iniţial cu variabila .
i
45
1/31/2018
Noul model de regresie (corectat) se obţine astfel:

yi 0 x 
  1 i  i
i i i i
Estimarea parametrilor acestui model se realizează

pe baza MCMMP ponderată (method of weighted
least squares).
4.2. Dacă nu se cunosc parametrii  i2

Corecţia heteroscedasticităţii se realizează pe baza
relaţiei:
 i2   2 xi2
Corectarea heteroscedasticităţii presupune
ponderarea modelului iniţial cu variabila 1/xi.
46
1/31/2018
Noul model de regresie (corectat) este de forma:
yi  0 
  1  i
xi xi xi
c. Ipoteza de normalitate a erorilor

1. Formularea problemei
- erorile ε urmează o lege normală de medie 0 şi varianţă
σ2 :
 i ~ N (0,  2 )
2. Efectele încălcării acestei ipoteze
- ipoteza de normalitate a erorilor este importantă pentru
stabilirea proprietăţilor estimatorilor parametrilor
modelului de regresie.
47
1/31/2018
 dacă  i ~ N ( 0 , 2 ) , atunci estimatorii parametrilor modelului de

regresie urmează, de asemenea, o lege normală:
ˆi ~ N (  i ,  2ˆ )
i
 dacă ipoteza de normalitate este încălcată, atunci estimatorii

parametrilor modelului de regresie nu urmează o lege
normală (pentru eşantioane de volum mare, proprietatea de
normalitate este atinsă asimptotic).
3. Verificarea normalităţii erorilor

3.1. Procedee grafice
- Histograma (curba frecvenţei):

- P-P Plot sau Q-Q Plot;
- Box-Plot;
48
1/31/2018
a. Reprezentarea histogramei şi a curbei frecvenţelor

- se reprezintă curba frecvenţei sau histograma reziduurilor
şi se observă dacă forma distribuţiei acestora are alură de
clopot.
Exemplu:
Histograma şi curba frecvenţelor
Histogram
Dependent Variable: greut

3,0
2,5
Frequency
2,0
1,5
1,0
0,5
0,0
Mean = -1,85E-15
-2 -1 0 1 2 Std. Dev. = 0,943
N = 10
Regression Standardized Residual
49
1/31/2018
b. P-P Plot
Normal P-P Plot of Regression Standardized
Residual
Dependent Variable: greut

1,0
Expected Cum Prob
0,8
0,6
0,4
0,2
0,0
0,0 0,2 0,4 0,6 0,8 1,0
Observed Cum Prob
c. Box-plot
70
65
60
55
50
45
greut
50
1/31/2018
3.2. Procedee numerice

a. Testul Kolmogorov-Smirnov
- presupune compararea frecvenţelor cumulate (calculate) cu
frecvenţele teoretice cumulate extrase din tabelul Gauss.
Ipoteze statistice:
H0: ipoteza de normalitate
H1: distribuţia erorilor nu urmează o lege normală
Regula de decizie:
 valoarea probabilităţii asociate statisticii test calculate (Sig.)

se compară cu  (0,05): dacă Sig.<0,05, atunci se
respinge ipoteza de normalitate a erorilor.
Exemplu:
51
1/31/2018
One-Sample Kolmogorov-Smirnov Test
greut
N 10
Normal Parameters a,b Mean 58,5000
Std. Deviation 7,83511
Most Extreme Absolute ,276
Differences Positive ,161
Negative -,276
Kolmogorov-Smirnov Z ,873
Asymp. Sig. (2-tailed) ,432
a. Test distribution is Normal.
b. Calculated from data.
b. Testul Jarque-Bera
- se bazează pe verificarea simultană a proprietăţilor de
asimetrie şi boltire ale seriei reziduurilor. Pentru o
distribuţie normală, valoarea coeficientului de asimetrie
Fisher (sw) este zero, iar valoarea coeficientului de
boltire Fisher (k) este zero.
Ipoteze statistice
H0: ipoteza de normalitate
H1: distribuţia erorilor nu urmează o lege normală
52
1/31/2018
Calculul statisticii test:

 statistica test JB se calculează după relaţia:
n  2 k 2 
JB   sw 
6  4 
unde: sw este coeficientul de asimetrie (Skewness):

3
sw 
3
k este coeficientul de boltire (Kurtosis):
4
k 3
 22
 În cazul unui model de regresie, estimaţiile celor doi

parametri ai formei unei distribuţii au următoarele relaţii:
ei3 2
( )
i n2
sw 
e2
( i ) 3
i n2
ei4
n2
k i
3
e2
( i ) 2
i n2
53
1/31/2018
unde: ei  y i  y x i
Regula de decizie:
Statistica JB urmează o lege 2 , 2 .
- dacă valoarea calculată a statisticii test JB > 2 ; 2
sau Sig.<0,05, atunci se respinge ipoteza Ho.
Exemplu.
Descriptive Statistics
N Minimum Maximum Mean Std. Skewness Kurtosis

Statistic Statistic Statistic Statistic Deviation
Statistic Statistic Std. Error Statistic Std. Error
Unstandardized Residual 7 -2.61905 2.14286 .0000000 1.889822 -.529 .794 -1.375 1.587
Valid N (listwise) 7
54
1/31/2018
ECONOMETRIE
109
d. Ipoteza de necorelare sau de independenţă a

erorilor: cov(εi, εi)=0.
1. Noţiuni
a. Autocorelarea sau corelaţia serială :

- presupune existenţa unei autocorelări între erorile ε,
altfel spus: cov(εi, εj) # 0 sau M(εi, εj ) # 0.
b. Coeficientul de autocorelaţie
- coeficientul de autocorelaţie între erorile εi şi εi-1 ale
unui model de regresie se calculează după
110
55
1/31/2018
relaţia: cov(  i , i 1 ) cov(  i , i 1 )

 
 i  i 1 2
- acest coeficient este un coeficient de autocorelaţie de ordinul

1.
c. Funcţia de autocorelaţie
 este definită de valorile coeficienţilor de autocorelare de
ordinul k.
111
2. Sursa autocorelării erorilor

- neincluderea în modelul de regresie a uneia sau mai multor
variabile explicative importante;
- inerţia fenomenelor în timp şi decalajul, în cazul seriilor de
timp;
- modelul de regresie nu este corect specificat.
3. Testarea autocorelării erorilor
112
56
1/31/2018
3.1. Testul Durbin-Watson

Ipoteze statistice:
H0: erorile nu sunt autocorelate ( = 0)
H1: erorile sunt autocorelate (  0 )
Calculul statisticii test:
 (ˆ ˆ i i 1 )2
DW  d  i 2
 ˆ i 1
i
2
113
Întrucât  i   i1  ui statistica DW se mai poate scrie astfel:
 ˆ i  2 ˆ i ˆ i 1   ˆ i 1
2 2
 ˆ i   ˆ i ˆ i 1
2   ˆ i ˆ i 1 
 
d i i i
2 i i
 2   1  i 2   2  ( 1  ˆ )
 ˆ i  ˆ i  ˆ i 
2 2

i i  i 
Deoarece  1  ˆ  1 , valorile statisticii DW sunt date de

intervalul: 0  d  4
114
57
1/31/2018
Interpretare:
 Dacă ˆ  1  d  0 , atunci există autocorelare pozitivă
maximă a erorilor;
 Dacă ˆ  1  d  4 , atunci există autocorelare negativă
maximă a erorilor;
 Dacă ˆ  0  d  2 , atunci nu există autocorelare.
115
Regula de decizie:
 Valorile teoretice ale statisticii DW sunt calculate şi tabelate
în funcţie de pragul de semnificaţie, de volumul eşantionului
şi de numărul de parametri ai modelului.
 În tabele se determină două valori critice, notate cu dL (limita

inferioară) şi dU (limita superioară).
116
58
1/31/2018
 În funcţie de aceste valori critice se determină următoarele

intervale, care permit luarea deciziei de respingere sau
acceptare a ipotezei nule:
a. (0<dcalc<dL) se respinge ipoteza Ho, erorile înregistrează o

autocorelare pozitivă;
b. (dL<dcalc<dU) şi (4-du<dcalc< 4-dL) sunt regiuni de
nedeterminare, nu se poate decide asupra existenţei
autocorelării erorilor;
117
c. (du <dcalc< 4- du) se acceptă ipoteza Ho, erorile nu sunt

autocorelate;
d. (4-dL <dcalc< 4) se respinge ipoteza Ho, erorile înregistrează o
autocorelare negativă.
Exemplu:
În studiul legăturii dintre două variabile, X şi Y, observate
pentru un eşantion format din 25 unităţi statistice, s-a estimat
un model de regresie liniară simplă şi s-au obţinut
118
59
1/31/2018
Calculul statisticii Durbin Watson în SPSS:
Model Summaryb
Adjusted Std. Error of Durbin-

Model R R Square R Square the Estimate Watson
1 ,985a ,970 ,960 2,41523 1,429
a. Predictors: (Constant), X
b. Dependent Variable: Y
Să se testeze ipoteza de autocorelare a erorilor, considerând un

risc de 0,05.
119
3.2. Runs Test

- se bazează pe ideea că valorile variabilei reziduale se
constituie în secvenţe sau seturi de valori pozitive sau
negative numite runs, care se succed într-o anumită ordine
sau aleator.
- ipoteza de bază a acestui test este aceea că, în cazul lipsei

autocorelării erorilor, succesiunea acestor seturi (runs, notate
k) este aleatoare sau numărul acestora este distribuit normal.
120
60
1/31/2018
Ipoteze statistice
H0: k este distribuit normal (nu există autocorelare a erorilor)
H1: k nu este distribuit normal (ipoteza este încălcată)
Calculul statisticii test

- se foloseşte statistica t Student, calculată după relaţia:
k  M (k )
t calc 
sk
unde: k este numărul de runs caracterizat prin:
121
n1 n2
M( k )  2 1
n1  n2
2n1n2  n1  n2
sk2  2n1n2
( n1  n2 ) 2 ( n1  n2  1)
122
61
1/31/2018
 n1 este numărul de valori pozitive ale erorilor ei ;

 n2 este numărul de valori negative ale erorilor ei,
cu n1 + n2 = n .
Regula de decizie:
- dacă |tcalc|  ta/2,n-2 , atunci se acceptă ipoteza H0.
123
Exemplu:
Pentru două variabile, X şi Y, s-au obţinut următoarele
rezultate: Runs Test 2
Unstandardiz
ed Residual
Test Valuea ,0000000
Cases < Test Value 17
Cases >= Test Value 15
Total Cases 32
Number of Runs 3
Z -4,849
Asymp. Sig. (2-tailed) ,000
a. Mean
Să se testeze ipoteza de autocorelare a erorilor, folosind testul

Runs.
124
62
1/31/2018
4. Efectele încălcării ipotezei de necorelare a erorilor

 în aceste condiţii, prin aplicarea MCMMP, se obţine pentru
parametrul β0 un estimator neeficient.
6.2. Ipotezele asupra variabilelor independente

1. Variabilele independente sunt nestochastice sau
deterministe.
2. Variabilele independente şi variabila eroare sunt

necorelate, cov (Xi,εi)=0.
- această ipoteză este îndeplinită dacă variabilele independente
sunt nestochastice.
125
3. Ipoteza de necoliniaritate a variabilelor

independente
a. Definire
 Coliniaritatea poate fi definită ca o legătură liniară
funcţională existentă între două sau mai multe variabile
independente ale unui model de regresie multiplă de
forma:
YX1 , Xp  0  1  X1  2  X 2     p  X p  
a.1. Coliniaritate perfectă
126
63
1/31/2018
 apare atunci când între variabilelele independente X1, X2, ...,

Xp există o legătură liniară perfectă, funcţională. Această
legătură poate fi exprimată printr-o relaţie de forma:
1  X 1  2  X 2     p  X p  0
unde: λi, cu i=1, ..., p, valori constante care nu sunt toate, în mod
simultan, nule.
127
a.2. Coliniaritatea imperfectă

 Poate fi definită ca o relaţie liniară puternică existentă între
două sau mai multe variabile independente.
1  X 1  2  X 2     p  X p  u  0
128
64
1/31/2018
b. Efectele coliniarităţii
 Varianţa estimatorilor parametrilor modelului de regresie
creşte, adică estimatorii pierd proprietatea de eficienţă.
 În cazul unei coliniarităţi perfecte, varianţa estimatorilor este
infinită (parametrii modelului nu pot fi estimaţi).
 În cazul unei coliniarităţi imperfecte, varianţele estimatorilor
sunt mari.
129
c. Testarea coliniarităţii
c.1. Folosind procedee grafice
20,00
15,00
X2
10,00
5,00
R Sq Linear = 1
0,00
0,00 2,00 4,00 6,00 8,00 10,00
X1
130
65
1/31/2018
20,00
15,00
X2
10,00
5,00
0,00 R Sq Linear = 0,902
0,00 2,00 4,00 6,00 8,00 10,00 12,00 14,00
X1
131
c.2. Folosind procedee numerice

1. Factorul varianţei crescute (variance-inflated factor,
VIF)
1
VIF j 
1  R 2j
2
 unde: R j este raportul de determinaţie din modelul de
regresie auxiliar, respectiv dintre variabila Xj şi celelalte
variabile independente.
132
66
1/31/2018
Interpretare:
 Atunci când legăturile dintre variabilele independente sunt
puternice, valoarea raportului de determinaţie se apropie de
unu, iar raportul VIF este infinit.
 Atunci când între variabilele independente nu există corelaţie

(R2j=0), valoarea raportului VIF este egală cu unu.
133
 În practică, o valoare VIF>10 indică prezenţa coliniarităţii.
2. Toleranţa (Tolerance)
- se calculează după relaţia: TOL=1/VIF=1-R2j
Interpretare:
- Dacă valoarea TOL=1, atunci nu există coliniaritate;
- Dacă valoarea TOL=0, atunci există coliniaritate perfectă.
 Existenţa coliniarităţii este sugerată de valorile mici ale

indicatorului TOL.
134
67
1/31/2018
d. Corectarea coliniarităţii
 metodele de corecţie ţin cont de tipul de coliniaritate, de
numărul de variabile din model şi de informaţiile
suplimentare despre fenomenul studiat.
 Cea mai simplă metodă constă în eliminarea variabilei care
introduce coliniaritatea.
 Altă metodă constă în construirea unui model cu variabile
transformate prin diverse funcţii sau operatori (de exemplu,
operatorul decalaj, diferenţă).
135
Exemplu:
În urma analizei legăturilor dintre variabilele independente ale
unui model de regresie, s-au obţinut următoarele rezultate:
Coefficientsa
Coefficients Coefficients Collinearity Statistics
Model B Std. Error Beta t Sig. Tolerance VIF
1 (Constant) 65,705 27,731 2,369 ,037
X1 48,979 10,658 ,581 4,596 ,001 ,950 1,052
X2 59,654 23,625 ,359 2,525 ,028 ,753 1,328
X3 -1,838 ,814 -,324 -2,258 ,045 ,738 1,355
a. Dependent Variable: Y
136
68

Cursuri Pentru Econometrie Sesiune

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Cursuri Pentru Econometrie Sesiune

Încărcat de

Drepturi de autor:

Formate disponibile

1/31/2018

4. Modele de regresie neliniară

4.2. Modele liniarizabile

4.3. Modele polinomiale

4.4. Modele neliniare multiple

4.1. Tipuri de modele neliniare

II. Modele polinomiale sunt acele modele care exprimă relaţia

4.2. Modele liniarizabile

a.1 Modele cu variabila dependentă logaritmată

a.2 Modele cu variabila independentă logaritmată:

a.1 Modele cu variabila dependentă logaritmată

1. Forma generală a modelului:

Ecuaţia se liniarizează prin logaritmare:

- Dacă 0<β1<1, atunci legătura dintre cele două

2. Estimarea parametrilor modelului

Sistemul de ecuaţii normale:

 Valorile estimaţiilor b0 şi b1 sunt prezentate în output-ul

3. Testarea semnificaţiei parametrilor

4. Intensitatea legăturii dintre variabile

În urma analizei legăturii dintre valoarea investiţiilor (mii

Logaritmând ecuaţia de mai sus, se obţine:

2. Testarea semnificaţiei parametrilor

3. Estimarea şi testarea intensităţii legăturii dintre

a.1 Modele cu variabila dependentă logaritmată

 Forma generală a modelului:

II. Modelul Growth (de creştere)

- eβ0 este valoarea medie a lui Y pentru X=0.

- β1 arată variaţia medie procentuală a lui Y la o

Ecuaţia estimată a legăturii dintre cele două variabile

Logaritmând ecuaţia de mai sus, se obţine:

III. Modelul exponenţial

 Forma generală a modelului:

III. Modelul exponenţial

- β0 este valoarea medie a lui Y pentru X=0.

- β1 arată variaţia medie procentuală a lui Y la o

III. Modelul exponenţial

a.2 Modele cu variabila independentă logaritmată

 Forma generală a modelului:

- β0 este valoarea medie a lui Y pentru X=1.

 Ecuaţia estimată a legăturii dintre cele două variabile este:

b. Modelul de tip putere (Power) (log-liniar)

Ecuaţia se liniarizează prin logaritmare:

 În modelul putere, parametrul β1 este elasticitatea variabilei

• Elasticitatea unei variabile Y în raport cu o altă variabilă X

Elasticitatea poate fi determinată prin relaţia:

2. Estimarea parametrilor modelului

ln b0  ln xi + b1  (ln xi )2 = ln xiln y i

3. Testarea semnificaţiei parametrilor

Adjusted Std. Error of

Prin logaritmare se obţine:

ln YX  ln 1,603  0 ,960  ln X  0 ,472  0 ,960  ln X

 Panta dreptei (parametrul β1) reprezintă elasticitatea (E)

2. Testarea semnificaţiei parametrilor

4.3. Modele polinomiale

 În economie, modelul polinomial este folosit pentru

2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00

Adjusted Std. Error of

 Coordonatele punctului de minim arată nivelul producţiei

Pentru acest tip de legătură se poate determina punctul de

Grad de urbanizare (%)

0 5000 10000 15000 20000 25000

4.4. Modele de regresie neliniară multiplă.

 parametrul β0 este nivelul mediu al lui Y atunci când Xi=1.

 parametrii βi reprezintă elasticitatea variabilei dependente Y