Sunteți pe pagina 1din 68

1/31/2018

ECONOMETRIE

Planul cursului
1. Introducere
2. Modelul de regresie liniară simplă
3. Modelul de regresie liniară multiplă
4. Modele de regresie neliniară
5. Ipoteze statistice: normalitatea erorilor,
homoscedasticitatea, necorelarea erorilor,
multicoliniaritatea.

1
1/31/2018

4. Modele de regresie neliniară


4.1. Tipuri de modele

4.2. Modele liniarizabile

4.3. Modele polinomiale

4.4. Modele neliniare multiple

4.1. Tipuri de modele neliniare


 Putem distinge două mari clase de modele neliniare:
I. Modelele liniarizabile sunt acele modele neliniare care se
pot transforma în modele liniare prin logaritmare sau alte
transformări: modele semi-logaritmice şi modelul putere.

II. Modele polinomiale sunt acele modele care exprimă relaţia


dintre variabilele X şi Y cu ajutorul unui polinom de gradul
2, 3, etc.

2
1/31/2018

4.2. Modele liniarizabile


a. Modele semi-logaritmice

a.1 Modele cu variabila dependentă logaritmată


I. Modelul Compound (compus)
II. Modelul Growth (de creştere)
III. Modelul exponenţial

a.2 Modele cu variabila independentă logaritmată:


modelul Logarithmic.

a.1 Modele cu variabila dependentă logaritmată

I. Modelul Compound

1. Forma generală a modelului:

Y   0  1  e
X

Ecuaţia se liniarizează prin logaritmare:

ln Y  ln  0  X  ln 1  

3
1/31/2018

Parametrii modelului:
- β0 este valoarea lui Y pentru X=0. Variabila Y are
numai valori pozitive, deci β0 satisface condiţia β0
>0.
- β1 arată variaţia medie procentuală a lui Y la o
variaţie absolută a lui X cu o unitate. Reprezintă rata
de creştere sau reducere a variabilei Y în raport cu
variabila X.

Observaţii:
- Dacă β1>1, atunci legătura dintre cele două variabile
este directă.

- Dacă 0<β1<1, atunci legătura dintre cele două


variabile este indirectă.

4
1/31/2018

2. Estimarea parametrilor modelului


2
Se face prin MCMMP:  ei  min im

Sistemul de ecuaţii normale:


n ln b0 + ln b1  xi =  ln yi , i  1,n

ln b0  x i + ln b1  x i2 =  x iln y i

n xi ln yi   xi  ln yi
ln b1  ;
n xi2   xi 
2

ln b0 
 ln yi  xi2   xi  xi ln yi
n xi2   xi 
2

5
1/31/2018

 Valorile estimaţiilor b0 şi b1 sunt prezentate în output-ul


Coefficients, coloana Unstandardized Coefficients.

3. Testarea semnificaţiei parametrilor


 Ipoteze

 Interpretare

4. Intensitatea legăturii dintre variabile


Exemplu: raportul de determinaţie (R square).

5. Exemplu

În urma analizei legăturii dintre valoarea investiţiilor (mii


lei) şi valoarea producţiei (mil. lei) înregistrate pe un
eşantion de 5 firme, folosind modelul Compound, s-au
obţinut următoarele rezultate:

6
1/31/2018

Coefficients

Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
X 1.139 .039 2.488 29.566 .000
(Constant) 15.175 2.726 5.568 .011
The dependent variable is ln(Y).

Rezolvare:
Ecuaţia estimată a legăturii dintre cele două
variabile este:

y xi  15,175  1,139 xi

Logaritmând ecuaţia de mai sus, se obţine:


lnyxi=ln15,175+xiln1,139=2,719+0,13xi

7
1/31/2018

Interpretare:
- valoarea parametrului β1 arată că la o creştere cu o
mie de lei a investiţiilor (X), producţia (Y) creşte în
medie cu o rată de 0,13 sau cu 13%.

2. Testarea semnificaţiei parametrilor

3. Estimarea şi testarea intensităţii legăturii dintre


variabile

a.1 Modele cu variabila dependentă logaritmată


II. Modelul Growth (de creştere)

 Forma generală a modelului:

Y  e 0  1 X 
ln Y   0   1  X  

8
1/31/2018

II. Modelul Growth (de creştere)

Parametrii modelului:

- eβ0 este valoarea medie a lui Y pentru X=0.

- β1 arată variaţia medie procentuală a lui Y la o


variaţie absolută a lui X cu o unitate.

Exemplu
În urma analizei legăturii dintre valoarea investiţiilor
(mii lei) şi valoarea producţiei (mil. lei) înregistrate pe
un eşantion de 5 firme, folosind modelul Growth, s-au
obţinut următoarele rezultate:

9
1/31/2018

Coefficients

Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
X .130 .034 .912 3.843 .031
(Constant) 2.720 .180 15.142 .001
The dependent variable is ln(Y).

Ecuaţia estimată a legăturii dintre cele două variabile


este:

YX  e 2 ,720 ,13 X

Logaritmând ecuaţia de mai sus, se obţine:


lnYX=2,72+0.13X

10
1/31/2018

III. Modelul exponenţial

 Forma generală a modelului:

Y  0  e 1 X  e
Ecuaţia se liniarizează prin logaritmare:

ln Y  ln 0  1  X  

III. Modelul exponenţial


Parametrii modelului:

- β0 este valoarea medie a lui Y pentru X=0.

- β1 arată variaţia medie procentuală a lui Y la o


variaţie absolută a lui X cu o unitate.

11
1/31/2018

III. Modelul exponenţial


Exemplu
Se consideră legătura dintre valoarea investiţiilor (mii lei) şi
valoarea producţiei (mil. lei).

Coefficients

Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
X .130 .034 .912 3.843 .031
(Constant) 15.175 2.726 5.568 .011
The dependent variable is ln(Y).

 Ecuaţia estimată:

YX  15,175  e0 ,13 X

Interpretare:
 La o creştere a investiţiilor cu o mie de lei,
producţia creşte, în medie, cu 13%.

12
1/31/2018

a.2 Modele cu variabila independentă logaritmată


Modelul Logarithmic

 Forma generală a modelului:

Y  0  1  ln X  

- β0 este valoarea medie a lui Y pentru X=1.


- β1 arată variaţia medie absolută a lui Y la o
variaţie procentuală a lui X cu o unitate.

Exemplu
Se consideră legătura dintre valoarea investiţiilor (mii
lei) şi valoarea producţiei (mil. lei).

Coefficients

Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
ln(X) 20.535 3.396 .961 6.047 .009
(Constant) -1.799 5.388 -.334 .760

13
1/31/2018

 Ecuaţia estimată a legăturii dintre cele două variabile este:

Y X  1,799  20 ,535  ln X

Interpretare:
 La o creştere a investiţiilor cu 1 % producţia creşte, în
medie, cu 0,20535 mil. lei (20,535/100).

b. Modelul de tip putere (Power) (log-liniar)


1. Forma generală a modelului:

Y  0  X 1  e

Ecuaţia se liniarizează prin logaritmare:

ln Y  ln  0  1  ln X  

14
1/31/2018

 În modelul putere, parametrul β1 este elasticitatea variabilei


dependente Y în raport cu variabila independentă X.

• Elasticitatea unei variabile Y în raport cu o altă variabilă X


reprezintă modificarea relativă (procentuală) a variabilei Y la
o modificare relativă (procentuală) a lui X cu o unitate.

Elasticitatea poate fi determinată prin relaţia:


Y
 100
% mod if . Y Y X
E  Y  
% mod if . X X X Y
 100
X

15
1/31/2018

2. Estimarea parametrilor modelului


 Prin MCMMP

n ln b0 + b1  ln x i =  ln y i , i  1, n

ln b0  ln xi + b1  (ln xi )2 = ln xiln y i

3. Testarea semnificaţiei parametrilor

4. Exemplu
În urma prelucrării datelor privind valoarea
producţiei industriale (mil. lei) şi nivelul
investiţiilor nete din industrie (mii lei) în România,
în perioada 1990-2010, s-au obţinut următoarele
rezultate:

16
1/31/2018

Coefficients

Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
ln(X) ,960 ,012 ,999 79,735 ,000
(Constant) 1,603 ,143 11,204 ,000
The dependent variable is ln(Y).

Model Summary

Adjusted Std. Error of


R R Square R Square the Estimate
,999 ,998 ,998 ,116
The independent variable is X.

17
1/31/2018

ANOVA

Sum of
Squares df Mean Square F Sig.
Regression 86,240 1 86,240 6357,625 ,000
Residual ,190 14 ,014
Total 86,429 15
The independent variable is X.

Rezolvare:
1. Ecuaţia estimată a modelului putere este:

YX  1,603  X 0 ,960

Prin logaritmare se obţine:

ln YX  ln 1,603  0 ,960  ln X  0 ,472  0 ,960  ln X

18
1/31/2018

Interpretare:
 Producţia industrială creşte în medie cu 0,96%, la o creştere
cu 1% a investiţiilor nete în industrie.

 Panta dreptei (parametrul β1) reprezintă elasticitatea (E)


investiţiilor în raport cu producţia.

2. Testarea semnificaţiei parametrilor

3. Analiza de corelaţie

4.3. Modele polinomiale


a. Modelul parabolic: cel mai simplu model polinomial este
modelul parabolic (Quadratic).

Y  0  1  X  2  X 2  
La nivelul eşantionului:

YX  b0  b1  X  b2  X 2

19
1/31/2018

 În economie, modelul polinomial este folosit pentru


descrierea relaţiei dintre costul unitar şi producţia realizată:
costul unitar scade concomitent cu creşterea producţiei până
la un nivel optim al producţiei, după care, dacă producţia
continuă să crească, începe să crească şi costul unitar.

Exemplu
Cost unitar

50.00 Observed
Quadratic

40.00

30.00

20.00

10.00

2.00 3.00 4.00 5.00 6.00 7.00 8.00 9.00

Productia

20
1/31/2018

Exemplu
 În studiul legăturii dintre costul unitar şi producţia
unui bun (sute bucăţi), înregistrate pentru un
eşantion de firme, s-au obţinut următoarele rezultate:

Exemplu

Coefficients

Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
Productia -25.795 3.895 -5.322 -6.623 .000
Productia ** 2 2.114 .351 4.842 6.026 .001
(Constant) 89.041 9.231 9.646 .000

21
1/31/2018

Exemplu
Model Summary

Adjusted Std. Error of


R R Square R Square the Estimate
.941 .886 .853 4.484
The independent variable is Productia.

ANOVA

Sum of
Squares df Mean Square F Sig.
Regression 1091.326 2 545.663 27.133 .001
Residual 140.774 7 20.111
Total 1232.100 9
The independent variable is Productia.

Interpretare:
 β2>o, deci legătura de tip parabolic admite un punct de
minim.

 Coordonatele punctului de minim arată nivelul producţiei


optim pentru care costul unitar este minim. Abscisa acestui
punct este:
-b1/2b2=25,79/4,22=6,11. Pentru o producţie de 611 bucăţi
din produsul A, costul este minim.

22
1/31/2018

b. Modelul cubic

Y  0  1  X  2  X 2  3  X 3  
În economie acest model este folosit pentru descrierea
relaţiei dintre costul total şi valoarea producţiei.

Pentru acest tip de legătură se poate determina punctul de


inflexiune al curbei, prin anularea derivatei de ordinul 2 in X.

Grad de urbanizare (%)


100

80

60

40

20

0 5000 10000 15000 20000 25000

PIB / loc

23
1/31/2018

Coefficients

Unstandardized Standardized
Coefficients Coefficients
B Std. Error Beta t Sig.
PIB 2,931 ,071 1,197 41,218 ,000
PIB ** 2 -3,9E-007 ,000 -,361 -4,932 ,000
PIB ** 3 7,73E-014 ,000 ,165 . .
(Constant) -3962,660 11506,083 -,344 ,737

4.4. Modele de regresie neliniară multiplă.


Modelul putere
a. Forma generală a modelului:

 2 p
Y  0  X 1 1  X 2   X p  e
Ecuaţia se liniarizează prin logaritmare:

lnY  ln 0  1  ln X 1  2  ln X 2     p  ln X p  

24
1/31/2018

Interpretare:

 parametrul β0 este nivelul mediu al lui Y atunci când Xi=1.

 parametrii βi reprezintă elasticitatea variabilei dependente Y


în raport cu variabilele independente Xi.

b. Exemplu din economie

- funcţia de producţie de tip Cobb-Douglas.

b.1. Prezentarea modelului

25
1/31/2018

 
Y   0  X 1 1  X 2 2  e
unde:
Variabilele modelului sunt:
Y este producţia finală sau output-ul;
X1 sunt fondurile fixe, capitalul sau input-ul;
X2 este forţa de muncă (input).
Coeficienţii modelului:
β0 este nivelul mediu al producţiei (Y) când Xi=1.

β1 este elasticitatea parţială a producţiei în raport cu fondurile


fixe sau factorul capital.

β2 este elasticitatea parţială a producţiei în raport cu forţa de


muncă.

(β1+ β2) este elasticitatea totală a producţiei în raport cu cei doi


factori. Această valoare poartă numele de randament de scară.

26
1/31/2018

Interpretare:
 (β1+ β2)<1: un spor al factorilor de producţie generează o
creştere a output-ului dar într-o proporţie mai mică (proces de
producţie cu randament de scară descrescător);
 (β1_+ β2)>1: un spor al factorilor de producţie generează o
creştere a output-ului dar într-o proporţie mai mare (proces
de producţie cu randament de scară crescător);
 (β1_+ β2) =1: sporul factorilor de producţie generează
creşterea output-ului în aceeaşi proporţie (randament de scară
constant).

b.2. Exemplu numeric


Să presupunem că, în urma prelucrării datelor privind
valoarea input-urilor (L, forţa de muncă; K, valoarea
capitalului fix) şi a output-urilor obţinute într-un anumit
domeniu de activitate (Y, valoarea producţiei), s-au obţinut
următoarele rezultate:

ln Y  4 ,28  1,35  ln L  0 ,63  ln K


R square=0,878.

27
1/31/2018

Interpretare:
- pentru perioada analizată, dacă se consideră constantă
valoarea capitalului fix (K), atunci o creştere cu un procent a
nivelului variabilei L duce la creşterea medie cu 1,35% a
valorii producţiei obţinute.
- pentru perioada analizată, dacă se consideră constantă
valoarea forţei de muncă (L), atunci o creştere cu un procent a
valorii capitalului fix (K) duce la creşterea medie cu 0,63% a
valorii producţiei obţinute.

- suma elasticităţilor parţiale este egală cu 1,98 ceea ce arată


că, în perioada analizată, procesul de producţie s-a
caracterizat printr-un randament de scară crescător.

- 87,8% din variaţia producţiei este datorată influenţei


simultane a forţei de muncă şi a valorii capitalului fix în
domeniul considerat.

28
1/31/2018

ECONOMETRIE

Planul cursului
1. Introducere
2. Modelul de regresie liniară simplă
3. Modelul de regresie liniară multiplă
4. Modele de regresie neliniară
5. Ipoteze statistice: normalitatea erorilor,
homoscedasticitatea, necorelarea erorilor,
multicoliniaritatea.

29
1/31/2018

5. Verificarea ipotezelor modelului de


regresie
Ipotezele statistice care se formulează în modelarea
econometrică sunt ipoteze asupra componentei aleatoare
(erorilor) şi ipoteze asupra componentei deterministe
(variabilelor independente).

5.1. Ipotezele asupra componentei aleatoare (erorilor) sunt


următoarele:
a. Media erorilor este nulă: M(εi)=0.
b. Ipoteza de homoscedasticitate: V(εi)=σ2
c. Ipoteza de normalitate:  i ~ N (0,  2 )

d. Ipoteza de necorelare sau de independenţă a erorilor:


cov(εi, εi)=0.

30
1/31/2018

a. Media erorilor este nulă


1. Definire: M(εi)=0 care este echivalentă cu M(Y/X)=β0+ β1X.

2. Efectele încălcării acestei ipoteze:


- dacă această ipoteză este încălcată, atunci se modifică
proprietăţile estimatorilor parametrilor modelului de regresie
(parametrii sunt estimaţi deplasat sau cu o eroare
sistematică).

3. Testarea ipotezei cu privire la media erorilor


 Ipoteze:
H0: M(ε)=0
H1: M(ε)#0
 Alegerea testului: t  M̂ (  )  M (  )
V̂ ( M̂ (  ) )
 Calculul statisticii test:
M ( ei )
tcalc 
sM̂ (  )

 Decizie

31
1/31/2018

4. Exemplu

Residuals Statisticsa

Minimum Maximum Mean Std. Deviation N


Predicted Value 58508,12 6084511 1582428 1957596,554 15
Residual -98125,2 131202,7 ,00000 73271,63549 15
Std. Predicted Value -,778 2,300 ,000 1,000 15
Std. Residual -1,290 1,725 ,000 ,964 15
a. Dependent Variable: salariu

One-Sample Statistics

Std. Error
N Mean Std. Deviation Mean
Unstandardized Residual 15 ,0000000 73271,63549 18918,65

32
1/31/2018

One-Sample Test

Test Value = 0
95% Confidence
Interval of the
Mean Difference
t df Sig. (2-tailed) Difference Lower Upper
Unstandardized Residual ,000 14 1,000 ,00000000 -40576,5 40576,48

5. Corectarea modelului
 Modelul iniţial se corectează cu ajutorul estimaţiei
erorilor calculate la nivelul eşantionului.
 Modelul corectat este de forma:

y*i  0  i xi  ui
 , unde:

y*i  yi  M (  i )

33
1/31/2018

b. Ipoteza de homoscedasticitate a erorilor

1. Definire
- ipoteza de homoscedasticitate presupune ca varianţa
erorilor să fie constantă:
V(i )   2

- această ipoteză presupune o varianţă constantă şi egală a


erorilor la nivelul distribuţiilor condiţionate de forma
Y X  xi

2. Efectele încălcării acestei ipoteze


 pierderea eficienţei estimatorilor parametrilor modelului de
regresie (estimează parametrul cu o varianţă mai mare).

3. Identificarea heteroscedasticităţii

3.1. Procedee grafice


- presupun reprezentarea distribuţiei erorilor şi aprecierea
varianţei acesteia.

34
1/31/2018

- cazul existenţei heteroscedasticităţii:

1
X
0 Residuals
0 5 10 15 20 25 30 35
-1

-2

-3

3.2. Procedee numerice


a. Testul Glejser

 are la bază un model de regresie între variabila reziduală


estimată şi variabila independentă.

Etapele testării:
1. Se estimează modelul de regresie de forma:
Y   0  1  X  
2. Se calculează erorile estimate ei.
3. Se construieşte un model de regresie pe baza erorilor
estimate în valoare absolută şi variabila

35
1/31/2018

independentă. Exemplu:

 i   0  1  xi  ui
4. Se testează parametrii acestui model: dacă parametrul α1
este semnificativ, atunci modelul iniţial este
heteroscedastic.

Exemplu:

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) 50921,663 12000,771 4,243 ,001
PIB ,016 ,012 ,348 1,337 ,204
a. Dependent Variable: erori

36
1/31/2018

b. Testul Spearman (coeficient al corelaţiei neparametrice)


- se bazează pe calculul rangurilor valorilor estimate ale
erorilor, εi , şi a valorilor Xi .

Ipoteze statistice:
H0: ipoteza de homoscedasticitate
H1: ipoteza de heteroscedasticitate

Statistica test: ˆ n  2
t
1  ˆ 2

 Valoarea calculată a statisticii test:


r n2
tcalc 
1 r2

unde: r este o estimaţie a coeficientului Spearman.

37
1/31/2018

Regula de decizie:
 tcalc>tteor sau o valoare a lui Sig. asociată statisticii test t
Student calculate < 0,05 duce la respingerea ipotezei Ho.

Exemplu:
În studiul legăturii dintre două variabile, X şi Y, s-au obţinut
următoarele rezultate:

Correlations

Unstandardiz
X ed Residual
Spearman's rho X Correlation Coefficient 1,000 ,000
Sig. (2-tailed) . 1,000
N 5 5
Unstandardized Residual Correlation Coefficient ,000 1,000
Sig. (2-tailed) 1,000 .
N 5 5

38
1/31/2018

Se cere să se testeze ipoteza de homoscedasticitate,


considerând un risc de 0,05.

Rezolvare:
Pentru aceasta, se formulează următoarele ipoteze statistice:
H0: ipoteza de homoscedasticitate
H1: ipoteza de heteroscedasticitate

Statistica test : r n2


t
1 r2

39
1/31/2018

 Coeficientul Spearman este:

r 0

 Statistica test t Student se calculează astfel:

r n2 0 52
tcalc   0
1 r 2 10

Regula de decizie:
- pentru exemplul dat:

(t calc  0)  (t 0, 025;3  3,182 )

Deci, se acceptă, cu o probabilitate de 0,95, ipoteza Ho,


ipoteza de homoscedasticitate.

40
1/31/2018

c. Testul Goldfeld-Quandt
Are la bază ideea că între valorile varianţei erorilor la nivelul
repartiţiilor condiţionate şi valorile variabilei dependente
există o legătură pozitivă de forma:

 i2   2 xi2
Ipoteze statistice:
H0: ipoteza de homoscedasticitate
H1: ipoteza de heteroscedasticitate

Etape pentru calculul statisticii test:


- se ordonează crescător valorile xi .

- se împarte seria în două părţi egale, după omiterea unui set de


date din centrul seriei (în cazul seriilor cu un număr mare de
termeni);

- se estimează parametrii ecuaţiei de regresie pentru fiecare din


cele două seturi de date şi se calculează variaţia reziduală
(RSS) pentru fiecare model în parte;

41
1/31/2018

- se calculează statistica test Fisher care compară cele două


variaţii reziduale:

RSS 2
Fcalc 
RSS1

unde: RSS1 corespunde celei mai mici valori a variaţiei


reziduale.

Regula de decizie:

- dacă Fcalc  F0, 05;n  k ;n  k sau Sig.<0.05, atunci se


respinge ipoteza Ho.

Exemplu:

Pentru două variabile, X şi Y, se cunosc următoarele valori:

42
1/31/2018

xi yi

2 15

3 20

1 10

4 19

6 25

5 23

7 30

8 35

9 38

10 40

 Se cere să se testeze ipoteza de homoscedasticitate, folosind


testul Goldfeld-Quandt.

Rezolvare:
1. Se ordonează crescător şirul valorilor xi.
2. Se împarte seria valorilor xi în două serii: prima serie este
reprezentată de valorile 1, 2, …, 5; iar a doua serie este
reprezentată de valorile 6, 7, …, 10.

43
1/31/2018

3. Pentru fiecare din cele două serii se estimează parametrii


modelului de regresie. Se obţine:

Seria 1: Yx=8,3+3X
Seria 2: Yx=3,2+3,8X

4. Pentru aceste modele, se estimează variaţia reziduală (valoare


prezentată în output-ul ANOVA):
- pentru seria 1: RSS=3,73;
- pentru seria 2: RSS=1,6.

5. Se calculează raportul F, considerând RSS1 cea mai mică


valoare, şi anume RSS1=1,6:
Fcalc=3,73/1,6=2,33.

6. Se compară valoarea calculată a statisticii test F cu


valoarea teoretică:

F0,05;n1 k ;n2 k  F0,05;52;52  9,277.


(k este numărul de parametri estimaţi).

44
1/31/2018

7. Interpretare:

( Fcalc  2,33)  ( F0,05;3;3  9,277)


Pentru exemplul dat, se acceptă ipoteza de
homoscedasticitate, cu o probabilitate de 0,95.

4. Corectarea heteroscedasticităţii
4.1. Dacă se cunosc parametrii  i2
Corecţia heteroscedasticităţii este aplicată modelului
de regresie liniară simplă:

yi  0  1 xi   i
Corectarea heteroscedasticităţii presupune
1
ponderarea modelului iniţial cu variabila .
i

45
1/31/2018

Noul model de regresie (corectat) se obţine astfel:


yi 0 x 
  1 i  i
i i i i

Estimarea parametrilor acestui model se realizează


pe baza MCMMP ponderată (method of weighted
least squares).

4.2. Dacă nu se cunosc parametrii  i2


Corecţia heteroscedasticităţii se realizează pe baza
relaţiei:

 i2   2 xi2
Corectarea heteroscedasticităţii presupune
ponderarea modelului iniţial cu variabila 1/xi.

46
1/31/2018

Noul model de regresie (corectat) este de forma:

yi  0 
  1  i
xi xi xi

c. Ipoteza de normalitate a erorilor


1. Formularea problemei
- erorile ε urmează o lege normală de medie 0 şi varianţă
σ2 :

 i ~ N (0,  2 )
2. Efectele încălcării acestei ipoteze
- ipoteza de normalitate a erorilor este importantă pentru
stabilirea proprietăţilor estimatorilor parametrilor
modelului de regresie.

47
1/31/2018

 dacă  i ~ N ( 0 , 2 ) , atunci estimatorii parametrilor modelului de


regresie urmează, de asemenea, o lege normală:
ˆi ~ N (  i ,  2ˆ )
i

 dacă ipoteza de normalitate este încălcată, atunci estimatorii


parametrilor modelului de regresie nu urmează o lege
normală (pentru eşantioane de volum mare, proprietatea de
normalitate este atinsă asimptotic).

3. Verificarea normalităţii erorilor


3.1. Procedee grafice

- Histograma (curba frecvenţei):


- P-P Plot sau Q-Q Plot;
- Box-Plot;

48
1/31/2018

a. Reprezentarea histogramei şi a curbei frecvenţelor


- se reprezintă curba frecvenţei sau histograma reziduurilor
şi se observă dacă forma distribuţiei acestora are alură de
clopot.

Exemplu:

Histograma şi curba frecvenţelor

Histogram

Dependent Variable: greut


3,0
2,5
Frequency

2,0
1,5
1,0
0,5
0,0
Mean = -1,85E-15
-2 -1 0 1 2 Std. Dev. = 0,943
N = 10
Regression Standardized Residual

49
1/31/2018

b. P-P Plot
Normal P-P Plot of Regression Standardized
Residual

Dependent Variable: greut


1,0
Expected Cum Prob
0,8

0,6

0,4

0,2

0,0
0,0 0,2 0,4 0,6 0,8 1,0

Observed Cum Prob

c. Box-plot

70

65

60

55

50

45

greut

50
1/31/2018

3.2. Procedee numerice


a. Testul Kolmogorov-Smirnov
- presupune compararea frecvenţelor cumulate (calculate) cu
frecvenţele teoretice cumulate extrase din tabelul Gauss.

Ipoteze statistice:
H0: ipoteza de normalitate
H1: distribuţia erorilor nu urmează o lege normală

Regula de decizie:

 valoarea probabilităţii asociate statisticii test calculate (Sig.)


se compară cu  (0,05): dacă Sig.<0,05, atunci se
respinge ipoteza de normalitate a erorilor.

Exemplu:

51
1/31/2018

One-Sample Kolmogorov-Smirnov Test

greut
N 10
Normal Parameters a,b Mean 58,5000
Std. Deviation 7,83511
Most Extreme Absolute ,276
Differences Positive ,161
Negative -,276
Kolmogorov-Smirnov Z ,873
Asymp. Sig. (2-tailed) ,432
a. Test distribution is Normal.
b. Calculated from data.

b. Testul Jarque-Bera
- se bazează pe verificarea simultană a proprietăţilor de
asimetrie şi boltire ale seriei reziduurilor. Pentru o
distribuţie normală, valoarea coeficientului de asimetrie
Fisher (sw) este zero, iar valoarea coeficientului de
boltire Fisher (k) este zero.

Ipoteze statistice
H0: ipoteza de normalitate
H1: distribuţia erorilor nu urmează o lege normală

52
1/31/2018

Calculul statisticii test:


 statistica test JB se calculează după relaţia:

n  2 k 2 
JB   sw 
6  4 

unde: sw este coeficientul de asimetrie (Skewness):


3
sw 
3
k este coeficientul de boltire (Kurtosis):

4
k 3
 22

 În cazul unui model de regresie, estimaţiile celor doi


parametri ai formei unei distribuţii au următoarele relaţii:
ei3 2
( )
i n2
sw 
e2
( i ) 3
i n2

ei4
n2
k i
3
e2
( i ) 2
i n2

53
1/31/2018

unde: ei  y i  y x i

Regula de decizie:
Statistica JB urmează o lege 2 , 2 .
- dacă valoarea calculată a statisticii test JB > 2 ; 2
sau Sig.<0,05, atunci se respinge ipoteza Ho.

Exemplu.

Descriptive Statistics

N Minimum Maximum Mean Std. Skewness Kurtosis


Statistic Statistic Statistic Statistic Deviation
Statistic Statistic Std. Error Statistic Std. Error
Unstandardized Residual 7 -2.61905 2.14286 .0000000 1.889822 -.529 .794 -1.375 1.587
Valid N (listwise) 7

54
1/31/2018

ECONOMETRIE

109

d. Ipoteza de necorelare sau de independenţă a


erorilor: cov(εi, εi)=0.
1. Noţiuni

a. Autocorelarea sau corelaţia serială :


- presupune existenţa unei autocorelări între erorile ε,
altfel spus: cov(εi, εj) # 0 sau M(εi, εj ) # 0.

b. Coeficientul de autocorelaţie
- coeficientul de autocorelaţie între erorile εi şi εi-1 ale
unui model de regresie se calculează după

110

55
1/31/2018

relaţia: cov(  i , i 1 ) cov(  i , i 1 )


 
 i  i 1 2

- acest coeficient este un coeficient de autocorelaţie de ordinul


1.
c. Funcţia de autocorelaţie
 este definită de valorile coeficienţilor de autocorelare de
ordinul k.

111

2. Sursa autocorelării erorilor


- neincluderea în modelul de regresie a uneia sau mai multor
variabile explicative importante;
- inerţia fenomenelor în timp şi decalajul, în cazul seriilor de
timp;
- modelul de regresie nu este corect specificat.

3. Testarea autocorelării erorilor

112

56
1/31/2018

3.1. Testul Durbin-Watson


Ipoteze statistice:
H0: erorile nu sunt autocorelate ( = 0)
H1: erorile sunt autocorelate (  0 )

Calculul statisticii test:

 (ˆ ˆ i i 1 )2
DW  d  i 2

 ˆ i 1
i
2

113

Întrucât  i   i1  ui statistica DW se mai poate scrie astfel:

 ˆ i  2 ˆ i ˆ i 1   ˆ i 1
2 2
 ˆ i   ˆ i ˆ i 1
2   ˆ i ˆ i 1 
 
d i i i
2 i i
 2   1  i 2   2  ( 1  ˆ )
 ˆ i  ˆ i  ˆ i 
2 2

i i  i 

Deoarece  1  ˆ  1 , valorile statisticii DW sunt date de


intervalul: 0  d  4

114

57
1/31/2018

Interpretare:
 Dacă ˆ  1  d  0 , atunci există autocorelare pozitivă
maximă a erorilor;
 Dacă ˆ  1  d  4 , atunci există autocorelare negativă
maximă a erorilor;
 Dacă ˆ  0  d  2 , atunci nu există autocorelare.

115

Regula de decizie:
 Valorile teoretice ale statisticii DW sunt calculate şi tabelate
în funcţie de pragul de semnificaţie, de volumul eşantionului
şi de numărul de parametri ai modelului.

 În tabele se determină două valori critice, notate cu dL (limita


inferioară) şi dU (limita superioară).

116

58
1/31/2018

 În funcţie de aceste valori critice se determină următoarele


intervale, care permit luarea deciziei de respingere sau
acceptare a ipotezei nule:

a. (0<dcalc<dL) se respinge ipoteza Ho, erorile înregistrează o


autocorelare pozitivă;
b. (dL<dcalc<dU) şi (4-du<dcalc< 4-dL) sunt regiuni de
nedeterminare, nu se poate decide asupra existenţei
autocorelării erorilor;

117

c. (du <dcalc< 4- du) se acceptă ipoteza Ho, erorile nu sunt


autocorelate;
d. (4-dL <dcalc< 4) se respinge ipoteza Ho, erorile înregistrează o
autocorelare negativă.

Exemplu:
În studiul legăturii dintre două variabile, X şi Y, observate
pentru un eşantion format din 25 unităţi statistice, s-a estimat
un model de regresie liniară simplă şi s-au obţinut
următoarele rezultate:

118

59
1/31/2018

Calculul statisticii Durbin Watson în SPSS:

Model Summaryb

Adjusted Std. Error of Durbin-


Model R R Square R Square the Estimate Watson
1 ,985a ,970 ,960 2,41523 1,429
a. Predictors: (Constant), X
b. Dependent Variable: Y

Să se testeze ipoteza de autocorelare a erorilor, considerând un


risc de 0,05.

119

3.2. Runs Test


- se bazează pe ideea că valorile variabilei reziduale se
constituie în secvenţe sau seturi de valori pozitive sau
negative numite runs, care se succed într-o anumită ordine
sau aleator.

- ipoteza de bază a acestui test este aceea că, în cazul lipsei


autocorelării erorilor, succesiunea acestor seturi (runs, notate
k) este aleatoare sau numărul acestora este distribuit normal.

120

60
1/31/2018

Ipoteze statistice
H0: k este distribuit normal (nu există autocorelare a erorilor)
H1: k nu este distribuit normal (ipoteza este încălcată)

Calculul statisticii test


- se foloseşte statistica t Student, calculată după relaţia:
k  M (k )
t calc 
sk
unde: k este numărul de runs caracterizat prin:

121

n1 n2
M( k )  2 1
n1  n2

2n1n2  n1  n2
sk2  2n1n2
( n1  n2 ) 2 ( n1  n2  1)

122

61
1/31/2018

 n1 este numărul de valori pozitive ale erorilor ei ;


 n2 este numărul de valori negative ale erorilor ei,

cu n1 + n2 = n .

Regula de decizie:
- dacă |tcalc|  ta/2,n-2 , atunci se acceptă ipoteza H0.

123

Exemplu:
Pentru două variabile, X şi Y, s-au obţinut următoarele
rezultate: Runs Test 2

Unstandardiz
ed Residual
Test Valuea ,0000000
Cases < Test Value 17
Cases >= Test Value 15
Total Cases 32
Number of Runs 3
Z -4,849
Asymp. Sig. (2-tailed) ,000
a. Mean

Să se testeze ipoteza de autocorelare a erorilor, folosind testul


Runs.
124

62
1/31/2018

4. Efectele încălcării ipotezei de necorelare a erorilor


 în aceste condiţii, prin aplicarea MCMMP, se obţine pentru
parametrul β0 un estimator neeficient.

6.2. Ipotezele asupra variabilelor independente


1. Variabilele independente sunt nestochastice sau
deterministe.

2. Variabilele independente şi variabila eroare sunt


necorelate, cov (Xi,εi)=0.
- această ipoteză este îndeplinită dacă variabilele independente
sunt nestochastice.
125

3. Ipoteza de necoliniaritate a variabilelor


independente
a. Definire
 Coliniaritatea poate fi definită ca o legătură liniară
funcţională existentă între două sau mai multe variabile
independente ale unui model de regresie multiplă de
forma:

YX1 , Xp  0  1  X1  2  X 2     p  X p  
a.1. Coliniaritate perfectă
126

63
1/31/2018

 apare atunci când între variabilelele independente X1, X2, ...,


Xp există o legătură liniară perfectă, funcţională. Această
legătură poate fi exprimată printr-o relaţie de forma:

1  X 1  2  X 2     p  X p  0

unde: λi, cu i=1, ..., p, valori constante care nu sunt toate, în mod
simultan, nule.

127

a.2. Coliniaritatea imperfectă


 Poate fi definită ca o relaţie liniară puternică existentă între
două sau mai multe variabile independente.

1  X 1  2  X 2     p  X p  u  0

128

64
1/31/2018

b. Efectele coliniarităţii
 Varianţa estimatorilor parametrilor modelului de regresie
creşte, adică estimatorii pierd proprietatea de eficienţă.
 În cazul unei coliniarităţi perfecte, varianţa estimatorilor este
infinită (parametrii modelului nu pot fi estimaţi).
 În cazul unei coliniarităţi imperfecte, varianţele estimatorilor
sunt mari.

129

c. Testarea coliniarităţii
c.1. Folosind procedee grafice

20,00

15,00
X2

10,00

5,00

R Sq Linear = 1
0,00

0,00 2,00 4,00 6,00 8,00 10,00

X1

130

65
1/31/2018

20,00

15,00
X2

10,00

5,00

0,00 R Sq Linear = 0,902

0,00 2,00 4,00 6,00 8,00 10,00 12,00 14,00

X1

131

c.2. Folosind procedee numerice


1. Factorul varianţei crescute (variance-inflated factor,
VIF)
1
VIF j 
1  R 2j
2
 unde: R j este raportul de determinaţie din modelul de
regresie auxiliar, respectiv dintre variabila Xj şi celelalte
variabile independente.

132

66
1/31/2018

Interpretare:
 Atunci când legăturile dintre variabilele independente sunt
puternice, valoarea raportului de determinaţie se apropie de
unu, iar raportul VIF este infinit.

 Atunci când între variabilele independente nu există corelaţie


(R2j=0), valoarea raportului VIF este egală cu unu.

133

 În practică, o valoare VIF>10 indică prezenţa coliniarităţii.

2. Toleranţa (Tolerance)
- se calculează după relaţia: TOL=1/VIF=1-R2j

Interpretare:
- Dacă valoarea TOL=1, atunci nu există coliniaritate;
- Dacă valoarea TOL=0, atunci există coliniaritate perfectă.

 Existenţa coliniarităţii este sugerată de valorile mici ale


indicatorului TOL.

134

67
1/31/2018

d. Corectarea coliniarităţii
 metodele de corecţie ţin cont de tipul de coliniaritate, de
numărul de variabile din model şi de informaţiile
suplimentare despre fenomenul studiat.
 Cea mai simplă metodă constă în eliminarea variabilei care
introduce coliniaritatea.
 Altă metodă constă în construirea unui model cu variabile
transformate prin diverse funcţii sau operatori (de exemplu,
operatorul decalaj, diferenţă).

135

Exemplu:
În urma analizei legăturilor dintre variabilele independente ale
unui model de regresie, s-au obţinut următoarele rezultate:

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients Collinearity Statistics
Model B Std. Error Beta t Sig. Tolerance VIF
1 (Constant) 65,705 27,731 2,369 ,037
X1 48,979 10,658 ,581 4,596 ,001 ,950 1,052
X2 59,654 23,625 ,359 2,525 ,028 ,753 1,328
X3 -1,838 ,814 -,324 -2,258 ,045 ,738 1,355
a. Dependent Variable: Y

136

68

S-ar putea să vă placă și