Sunteți pe pagina 1din 33

Curs 7

MODELUL DE REGRESIE LINIAR UNIFACTORIAL (IV)

Etapele modelrii econometrice(2/2)


4. Evaluarea validitii modelului

I.

- se verific dac variaia lui X este un bun predictor pentru variaia lui Y
- presupune:
Inferenta statistica pentru parametrii modelului de regresie

II.

Testarea validitii modelului de regresie folosind metoda ANOVA

III.

Determinarea masurii calitatii ajustarii

IV.

Verificarea ipotezelor modelului de regresie

5. Realizarea de predicii utiliznd modelul de regresie

4. IV. Ipotezele modelului de regresie liniar


unifactorial
I1: Cele dou variabile yi i xi sunt observate fr erori de msur.
I2: Variabila aleatoare este de medie nul, E(i) = 0.
I3: Varianta variabilei reziduale, 2 este constant i independent de
variabila exogen X - ipoteza de homoscedasticitate a erorilor.
Functia de consum
1200
1000
800
consum

Se consider un model care descrie


consumul unor gospodrii n funcie
de venitul acestora. n acest caz,
consumul gospodriilor mari poate
varia mult mai mult fa de
consumul gospodriilor cu venituri
mici.
Deci
ipoteza
de
homoscedasticitate
nu
este
respectat.

600
400
200
0
200

300

400

500

600

700

800

900

1000

venit

4. IV. Ipotezele modelului de regresie liniar


unifactorial(Ipotezele MCMMP)

I1: Cele dou variabile yt i xt sunt observate fr erori de


msur
Aceast ipotez se verific cu regula celor trei sigma:

I3:Ipoteza de homoscedasticitate a erorilor-Variabila


rezidual este de medie nul, E(i)=0 si dispersia ei, 2
este constant i independent de variabila exogen X(1/4)

In cazul modelului liniar


reziduurile i y i y i y i a bxi
sunt homoscedastice dac dispersiile lor sunt constante si independente de
variabila exogen X:
Contrariul homoscedasticitii este heteroscedasticitatea, ceea ce nseamn c
erorile nu au dispersiile egale ci diferite.
Procedee de depistare a heteroscedaticitii erorilor:
1. Procedeul grafic care const n construirea corelogramei dintre variabile
variabilei exogene X si erorile . Dac pe msura creterii(scderii) valorilor
variabilei exogene X se observ o cretere(scdere) a valorilor erorilor,
atunci cele dou variabile sunt corelate si nu independente.

Corelare pozitiv

Corelare negativ

I3:Ipoteza de homoscedasticitate a erorilor-Variabila


rezidual este de medie nul, E(i)=0 si dispersia ei, 2
este constant i independent de variabila exogen X(2/4)
2. Testul White:
estimarea parametrilor modelului iniial i calculul valorilor estimate ale
variabilei reziduale, .
construirea unei regresii auxiliare, bazat pe prespunerea existenei unei
relaii de dependen ntre ptratul valorilor erorii, variabila exogen inclus n
modelul iniial i ptratul valorilor acesteia:

si calcularea coeficientului de determinaie R2, corespunztor acestei


regresii auxiliare.

0
1
2
verificarea semnificaiei parametrilor modelului nou construit H0
iar dac unul dintre acetia este semnificativ diferit de zero, atunci ipoteza
de heteroscedasticitate a erorilor este acceptat.

I3:Ipoteza de homoscedasticitate a erorilor-Variabila


rezidual este de medie nul, E(i)=0 si dispersia ei, 2
este constant i independent de variabila exogen X(3/4)

0 1 2 0

Fc F ;v1 ;v2

I3:Ipoteza de homoscedasticitate a erorilor-Variabila


rezidual este de medie nul, E(i)=0 si dispersia ei, 2
este constant i independent de variabila exogen X(4/4)
Eliminarea fenomenului de heteroscedasticitate a erorilor se realizeaz cu
ajutorul metodei regresiei ponderate:
Ecuatia modelului

se imparte la xi, rezultand modelul:

Notand cu

Se obtine modelul
si se estimeaza
parametrii modelului cu MCMMP si se verifica ipoteza de
homoscedasticitate a noilor erori cu ajutorul testului
White.
9

I4: Autocorelarea erorilor


Problemele ce se pun n acest caz sunt:
1. Identificarea cauzelor de apariie a corelrii erorilor
2. Testele statistice utilizate pentru depistarea autocorelrii
3. Procedee de eliminare a fenomenului de autocorelare a
erorilor
In cazul existenei fenomenului de autocorelaie a erorilor, cov(i,j)0,
M.C.M.M.P. nu mai permite obinerea de estimatori eficieni, prezentnd
distorsiuni de la valorile reale.
Se pstreaz ns calitatea acestora de a fi consisteni, fapt ce impune
introducerea n calcul a unor serii de date suficient de lungi (eantion de
valori ct mai mare).
10

1.Cauzele de apariie a autocorelrii erorilor

Absena uneia sau mai multor variabile explicative importante


neincluderea uneia sau mai multor variabile explicative
importante poate genera autocorelarea erorilor.
exemplu: y i a bx1i cx 2i i
variabila exogen x3 este omis variabilele reziduale sunt
autocorelate i reziduul va fi explicitat prin intermediul
acestei variabile omise: i x3i u i

Modelul de regresie nu este corect specificat: fie modelul se


exprim sub forma unei combinaii liniare de variabile n
condiiile n care o specificare corect a modelului trebuie s fie
exprimat printr-o combinaie liniar de logaritmi de variabile
exogene etc.

Au fost fcute transformri neadecvate sau interpolri n


cadrul seriei de date
11

2.Procedee
erorilor(1/6)

de

depistare

autocorelrii

2.1. Procedeul grafic se realizeaz corelograma ntre valorile


estimate ale variabilei endogene i valorile variabilei reziduale.

i
y i
Grafic, autocorelarea erorilor se manifest
printr-o oscila ie
regulat a valorilor variabilei reziduale fa de valorile estimate ale
variabilei endogene.
12

2.Procedee
erorilor(2/6)

de

depistare

autocorelrii

2.2. Calculul coeficientului de autocorelaie a erorilor de


ordinul nti:
n

r1


i 2
n 1

i i 1

i
i 1


i 2
n

i i 1

i 1

r1 1; 1

i2

1, autocorela ie strict negati v

r1 0, independen
1, autocorela ie strict pozitiv

2.Procedee
erorilor(3/6)

de

depistare

autocorelrii

2.3. Testul Durbin-Watson:


n

DW

i i 1
i 2

i
i 1

Aceast valoare empiric DW, se compar cu dou valori teoretice, d1 i


d2, preluate din tabelul distribuiei Durbin-Watson n funcie de un prag
de semnificaie , arbitrar ales, ( = 0,05 sau = 0,01), de numrul
de variabile exogene (k) i de valorile observate(n).

2.Procedee
erorilor(4/6)

de

depistare

autocorelrii

Observaii:
Testul Durbin-Watson verific
doar existena autocorelrii de
ordinul 1 al erorilor;
Testul Durbin Watson nu poate fi
aplicat dect dac:
modelul de regresie are termen
liber;
printre variabilele explicative nu
se afl i variabila endogen cu
decalaj;
seriile de date nu sunt atributive

15

2.Procedee
erorilor(5/6)

de

depistare

autocorelrii

Regulile de decizie ale aplicrii testului Durbin-Watson

0 DW d1 d1 DW d2 d2 DW 4-d2
Autocorelare
pozitiv

Indecizie

4-d2 DW 4-d1

4-d1 DW <4

Indecizie

Autocorelare
negativ

Erorile sunt
independente

0 < DW < d1 autocorelare pozitiv a erorilor


d1 DW d2 indecizie, recomandat acceptarea autocorelrii pozitive
d2 < DW < 4-d2 erori independente
4-d2 DW 4-d1 indecizie, recomandat acceptarea autocorelrii negative
4-d1< DW <4 autocorelare negativ a erorilor
16

2.Procedee
erorilor(6/6)

de

depistare

autocorelrii

H0: r1 = 0
H1: r1 0, r1 = coeficientul de autocorelaie a erorilor de ordinul nti.
n

DW

i2

i 2

i 2


i 2
n 1

i i 1


i 1

Pentru n i
2

i 2

i 2

2
i 1

i
i 1

i 1

DW 2 2

i 1 2 ii 1
2

DW 2 1 r1 r1 1

2
i

DW
d [0,4]
2

1 autocorela re strict negativ


4
indecizie

r1 0 independen
d 2
indecizie

1 autocorela re strict pozitiv


0
17

3.Procedee de eliminare
autocorelare a erorilor(1/2)

i y i y i y i a bxi

fenomenului

de

y i a bxi

i 1 y i 1 y i 1 y i 1 a bxi 1
y i a bxi r1 ( y i 1 a bxi 1 ) vi
y i r1 y i 1 a (1 r1 ) b( xi r1 xi 1 ) vi

18

3.Procedee de eliminare
autocorelare a erorilor(1/2)

fenomenului

de

Calculul coeficientului de autocorelaie cu ajutorul relaiei:


n

r1


i 2
n 1

i 1


i 1

2
i

Notnd cu: yi* yi r1 yi 1

xi* xi r1 xi 1

a1 a (1 r1 )
b b
1

Obtinem urmatorul model:

yi* a1 b1 xi* vi

Se estimeaz parametrii noului model i apoi se revine la modelul iniial.

19

Ipoteza de normalitate a variabilei reziduale(1/3)


Dac erorile urmeaz legea normal de medie zero i de abatere medie
ptratic, atunci are loc relaia:

P i t 1

n funcie de diferite praguri de semnificaie , din tabela distribuiei normale


sau a distribuiei Student se vor prelua valorile corespunztoare lui t.
1.Procedeul grafic

- pe axa Ox se vor reprezenta valorile


ajustate ale variabilei endogene, i,
iar pe axa Oy se vor trece valorile
estimate ale variabilei reziduale, i.
- Dac valorile empirice ale variabilei
reziduale se nscriu n banda t ,
cu un anumit prag de semnificaie ,
ipoteza de normalitate a variabilei
reziduale poate fi acceptat cu acest
prag de semnificaie.
20

Testarea
normalitii
reziduale(2/3)

distribuiei

variabilei

2. Testul Jarque-Bera(JB):
H0:erorile nu sunt normal distribuite
H1: erorile sunt normal distribuite
Valoarea statisticii JB:

S 2 K 3 2
2
JB n

~ ;2
24
6

Se bazeaz pe ipoteza c distribuia normal are un coeficient de asimetrie


egal cu zero, S = 0, i un coeficient de aplatizare egal cu trei, K = 3.
Dac coeficientul de aplatizare excede 3, distribuia este leptocurtica fa
de normal, n caz contrar distribuai este platicurtic comparativ cu normala.
n= numrul de observaii;
S= coeficientul de asimetrie(skewness) al variabilei reziduale, ce msoar
simetria distribuiei erorilor n jurul mediei acestora:
n

1
yi y
n i 1
S
3

21

Testarea
normalitii
reziduale(3/3)

distribuiei

variabilei

K = coeficientul de aplatizare calculat de Pearson (kurtosis), ce msoar


boltirea distribuiei (ct de ascuit sau de aplatizat este distribuia
4
1 n
comparativ cu distribuia normal):
y

y
i
n i 1
K
4

Decizia:
Dac valoarea testului JB este inferioar valorii tabelate se accept H0,
erorile nu sunt normal distribuite;
Dac valoarea testului JB este superioar valorii tabelate se accept H1,
erorile sunt normal distribuite.

22

5.Realizarea de predicii utiliznd modelul de


regresie(1/2)

1. Tipuri de predicii

Estimri punctuale
Estimri pe intervale de ncredere

2.

Care e obiectul prediciei?


Valoarea individual (Yi) pentru o valoare particular a lui X

Dac presupunem c variabila independent ia valoarea specificat(particular), Xn+v, i


legtura liniar se menine, atunci valoarea corespunztoare a variabilei dependente
Yn+v este:

Yn v X n v
Pentru a obine estimaii punctuale folosim ecuaia de regresie liniar la nivel
de eantion:
yi = a + bxi + i nlocuind cu valoarea dat Xn+v obinem estimaia punctual:

Yn v a bX n v
23

5.Realizarea de predicii utiliznd modelul de


regresie(2/2)

Construirea intervalului de ncredere pentru previziune necesit cunoaterea


distribuiei, mediei i dispersiei pentru
y n. v
Variabila y
urmeaz o distribuie t cu (n k 1) grade de libertate.
nv

Determinarea intervalului de prognoz (previziune):

n v t / 2 , n k 1 s y nv
yn v y

Dispersia erorii de previziune la nivel de eantion este:

2
y n v

1 ( xn v x)

s 1 n

n
2
( xi x)

i 1

24

Ipotezele modelului de regresie(1/)


Pentru 15 ageni de asigurri, angajai ai unei companii de asigurri de via, se
cunosc datele privind timpul mediu (n minute) petrecut de un agent cu un
potenial client i numrul de polie ncheiate de fiecare ntr-o sptmn.

Timp mediu
(min.)

25

23

30

25

20

33

18

21

22

30

26

26

27

29

20

Nr. polie

10

11

14

12

18

10

10

15

11

15

12

14

11

A. S se verifice ipoteza de homoscedaticitate a erorilor;


B. Sa se verifice ipoteza de autocorelare a erorilor;
C. Sa se verifice ipoteza de normalitate a erorilor;
D. Sa se construiasc un interval de ncredere pentru numarul de polite
daca valoarea anticipat a timpului mediu petrecut de un agent cu un
potential client este de 35 min, daca rezultatele se garanteaza cu
probabilitate de 95%.

26

Ipoteza
de
erorilor(1/2)

homoscedasticitate

Verificarea ipotezei de homoscedasticitate a erorilor prin:


1. Procedeu grafic
Deoarece graficul punctelor
empirice
prezint
o
distribuie oscilant, se
poate accepta ipoteza c
cele dou variabile, x i ,
sunt independente i nu
corelate.

27

Ipoteza
de
erorilor(2/2)

homoscedasticitate

Verificarea ipotezei de homoscedasticitate a erorilor prin:


2. Testul White
Etapa 1 : Se estimeaz parametrii modelului liniar de regresie : y i 1,73 0,5492 xi
Etapa 2 : Se calculeaz erorile
modelul:
i se obine:

iar pe baza acestora, se estimeaz

, R2=0.014

Etapa 3: Se calculeaz testul LM :

LM 0.216 02,05; 2 5,99


homoscedastice.

=>se accept ipoteza H0 =>erorile sunt

Se calculeaz testul Fisher pentru verificarea validitii modelului de regresie


auxiliara: Fc=0.087<F0,05;2;12=3.88=>modelul nu este valid=>erorile sunt
homoscedastice.
28

Ipoteza de autocorelare a erorilor(1/2)


Verificarea ipotezei de autocorelare a erorilor prin:
1. Procedeu grafic

Corelograma intre i si i-1

29

Ipoteza de autocorelare a erorilor(2/2)


Verificarea ipotezei de non-autocorelare a erorilor prin:
2. Testul Durbin-Watson
Etapa 1 : Se estimeaz parametrii modelului liniar de regresie :

y i 1,73 0,5492 xi
Etapa 2 : Se calculeaz erorile:
Etapa 3 : Se calculeaz valoarea variabilei Durbin -Watson : DW


i2

i 1


i 1

2.39

Etapa 3 : Pentru = 0,05 (pragul de semnificaie), k = 1 (nr. variabilelor


exogene) i n =15 (nr. de observaii), valorile teoretice ale variabilei DurbinWatson, preluate din tabela distribuiei Durbin-Watson sunt: d1=1,08 i
d2=1,36.
Etapa 4 : n comparaie cu acestea, valoarea empiric DW, se situeaz astfel:
d2=1,36<DW(2,39)<4-d2 (4-1,36).
Deci, ipoteza de independen a erorilor este acceptat.
30

Testarea
normalitii
reziduale(1/2)

distribuiei

variabilei

1. Procedeu grafic

31

Testarea
normalitii
reziduale(2/2)
2. Testul Jarque-Bera(JB):
H0:erorile nu sunt normal distribuite
H1: erorile sunt normal distribuite

distribuiei
In excel:
Skew=0.38

variabilei
In excel:
Kurt=-0.38

Valoarea statisticii JB:

S 2 K 3 2
0.382 (0.38 3)2
2
JB n

7
.
52

15
, 2 5.99

24
24
6

6
Cum valoarea calculat a testului JB este superioar valorii tabelate pentru
un prag de semnificaie de 5%, se respinge H0, se accepta H1, erorile sunt
normal distribuite.

32

5.Realizarea de predicii utiliznd modelul de


regresie(1/1)
Dac timpul mediu este

Estimatie
punctual

xn v 35 , atunci

Yn v 1.73 0.5492 X n v 1.73 0.5492 * 35 17.492


Intervalul de ncredere pentru numrul de polite incheiate de un agent,
daca timpul mediu a fost de 35 min:

yn v y n v t 2;n k 1 s y nv

t / 2;n 2 t0.025,13 2,53


s2

y
i i

n k 1

22.35
1,719
13

Dispersia erorii de prognoz este egal cu:

s y2nv

1
(
x

x
)
1 (35 25) 2
2
nv

2.484
s 1 n
1.719 1

n
15
264

( xi x) 2

i 1

yn v 17.492 2,53 1.576 13,5;21,5

Rezultatele se
gar. cu prob.95%
33