Sunteți pe pagina 1din 52

Conf.univ., dr.

RUSU Viorica


anul universitar 2013/2014


Specificarea unui model de regresie simpl
Definirea modelului de regresie simpl
Identificarea modelului de regresie simpl
Estimarea parametrilor unui model de regresie simpl
Verificarea ipotezelor
Ipoteze asupra unui model econometric (ipoteze stohastice)
Verificarea semnificaiei estimatorilor parametrilor unui
model econometric
Verificarea semnificaiei modelului econometric



Cuprins

Regresia liniar simpl este un caz particular al
analizei de regresie ntr-un astfel de model variabila
dependent ar fi explicat numai de o singur
variabil independent, iar factorii neeseniali sunt
exprimai sintetic prin variabil reziduu.
Specificarea unui model de regresie simpl


Specificarea modelului de regresie pornete de la conceptele
teoriei economice care definesc cadrul de analiz a fenomenelor
luate n studiu.

Spre exemplu n practica analizei economice modelul liniar de
regresie are urmtoarele aplicaii:
funcia de consum din modelul lui Keynes:

=a+b*


unde:

consumul pentru un an

venitul pentru aceeai perioad


a,b parametrii modelului de regresie




Specificarea unui model de regresie simpl


Relaia liniar ntre pregtirea profesional i venitul
obinut;
Legea cererii C=f(P) + cererea (C) a unui produs
crete sau descrete sub influena preului (P);
Legea ofertei O = f(P) + oferta (O) a unui produs
crete sau descrete sub influena preului (P).


Specificarea unui model de regresie simpl


Forma modelului de regresie liniar simpl este:


Unde:
Y variabila endogen;
X variabila exogen;
- variabila rezidual.

Definirea modelului de regresie simpl

Y = +

Parametrii modelului de regresie simpl liniar, numii
i coeficieni de regresie, sunt:

- ordonata la origine - arat valoarea medie a
variabilei Y cnd ;
- panta dreptei - arat variaia medie a variabilei
dependente, Y, la o variaie absolut cu o unitate a
variabilei X, adic variaia variabilei Y este
proporional cu variaia variabilei X.
Definirea modelului de regresie simpl



Const n alegerea unei funcii matematice care ar
descrie cel mai bine valorile variabilei endogene y n
funcie de variaia variabilei exogene x.

Funciile matematice sunt:
Liniare
Non-liniare

Identificarea modelului de regresie simpl


Cel mai simplu procedeu de stabilire a funciei
matematice: procedeul grafic.

Procedeul grafic const n construirea corelogramei
dintre cele dou variabile. Axa OX va fi destinat
variabilei exogene, axa OY variabilei endogene.

n funcie de forma graficului punctelor empirice se
alege funcia matematic al crei grafic aproximeaz
cel mai bine graficul punctelor empirice.
Identificarea modelului de regresie simpl



Spre exemplu:






De menionat, formele non-liniare (putere) se vor
supune liniarizrii prin logaritmare!






Proprieti ale modelului de regresie liniar:

simplitate

capacitatea de aplicare direct pentru verificarea
existenei unei relaii ntre variabile

estimarea direct a parametrilor de regresie


Metoda celor mai mici ptrate (MCMMP):
Dac forma general a modelului este definit de relaia:

= +x


Estimarea parametrilor modelului de regresie se bazeaz pe
criteriul minimizrii sumei ptratelor abaterilor ntre valorile
observate, y
i
, i valorile teoretice,

:
F(,

) = (

)
2

Condiia de minim a acestei funcii rezult din:



Estimarea parametrilor unui model de regresie
simpl


n cazul dreptei de regresie, = +

, construit pe
baza unui eantion observat, estimaiile i

ale
parametrilor i se pot calcula dup relaiile:

2
(

)
2


=



Estimarea parametrilor unui model de regresie
simpl


b coeficient de regresie care prezint cu ct se
modific caracteristica rezultativ dac caracteristica
factorial se modific cu o unitate.
dac:
b=0 , ntre x i y nu exist legtur;
b>0, ntre x i y legtur direct proporional;
b<0, ntre x i y legtur invers proporional.
a termenul liber care exprim aciunea constant a
factorilor nenregistrai.
Estimarea parametrilor unui model de regresie
simpl

Estimarea parametrilor prin interval de ncredere -
se bazeaz pe distribuiile de selecie ale estimatorilor
i

ai parametrilor a i b.
Pentru modelul liniar simplu, estimatorii parametrilor
urmeaz o lege de distribuie normal i sunt nedeplasai:
~(,

2
) cu () = a; ()=

2
;

2
=

2

(

)
2

~(,

2
) cu (

) = b; (

)=

2
;

2
=
1
(

)
2

2


Estimarea parametrilor unui model de regresie
simpl

Estimaii:
pentru variana erorilor

2
:

2
=

2
2
=
(

)
2
2

- pentru variana estimatorului a i b variana
estimatorului :

2
=

2

(

)
2

2
i

2
=
1
(

)
2

2


Estimarea parametrilor unui model de regresie
simpl

Intervalul de ncredere
Intervalul de ncredere pentru:
coeficientul de regresie a este definit de relaia:
= (
2

)

coeficientul de regresie b este definit de relaia:
= (

)


Estimarea parametrilor unui model de regresie
simpl

Estimatorii obinui prin MCMMP sunt estimatori de maxim
verosimilitate dac pot fi acceptate urmtoarele ipoteze:
Variabilele observate nu sunt afectate de erori de msurare;
Liniaritatea modelului. Relaia ntre Y i X este liniar. Aceast
ipotez este necesar pentru estimarea parametrilor modelului;
Normalitatea erorilor. Variabila rezidual este distribuit
normal: (0,

2
);
Homoscedasticitatea. Varianele V() sunt constante, oricare ar
fi valorile variabilei X, adic, =
2
;
Necorelarea erorilor. Erorile sunt necorelate ntre ele:

= 0;
Independena erorilor de valorile variabilei X. Valorile
variabilei sunt independente de valorile variabilei explicative
X, adic , = 0.




Ipoteze asupra unui model econometric
(ipoteze stohastice)

se poate verifica regula celor trei sigma care const n
verificarea urmtoarelor relaii:

( +3

(+3

)

Variabilele observate nu sunt afectate de erori de
msur dac:

Verificarea liniaritii se poate efectua grafic, folosind:
diagrama reziduurilor din regresie.
Diagrama reziduurilor din regresie se construiete lund pe
ordonat variabila reziduu i pe abscis variabila
dependent.
Dac reziduurile apar dispersate aleator, de o parte i de alta
a valorii zero, atunci relaia poate fi modelat cu ajutorul
regresiei liniare. Dac reziduurile apar dispersate n blocuri
deasupra sau sub valoarea zero, atunci relaia dintre
variabilele considerate nu poate fi modelat cu ajutorul
regresiei liniare.
Testarea liniaritii modelului

Exemplu:

Testarea liniaritii modelului
Reziduu








Variabila dependent

Reziduu








Variabila dependent

..................(a)........................................................................(b)
Distribuia reziduurilor n cazul relaiei de tip liniar (a) i a relaiei de tip
neliniar (b)


Ipoteza de normalitate a erorilor presupune c variabila
urmeaz o lege normal de medie 0 i varian
2
:
~(0,

2
);

Importana: dac ~(0,

2
), atunci estimatorii
parametrilor modelului de regresie urmeaz, de
asemenea, o lege normal: ~(,

2
) ,

~(,

2
) .

Dac ipoteza de normalitate este nclcat, proprietile
estimatorilor construii pe baza metodei celor mai mici
ptrate au doar proprieti asimptotice, adic necesit
eantioane sau seturi mari de date!




Testarea ipotezei de normalitate a erorilor

Verificarea acestei ipoteze implic i testarea
ipotezei c, n medie, modelul este bine specificat:
()=0.

Testarea ipotezei () =0 se poate realiza cu
ajutorul t-Student, folosit pentru pentru compararea
mediei cu valoarea 0.

Testarea ipotezei de normalitate a erorilor

Testarea ipotezei de normalitate a erorilor se poate
realiza cu ajutorul procedeelor grafice (histograma,
diagrama reziduurilor) sau a procedeelor numerice
(testul Kolmogorov-Smirnov, testul Jarque - Bera ).

Testarea ipotezei de normalitate a erorilor

Diagrama de dispersie a reziduurilor
Diagrama de dispersie a reziduurilor se construiete considernd pe
ordonat valori ale variabilei reziduale

, iar pe abscis valori estimate ale


variabilei dependente

.



Testarea ipotezei de normalitate a erorilor

Se tie c dac erorile urmeaz legea normal de medie
zero i de abatere medie ptratic

2
atunci are loc
relaia:

= 1

ce va fi folosit pentru acceptarea ipotezei cercetate la
nivelul de semnificaie .

Testarea ipotezei de normalitate a erorilor

Testul Jarque-Bera
Testul Jarque - Bera se calculeaz dup relaia:


unde:
, reprezint asimetria (skewness).
S = 0 pentru o repartiie normal,
S > 0 pentru o repartiie asimetric la dreapta,
S < 0 pentru o repartiie asimetric la stnga;
Testarea ipotezei de normalitate a erorilor
2
2
2
~
4
) 3

6
_
|
|
.
|

\
|

+ =
K
S
n
JB
3
2
3

= S

reprezint boltirea, (kurtosis).

K = 3 pentru o repartiie normal,
K<3 pentru o repartiie aplatizat
K > 3 pentru o repartiie afectat de boltire.

Testarea ipotezei de normalitate a erorilor
2
2
4

= K

Estimatorii pentru cei doi parametri sunt:


respectiv


unde

Testarea ipotezei de normalitate a erorilor

=
i
i
i
i
n
n
K
2
2
4
)
2

(
2

c
c

=
i
i
i
i
n
n
S
3
2
2
3
)
2

(
)
2

c
c
i i i
y y e

=

Din tabela chi-ptrat, se citete valoarea teoretic
.

Dac valoarea calculat a testului este mai mic dect
valoarea teoretic, se ia decizia de a accepta ipoteza
nul (de normalitate a erorilor), cu o probabilitate de
0,95, i invers.

Testarea ipotezei de normalitate a erorilor
99 , 5
2
2 ; 05 , 0
= _

Asimetrie moderat i pozitiv SQRT(X)
Asimetrie substanial i pozitiv LOG10(X)
--------- atunci cnd scara include zero LOG10(X+C)
Asimetrie sever i pozitiv 1/X
--------- atunci cnd scara include un zero 1/(X+C)
Asimetrie moderat i negativ SQRT(K-X)
Asimetrie substanial i negativ LOG10(K-X)
Asimetrie sever i negativ LOG10(K-X)

C = constant adugat astfel nct scorul cel mai mic este 1
K = constant din care este retras scorul astfel nct scorul cel mai mic este 1; n general egal cu scorul cel mai
mare +1
Tipuri de asimetrie i transformri ale variabilei
pentru normalizarea distribuiei


Ipoteza de homoscedasticitate presupune c
varianele sunt constante, oricare ar fi valorile
variabilei X, adic, .

Pentru testarea ipotezei se utilizeaz :
procedeul grafic;
procedeul analitic.
Testarea ipotezei de homoscedasticitate

2
) ( o c = V

Procedeul grafic - const n construirea corelogramei
privind valorile variabilei factoriale x i ale variabilei
reziduale .












Dac graficul punctelor empirice prezint o distribuie oscilant,se poate
accepta ipoteza c cele dou variabile sunt independente i nu corelate.
Testarea ipotezei de homoscedasticitate

Procedee analitice:
Testul Goldfeld-Quandt
Se aplic cnd se dispune de serii lungi de date.
Paii:
1. ordonarea cresctoare a observaiilor n funcie de variabila
exogen x;
2. eliminarea a c observaii centrale, c fiind specificat a priori
(se consider c c trebuie s reprezinte o treime sau un sfert
din numrul total de observaii);
3. efectuarea de regresii aplicnd M.C.M.M.P. asupra celor dou
subeantioane de dimensiune (n-c)/2 i calcularea sumei
ptratelor erorilor pentru fiecare subeantion n parte;
Testarea ipotezei de homoscedasticitate

4. calcularea raportului dintre sumele ptratelor
erorilor sau dispersiilor acestora, corespunztoare
celor dou subeantioane (suma ptratelor erorilor
avnd valoarea cea mai mare fiind plasat la
numrtor):




unde: u variabila rezidual pentru sub-modele definite;
k numrul variabilelor exogene.
Testarea ipotezei de homoscedasticitate

Presupunnd c erorile sunt normal distribuite,
atunci raportul F* urmeaz o distribuie F cu

1
=
2
=
()
2
- +1 grade de libertate.
dac

>
;

2
+1 ;;

2
+1
, ipoteza de
homoscedasticitate este infirmat, erorile sunt
heteroscedastice;
dac

<
;

2
+1 ;;

2
+1
, ipoteza de
homoscedasticitate este acceptat.
Testarea ipotezei de homoscedasticitate

Testul White
Aplicarea testului White presupune parcurgerea urmtoarelor etape:
1. estimarea parametrilor modelului iniial i calculul valorilor estimate ale
variabilei reziduale, ;
2. construirea unei regresii auxiliare, bazat pe presupunerea existenei unei
relaii de dependen ntre ptratul valorilor erorii, variabila exogen
inclus n modelul iniial i ptratul valorilor acesteia:

2
=
0
+
1

+
2

2
+


i calcularea coeficientului de determinare,
2
, corespunztor acestei regresii
auxiliare;
3. verificarea semnificaiei parametrilor modelului nou construit, iar dac
unul dintre acetia este nesemnificativ, atunci ipoteza de
heteroscedasticitate a erorilor este acceptat.
Testarea ipotezei de homoscedasticitate

Exist dou variante de aplicare a testului White:
utilizarea testului Fisher Snedecor clasic, bazat pe
ipoteza nulitii parametrilor, respectiv:

0
:
0
=
1
=
2
=0
Dac ipoteza nul, potrivit creia rezultatele estimrii
sunt nesemnificative (

<
;
1
;
2
), este acceptat,
atunci ipoteza de homoscedasticitate se verific, cazul
contrar semnificnd prezena heteroscedasticitii
erorilor.
Testarea ipotezei de homoscedasticitate

utilizarea testului LM, ce este asimptotic distribuit
sub forma unui
2
;
, pentru care numrul gradelor
de libertate este egal cu: v = k , unde k = numrul
variabilelor exogene, respectiv:
=
2
~
2
;

dac >
2
;
, erorile sunt heteroscedastice, n
caz contrar, sunt homoscedastice, respectiv ipoteza
nulitii parametrilor,
0
=
1
=
2
=0, este acceptat.

Testarea ipotezei de homoscedasticitate

Ipoteza de necorelare a erorilor:
presupune lipsa unei corelaii ntre termenii variabilei
eroare din modelul de (eroarea asociat unei valori a
variabilei dependente nu este influenat de eroarea
asociat altei valori a variabilei dependente).

Pentru testarea acestei ipoteze se pot utiliza: testul
Durbin Watson.
Testarea ipotezei de autocorelare a erorilor
0 ) , cov( =
j i
c c

Testul Durbin Watson (DW)
H
0
: = 0 (nu exist autocorelare a erorilor);
H
1
: = 0 (ipoteza este nclcat, exist o legtur ntre erori).
n cazul existenei fenomenului de autocorelare a erorilor se
presupune c ntre erori exist o relaie de tipul: ,
cu


Statistica test:


Testarea ipotezei de autocorelare a erorilor
i i i
u + =
1
c c
) , 0 ( ~
2
u i
N u o

=
=

=
n
i
i
n
i
i i
e
e e
DW
1
2
2
2
1
) (

Valoarea calculat a testului DW se compar cu d
L

(limita inferioar) i d
U
(limita superioar), citite din
tabelul Durbin Watson la pragului de semnificaie
i volumul eantionului n.

Testarea ipotezei de autocorelare a erorilor

Decizia se ia n funcie de urmtoarele regiuni:
- regiune de respingere:
>0 erorile nregistreaz o autocorelare pozitiv;
<0 erorile nregistreaz o autocorelare negativ;
- regiune de acceptare a ipotezei nule:
(d
u
; 4- d
u
) erorile nu sunt autocorelate;
- regiune de nedeterminare:
(d
L ;
d
U
) i (4-d
u
;

4-d
L
), dac valoarea statisticii Durbin-
Watson cade n aceast regiune, nu se poate decide asupra
existenei autocorelrii erorilor.

Testarea ipotezei de autocorelare a erorilor


Testul Durbin-Watson se recomand pentru eantioane
de volum mare n15 i este folosit n mod curent
pentru analiza seriilor de timp.
Testarea ipotezei de autocorelare a erorilor

Testarea parametrilor unui model de regresie se realizeaz cu
ajutorul testului t Student.
Formularea ipotezelor:


Estimatorii sunt semnificativ diferii de zero, cu un prag de
semnificaie , dac se verific urmtoarele relaii:

>
,

>
,


= 2 (. ),
Testarea semnificaiei estimatorilor
parametrilor modelului de regresie
0 :
0 :
1
0
=
=
a H
a H
0 :
0 :
1
0
=
=
b H
b H
05 , 0 = o

Cnd modelarea econometric este realizat cu
suportul softurilor specializate ) decizia poate fi luat i
n baza valorii Sig., astfel:
Sig. > : se accept ipoteza H
0
,
Sig. < : se respinge ipoteza H
0,
cu o probabilitate de
95%.

Testarea semnificaiei estimatorilor
parametrilor modelului de regresie

Evaluarea global a modelului de regresie se realizeaz n baza
raportului de corelaie i presupune folosirea statisticii test F
Fisher.
Statistica test F:




urmeaz o lege de distribuie Fisher,
unde:
- reprezint estimaia varianei explicat prin model;
reprezint estimaia varianei neexplicat, variana rezidual:
este raportul de determinare, iar reprezint raportul de nedeterminare.

Verificarea semnificaiei modelului
econometric
1 1 1
2
2
2
2

= =
k
k n
R
R
k
k n
V
V
S
S
F
R
E
rez
reg

2
reg
S
2
rez
S
2
R
2
1 R

Elementele de calcul i valoarea raportului F se pot
obine facil cu ajutorul programelor statistice,
rezultatele fiind prezentate n Tabelul ANOVA, i
anume:
estimaiile celor dou componente ale variaiei,
gradele de libertate corespunztoare,
estimaiile varianelor, explicat i rezidual,
valoarea calculat a raportului Fisher i
semnificaia testului, Sig.

Verificarea semnificaiei modelului
econometric

Valoarea teoretic a testului F se citete din tabelul Fisher, i
anume
,
1
,
2
,
unde
1
=k 1 i
2
=n k grade de libertate i un nivel de
semnificaie .
Decizia. Dac F
,
1
,
2
, se respinge
0
i se trage concluzia c
ntre variabilele cercetate exist o legtur semnificativ, deci modelul
este corect specificat (valid), cu un risc acceptat de 5%.
Sau n baza nivelului Sig. :
dac valoarea Sig. corespunztoare statisticii F este mic (mai
mic dect 0,01), atunci variabila independent explic variaia
variabilei dependente i invers, deci relaia liniar dintre cele dou
variabile considerate este semnificativ .


Verificarea semnificaiei modelului
econometric

S-ar putea să vă placă și