Sunteți pe pagina 1din 17

1

MODELUL DE REGRESIE LINIAR UNIFACTORIAL


Curs 6
2
Etapele modelrii econometrice
1. Specificarea modelului
- precizarea variabilei endogene Y i a variabilei exogene X
y=f(x)+e
2. Identificarea modelului
- alegerea unei funcii care descrie valorile vb. endogene n funcie de variaia vb. exogene
- se realizeaz cu ajutorul procedeului grafic sau a calculelor algebrice (analiza de varian)

y
i
=a + bx
i
+ e
i
, i=1,n



y
i
= componenta predictibil (deterministic) + eroarea aleatoare

3. Estimarea parametrilor modelului
- metoda minimizrii sumei ptratelor erorilor (MCMMP)


i i
bx a y + =

= =
i
i i
i
i
bx a y e b a S
2 2
) ( min min ) , (
3
Etapele modelrii econometrice
- se obine sistemul de ecuaii normale:






- prin rezolvarea sistemului avem:

= +
= +


= = =
= =
n
i
i i
n
i
i
n
i
i
n
i
i
n
i
i
y x x b x a
y x b na
1 1
2
1
1 1
( )
( )


=
A
A
=


=
A
A
=




2
2
2
2
2
i i
i i i i
i i
i i i i i
x x n
y x y x n
b
b
x x n
y x x x y
a
a
( )( )
( )

=
|
.
|

\
|

= =


=
=
= =
2
1
2
1
2
2
1 1
x
xy
n
i
i
i
n
i
i
i
i
i
i i
n
i
i
n
i
i
s
s
n
x x
n
y y x x
x n x
y x n y x
b
n
x b y
x b y a
4
Etapele modelrii econometrice
- dup determinarea coeficienilor a i b se calculeaz valorile ajustate:


- se obine astfel:



- n cazul legturii simple liniare o msur relativ a dependenei dintre dou variabile o
constituie coeficientul de corelaie liniar Pearson (semnul arat direcia legturii, iar
valoarea intensitatea legturii)

i i
bx a y

+ =

= =
=
n
i
i
n
i
i
y y
1 1
(

= =

= =
=
n
i
i
n
i
i
n
i
i i
y x
xy
y x
xy
) y y ( ) x x (
) y y )( x x (
s s
s
s s
) y , x cov(
r
1
2
1
2
1
5
Etapele modelrii econometrice
- coeficientul de corelaie liniar Pearson se poate determina:
*
n
i
n
i
i i
n
i
n
i
i i
n
i
n
i
n
i
i i i i
xy
b
y y n x x n
y x y x n
r
A A
A
=
(
(

|
.
|

\
|

(
(

|
.
|

\
|

=


= = = =
= = =
1
2
1
2
1
2
1
2
1 1 1

= =
|
.
|

\
|
= A
n
i
n
i
i i
*
y y n
1
2
1
2
2
x
xy
s
s
b =
y
x
s
s
b r =
6
Etapele modelrii econometrice
4. Evaluarea validitii modelului
- se verific dac variaia lui X este un bun predictor pentru variaia lui Y
- presupune:
a) Testarea validitii modelului de regresie folosind metoda ANOVA
b) Determinarea i testarea semnificaiei raportului de corelaie
c) Inferena statistic pentru parametrii modelului de regresie
d) Verificarea ipotezelor modelului de regresie

a) Testarea validitii modelului de regresie folosind metoda ANOVA
- variabilei dependente Y i se asociaz dou medii:
media total ( )
media condiionat ( ).
- variaia total ( ) poate fi mprit n:
abaterea neexplicat de model ( )
abaterea explicat ( )
y
i i
bx a y + =
y y
i

i i
y y
y y
i

) y y

( ) y

y ( y y
i i i i
+ =
7
Etapele modelrii econometrice
- abaterea ( ) nu poate fi explicat de linia de regresie, deoarece
atunci cnd se modific, ambele valori i se modific;

- abaterea ( ) poate fi explicat, deoarece cnd se schimb,
rmne constant
i
x

i i
y

y
i
y
i
y
y y
i

y
i
x
8
Etapele modelrii econometrice
Prin ridicarea la ptrat a fiecrei abateri i nsumarea pentru toate observaiile, obinem:


= = =
+ =
n
i
n
i
i i i
n
i
i
) y y ( ) y y ( ) y y (
1 1
2 2
1
2

Vom nota:

=
A =
n
i
y i
) y y (
1
2 2
- variana total, suma ptratelor abaterilor totale;

=
A =
n
i
e i i
) y y (
1
2 2
- variana neexplicat (rezidual), suma ptratelor erorilor;

=
A =
n
i
x / y i
) y y (
1
2 2
- variana explicat, suma ptratelor abaterilor datorate regresiei.
Variana total este:
.
2 2 2
e x / y y
A + A = A

9
Etapele modelrii econometrice
n literatura de specialitate, precum i n pachetele de programe informatice
specializate se utilizeaz urmtoarele notaii echivalente:

SST= variana total, suma ptratelor abaterilor totale (
2
y
A
)

SSE= variana neexplicat (rezidual) , suma ptratelor erorilor (
2
e
A
)

SSR=variana explicat, suma ptratelor abaterilor datorate regresiei (
2
x / y
A
)

Deci, SST= SSR+SSE.

10
Etapele modelrii econometrice
Pentru testarea validitii modelului se formuleaz cele dou ipoteze:
H0: model nevalid (nesemnificativ) statistic
H1: model valid (semnificativ) statistic

Statistica utilizat pentru a decide care dintre ipoteze se accept este:



Se compar valoarea calculat a testului F cu valoarea teoretic pentru un prag de
semnificaie , k, respectiv (n-k-1) grade de libertate, preluat din tabelul repatiiei
Fisher: .

Dac Fcalc> se respinge H0, adic se concluzioneaz c modelul este valid.
2
2
/
e
x y
calc
s
s
F =
1 k n ; k ;
F
o
1 k n ; k ;
F
o
11
Etapele modelrii econometrice
Sursa
variaiei
Suma
ptratelor
(SS-Sum of
Squares)
Grade de
libertate
(df-
degree of
freedom)
Media
ptratelor
(MS- Mean of
Squares)
Testul
Fisher
(testul F)
Datorat
regresiei

( )
= A
=
n
1 i
2
i
2
x / y
y y

k
k
s
x / y
x / y
2
2
A
=

Rezidual
( ) = A
=
n
1 i
2
i i
2
e
y y

n k 1
1
2
2

A
=
k n
s
e
e
Total
( ) = A
=
n
1 i
2
i
2
y
y y

n 1
1
2
2

A
=
n
s
y
y
2
2
e
x / y
s
s
Fcalc=


12
Etapele modelrii econometrice
- Estimatorul dispersiei variabilei Y este:
1
2
2

A
=
n
s
y
y
- Estimatorul dispersiei reziduurilor este:

1 1
1
2
2
2

=

A
=

=
k n
) y y (
k n
s
n
i e
e
,
- k =nr. variabilelor independente considerate
- (n-k-1)= nr. gradelor de libertate
n cazul regresiei simple liniare, k=1 i (n-k-1)=2
- Abaterea standard a erorilor n eantion este:
( )
2 2
1
2
2

A
=

=
n
y y
n
s
n
i
i i
e
e

13
Etapele modelrii econometrice
b) Determinarea i testarea semnificaiei raportului de corelaie
Raportul de corelaie este un indicator relativ utilizat pentru:
- msurarea intensitii legturii dintre variabile
- validarea modelelor de regresie.

Raportul de corelaie se calculeaz ca:






Raportul de corelaie ia valori cuprinse ntre 0 (cnd linia de regresie este situat pe nivelul
mediu, deci nu exist legtur ntre variabile) i 1 (cnd valorile observate se situeaz
exact pe linia de regresie, deci legtura este perfect).
( )
( )
( )
( )

=
=
=
=

=
n
i
i
n
i
i
n
i
i
n
i
i
y y
y y
y y
y y
R
1
2
1
2
1
2
1
2
1
2
2
2
2
1
y
e
y
x / y
R
A
A
=
A
A
=
14
Etapele modelrii econometrice
Testarea semnificaiei raportului de corelaie se face utiliznd statistica F:
2
2
1
1
R
R
k
k n
F


=

Dac F
calc
>
1 k n ; k ;
F
o
se accept ipoteza conform creia variabila X are o
influen semnificativ asupra variabilei rezultative Y.

Ptratul raportului de corelaie este coeficientul de determinaie (R
2
), care
arat proporia din variaia total a variabilei dependente explicat de variaia
variabilei independente.
( )
( )

=
A
A
=
A
A
=
=
=
n
1 i
2
i
n
1 i
2
i
2
y
2
e
2
y
2
x / y
2
y y
y y
1 R
sau
| | 1 , 0
2
e =
SST
SSR
R

15
Etapele modelrii econometrice
R
2
= 0 dac b=0, y y =
.
, ecuaia de regresie este o dreapt orizontal (X nu explic Y)
R
2
= 1 dac punctele determinate de observaiile fcute asupra variabilelor X i Y se
afl toate pe o dreapt, caz n care erorile vor fi zero.
Coeficientul de determinaie nu este ajustat cu gradele de libertate.

Dac utilizm estimatorii
2
y
s
i
2
e
s
, obinem valoarea ajustat a coeficientului de
determinaie |
.
|

\
|
2
R :
1
1
1
2
2
2
A
A
=
n /
k n /
R
y
e


Valoarea lui
2
R este ntotdeauna mai mic dect valoarea lui R
2
.
16
Etapele modelrii econometrice
Raportul de corelaie se determin pentru legturi de tip liniar sau neliniare

Egalitatea |r|= R este un test de liniaritate pentru model

n analiza corelaiei simple liniare se observ c:
r
2
= R
2
,
deoarece, cum
( )

= =
=
n
i
n
i
i i
) x x ( b y y
1 1
2 2
2
, atunci:
( )
( ) ( )
2
2
2
2
1
2
1
2
2
1
2
1
2
2
r
s
s
b
y y
) x x (
b
y y
y y
R
y
x
n
i
i
n
i
i
n
i
i
n
i
i
= =

=
=
=
=
.
17
Etapele modelrii econometrice
Testarea semnificaiei coeficientului liniar de corelaie r
Se noteaz cu coeficientul de corelaie din colectivitatea general:
(



= = =

= =
=
N
i
Y i
N
i
X i
N
i
Y i X i
y x
xy
y x
) y ( ) x (
) y )( x (
) Y , X ( COV
1
2
1
2
1


o o
o
o o


Media estimatorului r este = ) r ( i abaterea standard este
2
1
2

=
n
r
s
r
.
Ipotezele testate sunt:
H
0
:

= 0 (

nu este semnificativ statistic)
H
1
:

= 0
Statistica t este:
2
1
2
r
n r
s
r
t
r
calc

= =
.
Dac t
calc
>
2 n ;
t
o
atunci coeficientul de corelaie este semnificativ statistic.