Sunteți pe pagina 1din 25

Capitolul 1.

MODELUL LINIAR SIMPLU


1. Forma modelului
Sub forma cea mai general, un model liniar simplu se poate scrie:
t t t
x a a y + +
1 0
T t ,..., 1
(1.1)

t
indexeaz observaiile. Acestea pot fi diferite uniti statistice observate n
acelai moment de timp, caz n care modelul este de tip cross-section sau
en coupe instantane . Sau putem avea aceeai unitate observat la
momente diferite de timp, ceea ce ne d o serie de timp sau cronologic.

t
y
este realizarea variabilei Y observat n momentul
t
(sau observaia cu
rangul t a variabilei Y). Variabila Y se numete variabil endogen, explicat
sau dependent).

t
x
este realizarea variabilei X observat n momentul
t
(sau observaia cu
rangul t a variabilei X). Variabila X se numete variabil exogen sau
explicativ).

este realizarea n t a variabilei reziduale, aleatoare. Aceasta conine


realizrile tuturor variabilelor neobservate sau neincluse n model.

0
a
i
1
a
i sunt parametrii sau coeficienii ale cror valori dorim s le
estimm.
Acest tip de model se numete liniar, deoarece
t
y
este liniar n raport cu parametrii
0
a
i
1
a . Din punct de vedere econometric ne intereseaz liniaritatea n raport cu
parametrii, nu cu variabilele, deoarece modelele neliniare necesit metode de
estimare diferite.
1.2. Rolul termenului aleator
n general, fenomenele din tiinele sociale pe care dorim s le modelm prin
econometrie sunt fenomene complexe, ce nu pot fi explicate printr-un singur factor.
Exist deci o mulime de ali factori susceptibili de a-l putea explica pe Y. Din acest
considerent adugm un termen
t

care sintetizeaz ansamblul informaiilor


neincluse n model. El msoar diferena dintre valorile reale (observate) ale lui Y i
valorile estimate prin model. Termenul
t

grupeaz trei tipuri de erori (Bourbonnais,


1998):
- eroare de specificare, datorit faptului c am inclus n model doar o variabil
explicativ, nu toi factorii care ar putea influena variabila endogen
- eroare de msur, dac datele nu au fost exact msurate
- eroare de eantionare, datorat fluctuaiilor ce pot s apar de la un eantion
la altul n privina observaiilor i deci i a estimaiilor.
1.3. Ipoteze fundamentale asupra modelului
Ipotezele ce vor fi detaliate mai jos nu sunt verificate ntotdeauna.
Considernd c ele sunt potenial verificate vom studia proprietile estimatorilor i a
metodelor de estimare. Procedurile care permit testarea acestor ipoteze vor fi
detaliate n seciunile urmtoare.
H
1
:
0 ) (
t
E
; variabila rezidual este de medie nul. Ansamblul factorilor lui
t
y
care nu au fost reinui n model este de speran matematic nul. Avem
astfel :
t t t
x a a x y E
1 0
) / ( +
H
2
:
t
y
i
t
x
reprezint valori numerice observate fr erori. Termenul
t
x
nu este
deci aleator, ci determinist. Modelul devine aleator prin intermediul lui
t

.
n acest caz, sperana condiional considerat mai sus se reduce la:
t t
x a a y E
1 0
) ( +
Sensul acestei ipoteze este acela c X este o variabil economic, la fel ca
Y. Considernd H
2
adevrat nseamn c ncercm s modelm fenomenul
descris de
t
y
condiionat de realizrile
t
x
observate n eantion.
H
3
: Modelul este liniar n raport cu
t
x
sau o transformare a lui
t
x
(logaritm,
inversiune, etc.)
H
4
:
t E
t
) (
2 2


Presupunem c variana perturbaiilor este constant, indiferent de t. Este
cunoscut ca ipoteza de homoscedasticitate a perturbaiilor. Intuitiv,
considerm c amploarea erorilor, deci aproximaia efectuat de model este
constant n raport cu t.
H
5
:
0 ) , cov(
'

t t


sau
0 ) , (
'

t t
E
deoarece
' , 0 ) ( ) (
'
t t E E
t t

Covariana perturbaiilor este nul, dou erori cu privire la dou observaii
diferite t i t sunt independente ntre ele.
H
6
:
0 ) , cov(
t t
x

Perturbaiile sunt independente n raport cu variabila explicativ.
H
7
: Presupunem c primele momente empirice ale lui X sunt finite atunci cnd T
este foarte mare:


T
t
t
T
x x
T
1
0
1
lim
cantitate finit (media empiric)



T
t
t
T
s x x
T
1
2 2
0 ) (
1
lim
cantitate finit (variana empiric)
Presupunem c variana empiric a lui X converge spre o valoare nenul
2
x

. Ipoteza poate fi verificat n cazul staionar, adic dac


t
x
sunt realizri ale
unor variabile aleatoare independente i identic distribuite, de variane egale
cu
2
x
. Important de reinut este c n aceast ipotez,
t
x
conserv o
oarecare varian cnd T , deci observaiile suplimentare amelioreaz
informaia (Dormont, 1999).
H
8
:
t N
t
) , 0 (
2


Ipoteza permite efectuarea unor teste asupra modelului. Pertinena ei se
datoreaz teoremei limit-central. Nu este necesar s presupunem
normalitatea componentelor lui
t

, ci doar un numr mare de factori


independeni i identic distribuii ntre care exist o relaie de tip aditiv.
1.4. Estimarea parametrilor
0
a
i
1
a prin metoda patratelor minime (MPM)
n cvasi-totalitatea situaiilor reale, datele utilizate pentru modelarea unui
fenomen provin dintr-un eantion. Ca urmare, dei exist adevraii parametrii
0
a
i
1
a , la nivelul ntregii populaii, n realitate nu i vom cunoate niciodat. Vom gsi
doar nite estimaii ale acestora,
0
a
i
1
a , pe baza datelor din eantion.
Ne propunem s determinm
0
a
i
1
a astfel nct valorile lor s minimizeze
suma patratelor erorilor:



T
t
t t
T
t
t
a a f a x a y
1
1 0
2
0 1
1
2
) , ( ) (
(1.2)
Putem deci s exprimm suma patratelor erorilor ca o funcie de
0
a
i
1
a . Pentru a
minimiza
) , (
1 0
a a f
trebuie satisfcut o condiie necesar (sau condiia de ordinul
1) i una suficient (condiia de ordinul 2). Condiia necesar presupune anularea
derivatelor n raport cu cei doi parametri:

'

0
0
0
1
a
f
a
f
(1.3)
Prin efectuarea derivrii, sistemul devine :

'

T
t
t t
T
t
t t t
a x a y
x a x a y
1
0 1
1
0 1
0 ) (
0 ) (
(1.4)
nsumnd n raport cu t diviznd fiecare termen cu T obinem:

'





0
0
1 1
0 1
1 1
0
2
1
a x a y
x a x
T
a x y
T
T
t
T
t
t t t
(1.5)
Considernd
0
a
i
1
a soluiile sistemului, obinem:

'


) (
) )( (

1 0
1
2
1
1
x a y a
x x
x x y y
a
T
t
t
T
t
t t
(1.6)
Estimatorii
0
a
i
1
a sunt variabile aleatoare, deoarece sunt funcii de Y, care este o
variabil aleatoare prin intermediul lui

.
Condiia suficient (de ordinul 2):
0 ; 0
2
0
2
1 0
2
0 1
2
2
1
2
2
1
2
>

>

a
f
a a
f
a a
f
a
f
a
f
(1.7)
este ntotdeauna ndeplinit (nu prezentm aici demonstraia, deoarece nu e necesar
n nelegerea a ceea ce urmeaz).
ncepnd de aici, estimatorii
0
a
i
1
a pe care i vom folosi vor fi cei din
expresia 1.6.
1.5. Proprieti ale estimatorilor
0
a
i
1
a
Vom demonstra n acest paragraf c innd cont de ipotezele din paragraful
1.3, estimatorii obinui prin metoda patratelor minime sunt nedeplasai i
convergeni. Pentru aceasta, vom transforma mai nti expresiile lui
0
a
i
1
a (vezi
Giraud & Chaix, 1989).
i) Transformri ale expresiei estimatorilor
0
a
i
1
a
Considerm n continuare modelul:
t t t
x a a y + +
1 0
(1.8)
nsumnd n raport cu t i diviznd prin T, obinem:
+ + x a a y
1 0
(1.9)
Din ecuaiile 1.8 i 1.9, prin scdere:
) ( ) (
1
+
t t t
x x a y y
(1.10)
nlocuind
y y
t

din expresia de mai sus n formula lui
1
a , avem :
[ ]

T
t
t
T
t
t t t
x x
x x x x a
a
1
2
1
1
1
) (
) ( ) ( ) (


(1.11)


+
T
t
t
T
t
t t
x x
x x
a a
1
2
1
1 1
) (
) )( (


(1.12)
Din ipotezele asupra modelului, deducem c


T
t
t
x x
1
0 ) (
, deci putem scrie :

+
T
t
t
T
t
t t
x x
x x
a a
1
2
1
1 1
) (
) (


(1.13)
Din 1.6 i 1.9 tim c:

'

+ +
+


0 1
0 1
a x a y
a x a y
(1.14)
De unde deducem:
x a a a a ) (
1 1 0 0
+
(1.15)
ii)
0
a
i
1
a sunt estimatori nedeplasai ai lui
0
a
i
1
a
Notnd pentru simplificare:

T
t
t
t
t
x x
x x
1
2
) (
) (

(1.16)
Ecuaia 1.13 devine :

+
T
t
t t
a a
1
1 1
(1.17)
De unde :

+
T
t
t t
E a a E
1
1 1
) ( ) (
Dar
0 ) (
t
E
, deci :
1 1
) ( a a E (1.18)
1
a este un estimator nedeplasat al lui
1
a .
n mod similar, deducem :
) ( ) ( ) (
0 0 0 0
a a E x E a a E +
(1.19)
Dar


T
t
t
E
T
E
1
0 ) (
1
) (
i 0 ) (
1 1
a a E , deci:
0 0
) ( a a E (1.20)
0
a
este i el un estimator nedeplasat al lui
0
a
.
iii)
0
a
i
1
a sunt estimatori convergeni ai lui
0
a
i
1
a
Cunoatem c dac un estimator este nedeplasat, pentru ca el s fie convergent este
necesar ca variana lui s tind la 0. n cazul nostru,
0 ) ( lim
0


a V
T
0 ) ( lim
1


a V
T
Pornind de la 1.17 i folosind ipotezele fundamentale formulate asupra modelului, se
poate demonstra (Giraud & Chaix, 1989) c variana lui
1
a se poate scrie sub forma:

T
t
t
x x
a V
1
2
2
1
) (
) (

(1.21)
Din H
7
tim c :



T
t
t
T
s x x
T
1
2 2
0 ) (
1
lim
0 ) (
2
2
1


Ts
a V
T

(1.22)
deci
1
a converge n probabilitate spre
1
a :
1
P
1
a a
T
(1.23)
Procednd similar, se poate arta c variana lui
0
a
se poate scrie sub forma:
1
1
1
1
]
1

T
t
t
x x
x
T
a V
1
2
2
2
0
) (
1
) (

(1.24)
Atunci cnd T , 0
1

T
i n consecin :
0
1
) (
1
2
1
2

Ts
x x
T
t
t
deci :
0 ) (
0

T
a V
(1.25)
i
0
a
converge n probabilitate spre
0
a
:
0
P
0
a a
T
(1.26)
iv) Matricea de variane i covariane a lui
0
a
i
1
a
Deoarece n seciunea precedent au fost date expresiile varianelor lui
0
a
i
1
a , rmne de calculat expresia covarianei :
] ) ( ) [(
))] ( )( [(
)] )( [( ) , (
2
1 1 1 1
1 1 1 1
1 1 0 0 1 0
a a x a a E
a a x a a E
a a a a E a a Cov


Dar ] ) [(
1 1
a a E , deci:
) (
) ( ) , (
1
2
1 1 1 0
a V x
a a E x a a Cov


T
t
t
x x
x
a a Cov
1
2
2
1 0
) (
) , (

(1.27)
Notm

,
_


) ( ) , (
) , ( ) (
1 1 0
1 0 0
) , (
1 0
a V a a Cov
a a Cov a V
a a
matricea de variane i covariane a lui
0
a
i
1
a .

,
_

+





T
t
t
T
t
t
T
t
t
T
t
t
a a
x x x x
x
x x
x
x x
x
T
1
2
1
2
1
2
1
2
2
2
) , (
) (
1
) (
) ( ) (
1
1 0

(1.28)
Expresia matricei de variane i covariane conine i variana lui
t

, respectiv
2


care este necunoscut. Este deci necesar gsirea unui estimator
2

cu bune
proprieti. Se poate demonstra (Giraud & Chaix, 1989) c un astfel de estimator
este:

T
t
t
T
1
2 2

2
1

(1.29)
Deoarece se poate arta c
2 2
) (

E , estimatorul este nedeplasat.
1.6. Consecine ale normalitii erorilor. Teste i intervale de ncredere
Ipoteza de normalitate a erorilor nu e absolut necesar pentru a obine
estimatori convergeni, dar ea permite construirea unor teste statistice privind
validitatea modelului.
Dac ) , 0 (
2

N
t
i

T
t
t
T
1
2 2

2
1

atunci se pot deduce urmtoarele:


1)
2
) 2 (
2
2

) 2 (


T
T

(o distribuie
2
cu T-2 grade de libertate)
2)
) 1 , 0 (

0 0
N
a a
a

i
) 1 , 0 (

1 1
N
a a
a

(o distibuie normal de medie nul i


varian unitar)
3)
0

0 0

a
a a

i
1

1 1

a
a a

urmeaz o distribuie Student cu T-2 grade de libertate


4)
( )
) 2 ; 2 (
1 1
0 0 1
) , (
1 1
0 0

'

2
1
1 0

1
]
1

,
_

,
_

T a a
F
a a
a a
a a
a a
F
(o distribuie Fisher-Snedecor
cu 2 i respectiv T-2 grade de libertate).
innd cont de de aceste distribuii se pot construi teste i regiuni de ncredere pentru
coeficieni:
1) Pentru un anumit nivel de semnificaie

dat, se poate determina un interval de


ncredere pentru
0
a
(sau
1
a ) :

'

Prob
0

0 0
t
a a
a
(1.30)
unde

t
este extras din distribuia Student cu T-2 grade de libertate. Sau sub o form
echivalent:
( )

1 Prob
0 0
0 0 0 a a
t a a t a
(1.31)
Analog se construiesc intervalele de ncredere i pentru
1
a .
2) Pentru un anumit nivel de semnificaie

dat, avem:
( )

1 Prob
) 2 ; 2 ( T
F F
( )

'

1
]
1

,
_

,
_

'

2
1
Prob
) 2 ; 2 (
1 1
0 0 1
) , (
1 1
0 0
1 0
T a a
F
a a
a a
a a
a a
(1.32)
Pentru a testa simultan dou valori oarecare
*
0
a i
*
1
a , anterior alese, le vom substitui
lui
0
a i
1
a n expresia lui F. Dac:

) 2 ; 2 (
*
1
*
0
) , (

T
F a a F
(1.33)
Putem accepta aceste valori cu un prag de semnificaie

, n caz contrar le
respingem.
1.7. Analiza varianei
Vom demonstra mai nti dou relaii din care vom putea deduce ecuaia de
analiz a varianei:
1) Suma reziduurilor este nul, respectiv:

T
t
t
1
0
.
Pornind de la ecuaia:
t t t
x a a y + +
1 0

Din care nsumnd dup t, obinem:


+ +
T
t
t
T
t
t
T
t
T
t
t
x a a y
1 1
1
1
0
1




T
t
t
T
t
t
T
t
t
x a a n y
1 1
1 0
1

tiind c
x a y a
1 0

i diviznd prin T rezult c

T
t
t
1
0
.
2) Media (suma) seriei variabilei endogene este egal cu media (suma) seriei
ajustate:

T
t
t
T
t
t
y y
1 1

t t
y y



T
t
t
T
t
t
T
t
t
y y
1 1 1

Dar

T
t
t
1
0
, deci :

T
t
t
T
t
t
y y
1 1

sau
t t
y y
Din aceste dou relaii putem deduce ecuaia de analiz a varianei:
SPR SPE SPT
y y y y
T
t
t
T
t
t
T
t
t

) ( ) (
1
2 2
1
2
1
+
+

(1.34)
Suma patratelor total (SPT) = Suma patratelor explicat (SPE)+
+ Suma patratelor rezidual (SPR)
ntr-o form echivalent, prin divizare cu T, ecuaia devine:
VR VE VT
T
y y
T
y y
T
T
t
t
T
t
t
T
t
t

1
) (
1
) (
1
1
2 2
1
2
1
+
+

(1.35)
Variana total (VT) = Variana explicat (VE) + Variana rezidual (VR)
Aceast ecuaie ne permite s apreciem calitatea ajustrii unui model. Cu ct
variana explicat este mai aproape de cea total, cu att norul de puncte este mai
apropiat de dreapta de regresie estimat prin metoda patratelor minime. Se calculeaz
i raportul dintre variana explicat i variana total.
2
1
1
2
2
1
2
1 2
) (
1
) (
) (

T
t
t
T
t
t
T
t
t
T
t
t
y y y y
y y
R

(1.36)
unde
2
R
se numete coeficient de determinaie, iar R coeficient de corelaie multipl
(coincide cu coeficientul de corelaie liniar simpl n cazul unei singure variabile
explicative).
Analiza varianei pentru o regresie liniar simpl se poate reprezenta
schematic astfel:
Tabelul 1.1 : Analiza varianei
Sursa variaiei Suma patratelor Numrul gradelor
de libertate
Variabila explicativ (X)
2
1
) (


T
t
t
y y SPE
1
Variabila rezidual (

T
t
t
SPR
1
2

2 T
Total
2
1
) (


T
t
t
y y SPT
1 T
Numrul gradelor de libertate corespunde numrului de valori ce pot fi alese arbitrar
(numrul de valori minus numrul de restricii).
Se poate demonstra c testul de nulitate a coeficientului de regresie (
0 :
1 0
a H
) este echivalent cu testul de analiz a varianei unde F empiric este dat
de:
) 2 /(
1 /

T SPR
SPE
F
(1.37)
cu F urmnd o distribuie Fisher-Snedecor cu 1 i respectiv 2 T grade de libertate.
Expresia lui F se poate scrie i n raport cu coeficientul de determinaie:
) 2 /( ) 1 (
2
2

T R
R
F (1.38)
Dac de exemplu pentru un prag de semnificaie
05 , 0
avem
05 , 0
) 2 , 1 (
>
T
F F
,
respingem ipoteza de egalitate a varianei explicative i a varianei reziduale i
considerm variabila X ca fiind semnificativ. n caz contrar, acceptm ipoteza de
egalitate a varianelor, variabila X nefiind o variabil explicativ a variabilei Y.
1.8. Previziunea variabilei endogene prin regresia liniar simpl
Dac parametrii modelului au fost estimai, se pot realiza previziuni ale
variabilei endogene Y, pentru valori date ale variabilei exogene X. Presupunem c
dorim s realizm o previziune la momentul t+1 sau pentru unitatea statistic t+1.
Valoarea previzionat a lui Y, conform modelului va fi:
1 1 0 1

+ +
+
t
p
t
x a a y (1.39)
Valoarea efectiv a lui Y va fi:
1 1 1 0 1 + + +
+ +
t t t
x a a y (1.40)
Eroarea de previziune se poate exprima printr-o variabil aleatoare:
1 1 1 1 0 0 1 1 1
) ( ) (
+ + + + +
+
t t t
p
t t
x a a a a y y (1.41)
Se observ c sperana matematic a erorii de previziune este nul:
0 ) (
1 1

+ + t
p
t
y y E (1.42)
Variana erorii de previziune se scrie:
)] )( [( 2 ) (
) ( ) (
) ( ) (
1 1 0 0 1
2
1
2
1 1
2
1
2
0 0
2
1 1 1 1
a a a a E x E
a a E x a a E
y y E y y V
t t
t
t
p
t t
p
t
+ +
+

+ +
+
+ + + +

(1.43)
deoarece
0 ) , (
1 0

+ t
a Cov
i
0 ) , (
1 1

+ t
a Cov
.
nlocuind
) (
0
a V
, ) (
1
a V i
) , (
1 0
a a Cov
i notnd cu
2
1 + t

variana erorii de
previziune, dup efectuarea calculelor avem:
1
1
1
1
]
1

+ +

+
+ T
t
t
t
e
x x
x x
T
t
1
2
2
1 2 2
) (
) ( 1
1
1


(1.44)
Dar
2

este necunoscut i se estimeaz prin


2

, deci variana erorii de previziune se


estimeaz prin:
1
1
1
1
]
1

+ +

+
+
T
t
t
t
x x
x x
T
t
1
2
2
1 2 2
) (
) ( 1
1
1


(1.45)
Se observ c variana este cu att mai redus (i implicit previziunea mai precis) cu
ct numrul de observaii (eantionul) T este mai mare, iar
1 + t
x
este mai apropiat de
x .
Dac
t

are o distribuie normal, i


0 0
a a
, respectiv
1 1
a a sunt normal
distribuite, deci:
) 1 , 0 (
1
1 1
N
y y
t
e
t
p
t

+
+ +

(1.46)
Dar
1 + t
e

este nlocuit prin estimatorul su


1

+ t
e

, deci expresia
1

1 1
+
+ +

t
e
t
p
t
y y

urmeaz o
distribuie Student, cu T-2 grade de libertate. Pentru un prag de semnificaie

i o
anumit valoare
1 + t
x
putem construi un interval de ncredere a valorii previzionate a
variabilei endogene:
( )

+
+ +
+ + +
1 Prob
1 1
2 /
2 1 1
2 /
2 1
t t
e T t t e T t
t y y t y
(1.47)
Figura 1.1 : Previziunea variabilei endogene prin regresie liniar simpl
4
6
8
10
12
14
16
18
550 600 650 700 75 0 800 8 50 900 950 1000 105 0
Exerciiul 1.1
x
y
x a a y
1 0
+
1 + t
x x
y
Un produs a fost propus spre vnzare pe 20 de piee (zone geografice) la preuri
diferite, cu venituri (medii) ale consumatorilor diferite, nregistrndu-se valori
diferite ale cererii pentru fiecare pia.
Tabelul 1.2
Nr. crt. Cerere Venit Pre Nr. crt. Cerere Venit Pre
1 11,7 777 5,4 11 11,0 814 9,0
2 9,3 802 5,9 12 7,6 801 8,4
3 13,4 635 8,0 13 12,6 768 5,6
4 16,1 952 5,9 14 16,4 965 5,7
5 14,5 998 8,8 15 9,4 990 8,9
6 11,9 988 8,7 16 17,6 806 6,2
7 9,0 586 7,1 17 12,9 820 7,5
8 16,1 658 6,4 18 5,3 553 8,5
9 11,0 520 6,5 19 14,6 684 7,4
10 15,8 960 5,0 20 14,5 756 5,6
Notm:
t
y
= cererea (variabila endogen)
t
x
1
= venitul
t
x
2
= preul
Se cere:
1) n ipoteza unei legturi liniare ntre cerere i venit, s se calculeze estimatorii
parametrilor
0
a
i
1
a .
2) Parametrii
0
a
i
1
a sunt semnificativ diferii de 0 ?
3) S se stabileasc intervale de ncredere la un prag de 95% pentru cei doi
parametri.
4) S se arate c testarea ipotezei
0 :
1 0
a H
este echivalent cu testarea ipotezei
0 r , unde
r
este coeficientul de corelaie liniar simpl ntre cerere i venit.
5) S se construiasc tabloul de analiz a varianei i testul Fisher adecvat.
6) S se fac o previziune a cererii pentru o valori ale venitului de 600 i respectiv
800.
7) S se parcurg aceleai etape pentru regresia liniar simpl dintre cerere i pre.
1) Un grafic adecvat, de exemplu norul de puncte permite evidenierea legturii
dintre cele dou variabile:
Figura 1.2. Legtura liniar dintre cerere i venit
0
2
4
6
8
10
12
14
16
18
20
400 500 600 700 800 900 1000 1100
venit (X1)
c
e
r
e
r
e

(
Y
)
12,535
20
1
20
1


t
t
y y
791,65
20
1
20
1


t
t
x x
435358,6 ) (
20
1
2

t
t
x x
3396,345 ) )( (
20
1

t
t t
y y x x
007801 , 0
) (
) )( (

20
1
2
20
1
1

t
t
t
t t
x x
y y x x
a
3591 , 6 65 , 791 007801 , 0 535 , 12
1 0
x a y a
Desigur aceste calcule se pot face foarte repede, utiliznd soft-ware adecvat de
statistic i econometrie: SPSS, Stata, SAS, Eviews, Limdep, etc.
2) Este foarte important s testm ndeosebi nulitatea parametrului
1
a , deoarece dac
el nu este semnificativ diferit de 0, variabila venit nu poate fi considerat
explicativ pentru variabila endogen cerere . Formulm o ipotez nul, cu
alternativa ei:
0 :
0 :
1 1
1 0

a H
a H
Dac respingem ipoteza
0
H
la un prag de semnificaie

fixat,
1
a este considerat
semnificativ diferit de 0. Pragul cel mai adesea utilizat este
05 , 0
adic un risc de
eroare de 5%.
Cunoatem c:
1

1 1

a
a a

urmeaz o distribuie Student cu T-2 grade de libertate


Sub ipoteza
0
H
, relaia devine:
1
1 1

0
a
a a
t
a a


care urmeaz o distribuie Student cu 20-2=18 grade de libertate.
0078 , 0
1
a a fost calculat la punctul precedent, iar expresia lui
1

se cunoate din
relaia 1.28, respectiv:

T
t
t
T
t
t
T
t
t
a
x x
T
x x
1
2
1
2
1
2
2
2

) (

2
1
) (


Tabelul 1.3 : Calculul reziduurilor din estimare
Nr. crt.
t
y
t t
x y + 0078 , 0 359 , 6
t

1 11,7 12,42 -0,72 0,518


2 9,3 12,615 -3,315 10,989
3 13,4 11,312 2,088 4,36
4 16,1 13,785 2,315 5,359
5 14,5 14,143 0,357 0,127
6 11,9 14,065 -2,165 4,687
7 9,0 10,93 -1,93 3,725
8 16,1 11,491 4,609 21,243
9 11,0 10,415 0,585 0,342
10 15,8 13,847 1,953 3,814
11 11,0 12,708 -1,708 2,917
12 7,6 12,607 -5,007 25,07
13 12,6 12,349 0,251 0,063
14 16,4 13,886 2,514 6,32
15 9,4 14,081 -4,681 21,912
16 17,6 12,646 4,954 24,542
17 12,9 12,755 0,145 0,021
18 5,3 10,672 -5,372 28,858
19 14,6 11,694 2,906 8,445
20 14,5 12,256 2,244 5,036
9,9082
2 20
178,348
2

20
1
2
2

T
t
t

ceea ce ne permite s calculm variana estimat a lui


1
a :
22759 0000 , 0
435358,6
9082 , 9
) (

1
2
2
2

T
t
t
a
x x

i respectiv:
0,0047706 22759 0000 , 0
1

Figura 1.3 : Distribuia de eantionare sub ipoteza


0
H
-0.05
0.45
0.95
1.45
1.95
-0.05 0.15 0.35 0.55 0.75 0.95
Regula de decizie pentru un prag
05 , 0
devine:
dac
025 , 0
2

1
1
1

>
n a
a
t t
a

respingem ipoteza
0
H
, coeficientul
1
a
este semnificativ
diferit de 0 (acceptm 0
1
a ), venitul este deci o variabil explicativ pentru
cerere.
dac
025 , 0
2

1
1
1


n a
a
t t
a

acceptm ipoteza
0
H
, coeficientul
1
a
nu este semnificativ
diferit de 0 (acceptm 0
1
a ), venitul nu este deci o variabil explicativ pentru
cerere.
Calculm:
64 , 1
0,0047706
007801 , 0

1
1


a
a
a
t

101 , 2
025 , 0
18
t
025 , 0
18
1
t t
a

ceea ce nseamn c din punct de vedere statistic, 0
1
a .
3) Pentru construirea intervalului de ncredere pentru 0
1
a , cunoatem c:
( )

+ 1 Prob
1 1
1 1 1 a a
t a a t a
Aplicnd pentru o probabilitate de 95%:

1
a
%
2

%
2

( ) % 95 00477 , 0 101 , 2 0078 , 0 00477 , 0 101 , 2 0078 , 0 Prob


1
+ a
( ) % 95 ,01782 0 0,00222 - Prob
1
a
Exit deci un risc de 5% ca adevratul coeficient
1
a s se afle n afara intervalului
[ ] ,01782 0 ; 0,00222 - . Valoarea 0 se afl n interval, ceea ce ne duce la aceeai
concluzie ca mai nainte, respectiv 0
1
a .
Acelai demers se poate urma i pentru coeficientul
0
a
, dar vom lsa calculele la
latitudinea cititorului.
4) Coeficientul de corelaie liniar simpl este egal cu:

T
t
T
t
t t
T
t
t t
y y x x
y y x x
r
1 1
2 2
1
) ( ) (
) )( (
de unde:


1
]
1

T
t
T
t
t t
T
t
t t
y y x x
y y x x
r
1 1
2 2
2
1 2
) ( ) (
) )( (
Dar:

T
t
t
T
t
t t
x x
y y x x
a
1
2
1
1
) (
) )( (

De unde putem deduce:


2
1
2
1
1
2
) (
) )( (
R
SPT
SPE
y y
y y x x a
r
T
t
t
T
t
t t

deci pentru regresia liniar simpl, coeficientul de determinaie este patratul


coeficientului de corelaie liniar simpl.
2
2
2
2
2
*) (
) 2 /( ) 1 ( ) 2 /( ) 1 (
t
T r
r
T R
R
F



de unde deducem:
2
1
2
*
r
T r
t

care urmeaz o distribuie Student cu 2 T grade de libertate.


Aceasta permite s testm dac relaia dintre Y i X este semnificativ, sau n mod
echivalent dac r este semnificativ diferit de 0.
2
1
18
64 , 1 *
r
r
t

1293 , 0
2
r
3596 , 0 r
5) Pentru tabloul de analiz a varianei, calculm:
26,4957 ) (
20
1
2

t
i
y y SPE
178,349
20
1
2

t
t
SPR
204,845 ) (
20
1
2

t
i
y y SPT
Putem observa c obinem aceeai valoare a coeficientului de corelaie i pe baza
componentelor varianei:
1293 , 0
845 , 204
4957 , 26
1
2 2

SPT
SPR
SPT
SPE
R r
Tabelul 1.4 : Analiza varianei
Sursa variaiei Suma patratelor Numrul gradelor
de libertate
Variabila explicativ (X) 26,4957 SPE 1
Variabila rezidual (

) 349 , 178 SPR 20-2


Total 845 , 204 SPT 20-1
67 , 2
) 2 20 /(
1 /
*

SPR
SPE
F
Din tabelele cu distribuia Fisher-Snedecor avem:
41 , 4
05 , 0
) 18 ; 1 (
F
05 , 0
) 18 ; 1 (
* F F <
deci variabila venit nu poate fi considerat ca fiind explicativ pentru
variabila endogen, cerere .
Observaie
Cele trei teste sunt echivalente:
0 :
0 :
1 1
1 0

a H
a H

0 :
0 :
, 1
, 0

y x
y x
r H
r H

0 :
0 :
1
0

SPE H
SPE H
Problema a fost rezolvat pn aici ntr-o manier didactic, cu calcule fcute fr a
utiliza programe informatice de specialitate. Prin software-ul STATA, de exemplu,
toate aceste rezultate sunt furnizate imediat. Informaiile de baz redate pentru o
regresie simpl, fr a utiliza opiuni suplimentare sunt urmtoarele:
. regress cerere venit
Source | SS df MS Number of obs = 20
---------+------------------------ F( 1, 18) = 2.67
Model | 26.4957 1 26.4957 Prob > F = 0.1194
Residual | 178.349 18 9.90831 R-squared = 0.1293
---------+------------------------ Adj R-squared = 0.0810
Total | 204.845 19 10.7813 Root MSE = 3.1477
---------------------------------------------------------------
cerere | Coef. Std.Err. t P>|t| [95% Conf.Interval]
---------+-----------------------------------------------------
venit | .007801 .0047706 1.64 0.119 -.002221 .017824
cons | 6.35913 3.841705 1.66 0.115 -1.71198 14.4302
---------------------------------------------------------------
Prima linie a rezultatelor declar variabilele asupra crora s-a efectuat regresia.
Tabelul de analiz a varianei este identic cu cel prezentat anterior.
F(1, 18) = 2.67 este de asemenea o valoare calculat identic cu cea obinut
de noi anterior.
Prob > F = 0.1194 ne arat riscul cu care putem accepta 0 SPE (respectiv n
mod echivalent 0 R ). Riscul este mai mare dect acel 5% n general acceptat,
similar cu ceea ce am concluzionat anterior.
Ultimul tabel prezint estimatorii parametrilor, abaterea medie patratic a
estimatorilor parametrilor, valoarea calculat a lui t, riscul de nulitate a parametrilor
i intervalul de ncredere la 95%. Observm acelai prag de semnificaie 0.119 ca i
la testul F pentru analiza varianei.
6) Pentru observaia de rangul t+1 avem
600
1

+ t
x
.
0396 , 11 600 007801 , 0 359 , 6
1 1 0 1
+ +
+ + t t
x a a y
Eroarea de estimare este:
1
1
1
1
]
1

+ +

1
1
1
1
]
1

+ +

+
+ T
t
t
t
t
t
T
t
t
t
x x
x x
T T
x x
x x
T
t
1
2
2
1
20
1
2
1
2
2
1 2 2
) (
) ( 1
1
2
1
) (
) ( 1
1
1


11,2396
435358,6
) 65 , 791 600 (
20
1
1 349 , 178
2 20
1

2
2
1

1
]
1


+ +

+ t

3,3525
1

+ t

Intervalul de ncredere pentru


1 + T
y se scrie:
( )

+
+ +
+ + +
1 Prob
1 1
2 /
2 1 1
2 /
2 1
t t
e T t t e T t
t y y t y
ceea ce pentru o probabilitate de 95% devine:
( ) % 95 3525 , 3 09 , 2 0396 , 11 3525 , 3 09 , 2 0396 , 11 Prob
1
+
+ t
y
( ) % 95 05 , 19 03 , 4 Prob
1

+ t
y
Intervalul de ncredere este foarte larg, nesatisfctor, datorit varianei reziduale
mari.
Pentru observaia de rangul t+2 avem
800
2

+ t
x
.
12,5998 800 007801 , 0 359 , 6
2 1 0 2
+ +
+ + t t
x a a y
Eroarea de estimare este:
10,4053
435358,6
) 65 , 791 800 (
20
1
1 349 , 178
2 20
1

2
2
2

1
]
1


+ +

+ t

3,2257
2

+ t

( ) % 95 2257 , 3 09 , 2 12,5998 2257 , 3 09 , 2 12,5998 Prob


2
+
+ t
y
( ) % 95 34 , 19 86 , 5 Prob
2

+ t
y
Intervalul de ncredere este mai ngust dect cel obinut anterior, deoarece
800
2

+ t
x
se apropie mai mult de
65 , 791 x
, dar este tot nesatisfctor, datorit
varianei reziduale mari.
7) Pentru regresia liniar simpl dintre cerere i pre nu detaliem calculele, ci le
lsm la latitudinea cititorului. Prezentm doar rezultatele estimaiilor obinute prin
utilizarea programului STATA.
. regress cerere pret
Source | SS df MS Number of obs = 20
---------+------------------------ F( 1, 18) = 5.71
Model | 49.3031 1 49.3031 Prob > F = 0.0281
Residual | 155.542 18 8.64124 R-squared = 0.2407
---------+------------------------ Adj R-squared = 0.1985
Total | 204.845 19 10.7813 Root MSE = 2.9396
---------------------------------------------------------------
cerere | Coef. Std.Err. t P>|t| [95% Conf.Interval]
---------+-----------------------------------------------------
pret |-1.18353 .4954869 -2.39 0.028 -2.22451 -.142556
cons | 20.8493 3.542316 5.89 0.000 13.4072 28.2914
---------------------------------------------------------------
Remarcm c de aceast dat coeficientul corespunztor variabilei explicative este
semnificativ.

S-ar putea să vă placă și