Sunteți pe pagina 1din 29

CURS 7

Influena creterii numrului de parametrii


n cadrul modelului III de regresie liniar
( CONTINUARE )

Deoarece modelul III utilizeaz n plus fa de modelul I

vectori regresori,
cu variabile de control i corespunztor lor matricea are n plus 1 k coloane, iar
modelul I are n plus 1 k parametrii, trebuie stabilit proporia din totalul variabilitii
lui Y , datorat considerrii n plus a celor 1 k vectori coloan din , corespunztori
variabilelor de control.
O msur a variabilitii lui se obine considernd suma ptratelor
componentelor lui , dat de produsul
, care este dat de urmtoarea formul:

( )
. . . .
+ = c c
T T
T
Y Y Y Y 1 ,
care se obine astfel:

( ) . . . . . .
+ + + =
|
.
|

\
|
+
|
.
|

\
|
+ = c c c c c c
T T
T T T T
T
T
Xb X b Xb X b Xb Xb Y Y
1
.
Se tie c , unde . Atunci are loc:
( ) ( ) ( )
k
k
T T T T
n
T T
X X X X X X I X X R e = = =

.
0
1
c c c
k
T
T
T
X X
, 1
0 =
|
.
|

\
|
=
. .
c c .
Utiliznd aceste rezultate n produsul Y Y
T
se obine:

. .
+ = c c
T
T T T
Xb X b Y Y
sau

. . . .
+ = c c
T T
T
Y Y Y Y .
Pe de alt parte, dispersia componentelor lui Y , care msoar abaterea valorilor
de selecie n i Y
i
, 1 , = de la media de selecie

=
=
n
i
i
Y
n
Y
1
1
, are forma:
( )
2
2
1
1 1
Y Y Y
n
Y Y
n
T
n
i
i
=

=
,
din care se deduce:
1 k
X
X
Y
Y Y Y
T
c c B =
.
( ) ( ) R
n
T T
n
M X X X X I B e =
1
not
( )
2
2
1
Y n Y Y Y Y
T
n
i
i
=

=
.
Aceast relaie sugeraz prelucrarea relaiei (1) prin scderea temenul
2
Y n din
ambii termeni ai egalitii, obinndu-se.
( )
. . . .
+
|
|
.
|

\
|
= c c
T T
Y n Y Y Y n Y
2 2
T
Y 2 .
Se consider urmtoarele notaii:

=
. .
=
n
i
i Y
n
Y
1
not
1
, unde
T
n Y Y Y
|
.
|

\
|
=
. . .
,..., 1
not
.
ntre
.
Y i Y exist urmtoare legtur.
PROPOZIIE. n condiiile precizate de ipotezele 0 5 ale modelului III de
regresie liniar, are loc:
( ) Y =
.
Y 3
Demonstraie. Deoarece b este estimatorul lui m n sensul celor mai mici
ptrate, rezult c :
( ) , 0 Y X Xb X b
m
S
T T k
k
= e =
c
c
R unde ( )
k
X X X X ...
2 1
= ,
( )
T
X 1 ,..., 1 , 1
1
= .
Atunci se poate scrie:
( ) * Y X Xb X
T T
1 1
= .
Rezult:

=
. .
=
n
i
i Y
n
Y
1
not
1
=
( )
Y Y
n
Y X
n
Xb X
n
Y X
n
n
i
i
T T T
= = = =

=
.
1
1
*
1 1
1 1 1 1
.
n baza acestei propoziii, relaia (2) se poate scrie:
( )
. . . . .
+
|
|
.
|

\
|
= c c
T T
T
Y n Y Y Y n Y Y 4
2
2
.
Relaia (4) este alctuit din:

1) termenul
2
T
Y Y n Y , numit variaia total a lui Y i se noteaz prin
t
S ;
2) termenul
2
Y n Y Y
T

. .
, numit variaia explicat de regresie i este notat prin
r
S ;
3) termenul
. .
c c
T
, numit variaia neexplicat de regresie sau variaia rezidual,
datorat erorilor i se noteaz prin
e
S .
Observaie. Relaia (4) se mai poate scrie i astfel:

t
S =
r
S +
e
S .
Semnificaia lui
r
S

r
S este acea parte a abaterilor valorilor de selecie n i Y
i
, 1 , = de la media de
selecie Y , care poate fi explicat prin existena dependenei (regresiei) liniare de forma:
( ) Xm Y = M ,
relaie adevrat n baza ipotezei 1 a modelului III.
Semnificaia lui
e
S

e
S este acea parte a variaiei totale, care nu poate fi explicat prin existena
regresiei. Cu ct
e
S are o pondere mai mic n variaia total
t
S , cu att va fi mai
puternic dependena liniar lui Y de X .

O msur a gradului n care variaia lui Y este explicat de X este
coeficientul de determinare.
DEFINIIE. Se numete coeficient de determinare i se noteaz prin
2
R ,
urmtoarea statistic:

t
r
S
S
R =
2
.
Observaie. Coeficientul de determinare se mai poate scrie i astfel:

2
R =
t
e
S
S
1 .
PROPOZIIE. n condiiile precizate de ipotezele 0 5 ale modelului III de
regresie liniar, are loc:

2
2
2
Y n Y Y
Y n Y X b
R
T
T T

= .
Demonstraie. Deoarece , Y X Xb X
T T
= se poate scrie:

2 2 2
Y n Y X b Y n Xb X b Y n Y Y S
T T T T
T
r
= = =
. .
,
de unde rezult formula lui
2
R .
Observaie. n limbajul Gauss se va utiliza urmtorul mod de a calcula
2
R .
Fie vectorul
1
X , ale crui componenete sunt egale cu 1. Atunci:
( ) ( ) Y X X Y
n
Y X Y X
n
Y n
T T T
T
T
1 1 1 1
2 1 1
= = i
Y X X Y Y nY
Y X X Y Y X nb
R
T T T
T T T T
1 1
1 1 2

= sau
( ) ( )
( ) ( ) Y X Y X Y nY
Y X Y X Y X nb
R
T
T
T T
T
T
T T T
1 1
1 1 2

= .
Comentarii asupra coeficientului de determinare
1)
2
R este ptratul coeficientului de corelaie dintre Y i
.
Y , adic are loc:

( )
( )

= =
.
=
.
|
.
|

\
|

(

|
.
|

\
|

=
n
i
n
i
i
i
n
i
i
i
Y Y Y Y
Y Y Y Y
R
1 1
2
2
2
1 2
.
Consecin.
2
R | | 1 , 0 e .
Observaie.
2
R poate fi considerat ca o msur a dependenei liniare dintre
i
Y i
n i Y
i
, 1 , =
.
, i n consecin ca o msur a adecvrii modelului III.
2)
2
R poate s nu aib valori n intervalul | | 1 , 0 , dac formula lui
2
R este aplicat
n cazul unui model econometric neliniar sau n cazul n care b nu este estimaia n
sensul celor mai mici ptrate, deoarece egalitatea
k
T
X 0 =
.
c nu mai este adevrat i
.
Y
nu este egal cu Y .
Deficien.
2
R nu este suficient de sensibil la modificarea numrului de variabile de control,
astfel el nu crete dac se adaug noi variabile de control, ba chiar poate descrete. Din
aceast cauz
2
R nu poate fi utilizat drept criteriu pentru a compara dou modele de
regresie liniar de tipul III ale aceluiai fenomen economic. Legat de aceast deficien,
n cazul cnd
2
R nu crete odat cu creterea numrului de variabile de control, ca o
msur a capacitii explicative a modelului III este considerat urmtoarea modificare a
lui
2
R , notat prin
2
R :

( )
( )
2 2
2
2
1
1
1
1
1
1
1 R
k n
n
R
Y n Y Y
n
k n
R
T
T

=
. .
c c
,
unde
. .

c c
T
k n
1
este estimatorul nedeplasat al lui ( ) n i , 1 , D
i
2
= = c o , iar
( )
2
1
1
Y n Y Y
n
T

este estimatorul nedeplasat al dispersiei de selecie a componentelor lui


Y , (notat prin ( ) Y D ).
Observaie. Dac adugarea unei noi variabile de control produce o reducere prea
mic a lui
2
1 R pentru a putea compensa creterea coeficientului
k n
n

1
, atunci nici
coeficientul
2
R nu va fi luat n seam.
Atenie!

2
R sau
2
R nu pot hotr asupra alegerii modelului III de regresie liniar .
Pentru a alege ntre dou modele de regresie liniar de tipul III i care difer prin
numrul de variabile de control se poate utiliza un alt indicator sintetic, notat prin S i
numit eroarea standard, care este o msur a variaiei neexplicate i are urmtoarea
formul:

. .
=
.

=
(
(

|
.
|

\
|


=

c c
T
n
i
i i
k n
Y Y
k n
S
1
1
1
1
2
1
1
2
.
Eroarea standard este considerat ca fiind i o msur a gradului de adecvare al
modelului III de regresie liniar.



Teste pentru stabilirea oportunitii creterii numrului de regresori

Se consider modelul III de regresie liniar ( ) R R
k n
n
M X Y Xm Y
,
, , e e + = c ,
k n
m R R e e , c , care conine k parametrii i k regresori. Presupunem c se adaug un
nou vector regresor, obinndu-se un nou model III de regresie liniar a crei ecuaie
este ( )
n k
k n
m M X m X Y R R R e e e + =
+
+ 0
1
0 1 , 0 0 0 0
, , , c c .

Cazul regresorilor stochastici

Se consider modelul III de regresie liniar:
c + = Xm Y .
Alturi de terminologia cunoscut privind elementele modelului, se utilizeaz i
urmtoarele denumiri:
- Y mai este numit regresand sau variabil dependent;
- vectorii coloan ai matricei X se mai numesc i regresori sau variabile
independente sau covariani;
- c mai este numit oc sau perturbare.
n analiza modelului III de regresie liniar s-a considerat c matricea X este o
matrice de elemente constante, adic X este o matrice nonstochastic i deci regresorii
sunt nonstochastici. n baza ipotezelor 0 5, s-a determinat estimaia b a lui m , n
sensul celor mai mici ptrate, dat de formula:
( ) Y X X X b
T T
1
= ,
din care rezult:
( ) ( ) ( ) c c
T T T T
X X X m Xm X X X b
1 1
+ = + = .
Vom considera cazul n care regresorii sunt variabile aleatoare, ceea ce implic
faptul c matricea X este stochastic. Atunci are sens media condiionat a lui b de
matricea X i are loc:
( ) ( ) ( ) ( ) ( ) X M M X b M
1 1
c c
T T T T
X X X m X X X X m

+ = + =
i deoarece ( )
n
X 0 M = c , n baza ipotezei 3, se obine:
( ) m X b = M .
n baza teoremei mediei iterate, rezult c media lui b se determin astfel:
( ) ( ) | | ( ) m m X b b = = =
X X
M M M M .
Acest rezultat are urmtoarea semnificaie: b este o estimaie nedeplasat a lui
m i n situaia n care X este o matrice stochastic.
Deoarece X este stochastic, are sens dispersia condiionat a lui b de matricea
X i are loc:
( ) ( )
1
2
D

= X X X b
T
o ,
care este rezultatul obinut n baza ipotezelor 0 5. Pentru a calcula dispersia lui b , cu
condiia X este stochastic, se aplic formula de descompunere a dispersiei, obinndu-
se:
( ) ( ) | | ( ) | | X b X b b
X X
D M M D D + = ,
de unde rezult:
( ) | | ( ) | | ( ) | |
1
2
1
2
M M D D

= + = X X X X m b
T
X
T
X X
o o .
Din demonstraia teoremei lui Gauss-Markov, rezult c oricare ar fi
'
b o
estimaie din familia LN are loc.
( ) ( ) X b X b
'
D D < oricare ar fi o matrice particular X .
n cazul X este o matrice stochastic i n baza inegalitii de mai sus, se poate
scrie :
( ) ( ) | | ( ) X b X b b
X
'
D D M D s = .
n acest fel s-a stabilit urmtorul rezultat.
TEOREMA Gauss-Markov cu regresori stochastici. n ipotezele modelului
III de regresie liniar, estimaia b , n sensul celor mai mici ptrate, este estimaia
liniar nedeplasat cu dispersia minim a lui m , unde X este o matrice stochastic
sau nonstochastic.




MODELUL III NORMAL DE REGRESIE LINIAR

Se consider modelul III de regresie liniar:
c + = Xm Y
construit pe baza ipotezelor 0 5.
Alturi de cele 6 ipoteze, se va considera i urmtoarea ipotez.
IPOTEZA 6. ( )
n n
I N X
2
, 0 o c e ,
unde ( ) E , N este familia vectorilor aleatori cu o repartiie normal multidimensonal,
avnd media
n
R e i matricea de covarian E.
Consecin. ( )
n
X 0 M = c i
n X
I
2
o
c
= E .
DFINIIE. Modelul III de regresie liniar, care are satisfce i ipoteza 6, se
numete modelul III normal de regresie liniar.

[N.S.] Repartiia normal multidimensional _______________
DEFINIE. O variabil aleatoare unidimensional X are o repartiie
normal de parametrii R e m i 0
2
> o , i se scrie ( )
2
,o m N X e , dac densitatea se
de repartiie este:
( )
( )
R e
)
`


= x
m x
m x f ,
2
exp
2
1
,
2
2
2
2
o
to
o .
PROPOZIIE. Dac ( )
2
,o m N X e i R e = + = b a b aX Y , 0 , , atunci:
( )
2 2
, o a b am N Y + e .
Consecina 1. Fie ( ) m X Z =
o
1
. Atunci ( ) 1 , 0 N Z e , adic Z are o repartiie
normal normat, a crei densitate de repartiie este:
( ) R e
(

= z
z
z f ,
2
exp
2
1
2
t
.
Consecina 2. Fie m Z X + =o . Atunci ( )
2
,o m N X e .
!.....Se consider n variabile aleatoare independente unidimensionale, avnd
aceeai repartiie normal normat i notate prin n i Z
i
, 1 , = . Fie vectorul aleator coloan
( )
T
n
Z Z Z ,..., ,
2 1
= Z .
PROPOZIIE. Fie R R
n
g : , densitatea de repartiie a vectorului aleator
Z. Atunci:
( ) ( )
)
`

=

z z z
T
n
g
2
1
exp 2 2 t ,
unde ( )
T
n
z z ,...,
1
= z i
i
z este valoarea variabilei aleatoare n i Z
i
, 1 , = .
Demonstraie. Deoarece componentele vectorului Z sunt variable aleatoare
independente cu o repartiie normal normat, se poate scrie:
( ) ( ) ( ) ( ) ( )
)
`

=
)
`

=
)
`

= =

=

=
[ [
z z z
T
n
n
i
i
n
n
i
i
n
i
i
z z z f g
2
1
exp 2
2
1
exp 2
2
1
exp 2 2
1
2
2
1
2
2
1
1
t t t
.
________________________________________________________________________


CURS 8

____________________[N.S.] Repartiia normal multidimensional _____________

Se consider n variabile aleatoare unidimensionale cu aceeai repartiie normal
normat, independente i notate prin n i Z
i
, 1 , = . Fie vectorul coloan
( )
T
n
Z Z Z ,..., ,
2 1
= Z , care este un vector aleator, deoarece componentele sale sunt
variabile aleatoare.
PROPOZIIE. Densitatea de repartiie a lui Z se noteaz prin g i are
urmtoarea form:
( ) ( )
)
`

=

z z z g
T
n
2
1
exp 2 2 t ,
unde ( )
T
n
z z z z ,..., ,
2 1
= i
i
z este valoarea variabilei aleatoare n i Z
i
, 1 , = .
Demonstraie. Fie G funcia de repartiie comun a celor n variabile aleatoare
unidimensionale independente n i Z
i
, 1 , = . Atunci, prin definiie:
( ) ( ) ( )
n n n
z Z z Z z Z P z z z G z G < < < = = ,..., , ,..., ,
2 2 1 1 2 1

i
( )
( )
n
n
n
z z z
z z G
z g
c c c
c
=
...
,...
2 1
1
.
Deoarece componentele vectorului Z sunt variabile aleatoare independente cu o
repartiie normal normat, se poate scrie:
( ) ( ) ( )
[ [
= =
= < =
n
i
i
n
i
i i
z F z Z P z G
1 1
, iar f F = ' pe R i
( ) = z g ( ) ( ) ( )
)
`

=
)
`

=
[ [
=

=
n
i
i
n
n
i
i
n
i
i
z z z f
1
2
2
1
2
2
1
1
2
1
exp 2
2
1
exp 2 t t =
( )
)
`

=

z z
T
n
2
1
exp 2 2 t .
Se consider vectorul aleator b Z X + = A , unde ( ) R
n
M e A cu 0 = A i
n
R be . Pentru a se determina densitatea de repartiie f a vectorului X se aplic tehnica
schimbrii de variabil, obinndu-se:
( ) ( ) | | ( ) ( ) ( )
)
`

= =

b b b X A A X A A X A g X f
T T
n
1
1
2
1
1
2
1
exp 2t , unde
X este vectorul ale crui componente sunt valorile componentelor lui X i b + = Az X .
Deoarece ( )
n
n
R Z e = 0 M i ( )
n
T
I M = = ZZ
Z
E , rezult c ( ) b X = M i
matricea de covarian E a vectorului X se obine astfel:
( )( ) | | | | | |
T T T T T T
AA M AA A A M M = = = = ZZ ZZ b X b X E .
Observaie.
2
A = E , iar
2
1
E = A i
1 1
= A A
T
E .
n final se obine:
( ) ( ) ( ) ( )
)
`

=


b b X X X f
T
n
1
2
1
2
1
exp 2
2
t .
Se face notaia:
not
= b . Cu aceast notaie se obine forma clasic a densitii de
repartiie f :
( ) ( ) ( ) ( )
)
`

=


t X X X f
T
n
1
2
1
2
1
exp 2
2
.
DEFINIIE. Vectorul aleator X are o repartiie normal multidimensional
cu media
n
R e i matricea de covarian ( ) R
n
M e E , pozitiv definit, i se scrie
, dac densitatea sa de repartiie este:
( ) ( ) ( ) ( )
)
`

=


t X X X f
T
n
1
2
1
2
2
1
exp 2 .
DEFINIIE. Un vector aleator cu o repartiie normal multidimensional se
numete vector normal.
Proprietatea de multiplicativitate. Dac i ( ) R
n m,
M e D , atunci
vectorul ( )
T
D D D N D E e , X , unde n ms .
Observaie. Dac n m = , atunci n rangD = i trebuie s fie pozitiv
definit.
Proprietatea de aditivitate. Dac ( ) E e , 0
n
N X i
n
R e , atunci
( ) N , e + X .
( ) E e , N X
( ) E e , N X
T
D DE


Se consider modelul III normal de regresie liniar:
c + = Xm Y ,
unde ( )
n
X 0 = c M i
n X
I
2
o
c
= E .
Repartiia vectorului aleator Y este precizat de urmtoarea afirmaie.
PROPOZIIE. ( )
n
I Xm N X Y
2
,o e .
Demonstraie. n baza ecuaiei modelului III, rezult:
( ) ( ) ( ) Xm Xm = + = + = X M X Xm M X Y M c c .
Matricea de covarian a lui X Y se poate calcula astfel:
( )( ) | | | |
n X
T
X Y
I X X
2
o cc
c
= E = = = E
T
M Xm - Y Xm - Y M .
Deoarece ( )
n n
I N X
2
, 0 o c e , rezult n baza proprietii de aditivitate c:
( ) ( )
n n n
I Xm N X Y I N X Xm Y
2 2
, , 0 o o e e .
PROBLEM. S se determine estimatorii de maxim verosimilitate ai lui m
i
2
o .
A. Estimatorul vectorului m

Deoarece ( )
T
n
Y Y Y Y ,..., ,
2 1
= i ( )
n
I Xm N X Y
2
,o e , pentru i fixat, se poate
scrie:
( )
2
,o m X N X Y
i
i
e ,
unde ( )
ik i i
i
x x x X ,..., ,
2 1
= este linia n i i , 1 , = , a matricei X .Atunci:
( ) ( ) n i m X Y X Y f
i
i i
, 1 ,
2
1
exp
2
1 2
2 2
=
)
`

=
o t o
.
Pentru a construi funcia de verosimilitate seconsider densitatea de repartiie
comun a lui
n
Y Y ,...,
1
condiionat de X , care este de forma:

( ) ( ) ( ) ( ) ( )
[ [
)
`

= = =

=
n
i
i
i
n
i
i n
m X Y m X Y f m X Y Y f m X Y f
1 '
2
2
2
1
2
1
2 2
1
2
2
1
exp 2 , , , , ,..., , ,
o
to o o o

( ) ( ) ( ) ( ) ( )
)
`

=
)
`

=

=

Xm Y Xm Y m X Y
T
n n
i
i
i
n
2
2
2
1
2
2
2
2
2
1
exp 2
2
1
exp 2
o
to
o
to .
ndat ce vectorul de selecie Y este cunoscut i matricea X este dat,
( )
2
, , o m X Y f se interpreteaz ca o funcie de vectorul parametrilor m i de
2
o , iar
funcia obinut este numit funcia de verosimilitate i se noteaz prin:
( ) ( ) ( ) ( )
)
`

=

Xm Y Xm Y X Y m L
T
n
2
2
2 2
2
1
exp 2 , ,
o
to o .
Deoarece funcia de verosimilitate, n acest caz, este strict pozitiv, se poate
calcula logaritmul natural al ei, obinndu-se:
( ) ( ) ( ) ( ) Xm Y Xm Y
n
X Y m L
T
=
2
2 2
2
1
2 ln
2
, , ln
o
to o .
Fie m estimatorul de maxim verosimilitate a lui m . Atunci, n timp ce
2
o este
constant, m trebuie s maximizeze funcia de verosimilitate L, ceea ce este echivalent
cu maximizarea logaritmului natural la funciei de verosimilitate L ln .
Se observ c, n cazul n care
2
o este constant, L ln are valoarea maxim, atunci
cnd expresia ( ) ( ) Xm Y Xm Y
T
are valoarea minim, ceea ce este echivalent cu
determinare lui m ca soluie a problemei urmtoare:
| | ( ) = m S min ( ) ( ) Xm Y Xm Y
T
,
despre care se tie c are soluia ( ) Y X X X b
T T
1
= , obinut cu metoda celor mai mici
ptrate.
Prin urmare, are loc: m = ( ) Y X X X b
T T
1
= . Rezult c proprietile statistice ale
lui m sunt exact cele ale lui b , adic:
1) ( ) m = m M ; 2) ( )
1
2

= E X X
T
m
o ; 3) m este estimatorul cel mai bun ( cea mai
precis ) din clasa tuturor estimatorilor liniari i nedeplasai ai lui m .
Repartiia lui m este precizat de urmtoarea afirmaie.
PROPOZIIE. ( ) ( )
1
2
,

e X X m N X m
T
o .
Demonstraie. Dac se face notaia ( ) ( ) R
n k,
M e =

T T
X X X D
1
, rezult c
DY m = . Deoarece ( )
n
I Xm N X Y
2
,o e , n baza proprietii de multiplicativitate se
obine:
( ) ( ) ( )
1
2 2
, ,

e e X X m N X m DD DXm N X m
T T
o o .

B. Estimatorul parametrului
2
o

Se consider funcia de verosimilitate ( ) X Y m L , ,
2
o i ( ) X Y m L , , ln
2
o .
Fie
2
o estimatorul de maxim verosimilitate a lui
2
o . Atunci
2
o trebuie s
maximizeze funcia L ln , atunci cnd m m = , adic
2
o este soluia ecuaiei:

( )
0
, , ln
2
2
=
c
c
o
o X Y m L
.
Rezult:

( )
( ) ( ) = +


0
2
1
2 2
2
2
2
2
m X Y m X Y
n T
o
o t
t

( ) ( )
. .
.
=
=
= c c o
c
o
T
T
n
Xb Y
m X Y m X Y
n
1 1
2 2
.
Prin urmare, estimatorul de maxim verosimilitate a lui
2
o este:

. .
= c c o
T
n
1
2
.
O caracterizare statistic a lui
2
o este dat de urmtoarea afirmaie:
PROPOZIIE. este un estimator deplasat al lui
2
o .
Demonstraie. Se poate scrie:
( ) X
2
Mo =
n
1
|
|
.
|

\
|
. .
X
T
c c M
tim c , unde ( ) ( ) R
n
T T
n
M X X X X I B e =
1
not
i este simetric i
idempotent. Fie
.
.
.
= c c
T
S
not
. Atunci
.
S se poate exprima n funcie de B , astfel
.
S = c c B
T
.
Deoarece ( ) C
1
M B
T
e c c , se poate scrie:
= ( ) ( ) | | ( ) | | X B Tr M X B Tr M X B M X S M
T T T
cc c c c c = = =
|
.
|

\
|
.

= ( ) | | ( ) | | | |= = =
n
BI Tr X Tr X Tr
2 T T
BM B M o cc cc ( ) B Tr
2
o ,
deoarece Tr i M sunt operatori liniari permutabili. Pe de alt parte, are loc:

( ) ( ) | | ( ) ( ) | | ( ) | |= = = =
1 1 1
X X X X Tr n X X X X Tr I Tr X X X X I Tr B Tr
T T T T
n
T T
n

= ( ) k n I Tr n
k
= .
n concluzie ( ) k n X S =
|
.
|

\
|
.
2
M o i ( ) ( )
2 2
k - n
1
M o o
n
X = . Atunci:
( ) ( ) ( )
2 2 2 2 2
M M M M o o o o o =

= |
.
|

\
|
= =
n
k n
n
k n
X
X X
.
Deci este o estimaie deplasat a lui
2
o .
Observaie. O estimaie nedeplast a lui
2
o este . Iar legtura
dintre
2
o i este:
.
Datorit ipotezei 6 privind normalitatea se poate determina repartiia estimaiei
.
2
o . Pentru aceasta avem nevoie de noi rezultate clasice.

__________________________[N.S.] Repartiia hi-ptrat ________________________
DEFINIE. O variabil aleatoare unidimensional X are o repartiie hi-
ptrat de parametrii n i o , dac densitatea sa de repatiie este:
2
o
c c B =
.
|
|
.
|

\
|
. .
X
T
c c M
2
o
. .
.

= c c o
T
k n
1
2
.
2
o
.
2
o
2
o
k n
n

=
( )
*
2
1
2
2 , 0 ,
0 , 0
0 ,
2
2
1
,
2
N e >

<
>
|
.
|

\
|
I
=

n
x
x e x
n
n x f
x n
n
n
o
o
o
o
.
Mulimea variabilelor aleatoare unidimensionale care au o repartiie hi-ptrat de
parametrii n i o se noteaz prin ( ) o , n H ; dac 1 = o se utilizeaz notaia
( ) ( ) n n H
2
1 , _ = , care este tabelat.
PROPOZIIA 1. Dac ( ) 1 , 0 N X e , atunci ( ) 1
2 2
_ e = X Y .
PROPOZIIA 2. Dac ( ) n i N X
i
, 1 , 1 , 0 = e i sunt variabile aleatoare
independente, atunci ( ) n X Y
n
i
i
2
1
2
_ e =

=
.
DEFINIIE. Numrul natural n din propoziia 2 se numete numrul
gradelor de libertate, fiind egal cu numrul variabilelor aleatoare independente care
generaz pe Y .
PROPOZIIA 3. Dac ( ) ( ) ( )
k k
n X n X n X
2
2
2
2 1
2
1
,..., , _ _ _ e e e i sunt
mutual independente, atunci |
.
|

\
|
e =

= =
k
i
i
k
i
i
n X Y
1
2
1
_ .
PROPOZIIA 4. Dac ( ),
2
n X _ e atunci ( ) n = X M i ( ) n X D 2 = .
TEOREMA 1. Dac vectorul aleator ( )
n n
I N , 0 e Z , atunci .
Demonstraie. Deoarece ( ) ( )
n n
T
n
I N Z Z Z , 0 ,..., ,
2 1
e = Z , rezult

=
=
n
i
i
T
Z
1
2
Z Z ,
unde ( ) n i N Z
i
, 1 , 1 , 0 = e . Atunci , n baza propoziiei 1, rezult ( ) n i Z
i
, 1 , 1
2
= e_ , iar
n baza propoziiei 2, rezult ( ) n
T 2
_ e Z Z .
TEOREMA 2. Dac M este o matrice simetric, idempotent, de rang
*
N e k i ( )
n n
I N , 0 e Z , atunci funcionala ptratic ( ) k M
T 2
_ e Z Z .
PROPOZIIA 5. Dac ( )
n n
I N
2
, 0 o e X i ( ) R
n
M e B A, sunt simetrice,
atunci funcionalele ptratice i sunt independente, dac i numai
dac ( ) R
n
M e = 0 AB .
PROPOZIIA 6. Dac ( )
n n
I N
2
, 0 o e X , A este o matrice simetric i B este
o matrice oarecare, atunci funcionala liniar X B i funcionala ptratic X X A
T

sunt independente, dac
n
A B 0 = .
PROPOZIIA 7. Dac ( ) R
n
M e A este o matrice idempotent nenul, atunci
( ) ( ) A Tr A rang = .

Cu aceste proprieti se poate stabili repartiia lui
.
2
o .
PROPOZIIE. ( ) k n X
T
e
. .
2
2
1
_ c c
o
.
( ) n
T 2
_ e Z Z
X X A
T
X X B
T
Demonstraie. Deoarece c c
o
c c
o
B
T
T
2 2
1 1
=
. .
, i
( )
n n
I N X
2
, 0 o c e , rezult c ( )
n n
I N X , 0
1
e c
o
i ( ) k n X B
T
e |
.
|

\
|
|
.
|

\
|
2
1 1
_ c
o
c
o
, n
baza teoremei 2.
Consecin. ( )
2 2 2
2
2
, o o _
o
o =
|
|
.
|

\
|

e
. .
M k n
k n
X i
k n
D

=
|
|
.
|

\
|
. 2
2
2o
o .
Legtura stochastic dintre estimaiile i este precizat de urmtoarea
afirmaie.
PROPOZIIE. Vectorul aleator m este independent de variabila aleatoare
.
2
o .
Demonstraie. Este adevrat urmtorul ir de echivalene:

. .
.

= c c o
T
k n
1
2
este independent de
.
c este independent de m matricea
de covarian dintre
.
c i m , condiionat de X este matricea nul
( )
k n
T
X m m
,
0 M =
(


.
c .
Deoarece:
( ) ( ) ( ) ( ) + = + = = =

c c
T T T T T T
X X X m Xm X X X Y X X X b m
1 1 1


i ( ) ( )c c c
T T
n
X X X X I B
1
.
= = , rezult:

( ) ( ) ( ) ( )
k n
T T T
n
X X X X X X X X I
,
T
1 1
0 M = =

cc















( ) k n B Tr rangB = =
m
2
o
m
( ) c
1
= X X m m
T
( ) ( ) ( ) ( ) | |= =
(



.
X X X X X X X X X m m
T T T T
T 1 1
n
I M M cc c
CURS 9

GENERALIZRI ALE MODELELOR ECONOMETRICE LINIARE

Modelul econometric de regresie liniar multifactorial cu matricea de
covarian diferit de
n
I
2
o

Construirea modelului III de regresie liniar sau a modelului de regresie liniar
multifactorial s-a realizat n urmtorul cadru statistic.
Se consider o populaie statistic, a crei caracteristic studiat este o variabil
aleatoare teoretic X, care este influenat de 1 k factori cunoscui, care sunt variabile
vectoriale, notate prin ( ) 2 , , 2 , ,..., ,
2 1
> = = k k j x x x X
T
nj j j j
.
Din populaia statistic se extrage, la ntmplare, o selecie repetat
{ }
n
Y Y ,...,
1
, de volum
*
N e n , referitoare la variabila aleatoare teoretic X.
n aceste condiii, se fac urmtoarele ipoteze, (cu scopul de a construi un
model mai general dect modelul II sau modelul bifactorial de regresie liniar).
IPOTEZA 0. Fiecare valoare de selecie
i
Y este alctuit din media sa
( )
i
Y M , numit component sistematic ( determinist ) sau semnal i o component
aleatoare inobservabil
i
c , numit eroare sau zgomot, n i , 1 = .
n baza acestei ipoteze se poate scrie:
( ) ( )
i
c + =
i i
Y M Y 1 , n i , 1 = .
IPOTEZA 1. Influena variabilelor vectoriale k j X
j
, 2 , = , asupra lui
X este liniar i este descris de relaia urmtoare:
( ) n i m x m
k
j
j ij
, 1 , Y M
2
1 i
= + =

=
,
unde k j n i x
ij
, 2 , , 1 , = = sunt numite variabile de control sau explicative, iar
k
m m ,...,
1
sunt numii parametrii locali i care dei sunt necunoscui, se presupun
constani n raport cu selecia.
inndu-se seama n relaia (1) de ipoteza 1 se obine:
( ) n i m x m
k
j
i j ij
, 1 , Y 2
2
1 i
= + + =

=
c .
Se fac urmtoarele notaii:
( ) ( ) ( ) R R
k n,
M e = e =
k
n T
n
X X X X Y Y Y ... , ,...,
2 1 1
unde ( )
n T
X R e = 1 ,..., 1
1
i
( ) 2 , , 2 , ,..., ,
2 1
> = e = k k j x x x X
n T
nj j j j
R , ( )
k T
k
m m m R e = ,...,
1
i
( )
n T
n
R e = c c c ,...,
1
,
cu ajutorul crora sistemul (2) se scrie:
Xm Y + = ) 3 (
i reprezint modelul III de regresie liniar sau modelul multifactorial de regresie
liniar, n care:
Y este vectorul aleator de selecie sau vectorul efectelor, observabil i ale crui
componente n i Y
i
, 1 , = au o densitate de repartiie condiionat de forma
( ) m x x x Y f
ik i i i
, ,..., ,
2 1
; X este numit matricea cadru, m este numit vectorul
parametrilor locali i este necunoscut, iar c este vectorul aleator al erorilor
inobservabile.
Referitor la coloanele matricei X se face urmtoarea ipotez.
IPOTEZA 2. Coloanele matricei X formeaz un sistem liniar
independent n ( ) R R ,
n
i k n > .
Consecina 1. k rangX = .
Demonstraia rezult n baza ipotezei 2.
Consecina 2. ( ) R
k
M e X X
T
este o matrice simetric, pozitiv definit i
nesingular.
Demonstraie. Cum ( ) X X X X
T
T
T
= se deduce c X X
T
este simetric.
Fie vectorul nenul
k
x R e i considerm produsul ( ) 0 > = Xx Xx Xx X x
T T T
, care este o
sum de ptrate. Dac produsul ar fi chiar 0, atunci ar trebui ca
n
Xx 0 = , adic coloanele
lui X sunt liniar dependente, ceea ce contrazice ipoteza 2. Rezult c X X
T
este o
matrice simetric, pozitiv definit i deci 0 = X X
T
, adic nesingular.
IPOTEZA 3. ( )
( )
( )
( )
n
n
n
X
X
X
X R e =
(
(
(
(
(

= 0
M
M
M
M
2
1
c
c
c
c

.
Comentariu. Conform ipotezei 3, matricea X nu conine nici o
informaie referitoare la media erorilor.
Noiuni suplimentare
Repartiii condiionate, medii condiionate

Fie vectorul aleator bidimensional ( ) Y X Z , = , unde:

( ) ( )
|
|
.
|

\
|
>
|
|
.
|

\
|
>
y g
y
Y
x f
x
X ~ , ~ i
( )
( )
R e
|
|
.
|

\
|
> y x
y x h
y x
Z , ,
,
,
~ .
Atunci:
( ) ( ) ( ) ( ) . , , ,
} }


= = dx y x h y g dy y x h x f
Au sens urmtoarele definiii ale densitilor de repartiie condiionate:
( )
( )
( )
( ) ( ) ( ) y g y x f y x h
y g
y x h
y x f / ,
,
/ = = i ( )
( )
( )
( ) ( ) ( ) x f x y f y x h
x f
y x h
x y f / ,
,
/ = = .
Cu ajutorul densitilor de repartiie condiionat se pot defini mediile
condiionate, n felul urmtor:
( ) ( )
}


= = dx y x xf y Y X M / / i ( ) ( )
}


= = dy x y yf x X Y M / / .
Teorema mediei iterate. Este adevrat urmtoarea relaie:
( ) ( ) | |. / x X Y M M Y M
X
= = ,
unde | | .
X
M este media unei funcii de variabila aleatoare X .
Demonstraie. Fie o funcie R R : u , R O : X i funcia compus
R O : X u , care este o variabil aleatoare cu repartiia:
( )
( )
( )
|
|
.
|

\
|
>
x f
x u
X u ~ .
Prin definiie media lui X u se noteaz prin ( ) | | X u M i este dat de relaia:
(*) ( ) | | ( ) ( )
}


= dx x f x u X u M .
Partea dreapt a egalitii, utiliznd relaia (*), devine:
( ) | | | | ( ) ( ) ( ) =
|
|
.
|

\
|
= = = =
} } }


dx dy x f x y yf dx x f x X Y M x X Y M M
X
/ / /
( ) ( ) ( ) Y M dy y yg dy dx y x h y = =
(

=
} } }


, .
TEOREMA DE DESCOMPUNERE A DISPERSIEI.
( ) ( ) | | ( ) | | x X Y D M x X Y M D Y D
X X
= + = = | | ,
unde | | .
X
D este dispersia unei funcii de variabila aleatoare X .


Consecina 3. ( )
n
0 M = c .
Demonstraie. Are loc:
( ) | | | | | | ( )
n X i X i
M n i M X M M M 0 , 1 , 0 0 = = = = = c c c .
Consecina 4. ( ) n i X , 1 , 0 , cov
i
= = c .
Demonstraie. Are loc:
( ) | | | | ( ) n i X X X X
i
, 1 , 0 , 0 cov , M cov , cov
i
= = = = c c .

IPOTEZA 4. ( )
n
T
I X M
2
o cc = , 0
2
> o .

Comentariu. Aceast relaie se poate explicita astfel:

( )
( ) ( ) ( )
( ) ( ) ( )
( ) ( ) ( )
n
n n n
n
n
T
I
X X X
X X X
X X X
X
2
2
2
2
2
2 1
2
2
2 1 2
1 2 1
2
1
0 0
0 0
0 0
M M M
M M M
M M M
M o
o
o
o
c c c c c
c c c c c
c c c c c
cc =
|
|
|
|
|
.
|

\
|
=
(
(
(
(
(

.
Consecina 5. Matricea de covarian a erorilor este
n
I
2
o
c
= E .
Demonstraie. Are loc:
( ) | | | | | |
n n
T T
I I X
2 2
X X
M M M M o o cc cc
c
= = = = E .
Comentariu. n baza consecinei 5, rezult c ( ) n i , 1 , D
2
i
= = o c . n
acest caz se spune c erorile
n
c c ,...,
1
sunt homoscedastice. Deasemeni, deoarece
( ) 0 , cov =
j i
c c pentru j i = , erorile sunt necorelate. Uneori, erorile care sunt
homoscedastice i necorelate se numesc erori sferice.
Alturi de cele 5 ipoteze se consider frecvent i urmtoarea ipotez.

IPOTEZA 5. Matricea X are toate elementele constante i cunoscute.
Observaie. Vectorul Y difer de la o selecie al alta, pe cnd X ,
conform ipotezei 5, este aceeai indiferent de selecia efectuat; aceasta este
justificarea pentru denumirea de matrice cadru a lui X i pentru faptul c Y are o
repartiie condiionat de X .
n realitatea economic sunt multe situaii n care ipoteza 4 nu este
respectat, fie c erorile sunt independente dar nu au aceeai dispersie i n acest caz
erorile sunt heteroscedastice, nicidecum homoscedastice, fie c erorile sunt corelate sau
chiar autocorelate, fiind rezultatul unui proces stochastic autoregresiv.
n cele ce urmeaz se vor considera situaii n care unele dintre
ipoteze vor fi nclcate.

Modelarea econometric a fenomenului de heteroscedasticitate

n cazul n care ipoteza 4 nu este ndeplinit, matricea de covarian are
forma general:
( )
|
|
|
|
|
|
.
|

\
|
o o o o
o o o o
o o o o
o o o o
= cc = E
c
2
3 2 1
3
2
3 32 31
2 23
2
2 21
1 13 12
2
1
n n n n
n
n
n
T
M

,
unde, n i
i
, 1 ,
2
= o este dispersia erorilor n i
i
, 1 , = c , iar ( ) j i
j i ij
= c c = o , , cov .
Un exemplu de situaie economic n care se ncalc ipoteza 4 este
prezentat n [Jula, 144] i se refer la faptul c atunci cnd veniturile unei familii cresc,
sumele care depesc cheltuielile cu coul zilnic sau satisfacerea nevoilor elementare
devin consistente i permit o gam larg de opiuni, ceea ce are ca efect faptul c
dispersia abaterilor valorilor calculate cu un model econometric al consumului fa de
valorile efective ale consumului s fie direct proporionale cu creterea veniturilor. Prin
urmare, n modelul de regresie liniar al legturii dintre venituri i consum, ipoteza
constanei dispersiilor erorilor nu mai este verificat aprnd fenomenul de
heteroscedasticitate.
Prezena fenomenului de heteroscedasticitate afecteaz rezultatele obinute
cu modelul multifactorial de regresie liniar. Astfel, estimatorii obinui dei sunt
nedeplasai, nu mai sunt cei mai buni estimatori nedeplasai.
ntr-adevr, s considerm cazul n care ipoteza 4 este nlocuit cu
urmtoarea ipotez:
IPOTEZA 4.1. ( ) + u
2
o cc = = X M
T
, unde 0
2
> o este necunoscut, iar
( ) R
n
M e + i este o matrice simetric, pozitiv definit i cunoscut.
Consecina 5.1. Matricea de covarian a erorilor este + E
2
o
c
= .
Demonstraie. Are loc:
( ) | | | | | | + + E
2 2
o o cc cc
c
= = = =
X
T
X
T
M X M M M .
DEFINIIE. Modelul econometric III de regresie liniar, n care ipoteza
4 a fost nlocuit prin ipoteza 4.1. se numete modelul +
2
o de regresie liniar.
Pentru modelul +
2
o de regresie liniar se pune problema estimrii
parametrilor.
Problema 1. S se determine un estimator al vectorului necunoscut m .
Se observ c, n noile condiii, se poate scrie:
( ) | | Xm Xm M Y M = + = c ,
( )( ) ( ) | | ( ) | | + E
2
o cc = = = X M M X Xm Y Xm Y M M
T
X
T
X Y
i
se poate aplica metoda celor mai mici ptrate pentru obinerea estimatorului
1
b al lui m ,
obinndu-se:
( ) ( ) ( ) ( ) c c
T T T T T T
X X X m Xm X X X Y X X X b
1 1 1
1

+ = + = = (1)
Proprietile statistice ale lui
1
b , care este un vector aleator, sunt:
( ) ( ) ( ) m X M X X X m X b M
Ip
T T
3 .
1
1
= + =

c
( ) ( ) | | m X b M M b M
X
= =
1 1
(2)
Din (2) rezult c
1
b este un estimator nedeplast al lui m ;
( )( ) | | ( ) ( ) | | ( ) ( ) ( )
1 1 1 1
1 1
1

= = = X X X X M X X X X X X X X X X M X m b m b M
T T T T T T T T
T
X b
cc cc E
( ) ( )
1 1
= X X X X X X
T T T
u ( ) ( )
1 1
2

= X X X X X X
T T T
+ o , iar
| | ( ) | | X b M Var M
X b b
1
1 1
+ = E E =
( ) ( ) | | ( ) ( )
1 1
2
1 1
2

= = X X X X X X X X X X X X M
T T T T T T
+ + o o . (3)
Deoarece
n
I = + , matricea de covarian
1
b
E este diferit de ( )
1
2

= X X
T
b
o E ,
matricea de covarian a estimatorului b , determinat n condiiile ipotezelor 0-5. Ca
urmare, se pune ntrebarea dac, n noile condiii,
1
b este i cel mai bun estimator al lui
m , aa cum era b .
Pentru a da un rspuns, se parcurg mai multe etape.
n prima etap, se transform modelul econometric +
2
o de regresie liniar
astfel:
- deoarece + este o matrice pozitiv definit, exist o matrice ( ) R
n
M Pe ,
neunic, astfel nct:
n
T
I P P = + ; (4)
- se nmulete, la stnga, cu P ecuaia modelului +
2
o de regresie liniar
c + = Xm Y i se obine:
c P PXm PY + =
- cu notaiile

* *
, X PX Y PY
not not
= = i
*
c c
not
P = (5)
se obine modelul transformat:
* * *
c + = m X Y (6)
Vectorul transformat al erorilor
*
c are urmtoarele proprieti statistice:
( ) ( ) ( )
n n
O O P PM P M M = = = = c c c
*
i

( ) ( ) ( )
n
T T T T T T
I P P P PM P P M M
2 2 * *
*
o o cc cc c c
c
= = = = = + E .
Rezult c modelul transformat (6) satisface toate axiomele 0-5 i se poate
determina cu metoda celor mai mici ptrate estimatorul
*
b al lui m cu relaia:
( )
* *
1
* * *
Y X X X b
T T

= , (7)
despre care se tie c este cel mai bun estimator nedeplasat al lui m .
nlocuind n (7) notaiile (5) se obine:

( ) | | ( )
| | PY P X PX P X b
PY PX PX PX b
T T T T
T T
1
*
1
*

=
=

Pe de alt parte, prelucrnd relaia (4) se obine:
P P P P
T T
= =
1 1
+ + (8)
care, nlocuit n expresia lui
*
b , conduce la forma final a lui
*
b :
( ) Y X X X b
T T 1
1
1 *

= + + (9)
Estimatorul
*
b se numete estimatorul generalizat n sensul celor mai mici
ptrate al lui m , fiind cel mai bun estimator nedeplasat al lui m . Ca urmare el are
urmtoarele proprieti statistice:
( ) ( ) ( ) ( ) m Xm X X X Y M X X X b M
T T T T
= = =

1
1
1 1
1
1 *
+ + + + ,
adic
*
b este un estimator nedeplasat al lui m i innd seama c modelul transformat
ndeplinete condiiile din ipotezele 0-5, rezult
( ) ( )
1
1 2
1
* * 2
*

= = X X X X
T T
b
+ E o o ,
iar oricare ar fi
0
b un estimator nedeplasat al lui m are loc:

*
0 b
b
E E
este o matrice pozitiv semidefinit.
Deoarece matricea + nu este precizat, rezult c:

1 *
b b
E E =
i diferena
( ) ( ) ( ) ( ) R
k
not
T T T T
b b
M S X X X X X X X X e = =

1
1 2
1 1
2
* 1
+ + E E o o
trebuie s fie o matrice pozitiv semidefinit.
Fie
( ) ( ) ( ) R
n k
T T T T
not
M X X X X X X B
,
1
1
1
1
e =

+ + .
Atunci:
( ) ( )
1
1 1
1

= X X X X X X B
T T T
+ +
i
( ) ( ) | | ( ) ( ) | |
( ) ( ) ( ) ( ) ( )
( ) ( ) ( )
1
1
1 1
1
1
1
1
1
1
1 1
1
1 1
1 1
1
1

=
= + =
= =
X X X X X X X X
X X X X X X X X X X X X
X X X X X X X X X X X X B B
T T T T
T T T T T T
T T T T T T T
+ +
+ + + +
+ + + + +

Prin urmare, se poate scrie:

T
B B S +
2
o = ,
care este o matrice pozitiv semidefinit. ntr-adevr, deoarece + este pozitiv
semidefinit, rezult c oricare ar fi
k
x R e se poate scrie:
( ) ( ) 0 > = x B x B x B B x
T
T
T T T
+ + .
n concluzie, n noile condiii nu
1
b este cel mai bun estimator nedeplasat al lui
b , ci
*
b .

Problema 2.S se determine un estimator nedeplasat al lui
2
o .
n noile condiii, determinate de nlocuirea ipotezei 4 prin ipoteza 4.1, cu ajutorul
estimatorului
1
b se poate construi un estimator al lui
2
o , la fel ca n cazul ndeplinirii
ipotezelor 0-5, i care se va nota prin
2
o .
Reamintim, c pentru modelul econometric III de regresie liniar, ce satisface
ipotezele 0-5 s-a determinat estimatorul ( ) Y X X X b
T T
1
= , cel mai bun estimator
nedeplasat al lui m . Apoi, cu notaiile:
,
. .
= Y Y c i ( ) ( ) R
n
T T
n
M X X X X I B e =
1
not

s-a obinut relaia:
,
unde matricea B este simetric i idempotent.
S-a fcut notaia:

.
. .

= c c o
T
k n
1
2
.
Legtura dintre
.
2
o i
2
o este stabilit de urmtoarea afirmaie.
PROPOZIIE.
2 2
M o o =
|
|
.
|

\
|
.
.
Rezult c
.
2
o este un estimator nedeplasat al lui
2
o .
Pornind de la construcia lui
.
2
o se va obine, n mod analog,
2
o .
Mai nti, se fac notaiile:
b X Y =
.
c c B =
.

1 1 1 1
, Y Y Xb Y
not
= = c i ( ) ( ) R
n
T T
n
not
M X X X X I B e =
1
,
apoi se obine, analog:
c c B =
1

i
( ) ( ) c c c c o B B
k n k n
T T

=
1 1
1 1 2

( ) ( ).
1 1
2
c c c c o B
k n
B B
k n
T T T

=
Deci:
( ) c c o B
k n
T

=
1
2
.
Pentru a stabili ce legtur stochastic exist ntre
2
o i
2
o se calculeaz:
( ) ( ) c c o B M
k n
M
T

=
1
2

i innd seama de proprietile operatorului Tr se obine:

( ) ( ) | | ( ) | | ( ) | |
| | ( ),
1 1
1 1 1
2 2
2
B Tr
k n
B Tr
k n
B M Tr
k n
B Tr M
k n
B Tr M
k n
M
T T T
+ +

=
=

=
o o
cc cc c c o

i deci ( )
2 2
o o = M , adic
2
o este o estimaie deplasat a lui
2
o .
Totui, utiliznd estimatorul generalizat
*
b se poate obine un estimator
nedeplasat al lui
2
o , notat prin
*
2
o , folosind acelai procedeu, adic:
( ) ( )
* * * * * * * *
*
2
1 1
b X Y b X Y
k n k n
T
T

=
. .
c c o .
Se observ c:
( ) ( )
* 1 *
*
2
1
Xb Y Xb Y
k n
T

=

+ o .















CURS X

Modelul +
2
o normal

Se continu studierea modelului +
2
o , n cazul ipotezei de normalitate.
Mai nti reamintim modelul III normal de regresie liniar.
Considerm modelul econometric III de regresie liniar, descris de ipotezele 0
5.
Se adaug i urmtoarea ipotez.
IPOTEZA 6. ( )
n n
I N X
2
, 0 o c e ,unde ( ) E , N este familia vectorilor aleatori cu
o repartiie normal multidimensonal, avnd media
n
R e i matricea de covarian
( ) R
n
M e E , pozitiv definit.
Consecin. ( )
n
X 0 M = c i
n X
I
2
o
c
= E .
DFINIIE. Modelul III de regresie liniar, care are la baz i ipoteza 6, se
numete modelul III normal de regresie liniar.
Reamintim urmtoarele noiuni suplimentare.
Noiuni suplimentare
Repartiia normal multidimensional

DEFINIIE. Vectorul aleator X
n
R e are o repartiie normal
multidimensional cu media
n
R e i matricea de covarian ( ) R
n
M e E , pozitiv
definit, i se scrie , dac densitatea sa de repartiie este:
( ) ( ) ( ) ( )
)
`

=


t X X X f
T
n
1
2
1
2
2
1
exp 2 .
DEFINIIE. Un vector aleator cu o repartiie normal multidimensional se
numete vector normal.
Proprietatea de multiplicativitate. Dac i ( ) R
n m,
M e D , atunci
vectorul ( )
T
D D D N D E e , X , unde n ms .
Observaie. Dac n m = , atunci n rangD = i trebuie s fie pozitiv
definit.
Proprietatea de aditivitate. Dac ( ) E e , 0
n
N X , atunci ( ) N , e + X .

Se consider modelul III normal de regresie liniar:
c + = Xm Y ,
unde ( )
n
X 0 = c M i
n X
I
2
o
c
= E .
Repartiia vectorului aleator Y este precizat de urmtoarea afirmaie.
( ) E e , N X
( ) E e , N X
T
D DE
PROPOZIIE. ( )
n
I Xm N X Y
2
,o e .
Demonstraie. n baza ecuaiei modelului III, rezult:
( ) ( ) ( ) Xm X M Xm X Xm M X Y M = + = + = .
Matricea de covarian a lui X Y se poate calcula astfel:
( )( ) | | | |
n X
T T
X Y
I X M X Y-Xm Y-Xm M
2
= = = = .
Deoarece ( )
n n
I N X
2
, 0 o c e , rezult n baza proprietii de aditivitate c:
( ) ( )
n n n
I Xm N X Y I N X Xm Y
2 2
, , 0 o o e e .
Pentru a estima parametrii necunoscui ai modelului III normal s-a construit
funcia de verosimilitate astfel.
Deoarece ( )
T
n
Y Y Y Y ,..., ,
2 1
= i ( )
n
I Xm N X Y
2
,o e , pentru i fixat, se poate
scrie:
( )
2
,o m X N X Y
i
i
e ,
unde ( )
ik i i
i
x x x X ,..., ,
2 1
= este linia n i i , 1 , = , a matricei X .
Se construiete funcia de verosimilitate ( ) X m Y Y Y L
n
, , ,..., ,
2
2 1
o , astfel :
( ) ( ) ( ) ( ) =
)
`

= =
[ [
=

=
2
2
1
2
1
2
1
2
2 1
2
1
exp 2 , , ,..., , m X Y X Y f X m Y Y Y L
i
i
n
i
n
i
i n
o
to o


( ) ( ) ( ) ( ) ( )
)
`

=
)
`

=

=

Xm Y Xm Y m X Y
T
n n
i
i
i
n
2
2
2
1
2
2
2
2
2
1
exp 2
2
1
exp 2
o
to
o
to .
ndat ce vectorul de selecie Y este cunoscut, funcia de verosimilitate are drept
argumente parametrii necunoscui m i
2
o , ca urmare se poate scrie:
( ) ( ) ( ) ( )
)
`

=

Xm Y Xm Y X Y m L
T
n
2
2
2 2
2
1
exp 2 , ,
o
to o
sau
( ) ( ) ( ) ( )
)
`

=

Xm Y I Xm Y I X Y m L
n
T
n
n
2
2
1
2
2 2
2
1
exp 2 , ,
o
to o . (1)
Deoarece funcia de verosimilitate, n acest caz, este strict pozitiv, se poate
calcula logaritmul natural al ei, obinndu-se:
( ) ( ) ( ) ( ) Xm Y I Xm Y I
n
X Y m L
n
T
n
=
2
2 2
2
1
ln
2
1
2 ln
2
, , ln
o
to o .
Se consider modelul +
2
o de regresie liniar, n care ipoteza 6 este nlocuit
prin urmtoarea ipotez.
IPOTEZA 6.1. ( ) +
2
, 0 o c
n
N X e , unde 0
2
> o este necunoscut, iar +
( ) R
n
M e este simetric, pozitiv definit i cunoscut.
Consecin. ( )
n
X 0 M = c i + E
2
o
c
=
X
.
DEFINIIE. Modelul +
2
o de regresie liniar, n care ipoteza 6 este nlocuit
prin ipoteza 6.1. se numete modelul +
2
o normal de regresie liniar.
Pentru a estima parametrii necunoscui ai modelului +
2
o normal de regresie
liniar se aplic metoda verosimilitii maxime i se consider funcia de verosimilitate
corespunztoare, ce se obine din relaia (1) prin nlocuirea matricei
n
I cu matricea
cunoscut
1
+ :
( ) ( ) ( ) ( )
)
`

=


Xm Y Xm Y X Y m L
T
n
1
2
2
1
2
2 2
2
1
exp 2 , , + +
o
to o . (2)
Apoi prin logaritmare se obine:
( ) ( ) ( ) ( ) Xm Y Xm Y
n
X Y m L
T
=
1
2
2 2
2
1
ln
2
1
2 ln
2
, , ln + +
o
to o . (3)
Fie
g
b estimatorul lui m i
g
2
o estimatorul lui
2
o , obinui cu metoda
verosimilitii maxime. Atunci cei doi estimatori verific sistemul de ecuaii:

( )
( )

=
c
c
=
c
c
0
, , ln
0
, , ln
2
2
2
2
g
n g
X Y m
b
m
X Y m
o
o
o
o
( ) | |
( ) ( )

= +
=


0
2
1
2
0
1
1
4 2
1 1
2
g
T
g
g g
n g
T T
g
Xb Y Xb Y
n
b X X Y X
+
+ +
o o
o
.
Atunci estimatorii de maxim verosimilitate
g
b i
g
2
o sunt:
( ) Y X X X b
T T
g
1
1
1

= + + i ( ) ( ) Xm Y Xm Y
n
T
g
=
1 2
1
+ o .
Se observ c
g
b coincide cu estimatorul generalizat n sensul celor mai mici
ptrate i este cel mai bun estimator nedeplasat al lui m , iar
g
2
o difer de
*
2
o i este un
estimator deplasat al lui
2
o .




Repartiiile de selecie ale lui
g
b i
*
2
o
Deoarece
g
b este o funcie liniar de Y , care are o repartiie normal
multidimensional, rezult c
g
b are o repartiie normal multidimensional cu media m
i matricea de covarian ( )
1
1 2

X X
T
+ o .
n baza proprietii de aditivitate se poate scrie ( ) ( )
1
1 2
, 0

e X X N b b
T
k g
+ o .
Ca urmare, pentru o component k i i , 1 , = a vectorului b b
g
are loc:
( ) 1 , 0 N
a
b b
ii
i
i
g
e

o
,
unde
ii
a se afl pe diagonala principal a matricei ( )
1
1

X X
T
+ .
Datorit ipotezei 6 privind normalitatea se poate determina, n cadrul modelului
III normal de regresie liniar, repartiia estimaiei . Pentru aceasta avem nevoie de noi
rezultate clasice.

Noiuni suplimentare
Repartiia hi-ptrat
DEFINIE. O variabil aleatoare unidimensional X are o repartiie hi-
ptrat de parametrii n i o , dac densitatea sa de repatiie este:
( )
*
2
1
2
2 , 0 ,
0 , 0
0 ,
2
2
1
,
2
N e >

<
>
|
.
|

\
|
I
=

n
x
x e x
n
n x f
x n
n
n
o
o
o
o
.
Mulimea variabilelor aleatoare unidimensionale care au o repartiie hi-ptrat de
parametrii n i o se noteaz prin ( ) o , n H ; dac 1 = o se utilizeaz notaia
( ) ( ) n n H
2
1 , _ = , care este tabelat.
PROPOZIIA 1. Dac ( ) 1 , 0 N X e , atunci ( ) 1
2 2
_ e = X Y .
PROPOZIIA 2. Dac ( ) n i N X
i
, 1 , 1 , 0 = e i sunt variabile aleatoare
independente, atunci ( ) n X Y
n
i
i
2
1
2
_ e =

=
.
DEFINIIE. Numrul natural n din propoziia 2 se numete numrul
gradelor de libertate, fiind egal cu numrul variabilelor aleatoare independente care
generaz pe Y .
PROPOZIIA 3. Dac ( ) ( ) ( )
k k
n X n X n X
2
2
2
2 1
2
1
,..., , _ _ _ e e e i sunt
mutual independente, atunci |
.
|

\
|
e =

= =
k
i
i
k
i
i
n X Y
1
2
1
_ .
PROPOZIIA 4. Dac ( ),
2
n X _ e atunci ( ) n = X M i ( ) n X D 2 = .
.
2
o
TEOREMA 1. Dac vectorul aleator ( )
n n
I N , 0 e Z , atunci .
Demonstraie. Deoarece ( ) ( )
n n
T
n
I N Z Z Z , 0 ,..., ,
2 1
e = Z , rezult

=
=
n
i
i
T
Z
1
2
Z Z ,
unde ( ) n i N Z
i
, 1 , 1 , 0 = e . Atunci , n baza propoziiei 1, rezult ( ) n i Z
i
, 1 , 1
2
= e_ , iar
n baza propoziiei 2, rezult ( ) n
T 2
_ e Z Z .
TEOREMA 2. Dac M este o matrice simetric, idempotent, de rang
*
N e k i ( )
n n
I N , 0 e Z , atunci funcionala ptratic ( ) k M
T 2
_ e Z Z .
PROPOZIIA 5. Dac ( )
n n
I N
2
, 0 o e X i ( ) R
n
M e B A, sunt simetrice i
indempotente, atunci funcionalele ptratice i sunt independente,
dac ( ) R
n
M e = 0 AB .
PROPOZIIA 6. Dac ( )
n n
I N
2
, 0 o e X , ( ) R
n
M e B A, , A este o matrice
simetric idempotent i B este o matrice oarecare, atunci funcionala liniar X B i
funcionala ptratic X X A
T
sunt independente, dac
n
A B 0 = .
PROPOZIIA 7. Dac ( ) R
n
M e A este o matrice idempotent, atunci
( ) ( ) A Tr A rang = .

Cu aceste proprieti se poate stabili repartiia lui
.
2
o .
PROPOZIIE. ( ) k n X
T
e
. .
2
2
1
_ c c
o
.
Se consider modelul transformat
,
unde i
*
c c
not
P = .
Conform ipotezei 6.1. ( )
2
, 0 o c
n
N X e . n baza proprietii de
multiplicativitate, rezult c ( ) ( )
n n
T
n
I N P P N X P
2 1 2
, 0 , 0 o o c = e

+ i deci
( )
n n
I N X
2 *
, 0 o c e .
Observaie. Din ( )
n n
I N X
2 *
, 0 o c e , rezult:
( ) +
2 1 2 * 1
, 0 o o c c = e =
T
n
P P N X P ,
relaie care poate fi utilizat pentru a genera un vector aleator normal cu matricea de
covarian +
2
o .
Rezult c modelul transformat al modelului +
2
o normal de regresie liniar
satisface ipotezele 0 6 i n baza proproziiei de mai sus se poate scrie:
( ) n
T 2
_ e Z Z
X X A
T
X X B
T
* * *
c + = m X Y
* *
, X PX Y PY
not not
= =
( ) k n X
T
e
. .
2 * *
2
1
_ c c
o
,
unde
* * * *
b X Y =
.
c .
Se consider raportul
( )
2
2
*
o
o k n
, unde
. .

=
* *
*
2
1
c c o
T
k n
. Rezult imediat
urmtoarea afirmaie.
PROPOZIIE.
( )
( ) k n X
k n
e

2
2
2
*
_
o
o
.
Pentru modelul III normal de regresie liniar s-a stabilit c i
.
2
o sunt
independeni, datorit faptului c produsul ( ) ( ) ( )
1 1
X X X X X X X I
T T T
n
este matricea
nul.
n mod analog, pentru modelul transformat al modelului +
2
o normal de regresie
liniar se poate demonstra c
g
b i
*
2
o sunt independeni, deoarece:
( ) | | ( )
n
T T T
n
X X X X X X X I 0
1
* * * *
1
* * *
=

.
Pentru a construi un interval de ncredere pentru
2
o se pleac de la faptul c:

( )
( ) k n X
k n
e

2
2
2
*
_
o
o
.
n baza acestei proprieti se poate construi un interval de ncredere corespunztor
unui nivel de semnificaie o , dat considernd relaia:
( )
( )
( ) o _
o
o
_
o
o =
|
|
.
|

\
|
<

< 1
2
1 ,
2
2
2
*
2 ,
2
k n k n
k n
P .
Rezult c intervalul de ncredere pentru
2
o este:

( )
( )
( )
( )
|
|
.
|

\
|


2
,
2
2
*
2
1 ,
2
2
*
,
o o
_
o
_
o
k n k n
k n k n

unde valoarea numitorilor se determin din tabelul repartiiei hi-ptrat, pentru k n
grade de libertate i
2
1
o
, respective
2
o
.



m

S-ar putea să vă placă și