Sunteți pe pagina 1din 28

1

AUTOCORELAREA ERORILOR
Modelul de regresie: Y=X|+c

V=


Erorile sunt autocorelate-i=j astfel nct Cov(c
i
,c
j
) = 0.

unde
V=
(
(
(
(

) , cov( ) , cov( ) , cov(


) , cov( ) , cov( ) , cov(
) , cov( ) , cov( ) , cov(
2 1
2 2 2 1 2
1 2 1 1 1
n n n n
n
n
c c c c c c
c c c c c c
c c c c c c

(
(
(
(

1
1
1
2 1
2 1
1 1
2

n n
n
n



o
c
1 - n 1, k
) var( ) var(
) , cov(
0
= = =
+
+

c c
c c

k
k i i
k i i
k
2
AUTOCORELAREA ERORILOR
Problemele ce se pun n acest caz sunt:
1. Identificarea cauzelor de apariie a corelrii
erorilor
2. Testele statistice utilizate pentru depistarea
autocorelrii
3. Metode de estimare a parametrilor n cazul
autocorelrii
3
1. Cauzele de apariie a autocorelrii erorilor
Absena uneia sau mai multor variabile explicative importante
neincluderea uneia sau mai multor variabile explicative importante
poate genera autocorelarea erorilor.
exemplu:
variabila exogen x
3
este omis variabilele reziduale sunt
autocorelate i reziduul va fi explicitat prin intermediul acestei
variabile omise:
Modelul de regresie nu este corect specificat: fie modelul se
exprim sub forma unei combinaii liniare de variabile n
condiiile n care o specificare corect a modelului trebuie s fie
exprimat printr-o combinaie liniar de logaritmi de variabile
exogene etc.
Au fost fcute transformri neadecvate sau interpolri n cadrul
seriei de date

i i i i
cx bx a y c + + + =
2 1
i i i
u x + + =
3
| o c
4
2. Testele statistice utilizate pentru depistarea
autocorelrii: Durbin Watson
Variabila rezidual satisface:
Ipoteze: H
o
: =0 H
a
: =0

Statistica testului:

=
=

=
n
i
i
n
i
i i
e
e e
DW
1
2
2
2
1
) (
i i i
u + =
1
c c
Numrtorul statisticii va fi scris sub forma echivalent:
( ) . 2 2 2
1 2
2 2
1 1
2
2
1
2
1
2
2
2
1

= =

=

=

= =

= + =
n
i
n
i
n i i i
n
i
i
n
i
i i
n
i
i
n
i
i i
e e e e e e e e e e e

Atunci statistica d va fi:
( ) . 1 2
1
2
2 2
1
1

=
+
=
n
i
i
n
e
e e
d

Dac seria de date este suficient de mare, vom neglija termenii
extremi din seria reziduurilor, obinnd:
( ). 1 2
1
d =

5
d
1
i d
2
extrase din tabela Durbin Watson pentru o, k i n:
0 < DW < d
1
autocorelare pozitiv a erorilor
d
1
s DW s d
2
indecizie, recomandat acceptarea
autocorelrii pozitive
d
2
< DW < 4-d
2
erori independente
4-d
2
s DW s 4-d
1
indecizie, recomandat acceptarea
autocorelrii negative
4-d
1
< DW <4 autocorelare negativ a erorilor
Observaie: Testul Durbin Watson nu poate fi aplicat dect dac:
modelul de regresie are termen liber
matricea X este nestochastic
printre variabilele explicative nu se afl i variabila endogen
cu decalaj
seriile de date nu sunt atributive

6
Testul Durbin Watson
Testul Durbin-Watson pentru = 5 %.
n k = 1 k = 2 k = 3 k = 4 k = 5
d1 d2 d1 d2 d1 d2 d1 d2 d1 d2
15 1,08 1,36 0,95 1,54 0,82 1,75 0,69 1,97 0,56 2,21
20 1,20 1,41 1,10 1,94 1,00 1,68 0,90 1,83 0,79 1,99
30 1,35 1,49 1,28 1,57 1,21 1,65 1,14 1,74 1,07 1,83
40 1,44 1,54 1,39 1,60 1,34 1,66 1,29 1,72 1,23 1,79
50 1,50 1,59 1,46 1,
63
1,42 1,67 1,38 1,72 1,34 1,77
100 1,65 1,69 1,63 1,72 1,61 1,74 1,59 1,76 1,37 1,78


7
3. Metode de estimare a parametrilor n cazul
autocorelrii
Erorile prezint o autocorelare de un anumit ordin estimatorii
parametrilor sunt nedeplasai i consisteni, dar nu sunt eficieni.
1. Se estimeaz parametrii modelului de regresie: Y=X|+c prin metoda
celor mai mici ptrate i se obine seria erorilor (e
i
)
i=1,n

2. Se consider c erorile urmeaz un proces autoregresiv de ordinul I:



3.

Notnd:


4. Se estimeaz parametrii noului model i apoi se revine la modelul iniial.

=

=

.
=
n
i
i
n
i
i i
e
e e
2
2
1
2
1

i i i
u + =
1
c c
i
p
j
ji j i
x y c | | + + =

=1
0 1
1
1 0 1
) ( ) 1 (

.
=

. .

.
+ + =
i i
p
j
ji ji j i i
x x y y c c | |

=
=
=
.

.

.
) 1 (
0 0
1
*
1
*
| o

ji ji ji
i i i
x x x
y y y
i
p
j
ji j i
x y u | o + + =

=1
*
0
*
) , 0 (
2
u
o u N
i

8
HOMOSCEDASTICITATEA

Y=X|+c






Problemele ce se pun n acest caz sunt:
1. Testele statistice utilizate pentru depistarea heteroscedasticitii
2. Metode de estimare a parametrilor n cazul heteroscedasticitii

(
(
(
(

=
=
1
1
1
2
0 0
0 0
0 0
) (
0 ) (
w
w
w
Var
E

c
o c
c
x
u
9
1. Testele statistice utilizate pentru depistarea
heteroscedasticitii - Testul White
1. Se estimeaz parametrii modelului de regresie: Y=X|+c prin metoda
celor mai mici ptrate i se obine seria erorilor (e
i
)
i=1,n

2. Se expliciteaz seria (e
i
2
)
i=1,n
n raport cu una sau mai multe variabile
exogene i se definete modelul de regresie:
1.
2.
3. Ipotezele testului:
H
0
: a
1
=...=a
k
=b
1
=...=b
k
=0 model homoscedastic
H
1
: -a
1
= 0 sau b
j
= 0 model heteroscedastic
4. Statistica testului: LM=nR
2
_
r
2

Observaie:
o cretere a lui r conduce la diminuarea puterii testului
pentru un numr mare de variabile exogene se recomand modelul 1
pentru un numr moderat de variabile exogene se recomand
modelul 2

i
k
j
ji j
k
j
ji j i
v x b x a e + + =

= = 1
2
1
2
i i i i i i i i
v x x c x b x b x a x a e + + + + + =
2 1 1
2
2 2
2
1 1 2 2 1 1
2
10
2. Metode de estimare a parametrilor n cazul
heteroscedasticitii
n cazul n care heteroscedasticitatea este indus de o variabil exogen
ntr-o manier multiplicativ:

Fenomenul de heteroscedasticitate se elimin prin transformarea modelului:


Notnd:

Modelul devine:

Dup estimarea parametrilor acestui model transformat se revine n modelul
iniial cu estimatorii.

,
2 2 2
ji i
x
c
o o =
ji
i
p
ji
pi
ji
i
ji
i
x x
x
x
x
x
y c
| | + + + = ...
1
1
ji
i
i
x
y
y =
*
(
(

=
ji
pi
ji
i
i
x
x
x
x
x ,...,
1 *
ji
i
i
x
c
c =
*
* * *
i i i
x y c | + =
11
MULTICOLINEARITATEA
este determinat de prezena corelrii ntre variabilele exogene
determinantul matricei XX este zero, deci aceasta nu este inversabil.
Se consider modelul centrat i redus, deci modelul de regresie fr
termen liber:
matricea de corelaie evaluat pentru variabilele exogene este 1/n(XX)
-1
variaia estimatorilor este o
2
R
-1
/n
prezena corelrii variabilelor exogene conduce la creterea varianei acelor
estimatori ai parametrilor modelului liniar de regresie ce corespund
variabilelor exogene aflate ntr-o dependen liniar semnificativ, deci
scderea performanelor modelului de regresie estimat prin forma clasic a
metodei celor mai mici ptrate.

Problemele ce se pun n acest caz sunt:
1. Indicatori pentru semnalarea coliniaritii
2. nlturarea efectului de multicoliniaritate

12
1. Indicatori pentru semnalarea coliniaritii
Criteriul Klein
se determin raportul de corelaie R
y
2
i coeficienii liniari de corelaie a
variabilelor exogene , i=j.
dou variabile exogene X
i
i X
j
sunt coliniare dac:
sunt identificate numai dependenele liniare dintre dou variabile exogene.
Criteriul Belsley
se calculeaz valorile proprii ale matricei XX, deci soluii ale ecuaiei:
,XX-I
p
,=0.
n cazul n care una sau mai multe valori proprii sunt zero sau aproximativ
zero, fenomenul de colinearitate este semnificativ i va afecta ntr-o bun
msur calitatea estimatorilor.
se calculeaz indicatorul:
dac valorile acestui indicator sunt superioare lui 1 colinearitatea
o valoare cuprins ntre 20 i 30 sau mai mare, pentru datele reale, relev o
colinearitate puternic a variabilelor exogene.
j i
x x
r
/
2
/
2
j i
x x y
r R <
min
max
) (

= X
13
2. nlturarea efectului de multicoliniaritate
Estimarea prin partiionarea matricei X n dou blocuri de variabile
se consider partiionarea matricei n dou submatrice ale cror coloane sunt
liniar independente: X=(X
m
, X
p-m
)
se estimeaz parametrii modelului de regresie: y=X
m
|
m
+c
m

se calculeaz apoi:
i se estimeaz parametrii modelului liniar de regresie: y*=X
r
|
r
+c
r

Eliminarea mecanic a coliniaritii
dac dependena celor dou variabile exogene este: x
2i
=ox
1i
+
i


cu

atunci se estimeaz modelul de regresie:


m
y y y
.
= *

=
=
.
=
n
i
i
n
i
i i
x
x x
1
2
2
1
2 1
o
i i i
x y q o| | + + =
1 2 1
) (
14
Exemplu
Departamentul de HR al unei mari companii care
produce aparatur industrial de nalt precizie vrea s
foloseasc modelele de regresie pentru fundamentarea
deciziei de recrutare a directorilor de vnzri.
Compania are 45 de regiuni de vnzare, fiecare fiind
coordonat de ctre un director de vnzri(sales
manager).
Muli dintre directorii de vnzri au studii universitare n
domeniul ingineriei electrice i datorit gradului nalt de
specializare a produselor vndute, conducerea companiei
crede c ar trebui acceptai pentru postul de director de
vnzri doar candidaii cu studii tehnice.
15
n timpul interviului pentru angajare, candidaii trebuie
s susin dou tipuri de teste, specifice jobului: Strong-
Campbell Interest Inventory Test i Wonderlic Personnel
Test.

Din cauza timpului i a banilor cheltuii n procesul de
testare, la nivelul conducerii snt discuii cu privire la
eliminarea unuia sau a ambelor teste.

Pentru nceput, directorul HR adun informaii despre
toi cei 45 de directori: anii de experien n vnzri,
studii de inginerie, precum i punctajele de la cele dou
teste.
16
Variabila dependent este indicele vnzrilor(sales
index), care este raportul dintre vnzrile actuale din
regiunea respectiv i vnzrile planificate
(actual/targeted sales).

Valorile target snt stabilite n fiecare an de ctre
conducerea companiei, dup consultarea directorilor de
vnzri, fiind bzate pe performanele anterioare i
potenialul pieei din fiecare regiune.
17
Datele
18
Variabilele studiate
Sales raportul dintre vnzrile anuale i vnzrile
planificate din fiecare regiune.
Wonder scorul la testul Wonderlic Personnel Test. Cu
ct punctajul este mai mare, cu att abilitile manageriale
ale candidatului snt mai puternice.
SC scorul la testul Strong-Campbell. Cu ct punctajul
este mai mare, cu att candidatul este mai indicat pentru
munca de vnzri.
Experience - numrul de ani de experien n vnzri
nainte de a deveni director.
Engineer o variabil dummy, care ia valoarea 1 dac
directorul de vnzri are studii tehnice i 0 altfel.
19
Obiectivele studiului
n urma studiului trebuie realizat cel mai bun model de
predicie a vnzrilor.

Studiul trebuie s rspund la urmtoarele ntrebri:
Pe viitor ar trebui pstrate la angajare cele dou teste?
Se susine ideea c a avea studii tehnice este un avantaj n
munca de vnzri?
Este realist ipoteza de a angaja numai ingineri pe
poziiile de directori de vnzri?
Ct de important este experiena anterioar?

20
Formalizarea modelului
Y sales index
X
1
scorul la testul Wonderlic Personnel (abiliti
manageriale)
X
2
- scorul la testul Strong-Campbell (abiliti de
vnzri)
X
3
numrul de ani de experien n vnzri
X
4
variabila indicator a studiilor tehnice

Modelul iniial:

0 1 1 2 2 3 3 4 4
Y X X X X | | | | | c = + + + + +
21
22
23
24
25
SC Residual Plot
-50
-40
-30
-20
-10
0
10
20
30
0 10 20 30 40 50 60 70 80 90
SC
R
e
s
i
d
u
a
l
s
26
27
Scatter Diagram
0
20
40
60
80
100
120
140
0 10 20 30 40 50 60 70 80 90
X
Y
28
Concluzii
Singurul factor semnificativ de influen asupra
vnzrilor este rezultatul la testul SC( abiliti de vnzri)
Este recomandat ca la angajare s fie eliminat testul
Wonderlic Personnel(aptitudini manageriale)
Experiena sau studiile tehnice nu trebuie sa fie un
criteriu definitoriu la angajare.