Sunteți pe pagina 1din 6

Revista Romn de Statistic Trim.

III/2012 - Supliment 174


Aspecte privind modelele de interpretare a variabilei
reziduale

Prof.univ.dr. Gabriela-Victoria ANGHELACHE
Academia de Studii Economice Bucuresti
Prof.univ.dr. Ion PRACHI
Academia de Studii Economice a Moldovei Chiinu
Prof.univ.dr. Titus Radu MARINESCU
Universitatea Artifex - Bucureti
Drd. Cosmin PUNESCU
Academia de Studii Economice Bucuresti



Abstract
The linear correlation quotient allows us to ascertain the existence of a
linear link between the variables of the regression model. This paper attempts to
examine the interpretation of the residual variables through the perspective of
models used.
Key words: regression, residual value, covariance, ecart, dispersion,
linear correlation quotient

Prin intermediul coeficientului liniar de corelaie, vom examina dac ntre
variabilele modelului de regresie exist o dependen liniar semnificativ.
Considerm c avem un eantion de forma
n i
i i
y x
, 1
) , (
=
. Prin coeficientul liniar de
corelaie vom pune n eviden prezena sau absena legturii liniare dintre cele
dou variabile ale modelului de regresie, sensul legturii, precum i intensitatea
acesteia.
Studiul caracteristicilor dependenei liniare dintre dou variabile se
realizeaza utilizand covariana
1
. Aceast msur prezint totusi dou neajunsuri
majore, respectiv:
- covariana nu este un indicator normalizat;
- covariatia depinde de unitile de msur ale celor dou variabile i
satisface relaia:

x y y x
y x o o o o s s ) , cov(
.
Un indicator care s nlture cele dou inconveniente trebuie s plece de la
domeniul de valori al covarianei mai jos prezentat:

1
Constantin Anghelache, Dan Cruceru, Radu Titus Marinescu Modele econometrice utilizate n
analiza performanelor financiare, Scientific Research Themes/Studies Communications at the
National Seminary Octav Onicescu, Romanian Statistical Review Trim. 2/2011, pp. 94-100

Revista Romn de Statistic Trim III/2012- Supliment 175



x y y x
y x o o o o s s ) , cov(
.
Dac mprim termenii inegalitii prin
x y
o o
, rezult:

1
) , cov(
1 s s
x y
y x
o o
.
Rezulta un nou indicator ce depinde de unitile de msur ale celor dou
variabile, fiind i o msur statistic normalizat (coeficient liniar de corelaie),
introdus n statistic de K. Pearson, calculat prin relaia:

y x
i
i i
n
y y x x
r
o o


=
) )( (

Coeficientul liniar de corelaie este eficient pentru msurarea intensitii
dependenei dintre variabile numai dac este de tip liniar
2
.
n continuare vor fi prezentate proprietile coeficientului liniar de
corelaie, stabilind relaiile de calcul pentru estimatorii parametrilor modelului
liniar de regresie n funcie de valoarea acestuia. Rezumativ putem evidenia:
a) coeficientul liniar de corelaie este o msur simetric, verificndu-se
egalitatea r(x,y) = r(y,x).
b) este invariant la transformarea datelor i schimbarea originii i unitii
seriilor de date.
Dac dispunem de seriile de date
n i
i i
y x
, 1
) , (
=
i
n i
i i
v u
, 1
) , (
=
, ce satisfac
relaiile u
i
= b + ax
i
i v
i
= c + dy
i
, cu
*
,
+
eR d a
, atunci coeficienii liniari de
corelaie calculai pentru cele dou serii sunt egali.
Considernd i proprietile covarianei i ale dispersiei, rezult:

) , (
) , cov( ) , cov(
y x r
d a
y x ad v u
r
v x v u
= = =
o o o o
.
Analiza modelului de regresie se poate face i prin utilizarea
transformrilor:
x
i
i
x x
u
o

=
i
y
i
i
y y
v
o

=
.
c) Estimatorul coeficientului pantei dreptei de regresie se calculeaz pe
baza relaiei:

x
y
r a
o
o
=

2
Anghelache, C., Dumbrav, M. i alii Econometrie Teorie i studii de caz, pag. 88, Editura
ARTIFEX, 2007

Revista Romn de Statistic Trim. III/2012 - Supliment 176


Dac variabilele modelului liniar de regresie sunt liniar independente,
atunci valoarea coeficientului liniar de corelaie este zero, coeficientul liniar de
corelaie nu este msur tranzitiv
3
.
Astfel, dac x este o variabil y, iar la rndul su y este corelat cu z, nu
implic n mod obligatoriu c ntre x i z exist o dependen liniar.
Pentru dou variabile se verific relaia r
2
= 1 dac i variabilele X i Y
sunt corelate funcional, cnd variabilele X i Y sunt liniar independente, atunci
coeficientul liniar de corelaie i raportul de determinare satisfac egalitatea:

( )
( )
2 2
2
2
2

r
S
S
a
y y
y y
R
yy
xx
i
i
i
i
= =


Proprietatea nu este reciproc. Dac dependena dintre dou variabile este
liniar i dac pentru msurarea intensitii dependenei se calculeaz ambii
indicatori, atunci acetia verific relaia de ordine:

1 0
2 2
s s s R r

In cazul in care seria de date se prezint sub forma unui tabel cu dub
intrare,
n ij
ij j i
n y x
, 1
) , , (
=
, coeficientul de corelaie se calculeaz folosind formula
4
:

y x
j i
ij i i
n
n y y x x
r
o o


=
,
) )( (

Avnd seria
n i
i i
y x
, 1
) , (
=
, realizrile unui cuplu de variabile (X,Y)
distribuite normal, atunci r reprezint pentru fiecare serie de valori,
realizrile variabilei aleatorii .
n cazul n care cele dou variabile sunt liniar independente, = 0, n plus:

2
2
2
1


I
I
=
n
t n t

.
unde t
n-2
este distribuia Student cu n-2 grade de libertate.
Atunci cand pragul de semnificaie este
% 5 = o
, i avem patru
dimensiuni ale eantionului, putem aprecia ca daca seria de date de volum redus (n
= 20), coeficientul liniar de corelaie difer semnificativ de zero dac
46 , 0 > r
;

3
Anghelache, C., Dumbrav, M. i alii Econometrie Teorie i studii de caz, pag. 88, Editura
ARTIFEX, 2007
4
Aurelian Diaconu, Amelia Diaconu, Numerical Simulation. Description of Simulation Models.
Making Simulation Experiments , Romanian Statistical Review - Supplement - International
SymposiumStatistically Significant Evolution Of Services Development, April 23-25, 2012, pp.
237-242, Dimitrie Cantemir Christian University, Bucharest, Romania.

Revista Romn de Statistic Trim III/2012- Supliment 177


dac volumul eantionului crete la 40, rezult c
32 , 0 > r
; cnd n = 50, valoarea
limit se micoreaz, rezultnd
28 , 0 > r
; dac n = 100, avem condiia
20 , 0 > r
.
Micorand probabilitatea de garantare a rezultatelor, la nivelul
% 10 = o
,
pentru aceast valoare a pragului de semnificaie analiza pe cele patru dimensiuni
ale eantionului conduce faptul ca: pentru eantioanele de volum redus, n = 20,
este satisfcut condiia
39 , 0 > r
; cnd n = 40,
27 , 0 > r
; dac n = 50,
24 , 0 > r
; dac volumul n = 100, valoarea se reduce, satisfcnd relaia
17 , 0 > r
.
Putem aprecia c pe msur ce volumul eantionului crete, pentru un prag
de semnificaie stabilit, valoarea critic a coeficientului liniar de corelaie scade i
valoarea critic a indicatorului, n cazul n care volumul eantionului este stabilit,
crete pe msur ce pragul de semnificaie scade.
Interpretarea variabilei reziduale
n modelul liniar de regresie,
i
c
reprezint variabila rezidual, iar e
i
sau
i
c
msoar ecartul dintre valoarea real y
i
i valoarea ajustat prin modelul de
regresie. Putem deci scrie
i i i
y y e =
.
Pentru a stabili o estimaie pentru cei doi parametri ai dreptei de regresie
vom determina o estimaie pentru dispersia variabilei reziduale, cu proprietile:
- pentru seria ecarturilor, suma termenilor acesteia este egal cu zero avand
egalitate:

=
i
i
0 c
.
Daca inem seama de formula de calcul a ecartului, de formula estimatorului
termenului liber i de faptul c suma ecarturilor termenilor unei serii n raport cu
media este zero, obtinem
5
:
( ) ( ) ( ) 0

= = =

i
i
i
i
i
i i
i
i
x x a y y x a b y c

Aceasta proprietate nu este valabil pentru seria variabilelor reziduale, ci
numai n cazul n care este ndeplinit ipoteza
0 ) ( =
i
E c
pentru toi indicii i.
Examinand ecartul unei valori fa de valoarea ajustat n funcie de
variabila rezidual, avem egalitile:
i i i i i
x a a b b y y e c + = = ) ( )

5
Constantin Anghelache, Ioan Partachi, Radu Titus Marinescu, Alexandru Manole, Ioana Mihaela
Pocan Residual Variable Methods of Interpretation, ART ECO Review of Economic Studies
and Research, Editura Artifex, Vol. 2/No.3/2011, pp. 3-9.

Revista Romn de Statistic Trim. III/2012 - Supliment 178


Pornind de la relaiile
x a y b

=
,
c = x a y b
i

=
i
i i
w a a c
,
determinam:

=
i
i i i i i
w x x e c c c ) (
.
- Dispersia variabilei reziduale pentru modelul clasic de regresie
(parametrii sunt estimai prin metoda celor mai mici ptrate) este stabilita prin
relaia:

=
i
i
e
n
2 2
2
1

c
o
.
Consideram ipotezele ce stau la baza modelului clasic de regresie:
0 ) ( =
i
E c
,
2
) var(
c
o c =
i
,
j i
j i
= = , 0 ) , cov( c c
i
0 ) , cov( =
i
X c
pentru toi
indicii i. Calculam e
i
2
i aplicnd operatorul de medie, obtinem pentru fiecare
indice i egalitatea:

( )
(

+ + =

k
k k i i
k
k i i
w x x E w x x
n
e E c c c o
o
o
c
c
c
) ( 2 ) ( ) (
2 2 2
2
2 2


( )
( )
(

+ + =

i i
k
k i i i
k
k
i
w x x w x x
n
w x x
x x
x x
n
) ( ) (
1
2
1
) (
2
2
2 2
2
2
c c
c
c
o o
o
o
.
Prin operatorul de nsumare, luand in consideratie proprietile seriei
n i
i
w
, 1
) (
=
, obinem:
2
) 2 ( ) (
c
o =

n e E
i
i
.
Obtinem astfel estimatorul variaiei reziduale, care se compar cu
estimatorul
n
e
a
i
i
=
2
2

, (estimator nedeplasat).
Mrimea dispersiei seriei ecarturilor
n i
i
e
, 1
) (
=
este cu att mai mare cu ct
seria valorilor caracteristicii rezultative este mai mare, dar mai mic dac
dependena dintre cele dou caracteristici este mai puternic.
Relatia dintre dispersia seriei ecarturilor, valorile caracteristicii endogene i
coeficientul liniar de corelaie verific egalitatea:
2 2 2
) 1 (
y e
r o o =
.
Ultima relaie se poate demonstra innd seam de faptul c, n cazul n
care ntre cele dou variabile dependena este liniar avem relatia,
SPT
SPE
r =
2
,

Revista Romn de Statistic Trim III/2012- Supliment 179


unde SPT = SPR + SPE. Dar
SPT
SPR
r =
2
1
i din formula de calcul a dispersiei
variabilei reziduale obinem:
( )
2 2 2
1
c
o o = =
n
SPT
SPT
SPR
r
y

dispersia ecarturilor s-a calculat prin formula:

=
i
i
e
n
2 2
1
c
o
.
- Din ipoteza de normalitate a reziduului, rezult:
( )
2
2
2
2
2


n
x n
c
c
o
o

Putem determina un interval de ncredere pentru dispersia variabilei
reziduale dac se fixeaz un prag de semnificaie
o
, cu intervalul de ncredere date
de:
( ) ( )
2
1
2
2
2
2
2

o
o

o
c
c
c
< < n n
.
Reprezentnd grafic punctele de coordonate
n i
i i
e y
, 1
) , (
=
, putem verifica
empiric ndeplinirea ipotezei de homoscedasticitate. Apar dou cazuri: dac
punctele definesc un nor de puncte, atunci nu este satisfcut ipoteza de
homoscedasticitate; daca punctele sunt dispuse sub forma unei benzi orizontale,
ipoteza este valabil pentru seria de date
n i
i i
y x
, 1
) , (
=
.

Bibliografie selectiv
Anghelache, C., Dumbrav, M. i alii Econometrie Teorie i studii de caz,
pag. 88, Editura ARTIFEX, 2007
Bardsen, G. i colaboratorii - The Econometrics of Macroeconomic Modelling,
Oxford University Press, 2005
ISI Newsletter, Volume 31, Number 2(92) 2007