Documente Academic
Documente Profesional
Documente Cultură
5
Ctlin Deatcu, Adina Elena Stoica (Fetcu), Irina Dinc Model econometric de regresie
multifactorial, Scientific Research Themes/Studies Communications at the National Seminary
Octav Onicescu, Romanian Statistical Review Trim. 3/2011, pp. 207-215.
=
+ + =
n
i
jt ijt i jt
X b b y
1
0
c
unde:
jt
y
- variabile endogene n anul t n regiunea j;
ijt
X
- variabile structurale corespunztoare caracteristicilor calitative:
jt
c
= variabila rezidual.
Definirea ipotezelor modelului se realizeaz n scopul obinerii unor estimatori
ai parametrilor modelului de calitate nalt; aceste ipoteze sunt:
- Legtura dintre variabila dependent i variabilele independente este
liniar.
- Variabilele independente sunt aleatoare, adic ntre variabilele
independente incluse n regresie nu exist o dependen:
( ) 0 , cov =
j i
x x
; pentru orice
j i =
Dac aceast relaie liniar exist, atunci apare fenomenul de
multicoliniaritate i ne sugereaz c putem renuna la anumite variabile, deoarece
efectul lor este preluat de factorii rmai. Reiese c variabilele independente
reinute i exercit influena numai asupra variabilei dependente
jt
y
, nu i ntre
ele
6
.
- Media variabilei reziduale
t
c
este zero, adic
0 ) ( =
t
E c
- Dispersia variabilei reziduale este aceeai pentru toate observaiile; aceasta
este cunoscut i ca ipoteza de homoscedasticitate, adica
2
) var(
E t
o c =
- Dac dispersia reziduului este variabil, erorile se numesc heteroscedastice
i atunci trebuie utilizate alte metode de estimare pentru regresie.
Valorile variabilei reziduale nu sunt corelate ntre ele. Aceasta indic i
corectitudinea realizrii observrii, adic nregistrrile au fost fcute independent
unele de altele. Absena necorelrii erorilor conduce, pentru un eantion suficient
de mare, la o mrime a covarianei egal cu zero sau foarte apropiat de zero, adica
0 ) cov( ~
j i
c c
pentru orice
j i =
6
Andrei, T., Bourbonais, R. (2008) Econometrie, Editura Economic, Bucureti
t
corespunztor repartiiei Student, pentru care au fost calculate i valorile
tabelate.
Testul
t
se calculeaz conform relaiei:
) (
k
k k
b se
b
t
|
=
unde :
k
b
- este coeficientul obinut din regresie (estimat);
k
|
- este valoarea de test
a coeficientului ;
) (
k
b se
- este eroarea standard a coeficientului.
Dac valoarea testului este mai mare dect valoarea critic (valoarea din
tabelul repartiiei Student, pentru nivelul de relevan considerat i a gradelor de
libertate
k T
), se respinge ipoteza nul i coeficientul este considerat
semnificativ.
Programele software econometrice testeaz prin testul
t
, pentru fiecare
coeficient, ipoteza nul i anume efectul nregistrat dac acel coeficient ar avea
valoarea zero.
Ipoteza nul a testului este
k k
b | =
Sunt raportate de ctre software, att valorile testului
t
(t-statistic), ct i
probabilitile asociate (prob).
Dac probabilitatea asociat este inferioar nivelului de relevan la care se
lucreaz (1%, 5%, sau 10%) atunci se respinge ipoteza nul i coeficientul este
considerat ca fiind semnificativ din punct de vedere statistic.
n cazul n care probabilitatea
p
este superioar nivelului la care se
lucreaz, atunci ipoteza nul este acceptat, iar coeficientul este considerat zero din
punct de vedere statistic (nesemnificativ).
Estimarea intervalului pentru un parametru al regresiei se face pe baza
relaiei:
o
|
=
|
|
.
|
\
|
s
s 1
) (
c
k
k k
c
t
b se
b
t P
unde:
c
t
este valoarea critic a lui
t
pentru
k T
grade de libertate i se citete din
tabele.
Relaia anterioar poate fi reprezentat astfel:
( ) ( ) ( ) o | = + s s 1
k c k k k c k
b se t b b se t b P
De remarcat c distribuia
t
(Student) are graficul destul de asemntor cu
cel al distribuiei normale, doar c este mai aplatizat datorit mpririi la gradele
de libertate; n schimb, marginile ei sunt mult mai semnificative.
= =
= =
2
2
2
2
2
1 1
y y
e
SST
SSE
y y
y y
SST
SSR
R
t
t
t
t
unde:
SSE
- este suma ptratelor erorilor de regresie, adic a prii neexplicat prin
factori de influen, ci doar prin factori accidentali.
Adjusted
2
R
se calculeaz prin ajustarea fiecrei abateri cu gradele sale de
libertate:
( )
( ) 1
)
1
2 2
= =
t SST
k T SSE
R R
Premisa acestor corecii o constituie observaia c adugnd noi variabile,
SSE
scade, iar
2
R
crete;
2
R
devine astfel comparabil, deoarece este corectat cu
gradele de libertate.
Cu ct coeficientul de determinaie este mai apropiat de 100%, el indic
legturi mai puternice, un grad mai mare de dependen ntre variabila dependent
i variabilele factoriale ale modelului.
Pentru testarea unei combinaii de ipoteze este obligatoriu testul
F
(Fisher
Snedecor). Ideea testului pornete de la a calcula suma ptratelor erorilor n dou
variante, restricionat i nerestricionat:
- restricionat nseamn calculul sumei ptratelor abaterilor n ipoteza nul, adic
anumii factori nu influenez semnificativ fenomenul analizat Aceasta conduce la
a pune valoarea 0 pentru coeficienii testai simultan prin ipoteza nul;
- nerestricionat nseamn calculul sumei ptratelor abaterilor considernd c
toate ramurile luate n considerare n model au influene semnificative asupra
fenomenul analizat i deci coeficienii afereni lor sunt cei rezultai din regresie.
Vom folosi urmtoarele notaii:
R
SSE
- (sum of squared errors restricted), suma ptratelor abaterilor n situaia n
care ipoteza / ipotezele testului se consider adevrate i deci unii parametri sunt
nuli;
=
unde:
J
numrul de ipoteze supuse simultan testului, adic numrul factorilor
presupui a avea influen nul asupra variabilei dependente;
T
numrul de observaii;
k
numrul de parametri ai modelului (inclusiv termenul liber).
Formula indic raportul dintre diferena abaterilor explicat de factorul
(factorii) supui ipotezei nule i abaterile totale, corectate fiecare cu numrul
gradelor lor de libertate.
Citim n tabel
) , ( k T J
F
la probabilitatea dorit
) 05 . 0 (
i comparm cu
valoarea calculat a lui
F
. Dac
c
F F >
, respingem ipoteza c factorul / factorii
nu ar influena fenomenul .
n esen testul
F
se aplic totdeauna unei variabile aleatoare obinut ca
raport de dou variabile aleatoare independente, distribuite
2
_
, fiecare mparit la
gradele ei de libertate. n cazul nostru cele dou variabile sunt:
Testul
F
mai este folosit pentru testare general a modelului. Astfel,
dac se face ipoteza nul
0 .... :
3 2 0
= = =
k
H | | |
(adic toi parametrii sunt
nuli, exceptnd interceptul) i alternativa
1
H
conform creia cel puin un
0 =
k
|
,
testul
|
ne va spune dac una sau mai multe dintre variabilele explicative trebuie
= = SST y y SSE
t R
2
(suma total a ptratelor
abaterilor).
Ca i n cazul testului
t
, programele software econometrice raporteaz att
valoarea testului
F
(F statistic ), ct i probabilitatea prob. asociat acestuia.
Dac valoarea lui
p
este inferioar nivelului de relevan la care se
lucreaz, atunci ipoteza nul este respins, ceea ce nseamn c cel puin unul
dintre coeficieni este semnificativ din punct de vedere statistic
7
.
ns, dac
p
este superioar nivelului de relevan, atunci este acceptat
ipoteza nul, ceea ce nseamn c toi coeficienii de regresie sunt considerai
nesemnificativi din punct de vedere statistic (sunt aproximativ egali cu zero).
Dac estimaiile obinute pentru parametri au rezistat testelor
t
i
F
, iar
2
R
este suficient de apropiat de 1 (sau de 100) i dac i alte teste la care vor fi
supui coeficienii, confirm rezultatele estimrii, atunci parametrii estimai
exprim, n uniti naturale, cu ct se modific n medie, variabila dependent) la o
cretere cu o unitate a factorului independent, n condiiile n care ceilali factori ar
rmne constani.
Cel de-al doilea set de teste se refer la cele care privesc confirmarea
ipotezelor metodei celor mai mici ptrate (ipoteze legate n principal de
caracteristicile variabilei reziduale).
Variabila rezidual, spre deosebire de variabilele rezultative, nu este
introdus n model. Valorile variabilei reziduale rezult ntr-o etap ulterioar
elaborrii modelului n urma comparrii valorilor estimate, generate de model, cu
valorile empirice.
Existena variabilei reziduale
( ) c
se datoreaz limitelor n cunoaterea
desfurrii proceselor economice n timp, multiplelor cauze ale acestora, precum
i manifestrii efectului unor riscuri, cum ar fi:
- erori de msurare ce presupun aprecieri numerice greite sau
neconcludente grupare nepotrivit a activitilor econmice n vederea
calculrii contribuiei la VAB realizat;
- erori de eantionare datorit accesului limitat la informaii privind
raportarea i colectarea informaiilor despreVAB la nivelul ii i
modul de determinare a VAB regional.
Valorile variabilei reziduale, indic n ce msur ecuaia obinut descrie
influena factorilor luai n consideraie.
7
Florin Paul Costel, Lilea (2010) Analiza statistic a repartiiei regionale a ntreprinderilor mici i
mijlocii n Romnia, Editura Ideea European, Bucureti
=
t t
r d
t
t
T
t
t t
calc c c
c
c c
8
Anghelache C., Mitru. C, Bugudui, E., Deatcu, C. (2010) Econometrie, Editura Artifex,
Bucureti
9
Anghelache, C. i alii (2012) Elemente de econometrie teoretic i aplicat, Editura Artifex,
Bucureti
10
Svoiu Gheorghe, (2012), Statistic pentru afaceri, Editura Universitar, Bucureti, p. 127.