Sunteți pe pagina 1din 21

2.1.

Tipuri de regresie
Legturile dintre variabilele statistice pot fi clasificate n mai multe categorii, dup
urmtoarele criterii: momentul la care se refer, tipul de dependen dintre variabile, numrul
variabilelor, tipul (forma) legturii etc.
Modele de moment i dinamice
Modelul de moment, numit i model static, este modelul econometric n care legtura dintre
variabile se refer la acelai moment sau la aceeai perioad de timp. Pentru construirea
acestor modele se utilizeaz date din anchete de moment, cum ar fi sondajele statistice,
recensmintele sau alte cercetri de moment.
Modelul dinamic este modelul econometric construit pe baza seriilor de timp. Factorul timp
apare n model prin precizarea momentelor sau a intervalelor de timp la care se refer datele.
Exist i modele n care timpul apare ca o variabil independent, exprimnd trendul seriei de
timp.
Modele deterministe i stochastice
Dependena dintre variabile poate fi:
- determinist sau funcional (matematic). Asemenea modele sunt mai rar ntlnite, pentru
c presupun c ntre variabile exist o legtur de tipul yi f ( xi ) , adic variabila dependent
este explicat n totalitate de variabilele independente din model. Modelele funcionale sunt
ntlnite n domeniul tiinelor naturii, pe cnd n tiinele sociale se utilizeaz mai frecvent
modelele probabiliste.
- stochastic sau probabilist. n aceste modele, pentru o valoare a variabilei independente,
exist mai multe valori ale variabilei dependente, determinate probabilistic. n modelele
stochastice, variabila dependent este influenat i de o serie de factori care nu apar explicit
n model, dar sunt sintetizai printr-o variabil aleatoare numit variabil rezidual. Modelul
stochastic este de forma:
yi f ( xi ) i .
Modele simple i multiple
Dac n modelul de regresie apare o singur variabil independent, regresia se numete
simpl. Un exemplu de model simplu este modelul care exprim dependena consumului de
pre: C f ( P ) . Aceste modele sunt ntlnite mai rar n economie, deoarece un fenomen
depinde, de regul, de mai muli factori de influen. Dac se alege totui un factor
determinant, ceilali factori pot fi considerai ca fiind avui n vedere prin variabila rezidual.
Dac n model apar cel puin dou variabile independente, regresia se numete multipl.
Modelul are forma: Y f ( X 1 , X 2 ) , iar variabila dependent este explicat prin influena
cumulat a factorilor care apar n model.
Modele liniare i neliniare
Modelul liniar este modelul n care relaia dintre variabile este una de proporionalitate,
legtura dintre variabile fiind descris de o funcie liniar. De exemplu, modelele
Y 0 1 X i Y 0 1 X 1 2 X 2 sunt modele liniare.

14

Regresia liniar simpl

Modelul neliniar este modelul n care legtura dintre variabile este explicat de o funcie
neliniar. Exemple:
Y 0 1 ln X , ln Y 0 1 X , Y 0 X 11 etc.
2.2. Interpretarea geometric i statistic a regresiei
Interpretarea geometric
Locul geometric al mediilor condiionate ale variabilei dependente, pentru valori fixate ale
variabilei independente, reprezint o linie poligonal sau o curb (linia de regresie, pentru caz
discret, sau curba de regresie, pentru caz continuu).
Analiza dependenei legturii dintre cele dou variabile se poate realiza pe baza unei judeci
statistice elementare: tipul dependenei dintre cele dou variabile sau modul n care variabila
independent o influeneaz pe cea dependent este sugerat de forma curbei sau liniei de
regresie statistic, construit pe baza mediilor condiionate, calculate cu ajutorul datelor
disponibile.
De exemplu, dac linia de regresie statistic se apropie de o dreapt, datele sugereaz un tip
de dependen liniar ntre variabilele studiate (figura 1).
6.00

Value profit

5.00

4.00

3.00

2.00

60.00

70.00

80.00

90.00

100.00

ch_publicit

Figura 1. Linia de regresie statistic a lui Y n raport cu X


b. Interpretarea statistic
Conform teoriei probabilitilor i statisticii matematice, regresia este o medie condiionat
definit pe o distribuie bi- sau multidimensional. n cazul unei legturi dintre dou variabile,
regresia este definit prin aplicaia:
M ( Y / X xi ) f ( xi ) sau M ( Y / X ) f ( x )
Pentru cazul liniar, regresia sau media condiionat este o funcie liniar:
M ( Y / X ) 0 1 X , unde 0, 1 sunt parametrii modelului, iar X este variabila
independent, considerat nestochastic.
Econometrie Dnu JEMNA

Regresia liniar simpl

15

n consecin, regresia liniar este:


yi M ( Y / X xi ) 0 1 xi .
2.3. Modelul econometric de regresie liniar simpl
1. Prezentarea modelului
n cazul regresiei liniare simple, modelul are urmtoarea expresie:
yi 0 1 xi i sau
Y 0 1 X ,
iar media condiionat este:
M ( Y / X xi ) 0 1 xi .
Componentele modelului
Modelul econometric liniar simplu include dou componente: una determinist i una
stochastic.
Componenta determinist este reprezentat de media condiionat:
M ( Y / X xi ) 0 1 xi .
n aceast component apare variabila independent, care este o variabil observabil din
punct de vedere statistic, i parametrii modelului, care sunt constante reale.
Componenta aleatoare este reprezentat de variabila aleatoare numit eroare sau reziduu,
notat cu . Natura acestei variabile este legat de urmtoarele probleme care nsoesc
procesul de modelare: natura fenomenului studiat, specificarea modelului, erorile de
msurare1.
n modelul econometric, i sunt variabile aleatoare construite pentru fiecare repartiie
condiionat de forma Yi X xi .
2. Parametrii modelului
n modelul de regresie liniar simpl, yi 0 1 xi i , exist doi parametri: 0 i 1 .
Acetia se mai numesc i coeficieni de regresie.
- 0 este constanta sau termenul liber (intercept) i indic valoarea medie a variabilei
dependente Y atunci cnd variabila independent X ia valoarea zero. Este ordonata la origine a
dreptei de regresie sau intersecia dreptei cu axa OY. n unele modele, acest parametru poate
s lipseasc, caz n care dreapta trece prin origine.

G.S. Maddala, Introduction to econometrics, John Wiley and Sons, 2001, p. 64

Econometrie Dnu JEMNA

16

Regresia liniar simpl

- 1 (slope) indic variaia absolut medie a variabilei dependente la o variaie absolut cu o


unitate a variabilei independente. Cu alte cuvinte, 1 arat rspunsul variabilei Y la o cretere
sau scdere cu o unitate a variabilei X.
1

dY Y
, unde Y 0 1 X .

dX X

Rspunsul variabilei dependente poate fi n acelai sens ( 1 0 ), ceea ce indic o legtur


direct sau pozitiv ntre variabile (de exemplu, dac X crete cu o unitate, Y crete n medie
cu 1 ) sau poate fi n sens contrar ( 1 0 ), adic ntre variabile exist o legtur invers.
Dac 1 0 , ntre cele dou variabile nu exist o legtur de tip liniar.
Y

yx 0 1 x

1
0

Figura 2. Linia de regresie sau media condiionat


Ipotezele clasice ale modelului de regresie
Modelarea econometric implic anumite condiii sau ipoteze asupra celor dou componente
ale modelului, ipoteze care vor fi prezentate n continuare. Ipotezele acestui model se mpart
n dou categorii i privesc cele dou componente ale modelului: componenta determinist i
componenta aleatoare.
Ipoteze cu privire la variabilele independente
- variabila independent X este observabil (nestochastic);
- lipsa coliniaritii variabilelor independente ntre variabilele factoriale nu exist o legtur
liniar (n cazul regresiei multiple);
- variabila independent are o dispersie finit i este posibil de determinat.

Ipoteze cu privire la variabila aleatoare eroare


- eroarea medie este nul: M ( i ) 0 .
Cu alte cuvinte, n medie, modelul este bine specificat, adic factorii neinclui explicit n
model nu afecteaz sistematic valoarea medie a variabilei dependente. Altfel spus, aceast
Econometrie Dnu JEMNA

17

Regresia liniar simpl

ipotez presupune c valoarea ateptat, sperat, a erorii la nivelul repartiiilor condiionate de


tipul Yi X xi este egal cu zero (figura 3.3).
- ipoteza de homoscedasticitate: V ( i ) M ( i2 ) 2 .
Aceast ipotez presupune c variana erorii este constant la nivelul repartiiilor condiionate
de tipul Yi X xi . Repartiiile variabilei reziduale pentru fiecare repartiie condiionat sunt
prezentate n figura 3.3.
- ipoteza de normalitate a erorilor: i ~ N( 0 , 2 ) .
La nivelul fiecrei repartiii condiionate, variabila eroare urmeaz o lege de repartiie
normal.
- ipoteza de necorelare a erorilor: cov( i , j ) 0 sau erorile nu se influeneaz reciproc, sunt
independente.
- lipsa corelaiei dintre variabila independent i variabila eroare, cov( i , xi ) 0 .
Dac se admite ipoteza i ~ N( 0 , 2 ) , atunci variabila dependent este o variabil aleatoare
normal distribuit de forma: Y ~ N( 0 1 X ; 2 ) .
Y
yx 0 1 x

x1

x2

xi

Figura 3. Repartiiile erorilor la nivelul repartiiilor condiionate


3. Estimarea parametrilor modelului
n practic, de obicei, nu se dispune de date dect de la nivelul unui eantion de volum n. Pe
baza acestor date se realizeaz estimarea parametrilor modelului de regresie.
Pentru modelul yi 0 1 xi i , la nivelul unui eantion se obine ecuaia pe baza
estimatorilor:
yi 0 1 xi i sau
yi yi i ,
Econometrie Dnu JEMNA

18

Regresia liniar simpl

unde yi 0 1 xi estimeaz media condiionat M(Y/X).


Din relaiile de mai sus, rezult i yi yi sau i yi 0 1 xi . Cu alte cuvinte, dac se
dispune de un set de date statistice obinute prin sondaj, se pot calcula erorile estimate ale
modelului de regresie ca diferene dintre valorile empirice i cele estimate cu ajutorul
modelului pentru variabila dependent.
Determinarea estimatorilor prin Metoda celor mai mici ptrate
Potrivit metodei celor mai mici ptrate, estimatorii parametrilor modelului de regresie verific
condiia:
i2 min sau ( yi 0 1xi )2 min .
i

Prin metoda celor mai mici ptrate, estimatorii parametrilor modelului de regresie liniar
simpl se obin rezolvnd problema de optim:
S yi 0 1 xi )2 min .
i

Soluia se obine prin respectarea a dou condiii: de extrem i de minim, pentru aplicaia
S S( 0 , 1 ) .
Condiia de extrem presupune ecuaiile:

, )
S (
0
1
0

2 ( yi 0 1 xi )( 1 ) 0

sau

S ( 0 , 1 ) 0
2 ( yi 0 1 xi )( xi ) 0
i

Rezult:
( yi 0 1 xi ) 0
i

xi ( yi 0 1 xi ) 0
i
sau
n 0 1 xi yi

i
i

2
0 xi 1 xi yi xi
i
i
i
Rezolvarea sistemului conduce la urmtoarele relaii ale estimatorilor:
n xi yi xi yi
i
i

1 i
sau
n xi2 ( xi )2
i

Econometrie Dnu JEMNA

19

Regresia liniar simpl

( yi y )( xi x )
i

( xi x )

co v( X ,Y )
.
V( X )

0 y 1 x .
Proprietile estimatorilor 0 , 1
a. Proprietatea de nedeplasare
Proprietatea de nedeplasare a estimatorilor parametrilor modelului de regresie se
demonstreaz n condiiile respectrii ipotezei c variabila X este nestochastic i n baza
proprietii c variabilele aleatoare yi urmeaz aceeai lege de repartiie, adic:
yi ~ N( 0 1 xi , 2 ) .
Se demonstreaz c: M ( ) i M ( ) , ceea ce indic faptul c estimatorii
0

obinui prin metoda celor mai mici ptrate sunt nedeplasai.


b. Proprietatea de normalitate
Dac admitem ipoteza c i ~ N( 0 , 2 ) , estimatorii 0 , 1 , care sunt combinaii liniare de
variabile normal distribuite, sunt normal repartizai. Parametrii acestor repartiii sunt
prezentai mai jos.

M ( 0 ) 0 , M ( 1 ) 1 ,

V ( 1 )

( xi x )2

x2
2 1

.
V ( 0 )
2
n ( xi x )
i

n concluzie, rezult urmtoarele repartiii ale estimatorilor:

sau 1 ~ N 1 , 2 1 ,
1 ~ N 1 ,
2
( xi x )

x2
2 1

0 ~ N 0 ,
sau 0 ~ N 0 , 2 0 .
2
n
(
x

x
)
i

c. Proprietatea de convergen
Estimatorii 0 , 1 sunt convergeni, adic pentru un volum al eantionului suficient de mare
irurile estimatorilor converg n probabilitate ctre parametrii 0 , 1 . Au loc relaiile:
Econometrie Dnu JEMNA

20

Regresia liniar simpl

0 nN

0 ,

1 nN

1 .

d. Proprietatea de eficien
Estimatorul 1 este eficient pentru parametrul 1 , adic, dintre toi estimatorii posibili, 1
are variana cea mai mic.
Se poate arta c un estimator nedeplasat al dispersiei erorilor este dat prin relaia:

i2 ( yi 0 1 xi )2
i

n2

, iar

n2

i2

2
M ( 2 ) M i
,
n

Considerm relaia de descompunere a variaiei totale a variabile dependente, n condiiile


existenei legturi liniare cu variabila independent:
( yi y )2 ( 0 1 xi y )2 ( yi 0 1 xi )2 sau
i

VT VE VR .

Vom nota prin

i2 ( yi 0 1 xi )2 VR , adic estimatorul variaiei reziduale.


i

Dezvoltnd relaia de mai sus, se poate scrie:


VR ( yi y )2 12 ( xi x )2 2 1 ( xi x )( yi y ) , unde
i

VT ( yi y )2 este estimatorul variaiei totale.


i

Rezult:
VR VT 12 ( xi x )2 2 1 ( xi x )( yi y ) , iar
i

( yi y )( xi x )
i

( xi x )

co v( X ,Y )
, de unde rezult:
V( X )

VR VT 1 ( xi x )( yi y ) , iar
i

VE 1 ( xi x )( yi y ) , care este estimatorul variaiei explicate.


i

Obinem rezultatul:
VT VE VR .
Econometrie Dnu JEMNA

Regresia liniar simpl

21

Estimarea punctual i prin interval de ncredere a parametrilor modelului


a. Estimarea punctual
n baza proprietilor de nedeplasare i convergen, parametrii modelului de regresie se
estimeaz punctual considernd estimaiile calculate la nivelul unui eantion reprezentativ
extras din populaia de referin, pe baza relaiilor:
n xi yi xi yi
i
i
i
b1 i
2
n xi ( xi ) 2
i

b0 y b1 x .

, y

n
n
reprezint mediile variabilelor X, Y calculate la nivelul eantionului.
b. Estimarea prin interval de ncredere a parametrilor 0 , 1
La baza procedeului de estimare prin interval de ncredere stau legile normale de repartiie a
estimatorilor 0 , 1 . Astfel, dac se consider estimatorii standardizai, obinem statisticile:
0
1 1
~ N( 0, 1 ) , 0
~ N ( 0 , 1 ) , respectiv

0
1 1
~ t( n 2 ) , 0
~ t( n 2 ) ,


0

dac se utilizeaz estimatorii abaterilor standard ale estimatorilor.


Conform proprietilor repartiiei Student, pentru un nivel de ncredere (1-) fixat, intervalul
de ncredere pentru parametrul 1 se determin pe baza relaiei:

1
P 1
t / 2 1 .

Rezult:
P( 1 t / 2 1 1 t / 2 ) 1 , unde
1

( xi x )2

, iar

i2 ( yi 0 1 xi )2
i

n2

n2

sau 2

VR
.
n2

Cu alte cuvinte, pentru un nivel de ncredere egal cu (1-), limitele intervalului de ncredere
pentru parametrul 1 sunt:
Econometrie Dnu JEMNA

22

Regresia liniar simpl

1 t / 2 .
1

Analog, pentru parametrul 0 , intervalul de ncredere este:


t .
0

/2

Pe baza datelor de la nivelul unui eantion, se calculeaz un interval de ncredere cu ajutorul


estimaiilor. Se obin intervalele:
b1 t / 2 s , respectiv b0 t / 2 s .
1

Estimaiile pentru abaterile standard ale estimatorilor sunt:

( yi b0 b1 xi )2

( n 2 ) ( xi x )2

s2
,
( xi x )2

s s 2 (
0

i
2

1
x

) , iar
n ( xi x )2
i

( yi b0 b1 xi )2
i

(n2)

este estimaia parametrului .

Dac notm cu ei yi b0 b1 xi estimaiile erorilor, estimaia parametrului devine:


s

ei2
i

(n2)

Pentru componentele variaiei, se obin urmtoarele estimaii:


TSS ( yi y )2 (Total Sum of Squares);
i

ESS ( b0 b1 xi y )2 (Explained Sum of Squares);


i

RSS ( yi b0 b1 xi )2 ei (Residual Sum of Squares);


2

TSS = ESS + RSS.

Exemplu
Considerm datele cu privire la repartiia unei populaii de 50 firme dup profitul realizat
(variabila dependent Y, exprimat n sute milioane lei) i cheltuielile cu publicitatea
(variabila independent X, exprimat n milioane lei).

Econometrie Dnu JEMNA

23

Regresia liniar simpl

Parametrii modelului liniar de regresie sunt estimai punctual i prin interval de ncredere cu
ajutorul programului SPSS, dup cum urmeaz:
Coefficientsa

Model
1

(Cons tant)
cheltuieli cu publicitatea

Uns tandardized
Coefficients
B
Std. Error
-3.951
1.795
.100
.022

Standardized
Coefficients
Beta
.551

95% Confidence Interval for B


Lower Bound Upper Bound
-7.561
-.342
.056
.143

a. Dependent Variable: profitul

Modelul estimat pentru cele dou variabile este de forma:


y 3,95 0 ,1x .
Valoarea pozitiv a estimaiei parametrului 1 indic o legtur direct ntre cheltuielile cu
publicitatea i profitul firmei. Valorile estimaiilor arat c n cazul lipsei cheltuielilor (X = 0)
firma pierde 3,95 sute milioane lei, iar la o cretere a cheltuielilor cu publicitatea de 1 milion
lei, profitul mediu al firmei crete cu 0,1 sute milioane lei.
Intervalele de ncredere pentru cei doi parametri au urmtoarea interpretare: cu un nivel de
ncredere de 95%, valoarea parametrului 0 este acoperit de intervalul
(-7,56 ; -0,34), iar a parametrului 1 , de intervalul (0,056 ; 0,143).
4. Indicatori de corelaie
a. Coeficientul de corelaie
Coeficientul de corelaie teoretic este un parametru definit prin relaia:
cov( X ,Y )
sau

V ( X )V ( Y )
N xi yi xi yi
i
i
i

2
2
2
2
N xi ( xi ) N yi ( yi )
i
i
i
i

unde: 1 1 .
Coeficientul de corelaie msoar intensitatea legturii dintre cele dou variabile.
Dac valoarea parametrului se apropie de unu, ntre variabile exist o legtur intens sau
puternic. Legtura este slab dac coeficientul are o valoare aproape de zero. Se consider
semnificativ intensitatea legturii dintre dou variabile dac 0 ,7 . Semnul coeficientului
indic sensul legturii dintre variabile.
Observaie

Econometrie Dnu JEMNA

24

Regresia liniar simpl

O alt relaie pentru coeficientul de corelaie se poate construi innd cont de relaia
coeficientului de regresie 1 :
V( X )
.
V(Y )

Estimarea coeficientului de corelaie


Pentru acest parametru, se poate construi un estimator pe baza relaiilor de mai sus:
V( X )
1
.
V ( Y )
O estimaie a coeficientului de corelaie se obine la nivelul unui eantion, pe baza relaiei:

r b1

s x2
.
s y2

Observaie
Dac se realizeaz o standardizare a variabilelor X, Y, atunci estimatorul coeficientului de
corelaie pentru aceste variabile este identic cu cel al coeficientului de regresie 1 .
b. Raportul de determinaie i raportul de corelaie
Raportul de determinaie
Raportul de determinaie este un parametru care se calculeaz pe baza valorilor reale (yi) i a
valorilor teoretice ( yxi 0 1 xi ), valori calculate cu ajutorul modelului de regresie pentru
variabila dependent.
Raportul de determinaie msoar ct din variaia total a variabilei dependente este explicat
de modelul de regresie:

( yx

y )2

( yi y )

VE
V
1 R , unde: 0 2 1 .
VT
VT

Exprimat n procente, valoarea raportului de determinaie arat ct la sut din variaia


variabilei dependente este determinat de variaia variabilei independente.
Estimarea raportului de determinaie
La nivelul unui selecii de volum n, raportul de determinaie este estimat pe baza relaiei de
descompunere a estimatorului variaiei totale:

( yi y )2 ( yi y )2 ( yi yi )2
i

sau

VT VE VR
Econometrie Dnu JEMNA

Regresia liniar simpl

25

Observaie
Deoarece variabila dependent urmeaz o lege de repartiie normal, de parametri
( 0 1 X , 2 ), pentru variabilele de mai sus se pot construi variabile cu legi de repartiie
cunoscute:
VT ~ 2 ( n 1 ),
V ~ 2 ( k 1 ),
E

VR ~ 2 ( n k ),
unde k este numrul de parametri inclui n model. Pentru modelul liniar simplu, k=1.
Estimatorul raportului de determinaie se definete ca raport ntre estimatorul variaiei
explicate i estimatorul variaiei totale. n aceste condiii, se poate scrie relaia:
V
V
2 E 1 R .
VT
VT
O estimaie a raportului de determinaie se obine prin relaia:
( b0 b1 xi y )2

ESS
RSS
R2 i

1
.
2
TSS
TSS
( yi y )
i

Observaie
Pentru modelul liniar simplu, au loc relaiile:
2 2 , r 2 R2 .
Raportul de corelaie
Indicatorul 2 se numete raport de corelaie i msoar intensitatea legturii dintre
cele dou variabile.
Raportul de corelaie respect condiia: 0 1 . Estimaia raportului de corelaie se noteaz
cu R.
Exemplu
Pentru repartiia unei populaii de 50 firme dup profitul realizat (variabila dependent Y,
exprimat n sute milioane lei) i cheltuielile cu publicitatea (variabila independent X,
exprimat n milioane lei), estimaiile pentru raportul de corelaie i pentru raportul de
determinaie, calculate n SPSS, sunt:
Model Summ ary
Model
1

R
.551a

R Square
.304

a. Predictors: (Constant), chel tuieli cu publ icitatea

Econometrie Dnu JEMNA

26

Regresia liniar simpl

Valoarea raportului de determinaie arat c 30,4% din variaia variabilei dependente este
explicat de variaia variabilei independente inclus n model. Deoarece legtura dintre
variabile este una direct, estimaia coeficientului de corelaie este egal cu cea a
coeficientului de corelaie, r=R=0,55, ceea ce indic o legtur de intensitate medie ntre cele
dou variabile.
5. Testarea parametrilor i a modelului de regresie
Testarea parametrilor modelului de regresie, precum i a modelului de regresie se realizeaz
dup schema clasic a unui procedeu de testare, ale crei etape sunt precizate n continuare.
Etapele procesului testrii unei ipoteze statistice sunt:
1. formularea ipotezelor (ipoteza nul i ipoteza alternativ);
2. alegerea pragului de semnificaie sau a limitei erorii de spea nti (eroarea de a
respinge ipoteza nul n condiiile n care aceasta este adevrat);
3. alegerea statisticii test adecvate, care, n condiiile acceptrii ipotezei nule, are o lege
de repartiie specificat;
4. determinarea unei valori teoretice a testului, n funcie de legea de repartiie i de
pragul de semnificaie ales;
5. calcularea unei valori a statisticii test pe baza datelor de la nivelul unui eantion;
6. aplicarea regulii de decizie de acceptare sau de respingere a ipotezei nule (care n
esen const n compararea valorii calculate a testului cu cea teoretic).
Regula de decizie cu privire la acceptarea sau respingerea ipotezei nule se poate lua n dou
moduri: prin compararea valorii calculate a testului cu valoarea teoretic sau prin compararea
semnificaiei testului cu pragul de semnificaie.
Valoarea teoretic se citete pentru un prag de semnificaie ales i pentru o statistic cu legea
de repartiie cunoscut. Pentru legea Student i un prag de semnificaie , valoarea din tabele
( t ,n ) are proprietatea: P( t t ,n ) .
Calculul exact al nivelului de semnificaie, p-value sau Sig
Probabilitatea calculat, asociat valorii calculate a testului, a primit numele de semnificaie a
testului i este notat cu p-value sau Sig. Pentru o statistic Student, Sig t este probabilitatea
cu care se accept ipoteza nul i este dat de relaia:
Sig t P( t tcalc ) .
Utiliznd tabela Student, pentru o valoare calculat egal cu 3,49, un eantion de volum egal
cu 40, Sig t este: P( t 3,49 ) 0 ,0015.
Decizia pe baza semnificaiei testului presupune urmtoarele dou situaii:
- dac semnificaia testului este mai mare sau egal dect pragul de semnificaie, Sigt , se
accept ipoteza nul, cu o probabilitate egal cu (1-);
Econometrie Dnu JEMNA

27

Regresia liniar simpl

- dac Sigt , se respinge ipoteza nul, cu probabilitatea (1-).


Testarea parametrilor modelului
Parametrii modelului de regresie liniar se testeaz cu ajutorul testului Student sau al testului
t. Vom exemplifica etapele testrii pentru parametrul 1 .
Testul t
Considerm un test bilateral, cu urmtoarele etape:
1. Formularea ipotezelor
H 0 : 1 0 (ntre cele dou variabile nu exist o legtur liniar);
H 1 : 1 0 (ntre variabile exist o legtur de tip liniar).

2. Alegerea pragului de semnificaie


De regul, se ia valoarea 0,05 (n SPSS, aceasta este valoarea implicit, dar poate fi
modificat de utilizator).
3. Alegerea statisticii test
Se alege statistica Student t

1 1
.

1

4. Determinarea valorii teoretice a testului


Dac se accept ipoteza nul, statistica test este:

t 1 ~ t( n 2 ) , unde

1

( yi 0 1 xi )2

( n 2 ) ( xi x )2

Pentru pragul de semnificaie stabilit i cunoscnd legea de repartiie a statisticii test, pentru
n-2 grade de libertate, se citete din tabela Student valoarea teoretic t
. Se alege /2
2

;n 2

deoarece testul este bilateral (figura 3.5), iar zonele de respingere sunt delimitate de valorile
i t
.
t
2

;n 2

;n 2

De exemplu, pentru un prag de semnificaie de 0,05 i un eantion de volum n=150, din


tabele se citete valoarea t0 ,025;148 1,96 .

Econometrie Dnu JEMNA

28

Regresia liniar simpl

t
2

;n 2

t
2

;n 2

Figura 4. Valorile teoretice ale statisticii Student pentru un nivel de ncredere de ( 1 )


5. Determinarea valorii calculate a testului
La nivelul unui eantion se obine o estimaie a statisticii test:
b
b1
b1
.
tcalc 1

2
2
s
(
y

b
x
)
e
i 0 1i

( n 2 ) ( xi x )2
i

( n 2 ) ( xi x )2
i

6. Luarea deciziei
Regula de decizie, pe baza valorii calculate a testului, este urmtoarea:
- dac tcalc [ t , t
] , se accept H0 cu o probabilitate egal cu (1-);
2

;n 2

;n 2

- dac nu se realizeaz aceast condiie, se respinge ipoteza nul, cu probabilitatea (1-).


Dac se ine cont de semnificaia testului, regula de decizie este urmtoarea:
- dac Sigt , se accept ipoteza nul.
- dac Sigt , se respinge H0.
Exemplu
Pentru repartiia unei populaii de 50 firme dup profitul realizat (variabila dependent Y,
exprimat n sute milioane lei) i cheltuielile cu publicitatea (variabila independent X,
exprimat n milioane lei), testarea parametrilor este realizat n SPSS pe baza rezultatelor din
tabelul de mai jos.
Coefficientsa

Model
1

Uns tandardized Coefficients


B
Std. Error
(Cons tant)
-3.951
1.795
cheltuieli cu publicitatea
.100
.022

Standardized
Coefficients
Beta

a. Dependent Variable: profitul

Econometrie Dnu JEMNA

.551

t
-2.201
4.540

Sig.
.033
.000

Regresia liniar simpl

29

Valoarea calculat a testului Student, pentru fiecare parametru, se obine prin relaia
b
tcalc i , i 0 ,1 .
s
i

n tabelul de mai sus, estimaiile parametrilor modelului de regresie se gsesc n coloana a


doua (valorile lui B din coloana Unstandardized Coefficients), iar estimaiile abaterii standard
a estimatorului se afl n coloana a treia (valorile Std. Error).
Din datele tabelului de mai sus, valoarea calculat a testului, prezentat n coloana a cincea
(coloana t), se obine prin raportul dintre valorile coloanei a doua i a treia. De exemplu,
pentru parametrul 1 , valoarea statisticii test este:
0 ,1
tcalc
4 ,54 .
0 ,022
n coloana a patra (valoarea lui Beta), este calculat estimaia coeficientului de regresie n
cazul standardizrii variabilelor din model. Valoarea coeficientului de regresie este identic,
n acest caz, cu cea a coeficientului de corelaie (r=0,551).
n ultima coloan a tabelului sunt prezentate valorile calculate ale probabilitilor cu care se
obin cele dou estimaii ale parametrilor (Sig t).
Aplicnd regula de decizie prin compararea pragului de semnificaie cu valoarea Sig t, se ia
decizia de a respinge ipoteza nul cu o probabilitate de 95% pentru fiecare parametru n parte.
n consecin, se consider c parametrii estimai sunt semnificativ diferii de zero, ceea ce
este echivalent cu a spune c ntre cele dou variabile exist o legtur de tip liniar.
Testarea modelului de regresie
Modelul de regresie se testeaz cu ajutorul testului Fisher. Este un test asupra semnificaiei
modelului de regresie utilizat.
n acest caz, ipoteza nul se formuleaz asupra ambilor parametri ai modelului:
H 0 : 0 0 , 1 0 (modelul nu este semnificativ);
H 1 : 0 0 , 1 0 (modelul explic semnificativ legtura dintre variabile).

Statistica Fisher se construiete pe baza procedeului de descompunere a variaiei totale a


variabilei dependente (VT) n dou componente: variaia explicat (VE) i variaia rezidual
(VR). Utiliznd estimatorii componentelor variaiei, se construiete statistica:
VE
V n k
F k 1 E
~ ( k 1,n k ) ,
VR
VR k 1
nk
care urmeaz o lege de repartiie Fisher, determinat de parametrii: k, numrul parametrilor
din model (pentru modelul liniar simplu k=2) i n, volumul eantionului.
Econometrie Dnu JEMNA

30

Regresia liniar simpl

Pentru un prag de semnificaie fixat, se citete valoarea teoretic F ;k 1;n k .

F ;k 1;n k

Figura 5. Valoarea teoretic a statisticii Fisher pentru un nivel de ncredere de ( 1 )


Valoarea calculat a statisticii Fisher este:
ESS
( b0 b1 xi y )2 n k
.
Fcalc k 1 i

RSS ( yi b0 b1 xi )2 k 1
i
nk
Decizia se ia prin compararea valorii calculate a testului cu valoarea din tabela Fisher:
- dac Fcalc F ;k 1;n k , se respinge ipoteza nul;
- dac Fcalc F ;k 1;n k , se accept ipoteza nul, cu probabilitatea ( 1 ).
Exemplu
Modelul de regresie estimat pe baza datelor privind repartiia unei populaii de 50 firme dup
profitul realizat (variabila dependent Y, exprimat n sute milioane lei) i cheltuielile cu
publicitatea (variabila independent X, exprimat n milioane lei).este testat cu ajutorul
testului Fisher, conform datelor din tabelul de mai jos.
ANOVAb
Model
1

Regres sion
Res idual
Total

Sum of
Squares
51.021
116.979
168.000

df
1
48
49

Mean Square
51.021
2.437

F
20.935

Sig.
.000 a

a. Predictors: (Cons tant), cheltuieli cu publicitatea


b. Dependent Variable: profitul

n tabelul ANOVA, realizat cu ajutorul programului SPSS, sunt prezentate estimaiile


variaiei, pe cele dou componente (coloana 2, Sum of Squares), precum i estimaiile
varianelor (coloana 4, Mean Squares), obinute prin raportarea acestora la numrul de grade
de libertate (coloana 3, df).

Econometrie Dnu JEMNA

Regresia liniar simpl

31

Componentele variaiei:
- variaia explicat estimat este 51,021 (Explained Sum of Squares sau Regression Sum of
Squares);
- variaia rezidual estimat este 116,979 (Residual Sum of Squares);
- variaia total estimat, suma celor dou precedente, este 168 (Total Sum of Squares);
Gradele de libertate asociate:
k 1 = 1;
n k = 48;
n 1 = 49;
n = 50.
Variana estimat a erorilor este:
( yi b0 b1 xi )2

116 ,979
s2 i

2 ,437 .
n2
50 2
Valoarea statisticii Fisher este:
ESS
51,021
Fcalc k 1
20,935 .
RSS
2 ,437
nk
Valoarea ridicat a statisticii este determinat de valoarea sczut a estimaiei varianei
erorilor, ceea ce nseamn c modelul este valid sau este semnificativ pentru a explica
legtura dintre cele dou variabile.
n condiiile discutate, decizia cu privire la ipoteza nul este evident, aa cum o arat i
valoarea semnificaiei testului: Sig F = 0,0 < 0,05. Adic, cu o probabilitate de 95%, se
respinge ipoteza nul sau ipoteza c modelul nu este adecvat realitii studiate.
6. Testarea indicatorilor de corelaie
a. Testarea coeficientului de corelaie
1. Ipoteze
H 0 : 0 (ntre variabile nu exist o legtur semnificativ);
H 1 : 0 (variabilele sunt corelate semnificativ).
2. Pragul de semnificaie ( 0 ,05 )
3. Testul statistic
Se utilizeaz statistica Student, care n condiiile acceptrii ipotezei nule este:

Econometrie Dnu JEMNA

32

Regresia liniar simpl

1 2
n2

~ t( n 2 ) .

4. Valorile teoretice din tabela Student


Pentru un test bilateral, se citete valoarea t / 2 ; n 2 .
5. Valoarea calculat a testului
La nivelul unui eantion, se calculeaz:
r
tcalc
.
1 r2
n2
6. Decizia
- dac tcalc [ t / 2 ;n 2 , t / 2 ;n 2 ] , se accept H0 cu o probabilitate egal cu (1-);
- dac nu se realizeaz aceast condiie, se respinge ipoteza nul, cu probabilitatea (1-).
b. Testarea raportului de corelaie
Demersul testrii este prezentat prin etapele de mai jos.
- Se formuleaz ipotezele:
H 0 : 0 ntre variabile nu exist o legtur semnificativ);
H1 : 0 (variabilele sunt corelate semnificativ).

- Se alege pragul de semnificaie .


- Se utilizeaz o statistic Fisher, care are urmtoarea expresie:
2 n k
F

,
1 2 k 1
care urmeaz o lege de repartiie Fisher de k-1 i n-k grade de libertate.
- Se citete valoarea teoretic F ;k 1;nk din tabela lui Fisher, pentru un prag de semnificaie
stabilit i pentru k-1, respectiv (n-k) grade de libertate.
- Se obine valoarea calculat a testului:
Fcalc

R2
nk
,

2
1 R k 1

unde R2 este raportul de determinaie calculat la nivelul unui eantion.

Econometrie Dnu JEMNA

Regresia liniar simpl

33

- Se ia decizia pe baza urmtoarei reguli: dac Fcalc F ;k 1;n k , se respinge ipoteza H0. n
funcie de semnificaia testului, dac SigF < , se respinge H0, cu o probabilitate egal cu 1.
Observaie
Testul Fisher utilizat pentru testarea modelului este identic cu cel folosit la testarea raportului
de corelaie:
ESS n k
R2 n k
. La baza acestei egaliti stau relaiile:

RSS k 1 1 R 2 k 1
ESS
R2
, TSS ESS RSS .
TSS
Fcalc

Econometrie Dnu JEMNA

S-ar putea să vă placă și