Sunteți pe pagina 1din 11

UNITATEA DE NVARE 3

Modelul liniar de regresie unifactorial


Modelul econometric
Modelul este o schem simplificat a realitii studiate.
a. Forma general a modelului:
Modelul econometric este o prezentare formalizat a problemei sau a realitii economice
studiate. De regul, modelul econometric este o ecuaie sau un sistem de ecuaii construit pe baza
variabilelor statistice.
Exemplu: un model de regresie liniar poate fi exprimat astfel: Y=
o
+
1
X+.
n cercetarea econometric se utilizeaz variabile statistice ntre care, n mod logic, exist
relaii de interdependen.
Tipuri de variabile: - variabile dependente, numite i variabile rezultative sau efect, rezultat.
- variabile independente, numite i variabile factoriale sau factori de influen care determin un
anumit efect asupra variabilei rezultat.
- variabilele reziduale sau eroare. De regul, aceste variabile apar n model ca sum a tuturor
influenelor necunoscute sau care nu apar explicit n model. n cercetarea econometric, variabila
eroare este o variabil aleatoare care respect anumite proprieti, numite i ipoteze clasice.
Parametri
- parametri modelului econometric, numii i coeficieni de regresie, sunt mrimi reale, fixe dar
necunoscute care apar n model n diferite expresii alturi de variabile ().
-parametri fac obiectul procesului de estimare i testare statistic.
Estimatori
Estimatorii sunt variabile aleatoare cu distribuii de probabilitate cunoscute i cu proprieti
specifice n baza crora se realizeaz procesul de estimare a parametrilor modelului econometric.
Proprieti ale estimatorilor
- nedeplasarea un estimator este nedeplasat dac media sau sperana
matematic a acestuia este egal cu parametrul: .
- convergena un estimator este convergent dac variana sa tinde spre 0 atunci cnd
volumul eantionului tinde spre volumul populaiei: .
- eficiena estimatorul este eficient dac are variana cea mai mic dintre toi
estimatorii posibili pentru parametrul u :
Criterii de clasificare a modelelor econometrice
a)Dup natura dependenei dintre variabile:
1. modele de regresie deterministe: variabila dependent este explicat n totalitate de
variabila sau variabilele independente din model.
u u = )

( M
N n cnd V , 0 )

(u
im V min )

( = u
2. modele de regresie probabiliste: Y=f(x) +, unde este o variabil numit eroare sau
reziduu, care sintetizeaz ansamblul factorilor cu influen asupra variabilei Y, dar care nu pot fi
comensurai i care nu sunt prini n mod explicit n model.
b. Dup numrul factorilor de influen:
1. modele de regresie simpl (unifactoriale)
- variabila Y este explicat printr-un singur factor determinant, ceilali factori au o
aciune aleatoare sau nesemnificativ.
Exemplu: funcia de consum (consum-venituri).
2. modele de regresie multipl
- variabila Y este explicat de doi sau mai muli factori.
Exemplu: funcia de producie Q=f(L,K)+,
unde: Q - producia
L - factorul munc
K capitalul
c. Dup forma legturii dintre variabile:
1. modele de regresie liniar dac Y este o funcie liniar de variabila sau variabilele
explicative;
;

2. modele de regresie neliniar
d. Dup timpul la care se refer datele din model:
1. Modele de regresie statice
- variabilele incluse n model se refer la acelai moment de timp sau la aceeai
perioad de timp.
- se construiesc pe baza datelor de sondaj sau a cercetrilor de moment.
2. Modele de regresie dinamice
- sunt modele n care factorul timp apare explicit, ca variabil independent:
Y
t
=f(t)+.
Demers metodologic:
a. Formularea problemei n termeni economici, plecnd de la o teorie economic.
Exemplu: Keynes a afirmat c oamenii sunt dispui s consume, n medie, mai mult dac
veniturile lor cresc. Aceast cretere nu se produce, ns, n acelai ritm (funcia de consum).
b. Identificarea variabilelor
c. Specificarea modelului matematic al teoriei economice.
Exemplu: Keynes a postulat existena unei relaii directe ntre consum i venituri, dar nu a
precizat forma legturii dintre cele dou variabile.
S considerm, pentru simplicitate, urmtoarea form a funciei de consum: Y=
0
+
1
X.
d. Specificarea modelului econometric
c | | + + = X Y
1 0
- modelul matematic pur al legturii dintre consum i venituri este de interes redus pentru
economiti, pentru c presupune o relaie exact, determinist ntre aceste dou variabile.
- pentru reprezentarea legturii dintre acestea,
Econometricianul a modificat funcia de consum, introducnd un termen eroare, astfel:
Y=
0
+
1
X +.
e. Estimarea parametrilor modelului econometric.
- se realizeaz plecnd de la metoda celor mai mici ptrate (MCMMP).
f. Testarea ipotezelor statistice
- se urmrete dac estimrile obinute sunt n acord cu ipotezele formulate, potrivit
teoriei economice testate.
g. Prognoza (predicia) statistic
- dac rezultatele testrii confirm ipotezele formulate, modelul econometric poate fi
folosit n scop predictiv.
h. Folosirea modelului n scop decizional.
- considernd, de exemplu, un model estimat de forma:
Y=-200+0,8X

Exemplu:
Managerul unei firme ce vinde autoturisme presupune c exist o dependen ntre
numrul de autoturisme vndute (Y) i numrul persoanelor care lucreaz n sectorul publicitii
(X). Pentru a verifica aceasta ipotez se nregistreaz date pentru 10 luni consecutive. In urma
prelucrrii datelor se obine:
Nr autoturisme Nr. persoane
Mean 11 4,8
Standard Deviation 4,27 1,23
Sample Variance 18,22 1,51
Sum 110 48
Count 10 10

=
n
i
i
y
1
2
=1374

=
n
i
i
x
1
2
= 244

=
n
i
i i
y x
1
= 571 ( )

= =
= =
n
i
i i
n
i
i
y y u SSE
1
2
1
2
= 28,044

a) In ipoteza unei dependene liniare determinai coeficienii ecuaiei de regresie i
interpretai valorile acestora.
b) Testai semnificaia parametrilor modelului, determinai intervalele de ncredere pentru
acetia i interpretai rezultatele obinute (t
critic
=2,306).
c) Testai validitatea modelului de regresie obinut pentru o probabilitate de 95% (F
critic
=
5,32).
d) Msurai intensitatea legturii dintre cele dou variabile folosind un indicator adecvat i
testai semnificaia acestuia pentru o probabilitate de 95% (t
critic
=2,306).
e) Estimai numrul de autoturisme vndute dac n sectorul publicitii lucreaz 30 de
persoane.

Rezolvare:
a) Dac distribuia punctelor empirice poate fi aproximat cu o dreapt, modelul
econometric care descrie legtura dintre cele dou variabile este un model liniar de forma:

i i i
u bx a y + + =

i i
x b a y

+ =

i i i
x b a y u

=
Parametrii a i b ai modelului se determin cu ajutorul metodei celor mai mici ptrate:
( ) ( ) ( )

= = =
i
i i
i
i i
i
i
x b a y y y u b a F
2
2 2

min min min

= +
= +


= = =
= =
n
i
i i
n
i
i
n
i
i
n
i
i
n
i
i
y x x b x a
y x b a n
1 1
2
1
1 1

10 = n

= +
= +
571

244 48
110

48 10
b a
b a

=
=
3

4
b
a

Deci:
i i
x y + = 3 4

Termenul liber este punctul n care variabila explicativ (factorial) este egal cu 0. Deci,
numrul de autoturisme vndute, dac numrul persoanelor care lucreaz n sectorul publicitii
este egal cu 0, este 4 buci.
Coeficientul 3

= b , ceea ce nseamn c, la creterea numrul persoanelor care lucreaz


n sectorul publicitii cu o persoan, numrul de autoturisme vndute va crete cu 3 buci.
b) Testarea semnificaiei parametrilor modelului:
Ecuaia de regresie la nivelul colectivitii generale este:
i i i
u bx a y + + =
iar la nivelul eantionului este:
i i i
u x b a y

+ + =
Verificarea semnificaiei parametrului b:
1) Se stabilete ipoteza nul:
H
0
: b= 0
2) Se stabilete ipoteza alternativ:
H
1
: b = 0, adic b este semnificativ diferit de zero pentru un prag de semnificaie
ales.
3) Se calculeaz testul statistic:
Deoarece n = 10 < 30 avem eantion de volum redus i, pentru verificarea semnificaiei
parametrilor modelului, vom utiliza testul t:
22 , 6
508 , 0
3

= = =

=
b b b
b
s
b
s
b
s
b b
t
( )
( )
( )
508 , 0
9 51 , 1
5055 , 3
1
1

2
2
2
2

n
k n
y y
x x
s
s
x
i
i i
i
i
u
b
o

( )
5055 , 3
2 10
044 , 28
1

2
2
=

=

k n
y y
s
i
i i
u

k reprezint numrul variabilelor factoriale (n cazul modelului unifactorial k = 1).
Deoarece 306 , 2 22 , 6

= > =
critic
b
t t se respinge ipoteza nul, adic parametrul b este
semnificativ diferit de zero, pentru un prag de semnificaie . 05 , 0 = o
Intervalul de ncredere pentru acest parametru este:

autoturisme vndute
Testarea semnificaiei parametrului a:
1) se stabilete ipoteza nul: H
0
: a = 0;
2) se stabilete ipoteza alternativ: H
1
: a = 0;
3) se calculeaz testul statistic:
66 , 1
509 , 2
4 0

= =

=
a a a
a
s
a
s
a
s
a a
t

( )
509 , 2
59 , 13
8 , 4
10
1
5055 , 3
1
2
2
2
2

=
(

+ =
(
(
(

+ =

i
i
u a
x x
x
n
s s

Deoarece 306 , 2 66 , 1

= > =
critic a
t t se accept ipoteza nul, adic parametrul a nu
este semnificativ diferit de zero, pentru un prag de semnificaie . 05 , 0 = o
Intervalul de ncredere pentru acest parametru este:
persoane care lucreaz n
sectorul publicitii

c) Testarea validitii modelului de regresie:
1) se stabilete ipoteza nul: H
0
: mprtierea valorilor
t
y datorate factorului nu difer
semnificativ de mprtierea acelorai valori datorate ntmplrii, deci modelul nu este valid.
2) se stabilete ipoteza alternativ: H
1
: modelul este valid;
| | | | | | 2 ; 10 509 , 2 306 , 2 4

= e e a s t a a
a critic
| | | | | | 4 ; 2 508 , 0 306 , 2 3

= e e b s t b b
b
critic
3) se calculeaz testul F:

78 , 38
5055 , 3
936 , 135
2
2
= = =
u
x y
c
s
s
F
( )
936 , 135 044 , 28 9 22 , 18 ) 1 (
1

2
2
2
= = =

=

SSE n
SSE SST
k
y y
s
y
i
i
x y
o
( )
5055 , 3
2 10
044 , 28
1

2
2
=

=

k n
y y
s
i
i i
u


32 , 5
8 ; 1 ; 05 , 0 1 ; ; ; ;
2 1
= = = =

F F F F
k n k v v tab o o

Deoarece F
calc
= 38,78 > F
tab
= 5,32 modelul este valid.
d) Intensitatea legturii dintre cele dou variabile se determin cu ajutorul coeficientului de
corelaie liniar:
( ) | | ( ) | |
| || |
0 1 91 , 0
110 1374 10 48 244 10
110 48 571 10
2 2
2
2
2
2
> =


=
=


=


i i i i
i i i i
y y n x x n
y x y x n
r

Rezult c ntre cele dou variabile exist o legtur direct foarte puternic.
Verificarea semnificaiei coeficientului de corelaie:
- se stabilete ipoteza nul: H
0
: r = 0;
- se stabilete ipoteza alternativ: H
1
: . 0 = r
- se calculeaz testul t:
23 , 6
91 , 0 1
8 91 , 0
1
2
2 2
=

= =
r
n r
s
r
t
r
r


Deoarece 306 , 2 23 , 6
8 ; 05 , 0 1 ;
= = > =

t t t
k n r o
coeficientul de corelaie este semnificativ
diferit de zero, pentru un prag de semnificaie =0,05.
Msurarea intensitii legturii cu ajutorul raportului de corelaie R:

( )
( )
91 , 0

1
2
1
2
=

=
=
n
i
i
n
i
i
y y
y y
R

Deoarece R = r = 0,91, apreciem c exist o legtur liniar, puternic i direct ntre cele
dou variabile.
Testarea raportului de corelaie se face cu testul F:
78 , 38
1
8
91 , 0 1
91 , 0 1
1
2
2
=

=
k
k n
R
R
F
calc

Deoarece 32 , 5 78 , 38 = > =
critic calc
F F R este semnificativ diferit de zero, pentru un prag
de semnificaie =0,05.
e) Cum x
n+v
= 30 pers.
86 30 3 4 = + =
+v n
y autoturisme vndute (estimaie punctual).
Pentru estimarea pe baza unui interval de ncredere vom avea:
v n v n
y k n v n v n y k n v n
s t y y s t y
+ +
+ s s
+ + + 1 ; 2 / 1 ; 2 /

o o

95 , 12 86 95 , 12 86
3 1
+ s s
+ critic n critic
t y t
( )
( )
95 , 12
9 51 , 1
) 8 , 4 30 (
10
1
1 5055 , 3
1
1
2
2
2
2

=
(

+ + =
(
(
(

+ + =

+
+
i
i
v n
u y
x x
x x
n
s s
v n

Deci, intervalul de ncredere pentru numrul de polie ncheiate este:
116 56 s s
+v n
y
Aplicaii propuse :
1. Pentru un mare magazin alimentar s-au cules date privind vnzrile (mil. RON) i
profitul (mil. RON) realizate n 9 luni ale anului 2003:
Luna Ian. Feb. Mar. Apr. Mai Iun. Iul. Aug. Sept.
Val. Vnz. (mil.
RON)
70 20 60 40 140 150 160 120 140
Profit (mil. RON) 15 2 13 15 25 27 24 20 27
a) S se reprezinte grafic datele;
b) S se determine modelul de regresie n eantion, calculnd valorile ajustate ale profitului n
funcie de vnzri;
c) S se verifice semnificaia modelului de regresie gsit la punctul b) folosind testul F, pentru
un nivel de semnificaie =0,05.
d) S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie
=0,05.
e) Dac modelul s-a dovedit semnificativ, s se previzioneze valoarea profitului dac s-ar fi
obinut vnzri n valoare de 200 mil. RON.
f) S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie, testnd
semnificaia acestuia pentru un nivel de semnificaie =0,05.
g) Ce pondere din variaia totala a profitului este explicata de influenta vnzrilor?

2. Pentru un magazin se cunosc vnzrile de cmi brbteti i profitul obinut pentru 8
zile consecutive:
Profit (unitati monetare) 30 42 10 62 12 30 21 58
Numar de camasi vandute ( zeci bucati) 3 4 1 6 1 2 2 5
a) S se reprezinte grafic datele;
b) S se determine modelul de regresie n eantion, calculnd valorile ajustate ale profitului n
funcie de vnzri;
c) S se verifice semnificaia modelului de regresie gsit la punctul b) folosind testul F, pentru
un nivel de semnificaie =0,05.
d) S se testeze semnificaia parametrilor modelului de regresie, pentru un nivel de semnificaie
=0,05.
e) Dac modelul s-a dovedit semnificativ, s se previzioneze valoarea profitului dac s-ar fi
vndut 8 zeci buc. de cmi.
f) S se msoare intensitatea legturii dintre variabile folosind coeficientul de corelaie, testnd
semnificaia acestuia pentru un nivel de semnificaie =0,05.
g) Ce pondere din variaia total a profitului este explicat de influena vnzrilor de cmi?
3. Managerul unui magazin alimentar dorete s cunoasc dependena dintre valoarea
vnzrilor i profit. Pentru aceasta nregistreaz timp de 9 luni date privind vnzrile i profitul
(mil. RON). n urma prelucrrii datelor (utiliznd EXCEL) i a specificrii ecuaiei de regresie
(n ipoteza legturii liniare) care modeleaz dependena dintre cele 2 variabile se obine :
Val. Vnz. (mil. RON) Profit (mil. RON)
Mean 10 Mean 0.195555556
Median 12 Median 0.2
Mode 14 Mode 0.15
Standard Deviation 5.267826876
Standard
Deviation 0.064828834
Smple Variance 27.75 Smple Variance 0.004202778
Sum 90 Sum 1.76
Count 9 Count 9
i i
x y 0117 . 0 07844 . 0 + = , iar dispersia erorilor este =
2
e
s 0.00045311.
Se cere:
a) Validai modelul de regresie obinut.
b) Testati semnificaia parametrilor ecuaiei de regresie.
c) Calculai i testai semnificaia coeficientului liniar de corelaie.