Sunteți pe pagina 1din 4

Econometrie Seminar 5 Sptaru ( 3nov.

2014 )
Ex1. Consumul unei familii n funcie de Venitul Disponibil
(Continuare Exemplul de la Seminarul 3)
e) S se msoare intensitatea legturii dintre cele dou variabile folosind coeficientul de corelaie
liniar i raportul de corelaie. S se testeze semnificaia indicatorilor utilizai.
f) n ce msur, variaia cheltuielilor de consum este influenat de venitul disponibil al familiei, pe
baza modelului de regresie determinat?
g) S se previzioneze cheltuielile medii de consum ale unei familii, n ipoteza c venitul disponibil
este 100.
h) S se previzioneze cheltuielile de consum ale unei familii, n ipoteza c venitul disponibil este
100.
e) Coeficientul de corelaie de selecie
Coeficientul de corelaie de selecie este un indicator ce caracterizeaz direcia i intensitatea
legturii liniare dintre dou variabile. Semnul acestui coeficient indic direcia legturi iar valoarea
sa indic intensitatea legturii.
S xy
n xi y i xi y i
( xi x )( y i y )
rxy =

SxSy

[ ( x

][

x ) 2 ( yi y) 2

[n x

2
i

( x i )

] [n y

2
i

( y i )

Valoarea coeficientului de corelaie este ntre -1 i 1. O valoare apropiat de 1 arat o legtur direct
puternic. O valoare apropiat de -1 arat o legtur invers puternic.
S
( x i x )( y i y ) S xy
rxy = 1 x .
b = 1 =
=
2
S xx
Sy
( xi x )
Rezult c rxy are acelai semn cu coeficientul de regresie 1 .
Am obinut rxy = 0,980847 , ceea ce arat c exist o legtur direct i foarte puternic ntre cele
dou variabile analizate.
Testarea semnificaiei coeficientului de corelaie liniar se face utiliznd testul t.
H 0 : = 0 ( coeficientul de corelaie nu este semnificativ statistic)
(ntre cele dou variabile nu exist o dependen liniar semnificativ)
H 1 : 0 ( coeficientul de corelaie este semnificativ statistic).
(ntre cele dou variabile exist o dependen liniar semnificativ)
Statistica testului urmeaz o distribuie Student cu (n-2) grade de libertate.
t=

rxy 0
se(rxy )

rxy
1 rxy2

n2.

Dac t calculat > t critic , respingem H 0 i acceptm H 1 , adic este semnificativ statistic.
t calculat =

0,980847
1 (0,980847) 2

10 2 = 14,25039

Deoarece 14,25039 > 2,306 , deci avem t calculat > t critic rezult c vom respinge H 0 i vom accepta H 1 ;
ntre cele dou variabile exist o dependen liniar semnificativ.
Calitatea ajustrii
Dup ce dreapta de regresie a fost estimat, este important s se evalueze rezultatele, s se tie ct de
bine ajusteaz sau aproximeaz aceast dreapt datele de selecie. Utilizarea MCMMP asigur faptul
c valorile gsite pentru 1 i 0 sunt cele care aproximeaz cel mai bine datele de observaie, n
sensul specific de minimizare a sumei ptratelor reziduurilor. Nu exist nici o garanie c 1 i 0
1

corespund exact cu parametrii necunoscui 1 i 0 i nici dac dreapta de regresie, determinat ca


fiind cea mai bun sau cea mai potrivit, aproximeaz corect datele observate.
Un indicator ce poate descrie calitatea reprezentrii, adic a liniei de regresie estimat, este
coeficientul de determinaie, notat R 2 .
SST = ( y i y ) 2 suma ptratelor abaterilor valorilor reale ale variabilei y de la media lor de
selecie, y . Suma SST se numete variaia total a valorilor variabilei y.
2
SSR = ( y i y ) 2 = ( y i y ) 2 = 1 ( x i x ) 2

suma ptratelor abaterilor valorilor ajustate ale


variabilei y de la media lor de selecie sau variaia datorat regresiei.
SSE = ( yi y i ) 2 = ei2 suma ptratelor reziduurilor (abaterilor valorilor reale ale variabilei y de la
valoarile ajustate) sau variaia datorat erorilor.
Avem SST=SSR+SSE
Raportul de corelaie dintre cele dou variabile este:
SSR
=
SST

R=

( y i y ) 2
( yi y) 2

sau R = 1

SSE
( y i y i ) 2
= 1
SST
( yi y) 2

Valoarea calculat este R 0,9808


Coeficientul de determinaie arat proporia din variaia total a variabilei dependente Y, explicat
de variaia variabilei independente X, deci prin modelul de regresie estimat.
R2 =

SSR
=
SST

( y i y ) 2
( yi y) 2

sau R 2 = 1

SSE
=1
SST

( y i y i ) 2
( yi y) 2

Testarea semnificaiei Raportului de corelaie se face utiliznd statistica


F=

R2
(n 2) ~ F ;1, n 2
1 R2

Cele dou ipoteze ale testului sunt:


H 0 : R 2 = 0 ( modelul nu este corect specificat, adic variabila X nu are efect asupra variabilei Y)
H 1 : R 2 > 0 (modelul este corect specificat, adic variabila X are efect asupra variabilei Y)
Se compar valoarea calculat a lui F cu valoarea critic obinut din tabelele repartiiei F. Se aplic
regula de decizie: dac Fcalc > F ;1,n 2 se respinge ipoteza nul n favoarea ipotezei alternative.
Deoarece Fcalc 202 i F ;1,n 2 = 5,32 se respinge H0 i se accept H1, adic modelul este corect
specificat.
f) Valoarea obinut, R 2 0,9621 , arat c aproximativ 96% din variaia cheltuielilor de
consum (var. Y) este explicat prin variaia venitului disponibil (var. X). Deoarece R 2 poate fi
cel mult 1, valoarea obinut sugereaz c dreapta de regresie estimat aproximeaz (ajusteaz)
foarte bine datele de observaie.
g) S se previzioneze (prognozeze) cheltuielile medii de consum ale unei familii, n ipoteza c
venitul disponibil este x 0 = 100 .
Trebuie s estimm valoarea medie a variabilei dependente, condiionat de valorile variabilei
independente.
Suntem n situaia de a prognoza E (Y | X = x0 ) = 0 + 1 x0
Putem obine estimaii punctuale sau prin intervale de ncredere
Folosim ecuaia de regresie estimat: y i = a + bxi = 24,4545 + 0,5091 xi
O estimaie punctual a previziunii mediei este y 0 = a + bx0 = 24,4545 + 0,5091 100 = 75,3645

y 0 este un estimator (predictor) al mediei condiionate E (Y | X = x0 ) .

Cea mai bun estimaie (predicie) a valorii medii reale este estimaia punctual 75,3645.
Determinarea Intervalului de ncredere pentru media de rspuns necesit cunoaterea
distribuiei i a varianei estimatorului y 0 .
1
( x0 x ) 2
Avem: Var ( y 0 ) = se2 +
. Eroarea standard a estimatorului y 0 este
n (x x)2
i

1
( x0 x ) 2
se( y 0 ) = s e2 +
n
( xi x ) 2

1 (100 170) 2
se( y 0 ) = 42,159 +
33000
10
Un interval de ncredere pentru valoarea medie real E (Y | X = x0 ) = 0
y 0 t / 2 ,n 2 se( y 0 ) E (Y | X = x 0 ) y 0 + t / 2 ,n 2 se( y 0 )

= 10,4759 = 3,2366 .

+ 1 x0 este dat de

75,3645 (2,306) (3,2366) E (Y | x 0 = 100) 75,3645 + (2,306) (3,2366)


67,9010 E (Y | x 0 = 100) 82,8381
Astfel, dac lum x 0 = 100 n selecii repetate, 95 de intervale din 100, vor conine valoarea real a

mediei.
Dac obinem intervale de ncredere 95% pentru fiecare X dat, vom obine, ca interval de ncredere,
o band de ncredere pentru funcia de regresie a populaiei.

h) S se previzioneze cheltuielile de consum ale unei familii, n ipoteza c venitul disponibil este
100.
Se dorete predicia unei valori individuale
y 0 = a + bx 0 = 24,4545 + 0,5091 100 = 75,3645 va fi, de asemenea, cea mai bun estimaie (predicie) a
valorii individuale y 0 = 0 + 1 x 0 + 0
Determinarea Intervalului de ncredere pentru un rspuns individual necesit cunoaterea
distribuiei i a varianei erorii de previzionare y 0 y 0 .
Pentru nivelul de semnificaie fixat, ( = 0,05 ), se poate construi un interval de ncredere
100 (1 )% pentru predicia individual y0 , de forma:
y 0 t / 2 ,n 2 se( y 0 y 0 ) y 0 y 0 + t / 2 ,n 2 se( y 0 y 0 )

( x0 x ) 2
1
Var ( y 0 y 0 ) = s e2 1 + +
n ( xi x ) 2

iar eroarea standard va fi:

1
( x0 x ) 2
se( y 0 y 0 ) = s e2 1 + +
n ( xi x ) 2

Dup

efectuarea

calculelor,

am

obinut

valorile

Var ( y 0 y 0 ) = 52,6349

se( y 0 y 0 ) = 52,6349 7,255


58,6345 y 0 | x 0 = 100) 92,0945

Observaie: Trebuie remarcat faptul c se obine un interval de lungime mai mare pentru y 0 dect
pentru E (Y | x 0 ) . Banda de ncredere este mai mic atunci cnd valoarea lui x 0 se apropie de media
de selecie x .

Previzionarea valorilor variabilei dependente Y utiliznd Eviews


1) Deschidem fiierul de tip workfile
2) Pentru a extinde domeniul fiierului selectm Procs/Change Workfile Range din workfile menu
bar i modificm End date de la 10 la 11 (sau 12, sau 13).

3) Pentru a extinde eantionul de date selectm Sample din workfile menu bar i modificm al doilea
numr din fereastr din 10 n 11 (sau 12, sau 13), apoi clic OK.
4) Deschidem un grup cu variabilele X i Y, selectm Show pentru a verifica datele i apoi clic OK.
5) Pentru a introduce valori pentru X, clic edit+/- pe meniul grupului i nlocuim literele NA cu
valorile dorite pentru X. Clic Enter dup fiecare valoare introdus i clic edit+/- pe meniul grupului
pentru a salva modificrile efectuate.
6) Selectm Objects/New Object/Equation de pe workfile menu bar, introducem variabilele X i Y
n fereastra Equation Specification , schimbm Sample de la 1 la 10; clic OK.
7) Selectm Name de pe equation menu bar, introducem eq01 pentru a identifica ecuaia, apoi clic
OK.
8) Selectm Forecast de pe fereastra ecuaiei, introducem un nume n fereastra Forecast name, (yif),
punem Sample range to forecast de la 1 la 11 (sau 12, sau 13) i apoi OK.
9) Deschidem seriile yif i yi ntr-un grup. Selectm Show din workfile menu bar, apoi OK.
10) Selectm Save din workfile menu bar pentru a salva modificrile efectuate.

Tem (pt.grupele prof. Sptaru). De predat rezolvarea, la Seminarul 6, pe coal semnat.


O agenie imobiliar dorete s previzioneze preul de vnzare al unor case pe baza unui
model de regresie unifactorial liniar ( y i = 0 + 1 xi + i ), n funcie de suprafaa locuibil a
caselor. Rezultatele obinute n urma prelucrrii n Excel, a datelor nregistrate pentru un eantion de
15 case, sunt:
Regression Statistics
Multiple R
.............
R Square
0,81646
Adjusted R Square
0,802305
Standard Error
6,39372
Observations
15
ANOVA
df
SS
Regression
..
....
Residual
..
531,435559
Total
..
2894,93333
Coefficients
Stand.Error
Intercept
21,23556
..
X Variab.1
1,025824
..

MS
2363,497774
......
t Stat
..
..

F
..

P-value
0.0002
0.0007

Lower 95%

Upper 95%

..

..

tiind c suprafaa medie a caselor din eantion este 58 mp iar dispersia (variana) de selecie este
160,4286 se cer urmtoarele:
a) Testai validitatea modelului de regresie. Se va utiliza nivelul de semnificaie de 5% (valoarea
tabelar este 4,67).
b) Interpretai valorile obinute pentru coeficienii modelului de regresie.
c) Testai semnificaia coeficientului pant ( 1 ). Se va utiliza nivelul de semnificaie de 5% (valoarea
tabelar este 2,65).
d) S se determine un interval de ncredere 95% pentru parametrul pant 1 .
e) Pentru o cas cu suprafaa de 120 mp, previzionai preul de vnzare al acesteia.
Treptat, completai spaiile punctate cu informaiile care lipsesc i comentai (pe scurt) valorile
indicatorilor ce apar n tabele.

S-ar putea să vă placă și