Documente Academic
Documente Profesional
Documente Cultură
Seminar5 Econometrie Spataru 3.nov.2014
Seminar5 Econometrie Spataru 3.nov.2014
2014 )
Ex1. Consumul unei familii n funcie de Venitul Disponibil
(Continuare Exemplul de la Seminarul 3)
e) S se msoare intensitatea legturii dintre cele dou variabile folosind coeficientul de corelaie
liniar i raportul de corelaie. S se testeze semnificaia indicatorilor utilizai.
f) n ce msur, variaia cheltuielilor de consum este influenat de venitul disponibil al familiei, pe
baza modelului de regresie determinat?
g) S se previzioneze cheltuielile medii de consum ale unei familii, n ipoteza c venitul disponibil
este 100.
h) S se previzioneze cheltuielile de consum ale unei familii, n ipoteza c venitul disponibil este
100.
e) Coeficientul de corelaie de selecie
Coeficientul de corelaie de selecie este un indicator ce caracterizeaz direcia i intensitatea
legturii liniare dintre dou variabile. Semnul acestui coeficient indic direcia legturi iar valoarea
sa indic intensitatea legturii.
S xy
n xi y i xi y i
( xi x )( y i y )
rxy =
SxSy
[ ( x
][
x ) 2 ( yi y) 2
[n x
2
i
( x i )
] [n y
2
i
( y i )
Valoarea coeficientului de corelaie este ntre -1 i 1. O valoare apropiat de 1 arat o legtur direct
puternic. O valoare apropiat de -1 arat o legtur invers puternic.
S
( x i x )( y i y ) S xy
rxy = 1 x .
b = 1 =
=
2
S xx
Sy
( xi x )
Rezult c rxy are acelai semn cu coeficientul de regresie 1 .
Am obinut rxy = 0,980847 , ceea ce arat c exist o legtur direct i foarte puternic ntre cele
dou variabile analizate.
Testarea semnificaiei coeficientului de corelaie liniar se face utiliznd testul t.
H 0 : = 0 ( coeficientul de corelaie nu este semnificativ statistic)
(ntre cele dou variabile nu exist o dependen liniar semnificativ)
H 1 : 0 ( coeficientul de corelaie este semnificativ statistic).
(ntre cele dou variabile exist o dependen liniar semnificativ)
Statistica testului urmeaz o distribuie Student cu (n-2) grade de libertate.
t=
rxy 0
se(rxy )
rxy
1 rxy2
n2.
Dac t calculat > t critic , respingem H 0 i acceptm H 1 , adic este semnificativ statistic.
t calculat =
0,980847
1 (0,980847) 2
10 2 = 14,25039
Deoarece 14,25039 > 2,306 , deci avem t calculat > t critic rezult c vom respinge H 0 i vom accepta H 1 ;
ntre cele dou variabile exist o dependen liniar semnificativ.
Calitatea ajustrii
Dup ce dreapta de regresie a fost estimat, este important s se evalueze rezultatele, s se tie ct de
bine ajusteaz sau aproximeaz aceast dreapt datele de selecie. Utilizarea MCMMP asigur faptul
c valorile gsite pentru 1 i 0 sunt cele care aproximeaz cel mai bine datele de observaie, n
sensul specific de minimizare a sumei ptratelor reziduurilor. Nu exist nici o garanie c 1 i 0
1
R=
( y i y ) 2
( yi y) 2
sau R = 1
SSE
( y i y i ) 2
= 1
SST
( yi y) 2
SSR
=
SST
( y i y ) 2
( yi y) 2
sau R 2 = 1
SSE
=1
SST
( y i y i ) 2
( yi y) 2
R2
(n 2) ~ F ;1, n 2
1 R2
Cea mai bun estimaie (predicie) a valorii medii reale este estimaia punctual 75,3645.
Determinarea Intervalului de ncredere pentru media de rspuns necesit cunoaterea
distribuiei i a varianei estimatorului y 0 .
1
( x0 x ) 2
Avem: Var ( y 0 ) = se2 +
. Eroarea standard a estimatorului y 0 este
n (x x)2
i
1
( x0 x ) 2
se( y 0 ) = s e2 +
n
( xi x ) 2
1 (100 170) 2
se( y 0 ) = 42,159 +
33000
10
Un interval de ncredere pentru valoarea medie real E (Y | X = x0 ) = 0
y 0 t / 2 ,n 2 se( y 0 ) E (Y | X = x 0 ) y 0 + t / 2 ,n 2 se( y 0 )
= 10,4759 = 3,2366 .
+ 1 x0 este dat de
mediei.
Dac obinem intervale de ncredere 95% pentru fiecare X dat, vom obine, ca interval de ncredere,
o band de ncredere pentru funcia de regresie a populaiei.
h) S se previzioneze cheltuielile de consum ale unei familii, n ipoteza c venitul disponibil este
100.
Se dorete predicia unei valori individuale
y 0 = a + bx 0 = 24,4545 + 0,5091 100 = 75,3645 va fi, de asemenea, cea mai bun estimaie (predicie) a
valorii individuale y 0 = 0 + 1 x 0 + 0
Determinarea Intervalului de ncredere pentru un rspuns individual necesit cunoaterea
distribuiei i a varianei erorii de previzionare y 0 y 0 .
Pentru nivelul de semnificaie fixat, ( = 0,05 ), se poate construi un interval de ncredere
100 (1 )% pentru predicia individual y0 , de forma:
y 0 t / 2 ,n 2 se( y 0 y 0 ) y 0 y 0 + t / 2 ,n 2 se( y 0 y 0 )
( x0 x ) 2
1
Var ( y 0 y 0 ) = s e2 1 + +
n ( xi x ) 2
1
( x0 x ) 2
se( y 0 y 0 ) = s e2 1 + +
n ( xi x ) 2
Dup
efectuarea
calculelor,
am
obinut
valorile
Var ( y 0 y 0 ) = 52,6349
Observaie: Trebuie remarcat faptul c se obine un interval de lungime mai mare pentru y 0 dect
pentru E (Y | x 0 ) . Banda de ncredere este mai mic atunci cnd valoarea lui x 0 se apropie de media
de selecie x .
3) Pentru a extinde eantionul de date selectm Sample din workfile menu bar i modificm al doilea
numr din fereastr din 10 n 11 (sau 12, sau 13), apoi clic OK.
4) Deschidem un grup cu variabilele X i Y, selectm Show pentru a verifica datele i apoi clic OK.
5) Pentru a introduce valori pentru X, clic edit+/- pe meniul grupului i nlocuim literele NA cu
valorile dorite pentru X. Clic Enter dup fiecare valoare introdus i clic edit+/- pe meniul grupului
pentru a salva modificrile efectuate.
6) Selectm Objects/New Object/Equation de pe workfile menu bar, introducem variabilele X i Y
n fereastra Equation Specification , schimbm Sample de la 1 la 10; clic OK.
7) Selectm Name de pe equation menu bar, introducem eq01 pentru a identifica ecuaia, apoi clic
OK.
8) Selectm Forecast de pe fereastra ecuaiei, introducem un nume n fereastra Forecast name, (yif),
punem Sample range to forecast de la 1 la 11 (sau 12, sau 13) i apoi OK.
9) Deschidem seriile yif i yi ntr-un grup. Selectm Show din workfile menu bar, apoi OK.
10) Selectm Save din workfile menu bar pentru a salva modificrile efectuate.
MS
2363,497774
......
t Stat
..
..
F
..
P-value
0.0002
0.0007
Lower 95%
Upper 95%
..
..
tiind c suprafaa medie a caselor din eantion este 58 mp iar dispersia (variana) de selecie este
160,4286 se cer urmtoarele:
a) Testai validitatea modelului de regresie. Se va utiliza nivelul de semnificaie de 5% (valoarea
tabelar este 4,67).
b) Interpretai valorile obinute pentru coeficienii modelului de regresie.
c) Testai semnificaia coeficientului pant ( 1 ). Se va utiliza nivelul de semnificaie de 5% (valoarea
tabelar este 2,65).
d) S se determine un interval de ncredere 95% pentru parametrul pant 1 .
e) Pentru o cas cu suprafaa de 120 mp, previzionai preul de vnzare al acesteia.
Treptat, completai spaiile punctate cu informaiile care lipsesc i comentai (pe scurt) valorile
indicatorilor ce apar n tabele.