Sunteți pe pagina 1din 10

Andrei Denisa Cristina

Grupa 1034

1. Formularea problematicii analizate, descrierea datelor i a sursei
datelor.
Pentru a decide n ce zon s fie amplasat un magazin de casete video, managerul unei firme
de comercializare i nchiriere de casete video realizeaz un studiu. Astfel, el consider ca succesul
afacerii este cuantificat prin profitul anual brut obinut (sute euro)-yi. Factorii, considerai
determinai pentru succesul acestei afaceri, sunt: numrul de locuitori pe o raz de un kilometru (mii
de loc.)-x1 si venitul mediu al locuitorilor de pe o raz de un kilometru (zeci euro)-x2
Sunt selectate aleator 15 supermarket-uri si sunt inregistrate valorile celor 3 variabile.

Nr. curent Profit(yi) Nr. loc(x1) Venit(x2)
1 323,581 5,556 42,746
2 343,682 5,917 43,106
3 375,264 5,483 46,993
4 351,242 6,4 43,249
5 328,417 5,917 40,695
6 318,069 6,683 41,253
7 330,959 6,065 40,791
8 267,263 7,491 39,932
9 320,883 6,284 36,826
10 409,535 5,851 45,3
11 316,262 5,681 42,645
12 351,806 5,187 42,306
13 333,655 6,164 44,842
14 372,679 7,32 45,233
15 362,796 5,062 41,426
Datele au fost preluate din studiul de piaa al unei firme in vederea deschiderii unui nou
magazin de casete video.
2. S se specifice model ul econometric unifactori al

2.1. Modelul econometric unifactorial : y
t
=f(x
1t
)+u
1t
explic variaia profitului brut pe seama
numrului de locuitori.
2.2 Modelul econometric unifactorial : y
t
=f(x
2t
)+u
2t
explic variaia profitului brut pe seama
venitului.
Pentru urmtoarele cerine ale proiectului vom folosi modelul econometric unifactorial care
explic cum variaz profitul brut atunci cand lum in calcul venitul locuitotilor : y
t
=f(x
2t
)+u
2t








a) Rezprezentai grafic datele de observaie i comentai legtura dintre variabile


Se observ ca ntre cele dou variabile X i Y exist o legtur liniar direct.
Deoarece graficul de mai sus arat c legatura dintre y si x
2
poate fi aproximat cu o dreapt,
modelul de mai sus devine : y
t
=a+bx
2t
+
1t
.
Dreapta de regresie demonstreaz faptul c atunci cnd venitul locuitorilor (x
2
) crete cu o
unitate, profitul brut al supermarketurilor crete b uniti.
b) Estimai parametrii modelului i interpretai rezultatele obinute
Se observ din grafic c ntre variabilele X i Y exist o legatur direct si liniar. Putem considera
ca ntre cele dou variabile exist o relaie de forma:
y
i
= + x
i
+
i
, i = 1,2,..., n.

y = 8.506x - 21.011
R = 0.4278
260
280
300
320
340
360
380
35 40 45 50
Series1
Linear (Series1)
X
2
Y Y
Pentru a determina estimatorii a i b rezolvm sistemul de ecuaii normale alea lui Gauss:
an + b xi = yi

a xi
+
b xi
2

=
xi yi
15a+637,343b=5106,093
637,343a+27170,11b=217718,5254
Din cele dou ecuaii, obtinem a=-21,0205022 si b=8,50601722.
Valorile celor doi coeficienii au fost determinate si cu ajutorul funciei de regresie din cadrul
calculului in Excel.
Coefficients Standard Error t Stat P-value Lower 95% Upper 95%
Intercept
-
21.0105022 116.1085556
-
0.1809557 0.8591931 -271.847786 229.8267815
X Variable 1 8.50601722 2.728124307 3.1178994 0.0081607 2.612262989 14.39977145


Dreapta de regresie estimat este : y
i
=21,011+8,506 x
i
Fiecare punct de pe dreapta de regresie este o estimaie a valorii medii Y, corespunztor
valorii alese pentru X. Deci y
i
este o estimaie pentru E(Y | X
i
) .
Interpretarea parametrilor obinui:
Valoarea b=8,506, care msoar panta dreptei de regresie, arat c, atunci cnd venitul creste cu o
unitate, profitul crete, in medie, cu 8, uniti.
Valoarea a=-21,011 o interpretm ca fiind efectul mediu asupra lui Y, al tuturor factorilor care nu
sunt luai n considerare n modelul de regresie.
c) Testai semnificaia statistic a parametrului pant i determinai intervalul de
ncredere 95% pentru acest parametru
Calculm abaterile medii ptratice ale estimatorilor parametrilor modelului
Varianele estimatorilor b i a.
Deoarece avem de testat doar semnificaia statistic a parametrului pant, vom calcula dar
variana estimatorului b.
Var(

) = Var(b) =

2


(x
i
)
2
x

Variana erorilor aleatoare este
2
, dar este necunoscut i trebuie estimat.
Un estimator nedeplasat pentru
2
este variana erorilor estimate.

2
= s
2
=
e
i
2




n 2

2
= s
e
2
=667.6303
s
e
==25,8385
se(b) = s
e

1 =
=2,728




(x
i


)
2
x

Testarea semnificaiei parametrului panta .
H
0
: =0 (parametrul panta nu este semnificativ statistic; modelul nu este valid )
H
1
: 0 (parametrul panta este semnificativ statistic; modelul este valid)
Sub ipoteza nul avem statistica:
t =
b
se(b)
care urmeaz o distribuie Student cu n-2 grade de libertate dac H
1
este adevrat.

Dac |t
calc
| > t
critic
= t
/2;n-2
, atunci respingem H
0
la un nivel de senificaie de %.
t
calc
=8.506/2,728=3,118
t
critic
= t
tabelat
= t
0.025;13
= 2,65
Deoarece 3,118>2,65 respingem H
0
si acceptm H
1
. Astfel, rezult ca parametrul pant
este semnificativ statistic. (Spunem c o statistic este semnificativ daca valoarea testului se gsete
in regiunea critic. n acest caz, se respinge H
0
).

Interval de ncredere pentru parametrul pant
Determinm un interval de ncredere care are o anumit probabilitate de a include valoarea
real, dar necunoscut a lui .
P(b t
crt
se(b) b + t
crt
se(b)) = 1
P(b t
/ 2;n

2
se(b) b + t
/ 2;n

2
se(b)) = 1
Un interval de ncredere 100(1 )% pentru parametrul este:
b t
crt
se(b) b + t
crt
se(b)
b t
/ 2;n

2
se(b) b + t
/ 2;n

2
se(b)
Valorile intervalului de ncredere in care se situeaz parametrul pant le putem vizualiza i
n tabelul ANOVA construit in Excel.
Astfel, parametrul pant se regsete n intervalul *2.61226298 ; 14.399771+.
Interpretare: Dat fiind un coeficient de ncredere de 95%, pe termen lung, n 95 din 100 de cazuri,
intervale precum intervalul (2.61226298 14.399771) , vor include valoarea real a lui .
Se poate testa dac =0 privind la intervalul de ncredere pentru observnd dac acesta
conine valoarea 0. Intervalul construit nu conine valoarea 0, deci suntem ncreztori ca 0.
Spunem c factorul X are putere explicativ pentru Y.

d) Testai validitatea modelului
Pentru testarea validitii modelului se formuleaz 2 ipoteze:
H
0
: modelul nu este valid statistic (MSR=MSE)
H
1
: modelul este valid statistic (MSR>MSE)
Se completeaz tabelul de analiz a variantei (ANOVA)
ANOVA

df SS MS F
Significance
F
Regression 1 6490.23281 6490.2328 9.7212969 0.008160685
Residual 13 8679.194534 667.63035

Total 14 15169.42734

SST=( y
i
-)
2
=15169,42734 este suma ptratelor abaterilor valorilor reale ale variabilei Y de la media
lor de selecie . Suma SST reprezint variana total a valorilor variabilei Y.
SSR=( y
i
-)
2
=6490,23281 reprezint variana rezidual explicat prin factorul de
regresie.
SSE=( y
i
- y
i
)= e
i
2
=8679,194534 reprezint variaia rezidual sau variaia neexplicat. Msoar
aciunea factorilor nenregistrai.
Avem SST=SSR+SSE
MSE=SSE/(n-2)=667,63035
Testul statistic folosit este:

F

=
SSR /1
care urmeaz o distributie F


SSE /(n 2) ;1,n2

Regula de decizie este:
Dac F
calculat
> F
critic
respingem H
0
si acceptm H
1
Modelul este valid statistic.
F
calculat
=9,7212969
F
tabelat
=

F
critic
=

F
;1,n2
=

F
0,05;1,8 = 4,67
Deoarece F
calculat
> F
tabelat
(9.7212969>4.67) respingem H
0
i acceptm H
1
. Rezult c
modelul este valid statistic.

e) Verificai ndeplinirea ipotezelor modelului clasic de regresie liniar
(heteroscedasticitatea, autocorelarea, normalitatea erorilor aleatoare)

1. Testarea heteroscedasticitii
Pentru a studia heteroscedasticitatea, vom utiliza Testul White, n EViews.
Testul solicit ca, dup determinarea reziduurilor din regresia original, s se calculeze o
regresie auxiliar a ptratelor reziduurilor n raport cu o constant, variabilele explicative ale
modelului original, ptratele lor i produsele ncruciate.
i i i i
X X e q o o o + + + =
2
2 1 0
2

Din regresia auxiliar se reine coeficientul de determinie multipl.
H
0
: nu exista heteroscedasticitate ( exista homoscedasticitate ).
H
1
: exista heteroscedasticitate


Conform testului efectuat in EViews, Probability(F-statistic)=0,968191 ceea ce ne face s
acceptam H
0
i respingem H
1
ceea ce nseamn c exist homoscedasticitate n modelul nostru de
regresie liniar.
2. Autocorelarea erorilor aleatoare
1. Metoda grafica

2. Detectarea autocorelrii erorilor aleatoare. Testul Durbin-Watson.
Se estimeaz parametrii modelului de regresie prin MCMMP i se obin reziduurile. Se testeaz
ipotezele:
0 :
0
= H (nu exist autocorelarea erorilor)
0 :
1
= H (exist autocorelarea erorilor).
Din tabelul distribuiei DW, pentru nivelul de semnificaie 5% , n=14 (n15), k=1, gsim d
1
=1,08 i
d
2
=1,36.
Deoarece DW2,4 rezult c reziduurile sunt independente.

3. Normalitatea erorilor aleatoare

Deoarece probabilitatea este mai mare de 0,05 si are o valoare de 0.894, nsemna ca avem o
distributie normala.
f) Previzionai valoarea variabilei dependente Y dac variabila X crete cu 10% fa de
ultima valoare nregistrat.

Ultima valoare nregistrat a lui X este 41.426, ceea ce nseamn c x
16
= x
15
+0,1* x
15.
x
16
=41,426+4,1426=45,5686
y
16
= 21,011+8,506 x
16
y
16
=21,011+8,50645,5686
y
16
=366,5955







3. Sa se estimeze modelul econometric multifactorial; sa se estimeze
parametrii modelului si sa se interpreteze valorile obtinute

Interpretarea coeficienilor obinui:
0
| = parametrul de interceptare
1

| =-14,448 arat c, meninnd celelalte variabile constante, profitul a scazut, n medie, cu


aproximativ 14,4 u.m., pentru fiecare locuitor.
2

| =7,904 arat c, meninnd celelalte variabile constante, atunci cnd venitul (X


2
) crete cu o u.m. ,
profitul creste, n medie, cu aproximativ 8 u.m.
0

| =92,242 arat c, dac cele dou variabile explicative, X


1
i X
2
au valoarea 0, valoarea medie a
profitului este estimat la circa 92 u.m.
Verificati existentei multicoliniaritatii variabilelor explicative

Detectam multicoliniaritatea pe baza coefcientilor de corelatie dintre variabilele explicative.
r
x1x2
=-0,1514 variabilele x
1
si x
2
nu sunt correlate.
Criteriul lui Klein se foloseste pentru identificarea dependentelor liniare dintre doua variabile
exogene.
Se verifica R
y
2
< r
xixj
2
Coeficientul de corelatie liniara r
xixj
trebuie sa fie semnificativ diferit de 0.
R
y
2
=0,5186, r
x1x2
=-0,1514 iar r
x1x2
2
=0,0229. Avem R
y
2
> r
xixj
2
.
In acest caz nu avem dependenta liniara intre variabilele exogene, ceea ce inseamna ca nu
exista multicoliniaritate.
4. Concluzii
In acest proiect am facut o analiza pentru o firma ce intentioneaza sa deschida un magazin de
casete video. In acest sens se face o analiza pe 15 supermarketuri amplasate in apropiere. Scopul
acestei analize a fost de a determina influenta numarului de locuitori si veniturile medii ale acestora
asupra profitului brut si, in acelasi timp, sa previzionam valoarea profitului in functie de anumite
valori ale variabilelor.
Observam ca in cazul modelului unifactorial, profitul brut este influentat de valoarea venitului
mediu al locuitorilor.
Putem spune ca modelul este valid statistic si ca venitul mediu influenteaza profitul brut in
proportie de 95%, existand o legatura directa intre cele doua variabile.
In acelasi timp putem spune ca testand heteroscedasticitatea, erorile aleatoare au proprietatea
de homoscedasticitate. Conform acestor teste, variabila Y, adica profitul brut, urmeaza o distributie
normala.
In cazul modelului multifactorial, analizand observam ca profitul brut este influentat in acelasi
timp atat de venitul mediu al locuitorilor, cat si de numarul acestora. Influentele celor doua variabile
sunt opuse. Profitul brut sufera o usoara scadere atunci cand numarul populatiei creste dar,
totadata, in raport cu veniturile medii ale acestora, profitul brut creste daca veniturile cresc.
In concluzie, putem spune ca pentru a se maximiza profitul brut e necesar a se tine cont de
venitul mediu al locuitorilor, dar in acelasi timp si de numarul acestora.

S-ar putea să vă placă și