Sunteți pe pagina 1din 27

REGRESIE MULTIFACTORIAL

(Cazul bifactorial)
APLICAIE
CUPRINS

a) prezentarea problemei i verificarea preliminar a datelor


a.1)- prezentarea problemei
a.2.1)- date suficiente i corecte
a.2.2)- factori independeni
b) definirea modelului de regresie;
b.1)- forma, variabilele i parametrii modelului de regresie
b.2)-aproximarea grafic a modelului legturii dintre
variabile
CUPRINS

c) estimarea parametrilor modelului;


c.1)- estimarea punctual a parametrilor
c.2)- estimarea parametrilor prin interval de
ncredere
d) testarea semnificaiei corelaiei i a parametrilor modelului
de regresie;
d.1)- testarea semnificaiei corelaiei
d.2)- testarea parametrilor unui model de regresie
a) Prezentarea problemei i verificarea
preliminar a datelor
a.1) PREZENTAREA PROBLEMEI:

Un ntreprinztor cumpr un magazin avnd o suprafa de 230 m2


ntr-un cartier n care locuiesc n jur de 6400 de familii. O societate de
consultan de management comercial l informeaz c cifra de
afaceri a magazinelor cu profilul respectiv depinde liniar de numrul
familiilor din cartierul respectiv care, de regul, cumpr de la
magazinul cel mai apropiat i suprafaa comercial a
magazinului. n acest sens, i pune la dispoziie informaiile
referitoare la aceti indicatori, nregistrate la 13 magazine avnd
acelai profil:
Tabel 1. Numr de familii, suprafaa comercial i cifra
de afaceri a 13 magazine
Supr. comercial Cifra de afaceri
Nr. de familii (sute)
Nr.crt. (zeci m2) (mil. lei)
1 70 21 198
2 35 26 209
3 55 14 197
4 25 10 156
5 28 12 85
6 43 20 187
7 15 5 43
8 33 28 211
9 23 9 120
10 4 6 62
11 45 10 176
12 20 8 117
13 56 36 273
Total 452 205 2034
Sursa: V.Voineagu, E.ian, R.erban, S.Ghi, D.Todose, C.Boboc, D.Pele Teorie i practic
econometric, Ed. Meteor Press, 2007
a.2) VERIFICAREA PRELIMINAR A DATELOR:
a.2.1) Date suficiente (n>=15) i corecte (regula celor 3
sigma):

xi x 3 x x 3 x xi x 3 x
i 2
x x
x
n 1

yi y 3 y y 3 y yi y 3 y
i 2
y y
y
n 1
Tabel 2. Descriptive statistics
Supr.
Nr. de familii comercial Cifra de afaceri
(sute) (zeci m2) (mil. lei)

Mean 34.77 Mean 15.77 Mean 156.46

34,77 3 18,51 x1i 34,77 3 18.51 Standard Error 5.13 Standard Error 2.67 Standard Error 18.57
Median 33 Median 12 Median 176
x1i 20,77;90,31 Mode #N/A Mode 10 Mode #N/A
Standard Standard Standard
Deviation 18.51 Deviation 9.62 Deviation 66.95
15,77 3 9,62 x2i 15,77 3 9,62 Sample
Variance
Sample
342.69 Variance
Sample
92.53 Variance 4482.44
x2i 13,09;44,63 Kurtosis -0.34 Kurtosis -0.18 Kurtosis -0.61
Skewness 0.31 Skewness 0.88 Skewness -0.23
Range 66 Range 31 Range 230
Minimum 4 Minimum 5 Minimum 43
156,46 3 66,95 yi 156,46 3 66,95 Maximum 70 Maximum 36 Maximum 273

yi 44,39;357,315 Sum 452 Sum 205 Sum 2034


Count 13 Count 13 Count 13
a.2.2) Factorii independeni (variabilele exogene Xj sunt
independente ntre ele)

Se verific iniial ca legtura s nu fie puternic sau foarte


puternic pe baza matricii de corelaie liniar a variabilelor
exogene:

r
xi / x j i , j 1,n

Variabilele exogene xi i xj sunt independente dac:

R rxi / x j
2
y
Tabel 3. Correlation

Nr. de familii Supr. comercial


(sute) (zeci m2)
Nr. de familii
(sute) 1
Supr. comercial
(zeci m2) 0.619761 1

r
x1i / x2 i 0,620 Legtura dintre cele dou
variabile independente este
de intensitate medie.
b) DEFINIREA MODELULUI DE REGRESIE
b.1) forma, variabilele i parametrii modelului de regresie

n colectivitatea general:
Yi 0 1 X 1i 2 X 2i i

n eantion: yi b0 b1 x1i b2 x2i ei

Componenta predictibil: yi b0 b1 x1i b2 x2i


b.2) APROXIMAREA GRAFIC A MODELULUI
LEGTURII DINTRE VARIABILE

Figura 1. Corelaia dintre cifra de afaceri i numrul de


300
familii, respectiv suprafaa comercial
Cifra de afaceri (mil. lei)

250

200

150
300
100

Cifra de afaceri (mil. lei)


250
50
200
0
0 20 40 60 80 150
Nr. de familii (sute)
100

50

0
0 10 20 30 40
Supr. comercial (zeci m2)
c) ESTIMAREA PARAMETRILOR MODELULUI
c.1) estimarea punctual a parametrilor (MCMMP)

min ei2 min ( yi y i ) 2


i i
n
F b j min yi b0 b1 x1i b2 x2i
2

i 1


F b0 0 2 yi b0 b1 x1i b2 x2i 1 0
i


F b1 0 2 yi b0 b1 x1i b2 x2i x1i 0
i


F b2 0 2 yi b0 b1 x1i b2 x2i x2i 0
i
nb0 b1 x1i b2 x2i yi

0 1i 1 1i b2 x1i x2i x1i yi
2
b x b x

0 2i 1 1i 2i 2 2i 2i i
b x b x x b x 2 x y

X X B X Y
n
x 1i x 2i b0 yi

x1i x x x 2 i b1 x1i yi

2
1i 1i
x b x y
2i x x x 2 2i i
2
1i 2i 2i
b0

B b1 X X X Y
1


b2
1
b0 n
x 1i x 2i yi

B b1 x1i x 2
1i x x
1i 2 i x1i yi
x y
b2 x2i x x x 2i i
2
1i 2i 2i
Tabel 4. Calcule pentru completare matrici

Nr. de Supr. Cifra de


familii comercial afaceri x1i2 x1i x2i x2i2 x1i yi x2i yi
Nr.crt. (sute) (zeci m2) (mil. lei)
1 70 21 198 4900 1470 441 13860 4158
2 35 26 209 1225 910 676 7315 5434
3 55 14 197 3025 770 196 10835 2758
4 25 10 156 625 250 100 3900 1560
5 28 12 85 784 336 144 2380 1020
6 43 20 187 1849 860 400 8041 3740
7 15 5 43 225 75 25 645 215
8 33 28 211 1089 924 784 6963 5908
9 23 9 120 529 207 81 2760 1080
10 4 6 62 16 24 36 248 372
11 45 10 176 2025 450 100 7920 1760
12 20 8 117 400 160 64 2340 936
13 56 36 273 3136 2016 1296 15288 9828
Total 452 205 2034 19828 8452 4343 82495 38769
1

b0 13 452 205 2034


B b1 452 19828 8452 82495
38769
b2 205 8452 4343

b0 0.4015 0,0063 0,0067 2034




B b1 0,0063 0,0004 0,0005 82495
38769
b2 0,0067 0,0005 0,0015

b0 37,502


B b1 1,4963

b2 4, 2446
yi 37,5023 1,4963x1i 4,2446 x2i

b0 Termenul liber nu are interpretare economic.

b1 La creterea cu 100 a numrului de familii, suprafaa comercial


constant, cifra de afaceri crete cu 1,4963 mil lei.

b2 La creterea cu 10 mp a suprafeei comerciale, numrul de familii


constant, cifra de afaceri crete cu 4,2446 mil lei.
c.2)- ESTIMAREA PARAMETRILOR PRIN INTERVAL
DE NCREDERE

b j t critic sb j b j t critic sb
j j

t critic t / 2 ;nk

sb se aij unde: aij = elementul (j+1) situat pe diagonala


j principal a matricei inverse (XX)-1

2
se
t
e

SSE
MSE
unde: k reprezint numrul parametrilor, iar
nk nk (n-k) reprezint numrul gradelor de libertate.
Tabel 4. Calcule pentru intervalele de ncredere ale parametrilor

Nr. de Supr. Cifra de


2
Nr. familii comercial afaceri y i et et ( yi y ) 2
crt. (sute) (zeci m2) (mil. lei)
1 70 21 198 231.38 -33.38 1114.19 1725.444

2 35 26 209 200.23 8.77 76.87 2760.29


3 55 14 197 179.22 17.78 316.03 1643.367
4 25 10 156 117.36 38.64 1493.38 0.213018
5 28 12 85 130.33 -45.33 2055.16 5106.751

6 43 20 187 186.74 0.26 0.07 932.5976


7 15 5 43 81.17 -38.17 1456.93 12873.52
8 33 28 211 205.73 5.27 27.78 2974.444
9 23 9 120 110.12 9.88 97.64 1329.444
10 4 6 62 68.96 -6.96 48.37 8922.982
11 45 10 176 147.28 28.72 824.75 381.7515
12 20 8 117 101.39 15.61 243.83 1557.213
13 56 36 273 274.10 -1.10 1.21 13581.21
Total 452 205 2034 2034.00 0.00 7756.21 53789.23
c.2)- ESTIMAREA PARAMETRULUI 0 PRIN
INTERVAL DE NCREDERE (idem pentru ceilali 2
parametri): 0.4015 0,0063 0,0067
b0 2034

B b1 0,0063 0,0004 0,0005 82495
y i 37,5023 1,4963x1i 4,2446 x2i
b2 0,0067 0,0005 0,0015 38769
matricea invers (XX)-1
t critic t / 2 ;nk t 0,05;133 2,228

2
se
t
e

7756,21
775,61 27,85
nk 13 3

sb se aij 27,85 0,4015 17,647


0

37,5023 2,228 17,647 0 37,5023 2,228 17,647

0 1,8157;76,8203
d.1)- TESTAREA SEMNIFICAIEI CORELAIEI
(TESTUL F)

Verificarea semnificaiei modelului econometric multifactorial se face cu ajutorul metodei


analizei dispersionale sau a variaiei (ANOVA) i a testului Fisher-Snedecor (F).
Ipoteze:
toi coeficienii de regresie egali cu 0
H0 :
=> R2 nesemnificativ, cele dou dispersii sunt aproximativ egale
(SSR=SSE), respectiv influena variabilelor exogene X nu este diferit de cea a factorilor
ntmpltori, deci modelul nu poate fi validat;

cel puin un coeficient de regresie diferit de 0


H0 :
=> R2 semnificativ, influena variabilelor exogene X i a factorilor
ntmpltori msurat prin cele dou dispersii difer semnificativ i, deci, modelul poate
fi validat.
Testul F:
MSR SSR SSE y y y y
2 2

F : : i i i

MSE k 1 n k k 1 nk

MSR R2 n k
Fcal
MSE 1 R k 1
2

Regiunea critic:
Dac Fcalc F,k-1,n-k, atunci se accept H0 i deci modelul nu este
semnificativ statistic;
Dac Fcalc> F,k-1,n-k, atunci se respinge H0 i se accept H1, deci
modelul este semnificativ statistic (valid).
SST SSR SSE

Din Tabel 4 rezult: SST 53789.23 SSE 7756.21 iar

SSR SST SSR 46033,02


SSR 46033,02
R
2
0,8558
SST 53789,23

Testul F:
MSR 46033,02 7756,21
F : 29,6749
MSE 3 1 13 3

Se respinge H0 i se accept H1, deci


Fcritic F0, 05;31;133 4,1028 modelul este semnificativ statistic (valid).
d.2)- TESTAREA PARAMETRILOR UNUI MODEL DE
REGRESIE

H0 : j 0 ;
Ipoteze
H1 : j 0, j 1, k .

Testul t pentru eantioane de volum mic

b j 0
tb , n 30
j
sb j

Regiunea critic: tb t 2;n k


j
d.2)- TESTAREA PARAMETRULUI 0 (idem pentru ceilali
2 parametri)

Ipoteze H 0 : 0 0 ;
H1 : 0 0,

Testul t pentru eantioane de volum mic

b0 0 37,5023
tb 2,125
0
sb 0 17,647

t critic t / 2 ;nk t 0,05;133 2,228

Se accept H0 i se respinge H1, deci


parametrul 0 nu este semnificativ
diferit de 0.
SUMMARY OUTPUT

Regression Statistics
Multiple R 0.925097
R Square 0.855804
Adjusted R
Square 0.826964
Standard Error 27.84998
Observations 13

ANOVA

df SS MS F Significance F
Regression 2 46033.02 23016.5083 29.67493 6.23E-05
Residual 10 7756.214 775.6214162
Total 12 53789.23

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept 37.5023 17.64612 2.12524322 0.059496 -1.81571 76.82031
Nr. de familii
(sute) 1.496288 0.553386 2.703875699 0.022165 0.263266 2.729309
Supr. comercial
(zeci m2) 4.244624 1.065 3.985563515 0.002578 1.871657 6.617592
RESIDUAL OUTPUT

Predicted Cifra de
Observation afaceri (mil. lei) Residuals
1 231.38 -33.38
2 200.23 8.77
3 179.22 17.78
4 117.36 38.64
5 130.33 -45.33
6 186.74 0.26
7 81.17 -38.17
8 205.73 5.27
9 110.12 9.88
10 68.96 -6.96
11 147.28 28.72
12 101.39 15.61
13 274.10 -1.10

S-ar putea să vă placă și