Explorați Cărți electronice
Categorii
Explorați Cărți audio
Categorii
Explorați Reviste
Categorii
Explorați Documente
Categorii
Nr. Observ. Y
X1 X2 X3
1. 27,9 2 47,5 77
2. 29,9 1 45,5 88
3. 25,9 3 45,5 110
4. 31,9 6 49,5 101
5. 29,9 7 44,5 85
6. 34,9 8 43,5 112
7. 36,9 8 34,5 88
8. 34,9 5 35,5 103
9. 36,9 5 43,5 84
10. 31,9 8 40,5 119
11. 34,9 4 34,5 117
12. 36,9 9 33,5 128
13. 40,9 12 37,5 130
14. 36,9 7 31,5 136
Total 470,6 85 567 1478
1
9. De determinat, dacă adăugarea variabilelor explicative X 1 şi X 2 , ameliorează semnificativ
calitatea estimaţiei în raport cu X 1 .
10. De determinat, dacă coeficienţii sunt semnificativ diferiţi de 0, iar regresia, global
semnificativă.
11. De calculat previziunea şi intervalul de încredere, pentru următoarele 2 perioade, dacă se
X 1 (15 )=3 X 2 (16)=6
X 2 (15)=24 X 2 (16)=38
cunosc datele: X 3 (15)=165 X 3 (16)=170
În cazul dat avem un model liniar general de regresie multiplă, deoarece în baza datelor prezentate
în tabelul 1, observăm că variabila dependentă (y), este explicată de trei variabile independente (
x 1 , x 2 , x 3 ).
Pentru a demonstra că există o legătură între variabile, este necesar să construim norul de puncte,
în ur,a căruia se va observa grafic tipul de legătură şi intensitatea acerstei legături. Norul de puncte
îl construim cu ejutorul pachetului de programe Eviews.
2
Concluzie: Analizînd graficul obţinut, observăm că în mare majoritate punctele tind spre o linie
dreaptă, cu panta pozitivă, ceea ce semnifică faptul că între variabila independentă x 1 şi y, există
o legătură directă, adică la creşterea variabilei x 1 , creşte şi variabila y şi invers.
Concluzie: Analizînd graficul obţinut, observăm că în mare majoritate punctele tind spre o linie
dreaptă, cu o pantă negativă , ceea ce semnifică faptul că între variabila independentă x 2 şi y,
există o legătură inversă, adică la creşterea variabilei x 2 , scade valoarea variabilei y şi invers.
3
Concluzie: Analizând graficul obţinut, observăm că în mare majoritate la fel, punctele, ca în
celelalte cazuri, tind spre o linie dreaptă, cu panta pozitivă, ceea ce semnifică faptul că între
variabila independentă x 3 şi y, există o legătură directă, adică la creşterea variabilei x 3 , creşte şi
variabila y şi invers.
2. În cerinţa precedentă, modelul este scris într-o formă practică, însă în formă matricială modelul
va fi în felul următor:
Y= ; ;X= ;
Pentru soluţionarea modelului este nevoie de estimat vectorul compus din parametrii a0 , a1 , a2 , a3 .
În scopul estimării acestui vector, aplicăm Metoda Celor Mai Mici Pătrate (MCMMP), care constă
în a minimiza suma pătratelor erorilor, adică:
n
min ∑ ε 2i =min ε ' ε=min(Y − Xa)' (Y − Xa)=min S=min(Y ' Y −Y ' Xa−a' X ' Y +a' X ' Xa )=
a i=1
¿ min (Y ' Y −2 a' X ' Y +a' X ' Xa) Pentru a
minimiza această funcţie în raport cu a , este necesar să calculăm diferenţiala lui S în raport cu
¿
a , în urma acestui raport obţinem relaţia cu ajutorul căreia vom calcula valoare estimatorului a
:
∂S ¿ ¿ ¿
=−2 X ' Y +2 X ' X a ⇔ X ' X a =X ' Y ⇔( X ' X )−1 ( X ' X )a =( X ' X )−1 ( X ' Y )⇒
∂a
¿
⇒ a=( X ' X )−1 ( X ' Y )
'
Această soluţie este posibilă dacă matricea pătrată ( X X ) , de dimensiunea (4;4), în cazul nostru
este inversabilă. Aceste condiţii le vom rezolva cu ajutorul pachetului de programe Eviews 3.
Pentru aceasta este nevoie să efectuăm cîţiva paşi:
1) Introducem datele noastre în Eviews 3.
2) Apoi introducem comanda: „genr unu =1”, adică generăm un nou vector.
3) Deschidem, noul vector generat, X 1 , X 2 , X 3 , în grup.
14 85 567 1478
85 631 3338.5 9392
567 3338.5 23413.5 58970
1478 9392 58970 160782
6
6) Cu ajutorul comenzilor: „matrix XINV=@inverse(XPX)”,
„matrix XTY=XTR*(@convert(Y))”, “matrix a=XINV*XTY
' −1
”, obţinem matricile, ( X X ) , X Y :
'
- - -
15.29547630 0.029288686 0.215219196 0.059957947
547996 00857059 1629948 05113186
- -
0.029288686 0.013204897 0.001194401 0.000940189
00857256 32594191 548281193 6796079049
-
0.215219196 0.001194401 0.003635042 0.000575423
1629952 548281166 345026458 2781109819
- -
0.059957947 0.000940189 0.000575423 0.000401260
0511316 6796079132 2781109765 0695491146
7
XTY X INV
470.6
2973.5
18837.3
50180.2
A
48.11090301599552
0.8019006878307592
-0.3813623642598678
-0.03713243582827985
Dependent Variable: Y
Method: Least Squares
Date: 11/12/20 Time: 14:56
Sample: 1 14
Included observations: 14
9
R-squared 0.702687 Mean dependent var 33.61429
Adjusted R-squared 0.613493 S.D. dependent var 4.177385
S.E. of regression 2.597069 Akaike info criterion 4.981600
Sum squared resid 67.44767 Schwarz criterion 5.164188
Log likelihood -30.87120 Hannan-Quinn criter. 4.964698
F-statistic 7.878181 Durbin-Watson stat 3.186886
Prob(F-statistic) 0.005452
()
a3
¿
a = a2 =( X ' X )−1 ( X ' Y )
¿
¿
' −1 '
Pentru a afla valoarea vectorului a , este necesar să calculăm valoarea ( X X ) ( X Y )
formulei date. Este nevoie să calculăm matricea:
X1X1
*Y
116
Y
.29
222
( ) Y 2 YY
'
0 .01320 0 . 00119 −0 . 00094 X X X2* 498
( X ' X )−1=
0 . 00119 0 . 00363 0 . 00057
X3X
3
* YY
.29
−0 .00094 0 .00057 0 . 00040 ;
¿
Avînd rezultatele putem afla valoarea vactorului a , introducem datele obţinute în formulă:
11
¿
a1
¿
()
¿
a = a2 =( X ' X )−1 ( X ' Y )
¿
a3
,
Obţinem valorile estimatorilor a1 ,a 2 ,a3
¿
a=
( 0.00119 0.00363 0.00057
−0.00094 0.00057 0.00040
)
0.01320 0.00119 −0.00094 ∗¿ ¿
¿¿ ( 0.801901
−0.381362
−0.037132
Avînd aceste valori putem calcula valoarea termanului liber, în baza relaţiei:
)
¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿ ¿
Y =a0 +a1 X 1 −a2 X 2 −a3 X 3 ⇒a 0 =Y −a 1 X 1 −a2 X 2−a3 X 3 ⇒ a0 =31 . 11−(0 .801901∗6 .07 )−
¿ ¿
−(−0 . 381362∗38 )−(−0 . 037132∗105 .57 )⇒ a 0=31 . 11−4 . 8675+14 . 4918+3 . 92⇒ a0 =44 .65750
Înlocuind valorile estimatorilor calculaţi obţinem modelul:
¿
Y =44 . 65750+0 .801901∗X 1 −0 . 381362∗X 2 −0 . 037132∗X 3
Estimatorul a1 :
La creşterea variabilei independente X 1 , cu o unitate, are drept efect creşterea valorii
variabilei dependente Y cu 0.801901 (u.m).
¿
Estimatorul a2 :
La creşterea variabilei independente X 2 , cu o unitate, are drept efect scăderea valorii
variabilei dependente Y cu 0.381362 (u.m), deoarece are valoare negativă.
¿
Estimatorul a3 :
La creşterea variabilei independente X 3 , cu o unitate, are drept efect scăderea valorii
variabilei dependente Y cu 0.037132 (u.m), deoarece are valoare negativă.
12
Datele care au fost utilizate la calcularea matricei sunt intoduse în Tabelul 3, la calcularea acestor matrice folosim
şi datele anterioare, obţinute cu ajutorul pachetului de programe Eviews 3.
Tabelul 3
Pentru a calcula varianţa erorilor avem evoie de un şir de date, pe care le găsim în
Tabelul 4.
Tabelul 4
Nr. (Yi Y ) (Yi Y ) 2
(Yi Y ) (Yi Y ) 2
Y Y
Observ. (e ) (e 2 )
1. 27,9 -5,7 32,7 28,74084 -0,8 0,7
2. 29,9 -3,7 13,8 28,29321 1,6 2,6
3. 25,9 -7,7 59,5 29,08011 -3,2 10,1
4. 31,9 -1,7 2,9 30,29456 1,6 2,6
5. 29,9 -3,7 13,8 33,59738 -3,7 13,7
6. 34,9 1,3 1,7 33,77808 1,1 1,3
7. 36,9 3,3 10,8 38,1015 -1,2 1,4
8. 34,9 1,3 1,7 34,75746 0,1 0,0
9. 36,9 3,3 10,8 32,41207 4,5 20,1
10. 31,9 -1,7 2,9 34,66224 -2,8 7,6
11. 34,9 1,3 1,7 33,81707 1,1 1,2
12. 36,9 3,3 10,8 37,79949 -0,9 0,8
13. 40,9 7,3 53,1 38,60548 2,3 5,3
14. 36,9 3,3 10,8 36,66135 0,2 0,1
Total 470,6 0,0 226,9 470,6 0,0 67,4
Având toate datele necesare, putem calcula varianţa erorilor:
∧
67,4 67,4
σ 2e = = =6,7 4
14−3−1 10
(−0.029289 0.013205
−0.215219 0.001194
0.001194 −0.00094 0 =¿
0.003635
−0.059958 −0.00094 0 0.000576
357,9141 −0 , 68536 −5,03613 −1,40302
0.000575
0.000401
)
(
¿
−0,68536 0 ,308995 0.0 27949 −0 ,02200
−5,03613 0 , 027949 0 , 08506 0 ,013465
−1,40302 −0,022 0 , 013465 0 ,009389
)
Dispersiile coeficienţilor de regresie, le găsim pe diagonala principală a matricei
varianţelor şi covarianţelor, iar radicalul dispersiilor sunt abaterile standard.
∧ ∧
σ 2 =96.0629 ⇒ σ a =√ 357,9141=18,91
∧
0
a0
∧ ∧
σ 2 =0.0890 ⇒σ a =√ 0,308995=0,555
∧
1
a1
∧ ∧
σ 2 =0.0245 ⇒σ a =√ 0.0 8506=0,29165
∧
2
a2
∧ ∧
σ 2 =0.0027 ⇒σ a =√ 0.0 09389=0 ,09689
∧
3
a3
0 1 2
∧
σ =0,09689.
2
∧
a3
2
5. Calculăm coeficientul de determinaţie, R şi coeficientul de determinaţie „corectat”,
R2 .
2
Coeficientul de determinaţie, R , îl calculăm conform formulei:
∧ 2
R2=1−
∑e 2
=1−
∑ (Y −Y ) =1−234,4 =0.7027=70.27 %
i
2
∑ ( Y i−Y ) ∑ ( Y i −Y )2 48,3
2
Concluzie: Coeficientul de determinaţie are valoarea R =70 .27 % , ceea ce exprimă
faptul că 70% din variaţia lui Y, se datorează variaţiei variabilelor independente,
X1, X2 , X3 .
n−1 14−1
R2 =1− ∗( 1−R2 )=1− ∗( 1−0 .7027 )=1−0. 3861=0. 6139
n−k−1 14−3−1
2
Concluzie: Coeficientul de determinaţie „corectat” are valoarea R =0 .6139 ,
observăm că are o valoare mai mică, din cauză că a foet corectat cu gradul de libertate.
Acest coeficient se calculează pentru a ţine cont de numărul relativ slab de observări,
comparat cu numărul de factori explicativi.
Formulăm ipotezele:
a1 a1
= 1 ≠ 1
H0: ( )(
a2 −0 . 5 ) H0: ( )( )
a2 −0 . 5
q
( ) ( )
a q −a q Ω aq −aq ¿ F α ( q , n−k−1 )
aq
¿
−1
α
Unde, F ( q , n−k−1 ) este legea Fisher, la pragul de semnificaţie α şi q,n−k−1 ,
grade de libertate. Pentru că avem de testat doi parametri rezultă că, q=2 ,
aq = 0. 8019
¿
( ) ¿ ¿
−0 . 38136 , adică valorile estimatorilor a1 , a 2 , calculate anterior şi
a =( 1 )
q
−0 . 5 .
¿
Ω−1 ¿
1) Formulăm ipotezele:
H 0 :a1 =1 H 1 :a1 ≠1
1
3) Determinăm valoarea tabelară a testului t-Student, în dependenţă de nivelul de
semnificaţie α=5 %=0 . 05 şi n-1, grade de libertate.
4) Comparăm valorile:
¿
a1 0. 05
t calc ≻t 13 ⇒ 2. 6882≻2. 160
, ceea ce semnifică că se respinge ipoteza nulă şi se
acceptă ipoteza alternativă, adică semnifică faptul că coeficientul a1 , este diferit de 1.
¿
a1 0. 05
Concluzie: În urma calculelor efectuate am obţinut: t calc ≻t 13 ⇒ 2. 6882≻2. 160
, ceea
ce denotă faptul că se respinge ipoteza nulă şi se acceptă ipoteza alternativă, semnifică
faptul, că coeficientul a1 , este diferit de 1.
Efectuăm testarea coeficientului a2 .
1) Formulăm ipotezele:
4) Comparăm valorile:
¿
a1 0. 05
t calc ≺t 13 ⇒−2 . 4368≺2 .160
, ceea ce semnifică că se respinge ipoteza alternativă şi
se acceptă ipoteza nulă, adică semnifică faptul că coeficientul a2 , nu respinge
posibilitatea de-a fi egal cu -0.5.
¿
a1 0. 05
Concluzie: În urma calculelor efectuate am obţinut: t calc ≺t 13 ⇒−2 . 4368≺2 .160
, ceea
ce denotă faptul că se respinge ipoteza alternativă şi se acceptă ipoteza nulă, semnifică
faptul, că coeficientul a2 , nu respinge posibilitatea de-a fi egal cu -0.5. În concluzie
putem menţiona faptul că coeficienţii a1 şi a2 , nu sunt semnificativ diferiţi de 1 şi
-0.5, doar coeficientul a1 , este diferit de 1, pe când coeficientul a2 , nu se respinge
posibilitatea de-a fi egal cu -0.5.
¿ ¿
IC :
[
( n−k −1 )∗σ 2e ( n−k−1 )∗σ 2e
χ 21
;
χ 22 ] , unde
α
(1− )
χ 21 , are (n-k-1), grade de libertate şi 2 , pragul de semnificaţie.
α
χ 22 , (n-k-1), grade de libertate şi 2 , pragul de semnificaţie.
Având toate datele necesare, înlocuim în formulă, obţinem:
erorilor fiind:
[3.2929≤σ ≤20.7730 ]⇒ [ 3.2929≤6.745≤20.7730 ]
2
e , într-adevăr observăm
că valoarea dată este mai mare decât 3.2929 şi mai mică decât 20.7730.
Tabelul 5
2
(Yi Y ) * (X1 X1)
(Yi Y ) (Yi Y )
2
Y (Y i Y ) 2
Nr. Y X1 (Yi Y ) (X1 X1) (X1 X1) ( e) (e 2 )
1 25.4 2 -5.71 -4.07 23.27 16.58 26.9948 -1.5948 2.54 16.93
2 27.4 1 -3.71 -5.07 18.84 25.72 25.983 1.417 2.01 26.29
3 23.4 3 -7.71 -3.07 23.69 9.43 28.0066 -4.6066 21.22 9.63
4 29.4 6 -1.71 -0.07 0.12 0.01 31.042 -1.642 2.70 0.00
5 27.4 7 -3.71 0.93 -3.45 0.86 32.0538 -4.6538 21.66 0.89
6 32.4 8 1.29 1.93 2.48 3.72 33.0656 -0.6656 0.44 3.82
7 34.4 8 3.29 1.93 6.34 3.72 33.0656 1.3344 1.78 3.82
8 32.4 5 1.29 -1.07 -1.38 1.15 30.0302 2.3698 5.62 1.17
9 34.4 5 3.29 -1.07 -3.52 1.15 30.0302 4.3698 19.10 1.17
10 29.4 8 -1.71 1.93 -3.31 3.72 33.0656 -3.6656 13.44 3.82
11 32.4 4 1.29 -2.07 -2.66 4.29 29.0184 3.3816 11.44 4.37
12 34.4 9 3.29 2.93 9.62 8.58 34.0774 0.3226 0.10 8.81
13 38.4 12 7.29 5.93 43.19 35.15 37.1128 1.2872 1.66 36.03
14 34.4 7 3.29 0.93 3.05 0.86 32.0538 2.3462 5.50 0.89
Total 435.6 85 0 0 116.29 114.93 435.5998 0.0002 109.20 117.66
∧
b=
∑ ( Y i−Y )∗( X 1−X 1 ) = 116,29 =1.0118
2
114.93
∑ ( X 1 −X 1 )
¿
Calculăm valoarea estimatorului a , conform formulei:
∧ ∧
a =Y −b∗X 1=33,6−1.0118∗6.0714=27,4569
∧
În rezultat am obţinut, valoarea estimatorului a =27,4569şi valoarea estimatorului
¿
b =1. 0118 .
Pentru a ne convinge de veridicitatea datelor, calculăm cu ajutorul pachetului de
programe Eviews 3, în rezultat obţinem aceleaşi rezultate, cea ce ne demonstrează că
calculele au fost efectuate corect.
Dependent Variable: Y
Method: Least Squares
Date: 11/12/20 Time: 20:30
Sample: 1 14
Included observations: 14
¿ 2 ¿ 2
' 2
SPR =∑ e =∑ Y i−Y ( ) '
SPE =∑ Y i−Y ( )
Având datele necesare, înlocuim în relaţie şi obţinem:
SPE ∧ 2
F calc=
k
=
( )
∑ Y i−Y /k = 226,86/2 = 113,43 =4,84
SPR ∧ 2 234,41/10 23,41
n−k−1 ∑ Y i −Y (
i / ( )
n−k−1 )
F calc ≻ F 0.05
2 ;10 ⇒ 4,84 ≻ 4.103 , ceea ce semnifică că se respinge ipoteza nulă şi se
10. Verificăm dacă coeficienţii sunt semnificativ diferiţi de 0, iar regresia este global
semnificativă. Pentru a verifica această ipoteză, avem nevoie de o variabilă
independentă X, care să influenţeze variabila dependentă, Y, semnificativ.
Trebuie să construim tabelul de analiză al varianţei, deoarece ne permite de-a efectua
testul Fisher.
Tabelul 6
Sursa Suma pătratelor Gradul de Pătrate medii
variaţiei libertate
X1, X 2 , X 3
2 k 3 SPE 159.41
SPE Y Y 159.41
k 3
Rezidiu
2 (n k 1) (14 3 1) 10 SPR 67.45
SPR Yi Y 67.45
( n k 1) 10
Total
SPT Yi Y 2
226.86 n 1 14 1 13
Efectuăm testarea cu ajutorul testului Fisher, toate datele necesare pentru efectuarea
datelor le avem calculate în exerciţiile interioare, deci putem efectua calculul,
parcurgând paşii:
1. Formulăm ipotezele:
F calc=
k
=
∑ Y i (
−Y /k )=
R2 /k
=
0 . 7027/3
=7 . 8855
SPR ¿ 2 2 ( 1−0 . 7027 )
n−k −1
∑ Y i −Y i /( n−k −1 ) 1−R / ( n−k−1 )
( ) ( ) /10
11. Calculăm previziunea şi intervalul de încredere pentru următoarele două perioade, dacă
X 1 (15 )=3 X 2 (16)=6
X 2 (15)=24 X 2 (16)=38
se cunosc datele: X 3 (15)=165 X 3 (16)=170
Pentru a calcula previziunea pentru următoarele două perioade trebuie datele cunoscute
înlocuite în formulă, obţinem valoarea de previziune pentru aceste perioade. Având
toate datele necesare, putem calcula previziunea pentru aceste perioade.
Previziunea pentru aceste perioade o calculăm în baza formulei:
¿
Y i=a0 +a1 X 1 −a 2 X 2 −a3 X 3
Unde:
α 0. 05
t n−k −1 ⇒ t 102 ⇒ t10
2 0. 025
=2 . 764 , în baza testului t-Student.
14 . 24209 −0 . 02630 −0. 20613 −0 .05851
¿
σ 2e =6 . 745
(
( X ' X ) = −0 . 02630 0 . 01320 0 .00119 −0 . 00094
−1
−0 . 20613 0 .00119 0 . 00363 0 . 00057
−0 . 05851 −0 . 00094 0 . 00057 0. 00040
)
Calculăm intervalul de previziune pentru perioada 15, în baza formulei:
[√ (
14.24209 1
)( ) ]
−0.02630 −0.20613 −0.05851
¿ ¿
−0.02630 0.01320 0.00119 −0.00094 3
10 √[
Y 15=Y 15−t 0.025 ∗ σ 2 ' ' −1
]
e∗ X 15 ( X X ) X 15+1 ⇔ Y 15=31.7841−2.764∗¿¿∗ 6.745∗ ( 1 3 24 165 )
−0.20613 0.00119 0.00363 0.00057 24
+1 =
−0.05851 −0.00094 0.00057 0.00040 165
¿31.7841−2.764∗√97.746=31.7841−27.3266=4.4575
¿ ¿
√ [ −1
]
Y 15=Y 15−t 010.025∗ σ 2e∗ X '15 ( X ' X ) X 15+1 ⇔Y 15=31. 7841+27 .3266=59 .1107
[√ (
14.24209 1
)( ) ]
−0.02630 −0.20613 −0.05851
¿ ¿
−0.02630 0.01320 0.00119 −0.00094 6
10 √[
Y 16=Y 16−t0.025∗ σ 2 ' ' −1
]
e∗ X 16 ( X X ) X 16 +1 ⇔ Y 16=28.6651−2.764∗¿¿∗ 6.745∗ ( 1 6 38 170 )
−0.20613 0.00119 0.00363 0.00057 38
+1 =
−0.05851 −0.00094 0.00057 0.00040 170
¿28.6651−2.764∗√ 78.8271=28.6651−24.5401=4.125
¿ ¿
√ [ −1
]
Y 16=Y 16−t 010. 025∗ σ 2e∗ X '16 ( X ' X ) X 16 +1 ⇔Y 16=28.6651+24.5401=53 .2052
Concluzie: În urma calculelor efectuate am obţinut intervalul de previziune, care
este, [ 4 . 125≤Y 16≤53 .2052 ] .