Sunteți pe pagina 1din 8

Caraman Mariana, CON-191

NR Y X1 X2 X3 X4
1 20,4 86,9 21,1 96 98
2 21,6 92 25,3 97 100
3 22,4 103,9 29,1 100 101
4 23,4 109,3 33 98 101
5 24,2 121,7 38 104 104
6 26,2 135 44 105 105
7 27,8 152,2 48 109 108
8 29,9 165,81 53 116 113
9 31,3 178,2 55 116 115
10 32,8 188,7 57 116 115
TOTAL 260 1333,71 403,5 1057 1060

1. Testul Klein
Modelul regresiei:
y=𝑎0 + 𝑎1𝑥1 + 𝑎2𝑥2 + 𝑎3𝑥3 + 𝑎4𝑥4 + 𝜀
în urma estimării obţinem:
𝑦̂ = −2.529566 + 0.097017𝑥1 + 0.015012𝑥2 − 0.199241𝑥3 + 0.340042𝑥4
𝑁 = 10;
𝑅2 = 0.998011

Calculul coeficienţilor de corelaţie simplă între variabilele independente:


n∗∑ x i x j−∑ xi∗∑ x j
r= 2 2 2 2
√ [ n∗∑ x −( ∑ x ) ][ n∗∑ x −(∑ x ) ]
i i j j
Calculele coeficienţilor de corelaţie simplă (în excel):
10∗58006,61−(1333,71∗403,5)
rx x = =0,9883
1 2

√[ 10∗189813,9261−( 1333,71 )2 ]∗[10∗17788,11−( 403,5 )2 ]


10∗143583,76−(1333,71∗1057)
rx x = =0,9803
2 2
1 3

√[ 10∗189813,9261−( 1333,71 ) ]∗[10∗112319−( 1057 ) ]

10∗143448,83−(1333,71∗1060)
rx x = =0,9876
1 4

√ [ 10∗189813,9261−( 1333,71 )2 ] [10∗112730−( 1060 )2 ]

10∗43567,7−( 403,5∗1057 )
rx x = =0,9699
2 3

√[ 10∗17788,11− ( 403,5 )2 ]∗[ 10∗112319−( 1057 )2 ]


Caraman Mariana, CON-191

10∗43494,9−(403,5∗1060)
rx x = =0,9694
2 4

√ [ 10∗17788,11−( 403,5 )2 ]∗[10∗112730−( 1060 )2 ]


10∗112507−(1057∗1060)
rx x = =0,9917
2 2
3 4

√ [ 10∗112319−( 1057 ) ]∗[10∗112730−( 1060 ) ]


În urma analizei datelor observăm ca R2 > r x x , deci putem presupune că nu e prezentă i j

multicolinearitatea, însă toţi coeficienţii de coliniaritate simplă au valori mari, de unde putem spune că e
prezentă o legătură între variabilele explicative.

2. Testul Farrar-Glauber
Determinarea determinantul D al matricei coeficienţilor de corelaţie între variabilele explicative ale
modelului.

1 rx
rx x rx x
1 x2 1 0,9883 0,9803 0,9876
1 3 1 4

rx x 1
2 1
rx x rx x 0,98831 0,9699 0,9694
2 3 2 4

D= ( rx x rx x
3 1
1 rx x ) = ¿
3 2
1 0,9917 ) = 0,73737*10−5
3 4

rx x rx x rx x 1
4 1 4
0,9876 0,9694 0,9917
2 4 3
1

Ipoteza:

H 0: D=1 (seriile sunt ortogonale)-[n-1-(1/6)(2K+5)*Ln D

H 1:D<1(seriile sunt dependente)

Calculul valoarii empirice a lui X 2 :

1
X 2 = − [𝑛 − 1 − ∗ (2𝐾 + 5) ∗ 𝐿𝑛𝐷]
6

1
X 2 = − [10 − 1 − ∗ (2*5 + 5) ∗(-11,81)]= 76,765
6

Valoarea tabulară a X 2 fiind cu 0,5K(k-1) grade de libertate; X 2 = 18,31

Concluzie

În urma analizei datelor obţinute, observăm ca X 2 > X tab 2, deci ipoteza nula se respinge, şi presupunem că
se acceptă ipoteza alternativă, seriile sunt independente.

1. Modelul regresiilor posibile


Caraman Mariana, CON-191

Vom estima toate combinaţiile posibile de variabile independete (2k-1), unde k este numărul de variabile
explicative candidate şi modelul reţinut este modelul pentru care R2este maxim. În cazul nostru, sunt 4
variabile explicative, deci k=4 si avem (24-1)=15 ecuatii posibile. Calculăm variabila y şi variabilele
explicative x 1, x 2, x 3, x 4 , rezultatele introducându-se în tabel. Pentru a putea efectua selectarea variabilei
explicative, este necesar de efectuat câteva calcule şi anume vom calcula valoarea testului Fisher,
valoarea criteriului Akaike (AIC), Schwarz(SC).

Cu ajutorul programului Eviews 3, obţinem ecuaţia:

𝑦̂ = −2.529566 + 0.097017𝑥1 + 0.015012𝑥2 − 0.199241𝑥3 + 0.340042𝑥4

nr Y X1 X2 X3 X4 ෝ
࢟ ࢟࢏െ ෝ
࢟ (࢟࢏ െ ෝ
࢟ ሻଶ ࢅࡵ െഥ ሺࢅࡵെ
ࢅ ഥሻଶ

1 20,4 86,9 21,1 96 98 20,41 -0,01 0,00022334 -5,6 31,36
2 21,6 92 25,3 97 100 21,45 0,15 0,02142576 -4,4 19,36
3 22,4 103,9 29,1 100 101 22,41 -0,01 5,6123E-05 -3,6 12,96
4 23,4 109,3 33 98 101 23,39 0,01 0,00013428 -2,6 6,76
5 24,2 121,7 38 104 104 24,49 -0,29 0,08477583 -1,8 3,24
6 26,2 135 44 105 105 26,01 0,19 0,03520802 0,2 0,04
7 27,8 152,2 48 109 108 27,96 -0,16 0,02698279 1,8 3,24
8 29,9 165,81 53 116 113 29,67 0,23 0,05510814 3,9 15,21
9 31,3 178,2 55 116 115 31,58 -0,28 0,07694932 5,3 28,09
10 32,8 188,7 57 116 115 32,63 0,17 0,03024124 6,8 46,24
total 260 1333,71 403,5 1057 1060 260,0010081 -0,00100807 0,33110485 0,00 166,50

Calculul raportului de determinatie R2

R2=1−∑ ¿ ¿ ¿

Testarea modelului în baza testului Fisher:

a) Determinarea valorii calculate a testului Fisher:


R2
k 0,2495
F calc= = =24,95
( 1−R )∗(n−k−1) 0,01
2

b) Determinarea valorii tabelare


F ak−1; n−k =F 0,05
4 ;5 =5,19
Caraman Mariana, CON-191

Concluzie

În urma analizei datelor obținute, observăm că 𝐹𝑐𝑎𝑙𝑐 > 𝐹𝑡𝑎𝑏, deci putem presupune că modelul este
semnificativ.

Calcularea valorii criteriului Akaike(AIC), Schwarz(SC)

AIC=ln ¿ ¿

SC=ln ¿ ¿

Datele corelate le introducem în urmatorul tabel:

Nr. Ecuația R2 VIF AIC SC


or
d
1 Y =10,28337+ 0,117841∗x1 0,9954 217,39 0,65 0,71
26,56585 41,94213
2 Y =12,81068+ 0,326873∗x 2 0,9669 30,21 2,63 2,69
14,22626 15,30956
3 Y =−28,58468+0,516411∗x3 0,9515 20,62 3,02 3,08
-6,547562 12,53628
4 Y =−44,30378+0 , 663243∗x 4 0,9775 44,44 2,25 2,31
-11,73883 18,65850
5 Y =10,03101+0,131506∗x 1−0,038912∗x2 0,9957 232,56 0,77 0,87
0,528675 0,019002 0,053479
6 Y =13,06123+ 0,125781∗x 1−0,036298∗x3 0,9956 227,27 0,81 0,90
2,543744 8,429063 -0,542697
7 Y =2,868729+ 0,102271∗x 1+ 0,089541∗x 4 0,9959 243,90 0,75 0,84
0,334070 5,607203 0,864358
8 Y =−2,909516+0 , 208856∗x 2 +0 , 193777∗x3 0,9749 39,84 2,56 2,65
-0,274472 2,553610 1,487645
9 Y =−21,36773+0,137311∗x2 +0,394597∗x 4 0,9877 81,30 1,84 1,93
-2,155529 2,425472 3,453870
10 Y =−48,86173−0,165646∗x 3 +0,871420∗x 4 0,9791 47,85 2,38 2,47
-6,660217 -0,732654 3,041702
11 Y =12,69072+0,138745∗x 1−0,037930∗x2 −0,034671∗x 3 0,9959 243,90 0,93 1,06
2,359620 5,587770 -0,669626 -0,497226
12 Y =3,974085+ 0,114955∗x1 −0,028409∗x 2 +0,073967∗x 4 0,9960 250,00 0,91 1,03
0,423976 3,551779 -0,488491 0,647308
13 Y =−25,21028+0,163781∗x 2−0,300337∗x 3 +0,720258∗x 4 0,9926 135,13 1,53 1,65
-2,960374 3,329282 -1,998644 3,812461
14 Y =−1,682233+ 0,103640∗x 1−0,188346∗x 3 +0,318565∗x 4 0,9979 476,19 0,24 0,36
-0,248077 7,470274 -2,473386 2,620971
15 Y =−2,529566+0 , 097017∗x1 +0,015012∗x2 −0 ,199241∗x3 + 0 ,34 0042∗x
0,9980 4 500,00 0,42 0,58
-0,321405 3,663736 0,304089 -2,211651 2,272306
Caraman Mariana, CON-191

Concluzie

Conform acestei metode are loc selectarea acelei variante în care 𝑅2 este maxim. Comparând toate
variantele observăm că cea mai mare valoare a coeficientului de determinație îi aparține modelului Nr.
15; deci aceasta varianta va fi aleasă ca cea mai optimă metodă.

2. Metoda eliminării regresive(Backward Elimination)

Această metodă constă în efectuarea unei regresii complete cu toate cele 4 variabile explicative. Se
elimină acea variabilă căreia îi corespunde o valoare t-Student sub nivelul critic acceptat, 𝑡0,05 ⇒ 𝑡0,05 =
𝑛−2 8
2,306, apoi reestimăm regresia cu 3 variabile. Continuăm procedeul prin eliminare până obținem o
ecuație satisfăcătoare.În primul caz, am efectuat analiza regresiei complete, deci comparăm
valorile obținute, pentru a putea deduce o concluzie.
Y =−2,529566+0,097017∗x1 +0,015012∗x 2−0,199241∗x 3 +0,340042∗x 4

t-Student -0,321405 3,663736 0,304089 -2,211651 2,272306


Observăm că majoritate valorilor sunt mai mici decât nivelul critic, deci se întocmește ecuația cu
3 variabile

Y =12,69072+0,138745∗x 1−0,037930∗x2 −0,034671∗x 3

2,359620 5,587770 -0,669626 -0,497226


Observăm că valorile sunt mai mici decât nivelul critic, deci în continuare eliminăm și comparăm
valorile în baza tabelului de mai sus.

Concluzie

Observăm că modelul Nr 1 și Nr2, majoritatea valorilor sunt mai mari decât nivelul critic, deci toate
variabilele sunt semnificative.

Y =10,28337+ 0,117841∗x1

t-st 26,56585 41,94213

Y =12,81068+ 0,326873∗x 2

t-st 14,22626 15,3095

3. Metoda eliminării progresive în aval (Forward regression)

Această metodă conține doar o singură variabilă explicativă, a cărui coeficient de corelație este cea mai
mare cu variabila Y. Dar în același timp ea trebuie să fie mai mică decit nivelul critic.

Determinarea coeficientului de corelatie:


Caraman Mariana, CON-191

n∗∑ x i y i−∑ x i∗∑ y i


r y x1= 2 2 2 2
√ [ n∗∑ x −(∑ x ) ][ n∗∑ y −(∑ y ) ]
i i i ❑

nr Y X1 X2 X3 X4 ࢅ૛ X1*Y X2*Y X3*Y X4*Y


1 20,4 86,9 21,1 96 98 416,16 1772,76 430,44 1958,4 1999,2
2 21,6 92 25,3 97 100 466,56 1987,2 546,48 2095,2 2160
3 22,4 103,9 29,1 100 101 501,76 2327,36 651,84 2240 2262,4
4 23,4 109,3 33 98 101 547,56 2557,62 772,2 2293,2 2363,4
5 24,2 121,7 38 104 104 585,64 2945,14 919,6 2516,8 2516,8
6 26,2 135 44 105 105 686,44 3537 1152,8 2751 2751
7 27,8 152,2 48 109 108 772,84 4231,16 1334,4 3030,2 3002,4
8 29,9 165,81 53 116 113 894,01 4957,719 1584,7 3468,4 3378,7
9 31,3 178,2 55 116 115 979,69 5577,66 1721,5 3630,8 3599,5
10 32,8 188,7 57 116 115 1075,84 6189,36 1869,6 3804,8 3772
total 260 1333,71 403,5 1057 1060 6926,5 36082,979 10983,56 27788,8 27805,4

10∗36082,979−1333,71∗260
r y x1= =0,9982
2 2
√ [ 10∗189813,9261−(1333,71) ][ 10∗6926,5−(260) ]
10∗10983,56−403,5∗260
r yx 2 = =0,9833
√ [ 10∗17788,11−( 403,5 )2 ][ 10∗6926,5− ( 260 )2 ]
10∗27788,8−1057∗260
r yx 3 = =0,9754
2 2
√ [ 10∗112319− (1057 ) ][ 10∗6926,5− (260 ) ]
10∗27805,4−1060∗260
r yx 4= =0,9887
√ [10∗112730−( 1060 )2 ] [ 10∗6926,5−( 260 )2 ]
Din toate variabilele propuse selectăm acea variabilă a cărei valoare este inferioară nivelului critic.
Selectăm variabilele explicative x1x2, Nr 5, deoarece în cazul dat variabilele sunt inferioare nivelului
critic așteptat.

4. Metoda regresiei pas cu pas(Stepwise Regression)

Această metodă se aseamănă cu metoda precedentă doar că se deosebește prin faptul că în urma
incorporării unei noi variabile explicative,se analizează testul t-Student al fiecărei variabile și se elimină
acea a caror valoare este inferioară valorii acceptate.

Ca urmare a estimării modelului cu o singură variabilă explicativă, s-a ales variabilele X1 și X2 deoarece
acestea satisfac toate condițiile necesare, 41,94213> 2,306 astfel și 15,3095>2,306

r yx 1=0,9982

r yx 2 =0,9833

r yx 3 =0,975 4

r yx 4=0,988 7
Caraman Mariana, CON-191

Odata ce efectuăm estimarea după doua variabile explicative obținem:

r x x =0,988 3 r x x =0,9699
1 2 2 3

r x x =0,980 3 r x x =0,969 4
1 3 2 4

r x x =0,987 6
1 4

Din toate selectăm variabilele X1 și X2, dar odata ce valorile lor t-Student sunt inferioare nivelului critic
acceptat, deci ele nu pot fi selectate

Concluzie
În baza acestei metode, variabila explicativă, care satisface toate condițiile necesare este X1și X2, Nr.1 și
Nr.2

5. Metoda regresiei etapizate(Stagewise Regression)


Etapa 1
Selectăm din rezultatele anteriore calculate variabila explicativă cu cel mai înalt coeficient de corelație
simplă cu variabila Y, avem urmatoarele rezultate :
r yx 1=0,9982

r yx 2 =0,9833

r yx 3 =0,975 4

r yx 4=0,988 7

Cel mai înalt coeficient de corelație simplă cu variabila Y, este 𝑟𝑦𝑥1 = 0,9982 deci selectăm variabila
explicativă X1

Etapa 2
Calculăm rezidiul corespunzător regresiei Y asupra variabilei explicative
X1: 𝑒 = 𝑦 − 𝑎̂0 − 𝑎̂1𝑥1 ⇔ 𝑒 = 𝑦 −10,28337 − 0,117841 ∗ X1, în rezultat obținem:
Nr e
1 -
0,123752
9
2 0,475258
3 -
0,127049
9
4 0,236608
7
5 -
Caraman Mariana, CON-191

0,424619
7
6 0,008095
7 -
0,418770
2
8 0,077413
79
9 0,017363
8
10 0,280033
3
Tot 0,000579
al 89

Etapa 3
Determinăm coeficienții de corelație simplă r, între rezidiu e și fiecare dintre variabilele explicative,
selectăm acea variabilă a carei coeficient este cel mai mare, calculele le efectuăm conform demonstrațiilor
anterioare sau cu ajutorul programului Eviews 3, în rezultat obținem:
𝑟𝑒𝑥1 = 0,306 𝑟𝑒𝑥2 = 0,828 𝑟𝑒𝑥3 = 1,004 𝑟𝑒𝑥4 = 0,683

Concluzie

În urma analizei și calculelor efectuate am observat că în cele mai dese cazuri, variabilele
explicative X1 și X2, corespund tuturor cerințelor necesare, deci putem spune că variabila
explicativă X1 și X2, explică cel mai bine variabila dependenta Y.