Documente Academic
Documente Profesional
Documente Cultură
Scopul:
1. Estimarea parametrilor modelului.
2. Proprietăţile estimatorilor obţinuţi prin M.C.M.M.P.
3. Testarea validităţii modelului ales. (Cu ajutorul testului Student şi testului Fisher).
4. Calcule de previziune pe baza modelului liniar simplu de regresie de tip clasic.
n n
u / 2 yi xi 0
2
i
i 1 i 1
n n
u / 2 yi xi 0
2
i
i 1 i 1
2
n n
y
i 1
i n x i
i 1
(1)
n n
xi yi ( y x ) xi xi2
i 1 i 1 i 1
1
x i yi xi
yi
n
1
xi2 n ( xi ) 2
Aşa dar, am obţinut pe şi , care sunt estimatorii lui şi .
Condiţia suficientă:
în n perioade de timp sau de n unităţi statistice este yi xi ui , iar funcţia de regresie
y i xi , unde y
i sunt valorile teoretice ale variabilei endogene yi calculate cu
ajutorul funcţiei de regresie, iar ui yi y i - estimaţiile variabilei reziduale.
Vˆ ( ˆ )
ˆ u2
( xi x ) 2
i
ˆ u2 ( 1n x2
) Vˆ (
ˆ)
( xi x ) 2
i
3
1
iar u2 ui2 este un estimator nedeplasat al variaţiei variabilei ui.
n 2 i 1
Covarianţa dintre cei doi estimatori este egală cu:
ˆ)
ˆ ˆ V̂(
ˆ) cov(ˆ ,
.
(
ˆ , ) cov̂(
ˆ,ˆ) V̂()
ˆ
Dacă ipotezele enunţate se verifică, atunci modelului estimat i se pot atribui o serie de
proprietăţi:
1. Media condiţionată a variabilei y în funcţie de variabila exogenă x devine
E(y/x) xi y i
2. Dispersia condiţionată a variabilei y este:
1
( xi x ) 2
2
1
2
y / xi u
n i
( x x ) 2
3. Covarianţa cov(yi,yj)=0 pentru i , j 1, n ; i j.
4. Legea de probabilitate condiţionată a lui y, în funcţie de variabilă exogenă x, este
În cazul când seria de date (xi,yi), i 1, n este obţinută în urma unui sondaj statistic,
0
contra H1 : ipoteza dependenţei liniare specificate.
0
4
Pentru un n mai mic decât 30 de cazuri statistica testului pentru şi
respectiv este:
t calc / ,
u2 1 / n ( x / ( x i x ) 2
t calc / .
u2 / ( x i x)2
Regula de decizie este următoarea:
tcalct,n-2=ttabelat, adică nivelul de referinţă preluat din tabelul repartiţiei Student pentru
riscul erorii () şi (n-2) grade de libertate. Dacă tcalc>ttab ipoteza nulă Ho este respinsă şi se
acceptă ipoteza H1 conform căreea estimaţiile şi diferă semnificativ de zero.
Evident, pentru tcalc<ttab ipoteza nulă, a nesemnificaţiei, este cea admisă, adică x şi y nu
sunt corelate liniar.
3.2. Testul F-Fisher-Snedecor.
Cu ajutorul acestui test are loc verificarea verosimilităţii modelului econometric.
La baza veridicităţii modelului stă principiul analizei dispersionale (varianţelor).
Deoarece avem că u
i
i 0 şi y y
i
i
i
i , de aici rezultă că şi yi y i .
y
y y i y u
2 2
2
i i .
i i i
Dispersie y2 - variaţie valorilor teoretice faţa de medie lor. Dispersie 2u - variaţie reziduală
Rezidiuală VR= ( yi y i ) 2 ˆ ( y i yˆ i ) 2 (n 2)
2
n-2 u
i i
VT= ( y i y ) ˆ y2 ( y i y ) 2 (n 1)
2
Total n-1
i
i
5
Nivelul Fcalc rezultă astfel:
Fcalc
( y i y) 2 (y i y i ) 2
.
1 n2
Amintim că y i sunt valori ajustate, obţinute din model folosind parametrii estimaţi şi
valorile empirice xi.
Modelul este valid dacă valoarea Fcalc este superioară valorii tabelate F;2-1;n-1, respectiv,
este considerat neconcludent (incluzând parametrii nesemnificativi sau o funcţie greşit aleasă)
dacă Fcalc<F; 2-1; n-1, adică x şi y sunt independente.
O formulă alternativă pentru Fcalc, este şi cea definită pe baza coeficientului de
determinaţie R2: Fcalc = R2/(1-R2)/(n-2)
Coeficientul R este coeficientul de corelaţie multiplă, însă pentru corelaţia liniară simplă
între x şi y reprezintă coeficientul de corelaţie.
2
R ( y y ) 2 / ( yi y ) 2 1 ui / ( yi y )
2
i
i i i i
Mărimea R se numeşte raport de corelaţie şi exprimă gradul de fidelitate a modelului faţă
de dependenţa statistică dintre y şi x, şi anume R0,1, cu cât R va avea o valoare mai
apropiată de 1, cu atât veridicitatea modelului va fi mai ridicată.
Pentru determinarea măsurii legăturii liniare puternice între x şi y se calculează
coeficientul liniar de corelaţie.
( x / (x x ) 2 ( yi y ) 2
2
ry , x cov( x, y) / x y i x ) ( yi y ) i
Mărimea lui ry/x este cuprinsă între -1 şi 1. Cu cât valoarea lui ry/x este mai mare, cu atât
legătura între variabile este mai strânsă. Pentru cazul dependenţei liniare ry, x R . După
obţinerea lui ry/x se poate de verificat în ce măsură coeficientul de corelaţie obţinut este
semnificativ cu ajutorul următorului test:
r
t calc .
1 r 2 / n 2
Dacă tcalc>ttabela=t/2n-2, atunci coeficientul de corelaţie semnificativ diferă de 0; în caz
contrar se acceptă ipoteza unui coeficient de corelaţie nul.
4. Efectuarea de calcule previzionale.
Se consideră că în urma analizei legăturii dintră valorile a două variabile
6
variabilei x specificat prin xp, unde (p=n+1,n+k), prin k desemnând orizontul de previziune.
Logica estimării variaţiei de previziunii prin această metodă este următoarea:
- pentru un nivel efectiv al variabilei xp vom avea yp=+xp+up
- dacă valoarea previzională pe baza modelului estimat este
Varianţa variabilei
V(ep)=0, iar up satisface ipotezele modelului, estimatorul
( y p -yp)/(ep)N(0,1)
Pentru un prag de semnificaţie şi (n-2) grade de libertate din tabelul funcţiei de Student
se determină t(n-2); şi se obţine intervalul de încredere pentru valoarea previzionată la
un nivel xp specificat
y p -t(n-2); (ep) yp ŷ p +t(n-2); (ep)
7
Pentru a studia cum variază costul de întreţinere al unui utilaj în funcţie de vechimea acestuia,
o firmă a înregistrat următoarele date (tabelul 1.1).
Tabelul 1.1.
Nr. observării 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15
Vechime 6 8 8 10 15 16 17 20 21 21 32 36 41 53 58
(în luni) Xi
Cost anual 25 30 33 37 38 40 48 50 46 52 61 67 79 90 92
Yi (sute lei)
Se cere:
8
Tabelul 1.2.
2 2
Nr. Xi Yi xi yi xi yi xi *yi
1 6 25 -18,1333 -27,5333 328,8178 758,0844 499,2711
2 8 30 -16,1333 -22,5333 260,2844 507,7511 363,5378
3 8 33 -16,1333 -19,5333 260,2844 381,5511 315,1378
4 10 37 -14,1333 -15,5333 199,7511 241,2844 219,5378
5 15 38 -9,13333 -14,5333 83,41778 211,2178 132,7378
6 16 40 -8,13333 -12,5333 66,15111 157,0844 101,9378
7 17 48 -7,13333 -4,53333 50,88444 20,55111 32,33778
8 20 50 -4,13333 -2,53333 17,08444 6,417778 10,47111
9 21 46 -3,13333 -6,53333 9,817778 42,68444 20,47111
10 21 52 -3,13333 -0,53333 9,817778 0,284444 1,671111
11 32 61 7,866667 8,466667 61,88444 71,68444 66,60444
12 36 67 11,86667 14,46667 140,8178 209,2844 171,6711
13 41 79 16,86667 26,46667 284,4844 700,4844 446,4044
14 53 90 28,86667 37,46667 833,2844 1403,751 1081,538
15 58 92 33,86667 39,46667 1146,951 1557,618 1336,604
Total 362 788 0 0 3753,733 6269,733 4799,933
X x x
2
i = 362; i = 3753,733; X = 24,1333 i yi = 4799,9333;
Y y
2
i =788; i = 6269,733; Y = 52,5333 ;
unde xi X i X ; yi Yi Y .
Deci
X i Yi (x i X ) ( yi Y ) x i yi Y xi X y i nXY
4799,9333 15 24,1333 52,5333 23817
X (x
i
2
i X ) 2 xi2 2 X xi n( X ) 2 3753,7333 15 (24,1333) 2 12490;
Y i
2
(y i Y ) 2 yi2 n(Y ) 2 6269,7333 15 52,5333 47666 .
x y i i
4799,9333
1,278709 1,2787 ,
x 2
i
3753,7333
9
2) Pentru calcularea estimaţiei coeficientului de corelaţie, vom folosi următorii
estimatori.
r
x y i i
4799,9333
0,989416; r 0,9894
( x )( y
2
i
2
i ) 3753,7333 6269,7333
r 2 0,9789
Pentru cazul liniar simplu al dependenţei Y X , coeficientul de determinaţie r2
coincide cu indicele de corelaţie:
( xi yi ) 2
Q1 x i y i x 2
( xi yi ) 2 (4799,9333) 2
r
2 i
Q yi2 y 2
i ( x i2 )( y i2 ) 3753,7333 6269,7333
0,97894 r 2
Q1
Din formula r 2 rezultă semnificaţia coeficientului de determinaţie, si anume:
Q
r2=0,9789 exprimă ponderea de 97,9% de dispersie (varianţă) a variabilei Y (costului anual
de întreţinere a maşinii) explicată de varianţa factorului identificat de influenţă X (durata de
utilizare a utilajului) şi numai 2,1% de varianţă variabilei Y este explicată de influenţa altor
factori neidentificaţi inclusiv şi aleatori:
3) Estimatorul
Q2
u i2
2
;
n 2 n 2
u
( xi yi ) 2 (4799,9333) 2
Q2 Q Q1 y 2
6269,7333 132,0144 ;
i
x 2
i
3753,7333
u2 10,15496 .
10
Y 21,6738 1,2787 X ,
(1,50087) (0,0520)
unde în paranteze sunt prezentate erorile standard (estimaţiile erorilor) coeficienţilor regresiei
Y pe X.
ˆ
ajutorul testului Student cu (n-2) grade de libertate. Raportul t furnizează valoarea
ˆ ˆ
empirică a testului Student ce trebuie comparată cu valoarea critică la pragul şi (n-2) grade
de libertate.
ˆ ˆ
Ipoteza H0 va fi acceptată dacă t n2 t13 (0,025) 2,16 ceea ce este
ˆ ˆ ˆ ˆ 2
t n2 , t n2 ( 2,16;2,16) cu o probabilitate de încredere de 95%.
2 2
ˆ ˆ
În cazul dat atât mărimea t ˆ cât şi tˆ aparţin domeniului critic din
ˆ ˆ ˆ ˆ
1,2787 21,6738
dreapta, şi anume t 24,59 2,16 ; t 14,44 2,16 .
0,0520 1,50087
Prin urmare, atât cât şi sunt semnificativ diferiţi de 0 la pragul de semnificaţie 5%.
5) Calculăm intervalele de încredere a coeficienţilor şi .
11
În punctul precedent s-a menţionat, că ambele variabile aleatorii t
t urmează o distribuţie Student cu (n-2) grade de libertate. Plecând de la valorile
sau 1166
, ;1,391 ; 18,432;24,916 .
u2
Variabila aleatoare ( n 2) urmează o lege 2 cu (n-2) grade de libertate. Putem deci
u2
găsi în tabelul acestei distribuţii valorile 12 având probabilitatea ( 1 ) de a fi depăşită,
2
respectiv 22 având probabilitatea de a fi depăşită. Avem:
2
2
P 12 ( n 2) u2 22 1 , de unde intervalul de încredere la pragul cu riscuri
u
(n 2)u2 (n 2)u2
simetrice pentru :
2 2
; .
u
u
22 12
Pentru 5% , n-2=3 şi u2 10,155 obţinem,
13 10,155 13 10,155
u2 5,336;26,350
5,01
;
24,74
unde 132 (0,975) 22 24,74 ,
Estimatorul punctual al previziunii este Y0p x 0 . Rezultă că, de exemplu, pentru x0=24
12
1
(x 0 X ) 2
2
2
2
i
p u
n
e0
( x X )
sau
1 (24 24,1333) 2
ˆ e2 10,155
p 0,6770.
0
15 3753,73333
50,5828:54,1372 adică Y0 va varia de la 5058 lei pânã la 5414 lei, iar pentru x0=48 luni
avem respectiv Y0 83,05 2,16 2,2180;83,05 2,16 2,2180 78,2591 : 87,84088 , ori de
În continuare este importantă verificarea ipotezei nule Ho: Yp Y0p (adică Yp Y0p 0 ),
13
Aceste calcule ne conduc la concluzia că micşorarea observată a costului de întreţinere a
utilajului este semnificativă pentru pragul de 5% şi nesemnificativă pentru pragul de 1%.
Alegerea rămâne să o facă decidenţii firmei.
Informaţia necesară pentru executarea lucrării este prezentată în probleme propuse.
La indicaţia profesorului, fiecare student trebuie să aleagă doi indicatori şi să analizeze
dependenţa liniară între ei de tipul:
y i xi ui (1).
În acest scop se propune studentului să realizeze următoarele puncte (etape):
14