Sunteți pe pagina 1din 49

MODELE ECONOMETRICE

UTILIZATE ÎN ECONOMIE
Modelul regresiei simple
(recapitulare)
Clasificarea modelelor econometrice
 Nr. variabilelor factoriale
 Modele unifactoriale y  f ( x)  u
 Modele multifactoriale y  f ( x1 , x2 ,..., xn )  u
 Forma legăturii
 Modele liniare C  a  bV  u
 Modele neliniare C  aV bu
 Sfera de cuprindere
 Modele parţiale
 Modele globale (agregate)
 Considerarea timpului, ca factor
 Modele statice yt  f ( x1t , x2t ,..., xkt )  ut
 Modele dinamice yt  f ( x1t , x2t ,..., xkt , t )  ut
Clasificarea modelelor econometrice
 Nr. de ecuaţii
 Cu o singură ecuaţie
 Cu ecuaţii multiple
 Scopul utilizării
 Modele euristice, raţionale – în teoria economică
 Modele decizionale, operaţionale – în practica economică
Modelele dinamice
 Introducerea în mod explicit a variabilei timp
yt  f ( x1t , x2t ,..., xkt , t )  ut
 Modele autoregresive yt  f ( xt , yt 1, yt 2 ,..., yt k )  ut
 Modele cu lag distribuit yt  f ( xt , xt 1 , xt 2 ..., xt k )  ut
ECONOMETRIA FINANCIARĂ

 Ce este Econometria?
- “mărimi si măsurători în economie”.

 Econometria financiară:
Aplicarea tehnicilor statistice şi matematice
la problemele din domeniul finanţelor
Exemple de probleme ce pot fi rezolvate

1. Testarea eficienței informaționale a piețelor financiare

2. Testarea utilității modelelor CAPM și APT pentru


determinarea profiturilor acțiunilor riscante.

3. Măsurarea și previziunea volatilității profiturilor


obligațiunilor.

4. Explicarea factorilor de influență ai ratingurilor de credit ale


obligațiunilor utilizate de agențiile de rating.

5. Modelarea relațiilor pe termen lung a prețurilor și cursurilor de


schimb.
Exemple de probleme ce pot fi rezolvate (continuare)

6. Determinarea raportului hedge optim pentru o poziție spot

7. Testarea reglementărilor comerciale tehnice pentru a


determina care aduce mai mulți bani

8. Testarea ipotezelor că anunțurile de câștiguri sau dividende nu


au efect asupra prețurilor acțiunilor

9. Testarea dacă piețele spot sau futures reacționează mai rapid la


noutăți

10. Previziunea corelației între profiturile și indicii acțiunilor din


două țări
Caracteristicile seriilor de date financiare

 Frecvența și cantitatea datelor


Prețurile pieței bursiere sunt măsurate de fiecare dată
când are loc o tranzacție sau cineva postează o nouă
cotare.

 Calitatea
Prețurile activelor înregistrate sunt de obicei acelea la
care a avut loc tranzacția. Deși nu există posibilitatea
erorilor de măsurare, totuși datele financiare sunt
afectate de “zgomot”.
Tipuri de date folosite – serii de timp
 3 tipuri de date care ar putea fi folosite în analiza econometrică:
- serii de timp (Time series data) – analiză longitudinală
- serii de date instantanee (Cross-sectional data) – analiză transversală
- paneluri (Panel data), o combinație 1 & 2.
Datele pot fi:
 Cantitative (ex.: rate de schimb, prețurile acțiunilor, nr. de acțiuni în circulație),

 Calitative (ex.: ziua din săptămână).

 Exemple de serii de timp


Seria de date Frecvența
- rata șomajului lunar, trimestrial
- deficitul bugetar anual
- oferta de masă monetară săptămânal
- valoarea unui indice al pieței bursiere când este tranzacția
Tipuri de date folosite - serii de date transversale

 Exemple de serii de date instantanee:


- un sondaj despre folosirea serviciilor online de brokeraj
- profiturile la BVB
- un eșantion al ratingurilor bondurilor de credit pentru băncile
din România
 Example de probleme pentru regresia transversală:
(Cross-Sectional Regression)
- Relația dintre dimensiunea companiei și profitul de investit în
acțiunile sale
- Relația dintre nivelul PIB și probabilitatea ca guvernul să se
onoreze datoria suverană
Tipuri de date folosite - paneluri

 Panelul are caracteristici și dimensiuni atât ale seriilor de timp cât și


ale datelor instantanee (de ex.: prețul zilnic al unui stoc de un
anumit tip de acțiuni în decursul a doi ani).

 În mod obișnuit s-a convenit notația următoare:


- Cu litera t pentru indexarea observărilor și numărul total al
observărilor prin T pentru seriile de timp;
- Cu literta i și numărul total al observărilor prin N pentru seriile de
date instantanee.
Profiturile în modelarea financiară
 Este de preferat să nu se lucreze cu direct cu preţurile acţiunilor;
de obicei se convertesc preţurile în serie de profituri.
 Există două modalităţi:
(simple returns) sau (log returns)

pt  pt 1  pt 
Rt  100% Rt  ln   100%
pt 1  pt 1 

unde, Rt arată rata profitului la momentul t (rentabilitatea,


randamentul)
pt arată preţul la timpul t
ln este logaritmul natural.
 Se pot ignora orice plăţi de dividende sau se presupune că seria
preţurilor este deja ajustată şi ţine seama de ele.
Serii log ale profiturilor - Log Returns
 Ratele profiturilor sunt cunoscute ca log preţuri relative.

Motivele sunt:
1. Pot fi interpretate ca fiind rate compuse continue (continuously
compounded returns)
2. Se pot aduna, de exemplu dacă vrem un profit săptămânal
(weekly return) şi dispunem de valorile zilnice ale ratelor
profitului (daily log returns):
r1 = ln p1/p0 = ln p1 - ln p0
r2 = ln p2/p1 = ln p2 - ln p1
r3 = ln p3/p2 = ln p3 - ln p2
r4 = ln p4/p3 = ln p4 - ln p3
r5 = ln p5/p4 = ln p5 - ln p4

ln p5 - ln p0 = ln p5/p0
Dezavantajul utilizării “Log Returns”

 Există un dezavantaj al utilizării “log-returns”.


Rentabilitatea unui portofoliu de acţiuni este
media aritmetică ponderată a rentabilităţilor
simple ale acţiunilor individuale:
N
Rpt   wip Rit
i 1

 Dar această situaţie nu se poate folosi pentru


rentabilităţi compuse continue.
Paşi în construirea modelelor econometrice

Teorie economică sau financiară (studii anterioare)

Formularea unui model teoretic de estimat

Culegerea datelor

Estimarea modelului

Este modelul corespunzător d.p.v. statistic?

NU DA

Reformularea modelului Interpretarea modelului

Utilizarea sa pentru analiză şi previziune


Aspecte de considerat în lucrările din literatura
academică în domeniul finanțelor (1)

1. Lucrarea se referă la dezvoltarea unui model teoretic


sau este mai degrabă o tehnică de aplicare sau un
exercițiu de data mining?
2. Datele sunt de “bună calitate” (veridice)? Sursa este
credibilă? Este suficientă dimensiunea eșantionului
pentru invocarea teoriei asimptotice?
3. Au fost aplicate corect tehnicile econometrice? S-au
efectuat testele diagnostic pentru verificarea
respectării ipotezelor presupuse în estimarea unui
model econometric?
Aspecte de considerat în lucrările din literatura
academică în domeniul finanțelor (2)

4. Rezultatele au fost interpretate sensibil? Concluziile


formulate pe baza rezultatelor sunt exagerate?
Rezultatele răspund întrebărilor formulate de autori?

5. Concluziile formulate sunt corespunzătoare


rezultatelor obținute sau importanța rezultatelor
studiului a fost supraevaluată?
MODELUL REGRESIEI SIMPLE
Regresia simplă
 Variabila y se pesupune că este random sau
“stochastică” într-un anume fel, adică are o distribuţie
de probabilitate.
 Variabilele x sunt presupuse având valori fixe, în
eşantioane repetate (“non-stochastice”).
 Example:
 Estimarea expunerii unei firme la riscul cursului de schimb
 Estimarea efectului de dimensiune pe piaţa acţiunilor
 Construirea unui raport hedge optim
 Evaluarea abilităţii de selecţie a managerului unui fond.
Analiza de regresie
Descrierea şi evaluarea relaţiei dintre o variabilă dată y
(numită variabilă dependentă) şi una sau mai multe (k)
variable x1, x2, ... , xk (numite variable independente)
 Alte denumiri pentru variabilele y and x:
y x
 variabilă endogenă variabilă exogenă
 variabilă explicată variabilă explicativă
 variabilă efect variabilă cauză
regresor
Cazul când se consideră o singură variabilă x – Analiza de
REGRESIE SIMPLĂ
În funcţie de numărul de factori a căror variaţie se consideră
în explicarea variaţiei fenomenului efect, y, există:
- regresie simplă: când se consideră variaţia unui singur
factor: y=f(x) şi
- regresie multiplă: când se consideră variaţia mai multor
variabile explicative: y=f(x1, x2, …, xk).

Metoda regresiei analizează relaţiile existente între


variabila explicată şi variabilele explicative, pe baza datelor
observate pentru aceste variabile.
Se poate stabili care din factori au o influenţă semnificativă,
gradul lor de esenţialitate şi cunoscând influenţa variabilelor
factoriale asupra variaţiei fenomenului explicat, se pot face
previziuni ale valorilor variabilei y pentru anumite valori date ale
variabilelor x.
Metoda celor mai mici pătrate - ipoteze
Metoda celor mai mici pătrate, atribuită matematicianului german Carl Friederich
Gauss, este una din cele mai des utilizate metode de estimare a ecuaţiilor de regresie a
sondajelor statistice. Principiul acestei metode constă în minimizarea sumei pătratelor
abaterilor valorilor empirice faţă de cele teoretic estimate, adică minimizarea sumei
pătratelor reziduurilor.
Aplicarea acestei metode se bazează pe următoarele ipoteze presupuse adevărate:

1. Modelul este liniar în xi (sau în oricare transformare a lui xi).


2. Valorile lui xi sunt observate fără erori (xi este nealeator).
3. Media (operatorul E) erorilor este zero: E(i / xi)=0
Această ipoteză spune de fapt că toţi factorii neexplicitaţi de model, şi dealtfel cuprinşi în
i, nu afectează în mod sistematic valoarea medie a lui y, adică valorile lor pozitive se
anulează cu cele negative astfel încât efectul lor mediu asupra lui y este zero.
4. Homoscedasticitatea sau variaţia (V – dispersia, varianţă) egală a erorilor 2.
 
V  i / xi   E i  E  i   E  i2   2
2

Varianţa erorilor pentru fiecare xi (varianţa condiţionată a lui i) este un număr
pozitiv constant şi egal cu 2 sau altfel spus, populaţiile lui y, corespunzătoare valorilor
xi, au aceeaşi varianţă. Situaţia opusă se numeşte heteroscedasticitate şi se poate nota:
V  i / xi    i2 , şi unde varianţa nu mai este constantă, i=1,n.
Ajustarea liniară a profitului în funcţie de numărul de angajaţi
230

210

190

170
profit (mii euro)

150

130

110

90

70

50
0 50 100 150 200 250 300 350 400 450 500 550
ymed ymed.teoretic număr angajaţi (persoane)
5. Nu există corelaţia (covarianţa) erorilor.
cov( i ,  j )  E[ i  E ( i )][ j  E ( j )]  E ( i  j )  0 pentru oricare i  j.

Pentru anumite valori date xi, abaterile oricăror două valori y de la valoarea
lor medie nu prezintă nici o tendinţă.

6. Erorile sunt independente de variabila explicativă. Nu există corelaţie între


erori şi valorile x.
cov( i , xi )  E[ i  E ( i )][xi  E ( xi )]  E[ i ( xi  E ( xi ))] 
 E ( i xi )  E ( xi ) E ( i )  E ( i xi )  0
pentru că E  i   0 din ipoteza 3.

7. Modelul de regresie este corect specificat. O investigaţie econometrică


începe prin specificarea modelului econometric.

Problemele sunt: ce variabile ar trebui incluse în model, care este forma


funcţională a modelului (este liniar în parametri, în variabile sau ambele?)
Proprietăţile estimatorilor metodei celor mai mici pătrate

Estimatorii metodei celor mai mici pătrate au următoarele proprietăţi:

 liniari, adică o funcţie liniară a unei variabile aleatoare, cum ar fi variabila


y în modelul de regresie;

 nedeplasaţi, media estimatorului din toate eşantioanele posibile, de


volum n sau valoarea aşteptată a estimatorului E (aˆ1 ) este egală cu
valoarea adevărată a parametrului, a1 ;

 eficienţi, adică are varianţa minimă.

Teorema lui Gauss-Markov se enunţă astfel:


Date fiind ipotezele modelului liniar clasic de regresie, estimatorii celor
mai mici pătrate, din clasa estimatorilor liniari nedeplasaţi, au varianţă
minimă; se poate spune că sunt BLUE (Best Linear Unbiased
Estimators).
Liniaritatea
 liniaritatea în variabile - cu un înţeles „natural” înseamnă că media
condiţională (în sensul de valoarea medie aşteptată - în econometrie,
apare termenul de speranţă matematică) a variabilei y este o funcţie
liniară a lui xi. Operatorul de speranţă matematică se notează cu litera E.
Dreapta de regresie a populaţiei reprezintă tendinţa medie şi se scrie:
E(y/xi)=a0 + a1xi.

 liniaritatea în parametrii este când distribuţia condiţională a variabilei y,


E(y/xi) este o funcţie liniară a parametrilor, adică toţi sunt la puterea 1, in
timp ce variabilele x pot sau nu să fie liniare.

 Termenul de regresie liniară însemnă întotdeauna, liniaritatea în


parametrii necunoscuţi; indiferent dacă există liniaritate în variabilele
explicative.

Astfel, exemple de modele liniare sunt:


 E(y/xi)=a0 + a1xi, liniar în parametrii şi în variabile şi
 E(y/xi)=a0 + a1xi2, liniar în parametrii şi neliniar în variabile.

 Un model neliniar în parametrii este: E ( y / xi )  a0  a1  xi .


 Pentru regresia liniară este relevant termenul de liniaritate în parametrii.
Regresia simplă
Cum se poate modela această relaţie? Se va folosi ecuaţia dreptei,
y = a + bx
pentru a obţine dreapta care aproximează cel mai bine datele.

Ecuaţia este complet determinată.

Va exista un termen de disturbanţă (residual), u în ecuaţie.


yt =  + xt + ut

unde t = 1, 2, 3, 4, 5
Exemplu de regresie simplă
 Se dau următoarele date despre excesul de profit “excess
returns” al portofoliului unui manager de fond (“fund XXX”)
împreună cu excesul de profit al indexului de piaţă:

Year, t Excess return Excess return on market index


= rXXX,t – rft = rmt - rft
1 17.8 13.7
2 39.0 23.2
3 12.8 6.9
4 24.2 16.8
5 17.2 12.3

 Se poate intui relaţia dintre ratele profitului (beta pozitiv). Care


din variabile este cea dependentă?
 În prima fază se va construi graficul corelaţiei (Scatter Plot) al
celor două variable.
Regresia simplă – examplu (cont.)
Scatter plot

45
Excess return on fund XXX

40
35
30
25
20
15
10
5
0
0 5 10 15 20 25
Excess return on market portfolio
Regresia simplă (cont.)

 Termenul rezidul capturează:


 (întotdeauna există) alţi factori determinanţi ai lui yt

 erori în măsurarea lui yt, care nu pot fi modelate.

 influenţe externe aleatoare asupra lui yt care nu pot fi


cuprinse în model.
Valoarea efectivă și cea teoretică – termenul rezidual
y

yi

û i

ŷi

xi x
Regresia simplă – determinarea
termenului “intercept” şi “slope”
 Se determină  (the intercept) şi  (the slope) astfel
încât distanţele de la puncte la model să fie minime:

x
Dispersia reziduurilor
n n
naˆ 0  aˆ1  xi   yi
i 1 i 1
n n n
aˆ 0  xi  aˆ1  xi2   xi yi
i 1 i 1 i 1

Precizia estimatorilor modelului de regresie liniară simplă se


măsoară prin erorile lor standard. Aceste erori se obţin prin
extragerea rădăcinii pătrate din dispersiile estimatorilor.
Formulele varianţelor estimatorilor se obţin în funcţie de  2
estimatorul varianţei (dispersiei) reziduurilor sau simplu, 2 .
Estimatorul dispersiei reziduurilor se obţine prin raportarea
sumei pătratelor reziduurilor la numărul gradelor de libertate
n-2:  e 2
  y
i  ˆ
y 2
i i e 2
 i
ˆ 2  i
 i
ˆ  i
n2 n2 n2
Varianţele și abaterile estimatorilor
 var(aˆ1 )  E[aˆ1  E(aˆ1 )]2  E (aˆ1  a1 ) 2 , pentru ca E (aˆ1 )  a1

2 ˆ
var(aˆ1 )  ˆ aˆ  V aˆ1  

 i 
n

 (x 
1 2
i  x) 2 x x
i 1 i

 var(aˆ0 )  E[aˆ0  E (aˆ0 )]  E (aˆ0  a0 ) , pentru că E (aˆ0 )  a0


2 2

 
  x2
 V aˆ 0   ˆ
x2 1
2 1
var(aˆ0 )     n  ˆ aˆ 
n
0
n  xi  x 2
 ( xi  x ) 2 
 i 1
 i
Precizia şi erorile standard ale estimatorilor
Abaterile estimatorilor sunt:
ˆ x2
ˆ aˆ  V aˆ1    V aˆ 0   ˆ
1
ˆ aˆ 
n  xi  x 2
 x  x
1 2 0

i
i i

Dependenţa estimatorilor se măsoară prin covarianţa lor:


cov aˆ0 , aˆ1   E[(aˆ0  E (aˆ0 ))(aˆ1  E (aˆ1 ))]  E[(aˆ0  a0 )(aˆ1  a1 )]
n n
 E[( wi  i )( ki  i )] E w11  w2  2  ..  wn  n k11  k 2  2  ..  k n  n  
i 1 i 1

 n 
 2
1 1 1
2
2 2 
 E w k   w2 k   .....  w1k11 2  ...  w1k n 1 n  ...  E   wi ki  i2  
 i 1 
2  1   2   ki 2  
ˆ 2  n  2  
n n n
ˆ  E    k i x  k i   
ˆ  E    k i x    E   ki   x ˆ  E   ki2  
 i 1  n    i 1  n  n  i 1   i 1 
 n 2 1
ˆ E   ki    x 
  x 2

ˆ 2 n
  x var(aˆ1 )
 i 1 
 i
( x
i 1
 x ) 2
 2
var(a ) 
1 n
 var(aˆ1 )
 i
( x
i 1
 x ) 2


1 )  var(a1 ) şi estimatorul nu va mai fi de
În caz contrar var( a ˆ
varianţă minimă. Dacă există un estimator de varianţă
minimă acela este cel al metodei celor mai mici pătrate. În
mod similar se poate arăta şi pentru â 0 că este estimatorul
de varianţă minimă pentru parametrul a 0 .
â1
a1

 
distribuţia lui â1 distribuţia lui a1 distribuţia lui â1 şi a1
Tabela de regresie
cuprinde în sumarul său, SUMMARY OUTPUT, trei părţi:
 Regression Statistics,
 tabelul ANOVA şi
 informaţiile despre estimatorii coeficienţilor modelului liniar.
Regression Statistics conţine informaţii cu caracter general despre
variabilele implicate în analiza de regresie:
 coeficientul de corelaţie multiplă Multiple R, care la regresia simplă este
coeficientul de corelaţie liniară simplă, r;
 coeficientul de determinaţie R2, numit R Square arată validitatea modelului.
 Adjusted R Square care este R2 ajustat cu un anumit număr de grade de
libertate;
 Standard Error este eroarea medie standard a valorilor teoretice ale lui y şi se
calculează ca o abatere medie pătratică a valorilor empirice faţă de cele
teoretice:
n n

  yi  yˆ i  i
2 2
e
ˆ   i 1
 i 1
 ˆ 2
n  k 1 n  k 1
 Observations reprezintă n este numărul de observări ale variabilei dependente,
care este egal cu numărul de valori ale variabilei (variabilelor) independente xi.
Coeficientul de determinaţie.
n n

 y2 / x  ( yi  y )
ˆ 2
 ( yi  yi )
ˆ 2

R 
2
 i 1
 1 i 1
 1 N 2

 2 n n
y
 i
( y
i 1
 y ) 2
 i
( y
i 1
 y ) 2

R2 arată în ce măsură modelul ales explică variaţia lui Y, altfel spus,


este o măsură a validităţii modelului. 0 < R2 < 1, cu cât este mai
apropiat de 1 cu atât modelul este mai bun.
Raportul de corelaţie
Raportul de corelaţie are semnul coeficientului de regresie b,
şi are aceeaşi semnificaţie ca şi coeficientul de corelaţie, r.
n n

 y2 / x  i
( ˆ
y  y ) 2
 i i
( y  ˆ
y ) 2

R  i 1
 1 i 1

y 2 n n

 i
( y
i 1
 y ) 2
 i
( y
i 1
 y ) 2
Coeficientul de corelaţie simplă
-1 < r < 1
n

 (x i  x )( yi  y )
cov( X , Y )  i 1

n
cov( X , Y )
r=
xy
n n n
n x i yi   x i  yi
rxy  i 1 i 1 i 1

 n 2  n 2  n 2  n 2 
n  x i    x i   n  y i    y i  
 i 1  i 1    i 1  i 1  
Tabelul de analiză a varianţei pentru
regresia simplă
Sursa variaţiei Suma pătratelor Grade Pătrate
libertate medii

SSR   ( yt  yˆt ) 2   et2


reziduuri
n-2 SSR/(n-2)
t t
x
SSE   ( yˆ t  y ) 2 1 SSE/1
t

Total SST   ( yt  y ) 2 n-1


t

Testul Fisher este un test de verificare a semnificaţiei globale a regresiei, în


cazul regresiei multiple. În cazul regresiei simple, această semnificaţie se
reduce la semnificaţia influenţei variabilei x asupra variaţiei caracteristicii
variabilei y.
SSE / 1 R2
F*  F* 
SSR /( n  2) (1  R 2 ) /( n  2)

Dacă , F  F1,n 2 se respinge ipoteza de egalitate a varianţelor (H0 – ipoteza


* 0.05

nulă), variabila x fiind semnificativă pentru variaţia variabilei y. În caz contrar


se acceptă această ipoteză de egalitate a varianţelor.
Informaţiile despre estimatorii coeficienţilor modelului

 În coloana Coefficients - valorile estimate ale coeficienţilor


modelului liniar â i, i=1,k,
 Intercept - estimatorul termenului constant, â0, care poate fi zero
dacă s-a optat pentru Constant is Zero şi
 estimatorii coeficienţilor variabilelor explicative: â1, ..., ân la X
Variable 1, X Variable 2, ... în ordinea declarării variabilelor
explicative;
 Standard Error, abaterile standard ale estimatorilor; arată cu cât
variază în medie, în plus sau în minus valorile estimate ale
coeficienţilor faţă de parametrii pe care îi estimează
 valorile Student, t*, pentru fiecare estimator, pentru verificarea
semnificaţiei acestuia faţă de 0;
 P-value, corespunzătoare pragului de semnificaţie α, începând de la
care valoarea estimatorului este semnificativ diferită de zero,
 limitele intervalului de încredere ale estimatorilor: inferioară Lower
95% şi superioară Upper 95%, cu o probabilitate de 95%, implicit,
iar la cerere se pot solicita şi alte valori ale probabilităţii: 99%, 90%,
etc.
Funcţii de regresie ale populaţiei şi ale eşantioanelor

 Funcţia de regresie a populaţiei E ( y / xi )  a0  a1 xi


 Funcţia de regresie a eşantioanelor yˆ i  aˆ 0  aˆ1 xi
Dreapta de regresie a populaţiei şi a eşantionului
210

190

170

150

130

yi yi
i ei
110

E(y/x) E(y/xi)
90

70

0 50 100 150 200 250 300 350 400 450 500 550

y-es yt-es yt-pop


Consecinţe ale ipotezelor:
construirea testelor
 teste de verificare a semnificaţiei estimatorului
varianţei erorilor şi intervalul de încredere al
estimatorului varianţei erorilor, ca fiind
consecinţe ale ipotezei de normalitate a erorilor;
 teste de verificare a semnificaţiei estimatorilor şi
ai parametrilor şi din ecuaţia de regresie a
populaţiei, precum şi intervalul lor de încredere,
estimat cu o anumită probabilitate;
 testul Fisher de verificare a semnificaţiei globale
a regresiei.
Testul de semnificaţie al estimatorului
e 2
i
Estimatorul varianţei erorilor  2 , notat ˆ 2 este: ˆ 2  i .
ˆ 2 n2
ˆ aˆ1 
2 

i i
( x  x ) 2
ˆ 2
Ipoteza de normalitate a erorilor implică: (n  2) 2 urmează o lege  2

cu n-2 grade de libertate.

aˆ1  a1 aˆ 0  a 0
şi urmează o lege normală centrată redusă N(0,1).
 aˆ
1
 aˆ 0

ˆ 2 ˆ a2ˆ
urmează o lege  cu n-2 grade de libertate.
2
(n  2) 2  (n  2) 2
  aˆ
Rezultă că:
aˆ 0  a 0 aˆ  a1 urmează o lege Student cu n-2 grd. lib.
şi 1
ˆ aˆ0 ˆ aˆ1
Testul de semnificaţie al estimatorilor şi intervalele de încredere ale
acestora apar ca fiind consecinţe ale ipotezei de normalitate a erorilor.
Teoria testelor statistice: raţia Student

- ipoteza nulă H0: a1  0


- ipoteza alternativă H1: a1  0
Dacă se respinge ipoteza nulă H0, la un prag  fixat, atunci estimatorul
este considerat ca fiind semnificativ diferit de 0.
Pragul de semnificaţie cel mai des utilizat este =0.05, adică un risc de
a respinge H0, în mod neîntemeiat, de 5%.
aˆ1  0 aˆ1
raţie Student   t aˆ1
ˆ aˆ1 ˆ aˆ1

Testul de semnificaţie al estimatorului


Intervalul de încredere al estimatorilor

H0 cu probabilitatea P=1-

H1 H1
/2 /2
I

  / 20.025
 t n2 grd.lib. a1  t n/22grd
0.025

.lib.

Intervalul de încredere al parametrului a1 este:


IC a1  aˆ1  ˆ aˆ1  t n/22
Intervalul de încredere al previziunii cu
modelul regresiei simple
yˆ n1  aˆ 0  aˆ1 xn1 en1  y n1  yˆ n1
en1  (a0  a1 xn1   n1 )  (aˆ 0  aˆ1 xn1 )  (a0  aˆ 0 )  (a1  aˆ1 ) xn1   n1
Se calculează varianţa erorii de previziune care permite determinarea
unui interval de încredere pentru previziune.
var(en 1 )  var( y n 1  yˆ n 1 )  var(a0  aˆ 0 )  (a1  aˆ1 ) x n 1   n 1  
 E(a 0  aˆ 0 )  (a1  aˆ1 ) x n 1   n 1  
2

 E (aˆ 0 ) 2  x n21 E (aˆ1 ) 2  E ( n 1 ) 2  2 x n 1 cov(aˆ 0 , aˆ1 ) 


 
 1 x 2
 ˆ 2
 ˆ   
2
2 
 x n 1
2
 ˆ 2  2 x n 1 ( x var(aˆ1 )) 
 n  ( xt  x )   ( xt  x ) 2

 t  t
 
2 1 x2 x n21 2 x n 1 x 
 ˆ     1 2 

n  ( xt  x ) 2  ( xt  x ) 2 t t
( x  x )
 t t

 
 2
 ˆ 2    1
1 ( x n 1 x )
n  ( xt  x ) 2
 t

Previziuni cu modelul regresiei simple
Abaterea medie pătratică a erorii de previziune este:

1 ( x n 1  x ) 2
ˆyˆ n 1  ˆ   n 1
 t
n
( x  x ) 2

t 1

Rezultă intervalul de încredere IC al variabilei y la n+1:

1 ( x n 1  x ) 2
ICy n 1  yˆ n 1  t n/22  ˆ   1
n  ( xt  x ) 2

S-ar putea să vă placă și