Sunteți pe pagina 1din 11

CAPITOLUL 3

INFERENŢA STATISTICĂ

CONTINUT
 1. Testarea pantei dreptei de regresie
 2. Testarea interceptului
 3. Validarea modelului de regresie folosind
analiza varianţei - ANOVA
 4. Determinarea şi testarea raportului de
corelaţie

 Referinţe
2

1
1. Testarea pantei dreptei de regresie

H0 : 1  1
 0


H A : 1  1

0

ˆ1  10 ˆ1  10 ˆ1  10 ˆ1  10


t   
SE(ˆ1 ) ˆ 2 n n n

Sxx
ei2 /(n  2)
i 1
ei2 / (xi  x )2 / n  2
i 1 i 1
n

( x  x )
i 1
i
2

 Valoarea critică:
t / 2 ;n  2
 Caz particular: ă legătură
ă legătură
liniară)
liniară)
 H 0 : 1  0(nu exist

 H A : 1  0( exist 3

Intervale de încredere pentru panta


dreptei de regresie

ˆ1  t / 2,n  2 SE ( ˆ1 )  1  ˆ1  t / 2,n 2 SE ( ˆ1 )


 x2  2 x 
2
ˆ1  t / 2,n  2 ˆ 2    1  ˆ1  t / 2,n  2 ˆ  
 S xx   S xx 

unde e 2
i este estimatorul dispersiei modelului.
ˆ 
2 i 1

n2

2
2. Testul t pentru termenul liber(intercept)
H0 : 0  0
 0


H A : 0  0

0

ˆ0  00 ˆ0  00


t  
SE(ˆ0 )  1 x 2

ˆ 2   
 n Sxx 
ˆ0  00 ˆ   0
  0 0
n
 1 x2   
e 2
i /(n  2)    n 1 x 2 
i 1  n Sxx   2
ei 
n
 n  / n2
2 
i 1


i 1
( xi  x ) 

•Valoarea critică: t / 2 ;n  2 5

 Pentru termenul liber(intercept)

ˆ0  t / 2,n2SE(ˆ0 )  0  ˆ0  t / 2,n2 SE(ˆ0 )


 1 x2  21 x2 
ˆ0  t / 2,n2 ˆ 2     0  ˆ0  t / 2,n2 ˆ   
 n Sxx   n Sxx 

 e i
2

ˆ 2
 i1

n  2
unde este estimatorul dispersiei
modelului.

3
3. Analiza varianţei pentru modelul de regresie

 Abaterea totala = abaterea explicata + Abaterea


reziduala

(Yi - Y)  (Y
ˆ - Y)  (Y- Y
i i
ˆ)
i

Descompunerea variaţiei

Y 
SSE =(Yi - Yi )2 ^ Xi
_  β^ +β 1

SST = (Yi - Y)2


0
Yi =

 _
SSR = (Yi - Y)2 _
Y

X
X Xi
8

4
ANOVA pentru regresie

(Y  Y)  (Yˆ  Y)  (Y  Yˆ )


i
2
i
2
i i
2

SST = SSR + SSE


SST = Total Sum of Squares
_
Măsoară variaţia valorilor observate Yi în jurul mediei Y

SSR = Regression Sum of Squares


Măsoară variaţia explicată de modelul de regresie

SSE = Error Sum of Squares


Măsoară variaţia ce poate fi atribuită altor factori, diferiţi
9
de variabila explicativă X

Tabelul ANOVA
Variatia Suma patratelor Grade Media F
de patratelor
libertate (Mean
Square)
n MSR=SSR/k MSR
Datorata SSR   ( yˆi  y ) 2 k
i 1 MSE
regresiei
n n MSE=SSE/(n-
Reziduala SSE   ( yi  yˆi ) 2   ei 2 n-k-1 k-1)
i 1 i 1

SST   ( yi  y ) 2 SST
Totala n-1
i n 1

k-numărul de variabile independente,


K=1 in cazul regresiei simple liniare

10

5
 Testul
F= MSR/MSE
 este folosit la verificarea validităţii modelului.
 Un model este valid dacă proporţia varianţei
explicate prin model este semnificativă. Ipoteza
nulă pentru testul F in cazul acesta este cea de
model nevalid.

11

4. Determinarea si testarea raportului de


corelatie si a coeficientului de corelatie

 Formula de calcul:

SSR SSE
R   1 
SST SST

 Testarea semnificatiei se
face utilizand statistica F: n  k 1 R2
F 
k 1 R2

 Daca Fcalc>Fά;k;n-k-1, Raportul


de corelatie este semnificativ
statistic

12

6
Coeficientul de determinaţie R2
 Este o măsură a proporţiei varianţei explicate de
model

n n

SSR  e
( yˆ  y )i
2
i
2

R2   i 1
 1 i 1
0,1
SST ( y  y) i
2
( y  y)i
2

i i

13

Coeficientul de determinaţie R2
ajustat

 R2 este afectat de creşterea numărului de


parametri;
 Pentru modele cu multi parametri se
calculează R2 ajustat, care are aceeaşi
interpretare.
n 1  n 1 
2
Radj  1  (1  R 2 )  1  ,1
n  k 1  n  k 1 

14

7
Coeficientul de corelatie
 Estimatorul coeficientului de corelatie este de medie r
si abatere medie patratica:

1 r 2
sr 
n2

 Testarea se face folosind statistica t: t=r/sr


 Daca
t calc  t ;n  2

 atunci coeficientul de corelatie este semnificativ


statistic
15

Exemplu
 Se consideră datele din exemplul rezolvat în
capitolul anterior.
 Sa se testeze parametrii modelului estimati.
 Sa se testeze coeficientul de corelatie
 Verificati rezultatele folosind functiile Excel.

 A se vedea pentru rezolvare fisierul ek2.xls

16

8
Predicţia folosind modelul de regresie

 1. Tipuri de predicţii
 Estimări punctuale
 Estimări pe intervale de încredere

 2. Care e obiectul predicţiei?


 Media populaţiei E(Y) pentru o valoare
particulară a lui X
 Valoarea individuală (Yi) pentru o valoare
particulară a lui X

17

Interval de încredere pentru media lui Y

şi
Yˆ  t / 2, n  2  SYˆ  E (Y )  Yˆ  t / 2, n  2  SYˆ
unde
n

1 x  x
2
e 2
i
SYˆ  ˆ  ˆ 2 
p i 1
n
n2
x  x
n 2
i
i 1
18

9
Factori care afectează lungimea intervalului de încredere

 1. Nivelul de încredere (1 - )
 Creşterea nivelului de încredere duce la creşterea
intervalului de încredere
 2. Dispersia datelor (σ)
 Creşterea dispersiei duce la creşterea intervalului
de încredere
 3. Volumul eşantionului
 Creşterea volumului eşantionului duce la
micşorarea intervalului de încredere
 4. Distanţa lui Xp faţă de mediaX
 Creşterea acestei distante duce la creşterea
intervalului de încredere 19

 Temă

 Care este funcţia în Excel care produce


valorile t ale statisticii Student?

20

10
Referinte
 Andrei, T., Bourbonnais, R.- Econometrie,
Ed. Economica, Bucuresti, 2008- capitolul 3,
pag. 77-104

 Voineagu, V. si colectiv- Teorie si practica


econometrica, Ed. Meteor Press, 2007, cap.
4.1.4 si 4.1.5 pag. 178-193

21

11

S-ar putea să vă placă și