Sunteți pe pagina 1din 25

Curs 5

MODELUL DE REGRESIE LINIAR UNIFACTORIAL (II)

Etapele modelrii econometrice(1/2)


1.

Specificarea modelului

- precizarea variabilei endogene Y i a variabilei exogene X

y=f(x)+

2.

Identificarea modelului

- alegerea unei funcii care descrie valorile vb. endogene n funcie de variaia vb. exogene
- se realizeaz cu ajutorul procedeului grafic sau a calculelor algebrice (analiza de varian)

Yi a b X i i Yi i
Yi a b X i

yi = componenta predictibil (deterministic) + eroarea aleatoare

3.

Estimarea parametrilor modelului

- metoda minimizrii sumei ptratelor erorilor (MCMMP)

S (a, b) min i2 min ( yi a bxi ) 2


i

Etapele modelrii econometrice(2/2)


4. Evaluarea validitii modelului

I.

- se verific dac variaia lui X este un bun predictor pentru variaia lui Y
- presupune:
Inferenta statistica pentru parametrii modelului de regresie

II.

Testarea validitii modelului de regresie folosind metoda ANOVA

III.

Determinarea masurii calitatii ajustarii

IV.

Verificarea ipotezelor modelului de regresie

5. Realizarea de predicii utiliznd modelul de regresie

I.Inferenta statistica pentru parametrii modelului


de regresie(1/10)
Inferena statistic parametrii modelului se poate realiza prin:

Testarea

ipotezei

statistice

referitoare

la

semnificaia

parametrilor modelului de regresie;

Estimarea pe interval de ncredere a parametrilor modelului din


colectivitatea total.

n cazul regresiei liniare coeficienii ecuaiei de regresie n eantion, a i


b, sunt estimaii ale coeficienilor ecuaiei de regresie n populaia
general i .

I.Inferenta statistica pentru parametrii modelului


de regresie(2/10)

I.Inferenta statistica pentru parametrii modelului


de regresie(3/10)
Teorema
Dac variabila rezidual este repartizat normal cu
media zero i dispersia
un

estimator

2
e

nedeplasat

1
2
, atunci S e
n2

pentru

ei 2

este

i 1

dispersia

variabilei

e .
reziduale

I.Inferenta statistica pentru parametrii modelului


de regresie(4/10)

I.Inferenta statistica pentru parametrii modelului


de regresie(5/10)

I.Inferenta statistica pentru parametrii modelului


de regresie(6/10)

Testul bilateral:
H0: = 0(parametrul nu este semnificativ statistic)
H1: 0(parametrul este semnificativ statistic)
Daca esantionul este de volum mare:
b M b b 0
Testul z:
s b s e2
z

calc

sb

sb

( xi x ) 2
i 1

sb= abaterea standard a estimatorului b;


Regiunea critic: daca z calc z / 2 sau

se
n

( x
i 1

x )2

z calc z / 2 se respinge Ho.

Intervalul de incredere pentru :

b z / 2 sb b z / 2 sb
9

I.Inferenta statistica pentru parametrii modelului


de regresie(7/10)

Dac eantionul este de volum mic:

Testul t:

tcalc

b M b b 0 b

sb
sb
sb

sb= abaterea standard a estimatorului b;

s b s e2

1
n

( xi x ) 2
i 1

t / 2,n 2

Regiunea critic: dac t calc


H0.

Intervalul de ncredere pentru :

saut calc t / 2 , n 2

se
n

( x
i 1

x )2

se respinge

b t / 2 , n 2 s b b t / 2 , n 2 s b
10

I.Inferenta statistica pentru parametrii modelului


de regresie(8/10)
2. Testarea parametrului :

11

I.Inferenta statistica pentru parametrii modelului


de regresie(9/10)

Testul bilateral:
H0: = 0(parametrul nu este semnificativ statistic)
H1: 0(parametrul este semnificativ statistic)
Daca esantionul este de volum mare:
Testul z: a M a a 0

zcalc

sa

sa

sa= abaterea standard a estimatorului a;

s a se

x
n

( x
i 1

Regiunea critic: daca z calc z / 2 sau

x )2

se

x
i 1

2
i

n ( xi x ) 2
i 1

z calc z / 2 se respinge Ho.

Intervalul de incredere pentru :

a z / 2 sa a z / 2 sa
12

I.Inferenta statistica pentru parametrii modelului


de regresie(10/10)

Dac eantionul este de volum mic:

Testul t:

tcalc

a M a a 0 a

sa
sa
sa
n

1
s

a
e
sa= abaterea standard a estimatorului a;
n

x
n

( x
i 1

t / 2,n 2

Regiunea critic: dac t calc


H0.

Intervalul de ncredere pentru :

x)

saut calc t / 2 , n 2

se
2

x
i 1

2
i

n ( xi x ) 2
i 1

se respinge

a t / 2, n 2 sa a t / 2, n 2 sa
13

I.Inferenta statistica privind parametrii modelului de


regresie-exemplu(1/6)
Pentru 15 ageni de asigurri, angajai ai unei companii de asigurri de via, se
cunosc datele privind timpul mediu (n minute) petrecut de un agent cu un
potenial client i numrul de polie ncheiate de fiecare ntr-o sptmn.

Timp mediu
(min.)

25 23 30 25 20 33 18 21 22 30 26 26 27 29 20

Nr. polie 10 11 14 12 8 18 9 10 10 15 11 15 12 14 11

S se testeze semnificatia parametrilor modelului de regresie;


S se determine intervalele de incredere ale acestora;
Sa se masoare intensitatea legaturii dintre cele doua variabile utilizand
coeficientul de corelatie liniara Pearson si sa se testeze semnificatia acestuia.

14

I.Inferenta statistica privind parametrii modelului de


regresie-exemplu(2/6)

15

I.Inferenta statistica privind parametrii modelului de


regresie-exemplu(3/6)
Nr.
obs.

xi2

Timpul mediu
xi
(min.)

Nr. Polie

25

10

625

250

12

14

29

14

841

406

14,1968

15

20

11

400

220

9,254

375

yi

180 xi2 9639

x i yi

x y
i

y i 1,73 0,5492 x i

4645

180

a 1,73

y i 1,73 0,5492 xi

375a 9639b 4645 b 0,5492

15a 375b 180

16

I.Inferenta statistica privind parametrii modelului de


regresie-exemplu(4/6)

R2=78.07%

nu este semnificativ
diferit de zero
este semnificativ diferit
de zero

Fcalc=46.30
modelul este valid

17

I.Inferenta statistica privind parametrii modelului de


regresie-exemplu(5/6)

nu este semnificativ
diferit de zero
este semnificativ diferit
de zero

Testm ipotezele
a) H0: = 0
H1: 0

t 1calc

a 1.73

0.846
sa 2.046

tcritic t0, 025;13 2,160

b) H0: = 0
H1: 0

calc

b 0.549

6.804
sb
0.08

Deoarece n = 15 30 avem eantion de volum redus i pentru testare vom


utiliza testul t.
18

I.Inferenta statistica privind parametrii modelului de


regresie-exemplu(6/6)
Decizia:
Deoarece

1
t calc
t / 2;n 2 0.846 2.160

, se acc.Ho, ceea ce nseamn c nu

este semnificativ diferit de zero, deci nu este semnificativ statistic.

Deoarece

2
tcalc
t / 2;n 2 6.804 2.160

, se resp.Ho, se acc.H1, ceea ce inseamna

ca este semnificativ diferit de zero, deci este semnificativ statistic.

19

Despre P-value(1/2)
naintea nceperii unui test statistic clasic, se pune problema alegerii
unui nivel de semnificaie. Acesta exprim riscul maximal de a grei pe
care suntem dispui s-l acceptm (de regul 5%, 1% sau chiar mai mic)
atunci cnd lum decizia de respingere a ipotezei nule.
Softul modern ofer posibilitatea invers. Anume, este evaluat riscul
de a lua decizia greit, pe baza datelor de care dispunem, rmnnd la
latitudinea fiecruia dac i asum sau nu acest risc. Acest risc evaluat pe
baza datelor apare n tabele, la fiecare test de semnificaie, i se numete
valoarea p (p-value).
Pentru ca un coeficient s fie semnificativ diferit de zero, deci
variabila independenta asociat lui s influeneze variabila dependent,
trebuie ca n coloana P-value s avem valori mai mici decat pragul de
semnificatie(5%).

20

Despre
Pvalue(2/2)
Pentru parametrul :
Probabilitatea critic P-value = 0.412843 > (0,05) pragul de semnificaie,
putem afirma c dac respingem ipoteza nula potrivit creia interceptul este
egal cu zero, facem o eroare mare(41.28%). Prin urmare se accepta Ho,
potrivit careia parametrul nu este semnificativ diferit de zero.
Pentru parametrul :
Probabilitatea critic P-value = 0,000013 < (0,05) pragul de semnificaie,
putem afirma c dac respingem ipoteza nula c parametrul este egal cu
zero, facem o eroare foarte mica de 0.0013%. Prin urmare, respingem deci
aceast afirmaie i acceptm ca adevrat ipoteza c este diferit de zero.

21

Intervalele
modelului

de

ncredere

pentru

parametrii

Intervalul de ncredere pentru :

a t / 2, n 2 sa a t / 2, n 2 sa
1.73 2.160 2.046 1.73 2.160 2.046
6.15 2.68

Intervalul de ncredere pentru :

b t / 2 , n 2 s b b t / 2 , n 2 s b
0.549 2.160 0.08 0.549 2.160 0.08

0.374 0.723

22

Testarea semnicaiei
corelaie r(1/3)

coeficientului

liniar

de

23

Testarea semnicaiei
corelaie r(2/3)

coeficientului

liniar

de

Este un indicator sintetic care msoar intensitatea legturii liniare dintre


dou variabile i se calculeaz ca medie a produselor abaterilor normale
n
n
n
normate

n xi y i xi y i

cov( x, y )
r

sx s y

i 1

i 1

n 2
n x xi n y i
i 1 i 1

i 1
n

2
i

1,1

i 1

y
i 1

Testarea semnificaiei coeficientului liniar de corelaie (r) se poate efectua cu


testul t (Student):

H 0 : 0 (nu este semnificativ statistic)


H1 : 0 ( este semnificativ statistic)
Statistica testului: t
Decizia: daca

calc

r n2
1 r

t critic t / 2,n 2

t calc t critic (t / 2,n 2 ) , se resp.Ho, se acc.H1,

semnificativ statistic.

este

Testarea semnicaiei
corelaie r(3/3)

coeficientului

liniar

de

Validarea coeficientului de corelaie determinat anterior (r=0.8836):


E1:

H0 : 0

(nu este semnificativ statistic)

E2:

H1 : 0

(este semnificativ statistic)

E3: Se alege nivelul de ncredere al testului statistic (1 ) 95% 0.05


E4: Se calculeaz valoarea numeric a testului statistic (Student):

tcalc

r n2
1 r2

0,8836 15 2
1 0,8836 2

3,185
6,804
0,468

E5: Se determin din tabelul cu valorile repartiiei t (Student) n funcie de

i numrul gradelor de libertate (n-2): t critic

E6: Decizia:

tcalc t / 2,n 2

semnificativ statistic.

t0, 025;13 2,160

se resp.Ho, se acc.H1, coeficientul de corelatie

este

25