Sunteți pe pagina 1din 22

Curs 4

MODELUL DE REGRESIE LINIAR UNIFACTORIAL (I)

Regresia scurt istoric

Sir Francis Galton (1822-1911) spirit enciclopedic al perioadei


victoriene, este cel care a introdus termenii de regresie i corelaie
statistic

Originea regresiei ca metod statistic se afl n studiile sale de


genetic aplicat n studiul plantelor- 1877
Plantnd boabe dintr-un anumit soi de mazre dulce a
observat c exist o legtur liniar ntre diametrele acestor
boabe i diametrele boabelor recoltate de la noile plante. El
a numit iniial panta acestei drepte coefficient of reversion,
schimbndu-i apoi numele n coefficient of regression.

Termenul de regresie provine de la descoperirile sale n


domeniul ereditii: nalimea copiilor provenii din tai foarte
nali se apropie mai mult de nlimea medie dect nlimea
tailor.

CE ESTE REGRESIA?

Modelul econometric modeleaz dependena variabilelor


complexe de un ansamblu de factori principali i secundari,
sistematici sau aleatori, care acioneaz n acelai sens sau n
sensuri diferite

Regresia este o metod statistic pentru studiul


relaiei ntre o variabil dependent i una sau mai
multe variabile independente

Funcia
Cauze
Variabile
independente

Efect
Variabila
dependent

f(x1,x2,...,xn)=Y
3

REGRESIA Cnd i cum o utilizm?


Regresia se folosete pentru:

a determina o relaie cauzal


a testa o relaie cauzal
a previziona o variabil dependent n funcie de una sau mai multe variabile
independente
a explica efectul n funcie de cauze

Regresia liniar descrie relaia liniar dintre o variabil cauz,


reprezentat pe axa ox i o variabil efect reprezentat pe axa oy

Specificarea unui model de regresie(1/2)


Modelul liniar general de regresie unifactorial:
Y=+x +
Componenta predictibilVariabila/eroarea aleatoare

Parametrul arat modificarea proporional a variabilei efect (Y) la


modificarea cu o unitate a variabilei cauz (X).

Parametrul arat punctul n care linia intercepteaz (taie) axa OY

i reprezint componenta rezidual (eroarea aleatoare) pentru


fiecare unitate, adic partea din valoarea variabilei Y care nu poate fi
msurat prin relaia sistematic existent cu variabila X.

Specificarea unui model de regresie(2/2)

1.0

0,5

Modelul liniar unifactorial y=1+0,5x


6

Exemplu model de regresie(1/3)

Etapa 1: Identificarea i specificarea modelului

Legea psihologic fundamental sau nclinatia spre consum a lui Keynes:


psihologia colectivitii este de aa natur, nct atunci cnd se mrete
venitul real global, consumul global crete, dar nu cu aceeai mrime ca
venitul
nclinaia marginal spre consum este inclus n intervalul (0,1):
0

C
1
V

Specificarea modelului matematic: C 1 2V


Specificarea modelului econometric: C 1 2V

0 2 1
0 2 1

Exemplu model de regresie(2/3)

Etapa 2: Obinerea
datelor i estimarea
modelului
Obinerea datelor
Simple
Agregate
Estimarea parametrilor
modelului econometric
Analiza de regresie
Testarea ipotezelor

Exemplu model de regresie(3/3)

Etapa 3: Interpretri i previziune


Dac se ateapt ca PIB pe locuitor n anul 2007 s fie de
400000 mil lei preuri curente consumul previzionat al
populaiei va fi de:

y=-6915,7+0,8222*400000=321964,3

Presupunem c guvernul susine c un nivel al consumului


populaiei de 330000 mil lei preuri curente va menine
omajul la un nivel de aproximativ 6%. Care este nivelul
venitului care garanteaz nivelul int al consumului
populaiei?
y=330000 x=409773

Modelul liniar de regresie unifactorial


Modelul de regresie liniar la nivelul populaiei

Yi X i i

Valoarea
observat

i = Eroarea
E(Y/Xi) X i
Xi
Valoarea observat

Modelul liniar de regresie unifactorial


Se efectueaz o selecie de volum n : (xi,yi)i=1...n
Pe baza acestei selecii se estimeaz parametrii ecuaiei de
regresie liniar simpl, i .
Modelul de regresie liniar la nivelul eantionului

Yi a b X i i Yi i
cu componenta predictibil:

Yi a b X i

b este estimatorul pantei liniei drepte () obinut pe baza datelor din eantion

este estimatorul punctului de intercepie () obinut pe baza datelor din


eantion

este valoarea rezidual (pentru unitatea i) n eantion:

i Yi a b X i

Etapele modelrii econometrice(1/6)


1.

Specificarea modelului

- precizarea variabilei endogene Y i a variabilei exogene X

y=f(x)+

2.

Identificarea modelului

- alegerea unei funcii care descrie valorile vb. endogene n funcie de variaia vb. exogene
- se realizeaz cu ajutorul procedeului grafic sau a calculelor algebrice (analiza de varian)

Yi a b X i i Yi i
Yi a b X i

yi = componenta predictibil (deterministic) + eroarea aleatoare

3.

Estimarea parametrilor modelului

- metoda minimizrii sumei ptratelor erorilor (MCMMP)

S (a, b) min i2 min ( yi a bxi ) 2


i

12

Etapele modelrii econometrice(2/6)


-

se obine sistemul de ecuaii normale:

i 1

i 1

na b xi yi

i 1

i 1

a
x i b x xi y i

2
i

i 1

prin rezolvarea sistemului avem:

yi xi2 xi xi yi
n x xi
2
i

a y bx

i 1

y i b

i 1

xi

x
n

b n x i y i x i y i
2
b
n xi2 xi

yi n x y

xi2 n x
i

i 1

i 1

x
n

13

s xy
s x2

Etapele modelrii econometrice(3/6)

Estimatorul a :
este denumit i termen liber(intercept);
are caracter de mrime medie indic valoarea variabilei rezultative cnd toi factorii
neeseniali au o aciune constant (este nivelul mediu al variabilei y determinat prin influena
celorlali factori, n afara lui);
n reprezentarea grafic, indic punctul de ntlnire dintre axa OY i panta dreptei de regresie;
valoarea pozitiv (a > 0) sau negativ (a < 0) nu are nici o relevan n modelul regresiei.
Estimatorul b (coeficient de regresie):
Arat gradul de influen a variabilitii factoriale asupra rezultativei (cu ct variaz n medie
rezultativa n condiiile modificrii cu o unitate a lui X)
Arat direcia legturii:
b>0, legtur direct (creterea valorilor variabilei factoriale determin o cretere a valorilor
ecuaiilor de regresie i invers).
b<0, legtur invers sau indirect (creterea valorilor variabilei factoriale determin o scdere
a valorilor ecuaiilor de regeresie i invers).
b=0, nu exist legtur; variabilele sunt independente valoarea medie a caracteristicii factoriale
este egal cu cea a caracteristicii rezultative).

14

Etapele modelrii econometrice(4/6)


-

dup determinarea coeficienilor a i b se calculeaz valorile ajustate:

y i a bxi
-

se obine astfel:
n

y
i 1

y
i 1

n cazul legturii simple liniare o msur relativ a dependenei dintre dou variabile o
constituie coeficientul de corelaie liniar Pearson (semnul arat direcia legturii, iar
valoarea intensitatea legturii)
n

s xy
cov( x , y )
rxy

sx s y
sx s y

( x

i 1

x )( y i y )

( xi x )
i 1

2

i 1

( yi y )2
15

Etapele modelrii econometrice(5/6)


- coeficientul de corelaie liniar Pearson se poate determina:
n

rxy

i 1

i 1

i 1

n xi y i xi y i

2
n xi

i 1

x
i 1

2
n yi
i 1

i 1

* n yi2

s xy
s x2

y
i 1

b
*

i 1

yi

sx
r b
sy
16

Etapele modelrii econometrice(6/6)


4. Evaluarea validitii modelului

I.

- se verific dac variaia lui X este un bun predictor pentru variaia lui Y
- presupune:
Inferenta statistica pentru parametrii modelului de regresie

II.

Testarea validitii modelului de regresie folosind metoda ANOVA

III.

Determinarea masurii calitatii ajustarii

IV.

Verificarea ipotezelor modelului de regresie

5. Realizarea de predicii utiliznd modelul de regresie

17

3.Estimarea
parametrilor
regresie-exemplu(1/5)

modelului

de

Pentru 15 ageni de asigurri, angajai ai unei companii de asigurri de via, se


cunosc datele privind timpul mediu (n minute) petrecut de un agent cu un
potenial client i numrul de polie ncheiate de fiecare ntr-o sptmn.

Timp mediu
(min.)

25 23 30 25 20 33 18 21 22 30 26 26 27 29 20

Nr. polie 10 11 14 12 8 18 9 10 10 15 11 15 12 14 11

S se estimeze parametrii modelului liniar de regresie;


S se calculeze valorile estimate de model si erorile;
Sa se masoare intensitatea legaturii dintre cele doua variabile utilizand
coeficientul de corelatie liniara Pearson.

18

3.Estimarea
parametrilor
regresie-exemplu(2/5)

modelului

de

19

3.Estimarea
parametrilor
regresie-exemplu(3/5)
Nr.
obs.

xi2

modelului

Timpul mediu
xi
(min.)

Nr. Polie

25

10

625

250

12

14

29

14

841

406

14,1968

15

20

11

400

220

9,254

375

yi

180 xi2 9639

x i yi

x y
i

de

y i 1,73 0,5492 x i

4645

180

a 1,73

y i 1,73 0,5492 xi

375a 9639b 4645 b 0,5492

15a 375b 180

20

3.Estimarea
parametrilor
regresie-exemplu(4/5)

modelului

de

Interpretare: b = + 0,5492
se numete coeficient de regresie reprezentnd panta dreptei de regresie

b > 0, deci ntre timpul mediu petrecut de un agent cu un potenial client


i numrul de polie ncheiate de fiecare agent exist o legtur direct

la creterea cu un minut a timpul mediu petrecut de un agent cu un


potenial client, numrul de polie ncheiate se mrete cu 0,5495 (deci
ntr-un minut se completeaz o jumtate de poli)

21

3.Estimarea
parametrilor
regresie-exemplu(5/5)

In tabelul alaturat sunt prezentate


valorile estimate ale numarului de
polite pe baza modelului de regresie
simpla si erorile determinate ca
diferenta intre valorile reale(empirice)
ale numarului de polite si cele
estimate pe baza modelului.

Intensitatea legaturii dintre cele doua


variabile a fost determinata pe baza
coeficientului
de corelatie
liniara
r=0.8836, ceea ce evidentiaza o
legatura directa, puternica intre cele
doua variabile.

Coeficientul de corelatie liniara Pearson se determina in


Excel pe baza comenzii: correl(var.X, var.Y).

modelului

de

22