Sunteți pe pagina 1din 22

1

MODELUL DE REGRESIE LINIAR UNIFACTORIAL (I)


Curs 4
Regresia scurt istoric
Sir Francis Galton (1822-1911) spirit enciclopedic al
perioadei victoriene, este cel care a introdus termenii de regresie
i corelaie statistic
Originea regresiei ca metod statistic se afl n studiile sale
de genetic aplicat n studiul plantelor- 1877
Plantnd boabe dintr-un anumit soi de mazre dulce a
observat c exist o legtur liniar ntre diametrele
acestor boabe i diametrele boabelor recoltate de la noile
plante. El a numit iniial panta acestei drepte coefficient of
reversion, schimbndu-i apoi numele n coefficient of
regression.
Termenul de regresie provine de la descoperirile sale n
domeniul ereditii: nalimea copiilor provenii din tai foarte
nali se apropie mai mult de nlimea medie dect nlimea
tailor.
3
CE ESTE REGRESIA?
Modelul econometric modeleaz dependena variabilelor
complexe de un ansamblu de factori principali i secundari,
sistematici sau aleatori, care acioneaz n acelai sens sau n
sensuri diferite
Regresia este o metod statistic pentru studiul
relaiei ntre o variabil dependent i una sau mai
multe variabile independente

Cauze
Funcia
Efect
Variabile
independente
f
Variabila
dependent
f(x1,x2,...,xn)=Y
4
REGRESIA Cnd i cum o utilizm?
Regresia se folosete pentru:
a determina o relaie cauzal
a testa o relaie cauzal
a previziona o variabil dependent n funcie de
una sau mai multe variabile independente
a explica efectul n funcie de cauze

Regresia liniar descrie relaia liniar dintre
o variabil cauz, reprezentat pe axa ox i o
variabil efect reprezentat pe axa oy
5
Specificarea unui model de regresie(1/2)
Modelul liniar general de regresie unifactorial:
Y=o+|x + c


Parametrul | arat modificarea proporional a variabilei efect (Y) la
modificarea cu o unitate a variabilei cauz (X).

Parametrul o arat punctul n care linia intercepteaz (taie) axa OY

c
i
reprezint componenta rezidual (eroarea aleatoare) pentru
fiecare unitate, adic partea din valoarea variabilei Y care nu poate fi
msurat prin relaia sistematic existent cu variabila X.
Componenta predictibil Variabila/eroarea aleatoare
6
Specificarea unui model de regresie(2/2)
Modelul liniar unifactorial y=1+0,5x
X
Y

1.0
1
0,5
X
Y



Exemplu model de regresie(1/3)
1 0 <
c
c
<
V
C
Etapa 1: Identificarea i specificarea modelului
Legea psihologic fundamental sau nclinatia spre consum a lui Keynes:
psihologia colectivitii este de aa natur, nct atunci cnd se mrete
venitul real global, consumul global crete, dar nu cu aceeai mrime ca
venitul
V C
2 1
| | + = 1 0
2
< < |
c | | + + = V C
2 1
1 0
2
< < |
nclinaia marginal spre consum este inclus n intervalul (0,1):




Specificarea modelului matematic:
Specificarea modelului econometric:
Etapa 2: Obinerea
datelor i estimarea
modelului
Obinerea datelor
Simple
Agregate
Estimarea parametrilor
modelului econometric
Analiza de regresie
Testarea ipotezelor
y = 0,8222x - 6915,7
-100000
0
100000
200000
300000
400000
500000
0 100000 200000 300000 400000 500000 600000
PIB (milioane lei preuri curente)
(1990-2006)
C
o
n
s
u
m

p
o
p
u
l
a

i
e

(
m
i
l
i
o
a
n
e

l
e
i

p
r
e

u
r
i

c
u
r
e
n
t
e
)
(
1
9
9
0
-
2
0
0
6
)
Exemplu model de regresie(2/3)
Etapa 3: Interpretri i previziune
Dac se ateapt ca PIB pe locuitor n anul 2007 s fie de
400000 mil lei preuri curente consumul previzionat al
populaiei va fi de:
y=-6915,7+0,8222*400000=321964,3

Presupunem c guvernul susine c un nivel al consumului
populaiei de 330000 mil lei preuri curente va menine
omajul la un nivel de aproximativ 6%. Care este nivelul
venitului care garanteaz nivelul int al consumului
populaiei?
y=330000 x=409773

Exemplu model de regresie(3/3)
Modelul liniar de regresie unifactorial
Modelul de regresie liniar la nivelul populaiei
Y X
i i i
= + + o | c
|
i
X = +
E(Y/Xi)
o
c
i
= Eroarea
Valoarea observat
Y
X
Valoarea
observat
Xi
Modelul liniar de regresie unifactorial
Se efectueaz o selecie de volum n : (x
i
,y
i
)
i=1...n

Pe baza acestei selecii se estimeaz parametrii ecuaiei de
regresie liniar simpl, i .

Modelul de regresie liniar la nivelul eantionului


cu componenta predictibil:
este estimatorul punctului de intercepie (o) obinut pe baza datelor din
eantion
este estimatorul pantei liniei drepte (|) obinut pe baza datelor din
eantion
este valoarea rezidual (pentru unitatea i) n eantion:

i i i i i
Y X b a Y c c

+ = + + =
i i
X b a Y + =

a
b

i i i
X b a Y + =


c
12
Etapele modelrii econometrice(1/6)
1. Specificarea modelului
- precizarea variabilei endogene Y i a variabilei exogene X
y=f(x)+
2. Identificarea modelului
- alegerea unei funcii care descrie valorile vb. endogene n funcie de variaia vb. exogene
- se realizeaz cu ajutorul procedeului grafic sau a calculelor algebrice (analiza de varian)





y
i
= componenta predictibil (deterministic) + eroarea aleatoare

3. Estimarea parametrilor modelului
- metoda minimizrii sumei ptratelor erorilor (MCMMP)


= =
i
i i
i
i
x b a y b a S
2 2
)

( min min ) , ( c
i i i i i
Y X b a Y c c

+ = + + =
i i
X b a Y + =

13
Etapele modelrii econometrice(2/6)
- se obine sistemul de ecuaii normale:






- prin rezolvarea sistemului avem:

= +
= +


= = =
= =
n
i
i i
n
i
i
n
i
i
n
i
i
n
i
i
y x x b x a
y x b na
1 1
2
1
1 1
( )
( )


=
A
A
=


=
A
A
=




2
2
2
2
2
i i
i i i i
i i
i i i i i
x x n
y x y x n
b
b
x x n
y x x x y
a
a
( )( )
( )

=
|
.
|

\
|

= =


=
=
= =
2
1
2
1
2
2
1 1
x
xy
n
i
i
i
n
i
i
i
i
i
i i
n
i
i
n
i
i
s
s
n
x x
n
y y x x
x n x
y x n y x
b
n
x b y
x b y a
14
Estimatorul a :
este denumit i termen liber(intercept);
are caracter de mrime medie indic valoarea variabilei rezultative
cnd toi factorii neeseniali au o aciune constant (este nivelul mediu al
variabilei y determinat prin influena celorlali factori, n afara lui);
n reprezentarea grafic, indic punctul de ntlnire dintre axa OY i
panta dreptei de regresie;
valoarea pozitiv (a > 0) sau negativ (a < 0) nu are nici o relevan n
modelul regresiei.

Estimatorul b (coeficient de regresie):
Arat gradul de influen a variabilitii factoriale asupra rezultativei (cu
ct variaz n medie rezultativa n condiiile modificrii cu o unitate a lui
X)
Arat direcia legturii:
b>0, legtur direct (creterea valorilor variabilei factoriale determin
o cretere a valorilor ecuaiilor de regresie i invers).
b<0, legtur invers sau indirect (creterea valorilor variabilei
factoriale determin o scdere a valorilor ecuaiilor de regeresie i
invers).
b=0, nu exist legtur; variabilele sunt independente valoarea medie a
caracteristicii factoriale este egal cu cea a caracteristicii rezultative).

Etapele modelrii econometrice(3/6)
15
Etapele modelrii econometrice(4/6)
- dup determinarea coeficienilor a i b se calculeaz valorile ajustate:


- se obine astfel:



- n cazul legturii simple liniare o msur relativ a dependenei dintre dou variabile o
constituie coeficientul de corelaie liniar Pearson (semnul arat direcia legturii, iar
valoarea intensitatea legturii)

i i
bx a y

+ =

= =
=
n
i
i
n
i
i
y y
1 1
(

= =

= =
=
n
i
i
n
i
i
n
i
i i
y x
xy
y x
xy
) y y ( ) x x (
) y y )( x x (
s s
s
s s
) y , x cov(
r
1
2
1
2
1
16
Etapele modelrii econometrice(5/6)
- coeficientul de corelaie liniar Pearson se poate determina:
*
n
i
n
i
i i
n
i
n
i
i i
n
i
n
i
n
i
i i i i
xy
b
y y n x x n
y x y x n
r
A A
A
=
(
(

|
.
|

\
|

(
(

|
.
|

\
|

=


= = = =
= = =
1
2
1
2
1
2
1
2
1 1 1

= =
|
.
|

\
|
= A
n
i
n
i
i i
*
y y n
1
2
1
2
2
x
xy
s
s
b =
y
x
s
s
b r =
17
Etapele modelrii econometrice(6/6)
4. Evaluarea validitii modelului
- se verific dac variaia lui X este un bun predictor pentru variaia lui Y
- presupune:
I. Inferenta statistica pentru parametrii modelului de regresie

II. Testarea validitii modelului de regresie folosind metoda ANOVA

III. Determinarea masurii calitatii ajustarii

IV. Verificarea ipotezelor modelului de regresie


5. Realizarea de predicii utiliznd modelul de regresie
18
3.Estimarea parametrilor modelului de
regresie-exemplu(1/5)
Pentru 15 ageni de asigurri, angajai ai unei companii de asigurri de via, se
cunosc datele privind timpul mediu (n minute) petrecut de un agent cu un
potenial client i numrul de polie ncheiate de fiecare ntr-o sptmn.
Timp mediu
(min.)
25 23 30 25 20 33 18 21 22 30 26 26 27 29 20
Nr. polie
10 11 14 12 8 18 9 10 10 15 11 15 12 14 11
S se estimeze parametrii modelului liniar de regresie;
S se calculeze valorile estimate de model si erorile;
Sa se masoare intensitatea legaturii dintre cele doua variabile utilizand
coeficientul de corelatie liniara Pearson.
19
y = 0.5492x - 1.7311
R
2
= 0.7808
0
2
4
6
8
10
12
14
16
18
20
0 5 10 15 20 25 30 35
timp mediu (min.)
n
r
.

p
o
l
i

e
3.Estimarea parametrilor modelului de
regresie-exemplu(2/5)
20
Nr.
obs.
1 25 10 625 250 12

14 29 14 841 406 14,1968
15 20 11 400 220 9,254
i i
x y
b
a
b a
b a
5492 , 0 73 , 1

5492 , 0
73 , 1
4645 9639 375
180 375 15
+ =

=
=

= +
= +
i
x
i
y
2
i
x
i i
y x
i
i
x 5492 , 0 73 , 1 y + =
375 =
i
x
180 =
i
y 9639
2
=
i
x 4645 =
i i
y x
Timpul mediu
(min.)
Nr. Polie

180 =
i
y
3.Estimarea parametrilor modelului de
regresie-exemplu(3/5)
21
Interpretare: b = + 0,5492
se numete coeficient de regresie reprezentnd panta dreptei de regresie

b > 0, deci ntre timpul mediu petrecut de un agent cu un potenial client
i numrul de polie ncheiate de fiecare agent exist o legtur direct

la creterea cu un minut a timpul mediu petrecut de un agent cu un
potenial client, numrul de polie ncheiate se mrete cu 0,5495 (deci
ntr-un minut se completeaz o jumtate de poli)

3.Estimarea parametrilor modelului de
regresie-exemplu(4/5)
22
In tabelul alaturat sunt prezentate
valorile estimate ale numarului de
polite pe baza modelului de regresie
simpla si erorile determinate ca
diferenta intre valorile reale(empirice)
ale numarului de polite si cele
estimate pe baza modelului.

Intensitatea legaturii dintre cele doua
variabile a fost determinata pe baza
coeficientului de corelatie liniara
r=0.8836, ceea ce evidentiaza o
legatura directa, puternica intre cele
doua variabile.
3.Estimarea parametrilor modelului de
regresie-exemplu(5/5)
Coeficientul de corelatie liniara Pearson se determina in
Excel pe baza comenzii: correl(var.X, var.Y).

S-ar putea să vă placă și