Sunteți pe pagina 1din 25

ECONOMETRIE

CURS 3

- note de curs -

IAI
- 2016-

C 3 - REGRESIA LINIAR SIMPL

Indicatorii de corelaie
1. Estimarea indicatorilor de corelaie (coeficient, raport)
2. Relaia coeficient corelaie - coeficient de regresie
3. Testarea indicatorilor de corelaie
4. Testarea modelului
5. Probleme specifice utiliznd SPSS si Excel

1. Estimarea indicatorilor de corelaie


Coeficientul de corelaie - se folosete doar pentru
modelul liniar
Parametrul coeficientul de corelaie ()
N

( xi x )( yi y )
cov( X , Y )
i 1
( X ,Y )
sau
x y
N x y
n

( X ,Y )

N xi yi xi yi
i 1

i 1
i 1
, -1+1
n

[ N x ( xi ) ][ N y ( yi ) 2 ]
i 1

2
i

i 1

i 1

2
i

i 1

Interpretarea lui
Coeficientul de corelaie caracterizeaz intensitatea
legturii liniare dintre dou variabile X i Y.
Astfel:
Pentru -1<0 > legtura ntre X i Y este negativ;
Pentru 0<+1 ->legtura ntre X i Y este pozitiv;
Pentru ||->0 => legtura este foarte slab
||->1=> legtura este foarte puternic.

Estimaia coeficientului de corelaie (r)


n

(x
i 1

x)( yi y )
ns x s y

i 1

i 1

i 1

n xi yi xi yi
n

[n x ( xi ) ][n y ( yi ) 2 ]
i 1

2
i

r se interpreteaz la fel ca .

i 1

i 1

2
i

i 1

Raportul de determinaie
Parametrul raportului de determinaie (2)

2

(
y

y
)
i
i

2
(y

y
)
i

VE 0<2<1
VR
, cu
1
VT

VT

VE, VT i VR reprezint parametrii variaiiei explicat,


variaia totale i variaiei reziduale.

Interpretarea raportului de determina ie


2 aparine intervalului [0; 1].
Cu ct 2 -> 0 cu att legtura este mai slab ntre
variabila dependent i variabila independent.
Cu ct 2 -> 1 cu att legtura este mai puternic ntre
variabila dependent i variabila independent.
OBS: Raportul de determinaie poate fi calculat pentru
toate tipurile de legaturi: liniare sau neliniare, simple sau
multiple.

Interpretarea lui 2 n modelul de regresie


De obicei 2 este exprimat n valoare procentual, ia valori
de la 0% la 100%, i arat ct la % din variaia variabilei
dependente (Y) este explicat de variaia variabilei
independente (X) prin modelul liniar yxi= 0 +1 X
OBS: Pentru modelul liniar simplu se stabilete urmtoarea
relaie ntre 2 i : 2=2 ||= relaie care se extinde i
asupra etimaiilor acestora: R2=r2 |r|=R

Estimaia raportului de determinaie (R2)

(y y)
=
(y y)

(b b x y)

(y y)
1

ESS
RSS
1
TSS
TSS

ESS, TSS i RSS reprezint estimaiile variaei explicate,


variaiei totale respectiv variaei reziduale.
SS-este Suma ptratelor [abaterilor] (eng. Sum of Sqare)
TSS=ESS+RSS
Interpretarea estimaiei R2 este aceeai cu cea a
parametrului 2.

Calculul TSS, ESS i RSS i determinarea


gradelor de libertate corespunztoare acestora

SST ( yi - y) 2 ; SSE (y i - y) 2 ; SSR ( yi - y i ) 2 ;


i


df T n - 1;


df E k - 1;
dfT=dfE+dfR


df R n - k

2. Relaia coeficient corelaie (r) - coeficient de


regresie (b1)
Legtura dintre estimaia coeficientului de corelaie (r) i
estimaia coeficientului de regresie liniar (b1) se
realizeaz prin relaia:

r b1
unde

2
x

s x2
sx
b1
2
sy
sy

2
y

estimaiile varianelor respectiv


s , s si sreprezint
x , sy

estimaiile abaterilor standard ale variabilelor X i Y.


OBS: n cazul modelului de regresie standardizat (s2X=1, s2Y=1) r=b1.

EXEMPLU
Se consider datele cu privire la Valoarea vnzrilor i Cheltuielile cu
publicitatea pentru un eantion de 4 firme. Datele sunt prezentate n
tabelul urmtor.
xi

yi

10

2500

20

4100

50

5000

100

7500

180

19100

Rezultatele analizei in SPSS

3. Testarea indicatorilor de corelaie


1. Testarea coeficientul de corelaie

1. Formularea ipotezelor

H0: =0

H1: 0

2. Fixarea pragului de semnificaie =0,05


t / 2, n k
3. Alegerea statisticii test

tcalc

r n2

2

1
1 r 2
n2

4. Calcularea statisticii test


5. Criterii de decizie:

tcalc

r n2
1 r2

|tcalc| tteoretic= t/2, n-2 => se accept H0 cu o probabilitate de 1-.


|tcalc| > tteoretic= t/2, n-2 => se respinge H0 cu un risc asumat .

2. Testarea raportului de corelaie


1. Formularea ipotezelor H0: =0

H1: 0

2. Fixarea pragului de semnificaie =0,05

2 n k
3. Alegerea statisticii test F
1 2 k 1

R2 n k
4. Calcularea statisticii test F
1 R2 k 1
5. Criterii de decizie:

|Fcalc| F, k-1, n-k => se accept H0 cu o probabilitate de 1-.


|Fcalc|> F , k-1, n-k => se respinge H0 cu un risc asumat .

4. Testarea modelului de regresie - testul F


omnibus
1. Formularea ipotezelor
H0: 0= 0 i 1=0
H1: 0 0 sau/si 10
2. Fixarea pragului de semnificaie =0,05

VE n k
3. Alegerea statisticii test F
VR k 1
4. Calcularea statisticii test ESS

ESS n k k 1

RSS k 1 RSS
nk
5. Criterii de decizie:
Fcalc

2
(
b

b
x

y
)
0 1i

nk
2
(
y

b
x
)
i 0 1 i k 1
i

|Fcalc| F, k-1, n-k => se accept H0 cu o probabilitate de 1-.


|Fcalc|> F , k-1, n-k => se respinge H0 cu un risc asumat .

Legatura dintre testarea lui R2 i testarea modelului


Dac l exprimm pe R2 n funcie de SS vom obine:
2

R =

2
(
b

b
x

y
)
0 1
i

2
(
y

y
)
i

ESS
RSS

1
TSS
TSS

i nlocuind n expresia lui F obinem o expresie a lui F n


funcie de SS:
ESS n k
R2 n k
F=

TSS k 1 1 R 2 k 1

5. Probleme specifice analizei de


corelaie i regresie in SPSS i EXCEL
Analiza de regresie si corelaie n SPSS
Se consider datele cu privire la Valoarea vnzrilor i
Cheltuielile cu publicitatea pentru un eantion de 4
firme.
Datele sunt prezentate n tabelul alturat.
xi

yi

10

2500

20

4100

50

5000

100

7500

180

19100

Analiza de regresie si corelaie n EXCEL


Y

25000

25000

20000

20000

15000

15000

10000

10000

5000

5000

50

100

150

200

f(x) = 92.13x + 1006.98


R = 0.93

0 20 40 60 80 100120140160180200

Analiza de regresie si corelaie n EXCEL


SUMMARY OUTPUT
Regression Statistics
Multiple R
0.977
R Square
0.954
Adjusted R Square
0.931
Standard Error
550.556
Observations
4.000

ANOVA
df

SS

MS

Regression 1 12501275.510 12501275.510 41.243


Residual
Total

2
606224.490
3 13107500.000

303112.245

Significance F
0.023

X
X
Y

Y
1
0.977

Coefficients Standard Error t Stat P-value Lower 95% Upper 95%


Intercept
X

2502.041
50.510

448.379 5.580
7.865 6.422

0.031
0.023

572.821
16.669

4431.260
84.351

S-ar putea să vă placă și