Sunteți pe pagina 1din 19

Msurarea intensitii legturilor dintre dou

variabile
Indicatori cantitativi ai intensitii legturilor dentre dou
variabile
Covariana
Coeficientul de corelaie
Raportul de corelaie
Testarea semnificaiilor indicatorilor intensitii legturilor
dintre dou variabile
Testarea semnificaiei coeficientului de corelaie
Testarea semnificaiei raportului de corelaie
Estimarea valorilor variabilei independente
Testul Durbin Watson
Testul White

6. Msurarea intensitii legturilor dintre dou variabile

Covariana
Este o metod ajuttoare pentru msurarea intensitii legturilor statistice dintre dou
variabile

X {x }

si Y { y }

Se detemin ca media aritmetic a produselor abaterilor variabilelor fa de mediile lor


i i 1, n
i i 1, n

1 n
cov( x, y ) x x y y
n i 1

Coeficientul de corelaie simpl


Este un indicator sintetic care msoar intensitatea
legturii liniare dintre dou variabile i se calculeaz
ca medie a produselor abaterilor normale normate

ry

xi x

x

yi y

x
n

i 1

cov(x, y)

x y

x yi y

2
2
n xi xi n yi
i 1 i 1

i 1
n

y
i 1

Raportul de corelaie
Este un indicator sintetic utilizat att pentru
msurarea intensitii legturilor dintre variabile, ct
i pentru validarea modelelor de regresie
n validarea modelelor de regresie variabilei
dependente Y i se asociaz dou medii
Media total

i
Media condiionat y
de regresie respectiv

f(x i )

unde

Abaterea total poate fi scris

yi y yi y i y i y

f(x i )

este funcia

Raportul de corelaie
Se calculeaz ca:

y
n

Ry / x

i 1
n

y
i 1

R y/x

2y

x
2
y

y
y

2e
1 2
y

y
i i
i 1
n

y
i 1

sau

SSR
SSE
1
SST
SST

Testarea semnificaiei coeficientului de corelaie


Testarea semnificaiei coeficientului liniar de corelaie (r) se
poate efectua cu testul t (Student)
Ipoteze (test bilateral):

H0 : r 0
H1 : r 0
Testul statistic este

Dac

(nu este semnificativ statistic)


(este semnificativ statistic)

tcalc

r n2
1 r2

t calc t / 2 , n 2 se respinge ipoteza nul, coeficientul

de corelatie este semnificativ statistic

Testarea semificaiei raportului de corelaie


Testarea semnificaiei raportului de corelaie (R) se efectueaz
utiliznd statistica F (Fisher)
Ipoteze (test bilateral):

H0 : R 0
H1 : R 0

(nu este semnificativ statistic)


(este semnificativ statistic)

Pentru k variabile independente, testul statistic este

Fcalc
Dac

n k 1 R2

k
1 R2

Fcalc F / 2,k ,n k 1

se respinge ipoteza nul, variabila

exogena X are o influenta semnificativa asupra variabilei


endogene Y
7

Estimarea valorilor variabilei dependente

Dac presupunem c variabila independent ia valoarea specificat X n+1 i


legtura liniar se menine, atunci valoarea corespunztoare a variabilei
dependente Yn+1 este:

Yn+1,i =

+ *Xn+1,i + n+1,

Ecuaiile de mai sus sunt utilizate pentru estimarea mediei de rspuns i


pentru estimarea unui rspuns individual.
Pentru amndou estimaiile putem obine estimaii punctuale sau pe
intervale de ncredere.
Pentru a obine estimaii punctuale, folosim ecuaia de regresie liniar n
eantion: yi = + xi + ei i atunci, nlocuind cu valoarea dat Xn+1,
obinem:

y n 1 a b * x n 1

Construirea intervalului de ncredere pentru previzionare


necesit
n 1
y
cunoaterea
mediei i dispersiei pentru
distribuiei,
y
n 1 urmeaz o distribuie t cu (n 2) grade de libertate.
Variabila
Dispersia asociat variabilei poate fi identificat n trei cazuri i anume:

Estimarea valorilor variabilei dependente

Caz 1.determinarea intervalului de ncredere pentru media de rspuns,


cnd xn+1 = .
tim c:

y n 1 y b x bx n 1 y b x n 1 x

dac xn+1 = x , atunci y n 1 y, iar estimatorul dispersiei pentru y n 1 este:

s 2y n 1

2
s
s 2y e
n

Intervalul de ncredere este, n acest caz:

y n 1 t / 2 ,n 2

se
n

Caz 2.determinarea intervalului de ncredere pentru media de rspuns,


cnd xn+1 x .

y
y b( x n 1 x )
n acest caz: n 1
y n 1
este:
iar estimatorul dispersiei pentru

s2y n1

( xn 1 x ) 2
1
2
se
n
n
2
xi x

i 1

Estimarea valorilor variabilei dependente


-Intervalul de ncredere pentru media de rspuns este:
2
x n 1 x
1
y n 1 t / 2,n 2 * s e
n
2
n
xi x

i 1
Caz 3.determinarea intervalului
de ncredere pentru un rspuns
individual. Dispersia n eantion este:

2
2
1
(
x

x
)
1
(
x

x
)
se2 se2 1 n n 1

s2y s2y y se2 n n 1


n

n
2
2
(
x

x
)
(
x

x
)

i
i

i 1
i 1

n 1, i

n 1

n 1, i

Intervalul de ncredere pentru media de rspuns este:

n 1,i t / 2 , n 2 * s e
y

( x n 1 x ) 2
1
1
n
n
2
(
x

x
)
i
i 1

Testul Durbin Watson

Testul Durbin-Watson
const n calcularea termenului empiric:
n
2
ei ei 1
d

i 2

e
i 1

compararea acestei mrimi d cu dou valori teoretice d1 si d2 ,


preluate din tabela Durbin-Watson n funcie de un prag de
semnificaie , arbitrar ales, de numrul variabilelor exogene (k) i
de valorile observate (n).
Acceptarea sau respingerea ipotezei de independen a erorilor se
bazeaz pe o anumit regul, care const n:
0<d<d1- dac exista autocorelare pozitiv;
d1<d<d2- indecizie,recomandndu-se acceptarea autocorelrii
pozitive;
d2<d<4-d2- dac erorile sunt independente;
4-d2<d<4-d1- indecizie, recomandndu-se acceptarea autocorelrii
negative;
4-d1<d<4- dac exista autocorelare negativ.
11

6. Msurarea intensitii legturilor dintre dou variabile

12

Analiza variatiei reziduale pt independenta

Nu sunt Independente
SR

Independente

SR

Testul White(I)
Variabila aleatoare (rezidual) e este de medie nul , iar
dispersia ei este constant i independent de variabila X ipoteza de homoscedasticitate, pe baza creia se poate
admite c legtura dintre Y i X este relativ stabil.
Verificarea ipotezei de homoscedasticitate a erorilor n cazul
acestui model se va realiza cu ajutorul testului White.
Aplicarea testului White presupune parcurgerea urmtoarelor
etape:
- estimarea parametrilor modelului iniial i calculul valorilor
estimate ale variabilei reziduale, ei;
- construirea unei regresii auxiliare, bazat pe prespunerea
existenei unei relaii de dependen ntre ptratul valorilor
erorii, variabila exogen inclus n modelul iniial i ptratul
valorilor acesteia:
15

Testul White(II)

-calcularea coeficientului de determinare, R2, corespunztor acestei


regresii auxiliare;
- verificarea semnificaiei parametrilor modelului nou construit, iar
dac unul dintre acetia este nesemnificativ, atunci ipoteza de
heteroscedasticitate a erorilor este acceptat.
Exist dou variante de aplicare a testului White:
1. Utilizarea testului Fisher Snedecor clasic, bazat pe ipoteza
nulitii parametrilor, respectiv:

H 0 : 0 1 2 ..... k 0

H1 : k 0

Dac ipoteza nul, potrivit creia rezultatele estimrii sunt


nesemnificative (
), este acceptat, atunci ipoteza de
homoscedasticitate se verific, cazul contrar semnificnd prezena
heteroscedasticitii erorilor.
16

Testul White(III)

2. Utilizarea testului LM, calculat ca produs ntre numrul de


observaii corespunztoare modelului, n, i coeficientul de
determinare, R2, corespunztor acestei regresii auxiliare. n general,
2
testul LM este asimptotic distribuit sub forma unui ,
;k
pentru care numrul gradelor de libertate este egal cu: k = numrul
variabilelor exogene, respectiv:

Dac
, erorile sunt heteroscedastice, n caz
contrar, sunt homoscedastice, respectiv ipoteza nulitii parametrilor
este acceptat.

17

Analiza variatiei reziduale pentru homoscedasticitate

Heteroscedasticitate

Homoscedasticitate

SR

SR

Se utilizeaza Variabile Residuale Standardizate

Testul Jarque-Bera

Verificarea ipotezei de normalitate a erorilor se va realiza cu ajutorul testului


Jarque-Berra, care este i el un test asimptotic (valabil n cazul unui eantion
de volum mare), ce urmeaz o distribuie hi ptrat cu un numr al gradelor
de libertate egal cu 2, avnd urmtoarea form:

Testul Jarque-Berra se bazeaz pe ipoteza c distribuia normal are un


coeficient de asimetrie egal cu zero, S = 0, i un coeficient de aplatizare egal
cu trei, K = 3.
Dac probabilitatea p(JB) corespunztoare valorii calculate a testului este
suficient de sczut, atunci ipoteza de normalitate a erorilor este respins, n
timp ce, n caz contrar, pentru un nivel suficient de ridicat al probabilitii
ipoteza de normalitate a erorilor este acceptat, sau dac
atunci ipoteza de normalitate a erorilor este respins.

S-ar putea să vă placă și