Documente Academic
Documente Profesional
Documente Cultură
3.1. Introducere
Până acum am studiat un model regresional în care erau implicate două variabile şi
anume o variabilă dependentă şi una independentă.
Un model regresional în care sunt implicate cel puțin două variabile independente
se numeşte model regresional multiplu.
Exemplu
Legătura dintre falimentul unei bănci, rata economiilor populaţiei şi rata
împrumuturilor populaţiei.
Pot fi date nenumărate exemple de modele regresionale multiple, iar acest lucru este
posibil deoarece puţine fenomene economice pot fi explicate cu ajutorul unei singure
variabile explicative (independente).
E(Yi)= B0 + B1X1i+B2X2i
Yi= B0 + B1X1i+B2X2i+ui
în cazul stohastic.
1
În cele două relaţii avem următoarele:
Y – variabila dependentă;
X1, X2 – variabilele independente;
E(Yi) – valoarea medie a variabilei dependente, corespunzătoare
unor valori date sau fixate ale variabilelor independente;
B0, B1, B2 – parametrii modelului regresional;
u – eroare aleatoare;
i – valoarea observată i.
Observaţii
1. B0 reprezintă valoarea medie a variabilei dependente atunci când variabilele
independente sunt egale cu zero;
2. Parametrii (coeficienţii) B1 şi B2 se numesc parametrii de regresie parţială.
Această denumire se datorează semnificaţiei celor doi parametrii. Astfel B1 ne
arată cu cât se modifică valoarea medie a lui Y la modificări cu o unitate a
variabilei X1, atunci când variabila X2 este fixată. În mod similar B2 ne arată cu cât
se modifică valoarea medie a lui Y la modificări cu o unitate a variabilei X2,
atunci când variabila X1 este fixată.
În concluzie, coeficientul de regresie parţială reflectă efectul pe care o variabilă
explicativă îl are asupra mediei variabilei explicate atunci când celelalte
variabile explicative sunt fixate.
Observaţie
În relaţiile de mai sus bi reprezintă estimatorii parametrilor modelului regresional.
Observaţie
În cazul general vom avea:
populaţie
E(Yi)= B0 + B1X1i+B2X2i+...+ BkXki
Yi= B0 + B1X1i+B2X2i +...+ BkXki +ui
eşantion
ŷi b0 b1 x1 i b2 x2 i ... bk xk i
yi= b0 + b1x1i + b2x2i+...+ bkxki +i
2
3.3. Estimarea parametrilor
Observaţie
În cazul general vom avea:
bo
n b1 x1 b2 x 2
bo x1 b1 2
x1 b2
bo x 2
b1 x1 x 2
b 2
.. .... ..... ..... ......... .......... ...
bo x k
b1 x1 x k
b2
Exemplu
Legătura dintre datoria ipotecară (y mld. USD), venitul (x1 mld. USD) şi costul ipotecii
(x2 %) în Statele Unite în perioada 1980 – 1995.
Sistemul devine:
16 b0 65661.1b1 167.97 b2 47234.6
65661 .1b0 291424523 .59 b1 649025.76 b2 214254776 .4
167.97 b 649025.76 b1 1853 .07 b2 457539.63
0
3
Aşadar
ŷ i 155.6812 0.8258 x1 i 56.4393 x 2 i
Interpretări
b0 – dacă venitul şi costul ipotecii sunt zero atunci datoria ipotecară medie va fi
155.7 mld. USD;
b1 – dacă costul ipotecii este fixat atunci la modificări cu o unitate a venitului (1 $) îi
corespunde o modificare a datoriei medii de 0.8258 (adică aprox 83 de cenţi);
b2 – dacă venitul este fixat atunci la modificări cu o unitate a costului (un procent) îi
corespunde o modificare a datoriei medii de 56.5 unităţi (mld. USD).
Intervale de încredere
y ŷi 2 ;
ESE= i = i
2
n3 n3
n x 1 x 2 x 1 x 2
rx x .
n x 12 x 1 n x 22 x 2
1 2 2 2
4
y x1 x2 ŷ i 155.6812 0.8258 x1 i 56.4393 x 2 i y i ŷ i
2
Obţinem astfel:
t0,025;13=2,160;
203032.76
ESE= =124.97;
13
x1 =4103.82;
x2 =10.50;
x =4686.50;
2
2
1i n x1
x n x =9.47;
2 2
2i 2
rx2 x =0.82403;
1 2
s b =0,0635;
1
sb =31.4543;
2
B1 0.6885 ;0.9631 ;
B2 11 .5021;124.3807 .
Interpretări
1. Deoarece intervalul ce îl conţine pe B1 nu îl conţine pe zero, respingem ipoteza nulă.
Aşadar cu o probabilitate de 95% putem afirma că parametrul B1 este diferit de zero.
2. În cazul lui B2 intervalul conţine şi valoarea zero ceea ce înseamnă că nu putem
respinge ipoteza nulă la un nivel de semnificaţie de 5%. Se poate însă verifica faptul
că ipoteza nulă este respinsă cu un nivel de încredere de 90%.
5
Teste de semnificaţie
Test bilateral – B1
1. Formularea ipotezelor
Ho: B1=0;H1: B1≠0.
2. Stabilirea nivelului de semnificaţie =0,05;
3. Calcularea statisticii test
b1 0.8258
t= s = 12.9910 ;
b 0.06351
±t/2;(n-3)= ± t0,025;13=±2.160
5. Luarea deciziei
Deoarece valoarea calculată nu se află între valorile critice, ipoteza nulă se
respinge.
Test unilateral – B1
1. Formularea ipotezelor
Ho: B1=0;H1: B1>0.
2. Stabilirea nivelului de semnificaţie =0,05;
3. Calcularea statisticii test
b1 0.8258
t= s = 12.9910 ;
b1 0.0635
4. Determinarea valorilor critice t ;( n 3 ) gl (test unilateral)
t;(n-3)= t0,05;13=1.771
5. Luarea deciziei
Deoarece valoarea calculată este mai mare decât valoarea critică ipoteza nulă se
respinge.
Test bilateral – B2
1. Formularea ipotezelor
Ho: B2=0; H1: B2≠0.
2. Stabilirea nivelului de semnificaţie =0,10;
3. Calcularea statisticii test
b2 56.4393
t= s = 1.7943 ;
b 31.4543
2
±t/2;(n-3)= ± t0,005;13=±1.771
5. Luarea deciziei
Deoarece valoarea calculată nu se află între valorile critice, ipoteza nulă se
respinge.
6
Test unilateral – B2
1. Formularea ipotezelor
Ho: B2=0;H1: B2<0.
2. Stabilirea nivelului de semnificaţie =0,05;
3. Calcularea statisticii test
b2 56.4393
t= s = 1.7943 ;
b 2
31.4543
4. Determinarea valorilor critice - t ;( n 3 ) gl (test unilateral)
- t;(n-3)= - t0,05;13= - 1.771
5. Luarea deciziei
Deoarece valoarea calculată este mai mică decât valoarea critică ipoteza nulă se
respinge.
Observaţie
După cum s-a observat în cazul intervalelor de încredere şi a testelor bilaterale am lucrat
cu două nivele de semnificaţie şi anume 5% pentru B1, respectiv 10% pentru B2. Este
evident că dacă B1 este semnificativ la un nivel de 5%, atunci el este semnificativ şi la un
nivel de 10%, cazul invers nefiind în general adevărat.
7
3.4.2. Testarea ipotezelor formulate asupra ansamblului parametrilor
Am văzut în paragraful anterior cum verificăm dacă fiecare dintre parametrii modelului
regresional este semnificativ diferit, mai mare sau mai mic decât zero.
Etape
1. Formularea ipotezelor:
Ho: B1= B2=0;
H1:B1≠0 sau/şi B2≠0;
2. =0,05;
R2
2
3. Calcularea valorii statisticii test F=
1 R2
n 3
ryx2 ryx2 2 ryx ryx rx x
R= =0.9947;
1 2 1 2 1 2
1 r 2
x1 x2
R2=0.9894;
n x 1 y x 1 y
ryx =0.9933;
n x 12 x 1 n y 2 y
1 2 2
n x 2 y x 2 y
ryx = - 0.9232;
n x 22 x 2 n y 2 y
2 2 2
n x 1 x 2 x 1 x 2
rx x = - 0.9077;
n x 12 x 1 n x 22 x 2
1 2 2 2
0.9894
F= 1 02.9894 =608.92;
13
8
5. Luarea deciziei:
Deoarece valoarea calculată 608.92 depăşeşte valoarea critică 3,81, ipoteza nulă se
respinge. Aşadar putem afirma, cu o probabilitate de 95%, că modelul regresional
determinat este semnificativ în raport cu ansamblul variabilelor independente implicate.
Observaţie
În cazul general vom avea:
În raport cu fiecare variabilă:
Formularea ipotezelor: Ho: Bi=0; H1: Bi≠0, Bi0, Bi 0;
Stabilirea nivelului de semnificaţie ;
bi
Calcularea valorii statisticii test: t= unde
s bi
ESE
s bi =
x 2
i nx
2
1 r 2
x1 ... xk ;
i2 = y i ŷ i .
2
ESE=
nk 1 nk 1
Determinarea valorilor critice:
t 2 ;( n k 1 ) gl , t ;( n k 1 ) gl , t ;( n k 1 ) gl ;
Luarea deciziei.
9
3.5. Coeficient de corelaţie multiplă. Coeficient de determinaţie
Observaţie
Coeficientul de corelaţie multiplă ia valori cuprinse între 0 şi 1. În practică acest
coeficient nu este foarte important.
Observaţie
Este interesant de observat că venitul influenţa datoria ipotecară în proporţie de 98.68%.
Prin adăugarea în model a costului ipotecii această influenţă celor două variabile a
crescut la 98.94%. La fel costul ipotecii influenţează datoria ipotecară în proporţie de
85.23%.
Observaţie
Este demonstrat faptul că adăugarea de noi variabile unui model regresional multiplu
conduce la creşterea sau în cel mai rău caz la menţinerea constantă a valorii coeficientului
de determinaţie. Acest lucru conduce, pe măsura introducerii de noi variabile
independente, la interpretări eronate ale valorii coeficientului de determinaţie. Tocmai
pentru a evita această problemă se calculează un alt coeficient de determinaţie numit
coeficient de determinaţie ajustat care ia în calcul numărul variabilelor independente din
model şi a cărui expresie este:
n1
R 1 1 R2
2
,
nk 1
unde n este volumul eşantionului asupra căruia se efectuează studiul, iar k este numărul
de variabile independente considerate în model.
10
În cazul exemplului nostru n=16, k=2, astfel că vom avea:
n1 16 1
R 1 1 R2 = 1 1 0.9848
2
=0.9878.
nk 1 16 2 1
Observaţie
Se observă ca valoarea coeficientul de determinaţie ajustat este mai mică decât cea a
coeficientului de determinaţie. Pe de altă parte dacă n este mare iar k mic atunci cei doi
coeficienţi au aproximativ aceeaşi valoare. De aici reiese importanţa folosirii
coeficientului de determinaţie ajustat în special în cazul în care volumul eşantionului
studiat este mic.
Observaţie
A testa semnificaţia coeficientului de determinaţie se reduce la testarea semnificaţiei
modelului regresional în raport cu ansamblul variabilelor.
Se punea problema dacă x2 trebuie introdus în model (B2 nu era semnificativ la 5%).
Cum valoarea absolută a lui t corespunzătoare lui B 2 era 1,7943 > 1, aceasta poate fi
introdusă în model.
11
3.7. Estimări
Vom încerca, exact ca şi în cazul regresiei liniare simple, să folosim modelul pentru
determinarea unui interval de încredere pentru media variabilei explicate corespunzătoare
unor valori fixate ale variabilelor explicative.
Vom determina un interval de încredere pentru datoria ipotecară medie corespunzătoare
unui venit de 6100 USD şi unui cost al ipotecii de 7,5%.
E(YXo) ŷ o t 2 ;( n 3 ) gl s ;
s2
ESE 2
n
x 10 x 1 sb2 2 x10 x1 x 20 x 2 cov b1 , b2 x 20 x 2 sb2
2
1
2
2
ESE 2 rx2 x
cov b1 , b2
x
1 2
1i x 2 i n x 1 x 2 1 rx2 x 1 2
ŷo =4784,7;
t0,025;13=2,160;
203032.76
ESE= =124.97;
13
x1 =4103.82;
x2 =10.50;
x1 i x 2 i =649025,76;
rx2 x =0.82403;
1 2
cov(b1,b2)=1,81;
s b =0,0635;
1
sb =31.4543;
2
s=143;
E(YX1=6100, X2=7,5)(4629.1;4910.6).
Aşadar datoria ipotecară medie corespunzătoare unui venit de 6100 USD şi unui cost al
ipotecii de 7,5%, va fi cuprinsă, cu o probabilitate de 95%, între 4629.1 şi 4910.6 USD.
12