Documente Academic
Documente Profesional
Documente Cultură
2.1. Introducere
Preţul Număr
Cererea (u.c.) Cerere medie (u.c.)
(u.m.) consumatori
45, 46, 47, 48, 49, 50,
1 7 48
51
2 44, 45, 46, 47, 48 5 46
3 40, 42, 44, 46, 48 5 44
4 35, 38, 42, 44, 46, 47 6 42
5 36, 39, 40, 42, 43 5 40
32, 35, 37, 38, 39, 42,
6 7 38
43
7 32, 34, 36, 38, 40 5 36
31, 32, 33, 34, 35, 36,
8 7 34
37
9 28, 30, 32, 34, 36 5 32
1
10 29, 30, 31 3 30
Evolutia cererii
60
50
40
cererea
30
20
10
0
0 1 2 3 4 5 6 7 8 9 10
pretul
Ce putem observa?
1. Fiecare valoare a cererii medii corespunzătoare unei anumite valori a preţului, valoare
pe care o vom nota cu E(YXi), se găseşte pe dreapta PRL, ceea ce ne permite să
scriem următoarea relaţie:
E(YXi)= B0 + B1*Xi (1)
2
B1 ne arată cu cât se modifică valoarea medie a lui Y atunci când X se modifică cu
o unitate.
Funcţia definită de (1) se numeşte funcţia de regresie a populaţiei - PRF
Observaţie
1. Termenul u se numeşte eroare aleatoare;
2. ecuaţia (1) se numeşte model deterministic (fiecărei valori al lui x îi
corespunde o singură valoare a lui y, valoare pe care y o ia cu
certitudine);
3. ecuaţia (2) se numeşte model stocastic (fiecărei valori al lui x îi corespunde
o valoare a lui y, valoare pe care y o ia cu o anumită probabilitate).
Semnificaţia erorii
1. eroarea aleatoare reprezintă influenţa acelor variabile care nu apar explicit în
modelul regresional cum ar fi spre exemplu venitul consumatorilor;
2. chiar dacă reuşim să includem în model toate variabilele relevante, acest
termen nu poate să dispară pentru că pur şi simplu el poate reprezenta
comportamentul consumatorului care nu este predictibil;
3. eroarea aleatoare poate reprezenta totodată o eroare de măsurătoare.
Este evident că în practică rareori vom lucra cu o întreagă populaţie şi asta, în special, din
raţiuni de cost ridicat al unui astfel de studiu. Tocmai de aceea studiul se va realiza pe un
eşantion extras din populaţia ce face obiectul studiului.
Preţul
Cererea (u.c.)
(u.m.)
1 49
2 45
3 44
4 39
5 38
6 37
3
7 34
8 33
9 30
10 29
Evolutia cererii
60
50
40
cererea
30
20
10
0
0 1 2 3 4 5 6 7 8 9 10 11
pretul
Dacă privim graficul cu atenţie, observăm că nu toate valorile cererii se află pe dreapta de
regresie corespunzătoare eşantionului (SRL), astfel ca şi în cazul populaţiei, vom vorbi şi
aici de modelul stocastic ce poate fi exprimat astfel:
yi= b0 + b1*xi + i (3)
unde i poartă numele de reziduu.
4
2.2.3. Estimarea parametrilor. Metoda celor mai mici pătrate.
Această metodă poartă numele de metoda celor mai mici pătrate şi conduce la
următoarele expresii ale parametrilor de regresie:
x y nx y
i i
b1= ; 2
x nx
2
i
b0= y b 1 x.
xi yi x i2 xiyi
1 49 1 49
2 45 4 90
3 44 9 132
4 39 16 156
5 38 25 190
6 37 36 222
7 34 49 238
8 33 64 264
9 30 81 270
10 29 100 290
55 378 385 1901
x =5,5 y =37,8
Deci, dacă preţul se modifică cu o unitate atunci cererea medie se modifică cu aprox.
2,16 unităţi.
Observaţie
1. i 0 ;
2.2.4. Testarea semnificaţiei modelului regresional
5
Aşa cum arătam în paragrafele anterioare, b0 şi b1 reprezintă doar estimări ale
parametrilor modelului regresional, B0 şi B1. Se pune întrebarea ce se întâmplă la nivel de
populaţie. Pentru a vedea acest lucru va trebui ca pornind de la rezultatele obţinute la
nivel de eşantion, să derulăm un test de semnificaţie pentru parametrii modelului
regresional.
În analiza regresională, o astfel de ipoteză este aleasă în mod deliberat pentru a afla dacă
variabila independentă influenţează sau nu variabila dependentă. Evident că dacă această
ipoteză poate fi susţinută atunci nu are nici un rost să studiem legătura dintre cele două
variabile. În caz contrar dacă în mod logic cele două variabile sunt legate printr-o
anumită relaţie ne aşteptăm ca această ipoteză nulă să fie respinsă în favoarea ipotezei
alternative:
H1: B1≠0, B10, B1 0.
Intervale de încredere
unde:
ESE
sb = 2 ;
1
x 2
i
nx
y ŷ i y b0 y i b1 x i y i
2 2 2
ESE= i
= i
= i
fiind eroarea standard
n 2 n 2 n2
a estimării.
6
Obţinem astfel:
t0,025;8=2,306;
sb =0,1203.
1
B1 2,435;1,8802 .
Cum acest interval nu conţine 0, respingem ipoteza nulă. Aşadar cu o probabilitate de
95% putem afirma că parametrul B2 este diferit de zero.
În acest caz trebuie determinată marginea superioară a parametrului care are forma:
b1 t ; n 2 sb 1
Teste de semnificaţie
Test bilateral
1. Formularea ipotezelor
Ho: B1=0; H1: B1≠0.
2. Stabilirea nivelului de semnificaţie =0,05;
3. Calcularea statisticii test
b1 2 ,1576
t= s = 0 ,1203 17.94 ;
b 1
±t/2;(n-2)= ± t0,025;8=±2,306
5. Luarea deciziei
Deoarece valoarea calculată nu se află între valorile critice, ipoteza nulă se respinge.
Test unilateral
1. Formularea ipotezelor
Ho: B1=0; H1: B1<0.
2. Stabilirea nivelului de semnificaţie =0,05;
3. Calcularea statisticii test
b1 2 ,1576
t= s = 0 ,1203 17.94 ;
b 1
7
Eroarea standard ne arată cum variază valoarea parametrului de la un eşantion la altul.
Din cele arătate mai sus reiese că SRF determinată la punctul 2.2.2. aproximează
„rezonabil” PRF. Pentru a vedea ce înseamnă „rezonabil” va trebui să vedem cât de
puternică este această legătură şi în ce măsură variabila independentă explică
variabilitatea variabilei dependente.
coeficientul de corelaţie - dă măsura gradului de asociere dintre
cele două variabile;
coeficientul de determinaţie - dă măsura în care variabila
independentă influenţează (determină) variabila dependentă.
Coeficientul de corelaţie r
n x i y i x i y i
r=
n x i2 x i n y i2 y i
2 2
Valorile acestui coeficient sunt cuprinse între -1 şi 1, iar în ceea ce priveşte interpretarea
valorilor sale avem:
dacă r[0;0,3] legătură directă slabă;
dacă r(0,3;0,7] legătură directă de intensitate medie;
dacă r (0,7;1] legătură directă puternică;
dacă r[-0,3;0] legătură inversă slabă;
dacă r[-0,7; -0,3) legătură inversă de intensitate medie;
dacă r [-1; -0,7) legătură inversă puternică.
În cazul exemplului nostru vom obţine r = - 0,9878 ceea ce indică o puternică legătură
inversă între nivelul preţului şi cel al cererii.
Este evident că aceste date sunt obţinute la nivel de eşantion. Tocmai de aceea este
necesară derularea unui test de semnificaţie pentru valoarea coeficientului de corelaţie la
nivel de populaţie .
1. Formularea ipotezelor
8
r
3. Calcularea valorii statisticii test: t= 1 r 2 ;
n2
4. Determinarea valorilor critice: t 2 ;( n 2 ) gl , t ;( n 2 ) gl , t ;( n 2 ) gl ;
5. Luarea deciziei.
În cazul testului bilateral dacă valoarea calculată se află între valorile critice
ipoteza nulă se acceptă. În caz contrar aceasta se respinge;
În cazul testului unilateral la dreapta dacă valoarea calculată este mai mică
decât valoarea critică, ipoteza nulă se acceptă. În caz contrar aceasta se
respinge;
În cazul testului unilateral la stânga dacă valoarea calculată este mai mare
decât valoarea critică, ipoteza nulă se acceptă. În caz contrar aceasta se
respinge.
Observaţie
În cazul regresiei liniare simple testarea semnificaţiei coeficientului de corelaţie ρ
este echivalentă cu testarea semnificaţiei modelului regresional.
Coeficientul de determinaţie r2
Acest coeficient, aşa cum spuneam şi mai devreme, arată procentul în care variabila
independentă influenţează variabila dependentă.
Rolul cel mai important al modelului regresional este acela că ne ajută să vedem
comportamentul variabilei dependente la modificări ale variabile independente. Acest
lucru este posibil cu ajutorul unor estimări sau predicţii ale valorilor variabilei
dependente Y pentru anumite valori ale variabilei dependente X.
Astfel putem estima nivelul mediu al variabilei dependente Y pentru anumite valori ale
variabilei independente X, E(YXi), cu ajutorul intervalelor de estimare sau putem
previziona valori individuale ale variabilei dependente Y pentru anumite valori ale
variabilei independente X cu ajutorul intervalelor de predicţie.
9
Formele celor două intervale sunt următoarele:
Interval de estimare
1
E(YXo) ŷ o t 2 ;( n 2 ) gl ESE
x o x
2
;
n x i x 2
Interval de predicţie
1
y ŷo t 2 ;( n 2 ) g ESE 1
x o x
2
,
n x i x 2
unde valoarea yo se determină din ecuaţia de regresie pentru x=xo.
Observaţie
Dacă X nu este o variabilă stohastică, adică valorile sale sunt numere fixate,
această presupunere este automat satisfăcută.
Valoarea medie a lui u este 0, μu=0;
Dispersiile lui ui sunt egale, u
2 2
i
Observaţie
Această proprietate poartă numele de homoscedasticitate. Dacă această
proprietate nu este îndeplinită atunci vorbim de heteroscedasticitate.
10
Estimatorii b1 şi b2 au cea mai mică dispersie. Acest lucru înseamnă că
dispersia lor este mai mică decât a oricăror alţi estimatori nedeplasaţi ai
parametrilor B1 şi B2.
2.5. Probleme
1. Următorul tabel conţine date despre rata nominală a dobânzii şi rata inflaţiei
pentru anul 1988 în următoarele nouă ţări:
RND(%
Ţara RI(%)
)
Australia 11.9 7.7
Canada 9.4 4.0
Franţa 7.5 3.1
Germani 4.0 1.6
a
Italia 11.3 4.8
Mexic 66.3 51.0
Elveţia 2.2 2.0
Anglia 10.3 6.8
SUA 7.6 4.4
Studiaţi legătura dintre RND şi RI.
2. Cheltuielile cu consumul/persoană (PCE) şi venit disponibil/persoană (PDPI).
Anu PCE
PDPI
l
198 1321 14813
0 6
198 1324 15009
1 5
198 1327 14999
2 0
11
198 1382 15277
3 9
1441 16252
198 5
4
198 1495 16597
5 4
198 1540 16981
6 9
198 1574 17106
7 0
198 1621 17621
8 1
198 1643 17801
9 0
199 1653 17941
0 2
199 1649 17756
1
199 1652 18062
2 0
199 1680 18078
3 9
199 1715 18330
4 9
199 1740 18799
5 0
3. Dividendele plătite trimestrial în industria producătoare (Y) şi profitul net în
aceeaşi industrie (X)
Anu Y
X
l
197 19,46 58,74
4 7
197 19,96 49,135
5 8
197 22,76 64,519
6 3
197 26,58 70,366
7 5
197 28,93 81,148
8 2
197 32,49 98,698
9 1
198 36,49 92,579
0 5
12
198 40,31 101,302
1 7
198 41,25 71,028
2 9
198 41,62 85,834
3 4
198 45,10 107,648
4 2
198 45,51 87,648
5 7
198 46,04 83,121
6 4
4. Câştigurile orare(Y), productivitatea orară (X)
Anu Y
X
l
197 96,8
95,9
3
197 95,4 93,
4
197 96,0 95,7
5
197 98,8 98,3
6
197 100, 100,0
7 0
197 100, 100,8
8 9
197 99,4 99,6
9
198 96,7 99,3
0
198 95,8 100,7
1
198 97,3 100,3
2
198 98,2 103,0
3
198 97,9 105,5
4
198 98,8 107,7
5
198 101, 110,1
6 2
198 101, 111,0
7 5
13
Teoria economică spune că între câştiguri orare şi productivitatea orară există o
relaţie directă. Verificaţi această ipoteză.
5. Rata de rentabilitate a unei valori mobiliare (Y), rata de rentabilitate a pieţei (X).
Y X
67,5 19,5
19,2 8,5
- -29,3
35,2
- -26,5
42,0
63,7 61,9
19,3 45,5
3,6 9,5
20,0 14,0
40,3 35,3
Studiu
S&P 500 este un indice bursier care conține 500 de companii publice mari, majoritatea
americane. Indicele este realizat de compania Standard & Poor's, divizie a McGraw-Hill.
Se pune întrebarea dacă Indicele preţurilor de consum (CPI) influenţează acest indice.
Anu CPI
S&P
l
197 65,2 96,02
8
197 72 103,01
9
198 82,4 118,78
0
198 90,9 128,05
1
198 96,5 119,71
2
198 99,6 160,41
3
198 103, 160,46
4 9
198 107, 186,84
5 9
198 109, 236,34
6 6
198 113, 286,83
14
7 6
198 118, 265,79
8 3
198 124 322,84
9
199 130, 334,59
0 7
199 136, 376,18
1 2
199 144, 451,41
2 5
199 148, 460,33
3 2
199 152, 541,64
4 4
199 156, 670,83
5 9
15