Documente Academic
Documente Profesional
Documente Cultură
1
Goldberg, A.S., Econometric Theory, Wiley, New-York, 1964, p. 1.
2
Samuelson, P.A., Koopmans, T.C., Stone, J.R.N., Report of the Evaluative Committee for Econometrica,
Econometrica, 22(2), 1954, pg. 141-146.
1
În fapt, econometria, se bazează pe dezvoltarea metodelor statistice pentru estimarea
legăturilor între variabilele economice, pentru testarea teoriilor economice şi pentru
evaluarea şi implementarea politicilor economice.
Econometria implică:
1. Economii matematice: exprimarea teoriilor și ideilor economice în formă
matematică;
2. Statistică economică: colectarea și procesarea datelor;
3. Inferențe statistice: utilizarea informaţiilor obţinute pe un eşantion în testarea unor
ipoteze asupra populaţiei.
Una dintre cele mai importante aplicaţii ale econometriei constă în previzionarea unor
indicatori macroeconomici cum ar fi rata dobânzii, rata inflaţiei, PIB.
2
Este evident că dacă efectul „added-worker” este dominant, RFM va creşte chiar în
condiţiile unei RS ridicate. Invers, dacă efectul „discouraged-worker” este dominant
atunci RFM va scădea.
Se pune întrebarea cum aflăm acest lucru? Care evident este o întrebare empirică.
Pentru a vedea cum se comportă RFM în raport cu RS vom reprezenta grafic datele:
67
66
RFM (y)
65
64
63
5 6 7 8 9 10
RS (x)
3
Din grafic reiese că între RFM şi RS există o relaţie inversă. Aceasta poate sugera
spre exemplu că efectul „discouraged-worker” este mai puternic decât efectul „added-
worker”.
Modelul liniar de mai sus nu este foarte „iubit” de statisticieni pentru că acest model
sugerează că unei valori a lui RS îi corespunde o unică valoare a lui RFM. În practică
aceste cazuri sunt rareori întâlnite de cele mai multe ori relaţiile între diferite variabile
economice sunt inexacte sau statistice adică sunt adevărate cu o anumită probabilitate.
Reiese clar din reprezentarea grafică că nu toate punctele se află pe aceeaşi dreaptă. De
ce se întâmplă aşa? Pentru că între valorile observate (cele din tabel) şi cele calculate
(cele de pe dreapta definită de ecuaţia (1)) există anumite diferenţe, diferenţe cunoscute
sub numele de erori aleatoare. Din punct de vedere practic aceste erori aleatoare
reprezintă alţi factori(aleatori) care pot influenţa RFM.
În aceste condiţii modelul econometric va fi:
Modelul (2) este cunoscut sub numele de model regresional liniar care în forma sa
generală arată astfel:
unde:
Y – variabila dependentă (explicată, output);
X – variabila independentă (explicativă, input).
Se observă că relaţia (2) derivă din relaţia (1) ceea ce demonstrează complementaritatea
matematicilor economice şi a econometriei.
4
Observaţie
În ecuaţia (2) am stabilit că RFM este variabila dependentă, iar RS este variabila
independentă. Se pune întrebarea: sunt cele două variabile relaţionate cauzal? Este RS
cauza şi RFM efectul? Cu alte cuvinte implică regresia cauzalitate?
Metoda care stă la baza estimării parametrilor modelului regresional se numeşte metoda
celor mai mici pătrate pe baza căreia obţinem că:
Această relaţie ne arată că dacă RS creşte cu o unitate, RFM scade în medie cu 0.64
puncte procentuale.
Cât de bun, cât de adecvat, este modelul definit de ecuaţia (4)? Este adevărat că o
persoană va decide să intre pe piaţa muncii luând în considerare condiţiile de pe
această piaţă măsurate prin rata şomajului?
Este evident că există şi alţi factori care vor influenţa decizia cum ar fi spre exemplu
câştigul mediu orar (COM).
Dacă vom lua în considerare şi această variabilă atunci vom ajunge la următorul model:
Ecuaţia (5) este un exemplu de model regresional multiplu în care intervin două
variabile explicative.
Parametrii modelului, aşa cum vom vedea mai târziu, se determină prin metoda celor
mai mici pătrate.
În acest caz vom avea:
3
Kendall, M.G., Stuart, A., The Advanced Theory of Statistics, Charles Griffin Publishers, New-York,
1961.
5
RFM= 97.9 – 0.446*RS – 3.86*COM (6)
Având acum un model determinat vrem să aflăm dacă acesta are sens din punct de vedere
economic.
Ce este de reţinut aici este faptul că în cazul analizei regresionale s-ar putea să fim
interesaţi nu numai de estimarea parametrilor modelului ci şi de testarea unor ipoteze
sugerate de teoria economică.
Se pune natural următoarea întrebare: O dată trecuţi prin toate etapele de mai sus şi
având la dispoziţie cel mai bun model regresional, ce putem face cu acesta?
Răspunsul este cât se poate de evident. Îl vom folosi pentru a estima sau previziona
RFM corespunzătoare unor valori ale RS şi COM înregistrate spre exemplu în anul
1997. Comparând valorile obţinute cu cele reale, publicate de guvern, se vor observa
diferenţa numite şi erori de predicţie. Evident că scopul nostru va fi ca aceste erori să fie
cât mai mici. Dacă acest lucru este întotdeauna posibil vom vedea ceva mai târziu.
6
1.3. Recapitularea unor noţiuni de statistică descriptivă şi
inferenţială
Ne propunem în această secţiune să facem un repertoar al celor mai importante noţiuni de
statistică descriptivă şi inferenţială, noţiuni ce vor fi folosite de-a lungul cursului de econometrie.
Pentru detalii sunteţi rugaţi să consultaţi:
Server/Profiles/Chifu/Statistica_aplicata
Date calitative
etichete sau nume utilizate pentru
identificarea unui atribut al fiecărui
element. Pot fi numerice sau non-numerice
Date
statistice
Date cantitative
arată cantitatea fiind întotdeauna date
numerice
Variabile calitative
sunt formate din date
calitative
Variabile Discrete
iau doar anumite
statistice
valori dintr-un
Variabile cantitative interval
sunt formate din date
cantitative
Continue
iau orice valoare
dintr-un interval
7
Clasificarea II
Variabile atributive – exprimă o însuşire esenţială a elementelor;
Variabile de timp – exprimă timpul în care au luat fiinţă elementele (data de
expirare a unui produs);
Variabile de spaţiu – exprimă spaţiul în care există unităţile (localizarea punctelor
de distribuţie a presei).
Clasificare
1. după numărul variabilelor de la baza seriei:
Serii statistice unidimensionale – au la bază o singură variabilă;
Serii statistice multidimensionale – au la bază două sau mai multe variabile.
2. după tipul variabilelor de la baza seriei:
Serii calitative – au la bază variabile calitative;
Serii cantitative – au la bază variabile cantitative.
3. după natura variabilelor de la baza seriei:
Serii atributive – au la bază variabile atributive;
Serii cronologice (de timp) – au la bază variabile de timp;
Serii teritoriale (de spaţiu) – au la bază variabile de spaţiu;
4. o clasificare generală a seriilor statistice ar fi următoarea:
Serii de repartiţie – redau distribuţia populaţiei în raport cu una sau mai multe
variabile;
Serii de variaţie – redau variaţia unei mărimi în timp, spaţiu sau de la o categorie la
alta.
Cazul discret
Valoarea medie (, x )
μ=
∑ xk N k =
N
∑ xk f k
populaţie ,
x=
∑ x k nk = x f
n
∑ k k
eşantion
Dacă
r Me atunci Me = 2 .
Valoarea modală este acea valoare a unei variabile pentru care s-a înregistrat cea mai mare frecvenţă
8
Quartilele
Aşa cum am văzut împart populaţia în 4 părţi egale ceea ce implică faptul că vom avea de calculat
p=3 valori. Modalitatea de calcul nu diferă foarte mult de cea din cazul medianei. Astfel vom avea
următoarele etape:
p
r Q = ⋅N
Determinarea rangului quartilei: p 4 ;
rQ x
Dacă p atunci Qp = [ rq ] +1 p , unde [rQp] reprezintă partea întreagă
a rangului quartilei;
x r + x r q +1
qp p
rQ 2
Dacă p atunci Qp = .
∑ x 'k N k x k −1 + x k
μ=
N
= ∑ x 'k f k x 'k =
2
În cazul populaţiei: , unde , este centrul
clasei k (mijlocul intervalului de variaţie).
∑ x'k nk ' '
x k −1 + x k
x= =∑ x k f k xk =
În cazul eşantionului n , unde 2 este centrul
clasei k (mijlocul intervalului de variaţie)
9
Valoarea modală (Mo)
Determinarea intervalului valorii modale - acel interval pentru care s-au înregistrat cele mai
multe unităţi statistice;
Δ1
⋅ x −x
Mo = xk-1 +
Δ1 + Δ2 ( k k −1 ) , unde 1 este diferenţa dintre frecvenţa intervalului
modal şi frecvenţa intervalul precedent, iar 2 este diferenţa dintre frecvenţa intervalului modal
şi frecvenţa intervalul următor.
Quartilele
p
rq = N
Determinarea rangului quartilei: p m
, p= ; 1,m−1
Determinarea intervalului quartilei – se calculează frecvenţele cumulate până la acea frecvenţă
rq
care adăugată conduce la depăşirea rangului quartilei, cu alte cuvinte dacă N 1+...+Nk ≥ p ,
atunci qp (xk-1 , xk];
r q −N ( x k−1)
p
¿ ( x k −x k−1 )
Nk N x
( k−1)
Calcularea expresiei x = , unde este frecvenţa
cumulată până la intervalul quartilei, iar lk este lungimea intervalului quartilei;
Parametrii variaţiei
Dispersia
Populaţie
Caz discret
2
∑ ( x k −μ )2
date negrupate
σx = N ;
2
∑ ( x k −μ )2 N k
date grupate
σ
x = N .
Caz continuu (date grupate pe intervale de variaţie):
2
2
∑ ( x 'k −μ ) Nk
σx = N ,
x +x
x 'k = k −1 k
unde 2 este centrul clasei k (mijlocul intervalului de variaţie).
Eşantion
Caz discret
10
∑ ( x k −x )2
2
date negrupate
sx = n−1 ;
∑ ( x k −x )2 nk
2
date grupate x = s n−1 .
Caz continuu (date grupate pe intervale de variaţie):
2
2
∑ ( x 'k −x ) n k
sx = n−1 ,
'
x k −1 + x k
xk =
unde 2 este centrul clasei k (mijlocul intervalului de variaţie), iar nk
este frecvenţa clasei în eşantion.
Abaterea medie pătratică – măsoară gradul de reprezentativitate al valorii medii, dând măsura gradului
de împrăştiere a valorilor variabilei în jurul valorii medii.
Populaţie: σx = √σ 2x ;
Eşantion: sx = √s 2x .
11
1.3.2. Elemente de statistică inferenţială
Estimarea parametrilor
x=
∑ xi
n .
2
Estimatorul punctual al dispersiei populaţiei
σx este dispersia de eşantion
2
∑ ( x i −x )
s 2x=
n−1 .
Estimatorul punctual al abaterii medii pătratice a populaţiei σ x este abaterea medie pătratică de
eşantion
2
sx =
s √
x .
Intervalul (1,2) se numeşte interval de încredere pentru parametrul necunoscut dacă P(1
2)= 1–, unde (1–) se numeşte coeficient (nivel) de încredere iar se numeşte coeficient
(nivel) de semnificaţie.
^
Dacă λ este un estimator punctual al parametrului necunoscut atunci intervalul de încredere
pentru parametrul va avea forma:
^λ
(eroarea de eşantion)
12
sx
x z sx
2sx n
Nivel de Nivel de z
semnificaţie încredere P(0 z 2 z 2
1– )
0,1 0,90 0,45 1,65
0,05 0,95 0,475 1,96
0,01 0,99 0,495 2,58
s 12 , s 22 , σ x −x
şi anume dispersiile de eşantion iar 1 2 se înlocuieşte cu estimatorul său punctual
2 2
s s
s x −x =
1 2 √ 1
+
n1 n2
2
s
1
1 n1 1 s 12 n 2 1 s 22
sx s
2
1 x2
n1 n 2
,
n1 n 2 2 .
μd ∈ ( d±z α /2 s d )
, d=x1 – x2,
d=
∑ di i i
Valoarea medie: n ,
d i=x 1 −x 2
∑ ( d i−d )2
s 2d =
Dispersia: n−1 ;
13
Abaterea medie pătratică
s d = √ s2d ;
sd
s d=
Eroarea standard √n .
Teste de semnificaţie
Fie un parametru necunoscut al unei populaţii. O ipoteză formulată asupra acestui parametru se
va numi ipoteză nulă Ho.
Ho: =o
O altă ipoteză ce se formulează este ipoteza alternativă H1 ce poate avea următoarea formă:
H1: ≠o – test bilateral;
H1: o – test unilateral la dreapta;
H1: o – test unilateral la stânga.
14
Zonă de respingere Zonă de respingere
Zonă de acceptare
15
Test unilateral la dreapta
Zonă de respingere
Zonă de acceptare
valoarea critică
Zonă de respingere
Zonă de acceptare
valoarea critică
a.
±z α /2 a.
zα a. -
zα
±t α /2; (n−1 ) gl t α ; (n−1) gl t α ; (n−1) gl
b. b. b. -
Luarea deciziei Luarea deciziei
Dacă valorile calculate Dacă valorile calculate
Dacă valorile calculate ale statisticilor se află sunt mai mici decât cele sunt mai mari decât cele
între valorile critice atunci ipoteza nulă nu critice ipoteza nulă nu critice ipoteza nulă nu
poate fi respinsă în caz contrar aceasta se poate fi respinsă. poate fi respinsă.
respinge
16
Verificarea ipotezelor asupra diferenţei valorilor medii 1-2
Eşantioane independente
Test bilateral Test unilateral
Formularea ipotezelor Formularea ipotezelor
Ho: 1-2=0; H1: 1-2≠0 Ho: 1-2=0; H1: 1-2 0
Ho: 1-2=0; H1: 1-20
Determinarea nivelului de semnificaţie Determinarea nivelului de semnificaţie
Colectarea datelor la nivel de eşantion, Colectarea datelor la nivel de eşantion, alegerea şi
alegerea şi calcularea statisticii calcularea statisticii
n130, n230 n130, n230
( x1 −x 2 ) −( μ1−μ2 ) ( x1 −x 2 ) −( μ1 −μ2 )
s x −x s x −x
z= 1 2 , z= 1 2 ,
2 2 2 2
s s s s
s x −x =
1
n130, n230 (
2 √ +
n1 n2
1
σ 21 =σ 22=σ 2
2
)
s x −x =
n130, n230 (
1 2
√ +
n1 n2
σ 21 =σ 22=σ 2 )
1 2
( x1 −x 2 ) −( μ1−μ2 ) ( x1 −x 2 ) −( μ1−μ2 )
s x −x s x −x
t= 1 2 t= 1 2
1 1 1 1
s x1−x 2=s
2
√ +
n1 n2 ,
2
( n1 −1 ) s 1 + ( n2−1 ) s 2
s x1−x 2=s
2
√ +
n1 n2 ,
2
( n1 −1 ) s 1 + ( n2−1 ) s 2
2 2
s = s =
( n1 + n2−2 ) ( n1 + n2−2 )
Determinarea valorilor critice Determinarea valorilor critice
±z α /2 n130, n230 z sau - z
n130, n230
±t α /2;( n +n −2 ) gl t α ;( n +n −2 ) gl
n130, n230 1 2 n130, n230 1 2 sau
−t α ;( n +n −2 ) gl
1 2
Luarea deciziei Luarea deciziei
Dacă valorile Dacă valorile calculate
Dacă valorile calculate ale statisticilor se află calculate sunt mai sunt mai mari decât cele
între valorile critice atunci ipoteza nulă se mici decât cele critice critice ipoteza nulă se
acceptă în caz contrar aceasta se respinge ipoteza nulă se acceptă.
acceptă.
Eşantioane perechi
Test bilateral Test unilateral
Formularea ipotezelor Formularea ipotezelor
Ho: d=0; H1: d ≠0 Ho: d=0; H1: d0
Ho: d=0; H1: d0
Determinarea nivelului de semnificaţie Determinarea nivelului de semnificaţie
Colectarea datelor la nivel de eşantion, Colectarea datelor la nivel de eşantion, alegerea şi
alegerea şi calcularea statisticii calcularea statisticii
n30 n30
17
d−μd sd d−μd sd
sd= sd=
z=
sd , √n z=
sd , √n
n30 n30
d−μd sd d−μd sd
sd= sd=
t= d s , √n t= d s , √n
Determinarea valorilor critice Determinarea valorilor critice
±z α /2 n30 z sau - z
n30
±t α /2;( n−1 ) gl t α ;( n−1 ) gl α ;( n−1 ) gl −t
n30 n30 sau
Luarea deciziei Luarea deciziei
Dacă valorile Dacă valorile calculate
Dacă valorile calculate ale statisticilor se află calculate sunt mai sunt mai mari decât cele
între valorile critice atunci ipoteza nulă se mici decât cele critice critice ipoteza nulă se
acceptă în caz contrar aceasta se respinge ipoteza nulă se acceptă.
acceptă.
Tabelul ANOVA
Tabelul ANOVA este un tabel în care se trec toate elementele calculate la punctul acesta având
următoarea structură:
Sursa Suma pătratelor Grade de libertate Media sumelor pătratelor
Între grupuri SSB k–1 s 2b =SSB/ ( k−1 )
În grupuri SSW n–k s 2w =SSW / ( n−k )
Total SST=SSB+SSW n–1
18
4. Calcularea statisticii test F;
SSB
( k −1 )
s 2b
SSW
F = ( n−k ) =
s 2w
.
5. Determinarea valorilor critice F; (k-1, n-k)gl;
6. Luarea deciziei: dacă F F; (k-1, n-k)gl ipoteza nulă se respinge în caz contrar aceasta acceptându-
se.
Distribuţia Student t
19
Distribuţia Fischer pentru un nivel de semnificaţie de 5% (α=0,5)
k-1
n-k Grade de libertate ale numărătorului
1 2 3 4 5 6 8 12 24
1 161.4 199.5 215. 224.6 230. 234.0 239.0 244.0 249.0 254.3
7 2
2 18.51 19.00 19.1 19.25 19.3 19.33 19.37 19.41 19.45 19.50
6 0
3 10.13 9.55 9.28 9.12 9.01 8.94 8.84 8.74 8.64 8.53
4 7.71 6.94 6.59 6.39 6.26 6.16 6.04 5.91 5.77 5.63
5 6.61 5.79 5.41 5.19 5.05 4.95 4.82 4.68 4.53 4.36
6 5.99 5.14 4.76 4.53 4.39 4.28 4.15 4.00 3.84 3.67
7 5.59 4.74 4.35 4.12 3.97 3.87 3.73 3.57 3.41 3.24
8 5.32 4.46 4.07 3.84 3.69 3.58 3.44 3.28 3.12 2.93
9 5.12 4.26 3.68 3.63 3.48 3.37 3.23 3.07 2.90 2.71
Grade de libertate ale numitorului
10 4.96 4.10 3.71 3.48 3.33 3.22 3.07 2.91 2.74 2.54
11 4.84 3.98 3.59 3.36 3.20 3.09 2.95 2.79 2.61 2.40
12 4.75 3.88 3.49 3.26 3.11 3.00 2.85 2.69 2.50 2.30
13 4.67 3.80 3.41 3.18 3.02 2.92 2.77 2.60 2.42 2.21
14 4.60 3.74 3.34 3.11 2.96 2.85 2.70 2.53 2.35 2.13
15 4.54 3.68 3.29 3.06 2.90 2.79 2.64 2.48 2.29 2.07
16 4.49 3.63 3.24 3.01 2.85 2.74 2.59 2.42 2.24 2.01
17 4.45 3.59 3.20 2.96 2.81 2.70 2.55 2.38 2.19 1.96
18 4.41 3.55 3.16 2.93 2.77 2.66 2.51 2.34 2.15 1.92
19 4.38 3.52 3.13 2.90 2.74 2.63 2.48 2.31 2.11 1.88
20 4.35 3.49 3.10 2.87 2.71 2.60 2.45 2.28 2.08 1.84
21 4.32 3.47 3.07 2.84 2.68 2.57 2.42 2.25 2.05 1.81
22 4.30 3.44 3.05 2.82 2.66 2.55 2.40 2.23 2.03 1.78
23 4.28 3.42 3.03 2.80 2.64 2.53 2.38 2.20 2.00 1.76
24 4.26 3.40 3.01 2.78 2.62 2.51 2.36 2.18 1.98 1.73
25 4.24 3.38 2.99 2.76 2.60 2.49 2.34 2.16 1.96 1.71
26 4.22 3.37 2.98 2.74 2.59 2.47 2.32 2.15 1.95 1.69
27 4.21 3.35 2.96 2.73 2.57 2.46 2.30 2.13 1.93 1.67
28 4.20 3.34 2.95 2.71 2.56 2.44 2.29 2.12 1.91 1.65
29 4.18 3.33 2.93 2.70 2.54 2.43 2.28 2.10 1.90 1.64
30 4.17 3.32 2.92 2.69 2.53 2.42 2.27 2.09 1.89 1.62
40 4.08 3.28 2.84 2.61 2.45 2.34 2.18 2.00 1.79 1.51
20