Curs 1 Econometrie

Curs 1: Econometria
1.1. Ce este econometria?

1.2. Metodologia econometriei
1.3. Recapitularea unor noţiuni de statistică descriptivă şi inferenţială
1.1. Ce este econometria?

Simplu spus, econometria înseamnă măsurătoare economică.
Ragnar Anton Kittil Frisch

primul câştigător al premiului Nobel în economie 1969
Goldberg1 defineşte econometria ca fiind ştiinţa în care uneltele teoriilor economice,

matematice şi statistice sunt aplicate pentru analizarea unor fenomene economice.
Samuelson, Koopmans şi Stone2 spun că econometria constă în aplicarea statisticii în

datele economice pentru a adapta modelele empirice la modele construite cu ajutorul
economiilor matematice cu scopul de a obţine rezultate numerice.
Paul Anthony Samuelson Tjalling C.Koopmans John Richard Nicholas Stone

premiul Nobel în economie în 1970 premiul Nobel în economie în 1975 premiul Nobel în economie în 1984
1
Goldberg, A.S., Econometric Theory, Wiley, New-York, 1964, p. 1.
2
Samuelson, P.A., Koopmans, T.C., Stone, J.R.N., Report of the Evaluative Committee for Econometrica,
Econometrica, 22(2), 1954, pg. 141-146.
1
În fapt, econometria, se bazează pe dezvoltarea metodelor statistice pentru estimarea
legăturilor între variabilele economice, pentru testarea teoriilor economice şi pentru
evaluarea şi implementarea politicilor economice.
Econometria implică:
1. Economii matematice: exprimarea teoriilor și ideilor economice în formă
matematică;
2. Statistică economică: colectarea și procesarea datelor;
3. Inferențe statistice: utilizarea informaţiilor obţinute pe un eşantion în testarea unor
ipoteze asupra populaţiei.
Una dintre cele mai importante aplicaţii ale econometriei constă în previzionarea unor
indicatori macroeconomici cum ar fi rata dobânzii, rata inflaţiei, PIB.
1.2. Metodologia econometriei

1. Formularea ipotezelor;
2. Colectarea datelor;
3. Specificarea modelului matematic;
4. Specificarea modelului statistic sau econometric;
5. Estimarea parametrilor modelului ales;
6. Găsirea celui mai bun model;
7. Testarea ipotezelor ce derivă din model;
8. Estimări şi previziuni pe baza modelului.
În fapt econometria a apărut ca instrument de testare a unor ipoteze formulate pornind de

la anumite situaţii întâlnite în practica economică.
Spre exemplu pornim cu următoarea întrebare:
? Influenţează condiţiile economice dorinţa oamenilor de a muncii?
Pentru a răspunde la această întrebare considerăm două variabile şi anume rata

şomajului (RS) şi rata forţei de muncă (RFM).
1.2.1. Formularea ipotezelor

În teoriile economice asupra pieţei muncii există două ipoteze asupra efectului condiţiilor
economice asupra dorinţei oamenilor de a muncii şi anume:
1. ipoteza „discouraged-worker” care spune că atunci când condiţiile economice
se înrăutăţesc mulţi şomerii renunţă la speranţa de a-şi mai găsi un loc de
muncă;
2. ipoteza „added-worker” care spune că în condiţii economice înrautăţite mulţi
dintre cei apţi de muncă, dar care nu activează pe piaţa muncii (mame cu
copii), decid să intre pe piaţa muncii în condiţiile în care celălalt membru al
familiei îşi pierde slujba. Chiar dacă slujba este slab remunerată, câştigurile
vor acoperi o parte din pierderile suferite prin concedierea celulilalt membru
al familiei.
2
Este evident că dacă efectul „added-worker” este dominant, RFM va creşte chiar în
condiţiile unei RS ridicate. Invers, dacă efectul „discouraged-worker” este dominant
atunci RFM va scădea.
Se pune întrebarea cum aflăm acest lucru? Care evident este o întrebare empirică.
1.2.2. Colectarea datelor
Avem nevoie de informaţii cantitative despre cele două variabile.
Anul RFM (%) RS (%) COM* ($)

1980 63.8 7.1 7.78
1981 63.9 7.6 7.69
1982 64.0 9.7 7.68
1983 64.0 9.6 7.79
1984 64.4 7.5 7.80
1985 64.8 7.2 7.77
1986 65.3 7.0 7.81
1987 65.6 6.2 7.73
1988 65.9 5.5 7.69
1989 66.5 5.3 7.64
1990 66.5 5.6 7.52
1991 66.2 6.8 7.45
1992 66.4 7.5 7.41
1993 66.3 6.9 7.39
1994 66.6 6.1 7.40
1995 66.6 5.6 7.40
1996 66.8 5.4 7.43
*COM – câştigul mediu orar
1.2.3. Specificarea modelului matematic
Pentru a vedea cum se comportă RFM în raport cu RS vom reprezenta grafic datele:
67
66
RFM (y)
65
64
63
5 6 7 8 9 10
RS (x)
3
Din grafic reiese că între RFM şi RS există o relaţie inversă. Aceasta poate sugera
spre exemplu că efectul „discouraged-worker” este mai puternic decât efectul „added-
worker”.
Ca o primă aproximare putem scrie relaţia dintre RFM şi RS astfel:
RFM=B0 + B1*RS (1)
B0, B1 se numesc parametrii modelului matematic.
B1 ne arată cu cât se modifică RFM atunci când RS se modifică cu o unitate. B1 poate fi

pozitiv caz în care în exemplul nostru efectul „added-worker” domină efectul
„discouraged-worker” sau poate fi negativ caz în care efectul „discouraged-worker”
este mai puternic decât efectul „added-worker”. Gaficul sugerează, în cazul exemplului
nostru, că B1<0.
1.2.4. Specificarea modelului statistic sau econometric
Modelul liniar de mai sus nu este foarte „iubit” de statisticieni pentru că acest model
sugerează că unei valori a lui RS îi corespunde o unică valoare a lui RFM. În practică
aceste cazuri sunt rareori întâlnite de cele mai multe ori relaţiile între diferite variabile
economice sunt inexacte sau statistice adică sunt adevărate cu o anumită probabilitate.
Reiese clar din reprezentarea grafică că nu toate punctele se află pe aceeaşi dreaptă. De
ce se întâmplă aşa? Pentru că între valorile observate (cele din tabel) şi cele calculate
(cele de pe dreapta definită de ecuaţia (1)) există anumite diferenţe, diferenţe cunoscute
sub numele de erori aleatoare. Din punct de vedere practic aceste erori aleatoare
reprezintă alţi factori(aleatori) care pot influenţa RFM.
În aceste condiţii modelul econometric va fi:
RFM=B0 + B1*RS + u (2)
Modelul (2) este cunoscut sub numele de model regresional liniar care în forma sa
generală arată astfel:
Y=B0 + B1*X + u (3)
unde:
Y – variabila dependentă (explicată, output);
X – variabila independentă (explicativă, input).
Se observă că relaţia (2) derivă din relaţia (1) ceea ce demonstrează complementaritatea
matematicilor economice şi a econometriei.
4
Observaţie
În ecuaţia (2) am stabilit că RFM este variabila dependentă, iar RS este variabila
independentă. Se pune întrebarea: sunt cele două variabile relaţionate cauzal? Este RS
cauza şi RFM efectul? Cu alte cuvinte implică regresia cauzalitate?
Kendall şi Stuart3 notează că o relaţie statistică, oricât de puternică şi sugestivă nu poate

stabili o relaţie cauzală. Ideea de cauzalitate trebuie să vină din afara statisticii.
Conform acestei teorii, în cazul exemplului nostru, teoria economică trebuie să

stabilească relaţia de tip cauză-efect, dacă există, între cele două variabile. Dacă
cauzalitatea nu poate fi stabilită, atunci ecuaţia (2) o vom numi relaţie predictivă, adică
ştiind RS putem previziona RFM.
1.2.5. Estimarea parametrilor modelului econometric
Metoda care stă la baza estimării parametrilor modelului regresional se numeşte metoda
celor mai mici pătrate pe baza căreia obţinem că:
RFM = 69.9355 – 0.6458*RS (4)
Observaţie: RFM ne reaminteşte că (4) este o estimare a ecuaţiei (2).
Această relaţie ne arată că dacă RS creşte cu o unitate, RFM scade în medie cu 0.64
puncte procentuale.
1.2.6. Alegerea celui mai bun model
Cât de bun, cât de adecvat, este modelul definit de ecuaţia (4)? Este adevărat că o
persoană va decide să intre pe piaţa muncii luând în considerare condiţiile de pe
această piaţă măsurate prin rata şomajului?
Este evident că există şi alţi factori care vor influenţa decizia cum ar fi spre exemplu
câştigul mediu orar (COM).
Dacă vom lua în considerare şi această variabilă atunci vom ajunge la următorul model:
RFM= B0 + B1*RS + B2*COM + u (5)
Ecuaţia (5) este un exemplu de model regresional multiplu în care intervin două
variabile explicative.
Parametrii modelului, aşa cum vom vedea mai târziu, se determină prin metoda celor
mai mici pătrate.
În acest caz vom avea:
3
Kendall, M.G., Stuart, A., The Advanced Theory of Statistics, Charles Griffin Publishers, New-York,
1961.
5
RFM= 97.9 – 0.446*RS – 3.86*COM (6)
Această relaţie ne arată următoarele:

 dacă COM este constatat atunci RFM se modifică cu 0.446 puncte
procentuale la modificări cu o unitate ale RS;
 dacă RS este constatat atunci RFM se modifică cu 3.86 puncte
procentuale la modificări cu o unitate ale COM.
Care model trebuie ales?
1.2.7. Testarea ipotezelor ce derivă din model
Având acum un model determinat vrem să aflăm dacă acesta are sens din punct de vedere
economic.
De exemplu ipoteza „discouraged-worker” postulează o relaţie inversă între RFM şi

RS. Reiese această ipoteză din rezultatele obţinute de noi?
Rezultatele obţinute de noi sunt în conformitate cu această ipoteză deoarece coeficientul
estimat corespunzător lui RS este negativ.
Ce este de reţinut aici este faptul că în cazul analizei regresionale s-ar putea să fim
interesaţi nu numai de estimarea parametrilor modelului ci şi de testarea unor ipoteze
sugerate de teoria economică.
1.2.8. Estimări şi predicţii
Se pune natural următoarea întrebare: O dată trecuţi prin toate etapele de mai sus şi
având la dispoziţie cel mai bun model regresional, ce putem face cu acesta?
Răspunsul este cât se poate de evident. Îl vom folosi pentru a estima sau previziona
RFM corespunzătoare unor valori ale RS şi COM înregistrate spre exemplu în anul
1997. Comparând valorile obţinute cu cele reale, publicate de guvern, se vor observa
diferenţa numite şi erori de predicţie. Evident că scopul nostru va fi ca aceste erori să fie
cât mai mici. Dacă acest lucru este întotdeauna posibil vom vedea ceva mai târziu.
6
1.3. Recapitularea unor noţiuni de statistică descriptivă şi
inferenţială
Ne propunem în această secţiune să facem un repertoar al celor mai importante noţiuni de
statistică descriptivă şi inferenţială, noţiuni ce vor fi folosite de-a lungul cursului de econometrie.
Pentru detalii sunteţi rugaţi să consultaţi:
Server/Profiles/Chifu/Statistica_aplicata
1.3.1. Elemente de statistică descriptivă

 Date, elemente, populaţie, eşantion, variabile, serii statistice
 Statistica – ştiinţa colectării, analizării, prezentării şi interpretării datelor.

 date statistice
Clasificarea datelor statistice
Date calitative
etichete sau nume utilizate pentru
identificarea unui atribut al fiecărui
element. Pot fi numerice sau non-numerice
Date
statistice
Date cantitative
arată cantitatea fiind întotdeauna date
numerice
 elemente (unităţi) statistice – entităţi în funcţie de care sunt colectate datele.

 populaţie statistică – ansamblul tuturor elementelor
 eşantion – subansamblul unei populaţii
 variabilă statistică – caracteristică comună a unităţilor unei populaţii
Clasificarea variabilelor statistice
Variabile calitative
sunt formate din date
calitative
Variabile Discrete
iau doar anumite
statistice
valori dintr-un
Variabile cantitative interval
sunt formate din date
cantitative
Continue
iau orice valoare
dintr-un interval
7
Clasificarea II
 Variabile atributive – exprimă o însuşire esenţială a elementelor;
 Variabile de timp – exprimă timpul în care au luat fiinţă elementele (data de
expirare a unui produs);
 Variabile de spaţiu – exprimă spaţiul în care există unităţile (localizarea punctelor
de distribuţie a presei).
 Seria statistică – grupare de valori rezultată ca urmare a analizării unei populaţii în

raport cu una sau mai multe variabile.
Clasificare
1. după numărul variabilelor de la baza seriei:
 Serii statistice unidimensionale – au la bază o singură variabilă;
 Serii statistice multidimensionale – au la bază două sau mai multe variabile.
2. după tipul variabilelor de la baza seriei:
 Serii calitative – au la bază variabile calitative;
 Serii cantitative – au la bază variabile cantitative.
3. după natura variabilelor de la baza seriei:
 Serii atributive – au la bază variabile atributive;
 Serii cronologice (de timp) – au la bază variabile de timp;
 Serii teritoriale (de spaţiu) – au la bază variabile de spaţiu;
4. o clasificare generală a seriilor statistice ar fi următoarea:
 Serii de repartiţie – redau distribuţia populaţiei în raport cu una sau mai multe
variabile;
 Serii de variaţie – redau variaţia unei mărimi în timp, spaţiu sau de la o categorie la
alta.
 Parametrii tendinţei centrale şi de structură
Cazul discret
Valoarea medie (, x )
μ=
∑ xk N k =
N
∑ xk f k
 populaţie ,
x=
∑ x k nk = x f
n
∑ k k
 eşantion
Valoarea mediană (Me)

Modalitatea de calcul a valorii mediane în cazul discret implică următoarele etape:
N
r Me=
 Determinarea rangului valorii mediane: 2 ;
r x r +1
 Dacă Me   atunci Me = [ Me ] , unde [rMe] reprezintă partea
întreagă a rangului medianei;
x r + x rMe +1
Me
 Dacă
r Me   atunci Me = 2 .
Valoarea modală este acea valoare a unei variabile pentru care s-a înregistrat cea mai mare frecvenţă
8
Quartilele
Aşa cum am văzut împart populaţia în 4 părţi egale ceea ce implică faptul că vom avea de calculat
p=3 valori. Modalitatea de calcul nu diferă foarte mult de cea din cazul medianei. Astfel vom avea
următoarele etape:
p
r Q = ⋅N
 Determinarea rangului quartilei: p 4 ;
rQ x
 Dacă p   atunci Qp = [ rq ] +1 p , unde [rQp] reprezintă partea întreagă
a rangului quartilei;
x r + x r q +1
qp p
rQ 2
 Dacă p   atunci Qp = .
Cazul datelor grupate pe intervale de variaţie
Clasa Frecvenţa Frecvenţa

absolută relativă
[xo , x1] N1 f1
(x1 , x2] N2 f2
... ... ...
(xk-1, xk] Nk fk
... ... ...
(xr-1, xr] Nr fr
Valoarea medie (, x )

În cazul datelor grupate pe intervale de variaţie modalitatea de calcul a valorii medii este
următoarea:
∑ x 'k N k x k −1 + x k
μ=
N
= ∑ x 'k f k x 'k =
2
 În cazul populaţiei: , unde , este centrul
clasei k (mijlocul intervalului de variaţie).
∑ x'k nk ' '
x k −1 + x k
x= =∑ x k f k xk =
 În cazul eşantionului n , unde 2 este centrul
clasei k (mijlocul intervalului de variaţie)
Valoarea mediană (Me)

N
r Me=
 Determinarea rangului valorii mediane: 2 ;
 Determinarea intervalului valorii mediane – se calculează frecvenţele cumulate până la acea
frecvenţă care adăugată conduce la depăşirea rangului valorii mediane, cu alte cuvinte dacă
N1+...+Nk ≥ rMe, atunci Me(xk-1 , xk] interval căruia îi corespunde frecvenţa Nk;
r Me−N ( x k−1 )
⋅( x k−x k −1 )
Nk N ( x k−1 )
 Calcularea expresiei x = , unde este frecvenţa
cumulată până la intervalul median;
 Calcularea valorii mediane: Me = xk-1 + x.
9
Valoarea modală (Mo)
 Determinarea intervalului valorii modale - acel interval pentru care s-au înregistrat cele mai
multe unităţi statistice;
Δ1
⋅ x −x
 Mo = xk-1 +
Δ1 + Δ2 ( k k −1 ) , unde 1 este diferenţa dintre frecvenţa intervalului
modal şi frecvenţa intervalul precedent, iar 2 este diferenţa dintre frecvenţa intervalului modal
şi frecvenţa intervalul următor.
Quartilele
p
rq = N
 Determinarea rangului quartilei: p m
, p= ; 1,m−1
 Determinarea intervalului quartilei – se calculează frecvenţele cumulate până la acea frecvenţă
rq
care adăugată conduce la depăşirea rangului quartilei, cu alte cuvinte dacă N 1+...+Nk ≥ p ,
atunci qp (xk-1 , xk];
r q −N ( x k−1)
p
¿ ( x k −x k−1 )
Nk N x
( k−1)
 Calcularea expresiei x = , unde este frecvenţa
cumulată până la intervalul quartilei, iar lk este lungimea intervalului quartilei;
 Calcularea valorii quartile: qp = xk-1 + x, p= 1,m−1 .
 Parametrii variaţiei
Dispersia (σ2, s2). Abaterea medie pătratică (σ, s).
Dispersia
 Populaţie
 Caz discret
2
∑ ( x k −μ )2
 date negrupate
σx = N ;
2
∑ ( x k −μ )2 N k
 date grupate
σ
x = N .
 Caz continuu (date grupate pe intervale de variaţie):
2
2
∑ ( x 'k −μ ) Nk
σx = N ,
x +x
x 'k = k −1 k
unde 2 este centrul clasei k (mijlocul intervalului de variaţie).
 Eşantion
 Caz discret
10
∑ ( x k −x )2
2
 date negrupate
sx = n−1 ;
∑ ( x k −x )2 nk
2
 date grupate x = s n−1 .
 Caz continuu (date grupate pe intervale de variaţie):
2
2
∑ ( x 'k −x ) n k
sx = n−1 ,
'
x k −1 + x k
xk =
unde 2 este centrul clasei k (mijlocul intervalului de variaţie), iar nk
este frecvenţa clasei în eşantion.
Abaterea medie pătratică – măsoară gradul de reprezentativitate al valorii medii, dând măsura gradului
de împrăştiere a valorilor variabilei în jurul valorii medii.
 Populaţie: σx = √σ 2x ;
 Eşantion: sx = √s 2x .
Coeficientul de variaţie al lui Pearson

σx
×100
 Populaţie: Vx = μ ;
sx
×100
 Eşantion: Vx = x .
Coeficientul de corelaţie liniară

n ∑ x i y i− ∑ x i ∑ y i
2 2
rxy = √ n ∑ x −( ∑ x ) √ n ∑ y −( ∑ y )
2
i i
2
i i
Valorile coeficientului de corelaţie sunt cuprinse între -1 şi 1. Astfel:
 dacă r[0;0,3]  legătură liniară pozitivă (directă) slabă;
 dacă r(0,3;0,7]  legătură liniară pozitivă (directă) de intensitate medie;
 dacă r (0,7;1]  legătură liniară pozitivă (directă)
puternică;
 dacă r[-0,3;0]  legătură liniară negativă (inversă)
slabă;
 dacă r[-0,7; -0,3)  legătură liniară negativă (inversă) de intensitate medie;
 dacă r [-1; -0,7)  legătură liniară negativă (inversă)
puternică.
11
1.3.2. Elemente de statistică inferenţială
 Estimarea parametrilor
 Estimarea punctuală a parametrilor
 Estimatorul punctual al valorii medii  a populaţiei este media de eşantion
x=
∑ xi
n .
2
 Estimatorul punctual al dispersiei populaţiei
σx este dispersia de eşantion
2
∑ ( x i −x )
s 2x=
n−1 .
 Estimatorul punctual al abaterii medii pătratice a populaţiei σ x este abaterea medie pătratică de
eşantion
2
sx =
s √
x .
 Estimatorul punctual al erorii standard a mediei

σx este
sx unde:
sx
sx 
n în cazul populaţiei infinite;
 Estimatorul punctual al proporţiei populaţiei p este proporţia la nivel de eşantion p .
 Estimarea parametrilor prin intervale de încredere
 Intervalul (1,2) se numeşte interval de încredere pentru parametrul necunoscut  dacă P(1 
 2)= 1–, unde (1–) se numeşte coeficient (nivel) de încredere iar  se numeşte coeficient
(nivel) de semnificaţie.
^
 Dacă λ este un estimator punctual al parametrului necunoscut  atunci intervalul de încredere
pentru parametrul  va avea forma:
^λ
 (eroarea de eşantion)
 Interval de încredere pentru valoarea medie

x  (eroarea de eşantion)
 Cazul eşantioanelor de volum mare (n30)
 Dacă se cunoaşte dispersia populaţiei atunci:



  x  z 2 x  x 
n
 Dacă nu se cunoaşte dispersia populaţiei atunci:
12
sx
  x  z  sx 
 2sx n
Nivel de Nivel de z
semnificaţie încredere P(0 z   2 z 2
 1– )
0,1 0,90 0,45 1,65
0,05 0,95 0,475 1,96
0,01 0,99 0,495 2,58
 Cazul eşantioanelor de volum mic (n 30)

sx
μ∈ ( x±tα /2 ;( n−1 ) gl s x ) s x=
, √n
 Interval de încredere pentru estimarea diferenţei a două valori medii
 Cazul eşantioanelor independente

o Eşantioane independente de volum mare (n1 30, n2 30)
2 2
σ σ
μ1 −μ 2 ∈ ( x1 −x 2 ±z α /2 σ x − x
, 1 2 ) .
Dacă nu se cunosc dispersiile populaţiilor atunci acestea se înlocuiesc cu estimatorii lor punctuali
1 2
√
σ x −x = 1 + 2
n 1 n2
s 12 , s 22 , σ x −x
şi anume dispersiile de eşantion iar 1 2 se înlocuieşte cu estimatorul său punctual
2 2
s s
s x −x =
1 2 √ 1
+
n1 n2
2
. Astfel în acest caz intervalul va avea următoarea formă:

μ1 −μ 2 ∈ ( x1 −x 2 ±z α /2 s x )
1−x 2 .
o Cazul eşantioanelor de volum mic (n1 30, n2 30)


 1   2  x1  x 2  t 2; gl s x
1  x2
 ,
s
1

1  n1  1 s 12   n 2  1 s 22
sx s 
2
1  x2
n1 n 2
,
 n1  n 2  2  .
 Cazul eşantioanelor perechi
μd ∈ ( d±z α /2 s d )
, d=x1 – x2,
d=
∑ di i i
 Valoarea medie: n ,
d i=x 1 −x 2
∑ ( d i−d )2
s 2d =
 Dispersia: n−1 ;
13
 Abaterea medie pătratică
s d = √ s2d ;
sd
s d=
 Eroarea standard √n .
 Verificarea ipotezelor statistice
 Teste de semnificaţie
Fie  un parametru necunoscut al unei populaţii. O ipoteză formulată asupra acestui parametru se
va numi ipoteză nulă Ho.
Ho: =o
O altă ipoteză ce se formulează este ipoteza alternativă H1 ce poate avea următoarea formă:
H1: ≠o – test bilateral;
H1: o – test unilateral la dreapta;
H1: o – test unilateral la stânga.
Etapele derulării unui test de semnificaţie
1. Formularea ipotezei nule şi a ipotezei alternative
Test bilateral Teste unilaterale

Ho: =o Ho: =o Ho: =o
H1: ≠o H1: o H1:  o
2. Determinarea nivelului de semnificaţie  - probabilitatea comiterii unei erori prin

respingerea ipotezei nule datorită erorii de eşantionare, în cazul în care aceasta este de fapt
adevărată;
3. Colectarea datelor la nivel de eşantion, alegerea şi calcularea statisticii test ce va fi folosită
pentru a decide acceptarea sau respingerea ipotezei nule;
4. Determinarea valorilor critice ale statisticii;
5. Luarea deciziei.
Figura 12.2.1. Zonele de respingere şi de acceptare ale ipotezei nule

Test bilateral
14
Zonă de respingere Zonă de respingere
Zonă de acceptare
valoarea critică valoarea critică
15
Test unilateral la dreapta
Zonă de respingere
Zonă de acceptare
valoarea critică
Test unilateral la stânga
Zonă de respingere
Zonă de acceptare
valoarea critică
Verificarea ipotezelor asupra valorii medii 

Test bilateral Test unilateral
Formularea ipotezelor Formularea ipotezelor
Ho: =o; H1: ≠o Ho: =o; H1: o
Ho: =o; H1: o
Determinarea nivelului de semnificaţie  Determinarea nivelului de semnificaţie 
Colectarea datelor la nivel de eşantion, Colectarea datelor la nivel de eşantion, alegerea şi
alegerea şi calcularea statisticii: calcularea statisticii:
x−μ o x−μ o x−μ o x−μ o
a. z=
σx sau z=
sx a. z=
σx sau z=
sx
x−μ o x−μ o
b. t= x s b. t=
s
x
Determinarea valorilor critice Determinarea valorilor critice
a.
±z α /2 a.
zα a. -
zα
±t α /2; (n−1 ) gl t α ; (n−1) gl t α ; (n−1) gl
b. b. b. -
Luarea deciziei Luarea deciziei
Dacă valorile calculate Dacă valorile calculate
Dacă valorile calculate ale statisticilor se află sunt mai mici decât cele sunt mai mari decât cele
între valorile critice atunci ipoteza nulă nu critice ipoteza nulă nu critice ipoteza nulă nu
poate fi respinsă în caz contrar aceasta se poate fi respinsă. poate fi respinsă.
respinge
16
Verificarea ipotezelor asupra diferenţei valorilor medii 1-2
Eşantioane independente
Ho: 1-2=0; H1: 1-2≠0 Ho: 1-2=0; H1: 1-2 0
Ho: 1-2=0; H1: 1-20
alegerea şi calcularea statisticii calcularea statisticii
 n130, n230  n130, n230
( x1 −x 2 ) −( μ1−μ2 ) ( x1 −x 2 ) −( μ1 −μ2 )
s x −x s x −x
z= 1 2 , z= 1 2 ,
2 2 2 2
s s s s

s x −x =
1
n130, n230 (
2 √ +
n1 n2
1
σ 21 =σ 22=σ 2
2
) 
s x −x =
n130, n230 (
1 2
√ +
n1 n2
σ 21 =σ 22=σ 2 )
1 2
( x1 −x 2 ) −( μ1−μ2 ) ( x1 −x 2 ) −( μ1−μ2 )
s x −x s x −x
t= 1 2 t= 1 2
1 1 1 1
s x1−x 2=s
2
√ +
n1 n2 ,
2
( n1 −1 ) s 1 + ( n2−1 ) s 2
s x1−x 2=s
2
√ +
n1 n2 ,
2
( n1 −1 ) s 1 + ( n2−1 ) s 2
2 2
s = s =
( n1 + n2−2 ) ( n1 + n2−2 )
±z α /2  n130, n230  z sau - z
 n130, n230 
±t α /2;( n +n −2 ) gl t α ;( n +n −2 ) gl
 n130, n230  1 2  n130, n230  1 2 sau
−t α ;( n +n −2 ) gl
1 2
Dacă valorile Dacă valorile calculate
Dacă valorile calculate ale statisticilor se află calculate sunt mai sunt mai mari decât cele
între valorile critice atunci ipoteza nulă se mici decât cele critice critice ipoteza nulă se
acceptă în caz contrar aceasta se respinge ipoteza nulă se acceptă.
acceptă.
Eşantioane perechi
Ho: d=0; H1: d ≠0 Ho: d=0; H1: d0
Ho: d=0; H1: d0
alegerea şi calcularea statisticii calcularea statisticii
 n30  n30
17
d−μd sd d−μd sd
sd= sd=
z=
sd , √n z=
sd , √n
 n30  n30
d−μd sd d−μd sd
sd= sd=
t= d s , √n t= d s , √n
±z α /2  n30  z sau - z
 n30 
±t α /2;( n−1 ) gl t α ;( n−1 ) gl α ;( n−1 ) gl −t
 n30   n30  sau
Dacă valorile Dacă valorile calculate
Dacă valorile calculate ale statisticilor se află calculate sunt mai sunt mai mari decât cele
între valorile critice atunci ipoteza nulă se mici decât cele critice critice ipoteza nulă se
acceptă în caz contrar aceasta se respinge ipoteza nulă se acceptă.
acceptă.
 Analiza varianţei (ANOVA)
Etapele unei analize de tip ANOVA

1. Formularea ipotezelor;
Ho: 1=2=...=k;
H1: nu toate mediile sunt egale.
2. Stabilirea nivelului de semnificaţie ;
3. Calculul elementelor necesare determinării valorii statisticii test
3.1. Calculul mediei şi dispersiei fiecărui eşantion

x i , s 2i ,i=1,k ;
3.2. Calculul valorii medii totale x ;

k
∑ ni ( x i −x ) 2
s 2b = i=1
3.3. Calcul varianţei între grupuri k −1 ;
k k
∑ ( ni −1 ) s 2i ∑ ( ni −1 ) s 2i
i=1
i=1
2
3.4. Calculul varianţei în grupuri
sw = ( n1 +. . .+ nk )−k = n−k
Tabelul ANOVA
Tabelul ANOVA este un tabel în care se trec toate elementele calculate la punctul acesta având
următoarea structură:
Sursa Suma pătratelor Grade de libertate Media sumelor pătratelor
Între grupuri SSB k–1 s 2b =SSB/ ( k−1 )
În grupuri SSW n–k s 2w =SSW / ( n−k )
Total SST=SSB+SSW n–1
18
4. Calcularea statisticii test F;
SSB
( k −1 )
s 2b
SSW
F = ( n−k ) =
s 2w
.
5. Determinarea valorilor critice F; (k-1, n-k)gl;
6. Luarea deciziei: dacă F F; (k-1, n-k)gl ipoteza nulă se respinge în caz contrar aceasta acceptându-
se.
Distribuţia Student t
Grade de libertate t0.100 t0.050 t0.025 t0.010 t0.005

1 3.078 6.314 12.706 31.821 63.657
2 1.886 2.920 4.303 6.965 9.925
3 1.638 2.353 3.182 4.541 5.841
4 1.533 2.132 2.776 3.747 4.604
5 1.476 2.015 2.571 3.365 4.032
6 1.440 1.943 2.447 3.143 3.707
7 1.415 1.895 2.365 2.998 3.499
8 1.397 1.860 2.306 2.896 3.355
9 1.383 1.833 2.262 2.821 3.250
10 1.372 1.812 2.228 2.764 3.169
11 1.363 1.796 2.201 2.718 3.106
12 1.356 1.782 2.179 2.681 3.055
13 1.350 1.771 2.160 2.650 3.012
14 1.345 1.761 2.145 2.624 2.977
15 1.341 1.753 2.131 2.602 2.947
16 1.337 1.746 2.120 2.583 2.921
17 1.333 1.740 2.110 2.567 2.898
18 1.330 1.734 2.101 2.552 2.878
19 1.328 1.729 2.093 2.539 2.861
20 1.325 1.725 2.086 2.528 2.845
21 1.323 1.721 2.080 2.518 2.831
22 1.321 1.717 2.074 2.508 2.819
23 1.319 1.714 2.069 2.500 2.808
24 1.318 1.711 2.064 2.492 2.797
25 1.316 1.708 2.060 2.485 2.787
26 1.315 1.706 2.056 2.479 2.779
27 1.314 1.703 2.052 2.473 2.771
28 1.313 1.701 2.048 2.467 2.763
29 1.311 1.699 2.045 2.462 2.756
30 1.310 1.697 2.042 2.457 2.750
40 1.303 1.684 2.021 2.423 2.704
60 1.296 1.671 2.000 2.390 2.660
120 1.289 1.658 1.980 2.358 2.617
19
Distribuţia Fischer pentru un nivel de semnificaţie de 5% (α=0,5)
k-1
n-k Grade de libertate ale numărătorului
1 2 3 4 5 6 8 12 24 
1 161.4 199.5 215. 224.6 230. 234.0 239.0 244.0 249.0 254.3
7 2
2 18.51 19.00 19.1 19.25 19.3 19.33 19.37 19.41 19.45 19.50
6 0
3 10.13 9.55 9.28 9.12 9.01 8.94 8.84 8.74 8.64 8.53
4 7.71 6.94 6.59 6.39 6.26 6.16 6.04 5.91 5.77 5.63
5 6.61 5.79 5.41 5.19 5.05 4.95 4.82 4.68 4.53 4.36
6 5.99 5.14 4.76 4.53 4.39 4.28 4.15 4.00 3.84 3.67
7 5.59 4.74 4.35 4.12 3.97 3.87 3.73 3.57 3.41 3.24
8 5.32 4.46 4.07 3.84 3.69 3.58 3.44 3.28 3.12 2.93
9 5.12 4.26 3.68 3.63 3.48 3.37 3.23 3.07 2.90 2.71
Grade de libertate ale numitorului
10 4.96 4.10 3.71 3.48 3.33 3.22 3.07 2.91 2.74 2.54
11 4.84 3.98 3.59 3.36 3.20 3.09 2.95 2.79 2.61 2.40
12 4.75 3.88 3.49 3.26 3.11 3.00 2.85 2.69 2.50 2.30
13 4.67 3.80 3.41 3.18 3.02 2.92 2.77 2.60 2.42 2.21
14 4.60 3.74 3.34 3.11 2.96 2.85 2.70 2.53 2.35 2.13
15 4.54 3.68 3.29 3.06 2.90 2.79 2.64 2.48 2.29 2.07
16 4.49 3.63 3.24 3.01 2.85 2.74 2.59 2.42 2.24 2.01
17 4.45 3.59 3.20 2.96 2.81 2.70 2.55 2.38 2.19 1.96
18 4.41 3.55 3.16 2.93 2.77 2.66 2.51 2.34 2.15 1.92
19 4.38 3.52 3.13 2.90 2.74 2.63 2.48 2.31 2.11 1.88
20 4.35 3.49 3.10 2.87 2.71 2.60 2.45 2.28 2.08 1.84
21 4.32 3.47 3.07 2.84 2.68 2.57 2.42 2.25 2.05 1.81
22 4.30 3.44 3.05 2.82 2.66 2.55 2.40 2.23 2.03 1.78
23 4.28 3.42 3.03 2.80 2.64 2.53 2.38 2.20 2.00 1.76
24 4.26 3.40 3.01 2.78 2.62 2.51 2.36 2.18 1.98 1.73
25 4.24 3.38 2.99 2.76 2.60 2.49 2.34 2.16 1.96 1.71
26 4.22 3.37 2.98 2.74 2.59 2.47 2.32 2.15 1.95 1.69
27 4.21 3.35 2.96 2.73 2.57 2.46 2.30 2.13 1.93 1.67
28 4.20 3.34 2.95 2.71 2.56 2.44 2.29 2.12 1.91 1.65
29 4.18 3.33 2.93 2.70 2.54 2.43 2.28 2.10 1.90 1.64
30 4.17 3.32 2.92 2.69 2.53 2.42 2.27 2.09 1.89 1.62
40 4.08 3.28 2.84 2.61 2.45 2.34 2.18 2.00 1.79 1.51
20

Curs 1 Econometrie

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Curs 1 Econometrie

Încărcat de

Drepturi de autor:

Formate disponibile

Curs 1: Econometria

1.1. Ce este econometria?

1.1. Ce este econometria?

Ragnar Anton Kittil Frisch

Goldberg1 defineşte econometria ca fiind ştiinţa în care uneltele teoriilor economice,

Samuelson, Koopmans şi Stone2 spun că econometria constă în aplicarea statisticii în

Paul Anthony Samuelson Tjalling C.Koopmans John Richard Nicholas Stone

1.2. Metodologia econometriei

În fapt econometria a apărut ca instrument de testare a unor ipoteze formulate pornind de

Spre exemplu pornim cu următoarea întrebare:

? Influenţează condiţiile economice dorinţa oamenilor de a muncii?

Pentru a răspunde la această întrebare considerăm două variabile şi anume rata

1.2.1. Formularea ipotezelor

1.2.2. Colectarea datelor

Avem nevoie de informaţii cantitative despre cele două variabile.

Anul RFM (%) RS (%) COM* ($)

*COM – câştigul mediu orar

1.2.3. Specificarea modelului matematic

Ca o primă aproximare putem scrie relaţia dintre RFM şi RS astfel:

RFM=B0 + B1*RS (1)

B0, B1 se numesc parametrii modelului matematic.

B1 ne arată cu cât se modifică RFM atunci când RS se modifică cu o unitate. B1 poate fi

1.2.4. Specificarea modelului statistic sau econometric

RFM=B0 + B1*RS + u (2)

Y=B0 + B1*X + u (3)

Kendall şi Stuart3 notează că o relaţie statistică, oricât de puternică şi sugestivă nu poate

Conform acestei teorii, în cazul exemplului nostru, teoria economică trebuie să

1.2.5. Estimarea parametrilor modelului econometric

RFM = 69.9355 – 0.6458*RS (4)

Observaţie: RFM ne reaminteşte că (4) este o estimare a ecuaţiei (2).

1.2.6. Alegerea celui mai bun model

RFM= B0 + B1*RS + B2*COM + u (5)

Această relaţie ne arată următoarele:

Care model trebuie ales?

1.2.7. Testarea ipotezelor ce derivă din model

De exemplu ipoteza „discouraged-worker” postulează o relaţie inversă între RFM şi

1.2.8. Estimări şi predicţii

1.3.1. Elemente de statistică descriptivă

 Statistica – ştiinţa colectării, analizării, prezentării şi interpretării datelor.

 elemente (unităţi) statistice – entităţi în funcţie de care sunt colectate datele.

 Seria statistică – grupare de valori rezultată ca urmare a analizării unei populaţii în

 Parametrii tendinţei centrale şi de structură

Valoarea mediană (Me)

Cazul datelor grupate pe intervale de variaţie

Clasa Frecvenţa Frecvenţa

Valoarea medie (, x )

Valoarea mediană (Me)

 Calcularea valorii quartile: qp = xk-1 + x, p= 1,m−1 .

Dispersia (σ2, s2). Abaterea medie pătratică (σ, s).

Coeficientul de variaţie al lui Pearson

Coeficientul de corelaţie liniară

 Estimarea punctuală a parametrilor

 Estimatorul punctual al valorii medii  a populaţiei este media de eşantion

 Estimatorul punctual al erorii standard a mediei

 Estimatorul punctual al proporţiei populaţiei p este proporţia la nivel de eşantion p .

 Estimarea parametrilor prin intervale de încredere

 Interval de încredere pentru valoarea medie

 Cazul eşantioanelor de volum mare (n30)

 Dacă se cunoaşte dispersia populaţiei atunci:

 Cazul eşantioanelor de volum mic (n 30)

 Cazul eşantioanelor independente

. Astfel în acest caz intervalul va avea următoarea formă:

o Cazul eşantioanelor de volum mic (n1 30, n2 30)

 Cazul eşantioanelor perechi

RFM= B0 + B1RS + B2COM + u (5)