Documente Academic
Documente Profesional
Documente Cultură
1
Natura econometriei și a datelor economice
• Econometria este utilizată pentru
– Estimarea relațiilor economice
– Testarea teoriilor economice
– Evaluarea și implementarea politicilor (economice,
sociale)
– Previziunea efectelor unor factori, a politicilor
• Exemple:
– Care este efectul educației asupra veniturilor?
– Cum influențează programele educaționale
productivitatea muncii?
– Cum vor evolua prețurile acțiunilor în viitor?
3
Datele în econometrie
• Elementul principal sunt datele – de cele mai multe
ori sub forma eșantioanelor mari
• Datele sunt informațiile colectate (obținute)
• Econometria = o metoda de procesare a datelor și
de aflare a profilurilor generale ale populației de
interes
• Spre exemplu:
– Care este efectul investiției în educație asupra
economiei și pieței forței de muncă?
– Care este efectul modificării veniturilor asupra
comportamentului de consum?
– Care este efectul unui medicament asupra unei boli?
2
Structuri comune ale datelor economice
• Date transversale: Eșantion de persoane, gospodării,
companii etc., extras și observat la o anumita dată; de cele
mai multe ori este un eșantion aleator extras dintr-o
populație de referință.
• Serii de timp: Observare pe una sau mai multe variabile în
timp (exemplu: cifra de afaceri a întreprinderilor pe o
perioada lungă de timp). Seriile de timp nu sunt
independente în timp, ceea ce necesită analiza unor implicații
metodologice.
• Observații transversale combinate: Combină seturile de date
transversale cu momente sau perioade de timp diferite.
• Date panel sau longitudinale: Combină seturi de date
transversale cu perioade de timp diferite pentru aceleași
unităţi individuale.
3
Econometria și Economia
• Econometria trebuie întotdeauna legată de
raționamentul economic, de teoria economică și de
judecata analistului
• Cât de formalizată sau de puternică este această
legătură variază de la un studiu la altul
• Cercetătorii care pun la punct testarea unei teorii
economice încep, de obicei, prin dezvoltarea unui
model economic, adică un set de ecuații
matematice care descriu diverse relații
• Totuși este destul de obișnuit (și acceptabil) să se
utilizeze o teorie economică mai puțin formalizată –
sau să se bazeze chiar în întregime pe intuiție
Cauzalitate
• Un țel comun al analiștilor este să estimeze
efectul cauzal al unei variabile asupra unui
rezultat de interes
• Important: Trebuie să distingem între corelație
(asociație) și cauzalitate.
• Ceteris paribus: concept care ne spune că ”Dacă
ceilalți factori sunt egali, care este efectul ...
– Creșterii preturilor asupra cererii”
– Formarii profesionale asupra productivității”
4
Cauzalitate (continuare)
• Dacă…
• … reușim să menținem constanți toți ceilalți
determinanți (să spunem) ai productivității; și
• …găsim o legătură dintre formare profesională și
productivitate,
• …atunci putem sa concluzionăm că formarea
profesională are un efect cauzal asupra
productivității.
Cauzalitate (continuare)
• Condițiile ideale sunt cele experimentale: în
laborator – administram tratamentul unei
jumătăți din eșantion și utilizam cealaltă
jumătate ca eșantion de control
• Cei mai mulți dintre economiști nu utilizează
date experimentale
• O provocare majoră în econometrie constă în
condiționarea asupra multor altor factori astfel
încât să se identifice o cauzalitate
10
10
5
Cauzalitate: Exemplu
• Țel: Estimarea efectului cauzal al educației
asupra câștigurilor
• Diagrama în puncte:
25
20
average hourly earnings
15
10
5
0
0 5 10 15 20
years of education
11
11
Cauzalitate: Exemplu
• Aceasta nu înseamnă că educația influențează veniturile
• Veniturile sunt influențate de mulți alți factori în afara
educației – spre exemplu abilitățile
– Abilități deosebite => venituri mari
– Abilități deosebite => educație înaltă (ex. Persoanele
inteligente aleg educația înaltă)
• Se poate ca legătura de corelație dintre educație și
câștiguri vizibilă din grafic să fie determinată mai degrabă
de abilități decât de educație?
• Pentru a estima credibil efectul cauzal al educației,
trebuie sa găsim o cale de determinare a legăturii dintre
educație și câștiguri ținând constante abilitățile!
12
12
6
Modelul regresiei simple
SECȚIUNEA A 2-A: CONSTRUIREA MODELULUI MATEMATIC
13
13
14
14
7
Tipuri de modele
• Modelul determinist, în care, pentru fiecare valoare
a lui X cunoaștem exact valoarea lui Y
• Exemplu: Fahrenheit =(9/5)*Celsius+32
140
120
100
Fahrenheit
80
60
40
20
0
0 5 10 15 20 25 30 35 40 45 50
Celsius
15
15
Tipuri de modele
• Modelul statistic, în
care, pentru fiecare
valoare a lui X, valoarea
lui Y nu este perfect
cunoscută
• Exemplu: Relația dintre
latitudinea statului și
incidența cancerului de
piele
– Sursa: Penn State University
16
16
8
Modelul regresiei liniare simple (1)
• Să presupunem că vrem ”să explicăm Y în
funcție de X”, adică să măsurăm cât de mult
(sau puțin) este modificat Y dacă X este
modificat:
– Dacă se investește în educație (X), cum și cât de
mult se va modifica productivitatea muncii (Y)?
– Dacă pe un teren se aplică o anumită cantitate dintr-
un îngrășământ (X), cu cât de va modifica recolta
(Y)?
– Dacă venitul se modifică (X), cum și cu cât se va
modifica consumul (Y)?
17
17
18
18
9
Modelul regresiei liniare simple (3)
• La nivelul populației de referință, variabila de
rezultat Y poate fi modelată ca o funcție de X
după cum urmează:
𝑌 = 𝛽0 + 𝛽1 ∗ 𝑋 + ε
Terminologia regresiei simple
y x
• ε: termen de eroare; reziduu;
Variabilă dependentă Variabilă independentă zgomot
Variabilă explicată Variabilă explicativă
• β0, β1: parametri, coeficienți,
Variabilă de răspuns Variabilă de control constante
Variabilă predicţionată Variabilă predictoare
Regresand Regresor
19
19
20
20
10
Interpretare și întrebări
• Exemple de modele
recolta = β0 + β1*îngrășământ + ε
venitul = β0 + β1*educație + ε
• Cum interpretăm β1 în aceste ecuații?
• Care pot fi ”alți factori” reprezentați de ε în
aceste ecuații?
21
21
Exemplu
• Relația dintre rezultatele din liceu (High School Grade
Point Average) și notele de admitere la facultate
(College entrance test score) – sursa: Penn State
University
22
22
11
Exemplu
• Observăm că la fiecare valoare GPA (de pe orizontală)
sunt mai multe cercuri care corespund studenților care
au obținut diverse note la testul de admitere
• Pentru fiecare notă GPA
– notele de admitere (Y) se concentrează spre o valoare medie,
iar mediile par a fi în relație liniară (L)
– diferența dintre nota de admitere a unui student și media
notelor tuturor studenților (pe care le numim erori) este
independentă de eroarea notei de admitere a altui student
(I)
– notele de admitere (Y) apar ca având o distribuție normală
(N)
– notele de admitere (Y) au dispersie egală (abatere medie
pătratică) (E)
23
23
24
24
12
Supoziții ale modelului RLS
• Supoziția crucială a independenței:
• La orice valoare a lui X, media erorilor (diferența
dintre valoarea observată a variabilei Y și media
valorilor variabilei Y) este egală cu media tuturor
erorilor
Ε 𝜀 𝑥 = Ε(𝜀)
– Partea din stânga este o așteptare condiționată
– Partea din dreapta este o așteptare necondiționată
(doar valoarea așteptată a lui ε, indiferent de x).
– Astfel, expresia spune că valoarea așteptata a lui ε este
independentă de x. Formalizat, spunem că ε este media
independentă de x.
25
25
26
26
13
Valoarea așteptată
• Valoarea așteptată este media ponderată a
tuturor valorilor posibile ale lui X, unde
ponderile sunt determinate de funcția de
densitate a probabilității
• Exemplu: să presupunem că X ia valorile -1, 0,
and 2 cu probabilitățile 1/8, ½ și 3/8. Atunci,
1 1 3
Ε 𝑋 = −1 ∙ +0∙ +2∙( )
8 2 8
• care e egală cu 5/8 (sau 0.625).
27
27
Așteptarea condiționată
• Putem rezuma relația dintre o variabilă Y și o
altă variabilă X prin investigarea așteptării
condiționate a lui Y în funcție de o valoare dată
a variabilei X
• Ideea de bază: Să presupunem că X a luat o
valoare particulară, sa spunem x
• Putem calcula valoarea așteptata a lui Y dată
fiind valoarea lui X (ex.: x)
• Notăm această valoare așteptată cu E(Y|X=x),
sau uneori doar cu E(Y|x).
28
28
14
Așteptarea condiționată: exemplu
• Fie (X,Y) seria de repartiție a populației tuturor
absolvenților de liceu care au data admitere la
facultate, unde X este nota la absolvire (GPA) și
Y este nota la testul e admitere.
• E(Y|X=1) este nota medie la admitere a tuturor
absolvenților cu GPA=1.
• Similar, E(Y|X=4) este nota medie la admitere a
tuturor absolvenților cu GPA=4.
• Alte exemple: salariul unei persoane în funcție
de numărul de ani de educație (4, 8, 12, 16 etc.)
29
29
Diagrama
30
30
15
Să ne întoarcem
• Am întâlnit următoarea ’supoziție cruciala’:
Ε 𝜀 𝑥 = Ε(𝜀)
• Uitați-vă la diagrama din slide-ul anterior: la intersecția
dreptei cu norii de puncte se află valoarea așteptată a
notei de admitere pentru fiecare nota GPA, adică Ε 𝑦 𝑥
• Cum ați desena o diagramă pentru care Ε 𝜀 𝑥 = Ε(𝜀)?
• Răspuns:
– Dacă pe axa orizontală am reprezenta valorile lui X (notele
GPA), iar pe verticală valorile așteptate ale erorilor, iar la
fiecare valoare a lui X acea valoare așteptată este egală cu o
constantă Ε(𝜀), atunci ne „așteptăm” ca la toate valorile lui X
să putem trasa o dreaptă paralelă cu axa oX care
intersectează axa oY în punctul dat de Ε(𝜀)
31
31
Exemplu
• Ce presupune aceasta supoziție în contextul
modelului venitul = β0 + β1*educație + ε ?
• Are sens aceasta supoziție în acest context?
Ε 𝜀 𝑒𝑑𝑢𝑐𝑎𝑡𝑖𝑒 = Ε(𝜀)
32
32
16
O supoziție mai evidentă
• Atât timp cât parametrul β0 este inclus în
ecuație, vom putea întotdeauna presupune că
valoarea medie a lui 𝜀 în populație este zero
Ε 𝜀 =0
• De ce este aceasta o ”supoziție evidentă”?
33
33
Exercițiu de raționament
• Dacă modelul este 𝑌 = 𝛽0 + 𝛽1 ∗ 𝑋 + ε
• Cu supozițiile
Ε 𝜀 𝑥 = Ε(𝜀)
Ε 𝜀 =0
• Arătați că următoarea ecuație este adevărată:
Ε 𝑦 𝑥 = 𝛽0 + 𝛽1 ∗ 𝑥
• E(y|x) este funcția de regresie a populației (FRP).
• Este o funcție liniară de x.
• O crestere cu o unitate în x modifică valoarea
așteptată a lui y cu β1
34
34
17
Supoziția varianțelor egale
35
35
Interpretare:
Separarea lui y în două părți
• Avem modelul 𝑌 = 𝛽0 + 𝛽1 ∗ 𝑋 + ε
• Dată fiind FRP Ε 𝑦 𝑥 = 𝛽0 + 𝛽1 ∗ 𝑥, înseamnă
că
𝑌 =Ε 𝑦 𝑥 +ε
• Primul termen al părții din dreapta indică
componenta sistematică a lui Y, influențată de X
• Al doilea termen indică componenta
nesistematică a lui Y, influențată de alți factori
neobservați
36
36
18
Obținerea
estimațiilor celor mai mici pătrate ordinare
• Pornim de la modelul populației totale
𝑌 = 𝛽0 + 𝛽1 ∗ 𝑋 + ε
• Vom discuta cum se estimează parametrii
(necunoscuți) ai modelului.
• Să presupunem că avem un eșantion aleator de
mărime n extras din populație:
• Observații indicii i ai celor două variabile.
Modelul de regresie pentru fiecare individ
devine: 𝑦𝑖 = 𝛽0 + 𝛽1 ∗ 𝑥𝑖 + ε𝑖
37
37
38
19
Metoda celor mai mici pătrate (CMMP) (1)
• Pentru a vedea în ce constă metoda, să definim
mai întâi o valoare ajustată pentru y când x=xi
ca fiind 𝑦ො𝑖 = 𝛽መ0 + 𝛽መ1 ∗ 𝑥𝑖
• unde 𝛽መ0 și 𝛽መ1 sunt valorile pe care trebuie să le
estimăm cu ajutorul datelor din eșantion ale
parametrilor 𝛽0 și 𝛽1 , pe care nu îi cunoaștem
(și este posibil să nu îi cunoaștem niciodată, de
aceea alegem să îi estimăm).
39
39
40
40
20
Metoda celor mai mici pătrate (CMMP) (3)
• Estimatiile CMMP minimizează suma pătratelor
rezidualelor:
𝑛 𝑛
2
𝜀𝑖Ƹ 2 = 𝑦𝑖 − 𝛽መ0 − 𝛽መ1 ∗ 𝑥𝑖
𝑖=1 𝑖=1
• Necunoscutele sunt cei doi parametri estimați:
𝛽መ0 și 𝛽መ1
• Minimizăm suma pătratelor rezidualelor prin
derivare – separat în raport cu 𝛽መ0 și 𝛽መ1
41
41
𝑦𝑖
𝑦ො = 𝛽መ0 + 𝛽መ1 ∗ 𝑥
𝜀𝑖Ƹ = 𝑣𝑎𝑙𝑜𝑎𝑟𝑒 𝑟𝑒𝑧𝑖𝑑𝑢𝑎𝑙ă
42
42
21
Aflarea parametrilor 𝛽መ0 și 𝛽መ1
𝛿𝑓
=0
𝛿𝛽
• ൞ 𝛿𝑓0 Prin rezolvare, obținem
1 =0
𝛿𝛽
σ 𝑛 𝑛
σ𝑖=1 𝑥𝑖 −𝑥ҧ ∙ 𝑦𝑖 −𝑦ത
𝑥𝑖 ∙𝑦𝑖 −𝑛∙𝑥∙ҧ 𝑦ഥ
𝛽መ1 = 𝑖=1 𝑛 2
σ𝑖=1 𝑥𝑖 −𝑛∙𝑥ҧ 2
= σ𝑛 2
• ቐ 𝑖=1 𝑥𝑖 −𝑥ҧ
𝛽መ0 = 𝑦ഥ − 𝛽መ1 ∙ 𝑥ҧ
• unde 𝑥ҧ = σ 𝑥𝑖 /n și 𝑦ത = σ 𝑦𝑖 /n
43
43
44
44
22
Nota: Trebuie ca σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 2 >𝟎
• Dacă aceasta nu este adevărată, 𝛽መ1 nu este
definit.
• De ce?
• Ce implică asta în practică?
45
45
46
46
23
Să rezumăm
• Am obținut estimatorul CMMP din două supoziții
explicite:
– Covarianța dintre variabila independentă și variabila
reziduală este nulă -> conduce la prima ecuație
– Media erorilor este nulă -> conduce la a doua ecuație
• Este important să le înțelegem și de ce contează
• Nu am spus nimic despre proprietățile statistice ale
CMMP
• Deci mai avem de mers... Dar am făcut un prim pas.
Să consideram acum un exemplu
47
47
Exemplu:
Salariul unui CEO și RoE
• Datele: se refera la date publicate în revista
Businessweek din 6 mai 1991.
• Ar fi interesant de făcut un exercițiu similar și să
investigăm dacă relația dintre RoE și salariu s-a
schimbat între timp
48
48
24
Statistici ale datelor
. sum
49
50
25
Distribuția pentru RoE
.08
.06
Density
.04
.02
0
0 20 40 60
return on equity, 88-90 avg
51
51
Diagrama în puncte:
• Avem suficientă informație să ne dăm seama că
valoarea coeficientului de regresie (panta)
pentru RoE este egală cu .....
15000
Cov(salary,roe) = 1342.5
1990 salary, thousands $
10000
Corr(salary,roe)= 0.11
Var(roe) = 72.6
5000
52
0 20 40 60
return on equity, 88-90 avg
52
26
Rezultate din regresia simplă CMMP
• Cum interpretam aceste rezultate?
. reg salary roe
53
Linia de regresie
15000
10000
5000
0 20 40 60
return on equity, 88-90 avg
54
54
27
Temă: calcule de mână
• Modelul: 𝑌 = 𝛽0 + 𝛽1 ∗ 𝑋 + ε
+---------+
| Y X |
|---------|
| 2 1 | Nota: Rezolvati tema
| 6 9 |
| 4 3 | utilizand creion, hartie și un
| 12 18 | calculator de buzunar. Odată
| 4 5 |
| 10 15 | ce aveți un răspuns, puteți să
| 6 7 | îl verificați utilizând un
| 6 7 |
| 16 20 | software econometric (SAS,
| 12 13 | Excel)
| 8 14 |
| 6 5 |
+---------+
55
55
Supliment
MODELUL ECONOMIC AL LUI BECKER ASUPRA
INFRACȚIONALITĂȚII
56
56
28
Un model economic al infracționalității
• Anumite infracțiuni au beneficii economice
evidente, însă au și costuri
• Din perspectiva lui Becker (Gary Stanley Becker,
1968) decizia de implicare în activități ilegale
este influențata de beneficii și costuri
• Scrieți o ecuație care să descrie timpul petrecut
în activități infracționale ca o funcție de mai
mulți factori:
57
57
58
58
29
De la modelul economic la modelul
econometric
• Înainte de a face o analiză econometrică asupra
infracționalității, modelul anterior trebuie să fie
specific
– Asta înseamnă că trebuie să decidem cu exactitate
cum arată funcția f( )
– O a doua chestiune este cum tratăm variabilele care
nu pot fi observate (ex.: ”salariul” pe care cineva îl
obține din activități infracționale)
59
59
Un model econometric al
infracționalității
• infracțiune = măsură a frecventei activității infracționale
• salariu = salariul care poate fi obținut legal;
• alteven = venituri din alte surse;
• freqarest = frecventa arestărilor din infracțiuni anterioare;
• freqcond = frecventa condamnărilor;
• medsent = durata medie a sentinței după condamnare
• varsta = varsta persoanei
60
60
30
Ce aveți de făcut?
• De citit:
– Capitolele 1 și 2 și secțiunile 3.1 – 3.3 din suportul
de curs postat pe grup (paginile 1 – 20).
– Suplimentul din documentul de față, pentru discuții
la seminar
• De rezolvat tema (calcule de mână) - slide-ul
55.
61
61
31