5 ECONMP02 Regresia Liniara Simpla Partea01 PDF

Introducere în econometrie
Regresia liniară simplă

Partea I
Ref: Måns Söderbom, Universitatea Gothenburg

Damodar Gujarati, Basic Econometrics
1
Modelul regresiei simple

SECȚIUNEA ÎNTÂI – CONSIDERAȚII GENERALE
1
Natura econometriei și a datelor economice
• Econometria este utilizată pentru
– Estimarea relațiilor economice
– Testarea teoriilor economice
– Evaluarea și implementarea politicilor (economice,
sociale)
– Previziunea efectelor unor factori, a politicilor
• Exemple:
– Care este efectul educației asupra veniturilor?
– Cum influențează programele educaționale
productivitatea muncii?
– Cum vor evolua prețurile acțiunilor în viitor?
3
Datele în econometrie
• Elementul principal sunt datele – de cele mai multe
ori sub forma eșantioanelor mari
• Datele sunt informațiile colectate (obținute)
• Econometria = o metoda de procesare a datelor și
de aflare a profilurilor generale ale populației de
interes
• Spre exemplu:
– Care este efectul investiției în educație asupra
economiei și pieței forței de muncă?
– Care este efectul modificării veniturilor asupra
comportamentului de consum?
– Care este efectul unui medicament asupra unei boli?
2
Structuri comune ale datelor economice
• Date transversale: Eșantion de persoane, gospodării,
companii etc., extras și observat la o anumita dată; de cele
mai multe ori este un eșantion aleator extras dintr-o
populație de referință.
• Serii de timp: Observare pe una sau mai multe variabile în
timp (exemplu: cifra de afaceri a întreprinderilor pe o
perioada lungă de timp). Seriile de timp nu sunt
independente în timp, ceea ce necesită analiza unor implicații
metodologice.
• Observații transversale combinate: Combină seturile de date
transversale cu momente sau perioade de timp diferite.
• Date panel sau longitudinale: Combină seturi de date
transversale cu perioade de timp diferite pentru aceleași
unităţi individuale.
O problemă de practică a analistului

• Cel mai bine este ca analistul să poată
”controla” datele pe care le analizează
• Datele pot proveni
– Dintr-un experiment: analistul are control total
asupra datelor
– Dintr-o altă observație: analistul depinde de datele
deja colectate
• Cel mai adesea, datele provin dintr-o altă
observare, ceea ce face necesară luarea unor
măsuri asiguratorii
6
3
Econometria și Economia
• Econometria trebuie întotdeauna legată de
raționamentul economic, de teoria economică și de
judecata analistului
• Cât de formalizată sau de puternică este această
legătură variază de la un studiu la altul
• Cercetătorii care pun la punct testarea unei teorii
economice încep, de obicei, prin dezvoltarea unui
model economic, adică un set de ecuații
matematice care descriu diverse relații
• Totuși este destul de obișnuit (și acceptabil) să se
utilizeze o teorie economică mai puțin formalizată –
sau să se bazeze chiar în întregime pe intuiție
Cauzalitate
• Un țel comun al analiștilor este să estimeze
efectul cauzal al unei variabile asupra unui
rezultat de interes
• Important: Trebuie să distingem între corelație
(asociație) și cauzalitate.
• Ceteris paribus: concept care ne spune că ”Dacă
ceilalți factori sunt egali, care este efectul ...
– Creșterii preturilor asupra cererii”
– Formarii profesionale asupra productivității”
4
Cauzalitate (continuare)
• Dacă…
• … reușim să menținem constanți toți ceilalți
determinanți (să spunem) ai productivității; și
• …găsim o legătură dintre formare profesională și
productivitate,
• …atunci putem sa concluzionăm că formarea
profesională are un efect cauzal asupra
productivității.
Cauzalitate (continuare)
• Condițiile ideale sunt cele experimentale: în
laborator – administram tratamentul unei
jumătăți din eșantion și utilizam cealaltă
jumătate ca eșantion de control
• Cei mai mulți dintre economiști nu utilizează
date experimentale
• O provocare majoră în econometrie constă în
condiționarea asupra multor altor factori astfel
încât să se identifice o cauzalitate
10
10
5
Cauzalitate: Exemplu
• Țel: Estimarea efectului cauzal al educației
asupra câștigurilor
• Diagrama în puncte:
25
20
average hourly earnings
15
10
5
0
0 5 10 15 20
years of education
11
11
Cauzalitate: Exemplu
• Aceasta nu înseamnă că educația influențează veniturile
• Veniturile sunt influențate de mulți alți factori în afara
educației – spre exemplu abilitățile
– Abilități deosebite => venituri mari
– Abilități deosebite => educație înaltă (ex. Persoanele
inteligente aleg educația înaltă)
• Se poate ca legătura de corelație dintre educație și
câștiguri vizibilă din grafic să fie determinată mai degrabă
de abilități decât de educație?
• Pentru a estima credibil efectul cauzal al educației,
trebuie sa găsim o cale de determinare a legăturii dintre
educație și câștiguri ținând constante abilitățile!
12
12
6
Modelul regresiei simple
SECȚIUNEA A 2-A: CONSTRUIREA MODELULUI MATEMATIC
13
13
Ce este regresia liniară simplă?

• Regresia liniară simplă este o metodă statistică ce
ne permite să studiem sintetic, cu ajutorul unui
model matematic, relația dintre două variabile
cantitative continue
– O variabilă, notată cu X, este privită ca variabilă
explicativă sau INDEPENDENTĂ
– Cealaltă variabilă, notată cu Y, est privită ca variabilă
explicată, de răspuns sau DEPENDENTĂ
• Regresiei liniare i se mai spune ”simplă” pentru că
studiază efectul unei singure variabile explicative
• Regresia liniară multiplă ia în calcul două sau mai
multe variabile explicative
14
14
7
Tipuri de modele
• Modelul determinist, în care, pentru fiecare valoare
a lui X cunoaștem exact valoarea lui Y
• Exemplu: Fahrenheit =(9/5)*Celsius+32
140
120
100
Fahrenheit
80
60
40
20
0
0 5 10 15 20 25 30 35 40 45 50
Celsius
15
15
Tipuri de modele
• Modelul statistic, în
care, pentru fiecare
valoare a lui X, valoarea
lui Y nu este perfect
cunoscută
• Exemplu: Relația dintre
latitudinea statului și
incidența cancerului de
piele
– Sursa: Penn State University
16
16
8
Modelul regresiei liniare simple (1)
• Să presupunem că vrem ”să explicăm Y în
funcție de X”, adică să măsurăm cât de mult
(sau puțin) este modificat Y dacă X este
modificat:
– Dacă se investește în educație (X), cum și cât de
mult se va modifica productivitatea muncii (Y)?
– Dacă pe un teren se aplică o anumită cantitate dintr-
un îngrășământ (X), cu cât de va modifica recolta
(Y)?
– Dacă venitul se modifică (X), cum și cu cât se va
modifica consumul (Y)?
17
17

• Dacă nu există niciodată o relație exactă între
două variabile: cum includem alți factori care
influențează Y?
• Care este forma funcțională?
• Observăm o relație ceteris paribus (cauzală)
dintre Y și X? – adică ce influență va avea X dacă
ceilalți factori sunt menținuți constanți?
18
18
9
• La nivelul populației de referință, variabila de
rezultat Y poate fi modelată ca o funcție de X
după cum urmează:
𝑌 = 𝛽0 + 𝛽1 ∗ 𝑋 + ε
Terminologia regresiei simple
y x
• ε: termen de eroare; reziduu;
Variabilă dependentă Variabilă independentă zgomot
Variabilă explicată Variabilă explicativă
• β0, β1: parametri, coeficienți,
Variabilă de răspuns Variabilă de control constante
Variabilă predicţionată Variabilă predictoare
Regresand Regresor
19
19
Regresia simplă: Legătura funcțională

dintre y și x e liniară
• Dacă alți factori din ε sunt menținuți ficși, astfel
încât modificările ε sunt zero (Δε=0), atunci într-
un model liniar, x are un efect constant asupra
lui y: ∆𝑦 = 𝛽1 ⋅ ∆𝑥 𝑑𝑎𝑐ă ∆𝜀 = 0
• Atunci, β1 este parametrul pantei, ținând alți
factori din ε constanți – este un parametru de
principal interes în economia aplicată
• Parametrul β0 (numit uneori și termenul
constant) este rareori de interes pentru analiză.
20
20
10
Interpretare și întrebări
• Exemple de modele
recolta = β0 + β1*îngrășământ + ε
venitul = β0 + β1*educație + ε
• Cum interpretăm β1 în aceste ecuații?
• Care pot fi ”alți factori” reprezentați de ε în
aceste ecuații?
21
21
Exemplu
• Relația dintre rezultatele din liceu (High School Grade
Point Average) și notele de admitere la facultate
(College entrance test score) – sursa: Penn State
University
22
22
11
Exemplu
• Observăm că la fiecare valoare GPA (de pe orizontală)
sunt mai multe cercuri care corespund studenților care
au obținut diverse note la testul de admitere
• Pentru fiecare notă GPA
– notele de admitere (Y) se concentrează spre o valoare medie,
iar mediile par a fi în relație liniară (L)
– diferența dintre nota de admitere a unui student și media
notelor tuturor studenților (pe care le numim erori) este
independentă de eroarea notei de admitere a altui student
(I)
– notele de admitere (Y) apar ca având o distribuție normală
(N)
– notele de admitere (Y) au dispersie egală (abatere medie
pătratică) (E)
23
23
Supoziții ale modelului RLS

• Pentru a obține estimatori de încredere pentru β0 și
β1 dintr-un eșantion aleator, trebuie să facem o
serie de supoziții:
– Media variabilei dependente, E(Yi), la fiecare valoare a
variabilei independente, xi, este o funcție LINARĂ a
valorilor xi
– Erorile εi sunt INDEPENDENTE
– Erorile εi la fiecare valoare a variabilei X (xi) sunt
distribuite NORMAL
– Erorile εi la fiecare valoare a variabilei X (xi) au
VARIANȚE EGALE (notate cu σ2). – varianța este înrudită
cu dispersia
24
24
12
Supoziții ale modelului RLS
• Supoziția crucială a independenței:
• La orice valoare a lui X, media erorilor (diferența
dintre valoarea observată a variabilei Y și media
valorilor variabilei Y) este egală cu media tuturor
erorilor
Ε 𝜀 𝑥 = Ε(𝜀)
– Partea din stânga este o așteptare condiționată
– Partea din dreapta este o așteptare necondiționată
(doar valoarea așteptată a lui ε, indiferent de x).
– Astfel, expresia spune că valoarea așteptata a lui ε este
independentă de x. Formalizat, spunem că ε este media
independentă de x.
25
25
Paranteză: valori așteptate

• Valoarea așteptată este unul din cele mai
importante concepte legate de probabilitate pe
care le vom întâlni
• Dacă X este o variabilă aleatoare, valoarea
așteptată a lui X este notată cu E(X), sau uneori
cu μ. (la fel putem vorbi despre E(Y))
• Uneori, valoarea așteptată este numită și media
populației, subliniind că X reprezintă o anumită
variabilă a populației.
26
26
13
Valoarea așteptată
• Valoarea așteptată este media ponderată a
tuturor valorilor posibile ale lui X, unde
ponderile sunt determinate de funcția de
densitate a probabilității
• Exemplu: să presupunem că X ia valorile -1, 0,
and 2 cu probabilitățile 1/8, ½ și 3/8. Atunci,
1 1 3
Ε 𝑋 = −1 ∙ +0∙ +2∙( )
8 2 8
• care e egală cu 5/8 (sau 0.625).
27
27
Așteptarea condiționată
• Putem rezuma relația dintre o variabilă Y și o
altă variabilă X prin investigarea așteptării
condiționate a lui Y în funcție de o valoare dată
a variabilei X
• Ideea de bază: Să presupunem că X a luat o
valoare particulară, sa spunem x
• Putem calcula valoarea așteptata a lui Y dată
fiind valoarea lui X (ex.: x)
• Notăm această valoare așteptată cu E(Y|X=x),
sau uneori doar cu E(Y|x).
28
28
14
Așteptarea condiționată: exemplu
• Fie (X,Y) seria de repartiție a populației tuturor
absolvenților de liceu care au data admitere la
facultate, unde X este nota la absolvire (GPA) și
Y este nota la testul e admitere.
• E(Y|X=1) este nota medie la admitere a tuturor
absolvenților cu GPA=1.
• Similar, E(Y|X=4) este nota medie la admitere a
tuturor absolvenților cu GPA=4.
• Alte exemple: salariul unei persoane în funcție
de numărul de ani de educație (4, 8, 12, 16 etc.)
29
29
Diagrama
30
30
15
Să ne întoarcem
• Am întâlnit următoarea ’supoziție cruciala’:
• Uitați-vă la diagrama din slide-ul anterior: la intersecția
dreptei cu norii de puncte se află valoarea așteptată a
notei de admitere pentru fiecare nota GPA, adică Ε 𝑦 𝑥
• Cum ați desena o diagramă pentru care Ε 𝜀 𝑥 = Ε(𝜀)?
• Răspuns:
– Dacă pe axa orizontală am reprezenta valorile lui X (notele
GPA), iar pe verticală valorile așteptate ale erorilor, iar la
fiecare valoare a lui X acea valoare așteptată este egală cu o
constantă Ε(𝜀), atunci ne „așteptăm” ca la toate valorile lui X
să putem trasa o dreaptă paralelă cu axa oX care
intersectează axa oY în punctul dat de Ε(𝜀)
31
31
Exemplu
• Ce presupune aceasta supoziție în contextul
modelului venitul = β0 + β1*educație + ε ?
• Are sens aceasta supoziție în acest context?
Ε 𝜀 𝑒𝑑𝑢𝑐𝑎𝑡𝑖𝑒 = Ε(𝜀)
32
32
16
O supoziție mai evidentă
• Atât timp cât parametrul β0 este inclus în
ecuație, vom putea întotdeauna presupune că
valoarea medie a lui 𝜀 în populație este zero
Ε 𝜀 =0
• De ce este aceasta o ”supoziție evidentă”?
33
33
Exercițiu de raționament
• Dacă modelul este 𝑌 = 𝛽0 + 𝛽1 ∗ 𝑋 + ε
• Cu supozițiile
Ε 𝜀 =0
• Arătați că următoarea ecuație este adevărată:
Ε 𝑦 𝑥 = 𝛽0 + 𝛽1 ∗ 𝑥
• E(y|x) este funcția de regresie a populației (FRP).
• Este o funcție liniară de x.
• O crestere cu o unitate în x modifică valoarea
așteptată a lui y cu β1
34
34
17
Supoziția varianțelor egale
Dispersia în jurul mediei

pentru X = x3
35
35
Interpretare:
Separarea lui y în două părți
• Avem modelul 𝑌 = 𝛽0 + 𝛽1 ∗ 𝑋 + ε
• Dată fiind FRP Ε 𝑦 𝑥 = 𝛽0 + 𝛽1 ∗ 𝑥, înseamnă
că
𝑌 =Ε 𝑦 𝑥 +ε
• Primul termen al părții din dreapta indică
componenta sistematică a lui Y, influențată de X
• Al doilea termen indică componenta
nesistematică a lui Y, influențată de alți factori
neobservați
36
36
18
Obținerea
estimațiilor celor mai mici pătrate ordinare
• Pornim de la modelul populației totale
𝑌 = 𝛽0 + 𝛽1 ∗ 𝑋 + ε
• Vom discuta cum se estimează parametrii
(necunoscuți) ai modelului.
• Să presupunem că avem un eșantion aleator de
mărime n extras din populație:
• Observații indicii i ai celor două variabile.
Modelul de regresie pentru fiecare individ
devine: 𝑦𝑖 = 𝛽0 + 𝛽1 ∗ 𝑥𝑖 + ε𝑖
37
37
De ce facem diferența dintre populația

totală și eșantion?
• Am construit modelul statistic pornind de la o
teorie economică, de la o intuiție care privește un
fenomen (o populație) în totalitatea sa
• De regulă, nu putem obține date despre întreaga
populație – trebuie să observăm un eșantion
• Cu fiecare posibil eșantion, datele sunt altele!
• Atunci cum putem fi siguri că estimăm corect
parametrii funcției de regresie?
• Răspuns: Dacă erorile de estimare sunt mici!
• Dar am văzut că media erorilor de estimare este
întotdeauna zero: Ε 𝜀 = 0
38
38
19
Metoda celor mai mici pătrate (CMMP) (1)
• Pentru a vedea în ce constă metoda, să definim
mai întâi o valoare ajustată pentru y când x=xi
ca fiind 𝑦ො𝑖 = 𝛽መ0 + 𝛽መ1 ∗ 𝑥𝑖
• unde 𝛽መ0 și 𝛽መ1 sunt valorile pe care trebuie să le
estimăm cu ajutorul datelor din eșantion ale
parametrilor 𝛽0 și 𝛽1 , pe care nu îi cunoaștem
(și este posibil să nu îi cunoaștem niciodată, de
aceea alegem să îi estimăm).
39
39

• Apoi, sa definim valoarea reziduala pentru
fiecare entitate observată i ca
𝜀𝑖Ƹ = 𝑦𝑖 − 𝛽መ0 − 𝛽መ1 ∗ 𝑥𝑖
• care este diferența dintre valorile observate ale
variabilei Y și valorile estimate prin model ale
variabilei Y, model care nu e perfect!
• Să observăm că exista n astfel de valori
reziduale, adică un număr egal cu numărul
observațiilor noastre din eșantion
40
40
20
• Estimatiile CMMP minimizează suma pătratelor
rezidualelor:
𝑛 𝑛
2
෍ 𝜀𝑖Ƹ 2 = ෍ 𝑦𝑖 − 𝛽መ0 − 𝛽መ1 ∗ 𝑥𝑖
𝑖=1 𝑖=1
• Necunoscutele sunt cei doi parametri estimați:
𝛽መ0 și 𝛽መ1
• Minimizăm suma pătratelor rezidualelor prin
derivare – separat în raport cu 𝛽መ0 și 𝛽መ1
41
41
Valori observate, ajustate și reziduale
𝑦𝑖
𝑦ො = 𝛽መ0 + 𝛽መ1 ∗ 𝑥
𝜀𝑖Ƹ = 𝑣𝑎𝑙𝑜𝑎𝑟𝑒 𝑟𝑒𝑧𝑖𝑑𝑢𝑎𝑙ă
𝑦ො𝑖 = 𝑣𝑎𝑙𝑜𝑎𝑟𝑒 𝑎𝑗𝑢𝑠𝑡𝑎𝑡ă

𝑦ො1
𝑦1
42
42
21
Aflarea parametrilor 𝛽መ0 și 𝛽መ1
𝛿𝑓
෡ =0
𝛿𝛽
• ൞ 𝛿𝑓0 Prin rezolvare, obținem
෡1 =0
𝛿𝛽
σ 𝑛 𝑛
σ𝑖=1 𝑥𝑖 −𝑥ҧ ∙ 𝑦𝑖 −𝑦ത
𝑥𝑖 ∙𝑦𝑖 −𝑛∙𝑥∙ҧ 𝑦ഥ
𝛽መ1 = 𝑖=1 𝑛 2
σ𝑖=1 𝑥𝑖 −𝑛∙𝑥ҧ 2
= σ𝑛 2
• ቐ 𝑖=1 𝑥𝑖 −𝑥ҧ
𝛽መ0 = 𝑦ഥ − 𝛽መ1 ∙ 𝑥ҧ
• unde 𝑥ҧ = σ 𝑥𝑖 /n și 𝑦ത = σ 𝑦𝑖 /n
43
43
Aflarea parametrilor 𝛽መ0 și 𝛽መ1

• Acestea sunt estimațiile CMMP ai parametrilor
modelului de regresie liniară simplă.
• Ecuația lui 𝛽መ1 este raportul dintre covarianța
dintre x și y ÎMPĂRȚITĂ la varianța lui x.
• Astfel, semnul lui 𝛽መ1 este întotdeauna semnul
lui Cov(x,y) pentru acest model.
44
44
22
Nota: Trebuie ca σ𝑛𝑖=1 𝑥𝑖 − 𝑥ҧ 2 >𝟎
• Dacă aceasta nu este adevărată, 𝛽መ1 nu este
definit.
• De ce?
• Ce implică asta în practică?
45
45
Câteva concepte în legătură cu…

• Linia de regresie CMMP (sau funcția de regresie
a eșantionului; FRE):
𝑦ො = 𝛽መ0 + 𝛽መ1 ∗ 𝑥
• Interpretare:
∆𝑦ො
𝛽መ1 = ൗ∆𝑥
Care este diferența dintre funcția de regresie a
eșantionului și funcția de regresie a populației?
46
46
23
Să rezumăm
• Am obținut estimatorul CMMP din două supoziții
explicite:
– Covarianța dintre variabila independentă și variabila
reziduală este nulă -> conduce la prima ecuație
– Media erorilor este nulă -> conduce la a doua ecuație
• Este important să le înțelegem și de ce contează
• Nu am spus nimic despre proprietățile statistice ale
CMMP
• Deci mai avem de mers... Dar am făcut un prim pas.
Să consideram acum un exemplu
47
47
Exemplu:
Salariul unui CEO și RoE
• Datele: se refera la date publicate în revista
Businessweek din 6 mai 1991.
• Ar fi interesant de făcut un exercițiu similar și să
investigăm dacă relația dintre RoE și salariu s-a
schimbat între timp
48
48
24
Statistici ale datelor
. sum
Variable Obs Mean Std. Dev. Min Max
salary 209 1281.12 1372.345 223 14822

pcsalary 209 13.2823 32.63392 -61 212
sales 209 6923.793 10633.27 175.2 97649.9
roe 209 17.18421 8.518509 .5 56.3
pcroe 209 10.80048 97.2194 -98.9 977
ros 209 61.80383 68.17705 -58 418

indus 209 .3205742 .4678178 0 1
finance 209 .2200957 .4153057 0 1
consprod 209 .2870813 .4534861 0 1
utility 209 .1722488 .3785031 0 1
lsalary 209 6.950386 .5663741 5.407172 9.603868

lsales 209 8.292265 1.013161 5.165928 11.48914
• Salariile sunt exprimate în mii USD (date anuale), RoE

în procente.
• Principala variabila explicativă în acest exemplu:
Return on equity (RoE) 49
49
Distribuția pentru salary

6.0e-04
4.0e-04
Density
2.0e-04
0 5000 10000 15000

1990 salary, thousands $
(Cand vom lucra pe aceste date în SAS, care este instrucțiunea?) 50
50
25
Distribuția pentru RoE
.08
.06
Density
.04
.02
0
0 20 40 60
return on equity, 88-90 avg
51
51
Diagrama în puncte:
• Avem suficientă informație să ne dăm seama că
valoarea coeficientului de regresie (panta)
pentru RoE este egală cu .....
15000
Cov(salary,roe) = 1342.5
1990 salary, thousands $
10000
Corr(salary,roe)= 0.11
Var(roe) = 72.6
5000
52
0 20 40 60
52
26
Rezultate din regresia simplă CMMP
• Cum interpretam aceste rezultate?
. reg salary roe
Source SS df MS Number of obs = 209

F( 1, 207) = 2.77
Model 5166419.04 1 5166419.04 Prob > F = 0.0978
Residual 386566563 207 1867471.32 R-squared = 0.0132
Adj R-squared = 0.0084
Total 391732982 208 1883331.64 Root MSE = 1366.6
salary Coef. Std. Err. t P>|t| [95% Conf. Interval]
roe 18.50119 11.12325 1.66 0.098 -3.428196 40.43057

_cons 963.1913 213.2403 4.52 0.000 542.7902 1383.592
• Coeficientul lui RoE ne arată că la o creștere cu

un procent al RoE, salariul crește cu 18,5 mii
USD anual (𝛽መ1 ne arată cu cât crește Y dacă X
crește cu o unitate – v. slide nr. 46)
53
53
Linia de regresie
15000
10000
5000
0 20 40 60
1990 salary, thousands $ Fitted values
54
54
27
Temă: calcule de mână
• Modelul: 𝑌 = 𝛽0 + 𝛽1 ∗ 𝑋 + ε
+---------+
| Y X |
|---------|
| 2 1 | Nota: Rezolvati tema
| 6 9 |
| 4 3 | utilizand creion, hartie și un
| 12 18 | calculator de buzunar. Odată
| 4 5 |
| 10 15 | ce aveți un răspuns, puteți să
| 6 7 | îl verificați utilizând un
| 6 7 |
| 16 20 | software econometric (SAS,
| 12 13 | Excel)
| 8 14 |
| 6 5 |
+---------+
55
55
Supliment
MODELUL ECONOMIC AL LUI BECKER ASUPRA
INFRACȚIONALITĂȚII
56
56
28
Un model economic al infracționalității
• Anumite infracțiuni au beneficii economice
evidente, însă au și costuri
• Din perspectiva lui Becker (Gary Stanley Becker,
1968) decizia de implicare în activități ilegale
este influențata de beneficii și costuri
• Scrieți o ecuație care să descrie timpul petrecut
în activități infracționale ca o funcție de mai
mulți factori:
57
57
Un model economic al infracționalității

• y = f ( x1, x2, x3, x4, x5, x6, x7 )
– unde f ( ) este o funcție (care rămâne nespecificată pentru
moment)
– y = ore petrecute în activități infracționale
– x1 = ”salariul” pentru o ora petrecuta în activități infracționale
– x2 = salariul orar în activități legale
– x3 = alte venituri
– x4 = probabilitatea de a fi prins
– x5 = probabilitatea de a fi condamnat Dacă ești prins
– x6 = sentința așteptata Dacă ești condamnat
– x7 = varsta
• Gândiți-va dacă diferitele variabile explicative au un impact
pozitiv sau negativ asupra lui y
58
58
29
De la modelul economic la modelul
econometric
• Înainte de a face o analiză econometrică asupra
infracționalității, modelul anterior trebuie să fie
specific
– Asta înseamnă că trebuie să decidem cu exactitate
cum arată funcția f( )
– O a doua chestiune este cum tratăm variabilele care
nu pot fi observate (ex.: ”salariul” pe care cineva îl
obține din activități infracționale)
59
59
Un model econometric al
infracționalității
• infracțiune = măsură a frecventei activității infracționale
• salariu = salariul care poate fi obținut legal;
• alteven = venituri din alte surse;
• freqarest = frecventa arestărilor din infracțiuni anterioare;
• freqcond = frecventa condamnărilor;
• medsent = durata medie a sentinței după condamnare
• varsta = varsta persoanei
Infracțiune = β0 + β1salariu + β2alteven + β3freqarest + β4freqcond

+ β5medsent + β6varsta + u
60
60
30
Ce aveți de făcut?
• De citit:
– Capitolele 1 și 2 și secțiunile 3.1 – 3.3 din suportul
de curs postat pe grup (paginile 1 – 20).
– Suplimentul din documentul de față, pentru discuții
la seminar
• De rezolvat tema (calcule de mână) - slide-ul
55.
61
61
31

5 ECONMP02 Regresia Liniara Simpla Partea01 PDF

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

5 ECONMP02 Regresia Liniara Simpla Partea01 PDF

Încărcat de

Drepturi de autor:

Formate disponibile

Introducere în econometrie

Regresia liniară simplă

Ref: Måns Söderbom, Universitatea Gothenburg

Modelul regresiei simple

O problemă de practică a analistului

Ce este regresia liniară simplă?

Modelul regresiei liniare simple (2)

Regresia simplă: Legătura funcțională

Supoziții ale modelului RLS

Paranteză: valori așteptate

Dispersia în jurul mediei

De ce facem diferența dintre populația

Metoda celor mai mici pătrate (CMMP) (2)

Valori observate, ajustate și reziduale

𝑦ො𝑖 = 𝑣𝑎𝑙𝑜𝑎𝑟𝑒 𝑎𝑗𝑢𝑠𝑡𝑎𝑡ă

Aflarea parametrilor 𝛽መ0 și 𝛽መ1

Câteva concepte în legătură cu…

Variable Obs Mean Std. Dev. Min Max

salary 209 1281.12 1372.345 223 14822

ros 209 61.80383 68.17705 -58 418

lsalary 209 6.950386 .5663741 5.407172 9.603868

• Salariile sunt exprimate în mii USD (date anuale), RoE

Distribuția pentru salary

0 5000 10000 15000

(Cand vom lucra pe aceste date în SAS, care este instrucțiunea?) 50

Source SS df MS Number of obs = 209

salary Coef. Std. Err. t P>|t| [95% Conf. Interval]

roe 18.50119 11.12325 1.66 0.098 -3.428196 40.43057

• Coeficientul lui RoE ne arată că la o creștere cu

1990 salary, thousands $ Fitted values

Un model economic al infracționalității

Infracțiune = β0 + β1salariu + β2alteven + β3freqarest + β4freqcond

S-ar putea să vă placă și