Sunteți pe pagina 1din 19

Curs 9

Analiza de regresie în cazul modelelor


econometrice cu variabile
independente calitative. Variabile
dummy (fictive).
2. Analiza de regresie în cazul modelelor
econometrice cu variabile independente
calitative. Variabile dummy (fictive).

Până acum am considerat că variabila dependentă


este influenţată doar de variabile independente
numerice precum venitul, producţia, preţurile,
costurile, etc.
În economie există variabile ce se referă la însuşiri,
calităţi şi categorii. Se numesc variabile calitative
sau atributive.

2
Exemple de variabile de natură calitativă

– genul persoanei, rasa, religia, naţionalitatea,


– apariţia unor evenimente catastrofale determinate
de om sau de natură, precum: războaiele,
cutremurele de pământ,
– sezonalitatea determinată de succesiunea
anotimpurilor
– evenimente deosebite în activitatea unei firme
(greve, restructurări) sau în viaţa unei naţiuni
(evenimente politice, schimbări în politica
economică a unui guvern).
– apreciere excelentă, foarte bună, moderată,
negativă
– risc maxim, mediu, minim
Variabilele calitative indică de obicei
3
prezenţa sau
absenţa unei calităţi sau însuşiri.
Variabile dummy

Variabilele binare se referă la două aspecte ce se


exclud reciproc, cum ar fi: existenţa – nonexistenţa
(absenţa); acceptarea – refuzul; urban – rural;
masculin – feminin; mulţumit – nemulţumit.
O variabilă dummy codifică (de obicei prin valorile 1
şi 0) categoriile unei variabile atributive.
D  1 dacă observaţia este din categoria 1.
D  0 dacă observaţia este din categoria 2.
Variabilele dummy sunt un mod de clasificare a
datelor prin faptul că ele împart un eşantion în
diferite subgrupe bazate pe calităţi sau atribute şi
permit să se aplice regresia pe fiecare subgrupă.

4
a) Model cu o variabilă independentă calitativă (1)

yi   0  1 D   i sau y i   0   1 xi   i
Ex: Y = investiţiile;
D=X=forma de proprietate
D=1 pentru proprietate de stat;
D=0 pentru proprietate privată
Estimatorii parametrilor se obţin cu formulele
obişnuite:
 ( xi  x )( y i  y )
a  y  bx şi b  2
, cu menţiunea că
 ( xi  x )
 dacă x  0  a  ˆ 0  y x 0
 dacă x  1  a  b  ˆ 0  ˆ1  y x 1

5
a) Model cu o variabilă independentă calitativă (2)

Exemplu: y i   0   1 D   i
Y = Salariul anual al unui profesor, în mii lei
D  1, dacă profesorul este bărbat,
D  0 dacă profesorul este femeie.
Considerând că toţi ceilalţi factori sunt constanţi:
vârsta, gradul, anii de experienţă, etc. şi că erorile
satisfac ipotezele obişnuite ale modelului liniar
clasic, se va obţine:
 E (Y | D  1)  ˆ 0  ˆ1 = salariul mediu al unui
profesor – bărbat
 E (Y | D  0)  ˆ 0 = salariul mediu al unui profesor
– femeie

6
a) Model cu o variabilă independentă calitativă (3)

yˆ  15,375  7,958D
̂ 0 = 15,375 mii lei = salariul mediu al unui profesor
– femeie
ˆ0  ˆ1 = 15,375 +7,958 = 23,333 mii lei = salariul
mediu al unui profesor – bărbat

7
b) Model cu două variabile independente de natură binară (1)

y i   0   1 xi   2 z i   i
Ex: Y = Venitul naţional;
X = D1 = tipul de economie (1 = economie
planificată; 0 = economie de piaţă)
Z = D2 = starea de pace (1 = pace; 0 = război)
y x 0, z 0  ̂ 0 , y x 1, z 0  ˆ0  ˆ1 , y x 0, z 1  ˆ0  ˆ 2
Notăm cu y0 , y1 şi y 2 valorile medii pentru cele trei
situaţii de mai sus. Rezultă:
ˆ0  y 0 , ˆ1  y1  y 0 , ˆ 2  y 2  y 0

8
b) Model cu două variabile independente de natură binară (2)

Exemplu: Pentru un eşantion format din 25


persoane, se înregistrează salariul lunar obţinut (mii
lei/lună) pe nivele de pregătire
(nivel liceal, postliceal şi superior).
D1= 1 pentru nivel liceal şi 0 în rest
D2= 1 pentru nivel postliceal şi 0 în rest
y i   0   1 D1   2 D 2   i

9
b) Model cu două variabile independente de natură binară (3)

̂ 0 = 30,8117 mii lei este Salariul mediu al


persoanelor cu studii superioare
ˆ1 = –16,2208 diferenţa dintre salariul mediu al
angajaţilor cu studii liceale şi al celor cu studii
superioare.
ˆ0  ˆ1 = 30,8117–16,2208 =14,5909 mii lei –
nivelul mediu al salariului persoanelor cu studii
liceale
ˆ0  ˆ 2 =30,8117–7,9091=22,9026 mii lei–nivelul
10
mediu al salariului persoanelor cu studii postliceale
c) Model cu o variabilă independentă numerică şi una calitativă (1)

y i   0   1 xi   2 z i   i
Ex: Y = Cererea de servicii;
X = Venitul
Z = D = mediul (1 = urban; 0 = rural)
Pentru z  D  1 modelul devine
y i   0   1 xi   2   i  (  0   2 )   1 xi   i (urban)
Pentru z  D  0 modelul devine
y i   0   1 xi   i (mediu rural)
Coeficientul ̂ 2 arată diferenţa dintre termenii liberi
din cele două ecuaţii, adică dintre subeşantionul
din mediul urban şi subeşantionul din mediul rural.
Apar deosebiri doar în punctul de pornire al
dreptelor de regresie, dar panta 1 este aceeaşi.
11
c) Model cu o variabilă independentă numerică şi una calitativă (2)

Exemplu: Considerăm regresia Salariului


profesorilor (Y) în raport cu Educaţia (X) şi Genul
persoanei (D=Gen). Salariul este exprimat în mii lei.
Această regresie se utilizează pentru a vedea dacă
există discriminare între femei şi bărbati, în ceea ce
priveşte salariul primit, pentru acelaşi nivel de
pregătire.
Regresia cu genul Masculin ca grup de bază (de
comparaţie)
1 daca genul este Fem
D  Gen  
0 daca genul este Masc

12
c) Model cu o variabilă independentă numerică şi una calitativă (3)

Salariu   0   1 Educ   2 D   i
Dacă D  1 modelul devine
Salariu   0   1 Educ   2   i  (  0   2 )   1 Educ   i
Dacă D  0 modelul devine
Salariu   0   1 Educ   i (grupul de bază – Bărbaţii)
̂ 0 arată termenul liber pentru grupul de bază (de
comparaţie), pentru D  0 , deci pentru Bărbaţi.
̂1 este coeficientul pantă pentru variabila Educaţie
– este comun pentru cele două genuri.
̂ 2 arată diferenţa dintre termenii liberi din cele două
ecuaţii, adică dintre cele două linii de regresie. ̂ 2
arată diferenţa medie la Salariu între Femei şi
Bărbaţi, menţinând Educaţia 13şi celelalte condiţii
constante.
c) Model cu o variabilă independentă numerică şi una calitativă (4)

̂ 2 ne ajută să determinăm dacă există discriminare


în Salariu, între bărbaţi şi femei.
ˆ 2  0 arată că, pentru acelaşi nivel de educaţie,
femeile câştigă un salariu mai mic decât bărbaţii.
ˆ 2  0 arată că, pentru acelaşi nivel de educaţie,
femeile câştigă un salariu mai mare decât bărbaţii.

14
c) Model cu o variabilă independentă numerică şi una calitativă (5)

Ecuaţia de regresie estimată este:



Salariu  0,6228  0,5065 Educ  2,2734 D
Care este Salariul estimat pentru o persoană
Femeie cu Educaţie=12ani?
E ( Salariu | Educ  12, D  1)  ˆ0  ˆ1  12  ˆ 2  1
 0,62  0,51  12  2,27  1  4,47 mii lei
Care este Salariul estimat pentru o persoană Bărbat
cu Educaţie=12ani?
E ( Salariu | Educ  12, D  0)  ˆ0  ˆ1  12  ˆ 2  0
 0,62  0,51  12  2,27  0  6,74 mii lei

15
c) Model cu o variabilă independentă numerică şi una calitativă (6)

Rezultate similare se obţin dacă Gen=1 pentru


Masculin şi Gen=0 pentru Feminin.
Regresia cu genul Feminin ca grup de bază
1 daca genul este Masc
D  Gen  
0 daca genul este Fem
Salariu   0   1 Educ   2 D   i
Dacă D  1 modelul devine
Salariu   0   1 Educ   2   i  ( 0   2 )   1 Educ   i
Dacă D  0 modelul devine
Salariu   0   1 Educ   i (grupul de bază – Femeile)
̂ 0 arată termenul liber pentru grupul de bază (de
comparaţie), pentru D  0 , deci pentru Femei.
16
c) Model cu o variabilă independentă numerică şi una calitativă (7)

Sˆalariu  1,6505  0,5065 Educ  2,2734 D


ˆ 2  ˆ2  2,27 ; ˆ 1  ˆ1  0,51
ˆ 0  ˆ0  ˆ 2  0,62  2,27  1,65
Semnul lui ̂ 2 este inversat, dar mărimea lui
rămâne aceeaşi.
Care este Salariul estimat pentru o persoană Bărbat
cu Educaţie=12ani?
E ( Salariu | Educ  12, D  1)   0   1  12   2  1
 1,65  0,51  12  2,27  1  6,74 mii lei
Care este Salariul estimat pentru o persoană
Femeie cu Educaţie=12ani?
E ( Salariu | Educ  12, D  0)   0   1  12   2  0
 1,65  0,51  12  2,27  0  4,47 17 mii lei
d) Model cu interacţiune

O interacţiune apare dacă efectul unei variabile


independente asupra variabilei dependente se
modifică în acord cu valoarea unei alte variabile
independente.
De exemplu, este posibil ca publicitatea să aibă un
efect puternic asupra vânzărilor unui produs, atunci
cînd preţul produsului este mic. Totuşi, dacă preţul
este prea mare, creşterea în publicitate nu va
modifica vânzările.
y i   0   1 xi   2 z i   3 xi z i   i
Pentru z  1 modelul devine
y i  (  0   2 )  (  1   3 ) xi   i
Pentru z  0 modelul devine yi   0   1 xi   i
18
e) Model în care variabila independentă calitativă are mai multe stări

Dacă variabila calitativă are mai multe stări, se


atribuie numere de ordine variabilelor dummy.
Dacă o variabilă calitativă are m variante, se
introduc m-1 variabile dummy.
Ex: Analiza Profitului când Producţia este funcţie de
anotimp:
Profitul   0   1 D1   2 D2   3 D3  
Observaţie: Variabilele dummy se utilizează pentru
considerarea variabilelor calitative, pentru analiza
sezonalităţii şi pentru corecţia valorilor anormale
(aberante).
Observaţie. Există şi modele cu varibile
dependente calitative. Acestea sunt modele de tip
Logit şi Probit. 19

S-ar putea să vă placă și