Sunteți pe pagina 1din 4

NUME ȘI PRENUME: ................................................................

GRUPA: ....................................................................................

   Subiect pentru examenul de ECONOMETRIE   

Problema I: A fost efectuat un studiu pentru a se determina modul în care câștigurile unor persoane (mii
rupii) din districtul Cooch Behar din vestul Bengalului au fost afectate de vârsta acestora și domeniul
(modul) în care au fost aceștia angajați. Domeniul (modul) în care sunt angajați este considerată ca fiind
o variabilă de tip dummy care ia valoarea 0 pentru zilieri și 1 pentru cei angajați legal (înscriși la forțele de
muncă).

A. Se consideră următorul output privind descrierea datelor folosite în model:


> str(data1)
Data.frame: 46 obs. of 3 variables:
$ Castiguri : num 1.73 3.86 2.92 12.1 9.07 ...
$ Domeniu_angajare : factor 1 1 1 1 1 1 1 1 1 1 ...
$ Varsta : int 14 15 15 16 16 178 18 19 20 21 ...

1. Scrieţi pe spaţiile punctate denumirea variabilelor din model:


Variabila 1: câștiguri
Variabila 2: domeniul (modul) de angajare
Variabila 3: vârsta
2. Scrieţi tipul fiecărei variabile în parte
Variabila 1: numerică
Variabila 2: factor
Variabila 3: întreagă
3. Câte observaţii au fost incluse în setul de date: 46

B. Se consideră următorul output privind statisticile descriptive pentru datele analizate:


Castiguri Domeniu_angajare Varsta
Min. : 0.070 Min. : 0.0000 Min. : 9.00
1st Qu.: 3.312 1st Qu.: 0.0000 1st Qu.: 15.00
Median : 5.445 Median : 0.0000 Median : 16.00
Mean : 7.375 Mean : 0.4783 Mean : 17.15
3rd Qu.: 9.752 3rd Qu.: 1.0000 3rd Qu.: 21.75
Max. :25.040 Max. : 1.0000 Max. : 24.00
> sd(data3$Castiguri)
[1] 5.401949
> sd(data3$Varsta)
[1] 4.038522
> sd(data3$Domeniu_angajare)
[1] 0.505047

4. Completaţi tabelul statisticilor descriptive pentru variabilele analizate:


Variabilă Minim Medie Mediană Maxim Abatere standard
Câștiguri 0,070 7,375 5,445 25,040 5,40
Domeniul de ... ... ... ... ...
angajare
Vârsta ... ... ... ... ...
5. Interpretaţi valoarea mediei pentru variabila „Vârsta”:
Vârsta medie a celor intervievați a fost de 17,15 ani.
6. Pentru care dintre variabilele următoare abaterea standard reprezintă un procent mai mare din
medie?
a. Vârsta – 0,2349
b. Domeniul de angajare – nu se calculează pentru variabile calitative (de tip dummy)
c. Câștigurile – 0,7327

C. Se consideră următorul output în R:


Call:
lm(formula = data3$Castiguri ~ data3$Varsta)

Residuals:
Min 1Q Median 3Q Max
-6.4425 -2.8016 -0.6551 1.7184 14.0575

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -5.3887 2.9510 -1.826 0.0746 .
data3$Varsta 0.7441 0.1676 4.441 5.96e-05 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 4.54 on 44 degrees of freedom


Multiple R-squared: 0.3095, Adjusted R-squared: 0.2938
F-statistic: 19.72 on 1 and 44 DF, p-value: 5.956e-05

7. Interpretați coeficientul b1 din modelul de regresie precedent:


Dacă vârsta crește cu un an, câștigurile persoanelor analizate vor crește cu 0,74 mii rupii.
8. Considerați că modelul de regresie precedent este semnificativ din punct de vedere statistic?
Justificați!
Da deoarece p-value = 0,00005956 este mai mic decât 0,001.
9. Interpretați puterea explicativă a modelului:
30,95% din variația câștigurilor se datoarează variației vârstei respondenților.

D. Se consideră următorul output în R:


Call:
lm(formula = data3$Castiguri ~ data3$Domeniu_angajare + data3$Varsta)

Residuals:
Min 1Q Median 3Q Max
-6.3132 -2.8333 -0.7343 1.3603 14.1868

Coefficients:
Estimate Std. Error t value Pr(>|t|)
(Intercept) -6.6773 3.5189 -1.898 0.064479 .
data3$Domeniu_angajare_1 -1.2767 1.8712 -0.682 0.498708
data3$Varsta 0.8549 0.2340 3.653 0.000699 ***
---
Signif. codes: 0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1

Residual standard error: 4.567 on 43 degrees of freedom


Multiple R-squared: 0.3169, Adjusted R-squared: 0.2851
F-statistic: 9.974 on 2 and 43 DF, p-value: 0.0002764

10. Modelul precedent este:


a. Model de regresie liniară simplă
b. Model de regresie liniară multiplă
c. Model de regresie logaritmică
11. Variabila dependentă este:
a. Vârsta
b. Domeniul de angajare
c. Câștigurile
12. Variabilele independente sunt (răspuns multiplu):
a. Vârsta
b. Domeniul de angajare
c. Câștigurile
13. Scrieți ecuația estimată a regresiei:
Câștiguri = -6,6773 – 1,2767*Domeniul de angajare + 0,8549*Vârsta
14. Consideraţi că modelul din output-ul precedent este statistic semnificativ? Justificaţi!
Da deoarece p-value = 0,0002764 este mai mic decât 0,001.
15. Considerați că între variabila „Domeniul de angajare” și variabila „Câștiguri” există o relație
statistic semnificativă?
Da o Nu o
16. Justificaţi alegerea din grila precedentă:
p-value = 0.498708 este mai mare decât 0,05
17. Interpretaţi rezultatul precedent:
Domeniul de angajare nu influențează semnificativ câștigurile persoanelor analizate.
18. Considerați că între variabila „Vârsta” și variabila „Câștiguri” există o relație statistic
semnificativă?
Da o Nu o
19. Justificaţi alegerea din grila precedentă:
p-value = 0.000699 este mai mic decât 0,001
20. Interpretaţi rezultatul precedent:
Avem 99,9% încredere că vârsta influențează semnificativ câștigurile persoanelor analizate.
21. Puterea explicativă a modelului, exprimată în procente, este:
a. 47,93%
b. 31,69%
c. 93,66%
d. 23,21%
e. 1,73%
22. Considerați că modelul de la punctul D este mai bun din punct de vedere statistic decât modelul
de la punctul C? Justificați!
Modelul D nu este mai bun decât modelul C deoarece deși valoarea lui R2 a crescut de la 0.3095 la
0.3169 ceea ce ne spune că în modelul de la punctul D am explicat o mai mare parte din câștiguri decât
am facut-o la punctul C, totuși, valoarea lui R2 ajustat a scăzut de la 0.2938 la 0.2851 ceea ce ne spune
că în al doilea model calitatea informației este mai proastă.
23. Interpretați valoarea coeficientului b0 din modelul de regresie precedent:
Nu se poate interpreta.
24. Interpretați valoarea coeficientului b1 din modelul de regresie precedent:
Persoanele care sunt angajate legal câștigă cu 1,2767 mai puțin decât cei care lucrează ca zilieri, în condi
țiile în care au aceeași vârstă.
25. Interpretați valoarea coeficientului b2 din modelul de regresie precedent:
Dacă vârsta persoanelor crește cu un an iar domeniul de activitate nu se modifică, câștigurile cresc cu 0,
8549.
26. Folosind ecuația de regresie din acest model, estimați care ar putea fi nivelul câștigurilor unui
zilier care are vârsta de 15 ani: .......................................................................................................
27. Folosind ecuația de regresie din acest model, estimați care ar putea fi nivelul câștigurilor unui
angajat legal care are vârsta de 15 ani:......................................................................................

Problema 2: Răspundeți următoarelor cerințe:


28. Care din variabilele următoare sunt categoriale?
a. Clasele de venit în care se poate încadra o persoană
b. Cifra de afaceri
c. Produsul Intern Brut
A = a. + b. B = a. + c. C = b. + c. D = a. E = niciuna
29. Dacă termenii eroare au aceeași dispersie pentru fiecare valoare fixată a lui x spunem că aceștia
sunt heteroscedastici.
Adevărat o Fals o
30. În cazul în care corelația dintre două variabile independente este peste un prag de 70% spunem
că avem de-a face cu fenomenul de multicoliniaritate.
Adevărat o Fals o

Observaţie: Timp de lucru: 1,5 ore. Fiecare grilă corect rezolvată va fi notată cu 0,2 puncte. Din oficiu veţi
primi 1 punct. Punctajului obţinut pentru lucrarea scrisă i se adaugă cel obţinut la seminar.

S-ar putea să vă placă și