Sunteți pe pagina 1din 8

PROIECT ECONOMETRIE

CHIURTU ROXANA
GRUPA 504

1. Descrierea proiectului
Tot mai multe decese sunt datorate afeciunilor cardiace iar n urma unui studiului de caz se
dorete a se afla dac acestea sunt influenate i din cauza consumului de alcool din vin. Studiul de caz a
fost efectuat pe 17 ri europene.
Variabila independent n analiza econometric a acestuia este Decesele datorate consumului de
alcool din vin notat cu y, iar cea dependent este Consumul de alcool din vin notat cu x.
n tabelul urmtor sunt prezentate date statistice din 1994 privind aceast problem (consumul de
alcool in litri/persoana, decesele sunt anuale/100000 locuitori).

Tara
Australia
Austria
Belgia
Canada
Danemarca
Finlanda
Franta
Islanda
Irlanda
Italia
Olanda
Noua
Zeelanda
Norvegia
Spania
Suedia
Elvetia
Marea
Britanie

Decese
datorate
afectiunilor
cardiace(y)
211
167
131
191
220
297
71
211
300
107
167

2. Statistica descriptiva

266
227
86
207
115
285

Consumul de alcool
din Vin(x)
2.5
3.9
2.9
2.4
2.9
0.8
9.1
0.8
0.7
7.9
1.8
1.9
0.8
6.5
1.6
5.8
1.3

Dispersia unei liste de valori este ptratul abaterii standard, adic media ptratelor
abaterilor numerelor de la media lor.
Skewness-indicator folosit in analiza distributiei empirice in raport cu o distributie
simetrica in jurul mediei.
Kurtosis- indicator folosit in analiza distributiei unei serii de date pentru a indica gradul
de aplatizare sau de ascutire a unei distributii.
Decesele datorate afectiunilor
cardiace

Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
Confidence
Level(95.0%)

191.705882
4
17.5494605
207
211
72.3582793
3
5235.72058
8
-0.9768928
0.09511421
229
71
300
3259
17
37.2031943
2

Cosumul de alcool din Vin

Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis

n continuare vom analiza valorile


obinute n cadrul Descriptive Statistics, lund
n considerare consumul de alcool din vin
exprimat in litri.
Dup cum putem observa i n tabel, media
europeana a consumului de alcool este
3.152941176, litri/persoane iar decesele
datorate afectiunilor cardiace este de
191.7058824
persoane.

persoane

anual/100000

Skewness
Range
Minimum
Maximum
Sum
Count
Confidence
Level(95.0%)

3.15294117
6
0.63495701
8
2.4
0.8
2.61799485
5
6.85389705
9
0.38630283
4
1.20258989
4
8.4
0.7
9.1
53.6
17
1.34604874
8

Eroarea standard reprezint expresia direct a mprtierii valorilor eantionului nostru,


aadar, observm c aceasta este de 17.5494605 pentru decese iar pentru consum de
0.634957018.

Cea mai frecvent valoare a unei variabile este reprezentat de valoarea modal, n cazul nostru
este 211 pentru decese i 0.8 pentru consumul de alcool din vin.
Dac urmrim indicatorul skewness observm ca variabila consumul de alcool din vin
este mai > 0 respectiv 1.202589894 ceea ce reflect faptul ca distribuia este nclinat spre
stnga,avand mai multe valori spre dreapta.
Urmatorul indicator analizat este Kurtosis care ne arata ca avem distributie a variabelelor
> 3 0.386302834 distributie leptokurtica, mai ascutita decat o distibutie normala; avand mai
multe valori concentrate in jurul mediei si cozi mai groase ceeea ce inseamna probabilitati
ridicate pentru valorile extreme.

Consumul de alcool din vin Residual Plot

Consumul de alcool din vin Line Fit Plot


Y
Predicted Y

Normal Probability Plot

3.Modelul econometric de regresie multipla


Utiliznd funcia de regresie din EXCEL, i anume selectnd TOOLS DATA ANALYSIS
REGRESSION, am obinut urmtoarele rezultate, care vor fi interpretate fiecare in parte:
SUMMARY
OUTPUT
Regression Statistics
Multiple R
0.85690819
R Square
0.734291646
Adjusted R
Square
0.716577756
Standard Error
38.52167803
Observations
17

Multiple R (coeficientul multiplu de corelaie sau r) =0.85690819.Observm c valoarea


lui r este > 0, ceea ce inseamn ca ntre variabila stabilit (consumul de alcool din vin) i
decesele datorate afeciunilor cardiac exist o legatur direct.
R Square (R) (coeficientul de determinaie), exprim ct din variaia frecvenei deceselor
datorate afectiunilor cardiace este explicat de catre variabila dependenta consumului de alcool
din vin . El poate lua valori in intervalul [0,1]. Cu ct valoarea lui este mai apropiat de 1, cu att

partea din variaia lui Y, explicat de X este mai mare, i legtura dintre ele este mai puternic. In
cazul nostru, R Square are valoarea 0.734291646; exprimat procentual 73, 42% ceea ce ne arat
ca influena variabilei dependente asupra deceselor datorate afectiunilor cardiace este puternic
semnificativ.
Abaterea medie patratica a erorilor (eroarea standard, standard error)= 38.52167803 . n
cazul n care acest indicator este 0, toate punctele sunt situate pe dreapta de regresie.
Numarul de observatii luate in calcul a fost de 17.

ANOVA
df
Regression
Residual
Total

SS
1

61512.73424

15
16

22258.79517
83771.52941

MS
61512.734
24
1483.9196
78

F
41.452873
2

Significance F
0.000011

Testul ANOVA (analysis of variance) este folosit pentru validarea modelului de regresie utilizat.
Variaia explicat prin modelul de regresie este de 61512.73424, iar media variaiei explicat,
corectata prin numarul de grade de libertate (1), este 61512.73424. Variaia rezidual (variaia neexplicat
de modelul de regresie) este de 22258.79517, iar media variatiei reziduale corectat cu numrul de grade
de libertate (14) = 1483.919678.
n tabel este calculat testul F (Fisher). ntruct F=41.4528732, iar Significance F (pragul de
semnificaie)= 0.000011 (< = 0,05) modelul de regresie construit este valid pentru o probabilitate de cel
mult 95% i poate fi utilizat pentru analiza dependenei dintre cele doua.
Coe
fficie
nts

Stan
dard
Error

t
Stat

P-value

Low
er
95%

Uppe
r
95%

Lowe
r
95.0
%

Uppe
r
95.0
%

Inte
rcep
t
Con
sum
ul
de
alco
ol
din
vin

266.3
79915

14.89
32429

23.68
39282

3.678
54791
2

17.8
8595
8
6.43
8390
6

1.58186E11
0.00001116
656638028
6

234.6
3571
9
31.52
4567
5

298.1
24110
6
15.84
32889

234.6
35719
31.52
45674
8

298.1
24110
6
15.84
32889
3

Intercept este termenul liber, deci coeficientul y=266.379915. Termenul liber este punctul n care
variabila explicativ este 0. Deoarece t statistic=17.885958, iar P-value 0.0000000000158< 0,05,
nseamn c acest coeficient este semnificativ diferit de zero. Termenul liber al ecuaiei de regresie se
gsete cu o probabilitate de 95% in intervalul : [234.635719, 298.1241106].
Coeficientul corespunztor variabilei independente (X) are o valoare de -23.683. Pragul de
semnificatie P-value= 0.000011166< 0,05 nseamn c acest coeficient este semnificativ diferit de zero.
Intervalul de ncredere pentru parametrul de consum de alcool din vin este ntre[-31.5245675;
-15.84328893]
Observation
1
2
3
4
5
6
7
8
9
10
11

Predicted
Y
207.170094
3
174.012594
8
197.696523
209.538487
1
197.696523
247.432772
3
50.8561681
3
247.432772
3
249.801165
1
79.2768819
8
223.748844

Residuals
3.8299057

Standard
Residuals
0.102682692

-7.01259481

-0.188013014

-66.69652302
-18.53848712

-1.788184635
-0.497030975

22.30347698
49.56722775

0.597973223
1.328935169

20.14383187

0.540071491

-36.43277225

-0.976790403

50.19883493

1.345869039

27.72311802

0.743277932

-56.74884405

-1.521479777

12
13
14
15
16
17

221.380451
2
247.432772
3
112.434381
5
228.485629
7
129.013131
2
235.590808
1

44.61954878

1.196284123

-20.43277225

-0.547818203

-26.43438147

-0.708725922

-21.48562969

-0.576046114

-14.01313122

-0.375702732

49.40919185

1.324698106

n tabelul RESIDUAL OUTPUT, pe coloane, sunt enumerate toate observaiile luate n considerare (17),
valorile ajustate dup ecuaia de regresie i valoarea rezidual.
Pentru fiecare observatie se afieaz:
Observation (numarul de ordine al observatiei);
Predicted y valoarea y prognozat pentru observaia respectiv;
(se obine nlocuind valorile X ale observaiei n modelul estimate)
Residuals valoarea erorii de predicie (diferena dintre valoarea observat i valoarea prognozat);
Standard Reziduals valoarea standardizat a erorii. Este obinut prin mparirea reziduului la abaterea
standard a reziduurilor.
In urma analizei econometrice asupra studiului de caz Decesele datorate afectiunilor cardiace pe fondul
consumului de alcool , observam ca ipoteza conform careia afectiunile cardiace ce produc sunt
influentate in mare masura de factorul consumul de acool din vin.Acest lucru il putem vedea si Tabelul
Residual Output deoarece p-value corespunzator variabilei este mai mic de 0.05 .