Sunteți pe pagina 1din 4

Regresie – Seminar 3

Aplicație 1. Pentru a analiza legătura funcțională dintre Percepția pozitivă asupra sănătății și
Emisii gaze de sera, s-au analizat date din 27 țări din Europa, iar rezultatele sunt reflectate în
output-ul din Excel:

Regression Statistics
Multiple R .....
R Square 0,002477
Adjusted R Square -0,03742
Standard Error 8,850334
Observations .....
Numărul de obsevații este numărul de țări incluse în cercetare (27).d

ANOVA
df SS MS F Significance F
Regression ....... SSR=....... ....... ...... 0,805294
Residual ....... SSE=....... .......
Total ...... SST=....... .......

Standard Lower Upper


Coefficients Error t Stat P-value 95% 95%
Intercept 68,29465 2,134673 ...... 8,32E-22 ........ .......
Emisii gaze de
sera ......... 7,02E-06 ...... 0,805294 -1,6E-05 ......
Se cere:

a) Să se determine legătura dintre cele două variabile;


b) Să se interpreteze coeficientul de determinație;
c) Să se interpreteze coeficienții ecuației de regresie;
d) Să se determine intervalele de încredere pentru parametrii ecuației de regresie;
e) Să se testeze validitatea modelului;
f) Să se testeze semnificația parametrilor;
g) Să se realizeze o prognoză punctuală pentru țara X, dacă volumul emisiilor de seră
este de 50 (echivalemt CO2).

REZOLVARE

a).Legătura dintre cele două variabile este reflectată de Raportul de corelație (Multiple R).
Rϵ[0,1].
În cazul nostru, ˂ 0,3 → legătura dintre cele două
variabile (Percepția pozitivă asupra sănătății și Emisii gaze de sera) este foarte slabă.
b). = raportul de determinație, arată în ce măsură variația variabilei dependente este
explicată de variabila independentă.
= 0,002477 → variația variabilei Percepția pozitivă asupra sănătății este influențată în
procent de 0,2477% de variația variabilei Emisii gaze de sera. Această valoare este mai mică
decât 40%, ceea ce reflectă un model nevalid.

c). a=68,29465 – intercept (constantă), termen liber, nu are sens dpdv economic, dar este
valoarea lui y atunci când Emisiile de gaze de sera=0.
I.C. (in cazul lui β) :
L.I.= =
=2,056 (probabilitate 95%) →
b= , estimatorul parametrului „Pantă” al modelului de regresie liniară
unifactorială
- semnul lui : există o legătură inversă între cele două variabile (valorile celor două
variabile se modifică în sens diferit);- cresterea volumului de Emisii gaze de seră determină,
în medie, o scădere a Percepției pozitive asupra sănătății;
- valoarea lui : la creșterea cu o unitate (echivalemt CO2) a volumului de Emisii gaze de
sera, se estimează că Percepția pozitivă asupra sănătății scade cu unități.
-
d). Intervalele de încredere (I.C.):
- pentru α:
6

α pentru o Probabilitate de 95%.

- pentru β:
L.I. =
L.S. +7,02 *2,056=
pentru o Probabilitate de 95%.

e). Validitatea modelului:


- H0: modelul nu este valid
- H1: modelul este valid

Se folosește testul Fisher F:


- Fcalc=
-
Completă tabelul ANOVA:
ANOVA
df SS MS F Significance F
Regression ....... ....... ....... ...... 0,805294
Residual ....... ....... .......
Total ...... ....... .......
Coloana df (degrees of freedom = grade de libertate):
- Pentru regression = k= numărul de variabile independente, în cazul nostru 1
(Emisii gaze de seră);
- Pentru residual = n-k-1= 27-1-1= 25;
- Total = n-1= 27=1=26
- Coloana MS (Mean of Squares- dispersiile) = coloana SS/df:
- Pentru residual:
-
- Din primul output de Regression Statistics, știm că (Standard Error) = 8,85
→ =78,32, așadar SSE=1958,21 (78,32*25)
- Pentru total:
- Tot din output de Regression Statistics, știm că R Square=0,002477
-
-
- coloana de SS
- SSR=4,86
- SST=4,86+1958,21=1963,07
- Pentru regression:
-
- Pentru coloana de dispersii (MS) nu avemtotal, dispersiile nu se adună.
- Cum SSR˂SSE, deducem că modelul nu este valid.
- Calculăm testul F:
- Fcalc=
-
-
- Fcalc˂ , se acceptă ipoteza nulă H0, modelul nu este valid.

f) Semnificaţia parametrilor:
Pentru α:
- H0: α =0 (α nu e semnificativ statistic)
- H1: α ≠0 (α e semnificativ statistic)
-
- Varianta 1. Testul Student
- n˂30, se folosește testul aferent repartiției Student:
- tcalc=
- tcalc ˃ tcritic (2,056), se respinge H0, se acceptă H1: α ≠ 0 (α e semnificativ
statistic).
- Varianta 2. Semnificaţia parametrului α este dată şi de I.C. (atât limita inferioară,
cât şi limita superioară în cazul lui α sunt pozitive), aşadar α e semnificativ
statistic.
- Varianta 3. P value
- Pvalue 8,32 , se respinge H0, se acceptă H1: α ≠ 0 (α e
semnificativ statistic).
Pentru β:
- H0: β=0 (β nu e semnificativ statistic)
- H1: β≠0 (β e semnificativ statistic)
- Varianta 1. Testul Student
- n˂30, se folosește testul aferent repartiției Student:
- tcalc=
- tcalc ˂ tcritic (2,056), se acceptă H0, (β nu e semnificativ statistic).
- Varianta 2. Semnificaţia parametrului β este dată şi de I.C. (limita inferioară este
negativă, iar limita superioară este pozitivă în cazul lui β), aşadar β nu e
semnificativ statistic.
- Varianta 3. P value
Pvalue , se acceptă H0 (β nu e semnificativ statistic).
- Varianta 4. Doar în cazul regresiei factoriale, dacă modelul nu este valid,
înseamnă ca β nu este semnificativ statistic.
g). dacă volumul emisiilor de seră este de 50 (echivalemt CO2).
= 68,29 + =68,29 =68,289
- Estimăm că Percepția pozitivă asupra sănătății a unei țări cu emisii de seră de
50 (echivalemt CO2). este de 68,289.

S-ar putea să vă placă și