Sunteți pe pagina 1din 19

Probleme pentru proiect

1. Se consideră o variabilă dependentă numerică, Y (de ex., volumul vânzărilor)


şi k variabile explicative numerice sau binare, X1,…, Xk .
2. Pentru variabilele alese, se construieşte o baza de date în SPSS
3. Se cere să se prognozeze nivelul yi pentru orizontul de prognoză tn+2.

În acest proiect doresc să analizez legatura dintre elementele specifice unei


activităţi de comerţ. Pentru început am definit variabilele modelului :
 variabila dependentă: cifra afaceri;
 variabile independente: trimestre, preţul produsului, volumul vanzărilor şi
anul vânzării.
Pentru a analiza relaţia dintre aceste variabile am construit o bază de date în SPSS
(anexa nr.1), cu 7 variabile pe un eşantion de 30 unităţi.

1. Se aproximează modelul legăturii dintre Y şi X, folosind reprezentarea grafică a


legăturilor simple (Y, X)

Regresia simplă
Regresia simplă analizează relaţia dintre 2 variabile Y (cifra de afaceri) şi X
(volumul vânzărilor). Această legatură poate fi aproximată cu ajutorul unui Scatterplot.
Graphs → scatter/dot → simple scatterplot
Obţinem următoarea reprezentare grafică:
Legătura dintre cifra de afaceri şi volumul vânzărilor

60.00

50.00
c ifra d e a fa c e ri

40.00

30.00

20.00
R Sq Linear = 0.67

10.00

30.00 40.00 50.00 60.00 70.00 80.00 90.00

volumul vânzărilor

Interpretare:
 Valoare lui R square este egal cu 0,67.
 Legătura dintre cele 2 variabile este una liniară definită de ecuaţia: Y= a + bX.
 Panta crescătoare indică un coeficient de regresie pozitivă.

2. Se aleg modelele cele mai bune: cu un factor, cu doi factori,…


Testarea modelului de regresie
Ipoteze statistice:
H0: β1, β2... βn= 0 panta dreptei este egală cu 0, rezultă că modelul de regresie nu este
semnificativ statistic.
H1: β1, β2... βn≠ 0 panta dreptei este diferită de 0, rezultă că modelul de regresie este
semnificativ statistic.

2
Pentru a evalua calitatea modelului vom analiza valoarea coeficientului de
determinatie R 2 , din tabelul Model Summery.
Analyze → Regresion → Linear
Ca şi variabilă dependentă alegem cifra de afaceri şi variabilă independentă
volumul vânzărilor.

Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .818a .670 .658 7.60214
a. Predictors: (Constant), volumul vanzarilor

Interpretare:
În primul tabel, R 2 , numit coeficient de determinaţie, are o mare importanţă.
Măsoară proporţia variaţiei explicate de volumul vânărilor în variaţia cifrei de afaceri. În
acest caz factorul de regresie explică 67 % din variaţia cifrei de afaceri.
În cazul analizat având în vedere că R 2 are o valoare mai mare de 0.4, putem
observa o legatură puternică între cele 2 variabile.

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 3279.010 1 3279.010 56.738 .000a
Residual 1618.190 28 57.793
Total 4897.200 29
a. Predictors: (Constant), volumul vanzarilor
b. Dependent Variable: cifra de afaceri

Interpretare:
În al doilea tabel, ANOVA, ne focalizăm pe statistica F, prin care testăm ipoteza
că variabila volumul vânzărilor nu explică variaţia variabilei cifra de afaceri. Informaţia
asupra acestei ipoteze este dată de probabilitatea Sig. din tabel. Probabilitatea Sig. fiind

3
mai mică de 0.05 concluzionăm că statistica Fisher este destul de mare, aşa încât
respingem ipoteza că variabila volumul vănzărilor nu influenţează variaţia variabilei cifra
de afaceri.

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) -3.460 4.857 -.712 .482
volumul vanzarilor .610 .081 .818 7.532 .000
a. Dependent Variable: cifra de afaceri

Interpretare:
În final, ultimul tabel ne ajută să determinăm dacă cele doua variabile sunt
semnificativ corelate, direcţia legăturii şi intensitatea relaţiei. Primul lucru important este
ca semnul coeficientului variabilei volumul vânzărilor este pozitiv.
Ecuaţia Y = -3.460 + 0.610X, arată că atunci când volumul vânzărilor creşte cu o
unitate, cifra de afaceri va creşte, în medie, cu 0.610.
În concluzie, R 2 , este mare, probabilitatea Sig. este mică : totul este perfect!

Regresia multiplă
În cazul regresiei multiple, variaţia variabilei cifra de afaceri nu poate fi explicată
numai de o singură variabilă, motiv pentru care alegem ca variabile independente
volumul vânzărilor, preţul produsului şi trimestrele.

Ecuaţia regresiei multiple: Y = a 0 + a 1 X 1 + a 2 X 2 + ε

Coeficienţii variabilelor: a 1 şi a 2

Termenul de eroare: ε - influenţa factorilor care nu sunt prinşi în model.

4
Matricea de corelaţie
Înainte de realizarea analizei de regresie multiplă este necesar să calculăm
matricea de corelaţie pentru cele trei variabile independente: volumul vânzărilor, preţul
produsului şi trimestrele.
Se obţine prin Analyze → Correlate → Bivariate
Selectăm coeficientul de corelaţie Pearson şi testul de semnificaţie two-tailed.

Correlations

volumul pretul
vanzarilor produsului trimestre
volumul vanzarilor Pearson Correlation 1 .307 .289
Sig. (2-tailed) .099 .122
N 30 30 30
pretul produsului Pearson Correlation .307 1 .054
Sig. (2-tailed) .099 .776
N 30 30 30
trimestre Pearson Correlation .289 .054 1
Sig. (2-tailed) .122 .776
N 30 30 30

Interpretare:
Acest pas este important pentru că nu ar trebui să fie corelate unele cu altele,
deoarece s-ar afecta robustarea rezultatelor.
În cazul analizat se observă o legatură slabă între :
 volumul vânzărilor şi preţul produsului deoarece coeficientul de coleraţie este
egal cu 0.307 deci se apropie de zero;
 volumul vânzărilor şi trimeste deoarece coeficientul de coleraţie este egal cu
0.289 deci se apropie de zero;
 preţul produsului şi trimestre deoarece coeficientul de coleraţie este egal cu 0.054
deci se apropie de zero.

5
Regresia multiplă:
Analyze → Regresion → Linear
Obţinem outputul:

Model Summary

Adjusted Std. Error of


Model R R Square R Square the Estimate
1 .830a .689 .653 7.65454
a. Predictors: (Constant), pretul produsului, trimestre,
volumul vanzarilor

Interpretare:
Coeficientul R square este sensibil la numărul variabilelor introduse în model.
Adăugarea de noi variabile duce la creşterea coeficientului. Aceeaşi creştere se observă şi
în cazul lui R square ajustat.

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 3373.809 3 1124.603 19.194 .000a
Residual 1523.391 26 58.592
Total 4897.200 29
a. Predictors: (Constant), pretul produsului, trimestre, volumul vanzarilor
b. Dependent Variable: cifra de afaceri

Interpretare:
În tabelul ANOVA probabilitatea Sig. fiind mai mică de 0.05, concluzionăm că
statistica F este destul de mare, aşa încât respingem ipoteza că variabilele independente
volumul vănzărilor, preţul produsului şi trimestrele nu influenţează variaţia variabilei
dependente cifra de afaceri.

R square (pentru regresie simplă) = 0.670 Modelul cel mai bun este modelul de
regresie multiplă deoarece are

R square (pentru regresie multiplă) = 0.689 R square mai mare.

6
3. Se estimează coeficienţii de regresie, b0, b1,…, bk.

Coefficientsa

Unstandardized Standardized
Coefficients Coefficients
Model B Std. Error Beta t Sig.
1 (Constant) -4.280 5.746 -.745 .463
trimestre .209 .169 .142 1.238 .227
volumul vanzarilor .586 .089 .786 6.554 .000
pretul produsului -.111 .450 -.028 -.246 .808
a. Dependent Variable: cifra de afaceri

Y= - 4.280 + 0.209 * X1 + 0.586 * X2 - 0.111 * X3 + e, unde


Y = variabila dependentă, adică cifra de afaceri
X1 = variabila independentă trimestre
X2 = variabila independentă volumul vânzărilor
X3 = variabila independentă preţul produsului

ε = eroarea

Ecuaţia estimată pentru modelul de regresie poate fi interpretată în felul următor:


 dacă X1 creşte cu o unitate, Y se modifică, în medie, cu 0.209 unităţi, dacă
celelalte variabile independente rămân constante;
 dacă X2 creşte cu o unitate, Y se modifică, în medie, cu 0.586 unităţi, dacă
celelalte variabile independente rămân constante;
 dacă X3 creşte cu o unitate, Y se modifică, în medie, în sens invers, cu -0.111
unităţi, dacă celelalte variabile independente rămân constante.

7
4. Se estimează abaterea-tip s a termenului rezidual ei.

În scopul de a detremina valoarea acestei abateri ne vom ajuta de Sum of Squares


care revine Residual-ului în tabelul ANOVA, după care vom face un calcul simplu pentru
a afla valoarea acestei abateri (o estimare a acesteia).

ANOVAb

Sum of
Model Squares df Mean Square F Sig.
1 Regression 3373.809 3 1124.603 19.194 .000a
Residual 1523.391 26 58.592
Total 4897.200 29
a. Predictors: (Constant), pretul produsului, trimestre, volumul vanzarilor
b. Dependent Variable: cifra de afaceri

Formulele de calcul sunt:


n

σ = 
2
2 e 1523.391
= i 1
i
30  4  1
= 60.93
n  k 1

ˆ  ˆ 2 = 60.93 = 7.80 unde,


- Suma erorilor are valoarea 1523.391, din tabelul ANOVA, Residual;
- n este numărul de înregistrări din baza de date, în cazul nostru 30;
- k este numărul de parametri utilizati în regresie, în cazul nostru 4.

5. Se analizează reziduurile (se verifică ipotezele asupra reziduurilor)

Pentru analiza reziduurilor vom utiliza ipoteza de normalitate a erorilor. Înainte


de a testa ipoteza de normalitate, este important să se testeze dacă media erorilor este
egală cu zero sau nu.
În SPSS, pentru testarea acestei ipoteze:M(εi) = 0, utilizăm testul Student.
Analyze → Regression → Linear → opţiunea Save
 Predicted value: - Unstandardized
 Rezidual: - Standardized
Prin bifarea Standardized din categoria Residuals obţinem în baza de date (Data

8
View) o nouă variabilă pe o nouă coloană, variabila notată cu ZRE_1.
Utilizăm această nouă variabilă obţinută în urma selectării Standardized Residuals
în realizarea unui test One Sample T Test pentru a observa dacă există diferenţe
semnificative între media erorilor (reziduurilor) şi valoarea 0. Vom selecta testul urmând
Analyze - Compare Means - One sample T test. În căsuţa destinată valorii cu care dorim
să comparăm media vom înscrie valoarea 0. În căsuţa destinată Test Variable(s) vom
trece noua variabilă obţinută (ZRE_1).

Testare: Pentru a verifica dacă media erorilor este sau nu apropiată sau egală cu zero,
vom genera în SPSS outputul operaţiunii de mai sus:

One-Sample Test

Test Value = 0
95% Confidence
Interval of the
Mean Difference
t df Sig. (2-tailed) Difference Lower Upper
Standardized Residual .000 29 1.000 .00000000 -.3535649 .3535649

Ipoteze:

Ho: nu există diferenţe semnificative între media erorilor şi valoarea 0.

H1: există diferenţe semnificative între media erorilor şi valoarea 0.

Test: Valoarea testului este egală cu 0. În plus, vom interpreta şi vom genera
decizia cu ajutorul Sig. În tabelul de mai sus Sig = 1, ceea ce înseamnă că Sig > α(0.05)

Regula de decizie: Dacă Sig > α, atunci se acceptă Ho, adică ipoteza de
homoscedasticitate.
Interpretare: Cu o probabilitate de 95% putem afirma că nu există diferenţe
semnificative între media erorilor din cadrul variabilei ZRE_1 şi valoarea 0, media fiind
egală cu 0.

9
Testarea normalităţii distribuţiei reziduurilor
Pentru a testa ipoteza de normalitate a distribuţiei reziduurilor vom realiza un test
non parametric Kolmogorov-Smirnov. Vom urma Analyze - Nonparametric Tests - One
Sample K-S. Vom introduce variabila nou obţinută ZRE_1 ca variabila căreia dorim să îi
testăm normalitatea (prin bifarea căsuţei Normal din secţiunea Test Distribution).

One-Sample Kolmogorov-Smirnov Test

Standardized
Residual
N 30
Normal Parameters a,b Mean .0000000
Std. Deviation .94686415
Most Extreme Absolute .215
Differences Positive .194
Negative -.215
Kolmogorov-Smirnov Z 1.180
Asymp. Sig. (2-tailed) .123
a. Test distribution is Normal.
b. Calculated from data.

Ipoteze:
Ho: ~ N(0, ), erorile urmează o distribuţie normală
H1: nu urmează o distribuţie normală N(0, )
Test: De această dată ne vom orienta tot după nivelul semnificaţiei Sig
Sig (2-tailed) este egal cu 0.123 ceea ce înseamnă că este mai mare decât α(0.05).
Regula de decizie: Dacă Sig > α(0.05), atunci se respinge ipoteza H1 şi se acceptă H0 .
Interpretare: Cu o probabilitate de 95% putem afirma că distribuţia erorilor urmează o
lege de distribuţie normală.

1
Reprezentarea grafică a distribuţiei reziduurilor

Într-o primă etapă putem reprezenta grafic distribuţia reziduurilor cu ajutorul


histogramei pe care o găsim în urma acţionării butonului Graphs→Histogram. Selectăm
variabila nou creată ZRE_1 în căsuţa Variable.
g ra
to
is
H m
e p
D dV
n
e rit b
a if ra
:c
le f a
e
d ri
e
c

r e
F n
u
q
y
c
e g
R io n
s
re da
ta
S e R
iz
rd a l
u
id
s
e

Diagrama de dispersie a reziduurilor

Încălcarea ipotezei de normalitate se poate un grafic al reziduurilor.


te rp
a
c
S t
lo

e p
D d tV
n
e ri b
a if ra
:c
le f a
e
d ri
e
c
io n
e g
R s
re da
S
ta e R
rd
iz a l
u
id
s
e

r s
g
e
R e le
D
n
io (P re
td )R e
s l
a
u
id
s

6. Se măsoară intensitatea legăturii între Y şi variabilele X1,…,Xk, folosind : R, R2

Intensitatea legăturii între variabile o realizăm cu ajutorul lui R şi R Square, adică


a coeficientului de corelaţie (pe care l-am utilizat şi în procesul de corelaţie realizat
anterior).
Valoarea R arată dacă există sau nu o corelaţie între variabila dependentă cifra de
afaceri şi variabilele independente preţul produsului, trimestre şi volumul vânzărilor.

Raportul de determinaţie arată proporţia variaţiei variabilei dependente explicate


prin modelul de regresie şi este folosit pentru a evalua calitatea ajustării.
Apelăm din nou la regresie, urmând traseul Analyze → Regression → Linear,
unde vom interpreta legăturile dintre variabile.

1
Mod elSum mar y

A djuste d Std. Ero of


M odel R R Squa reR Squa re theE stima te
a
1 .830 .689 .6 53 7. 654
a.
P redicto rs:(C onsta nt),pr tulpre odus lui,tr mestr ,
vo lum anzv rilo

Interpretare:
R este egal cu 0,830 ceea ce înseamnă că între variabila dependentă cifra de
afaceri şi variabilele independente preţul produsului, trimestre şi volumul vânzărilor
există o legătură liniară, puternică şi directă. R² = 0,689 ceea ce înseamnă că 68.9% din
variaţia variabilelor independente explică variaţia variabilei dependente cifra de afaceri.

7. Se verifică dacă legătura totală (globală) între Y şi X1,…, Xk este semnificativă 

Ipoteze statistice:
Ho: β= 0 panta dreptei este egală cu 0, rezultă că modelul de regresie nu este semnificativ
statistic
H1: β≠ 0 panta dreptei este diferită de 0, rezultă că modelul de regresie este semnificativ
statistic.
Ecuaţia Y = - 4.280 + 0.209 * X1 + 0.586 * X2 - 0.111 * X3 + ε
Panta dreptei este egală cu 0.209, deci este pozitivă şi indică o legătură semnificativă
între variabilele modelului.

8. Se verifică dacă aportul marginal al fiecărei variabile Xj (în plus faţă de altele)
în explicarea lui Y este semnificativ

Y = - 4.280 + 0.209 * X1 + 0.586 * X2 - 0.111 * X3 + e, unde,


Y = variabila dependentă, adică cifra de afaceri
X1 = variabila independentă trimestre
X2 = variabila independentă volumul vânzărilor
X3 = variabila independentă preţul produsului

ε = eroarea

1
Coefic ientsa

Unsta darize St andrize d


Co eficnts Co eficnts
Mo del B Std.Er ro Beta t Sig .
1 (C onsta) -4.280 5.7 46 -.745 .46 3
trim estr .20 9 .169 .14 2 1.238 .2 7
vo lumvan zarilo .58 6 .089 .78 6 6.54 .0 0
pre tulprod suli -.1 1 .450 -.0 28 -.246 .80 8
a. Depnd entVari ble:cifra eafcd ri

Test 1 Se poate anula variabila volumul vânzărilor?


Ipoteze::
H 0 :  j  0 - se poate anula variabila

H1 :  j  0 - trebuie menţinută variabila


Statistica test utilizată: testul t student, cât şi semnificaţia lui Sig din tabelul Coefficients.
Regula de decizie: t calculat pentru variabila noastră este 6.554, t teoretic fiind egal în
anexa student cu t (29; 0.025) = 2.045, deci t calc > t teor, deci se respinge H0.
De asemenea, vom putea studia şi valoarea lui Sig în raport cu α= 0.05. Sig-ul
corespunzator variabilei noastre este 0.000, deci Sig < α., deci se respinge H0.
În concluzie, se respinge H0, deci se acceptă H1.
Interpretare: Cu o probabilitate de 95% putem afirma că variabila volumul vânzărilor
trebuie menţinută.

Test 2 Trebuie menţinută variabila preţul produsului?


Ipoteze::
H 0 :  j  0 - se poate anula variabila

H1 :  j  0 - trebuie menţinută variabila


Statistica test utilizată: testul t student, cât şi semnificatia lui Sig din tabelul Coefficients
de mai sus.
Regula de decizie: t calculat pentru aceasta variabilă este -0.246 fiind mai mic decât t
teoretic (2.045), deci t calc < t teor, se respinge H1.
De asemenea, vom putea studia şi valoarea lui Sig în raport cu α= 0.05. Sig-ul
corespunzator variabilei noastre este 0.808, deci Sig > α.
În concluzie se respinge H1 şi se acceptă Ho.
Interpretare: Cu o probabilitate de 95% putem afirma că variabila preţului produsului se
poate anula.

Test 3 Trebuie anulată variabila trimestre?

1
Ipoteze::
H0 :  j  0 - se poate anula variabila
H 1 :  j  0 - trebuie menţinută variabila

Statistica test utilizată: testul t student, cât şi semnificaţia lui Sig din tabelul Coefficients
de mai sus.
Regula de decizie: t calculat pentru aceasta variabilă este 1.238 fiind mai mic decat t
teoretic care este egal cu 2.045, deci t calc < t teor.
De asemenea, vom putea studia şi valoarea lui Sig în raport cu α= 0.05. Sig-ul
corespunzator variabilei noastre este 0.227, deci Sig > α., se respinge H1.
Deci se respinge H1 şi se acceptă H0.
Interpretare: Cu o probabilitate de 95% putem afirma că variabila trimestre se poate
anula.

9. Se face selecţia automată a variabilelor Xj « bune »

Pentru că mai sus am selectat variabilaa bună printr-o metodă clasică, acum
Coefficients
vom demonstra cum se putea face aceasta operaţiune tot prin intermediul SPSS,
Unstandardized Standardized
Coefficients
însă într-un mod diferit. Astfel, în demersul Coefficients
regresiei în loc să alegem înCollinearity
fereastraStatistics
Model B Std. Error Beta t Sig. Tolerance VIF
1 primară opţiunea Enter,
(Constant) -4.280 vom alege5.746 Backward -.745 .463
trimestre .209
. Selectăm variabila dependentă şi.169 .142
variabilele independente, 1.238 .227
apoi prin activarea .915
butonului 1.092
volumul vanzarilor .586 .089 .786 6.554 .000 .832 1.202
Ok vom obţine
pretul produsului -.111 urmatorul
.450 tabel de coeficienţi
-.028 şi Model
-.246 Summary.
.808 Mo
1
2
3
l
e
d

.P re
a
o lu
v
.P re
b

.905
to rs

.P re
c
ic
d
mv
to rs
ic
d

1.105
:(C o

to rs
ic
d
z rilo
n
a
:(C o
de
o
M

a RS
R
0 .6
3
.8
b
0 .6
3
.8
c
mm
u
lS

1 .6
.8

:(C o
r y
a

ta n
s
n

ta n
s
n
r e
t),p

ta n
s
n
t),ri e
a re
u
q
9 .6 5
8
8 .6 6
0 .6 5
7

o lu
t),v
r o
lp
tu
Ad
RS
te d S
s
ju

s lu
u
d

trm ,v
s
mv
a re th
u
q

lu m
o
z rilo
n
a
3 7
5 7
8 7
i,tr m

lv a
u
. E
td
Es
e
ro o

. 6
. 5
. 6
tr ,
s
e

ri lo
z
n r
a te
tim
4
5
1
0
2
4
1
2
0
f

2 (Constant) -4.959 4.948 -1.002 .325


trimestre .210 .166 .143 1.270 .215 .917 1.091
volumul vanzarilor .579 .084 .777 Variables
Excluded 6.924
c .000 .917 1.091
3 (Constant)În Model Summary
-3.460 şi Excluded
4.857 Variables putem observa -.712 cum SPSS-ul
.482 a eliminat
volumul vanzarilor .610 .081 .818 7.532 .000 1.000 1.000
una câte una variabilele care nu îmbunătăţeau modelul. Este clar că aceastăCollinearity metodă, Statistics
a. Dependent Variable: cifra de afaceri
Partial Minimum
Backward,
Model este mai indicată Betadecât
In cea clasică
t în urma
Sig. căreia putem scăpa
Correlation din vedereVIF
Tolerance o Tolerance
2
anumită pretul produsului
combinaţie de variabile. -.028a -.246 .808 -.048 .905 1.105 .832
3 pretul produsului -.034b -.289 .775 -.056 .906 1.104 .906
trimestre .143b 1.270 .215 .237 .917 1.091 .917

10.a.SePredictors
compară in the Model: (Constant), trimestre, volumul vanzarilor
modelele
b. Predictors in the Model: (Constant), volumul vanzarilor
c. Dependent Variable: cifra de afaceri

1
Modelul complet:
Cifra de afaceri = β0 + β1 * trimestre + β2 * volumul vânzărilor+ β3 * preţul produsului
+ β4 * anul vânzării
Modelul simplificat:
Cifra de afaceri = β0 + β1 * trimestre + β2 * volumul vânzărilor+ β3 * preţul produsului
Test asupra modelului complet
Ipoteze:
H 0 :  1   2   3  ... 4  0 coeficienţii sunt egali cu 0

H 1 :  j  0 cel puţin un coeficient este diferit de 0

Statistica test:
Vom folosi testul Fisher (statistica F)
Regula de decizie:

F
 R (Modelcomplet )  R (Modelsimplificat ) /(k
2 2
1  k2 )
1  R (Modelcomplet ) /(n  k  1)
2
1
= 0.166

F  F1  k1  k 2 , n  k1  1 , F calc fiind egal în tabel cu 4.260, unde

k1 – k2 = 5-4 = 1 (numărul de parametri din cele două modele)


n- k1-1 = 30-5-1 = 24
de
o
M mm
u
lS r y
a
Ad te d S
s
ju . E
td ro o f
Mo
1 l
e
d a RS
5
4
.8
R a
u
q
4 re
1
.7 RS a
u
q
.6 re 9 th
6 . s
7
E
e 6 te
9
7
4
a
tim
2 b .7
4
.8 2 .6 7
1 8 7 . 3 8
6
3 c .6
2
3
.8
d 2 .6 6
9 9 7 . 4 6
0
7
4 a
. 1 .6
.8 0 .6 5
7 8 7 . 6 4
1
2
0
P re
o
v to
ic
d mv
lu :(C o
rs
z
n
a ta
s
n ril, trim
),a tre
n
s
e n z
a
lv
u ri, p
a l p
tu
re u s
d
ro li,
u
.P re
b to rs
ic
d :(C o ta n
s
n t),a u n z
a
lv ri, v
a mu
lu
o l
a n
v ril o
a
z r,tim e tr
s
.P re
c to rs
ic
d :(C o ta n
s
n t),a u n z
a
lv ri, v
a mu
lu
o n z
a
lv rilo
a
.P re
d to rs
ic
d :(C o ta n
s
n o lu
t),v mvz rilo
n
a

NO
A A
V
e
o d
M l
e u u
q
S f d
o
m
s
re
a f M e a u re F S
q
S
n . a
ig
1 R e s n 1
o
re
lg
a
u
id 4 9
3 4 2
5
3
.6
8 5 4 5 6 1
7
8
4
.9 5 .6 4 .0 0
3
2 R o g
T
e l 3
ta
n
io
s
re 8 8
4 2 2
7
9
0
1
.4
5 9 3 1 .8 0
6 3
1 .3
2 6 .0 0
9 b
e ta
R
o
T u 4
id
ls 1 9
8 1 2
0
.2
7 6 5
9 0
.3
4
3 R e s n 1
o
re
lg
a
u
id 3 0
5 8 2
2
7
.4
9 7 2 5 8 6
3
1
6
0
.9 4
0 .2
3 8 .0 0
9 c
4 R o g
T
e l 3
ta
n
io
s
re 8 7
4
2 2 2
1
.0
9 9 1 3 .0 1
9
7
2 0
6 .7
5 8 .0 0
3 d
e ta
R
o
T u 4
id
ls 6 9
1
8 8 2
1
0
.2
7 8 5
9 3
.9
7
.a P
b ic to
d
re :(C n
rs ), a
ta
s lv z
u
n e tu
ri,p
a d s
ro
lp o lu
li,v
u v a
m rilo ,trim
z
n s re
e
. P
c ic to
d
re :(C n
rs ), a
ta
s lv z
u
n o lu
ri,v
a a n
v
m , trim
rilo
a
z s
e
.d D
e ic to
rd
P
n
p
e :(C
rs a ia
V
n
e
d t), ra
s
fn
:c
le
b mv
lu
o
fv
e
d rilo
z
n
a e r
c

În tabelul ANOVA putem observa valoarea lui Sig care este egală cu 0 în toate
modelele exemplificate, deci Sig < α (0.05).
Interpretare:
Cu o probabilitate de 95% putem afirma că respingem Ho, deci cel puţin un
coeficient diferă de 0.
11. Se estimează intervalul de încredere cu 95% a E(Y)

Pentru a afla intervalul de încredere, vom proceda ca la subpunctul precedent:


Din meniu: Analyse – Regression – Linear – Save: Din cadrul Prediction Intervals
vom bifa Mean (E(Y)).
Prin urmare, în baza de date vor apărea valorile upper şi low ale intervalului de

1
încredere pentru cifra de afaceri, prezentate în tabelul de mai jos:
Tabel Limite superioare şi inferioare ale cifrei de afaceri
LMCI UMCI LICI UICI
7.23293 20.87478 -3.09513 31.20285
13.71745 24.84926 2.59377 35.97294
31.58811 44.46457 21.02594 55.02674
26.83223 38.57979 15.91125 49.50078
9.96296 22.31535 -0.76375 33.04207
16.59991 26.2037 4.95124 37.85237
34.51976 46.27847 23.6024 57.19583
30.07444 38.91094 18.14999 50.83539
12.19779 22.70285 0.86262 34.03803
17.91076 28.17872 6.49419 39.59529
37.32243 48.15507 26.09845 59.37904
32.04307 40.29447 19.90272 52.43482
11.65442 24.54145 1.09553 35.10034
21.14411 28.07636 8.49884 40.72162
37.27903 49.71488 26.57875 60.41516
34.15597 41.90981 21.82816 54.23762
10.50578 27.87006 1.21732 37.15852
22.43617 29.84899 9.97779 42.30737
36.89097 53.4551 27.39228 62.9538
35.3937 43.51559 23.2049 55.70439
16.10379 26.66384 4.78738 37.98024
23.02206 33.94236 11.8276 45.13682
41.90158 53.49983 30.9319 64.46951
32.34252 41.49233 20.53168 53.30317
16.06314 28.3758 5.32381 39.11512
25.94997 37.15339 14.85012 48.25324
41.92256 54.99526 31.42111 65.49672
33.5008 44.06228 22.18488 55.3782
26.15793 37.75654 15.18837 48.7261
43.09748 57.79431 33.08035 67.81144

12. Cu o încredere de 95%, se estimează intervalul de previziune a valorii y

Pentru a previziona valoarea cifrei de afaceri, vom utiliza modelul:


Yi   0   1 X 1   2 X 2   i

yi = valoare viitoare a lui Yi


yˆ i  ˆ0  ˆ1 x1  ˆ 2 x 2  ei (estimaţia lui yi)

Demersul în SPSS este următorul:

1
Din meniu: Analyse – Regression – Linear – Save: Din cadrul Prediction
Intervals vom bifa Individual. Prin urmare, în baza de date vor apărea valorile estimate pe
baza modelului de regresie ales.
fic ie
e
o
C ts
n
a
sta d
n
U rize S
a t a rize d
d
n
o d
M l
e Be
o
C tsS
ficn r ro
.E
d Ce tsB
ficn
a t S ig .
1 trim
(C e )
a
n
stro 0 .0
9
8
.7
-2 2 3
3
5
9
1 7
14 -1 . 8 4 -1
9 .1
4
2
8
.3 4 9
7 8
vo tu
re
p n su
va
m
d
ro
lp ro .7
liza 4 1 .1 6 .9 4 5
3 7 .0 0
6
.4
n u
a zr i 1
n
lva - 1
2
.4 6 . 6
7 2
.4 1 -0 4
.9 5 1
8 5 .1
-8
3
9
.4 3 8
6
4 2
2 trim (C e )
a
n
stro 1 .3
4
7
.5
-2 4 3
9
1 0
79 -1
1 . 74 -1 6 .1
5
4
.3 5 1
9 7
vo u
n
a zrm iza
n
lva rlo 1 2 0
7
3
5
.8
0 .4 5
7 37 1
2
.1 6 4
9
.8 6 1
7 3 .1
8
6
5
.4 0 7
5 0
3 vo (C o )lu
sta
n v za
m rilo 7 9
-1 .2
0 8 8
5 . 9
2
1 5 1 .7
8
.0 8 9 7 9 .0
3
-1
4
.2 7 0
1 4
n u
a zr i .8
n
lva 9 2 .6 0 .1
4 5 2 1 5 .1
9
.3 7 5
4 vo (C o )lu
sta
n v za
m rilo .6 0 0
4
-3
1 .8 5
4 7 1 .8
8
.0 1 8 7 -1 .0
2
3
.5 8 0
4 2
. D
a d e
n
p
e ri b
a
tV
n :cifra e
le fcd ri
a

Bibliografie

1. Elisabeta Jaba, Ana Grama - “ Analiză statistică cu spss sub windows”, Ed.
Polirom, Iaşi, 2004;
2. Elisabeta Jaba, Statistica, Editura Economică, Bucureşti, ediţia a 3 revizuită,
2002;
3. Elisabeta Jaba, Carmen Pintilescu, Statistică-teste grile şi probleme, ediţia a 2
revizuită, Editura Sedcom Libris, Iaşi, 2007;
4. Elisabeta Jaba, Dănuţ Jemna, Econometrie, Editura Sedcom Libris, Iaşi, 2006;

1
Anexa 1

1
1

S-ar putea să vă placă și