Proiect SPSS

Specializarea: Statistică şi previziuni economice
Coordonator: Student:
Prof. D. VIORICA
Anul III, grupa 2
IAŞI
- 2006-
CUPRINS
CUPRINS............................................................................................................................1
CAPITOLUL I.....................................................................................................................2
Introducere...........................................................................................................................2
1.1.Definirea problemei...................................................................................................2
1.2.Obiectivul proiectului................................................................................................2
CAPITOLUL II...................................................................................................................2
Construirea bazei de date.....................................................................................................2
2.1.Alegerea variabilelor analizate..................................................................................2
2.2.Definirea variabilelor şi introducerea datelor în SPSS..............................................3
CAPITOLUL III..................................................................................................................5
Verificarea bazei de date.....................................................................................................5
3.1.Depistarea outlierilor.................................................................................................5
3.2.Verificarea normalităţii distribuţiilor.........................................................................8
CAPITOLUL IV................................................................................................................11
Analiza statistică univariată a datelor................................................................................11
4.1. Descrierea statistică a variabilelor nominale..........................................................11
4.2 Descrierea statistică a variabilelor numerice...........................................................14
CAPITOLUL V.................................................................................................................17
Analiza statistică bivariată a datelor..................................................................................17
5.1 Analiza statistică a gradului de asociere între două variabile..................................17
5.2 Analiza de regresie şi corelaţie................................................................................19
CAPITOLUL VI................................................................................................................28
Estimarea şi testarea statistică...........................................................................................28
6.1 Estimarea parametrilor prin interval de încredere....................................................28
6.1.1 Estimarea prin interval de încredere a unei medii şi a unei proporţii.............28
6.2 Testarea statistică.....................................................................................................34
6.2.1 Testarea unei medii şi a unei proporţii.............................................................34
6.2.2 Testarea diferenţei dintre două medii şi două proporţii..................................38
CONCLUZII......................................................................................................................42
BIBLIOGRAFIE................................................................................................................43
Anexa 1..............................................................................................................................44
1
CAPITOLUL I
Introducere
1.1.Definirea problemei
Piata jeansilor se diversifica mereu pentru ca apar firme noi care produc jeansi,
modelele
satisfac nevoile tinerilor sau a tuturor persoanelor care poarta blugi in general prin
calitate sporita a produsului sau prin forma lor diferita conform stilului care se poarta in
momentul actual, culoarea si textura difera deasemenea de la firma la firma.
Printre firmele renumite de blugi se numara si nume precum: LEVIS, MOTOR,
KENVELO, B&G.
Nu toata lumea si le permite sunt si firme fantoma care fabrica jeansi si sunt la un
prêt mai accesibil, aproape oricine isi permite sa-si cumpere asemenea produse ce pot fii
gasite in orice magazin cu preturi accesibile tuturor sau in bazare.
1.2.Obiectivul proiectului
O cere ridicata de jeansi se inregistreaza in randul tinerilor mai ales a studentilor

si asta deoarece ei sunt cei care poarta cel mai adesea acest produs.
Exista si tineri care sunt reprezentanti a unor firme mentionate printre care KENVELO,
LEVIS, MOTOR, D&G, ce se gasesc in compexul de magazine Mall sau in oricare
centru de oras din tara de la noi sau din afara pentru ca sunt firme cunoscute si acceptate
in general de tinerii ce vor sa fie in rand cu moda si care vor lucruri de calitate.
In cadrul acestui proiect se va incerca analiza modului in care diversi factori
(variabile) influenteaza cererea de jeansi.
CAPITOLUL II
Construirea bazei de date
2.1.Alegerea variabilelor analizate
2
Pentru a putea analiza problema considerate s-a aplicat un chestionar (Anexa 1)
unui esantion de 35 de persoanae, studenti, in Compexul Studentesc Puschin: C5, C6, C7,
C8, C9. si in caminele de medicina de pe strada Sarariei 1 MAI A si B, cat si in Targusor
in caminele: C1, C2, C3, C4. Chestionarul a presupus răspunderea la un set de întrebări
referitoare la vârstă,anul de studiu, preferinţa pentru o anumită firma de jeansi conform
preferintelor, venitul lunar al studentului, preţul pe care acesta este dispus sa îl plătească
pentru un produs cosmetic şi cantitatea de produse cosmetice cumpărate.
Variabilele ce vor constitui baza de date din SPSS vor fi: vârsta, sexul persoanei,
venitul, firma jeansilor, preţul acestora şi cantitatea. Acestea vor constitui baza de date
Jeans.sav.
2.2.Definirea variabilelor şi introducerea datelor în SPSS
Atributele acestor variabile sunt definite în fereastra Data Editor – Foaia

VariableView:
Figura 2.1 Fereastra Data Editor – Foaia Variable View pentru baza de date: Jeans.sav.
Astfel baza de date ce va fii analizata este urmatoarea:
3
Figura 2.2 Fereastra Data Editor – Foaia Data View pentru baza
4
CAPITOLUL III
Verificarea bazei de date
3.1.Depistarea outlierilor
Outlierile reprezintă valorile aberante înregistrate la nivelul unui eşantion şi se pot

depista pe baza graficelor care verifică normalitatea distribuţiilor variabilelor.
Pentru această analiză se vor analiza ca variabile numerice preţul jeansului şi
cantitatea pe care studenţii sunt dispuşi să o achiziţioneze într-un an, iar ca variabile
nominale sexul şi firma jeansului preferata.
Outlierile se pot depista în cazul variabilelor numerice, iar valorile acestora se vor
depista astfel: Graphs – Q-Q Plot – în fereastra Chart Editor butonul Point Id, sau
urmând demersul Analyze – Descriptive Statistics – Explore – Plots, outlierile fiind
depistate implicit.
Figura 3.1. Selectarea opţiunii Analyze – Descriptive Statistics - Explore
5
Pentru variabila”Pret” :
0
N= 35
Pretul jeansului
Figura 3.2 Diagrama Boxplot pentru variabila „Preţ”
Interpretare: Aşa cum se observă, nu există valori aberante.
6
Pentru variabila „Cantitate”:
În cazul acestei variabile în fereastra Explore se înlocuieşte în Dependent List
variabila „Preţ” cu variabila „Cantitate” şi se obţine următorul rezultat:
4.5
4.0 9
12
3.5
3.0 5
13
16
33
2.5
2.0
1.5
1.0
.5
N= 35
Numarul de jeansi cu
Figura 3.3 Diagrama Boxplot pentru variabila „Cantitate”

Interpretare: De asemenea, se poate observa că şi în cazul variabilei „Cantitate” nu
există outlieri.
7
3.2.Verificarea normalităţii distribuţiilor
Pentru a verifica normalitatea distribuţiilor variabilelor „Preţ” şi „Cantitate” se

folosesc procedeele grafice Q-Q Plot, P-P Plot, Boxplot, histograma, testul Kolmogorov-
Smirnov-Lilliefors.
Pentru a putea depista şi outlierile se va folosi procedeul Q-Q Plot. Q-Q Plot
compară valorile ordonate ale variabilei observate cu valorile quantilice ale distribuţieie
teoretice specificate (în acest caz distribuţia normală). Dacă distribuţia variabilei testate
este normală, atunci punctele Q-Q conturează o linie care se suprapune cu dreapta care
reprezintă distribuţia teoretică, adică trece prin origine şi are panta egală cu 1.
Pentru acesta se va urmări demersul: Graphs – Q-Q Plot – la Variables se
introduce variabila de analizat, iar la Test Distribution se alege Normal. Pentru cele două
variabile numerice rezultatele sunt următoarele:
Figura 3.4 Selectarea opţiunii Graphs – Q-Q Plots
8
Figura 3.5 Selectarea variabilelor de analizat pentru „Pret” :
Normal Q-Q Plot of Pretul jeansului

6
4
Expected Normal Value
0
0 1 2 3 4 5 6 7
Observed Value
Figura 3.6 Q-Q Plot pentru variabila „Preţ”
9
Interpretare: Se observă că punctele nu sunt serios deviate de la linia dreaptă,
ceea ce indică o distribuţie normală.
Pentru „Cantitate”:
Normal Q-Q Plot of Numarul de jeansi cumparat pe an

3.5
3.0
2.5
Expected Normal Value
2.0
1.5
1.0
.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5
Observed Value
Figura 3.7 Q-Q Plot pentru variabila „Cantitate”
Interpretare: Se observă că punctele nu sunt serios deviate de la linia dreaptă,

ceea ce indică o distribuţie normală.
10
CAPITOLUL IV
Analiza statistică univariată a datelor
4.1. Descrierea statistică a variabilelor nominale
Cele două variabile nominale ce vor fi analizate sunt sexul persoanei chestionate
şi firma de jeansi folosita.Pentru a descrie aceste variabile se vor urma paşii: meniul
Analyze – Descriptive Statistics – Frequencies – Statistics (unde la Central Tendency se
bifează Mode) şi Charts (unde la Chart Type se bifează Pie sau Bar, iar la Chart Value
Frequencies sau Percentages). Astfel, se obţin următoarele rezultate:
11
Figura 4.1 Selectarea variabilelor şi a indicatorilor
Pentru variabila „Sexul persoanei” chestionate se obţin rezultatele:

Sexul persoanei
Cumulative
Frequency Percent Valid Percent Percent
Valid F 21 60.0 60.0 60.0
M 14 40.0 40.0 100.0
Total 35 100.0 100.0
Tabelul 4.1 Sexul persoanei
Sexul persoanei
12
Figura 4.2 Diagrama Pie pentru variabila „Sexul persoanei”
Interpretare: Se observă şi din tabel şi din grafic că proporţie persoanelor de sex feminin
din eşantion este de 60%, iar cea a persoanelor de sex masculin este de 40%
Pentru variabila „Firma jeansului”:
Firma jeansului
Cumulative
Valid Bazar 10 28.6 28.6 28.6
D&G 5 14.3 14.3 42.9
Kenvelo 14 40.0 40.0 82.9
Levis 2 5.7 5.7 88.6
Motor 4 11.4 11.4 100.0
Total 35 100.0 100.0
Firma jeansului
Motor
Levis Bazar
D&G
Kenvelo
Figura 4.3 Diagrama Pie pentru variabila „Firma jeansului”
Interpretare: Se observă atât din tabel cât şi din grafic proporţiile firmelor de
jeansi: MOTOR(11.4%), LEVIS(5.7%), KENVELO(40.0%), D&G(14.3%),
BAZAR(28.6%).
13
4.2 Descrierea statistică a variabilelor numerice
În cazul variabilelor numerice se foloseşte acelaşi demers ca în cazul variabilelor

nominale, cu diferenţa că se bifează toţi indicatorii din Statistics, iar la Charts se bifează
Histograms. Astfel, se obtin următoarele rezultate:
14
Figura 4.4 Prezentarea demersului
Statistics
Numarul de
jeansi
Pretul cumparat pe
jeansului an
N Valid 35 35
Missing 0 0
Mean 3.06 1.97
Std. Error of Mean .272 .133
Median 3.00 2.00
Mode 2 2
Std. Deviation 1.608 .785
Variance 2.585 .617
Skewness .487 .824
Std. Error of Skewness .398 .398
Kurtosis -.829 .992
Std. Error of Kurtosis .778 .778
Range 5 3
Minimum 1 1
Maximum 6 4
15
Pretul jeansului
12
10
4
Frequency
2 Std. Dev = 1.61

Mean = 3.1
0 N = 35.00
1.0 2.0 3.0 4.0 5.0 6.0
Pretul jeansului
Figura 4.5 Histograma pentru variabila „Preţul produsului”

Pentru variabila „Cantitate”:
Numarul de jeansi cumparat pe an

30
20
10
Frequency
Std. Dev = .79

Mean = 2.0
0 N = 35.00
1.0 2.0 3.0 4.0
Numarul de jeansi cumparat pe an
Figura 4.6 Histograma pentru variabila „Cantitate”
16
Interpretare: Pentru ambele variabile se citesc în tabel principalii indicatori:
media, mediana, varianţa, modul, valorile minime şi valorile maxime.
CAPITOLUL V
Analiza statistică bivariată a datelor
5.1 Analiza statistică a gradului de asociere între două variabile
Gradul de asociere se poate studia pentru variabilele nominale, în acest caz sexul
persoanei şi firmele jeansului folosite. Gradul de asociere presupune obţinerea tabelului
de asociere, în care sunt prezentate relaţiile dintre variabilele categoriale. În fiecare celulă
a tabelului este prezentată frecvenţa parţială, adică efectivul care poartă simultan o
valoare a fiecărei variabile. Obţinerea acestui tabel presupune următorul demers: Analyze
– Descriptive Statistics – Crosstabs.
17
18
Firma jeansului * Sexul persoanei Crosstabulation
Count
Sexul persoanei
F M Total
Firma Bazar 6 4 10
jeansului D&G 3 2 5
Kenvelo 10 4 14
Levis 1 1 2
Motor 1 3 4
Total 21 14 35
Gradul de asociere se poate testa folosind testul Chi – Square, care se bifează în
Crosstabs: Statistics. Se obţine rezultatul:
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 2.887(a) 4 .577
Likelihood Ratio 2.898 4 .575
N of Valid Cases 35
a 7 cells (70.0%) have expected count less than 5. The minimum expected count is .80.
Interpretare: În eşantionul analizat sunt 6 persoane de sex feminin care folosesc

cu precădere jeansi din BAZAR, 3 jeansi de la firma D&G, 10 de la firma KENVELO, 1
de la firma LEVIS, 1 de la firma MOTOR, persoane de sex masculin care folosesc cu
precădere jeansi 4 din BAZAR, 2 de la firma D&G, 4 de la firma KENVELO, 1 de la
firma LEVIS, si 3 de la firma MOTOR.
5.2 Analiza de regresie şi corelaţie
Analiza de corelaţie presupune măsurarea gradului de intensitate a legăturii dintre

variabilele numerice, precum şi testarea semnificaţiei legăturii. Acest lucru se realizează
urmând paşii: Analyze – Correlate – Bivariate. În cazul celor două variabile numerice
19
studiate (preţul şi numărul de jeansi cumpărati) se obţine următorul output:
Figura 5.2 Prezentarea demersului:
20
Correlations
Numarul de
jeansi
cumparat Pretul
pe an jeansului
Numarul de jeansi Pearson Correlation 1 .514(**)
cumparat pe an Sig. (2-tailed) . .002
N 35 35
Pretul jeansului Pearson Correlation .514(**) 1
Sig. (2-tailed) .002 .
N 35 35
** Correlation is significant at the 0.01 level (2-tailed).
Tabelul 5.3 Correlations
Interpretare: Se observă că s-a obţinut un coeficient de corelaţie Pearson egal cu

0.514, ceea ce înseamnă că între cele două variabile există o corelaţie directa, valoarea
coeficientului fiind apropiata de unu.
Testarea semnificaţiei coeficientului de corelaţie este realizată cu ajutorul testului
t. Valoarea Sig. corespunzătoare, egală cu 0.002, evidenţiază că s-a obţinut un coeficient
de corelaţie semnificativ la un prag de 0.002, adică sunt şanse mai mici de 1% (α = 0.01)
de a gresi in a afirma ca intre cele doua variabile exista o corelatie semnificativa.
Analiza de regresie presupune aproximarea modelului de regresie, estimarea şi
testarea parametrilor modelului de regresie. Între cele două variabile numerice se poate
stabili o legătură liniară dată prin ecuaţia de regresie liniară simplă, care are forma:
Yi = α + Βxi + εi
în care:
Y – variabila dependentă (numărul de jeansi)
X – variabila independentă (preţul jeansilor)
ε – variabila aleatorie eroare sau reziduu
Aproximarea modelului de regresie se realizează prin Scatterplot (din meniul
Graphs - Interactive).
21
22
Se optine outputul:
  
6 Linear Regression
 
5
Pretul j eansului = 0.98 + 1.05 * cantit
R-Square = 0.26
Pretul jeansului

4
3  
2   
1  
1 2 3 4
Numarul de j ea nsi cumparat pe an
23
Figura 5.4 Regresia între „Numărul de jeansi” şi „Preţul jeansului”
Estimarea parametrilor modelului de regresie presupune parcurgerea demersului:

Analyze – Regession – Linear, prin care se deschide fereastra de dialog Linear Regession.
Urmând paşii necesari, în output se analizează Model Summary, ANOVA, Coefficients.
24
25
Tabelul Model Summary prezintă valoarea coeficientului de corelaţie R, valoarea
raportului de determinaţie R2 şi eroarea standard a estimaţiei.
Tabelul 5.4 Model Summary
Adjusted R Std. Error of

Model R R Square Square the Estimate
1 .514(a) .264 .242 .684
a Predictors: (Constant), Pretul jeansului
Interpretare: Valoarea lui R este 0.514, ceea ce indică faptul că între cele două
variabile există o legătură directă. Valoarea lui R2 este 0.264, ceea ce indică faptul că
26.4% din variaţia variabilei Y este explicată prin variaţia variabilei X. Aceasta este o
valoare destul de mică, ceea ce înseamnă că modelul ales nu explică foarte bine legătura
dintre variabile.
Tabelul Regession ANOVA prezintă rezultatele analizei varianţei
variabilei dependente sub influenţa factorului de regresie şi a factorului reziduu. Prezintă
informaţii asupra sumei pătratelor abaterilor variabilei dependente, gradele de libertate,
estimaţiile varianţelor datorate celor două surse de variaţie, raportul F şi Sig.
Tabelul 5.5 ANOVA(b)
Sum of
Model Squares df Mean Square F Sig.
1 Regressio
5.536 1 5.536 11.835 .002(a)
n
Residual 15.436 33 .468
Total 20.971 34
a Predictors: (Constant), Pretul jeansului
b Dependent Variable: Numarul de jeansi cumparat pe an
26
Interpretare: În cazul variabilelor considerate, valoarea Sig. pentru F este mai
mică decât 0.05, fiind 0.02, prin urmare relatia liniară dintre cele două variabile
considerate este semnificativă.
Tabelul Coefficients prezintă coeficienţii nestandardizaţi ai modelului de regresie
estimat, erorile standard ale acestora, coeficienţii de regresie standardizaţi cu erorile
standard corespunzătoare, precum şi valorile statisticii test t şi valorile Sig.
corespunzătoare.
Interpretare: Pentru o încredere de 95% se observă că în cazul ambilor

coeficienţi valoarea lui Sig. este mai mică decât 0.05, ceea ce înseamnă că aceştia sunt
semnificativ diferiţi de 0. Astfel, ecuaţia de regresie are următoarea formă:
Y =1.204+ 0.251 X
27
CAPITOLUL VI
Estimarea şi testarea statistică
Estimarea este procedeul prin care se generalizează rezultatele observate pe un

eşantion, la nivelul populaţiei din care este extras, adică se află valoarea unui parametru
al unei populaţii pe baza datelor înregistrate la nivelul unui eşantion extras din aceasta.
Estimarea poate fi punctuală sau prin interval de încredere. În acest caz se va
estima prin interval de încredere.
6.1 Estimarea parametrilor prin interval de încredere
. Acest lucru presupune aflarea limitelor de încredere ale unui interval care
acoperă valoarea adevărată a unui parametru al populaţiei (media sau proporţia în acest
caz). Calculul intervalului de încredere pentru o medie sau pentru o proporţie presupune
parcurgerea următorilor paşi:
 Calculul valorii tipice de sondaj (media sau proporţia);
 Determinarea variabilităţii estimatorului considerat;
 Alegerea intervalului de încredere (95% şi 99%);
 Calculul limitelor intervalului de încredere.
28
6.1.1 Estimarea prin interval de încredere a unei medii şi a unei proporţii
În cazul mediei SPSS calculează valoarea tipică de sondaj, scorul Z

corespunzător, eroarea standard a mediei, limita inferioară şi limita superioară a
intervalului de încredere. Pentru baza de date Jeans.sav se va calcula media jeansilor
vanduti in perioada de un an de zile şi intervalul de încredere corespunzător. Pentru
aceasta se parcurge demersul: meniul Analyze – Descriptives Statistics – Explore. Se
stabileşte nivelul de încredere de 95%, şi apoi de 99%.
29
30
Interpretare: Se poate spune cu o încredere de 95% că numărul jeansilor cumparati in
perioada de un an de zile este cuprins între 1.70 şi 2.24.
- nivelul de încredere: 99%
Tabelul 6.3 Case Processing Summary
Cases
Valid Missing Total
N Percent N Percent N Percent
Numarul de jeansi
cumparat pe an 35 100.0% 0 .0% 35 100.0%
Tabelul 6.4 Descriptives
Statistic Std. Error

Numarul de jeansi Mean 1.97 .133
cumparat pe an 99% Confidence Lower Bound 1.61
Interval for Mean Upper Bound
2.33
5% Trimmed Mean 1.91

Median 2.00
Variance .617
Std. Deviation .785
Minimum 1
Maximum 4
Range 3
Interquartile Range 1.00
Skewness .824 .398
Kurtosis .992 .778
31
Interpretare: Se poate spune cu o încredere de 99% că numărul jeansilor
cumparati in perioada de un an de zile este cuprins între 1.61şi 2.33
Cazul proporţiei.
SPSS nu calculează direct intervalul de încredere pentru o proporţie. Estimarea
intervalului de încredere presupune efectuarea mai multor operaţii, şi anume:
 calculul estimaţiei proporţiei, prin demersul Analyze – Descriptive
Statistics – Frequencies. După selectarea variabilei se bifează Display
frequency tables;
 se află valoarea variabilei Z pentru intervalul de încredere considerat.
Pentru un nivel de încredere de 95%, Z = 1.96; pentru un nivel de
încredere de 99%, Z = 2.55;
 se calculează eroarea standard Sp = s/n, unde s= f(1 – f) este abaterea
standard, iar n este volumul eşantionului;
 se calculează limitele intervalului folosind formula f ± 1.96S p, respectiv f
± 2.55Sp.
Urmând aceşti paşi se va estima proporţia persoanelor de sex feminin care
cumpără produse cosmetice.
32
Frequencies
Statistics
Sexul persoanei
N Valid 35
Missin
0
g
Sexul persoanei
Cumulative
Valid F 21 60.0 60.0 60.0
M 14 40.0 40.0 100.0
Total 35 100.0 100.0
Figura 6.3 Tabelele 6.5 Statistics şi 6.6 Sexul persoanei
Interpretare: Se observă că proporţia persoanelor de sex feminin este de 60%.
33
Calculul erorii Sp: pentru f = 60%, înlocuind în formula prezentată mai sus se
obţine valoarea 0.082.
Calculul limitelor intervalului de încredere:
 pentru z = 1.96, se obţine:
Li = f – 1.96*SP = 0.6 – 1.96*0.082 = 0.439

Ls = f + 1.96*Sp = 0.6 + 1.96*0.082 = 0.760
Interpretare: Ne putem aştepta, cu o încredere de 95%, ca procentul persoanelor
de sex feminin care cumpara jeansi să fie cuprins între 43.9% şi 76%.
 Pentru z = 2.55, se obţine:
Li = f – 2.55*0.082 = 0.6 – 2.55*0.082 = 0.391

Ls = f + 2.55*0.082 = 0.6 + 2.55*0.082 = 0.809
Interpretare: Ne putem aştepta, cu o încredere de 99%, ca procentul persoanelor
de sex feminin care cumpara jeansi să fie cuprins între 39.1% şi 80.9%.
6.2 Testarea statistică
Testele asupra mediilor, respectiv a proporţiilor, sunt folosite pentru a verifica

dacă o medie sau o proporţie diferă semnificativ de o valoare specificată (ipotetică) sau
pentru a compara două sau mai multe medii sau proporţii între ele pentru a testa dacă
există diferenţe semnificative între ele.
6.2.1 Testarea unei medii şi a unei proporţii
Testarea mediei.
Testarea mediei cu o valoare specificată se realizează utilizând procedeul One-
Sample T Test. Acest lucru presupune parcurgerea demersului: Analyze – Compare
Means – One-Sample T Test. Se va analiza dacă numărul mediu al jeansilor cumparati de
o persoană în decurs de un an diferă sau nu de 0.
34
Se obţine outputul:
35
One-Sample Statistics
Std. Error
N Mean Std. Deviation Mean
Numarul de jeansi
cumparat pe an 35 1.97 .785 .133
One-Sample Test
Test Value = 0
95% Confidence Interval
of the Difference
Mean
t df Sig. (2-tailed) Difference Lower Upper
Numarul de jeansi
cumparat pe an 14.850 34 .000 1.97 1.70 2.24
Figura 6.5 Tabelele 6.7 One-Sample Statistics şi 6.8 One-Sample Test
Interpretare: Valoarea medie observată este1.97; valoarea specificată este 0;

diferenţa dintre valoarea medie observată şi valoarea ipotetică este 1.97. Având în vedere
că valoarea Sig. < 0.05, între valoarea medie observată şi valoarea ipotetică există
diferenţe semnificative.
Testarea proporţiei.
Pentru realizarea acestui lucru se foloseşte Binomial Test. Acesta este un procedeu
prin carese testează ipoteze cu privire la o variabilă cu distribuţie binomială, variabilă
care poate lua doar două valori, cum ar fi sexul persoanelor.Binomial Test este folosit
pentru a compara o proporţie cu o valoare specificată şi presupune parcurgerea
demersului: Analyze – Nonparametric Tests – Binomial. Se va verifica dacă proporţia
uneia din cele două grupe de persoane definite prin variabila „sexul persoanei”, masculin
şi feminin diferă semnificativ de 0.50. În Test Variable List se introduce variabila „Sexul
persoanei”.
36
Binomial Test
Observed Asymp. Sig.

Category N Prop. Test Prop. (2-tailed)
37
SEXPERS Group 1 .00 21 .60 .50 .311(a)
Group 2 1.00 14 .40
Total 35 1.00
a Based on Z Approximation.
Interpretare: Proporţia observată în eşantion pentru grupa 1 (feminin) este de

60%, proporţia specificată este 50%. Valoarea Sig. asociată testului este mai mare decât
0.05; astfel se poate concluziona cu o încredere de 95% că proporţia persoanelor de sex
feminin în eşantion nu diferă semnificativ de proporţia specificată de 50%.
6.2.2 Testarea diferenţei dintre două medii şi două proporţii
Testarea diferenţei dintre două medii.

Acest lucru est echivalent cu a testa egalitatea mediilor a două eşantionae
independente. Testarea se realizează cu ajutorul testului Independent-Samples T Test.
Demersul este: Analyze – Compare Means – Independent-Samples T Test. Se va testa
dacă numărul mediu al jeansilor cumpărati pe an este acelaşi pe cele două categorii de
persoane: masculin şi feminin.
38
Group Statistics
Std. Error
Sexul persoanei N Mean Std. Deviation Mean
Numarul de jeansi M 14 2.07 .997 .267
cumparat pe an F 21 1.90 .625 .136
Figura 6.8 Tabelele 6.10 Group Statistics şi 6.11 Independent Samples Test
39
Interpretare: Întrucât nivelul de semnificaţie observat pentru acest test este mai
mare decât pragul α = 0.05 (0.199), se folosesc varianţe reunite . În acest caz testul t este
egal cu 0.557 cu o probabilitate Sig. de 0.584 >0.05, ceea ce arată că mediile numarului
de jeansi cumparati pe an pentru cele două grupe (2,07 pentru maculin şi 1.90 pentru
feminin) nu diferă semnificativ. La aceeaşi concluzie se poate ajunge analizând şi limitele
intervalului de încredere, care conţine valoarea 0.
Testarea diferenţei dintre două proporţii.

Acest lucru presupune folosirea testului Chi-Square, urmând demersul: Analyze –
Nonparametric Tests – Chi-Square Test. Se va verifica dacă proporţia persoanelor de sex
feminin este egală cu proporţia persoanelor de sex masculin.
40
SEXPERS
Observed N Expected N Residual

.00 21 17.5 3.5
1.00 14 17.5 -3.5
Total 35
Test Statistics
SEXPERS
Chi-
1.400
Square(a)
df 1
Asymp. Sig. .237
a 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 17.5.
41
Interpretare: Se observă că sunt 21 de persoane de sex feminin şi 14 de sex
masculin. Conform ipotezei de nul (de egalitate a proporţiilor), pentru fiecare categorie ar
trebui să fie câte 17.5 persoane. În tabelul Chi-Square Test valoarea semnificaţiei este
mai mare decât 0.05 şi, prin urmare se acceptă ipoteza de nul.
CONCLUZII
În urma realizării anchetei privind cererea de jeansi in Complexul studenţesc

Puschin, in Targusor, si in caminele de medicina de pe strada Sarariei, se poate
concluziona că aceasta este relativ constantă, depinzând în oarecare măsură de preţul
acestora. De asemenea se observă că la nivelul întregii populaţii nu există diferenţe
semnificative între proporţia persoanelor de sex feminin care cumpara jeansi şi proporţia
persoanelor de sex masculin, întrucât multe dintre produse reprezintă o necesitate.
42
BIBLIOGRAFIE
 Jaba, Elisabeta, Statistica, ediţia a III-a, Editura Economică, Bucureşti,

2002;
 Jaba, Elisabeta; Grama, Ana, Analiza statistică cu SPSS sub Windows,

Editura Polirom, 2004
43
Anexa 1
1. Care este vârsta dumneavoastră?

.......
2. Sexul persoanei:
o M o F
3. În ce an de studiu sunteţi?
o 1 o 4
o 2 o 5
o 3 o 6
4. De ce venit lunar dispuneţi?

o <3000000
o 3000000 – 7000000
o >7000000
5. Ce firma de jeansi preferati sa va cumparati?

o Din BAZAR o LEVIS
o KENVELO o MOTOR
o D&G
6. Câte perechi de jeansi va cumparati pe parcursul perioadei de un an?

o 1 o 3
o 2 o 4
44
7. Ce preţ sunteţi dispus să plătiţi pentru o pereche de jeansi?
o <100000
o 100000 – 200000
o 200000 – 300000
o >300000
45
0

Proiect SPSS

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Proiect SPSS

Încărcat de

Drepturi de autor:

Formate disponibile

Specializarea: Statistică şi previziuni economice

O cere ridicata de jeansi se inregistreaza in randul tinerilor mai ales a studentilor

2.2.Definirea variabilelor şi introducerea datelor în SPSS

Atributele acestor variabile sunt definite în fereastra Data Editor – Foaia

Astfel baza de date ce va fii analizata este urmatoarea:

Outlierile reprezintă valorile aberante înregistrate la nivelul unui eşantion şi se pot

Figura 3.1. Selectarea opţiunii Analyze – Descriptive Statistics - Explore

Figura 3.2 Diagrama Boxplot pentru variabila „Preţ”

Interpretare: Aşa cum se observă, nu există valori aberante.

Figura 3.3 Diagrama Boxplot pentru variabila „Cantitate”

Pentru a verifica normalitatea distribuţiilor variabilelor „Preţ” şi „Cantitate” se

Figura 3.4 Selectarea opţiunii Graphs – Q-Q Plots

Normal Q-Q Plot of Pretul jeansului

Figura 3.6 Q-Q Plot pentru variabila „Preţ”

Normal Q-Q Plot of Numarul de jeansi cumparat pe an

Figura 3.7 Q-Q Plot pentru variabila „Cantitate”

Interpretare: Se observă că punctele nu sunt serios deviate de la linia dreaptă,

Pentru variabila „Sexul persoanei” chestionate se obţin rezultatele:

Figura 4.3 Diagrama Pie pentru variabila „Firma jeansului”

În cazul variabilelor numerice se foloseşte acelaşi demers ca în cazul variabilelor

2 Std. Dev = 1.61

Figura 4.5 Histograma pentru variabila „Preţul produsului”

Numarul de jeansi cumparat pe an

Std. Dev = .79

Numarul de jeansi cumparat pe an

Figura 4.6 Histograma pentru variabila „Cantitate”

Interpretare: În eşantionul analizat sunt 6 persoane de sex feminin care folosesc

5.2 Analiza de regresie şi corelaţie

Analiza de corelaţie presupune măsurarea gradului de intensitate a legăturii dintre

Figura 5.2 Prezentarea demersului:

Interpretare: Se observă că s-a obţinut un coeficient de corelaţie Pearson egal cu

Numarul de j ea nsi cumparat pe an

Estimarea parametrilor modelului de regresie presupune parcurgerea demersului:

Tabelul 5.4 Model Summary

Adjusted R Std. Error of

a Predictors: (Constant), Pretul jeansului

Tabelul 5.5 ANOVA(b)

Interpretare: Pentru o încredere de 95% se observă că în cazul ambilor

Estimarea este procedeul prin care se generalizează rezultatele observate pe un

6.1 Estimarea parametrilor prin interval de încredere

În cazul mediei SPSS calculează valoarea tipică de sondaj, scorul Z

Tabelul 6.3 Case Processing Summary

Tabelul 6.4 Descriptives

Statistic Std. Error

5% Trimmed Mean 1.91

Figura 6.3 Tabelele 6.5 Statistics şi 6.6 Sexul persoanei

Interpretare: Se observă că proporţia persoanelor de sex feminin este de 60%.

 pentru z = 1.96, se obţine:

Li = f – 1.96*SP = 0.6 – 1.96*0.082 = 0.439

 Pentru z = 2.55, se obţine:

Li = f – 2.55*0.082 = 0.6 – 2.55*0.082 = 0.391

6.2 Testarea statistică

Testele asupra mediilor, respectiv a proporţiilor, sunt folosite pentru a verifica

6.2.1 Testarea unei medii şi a unei proporţii

Figura 6.5 Tabelele 6.7 One-Sample Statistics şi 6.8 One-Sample Test

Interpretare: Valoarea medie observată este1.97; valoarea specificată este 0;

Observed Asymp. Sig.

Interpretare: Proporţia observată în eşantion pentru grupa 1 (feminin) este de

6.2.2 Testarea diferenţei dintre două medii şi două proporţii

Testarea diferenţei dintre două medii.

Testarea diferenţei dintre două proporţii.

Observed N Expected N Residual

În urma realizării anchetei privind cererea de jeansi in Complexul studenţesc

 Jaba, Elisabeta, Statistica, ediţia a III-a, Editura Economică, Bucureşti,

Li = f – 1.96SP = 0.6 – 1.960.082 = 0.439

Li = f – 2.550.082 = 0.6 – 2.550.082 = 0.391