Documente Academic
Documente Profesional
Documente Cultură
Coordonator: Student:
Prof. D. VIORICA
Anul III, grupa 2
IAŞI
- 2006-
CUPRINS
CUPRINS............................................................................................................................1
CAPITOLUL I.....................................................................................................................2
Introducere...........................................................................................................................2
1.1.Definirea problemei...................................................................................................2
1.2.Obiectivul proiectului................................................................................................2
CAPITOLUL II...................................................................................................................2
Construirea bazei de date.....................................................................................................2
2.1.Alegerea variabilelor analizate..................................................................................2
2.2.Definirea variabilelor şi introducerea datelor în SPSS..............................................3
CAPITOLUL III..................................................................................................................5
Verificarea bazei de date.....................................................................................................5
3.1.Depistarea outlierilor.................................................................................................5
3.2.Verificarea normalităţii distribuţiilor.........................................................................8
CAPITOLUL IV................................................................................................................11
Analiza statistică univariată a datelor................................................................................11
4.1. Descrierea statistică a variabilelor nominale..........................................................11
4.2 Descrierea statistică a variabilelor numerice...........................................................14
CAPITOLUL V.................................................................................................................17
Analiza statistică bivariată a datelor..................................................................................17
5.1 Analiza statistică a gradului de asociere între două variabile..................................17
5.2 Analiza de regresie şi corelaţie................................................................................19
CAPITOLUL VI................................................................................................................28
Estimarea şi testarea statistică...........................................................................................28
6.1 Estimarea parametrilor prin interval de încredere....................................................28
6.1.1 Estimarea prin interval de încredere a unei medii şi a unei proporţii.............28
6.2 Testarea statistică.....................................................................................................34
6.2.1 Testarea unei medii şi a unei proporţii.............................................................34
6.2.2 Testarea diferenţei dintre două medii şi două proporţii..................................38
CONCLUZII......................................................................................................................42
BIBLIOGRAFIE................................................................................................................43
Anexa 1..............................................................................................................................44
1
CAPITOLUL I
Introducere
1.1.Definirea problemei
Piata jeansilor se diversifica mereu pentru ca apar firme noi care produc jeansi,
modelele
satisfac nevoile tinerilor sau a tuturor persoanelor care poarta blugi in general prin
calitate sporita a produsului sau prin forma lor diferita conform stilului care se poarta in
momentul actual, culoarea si textura difera deasemenea de la firma la firma.
Printre firmele renumite de blugi se numara si nume precum: LEVIS, MOTOR,
KENVELO, B&G.
Nu toata lumea si le permite sunt si firme fantoma care fabrica jeansi si sunt la un
prêt mai accesibil, aproape oricine isi permite sa-si cumpere asemenea produse ce pot fii
gasite in orice magazin cu preturi accesibile tuturor sau in bazare.
1.2.Obiectivul proiectului
CAPITOLUL II
Construirea bazei de date
2.1.Alegerea variabilelor analizate
2
Pentru a putea analiza problema considerate s-a aplicat un chestionar (Anexa 1)
unui esantion de 35 de persoanae, studenti, in Compexul Studentesc Puschin: C5, C6, C7,
C8, C9. si in caminele de medicina de pe strada Sarariei 1 MAI A si B, cat si in Targusor
in caminele: C1, C2, C3, C4. Chestionarul a presupus răspunderea la un set de întrebări
referitoare la vârstă,anul de studiu, preferinţa pentru o anumită firma de jeansi conform
preferintelor, venitul lunar al studentului, preţul pe care acesta este dispus sa îl plătească
pentru un produs cosmetic şi cantitatea de produse cosmetice cumpărate.
Variabilele ce vor constitui baza de date din SPSS vor fi: vârsta, sexul persoanei,
venitul, firma jeansilor, preţul acestora şi cantitatea. Acestea vor constitui baza de date
Jeans.sav.
Figura 2.1 Fereastra Data Editor – Foaia Variable View pentru baza de date: Jeans.sav.
3
Figura 2.2 Fereastra Data Editor – Foaia Data View pentru baza
4
CAPITOLUL III
Verificarea bazei de date
3.1.Depistarea outlierilor
5
Pentru variabila”Pret” :
0
N= 35
Pretul jeansului
6
Pentru variabila „Cantitate”:
În cazul acestei variabile în fereastra Explore se înlocuieşte în Dependent List
variabila „Preţ” cu variabila „Cantitate” şi se obţine următorul rezultat:
4.5
4.0 9
12
3.5
3.0 5
13
16
33
2.5
2.0
1.5
1.0
.5
N= 35
Numarul de jeansi cu
7
3.2.Verificarea normalităţii distribuţiilor
8
Figura 3.5 Selectarea variabilelor de analizat pentru „Pret” :
4
Expected Normal Value
0
0 1 2 3 4 5 6 7
Observed Value
9
Interpretare: Se observă că punctele nu sunt serios deviate de la linia dreaptă,
ceea ce indică o distribuţie normală.
Pentru „Cantitate”:
3.0
2.5
Expected Normal Value
2.0
1.5
1.0
.5 1.0 1.5 2.0 2.5 3.0 3.5 4.0 4.5
Observed Value
10
CAPITOLUL IV
Analiza statistică univariată a datelor
4.1. Descrierea statistică a variabilelor nominale
Cele două variabile nominale ce vor fi analizate sunt sexul persoanei chestionate
şi firma de jeansi folosita.Pentru a descrie aceste variabile se vor urma paşii: meniul
Analyze – Descriptive Statistics – Frequencies – Statistics (unde la Central Tendency se
bifează Mode) şi Charts (unde la Chart Type se bifează Pie sau Bar, iar la Chart Value
Frequencies sau Percentages). Astfel, se obţin următoarele rezultate:
11
Figura 4.1 Selectarea variabilelor şi a indicatorilor
Cumulative
Frequency Percent Valid Percent Percent
Valid F 21 60.0 60.0 60.0
M 14 40.0 40.0 100.0
Total 35 100.0 100.0
Tabelul 4.1 Sexul persoanei
Sexul persoanei
12
Figura 4.2 Diagrama Pie pentru variabila „Sexul persoanei”
Interpretare: Se observă şi din tabel şi din grafic că proporţie persoanelor de sex feminin
din eşantion este de 60%, iar cea a persoanelor de sex masculin este de 40%
Pentru variabila „Firma jeansului”:
Firma jeansului
Cumulative
Frequency Percent Valid Percent Percent
Valid Bazar 10 28.6 28.6 28.6
D&G 5 14.3 14.3 42.9
Kenvelo 14 40.0 40.0 82.9
Levis 2 5.7 5.7 88.6
Motor 4 11.4 11.4 100.0
Total 35 100.0 100.0
Firma jeansului
Motor
Levis Bazar
D&G
Kenvelo
Interpretare: Se observă atât din tabel cât şi din grafic proporţiile firmelor de
jeansi: MOTOR(11.4%), LEVIS(5.7%), KENVELO(40.0%), D&G(14.3%),
BAZAR(28.6%).
13
4.2 Descrierea statistică a variabilelor numerice
14
Figura 4.4 Prezentarea demersului
Statistics
Numarul de
jeansi
Pretul cumparat pe
jeansului an
N Valid 35 35
Missing 0 0
Mean 3.06 1.97
Std. Error of Mean .272 .133
Median 3.00 2.00
Mode 2 2
Std. Deviation 1.608 .785
Variance 2.585 .617
Skewness .487 .824
Std. Error of Skewness .398 .398
Kurtosis -.829 .992
Std. Error of Kurtosis .778 .778
Range 5 3
Minimum 1 1
Maximum 6 4
15
Pretul jeansului
12
10
4
Frequency
Pretul jeansului
20
10
Frequency
16
Interpretare: Pentru ambele variabile se citesc în tabel principalii indicatori:
media, mediana, varianţa, modul, valorile minime şi valorile maxime.
CAPITOLUL V
Analiza statistică bivariată a datelor
5.1 Analiza statistică a gradului de asociere între două variabile
Gradul de asociere se poate studia pentru variabilele nominale, în acest caz sexul
persoanei şi firmele jeansului folosite. Gradul de asociere presupune obţinerea tabelului
de asociere, în care sunt prezentate relaţiile dintre variabilele categoriale. În fiecare celulă
a tabelului este prezentată frecvenţa parţială, adică efectivul care poartă simultan o
valoare a fiecărei variabile. Obţinerea acestui tabel presupune următorul demers: Analyze
– Descriptive Statistics – Crosstabs.
17
Figura 5.1 Prezentarea demersului
18
Firma jeansului * Sexul persoanei Crosstabulation
Count
Sexul persoanei
F M Total
Firma Bazar 6 4 10
jeansului D&G 3 2 5
Kenvelo 10 4 14
Levis 1 1 2
Motor 1 3 4
Total 21 14 35
Gradul de asociere se poate testa folosind testul Chi – Square, care se bifează în
Crosstabs: Statistics. Se obţine rezultatul:
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 2.887(a) 4 .577
Likelihood Ratio 2.898 4 .575
N of Valid Cases 35
a 7 cells (70.0%) have expected count less than 5. The minimum expected count is .80.
19
studiate (preţul şi numărul de jeansi cumpărati) se obţine următorul output:
20
Correlations
Numarul de
jeansi
cumparat Pretul
pe an jeansului
Numarul de jeansi Pearson Correlation 1 .514(**)
cumparat pe an Sig. (2-tailed) . .002
N 35 35
Pretul jeansului Pearson Correlation .514(**) 1
Sig. (2-tailed) .002 .
N 35 35
** Correlation is significant at the 0.01 level (2-tailed).
Tabelul 5.3 Correlations
21
22
Figura 5.3 Prezentarea demersului
Se optine outputul:
6 Linear Regression
5
Pretul j eansului = 0.98 + 1.05 * cantit
R-Square = 0.26
Pretul jeansului
4
3
2
1
1 2 3 4
23
Figura 5.4 Regresia între „Numărul de jeansi” şi „Preţul jeansului”
24
Figura 5.5 Prezentarea demersului
25
Tabelul Model Summary prezintă valoarea coeficientului de corelaţie R, valoarea
raportului de determinaţie R2 şi eroarea standard a estimaţiei.
Interpretare: Valoarea lui R este 0.514, ceea ce indică faptul că între cele două
variabile există o legătură directă. Valoarea lui R2 este 0.264, ceea ce indică faptul că
26.4% din variaţia variabilei Y este explicată prin variaţia variabilei X. Aceasta este o
valoare destul de mică, ceea ce înseamnă că modelul ales nu explică foarte bine legătura
dintre variabile.
Tabelul Regession ANOVA prezintă rezultatele analizei varianţei
variabilei dependente sub influenţa factorului de regresie şi a factorului reziduu. Prezintă
informaţii asupra sumei pătratelor abaterilor variabilei dependente, gradele de libertate,
estimaţiile varianţelor datorate celor două surse de variaţie, raportul F şi Sig.
Sum of
Model Squares df Mean Square F Sig.
1 Regressio
5.536 1 5.536 11.835 .002(a)
n
Residual 15.436 33 .468
Total 20.971 34
a Predictors: (Constant), Pretul jeansului
b Dependent Variable: Numarul de jeansi cumparat pe an
26
Interpretare: În cazul variabilelor considerate, valoarea Sig. pentru F este mai
mică decât 0.05, fiind 0.02, prin urmare relatia liniară dintre cele două variabile
considerate este semnificativă.
Tabelul Coefficients prezintă coeficienţii nestandardizaţi ai modelului de regresie
estimat, erorile standard ale acestora, coeficienţii de regresie standardizaţi cu erorile
standard corespunzătoare, precum şi valorile statisticii test t şi valorile Sig.
corespunzătoare.
27
CAPITOLUL VI
Estimarea şi testarea statistică
. Acest lucru presupune aflarea limitelor de încredere ale unui interval care
acoperă valoarea adevărată a unui parametru al populaţiei (media sau proporţia în acest
caz). Calculul intervalului de încredere pentru o medie sau pentru o proporţie presupune
parcurgerea următorilor paşi:
Calculul valorii tipice de sondaj (media sau proporţia);
Determinarea variabilităţii estimatorului considerat;
Alegerea intervalului de încredere (95% şi 99%);
Calculul limitelor intervalului de încredere.
28
6.1.1 Estimarea prin interval de încredere a unei medii şi a unei proporţii
29
30
Interpretare: Se poate spune cu o încredere de 95% că numărul jeansilor cumparati in
perioada de un an de zile este cuprins între 1.70 şi 2.24.
- nivelul de încredere: 99%
Cases
Valid Missing Total
N Percent N Percent N Percent
Numarul de jeansi
cumparat pe an 35 100.0% 0 .0% 35 100.0%
31
Interpretare: Se poate spune cu o încredere de 99% că numărul jeansilor
cumparati in perioada de un an de zile este cuprins între 1.61şi 2.33
Cazul proporţiei.
SPSS nu calculează direct intervalul de încredere pentru o proporţie. Estimarea
intervalului de încredere presupune efectuarea mai multor operaţii, şi anume:
calculul estimaţiei proporţiei, prin demersul Analyze – Descriptive
Statistics – Frequencies. După selectarea variabilei se bifează Display
frequency tables;
se află valoarea variabilei Z pentru intervalul de încredere considerat.
Pentru un nivel de încredere de 95%, Z = 1.96; pentru un nivel de
încredere de 99%, Z = 2.55;
se calculează eroarea standard Sp = s/n, unde s= f(1 – f) este abaterea
standard, iar n este volumul eşantionului;
se calculează limitele intervalului folosind formula f ± 1.96S p, respectiv f
± 2.55Sp.
Urmând aceşti paşi se va estima proporţia persoanelor de sex feminin care
cumpără produse cosmetice.
32
Figura 6.2 Prezentarea demersului
Frequencies
Statistics
Sexul persoanei
N Valid 35
Missin
0
g
Sexul persoanei
Cumulative
Frequency Percent Valid Percent Percent
Valid F 21 60.0 60.0 60.0
M 14 40.0 40.0 100.0
Total 35 100.0 100.0
33
Calculul erorii Sp: pentru f = 60%, înlocuind în formula prezentată mai sus se
obţine valoarea 0.082.
Calculul limitelor intervalului de încredere:
Testarea mediei.
Testarea mediei cu o valoare specificată se realizează utilizând procedeul One-
Sample T Test. Acest lucru presupune parcurgerea demersului: Analyze – Compare
Means – One-Sample T Test. Se va analiza dacă numărul mediu al jeansilor cumparati de
o persoană în decurs de un an diferă sau nu de 0.
34
Figura 6.4 Prezentarea demersului
Se obţine outputul:
35
One-Sample Statistics
Std. Error
N Mean Std. Deviation Mean
Numarul de jeansi
cumparat pe an 35 1.97 .785 .133
One-Sample Test
Test Value = 0
95% Confidence Interval
of the Difference
Mean
t df Sig. (2-tailed) Difference Lower Upper
Numarul de jeansi
cumparat pe an 14.850 34 .000 1.97 1.70 2.24
Testarea proporţiei.
Pentru realizarea acestui lucru se foloseşte Binomial Test. Acesta este un procedeu
prin carese testează ipoteze cu privire la o variabilă cu distribuţie binomială, variabilă
care poate lua doar două valori, cum ar fi sexul persoanelor.Binomial Test este folosit
pentru a compara o proporţie cu o valoare specificată şi presupune parcurgerea
demersului: Analyze – Nonparametric Tests – Binomial. Se va verifica dacă proporţia
uneia din cele două grupe de persoane definite prin variabila „sexul persoanei”, masculin
şi feminin diferă semnificativ de 0.50. În Test Variable List se introduce variabila „Sexul
persoanei”.
36
Figura 6.6 Prezentarea demersului
Se obţine outputul:
Binomial Test
37
SEXPERS Group 1 .00 21 .60 .50 .311(a)
Group 2 1.00 14 .40
Total 35 1.00
a Based on Z Approximation.
38
Figura 6.7 Prezentarea demersului
Se obţine outputul:
Group Statistics
Std. Error
Sexul persoanei N Mean Std. Deviation Mean
Numarul de jeansi M 14 2.07 .997 .267
cumparat pe an F 21 1.90 .625 .136
Figura 6.8 Tabelele 6.10 Group Statistics şi 6.11 Independent Samples Test
39
Interpretare: Întrucât nivelul de semnificaţie observat pentru acest test este mai
mare decât pragul α = 0.05 (0.199), se folosesc varianţe reunite . În acest caz testul t este
egal cu 0.557 cu o probabilitate Sig. de 0.584 >0.05, ceea ce arată că mediile numarului
de jeansi cumparati pe an pentru cele două grupe (2,07 pentru maculin şi 1.90 pentru
feminin) nu diferă semnificativ. La aceeaşi concluzie se poate ajunge analizând şi limitele
intervalului de încredere, care conţine valoarea 0.
40
Figura 6.9 Prezentarea demersului
Se obţine outputul:
SEXPERS
Test Statistics
SEXPERS
Chi-
1.400
Square(a)
df 1
Asymp. Sig. .237
a 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 17.5.
41
Interpretare: Se observă că sunt 21 de persoane de sex feminin şi 14 de sex
masculin. Conform ipotezei de nul (de egalitate a proporţiilor), pentru fiecare categorie ar
trebui să fie câte 17.5 persoane. În tabelul Chi-Square Test valoarea semnificaţiei este
mai mare decât 0.05 şi, prin urmare se acceptă ipoteza de nul.
CONCLUZII
42
BIBLIOGRAFIE
43
Anexa 1
2. Sexul persoanei:
o M o F
3. În ce an de studiu sunteţi?
o 1 o 4
o 2 o 5
o 3 o 6
44
7. Ce preţ sunteţi dispus să plătiţi pentru o pereche de jeansi?
o <100000
o 100000 – 200000
o 200000 – 300000
o >300000
45
0