Sunteți pe pagina 1din 11

1. MOTIVATIA TEMEI 2. OBIECTIVUL PROIECTULUI 3. DESCRIEREA INSTRUMENTELOR 4.

ANALIZA SI PRELUCRAREA DATELOR - Definirea variabilelor i introducerea datelor n SPSS - Verificarea bazei de date -Analiza statistic univariat a datelor -Analiza statistic bivariat a datelor -Testarea diferenei dintre dou proporii. 5. CONCLUZII 1. MOTIVATIA TEMEI Piata adidasilor se diversifica mereu aparand firme noi producatoare , de diferite modele menite sa satisfaca gusturile variate ale sportivilor, tineri si batrani, dar si a celor ce-i utilizeaza ca pantof de strada. Pe langa frumusetea modelelor, ei trebuie sa fie si buni din punct de vedere calitativ. Dintre firmele renumite de adidasi amintim: NIKE, ADIDAS, LOTUS, PUMA. Nu isi permite toata lumea sa se incalte cu aceste marci renumite, originale, exista insa diversi producatori de adidasi contrafacuti ce se gasesc pe piata, in Bazar la preturi accesibile tuturor. O cerere ridicata de adidasi de firma exista din partea tinerilor, din randul lor fiind si cei mai multi practicanti de sport, majoritatea studenti, ei cauta produse cat mai frumoase, confortabile si rezistente in timp. Aceste branduri de adidasi: NIKE, ADIDAS, LOTUS si PUMA, se gasesc de obicei in moll-uri sau prin reprezentante si distribuitori in marile orase din tara. 2. OBIECTIVUL PROIECTULUI In cadrul acestui proiect se va incerca analiza modului in care diversi factori (variabile) influenteaza cererea de jeansi in randul studentilor. 3. DESCRIEREA INSTRUMENTELOR Pentru a putea analiza problemele considerate s-a aplicat un chestionar (Anexa 1) unui esantion de 35 de persoanae, studenti, in Compexul Studentesc Regie R1, R2, R3 si in caminele de de la Agronomie A1 si A2, cat si in Campusul Studentesc Leu, caminele A, B si C. Chestionarul a presupus rspunderea la un set de ntrebri referitoare la vrst, anul de studiu, preferina pentru o anumit firma de adidasi conform preferintelor, venitul lunar al studentului, preul pe care acesta este dispus sa l plteasc pentru o pereche de adidasi i cantitatea de produse cumprate in intervalul unui an calendaristic.

Variabilele ce vor constitui baza de date din SPSS vor fi: vrsta, sexul persoanei, venitul, firma producatoare de adidasi, preul acestora i cantitatea. Acestea vor constitui baza de date Adidas.sav 4. ANALIZA SI PRELUCRAREA DATELOR -Definirea variabilelor i introducerea datelor n SPSS Atributele acestor variabile sunt definite n fereastra Data Editor Foaia VariableView:

Figura 1 Fereastra Data Editor Foaia Variable View pentru baza de date:Adidas.sav. Astfel baza de date ce va fii analizata este urmatoarea:

Figura 2 Fereastra Data Editor Foaia Data View pentru baza -Verificarea bazei de date.Depistarea outlierilor Outlierile reprezint valorile aberante nregistrate la nivelul unui eantion i se pot depista pe baza graficelor care verific normalitatea distribuiilor variabilelor. Pentru aceast analiz se vor analiza ca variabile numerice preul adidasului i cantitatea pe care studenii sunt dispui s o achiziioneze ntr-un an, iar ca variabile nominale sexul i firma adidasului preferata. Outlierile se pot depista n cazul variabilelor numerice, iar valorile acestora se vor depista astfel Analyze Descriptive Statistics Explore Plots sau Analyze Descriptive Statistics Q-Q Plots, outlierile fiind depistate implicit. Pentru variabila Cantitate: n cazul acestei variabile n fereastra Explore se nlocuiete n Dependent List variabila Pre cu variabila Cantitate

Figura 3 Diagrama Boxplot pentru variabila Pre Interpretare: Aa cum se observ, nu exist valori aberante.

Figura 4 Diagrama Boxplot pentru variabila Cantitate

Verificarea normalitii distribuiilor Pentru a verifica normalitatea distribuiilor variabilelor Pre i Cantitate se folosesc procedeele grafice Q-Q Plot, P-P Plot, Boxplot, histograma, testul Kolmogorov-SmirnovLilliefors. Pentru a putea depista i outlierile se va folosi procedeul Q-Q Plot. Q-Q Plot compar valorile ordonate ale variabilei observate cu valorile quantilice ale distribuieie teoretice specificate (n acest caz distribuia normal). Dac distribuia variabilei testate este normal, atunci punctele Q-Q contureaz o linie care se suprapune cu dreapta care reprezint distribuia teoretic, adic trece prin origine i are panta egal cu 1. Pentru acesta se va urmri demersul: Analyze Descriptive Statistics Q-Q Plots, la Variables se introduce variabila de analizat, iar la Test Distribution se alege Normal. Pentru cele dou variabile numerice rezultatele sunt urmtoarele:

Figura 5 Q-Q Plot pentru variabila Pre

Figura 6 Q-Q Plot pentru variabila Cantitate Interpretare: Se observ c punctele nu sunt serios deviate de la linia dreapt, ceea ce indic o distribuie normal. -Analiza statistic univariat a datelor. Descrierea statistic a variabilelor nominale. Cele dou variabile nominale ce vor fi analizate sunt sexul persoanei chestionate i firma de adidasi folosita.Pentru a descrie aceste variabile se vor urma paii: meniul Analyze Descriptive Statistics Frequencies Statistics (unde la Central Tendency se bifeaz Mode) i Charts (unde la Chart Type se bifeaz Pie sau Bar, iar la Chart Value Frequencies sau Percentages). Astfel, se obin urmtoarele rezultate: Pentru variabila Sexul persoanei chestionate se obin rezultatele:
Sexul persoanei Cumulative Frequency Valid F M Total 21 14 35 Percent 60.0 40.0 100.0 Valid Percent 60.0 40.0 100.0 Percent 60.0 100.0

Tabelul 7 Sexul persoanei

Figura 8 Diagrama Pie pentru variabila Sexul persoanei Interpretare: Se observ i din tabel i din grafic c proporie persoanelor de sex feminin din eantion este de 60%, iar cea a persoanelor de sex masculin este de 40% Pentru variabila Firma adidasului:

Firma de adidasi Frequency Valid ADIDAS Bazar LOTUS NIKE PUMA Total 14 10 2 5 4 35 Percent 40.0 28.6 5.7 14.3 11.4 100.0 Valid Percent 40.0 28.6 5.7 14.3 11.4 100.0 Cumulative Percent 40.0 68.6 74.3 88.6 100.0

Tabelul 9Firma de adidasi

Figura 10 Diagrama Pie pentru variabila Firma adidasului Interpretare: Dupa cum se observ att din tabel ct i din grafic proporiile firmelor de adidasi sunt: PUMA(11.4%), LOTUS(5.7%), ADIDAS(40.0%), NIKE(14.3%), BAZAR(28.6%). -Descrierea statistic a variabilelor numerice. n cazul variabilelor numerice se folosete acelai demers ca n cazul variabilelor nominale, cu diferena c se bifeaz toi indicatorii din Statistics iar la Charts se bifeaz Histograms. Astfel, se obtin urmtoarele rezultate:
Statistics Pretul adidasilor N Valid Missing Mean Std. Error of Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum 35 0 3.06 .272 3.00 2 1.608 2.585 .487 .398 -.829 .778 5 1 6

Figura 11 Histograma si tabelul pentru variabila Preul produsului


Statistics Numarul de perechi N Valid Missing Mean Std. Error of Mean Median Mode Std. Deviation Variance Skewness Std. Error of Skewness Kurtosis Std. Error of Kurtosis Range Minimum Maximum 35 0 1.97 .133 2.00 2 .785 .617 .824 .398 .992 .778 3 1 4

Figura 12 Histograma si tabelul pentru variabila Cantitate Interpretare: Pentru ambele variabile se citesc n tabel principalii indicatori: media, mediana, variana, modul, valorile minime i valorile maxime. -Analiza statistic bivariat a datelor. Analiza statistic a gradului de asociere ntre dou variabile Gradul de asociere se poate studia pentru variabilele nominale, n acest caz sexul persoanei i firmele de adidasi folosite. Gradul de asociere presupune obinerea tabelului de asociere, n care sunt prezentate relaiile dintre variabilele categoriale. n fiecare celul a tabelului este prezentat frecvena parial, adic efectivul care poart simultan o valoare a fiecrei variabile. Obinerea acestui tabel presupune urmtorul demers: Analyze Descriptive Statistics Crosstabs. La rows-completam firma de adidasiiar la columns-completam sex persoana. La statistics-bifam Chi-square:
Firma de adidasi * sexpers Crosstabulation Count sexpers .00 Firma de ADIDAS Bazar 10 6 1 3 1 21 1.00 4 4 1 2 3 14 Total 14 10 2 5 4 35 Pearson Chi-Square Likelihood Ratio N of Valid Cases Chi-Square Tests Value 2.887a 2.898 35 df 4 4 Asymp. Sig. (2-sided) .577 .575

a. 7 cells (70.0%) have expected count less than 5. The minimum expected count is .80.

adidasi LOTUS NIKE PUMA Total

Tabel 14 Testarea gradului de asociere folosind testul Chi Square Tabel 13 Statistic a gradului de asociere ntre firmele producatoare si sexul cumparatorilor Interpretare: n eantionul analizat sunt 6 persoane de sex feminin care folosesc cu precdere adidasi din BAZAR, 3 persoane de firma NIKE, 10persoane de la firma ADIDAS, o persoana de la firma LOTUS si o persoana de la firma PUMA. Persoanele de

sex masculin care folosesc cu precdere adidasi sunt 4 persoane din BAZAR, 2 persoane de la firma NIKE, 4 persoane de la firma ADIDAS, o persoana de la firma LOTUS si 3 persoane de la firma PUMA. Analiza de regresie i corelaie Analiza de corelaie presupune msurarea Correlations gradului de intensitate a legturii dintre Numarul Pretul variabilele numerice, precum i testarea de perechi adidasilor semnificaiei legturii. Acest lucru se realizeaz urmnd paii: Analyze Numarul Pearson Correlation 1 .514 Correlate Bivariate. n cazul celor dou de perechi Sig. (2-tailed) .002 variabile numerice studiate (preul i N 35 35 numrul de adidasi cumprati) se obine Pretul Pearson Correlation .514 1 urmtorul rezultat:
**

**

adidasilor

Sig. (2-tailed) N

.002 35 35

**. Correlation is significant at the 0.01 level (2-tailed).

Tabelul 15 Corelatia Interpretare: Se observ c s-a obinut un coeficient de corelaie Pearson egal cu 0.514, ceea ce nseamn c ntre cele dou variabile exist o corelaie directa, valoarea coeficientului fiind apropiata de unu. Testarea semnificaiei coeficientului de corelaie este realizat cu ajutorul testului t. Valoarea Sig. corespunztoare, egal cu 0.002, evideniaz c s-a obinut un coeficient de corelaie semnificativ la un prag de 0.002, adic sunt anse mai mici de 1% ( = 0.01) de a gresi in a afirma ca intre cele doua variabile exista o corelatie semnificativa. Analiza de regresie presupune aproximarea modelului de regresie, estimarea i testarea parametrilor modelului de regresie. ntre cele dou variabile numerice se poate stabili o legtur liniar dat prin ecuaia de regresie liniar simpl, care are forma:

Yi = + xi + i
n care: Y variabila dependent (numrul de adidasi) X variabila independent (preul adidasilor) variabila aleatorie eroare sau reziduu Aproximarea modelului de regresie se realizeaz prin Scatterplot (din meniul Graphs - Interactive). Se optine outputul:

Figura 16 Regresia ntre Numrul de


6

Linear Regression

Pretul adidasilori 4

Pretul adidasului = 0.98 + 1.05 * cantit R-Square = 0.26

2 3 4

Numarul adidasi cumparat pe an

adidasi i Preul adidasilor Estimarea parametrilor modelului de regresie presupune parcurgerea demersului: Analyze Regession Linear, prin care se deschide fereastra de dialog Linear Regession. Urmnd paii necesari, n output se analizeaz Model Summary, ANOVA, Coefficients.
Model Summary Model R R
dimension0

Change Statistics Adjusted R Square .242 Std. Error of the Estimate 1.400 R Square Change .264 F Change df1 df2 11.835 1 33 Sig. F Change .002

Square .264

.514a

a. Predictors: (Constant), Numarul de perechi

Tabelul 17 Model Summary prezint valoarea coeficientului de corelaie R, valoarea raportului de determinaie R2 i eroarea standard a estimaiei. Interpretare: Valoarea lui R este 0.514, ceea ce indic faptul c ntre cele dou variabile exist o legtur direct. Valoarea lui R2 este 0.264, ceea ce indic faptul c 26.4% din variaia variabilei Y este explicat prin variaia variabilei X. Aceasta este o valoare destul de mic, ceea ce nseamn c modelul ales nu explic foarte bine legtura dintre variabile.
ANOVAb Model 1 Regression Residual Total Sum of Squares 23.199 64.687 87.886 df 1 33 34 Mean Square 23.199 1.960 F 11.835 Sig. .002a

a. Predictors: (Constant), Numarul de perechi b. Dependent Variable: Pretul adidasilor

Tabelul 18 Regession ANOVA prezint rezultatele analizei varianei variabilei dependente sub influena factorului de regresie i a factorului reziduu. Prezint informaii asupra sumei ptratelor abaterilor variabilei dependente, gradele de libertate, estimaiile varianelor datorate celor dou surse de variaie, raportul F i Sig

Interpretare: n cazul variabilelor considerate, valoarea Sig. pentru F este mai mic dect 0.05, fiind 0.02, prin urmare relatia liniar dintre cele dou variabile considerate este semnificativ.
Coefficientsa Model Unstandardized Coefficients B 1 (Constant) Numarul de perechi .984 1.052 Std. Error .648 .306 .514 Standardized Coefficients Beta t 1.519 3.440 Sig. .138 .002

a. Dependent Variable: Pretul adidasilor

Tabelul 19 Coefficients prezint coeficienii nestandardizai ai modelului de regresie estimat, erorile standard ale acestora, coeficienii de regresie standardizai cu erorile standard corespunztoare, precum i valorile statisticii test t i valorile Sig. corespunztoare. Interpretare: Pentru o ncredere de 95% se observ c n cazul ambilor coeficieni valoarea lui Sig. este mai mic dect 0.05, ceea ce nseamn c acetia sunt semnificativ diferii de 0. Astfel, ecuaia de regresie are urmtoarea form: Y =1.204+ 0.251 X -Estimarea i testarea statistic Estimarea este procedeul prin care se generalizeaz rezultatele observate pe un eantion, la nivelul populaiei din care este extras, adic se afl valoarea unui parametru al unei populaii pe baza datelor nregistrate la nivelul unui eantion extras din aceasta. Estimarea poate fi punctual sau prin interval de ncredere. n acest caz se va estima prin interval de ncredere. -Testarea diferenei dintre dou proporii. Acest lucru presupune folosirea testului Chi-Square, urmnd demersul: Analyze Nonparametric Tests Chi-Square Test. Se va verifica dac proporia persoanelor de sex feminin este egal cu proporia persoanelor de sex masculin.
.00 1.00 Total Observed N 21 14 35 SEXPERS ChiSquare(a) df Asymp. Sig. 1.400 1 .237 Expected N 17.5 17.5 Residual 3.5 -3.5

Test Statistics a 0 cells (.0%) have expected frequencies less than 5. The minimum expected cell frequency is 17.5

Tabelele 20 Sexul persoanei si Test statistics Interpretare: Se observ c sunt 21 de persoane de sex feminin i 14 de sex masculin. Conform ipotezei de nul (de egalitate a proporiilor), pentru fiecare categorie ar trebui s fie cte 17.5 persoane. n tabelul Chi-Square Test valoarea semnificaiei este mai mare dect 0.05 i, prin urmare se accept ipoteza de nul.

5. CONCLUZII n urma realizrii anchetei privind cererea de adidasi in Complexul studenesc Regie, in caminele de de la Agronomie si in Campusul Studentesc Leu, se poate concluziona c aceasta este relativ constant, depinznd n oarecare msur de preul acestora. De asemenea se observ c la nivelul ntregii populaii nu exist diferene semnificative ntre proporia persoanelor de sex feminin care cumpara jeansi i proporia persoanelor de sex masculin, ntruct multe dintre produse reprezint o necesitate. BIBLIOGRAFIE Jaba, Elisabeta, Statistica, ediia a III-a, Editura Economic, Bucureti, 2002; Jaba, Elisabeta; Grama, Ana, Analiza statistic cu SPSS sub Windows, Editura Polirom, 2004