Documente Academic
Documente Profesional
Documente Cultură
1. Normalitatea datelor
Inainte de a incepe testarile solicitate in cele 8 puncte ale lucrarii de fata o sa se testeze normalitate pentru fiecare variabila a cercetarii in parte. a) SEX:
Dupa cum se poate observa din acest grafic variablia sex nu este normal distribuita.
Proiect SPSS
Proiect SPSS
Dupa cum se observa din graficul de mai sus aceasta variabila tinde spre normalitate in partea stanga. e) PRINCIPALUL MOTIV DE ALEGERE A VOPSELEI DE PAR ACTUALE:
Proiect SPSS
Proiect SPSS
Nici aceasta variabila nu are valorile normal distribuite. i) CATEGORII DE VENITURI LUNARE:
Se poate spune ca variabila categorii de venituri lunare nu are valorile normal distribuite insa tinde spre normalitate in partea dreapta a graficului.
Proiect SPSS
j) MEDIUL DE LOCUINTA:
Validarea acestei ipoteze se va face cu ajutorul One-Sample Test folosind urmatorii pasi : Statistics Compare Means One Sample Test, iar rezultatul este dat in urma analizei datelor din tabelul de mai jos :
One-Sample Statistics
N frecventa de folosire a vopselei de par 9 Mean 2.2222 Std. Deviation 1.2019 Std. Error Mean .4006
One-Sample Test Test Value = 2 t df Sig. (2-tailed)Mean Difference 95% Confidence Interval of the Difference Lower -.7016 Upper 1.1460
.555
.594
.2222
Semnificatia testului t din cel de-al doilea tabel este cea care ne spune daca se sustine sau nu ipoteza nula. Cum valorea este mai mare decat pragul de 0.001 se poate spune ca este sustinuta
Proiect SPSS
ipoteza nula deci se poate aprecia ca aproape 80% din respondenti cumpara vopsea de par o data la 2-3 luni.
3. Testarea existenei diferenelor semnificative n cazul a cel puin trei variabile obinute prin intervievarea aceluiai eantion de respondeni, pe aceeai scal se face utilizandu-se testul Paired Samples T Test astfel: Statistics Compare Means- Paired Sample T Test
a. Atitudine vis-a-vis de marca de vopsea de par cumparata/ Ultimul nivel de educatie
Paired Samples Statistics
Mean Pair 1 atitudine vis-a-vis de marca de vopsea de par cumparata 2.2222 N 9 Std. Deviation 1.2019 Std. Error Mean .4006
3.4444
1.5092
.5031
Pair 1 atitudine visa-vis de marca de vopsea de par cumparata - ultimul nivel de educatie
-1.2222
2.1082
.7027
Lower -2.8427
Upper .3983
-1.739
.120
Valoarea semnificatiei testului t este 0.120 adica mai mare decat 0.001, situatie in care se poate aprecia ca se sustine ipoteza nula si deci nu exista diferente semnificative intre atitudine vis-avis de marca de vopsea de par cumparata si ultimul nivel de educatie. 7
Proiect SPSS
Pair 1
.2222
1.7873
Upper 1.5961
.373
.719
Avand in vedere ca valoarea semnificatiei testului t este 0.719>0.001 se paote spune ca este sustinuta ipoteza nula conform careia nu exista diferente semnificative in ceea ce priveste frecventa de folosire a vopselei de par in functie de intervalul de varsta. Principalul motiv de alegere avopselei de par actuala/ Categorii de venituri lunare
Paired Samples Statistics
Mean Pair 1 principalul motiv de alegere avopselei de par actuala 7.4444 N 9 Std. Deviation 3.1269 Std. Error Mean 1.0423
870.0000
591.3755
197.1252
Proiect SPSS
Confidence Interval of the Difference Lower 196.7873 -1316.3480 Mean
Pair 1
-862.5556
590.3620
Upper -408.7632
-4.383
.002
Si in cazul analizei diferentelor dintre aceste doua variabile se poate aprecia ca nu exista diferente semnificative in ceea ce priveste priveste principalul motiv de alegere a vopselei de par actuala, pe categorii de venituri.
4. Testarea existenei unor diferene semnificative statistic pentru subgrupuri generate la nivelul unui eantion de cel puin dou variabile de grupare dihotomice: Statistics- Compare Means Independent Samples T Test
Categorii de venituri lunare / Sex
Group Statistics
sex categorii de venituri lunare masculin N 1 Mean 1400.0000 Std. Deviation . Std. Error Mean .
feminin
870.0000
591.3755
197.1252
Sig.
df
Sig. (2tailed)
Mean Difference
.850 .
8 .
.420 .
530.0000 530.0000
Std. Error 95% Difference Confidence Interval of the Difference Lower 623.3645 -907.4812 . .
Upper 1967.4812 .
Se poate spune ca se sustine ipoteza nula (0.420>0.001) si in aceasta situatie nu exista diferente semnificative statistic intre valoarea mediei venitului la femei fata de valoarea mediei venitului la barbati. Categorii de venituri lunare/ Mediul de locuinta 9
rural
410.0000
300.4996
173.4935
Sig. (2tailed)
Mean Difference
.958
.356
2.166 2.739
8 6.926
.062 .029
732.8571 732.8571
Std. Error 95% Difference Confidence Interval of the Difference Lower 338.3031 -47.2712 267.5436 98.8449
Conform datelor din tabelul de mai sus ipoteza nula este sustinuta, si in aceasta situatie nu exista difetente semnificative statistic cu privire la media veniturilor raportate la persoanele care locuiesc in mediul urban fata de cele care locuiesc in mediul rural.
5. Testarea existenei unor diferene semnificative statistic pentru trei sau mai multe subgrupri generate la nivelul unui eantion de o variabil de grupare: Statistics Compare Means One Way ANOVA
Categoriile de venituri lunare/Ultimul nivel de educatie
Descriptives categorii de venituri lunare
N Mean Std. Deviation Std. Error 95% Confidence Interval for Mean Lower Bound scoala generala liceu facultate studii postuniversitare Total 3 3 3 1 243.3333 833.3333 1566.6667 1300.0000 60.2771 284.3120 208.1666 . 34.8010 164.1476 120.1850 . 93.5966 127.0631 1049.5522 . Upper Bound 393.0700 1539.6036 2083.7812 . 180.00 600.00 1400.00 1300.00 300.00 1150.00 1800.00 1300.00 Minimum Maximum
10
923.0000
582.1999
184.1078
506.5193
1339.4807
180.00
1800.00
10
Se poate aprecia ca ipoteza nula a Testului Levene, de egalitate a dispersiilor celor patru subgrupuri este sustinuta (in cazul Test of Homogenity of Variance Sig este 0.132>0.05) iar semnificatia testului F in tabelul ANOVA este 0.001=0.001, deci ipoteza nula este respinsa, situatie in care exista diferente semnificative statistic cu privire la categoriile salariale ale celor patru subgrupuri de respondenti din medii de locuinta diferite.
6. Testarea semnificaiei diferenelor statistice observate n cazul a cel puin dou variabile categoriale: Statistics Summerize Crosstabs
Sex/Ultimul nivel de educatie
Case Processing Summary
Cases Valid N sex * ultimul nivel de educatie 10 Percent 100.0% Missing N 0 Percent .0% Total N 10 Percent 100.0%
feminin
Total
Chi-Square Tests
Asymp. Sig. (2-sided)
11
Proiect SPSS
Pearson Chi-Square 2.593 3 .459
2.683 .961
3 1
.443 .327
N of Valid Cases
10
a 8 cells (100.0%) have expected count less than 5. The minimum expected count is .10. Symmetric Measures
Value Nominal by Nominal Phi .509 Approx. Sig. .459
.509 10
.459
a Not assuming the null hypothesis. b Using the asymptotic standard error assuming the null hypothesis.
Din analiza acestor tabele se poate aprecia ca ipoteza nula este sustinuta si, in aceasta situatie, nu exista diferente semnificative intre barbati si femei cu privire la ultimul nivel de educatie absolvit.
7. Stabilirea unor asocieri semnificative ntre toate variabilele setului de date analizat, utilizndu-se metodele de analiz specifice fiecrui caz n parte
Mai intai este necesar sa se stabileasca, pentru fiecare variabila in parte, normalitatea si homoscedasticitatea. Normalitatea a fost analizata in prima parte a proiectului pentru fiecare variabila in parte. Homoscedasticitatea variabilelor se stabileste urmand pasii: Statistics- Compare Means Independent T Test iar daca Sig>0.05 inseamna ca nu exista diferente semnificative intre dispersiile grupurilor, cerinta de homoscedasticitate fiind indeplinita.
Correlations
sex sex Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N * Correlation is significant at the 0.05 level (2-tailed). 1.000 . 10 .667 .035 10 participare la studiu de piata in ultimele 6 luni .667 .035 10 1.000 . 10
12
Proiect SPSS
Dupa cum se poate observa in tabelul de mai sus in celula care are atat pe linii cat si pe coloane aceeasi variabila valoarea coeficientului de corelatie este 1 aratand identitatea celor doua seturi de date. Valoarea coeficientului de corelatie al lui Pearson este 0.667 ceea ce semnifica sustinerea ipotezei nule. Totodata valoarea coeficientului de corelatie este pozitiv indicand o asociere pozitiva intre cele doua variabile.
Correlations
atitudine vis-a-vis de marca de vopsea de par cumparata atitudine vis-a-vis de marca de vopsea de par cumparata Pearson Correlation Sig. (2-tailed) N interval de varste Pearson Correlation Sig. (2-tailed) N 1.000 . 9 .378 .315 9 interval de varste
Si in aceasta situatie intre cele doua variabile exista o asociere semnificatva statistic.
Symmetric Measures
Nominal by Nominal Phi Cramer's V Contingency Coefficient N of Valid Cases Value -.375 .375 .351 10 Approx. Sig. .236 .236 .236
a Not assuming the null hypothesis. b Using the asymptotic standard error assuming the null hypothesis.
In tabelul de mai sus, pentru a determina asocierea dintre cele doua variabile nominale, tot ceea ce ne intereseaza este semnificatia coeficientului de contingenta. Valoarea lui Aprox. Sig. este de 0.236, o valoare superioara nivelului de semnificatie de 0.05 la care este acceptata ipoteza nula de non-asociere, deci coeficientul de corelatie nu este unul semnificativ, neexistand o asociere liniara intre cele doua variabile.
8. Realizarea a cel puin o previziune cu privire la evoluia ulterioar a fenomenului economic analizat, fie cu ajutorul regresiei, fie cu ajutorul analizei seriilor de timp, depinznd de natura setului de date utilizat
13
Proiect SPSS
Pentru a putea sa se faca o previziune este necesara intai identificarea asocierilor dintre variabilele analizate, asa cum s-a procedat la subpunctul anterior, studiind mai intai normalitatea si homoscedasticitatea datelor. Ulterior se va realiza un grafic liniar pentru a se determina forma relatiei dintre variabilele supuse analizei.
Se poate astfel observa ca imaginea ce descrie relatia dintre nivelul veniturilor si ultimul nivel de educatie este ecorespunzatoare unei relatii liniare intre aceste doua variabile. Se poate totdata observa ca sunt valori care nu conduc totusi la o relatie liniara, valori pentru care analiza de regresie devine foarte sensibila.
Variables Entered/Removed
Model 1 a All requested variables entered. Variables Entered ultimul nivel de educatie Variables Removed . Method Enter
ANOVA
Model Regression Residual Total Sum of Squares 2423971.765 626638.235 3050610.000 df 1 8 9 Mean Square 2423971.765 78329.779 F 30.946 Sig. .001
14
Proiect SPSS
a Predictors: (Constant), ultimul nivel de educatie b Dependent Variable: categorii de venituri lunare
Coefficients
Unstandardized Coefficients Model 1 (Constant) ultimul nivel de educatie a Dependent Variable: categorii de venituri lunare B -317.941 344.706 Std. Error 239.990 61.965 .891 Standardized Coefficients Beta -1.325 5.563 .222 .001 t Sig.
Residuals Statistics
Predicted Value Residual Std. Predicted Value Minimum 371.4706 -450.2941 -1.063 Maximum 1750.2941 433.8235 1.594 1.550 Mean 923.0000 5.116E-14 .000 .000 Std. Deviation 518.9703 263.8683 1.000 .943 N 10 10 10 10
Rezultatul aplicarii functiei de regresie liniara poate fi observata in toate cele cinci tabele de mai sus. In primul tabel, intitulat Variables Entered Removed sunt prezentate variabilele folosite in modelul de regresie., ca si metoda de regresie folosita. In cel de-al doilea tabel, intitulat Model Summary, sunt prezentate cele cateva valori necesare in estimarea gradului de asociere dintre variabilele independente utilizate si variabila dependenta analizata. In cazul de fata coeficientul de corelatie este 0.891 ceea ce indica o asociere puternica intre cele doua variabile, coeficientul de de determinare in valoare de 0.795 indica faptul ca aproape trei sferturi din variatia in timp a categoriilor de venituri este explicata prin ultinul nivel de educatie, valoare care este confirmata prin normalizare (Adjusted R Square) iar eroarea standard a indicatorului este utilizata pentru extrapolarea valorilor din esantion la nivelul populatiei din care acestea au fost extrase. Tabelul intitulat Coefficients reprezinta in fapt modelul de regresie. Se pot astfel identifica: parametrii de regresie, eroareav standard asociata acestora, valorile standardizate ale coeficientilor, valoarea testului Student si nivelul de semnificatie asociat acestora pentru determinarea eventualelor diferente semnificative in extrapolarea lor la nivelul populatiei din care a fost extras esantionul. O valoare a coloanei Sig mai mare de 0.01 duce la acceptarea ipotezei nule de non-diferentiere fata de zero (valoarea coeficientului nu este semnificativ diferita de zero) si a respingerii parametrului.
15