Sunteți pe pagina 1din 10

Academia de Studii Economice Facultatea de Marketing

Analiza bazei de date utilizand SPSS

-Bucuresti 2010-

Prelucrarea datelor
1) Schimbarea din scala metrica in nemetrica-pentru ore dormite pe noapte. Am schimbat intervalele cu mijlocul lor, am inlocuit inregistrarile lipsa cu ajutorul functiei replace missing values, adaugand in spatiile lipsa media seriei, apoi am stabilit ca valorile <7 reprezinta timp putin de somn, intre 7 si 9 mediu si peste 9 mult. 2) Transformarea unitatii de masura-realizata prin transform compute variable cu formula inc3_va2=inc3*60 3) Completarea valorilor lipsa- cu ajutorul functiei replace missing values, adaugand in spatiile lipsa media punctelor apropiate pentru ore dormite pe noapte/

Analiza univariata
1) Numar de ore/noapte

Statistics SMEAN(inc3) N Valid Missing Mean Median Mode Std. Deviation Variance Sum Percentiles 25 50 75 198 0 7,29 7,00 7 1,046 1,094 1444 7,00 7,00 8,00

Media este de 7.29, ceea ce ne arata ca studentii intervievati dorm in medie aproximativ 7 ore pe noapte. Mediana este tot de 7, iar modulul, valoarea cel mai des intalnita la fel. Dispersia de 1.09 ne indica faptul ca media este reprezentativa, iar cuartilele arata ca 75% dintre persoanele chestionate dorm sub 8 ore si 50% sub 7 ore. Histograma de mai jos ne arata o evolutie relativ normala a valorilor din tabel, cu valorile cele mai frecvente fiind cele de mijloc intre cea minima (4) si cea maxima (11).

Distributia numarului de ore dormite/noapte in medie

Oredormite/noapte
80 60 40 20 0 4 5 6 7 8 9 10 11 Oredormite/noa pte

Frecventa este masurata in numar de respondenti. 2) Varsta la care se atinge maximul in cariera Inainte de prelucrare s-au facut modificar asemanatoare cu cele realizate pentru numarul de ore dormite pe noapte. S-au inlocuit intervalele cu mijlocul lor, raspunsul niciodata a fost inlocuit cu 0 si cele in care era mentionat peste.... (o anumita varsta) au fost inlocuite cu acea varsta, apoi variabila a devenit una numerica.

a t n v c e r F
inc4 N

Statistics

Valid Missing

194 4 36,59 35,00 35 6,526 42,586 7098

Mean Median Mode Std. Deviation Variance Sum Percentiles 25 50 75

35,00 35,00 40,00

Media este de aproximativ 37 de ani, iar modul de 35, asta inseamna ca persoanele chestionate cred ca maximul in cariera se atinge in jurul varstei de 37 de ani. Dispersia de 42.586 ne indica insa ca media nu este reprezentativa. 50% dintre persoanele chestionate au raspuns cu o valoare sub 35 de ani.

Varsta la care se atinge maxim in cariera


140 120 100 80

a t n v c e r F

60 40 20 0 5 10 15 20 25 30 35 40 45 50 55 Va rs ta(a ni)

Pe axa Oy avem reprezentat numarul de respondenti. Se remarca o evolutie neobisnuita a rezultatelor, cu valori cu frecvente mari intercalate cu valori cu frecvente reduse.

3) In ce masura sunteti de acord cu urmatoarea afirmatie: Mesajele electorale fac parte din spam.
Statistics ico2_0 N Valid Missing Mode 193 5 1 ico2_0 Cumulative Frequency Valid -2 -1 0 1 2 Total Missing Total System 3 23 56 64 47 193 5 198 Percent 1,5 11,6 28,3 32,3 23,7 97,5 2,5 100,0 Valid Percent 1,6 11,9 29,0 33,2 24,4 100,0 Percent 1,6 13,5 42,5 75,6 100,0

Observam ca modul este 1, 32.3% din respondenti fiind de acord ca mesajele electorale fac parte din spam. De altfel, procentul persoanelor aflate in dezacord este mic, de 11.9% care au spus ca nu sunt de acord, sau sunt in dezacord total. Calculand media ponderata a rezultatelor obtinem o valoare de 0.42, ceea ce ne arata ca oamenii sunt de acord cu afirmatia. Trebuie avut in vedere ca aproape o treime, 28.3% au spus ca sunt indiferenti, deci probabil ca nu sunt interesati de mesajele electorale sau de mesajele nesolicitate.
Mesajeleelectorale facparte din spam
1,5 23,7 11,6 dezacord total 28,3 32,3 dezacord indiferent acord acord total

4) In ce masura sunteti de acord cu urmatoarea afirmatie: Informatiile de pe Wikipedia sunt corecte


Statistics ico2_1 N Valid Missing Mode 193 5 1

ico2_1 Cumulative Frequency Valid -2 -1 0 1 2 Total Missing Total System 3 38 23 114 15 193 5 198 Percent 1,5 19,2 11,6 57,6 7,6 97,5 2,5 100,0 Valid Percent 1,6 19,7 11,9 59,1 7,8 100,0 Percent 1,6 21,2 33,2 92,2 100,0

Modul este 1, majoritatea persoanelor sunt de acord. Observam o distributie a frecventelor diferite fata de cazul anterior, cu 21.2% din persoane in dezacord, doar 11.9%

avand o parere neutra si 65.2% de acord, deci majoritatea persoanelor considera ca informatiile de pe Wikipedia sunt corecte. Media ponderata de 0.518 arata ca majoritatea sunt de acord cu afirmatia.
Informatiile de pe Wikipedia sunt corecte
1,5 7,6 19,2 11,6 57,6

dezacord total dezacord indiferent acord acord total

5) In ce masura sunteti de acord cu afirmatia: internautii sunt persoane tinere


Statistics ico2_4 N Valid Missing Mode 194 4 1

ico2_4 Cumulative Frequency Valid -2 -1 0 1 2 Total Missing Total System 3 58 39 84 10 194 4 198 Percent 1,5 29,3 19,7 42,4 5,1 98,0 2,0 100,0 Valid Percent 1,5 29,9 20,1 43,3 5,2 100,0 Percent 1,5 31,4 51,5 94,8 100,0

Din nou modul este 1, dar respondentii se impart aproape egal intre acord si dezacord30.8% sunt in dezacord, 47.5% sunt de acord si 19.7% neutri. Media de 0.2 nu ne arata

neaparat ca persoanele sunt neutre cu privire la afirmatie, ci ca parerile sunt impartite, unii cred ca internautii sunt persoane tinere, iar altii nu. Cel mai probabil, parerea generala este ca internautii nu sunt numai persoane tinere. Internautii sunt persoane tinere
1,5 5,1 29,3 42,4 19,7 dezacord total dezacord indiferent acord acord total

Analiza bivariata
1) Corelatia intre numarul de adulti membri ai familiei si numarul de ore dormite/noapte
Symmetric Measures Asymp. Std. Value Nominal by Nominal Phi Cramer's V Contingency Coefficient Interval by Interval Ordinal by Ordinal N of Valid Cases a. Not assuming the null hypothesis. b. Using the asymptotic standard error assuming the null hypothesis. c. Based on normal approximation. Pearson's R Spearman Correlation ,638 ,241 ,538 -,088 -,067 192 ,070 ,069 -1,213 -,930 Errora Approx. Tb Approx. Sig. ,026 ,026 ,026 ,227c ,353c

L eg aturadintre num arul de ore dorm ite/noaptesi num arul de m em bri adulti ai fam iliei
12 10 8 6 4 2 0 0 2 4 6 8 Series1

Pe axa Oy este reprezentat numarul de ore dormite/noapte, iar pe axa Ox numarul de persoane adulte din familie. Coeficientul de corelatie al lui Pearson ne arata o legatura indirecta foarte slaba, deci nu putem afirma ca exista o legatura intre cele doua variabile, fapt confirmat si de tabel, in care punctele sunt raspandite haotic, negrupate in jurul vreuneia dintre diagonale, astfel incat sa putem spune ca exista vreo legatura intre variabile. 2) Corelatia intre in ce masura sunteti de acord cu urmatoarea afirmatie: Informatiile de pe Wikipedia sunt corecte si sex
ico2_1 * iid2 Crosstabulation Count iid2 barbatesc ico2_1 -2 -1 0 1 2 Total 0 10 5 19 3 37 femeiesc 3 28 18 95 12 156 Total 3 38 23 114 15 193

Symmetric Measures Value Nominal by Nominal N of Valid Cases Contingency Coefficient ,114 193 Approx. Sig. ,639

Coeficientul de corelatie de 0.114 arata o legatura foarte slaba intre sex si masura in care persoanele chestionate sunt de acord cu afirmatie. Acest lucru se poate observa si din tabelul de contingenta, un numar mic, atat de femei, cat si de barbati, din total au ales variantele extreme: dezacord total sau acord total (pentru ambele cazuri 3 in randul barbatilor si 15 in randul femeilor, reprezentand procente de 8 respectiv 9%), majoritatea au ales acord (51% dintre barbati si 60% dintre femei), iar restul au fost neutri.

Inform atiiledepe Wikipediasunt corecte


80,0 60,0 40,0 20,0 0,0 Dezacord Dezacord Indiferent Acord total Acord total Barbati Fem ei

Se observa ca si respondentii de sex feminin si cei de sex masculin au frecvente asemanatoare, fie ele mici sau mari, pentru aceleasi afirmatii. 3) Corelatia intre numarul de ore dormite/noapte si in ce masura sunteti de acord cu afirmatia: Mesajele electorale fac parte din spam
inc3_va * ico2_0 Crosstabulation Count ico2_0 -2 inc3_va mediu mult putin Total 1 1 1 3 -1 9 1 13 23 0 28 5 23 56 1 24 3 37 64 2 16 4 27 47 Total 78 14 101 193

Symmetric Measures Value Nominal by Nominal N of Valid Cases Contingency Coefficient ,201 193 Approx. Sig. ,419

A fost folosita variabila realizata la primul punct. Avem un coeficient de corelatie de 0.201, adica o legatura directa slaba. Din tabelul de contingenta observam ca cei care dom mediu si mult au avut cele mai mari frecvente pentru un raspuns neutru, pe cand cei care dorm putin au cea mai mare frecventa pentru acord.

Mesajele electorale fac parte din spam in functie de timpul dormit/noapte


40,0 30,0 20,0 10,0 0,0 Dezacord Dezacord Indiferent total Acord Acord total Putin Mediu Mult

Indiferent de numarul de ore dormite/noapte, persoanele au fost in dezacord total cu afirmatia, majoritatea fiind in acord sau in acord total (51% din cei care dorm un numar mediu de ore, 50% din cei care dorm mult si 63% din cei care dorm putin). In concluzie, numarul ore dormite/noapte nu influenteaza masura in care persoanele chestionate sunt de acord ca mesajele electorale fac parte din spam.

www.aseonline.ro
Comunitatea studentilor din A.S.E.