Sunteți pe pagina 1din 10

Academia de Studii Economice

Facultatea de Marketing

Analiza bazei de date utilizand SPSS

-Bucuresti 2010-
Prelucrarea datelor
1) Schimbarea din scala metrica in nemetrica-pentru ore dormite pe noapte.
Am schimbat intervalele cu mijlocul lor, am inlocuit inregistrarile lipsa cu ajutorul functiei
replace missing values, adaugand in spatiile lipsa media seriei, apoi am stabilit ca valorile <7
reprezinta timp putin de somn, intre 7 si 9 mediu si peste 9 mult.

2) Transformarea unitatii de masura-realizata prin transform compute variable cu


formula inc3_va2=inc3*60

3) Completarea valorilor lipsa- cu ajutorul functiei replace missing values, adaugand


in spatiile lipsa media punctelor apropiate pentru ore dormite pe noapte/

Analiza univariata
1) Numar de ore/noapte

Statistics
SMEAN(inc3)

N Valid 198

Missing 0
Mean 7,29
Median 7,00
Mode 7
Std. Deviation 1,046
Variance 1,094
Sum 1444
Percentiles 25 7,00

50 7,00

75 8,00

Media este de 7.29, ceea ce ne arata ca studentii intervievati dorm in medie


aproximativ 7 ore pe noapte. Mediana este tot de 7, iar modulul, valoarea cel mai des intalnita
la fel. Dispersia de 1.09 ne indica faptul ca media este reprezentativa, iar cuartilele arata ca
75% dintre persoanele chestionate dorm sub 8 ore si 50% sub 7 ore.
Histograma de mai jos ne arata o evolutie relativ normala a valorilor din tabel, cu
valorile cele mai frecvente fiind cele de mijloc intre cea minima (4) si cea maxima (11).
Distributia numarului de ore dormite/noapte in medie
Oredormite/noapte
80
60
40
20
n
ta
v
cF
re

0
4 5 6 7 8 9 10 11

Oredormite/noapte

Frecventa este masurata in numar de respondenti.

2) Varsta la care se atinge maximul in cariera


Inainte de prelucrare s-au facut modificar asemanatoare cu cele realizate pentru
numarul de ore dormite pe noapte. S-au inlocuit intervalele cu mijlocul lor, raspunsul
“niciodata” a fost inlocuit cu 0 si cele in care era mentionat “peste....” (o anumita varsta) au
fost inlocuite cu acea varsta, apoi variabila a devenit una numerica.

Statistics
inc4

N Valid 194

Missing 4
Mean 36,59
Median 35,00
Mode 35
Std. Deviation 6,526
Variance 42,586
Sum 7098
Percentiles 25 35,00

50 35,00

75 40,00

Media este de aproximativ 37 de ani, iar modul de 35, asta inseamna ca persoanele
chestionate cred ca maximul in cariera se atinge in jurul varstei de 37 de ani. Dispersia de
42.586 ne indica insa ca media nu este reprezentativa. 50% dintre persoanele chestionate au
raspuns cu o valoare sub 35 de ani.
Varsta la care se atinge maxim in cariera
140

120

100

80

60
n
ta
v
cF
re

40

20

0
5 10 15 20 25 30 35 40 45 50 55

Varsta(ani)

Pe axa Oy avem reprezentat numarul de respondenti.

Se remarca o evolutie neobisnuita a rezultatelor, cu valori cu frecvente mari intercalate cu


valori cu frecvente reduse.

3) In ce masura sunteti de acord cu urmatoarea afirmatie: Mesajele electorale fac parte din
spam.

Statistics
ico2_0

N Valid 193

Missing 5
Mode 1

ico2_0

Cumulative
Frequency Percent Valid Percent Percent

Valid -2 3 1,5 1,6 1,6

-1 23 11,6 11,9 13,5

0 56 28,3 29,0 42,5

1 64 32,3 33,2 75,6

2 47 23,7 24,4 100,0

Total 193 97,5 100,0


Missing System 5 2,5
Total 198 100,0
Observam ca modul este 1, 32.3% din respondenti fiind de acord ca mesajele
electorale fac parte din spam. De altfel, procentul persoanelor aflate in dezacord este mic, de
11.9% care au spus ca nu sunt de acord, sau sunt in dezacord total.
Calculand media ponderata a rezultatelor obtinem o valoare de 0.42, ceea ce ne arata
ca oamenii sunt de acord cu afirmatia. Trebuie avut in vedere ca aproape o treime, 28.3% au
spus ca sunt indiferenti, deci probabil ca nu sunt interesati de mesajele electorale sau de
mesajele nesolicitate.

Mesajeleelectorale facparte din spam


1,5

23,7 11,6
dezacord total
dezacord
28,3
indiferent
32,3 acord
acord total

4) In ce masura sunteti de acord cu urmatoarea afirmatie: Informatiile de pe Wikipedia


sunt corecte

Statistics
ico2_1

N Valid 193

Missing 5
Mode 1

ico2_1

Cumulative
Frequency Percent Valid Percent Percent

Valid -2 3 1,5 1,6 1,6

-1 38 19,2 19,7 21,2

0 23 11,6 11,9 33,2

1 114 57,6 59,1 92,2

2 15 7,6 7,8 100,0

Total 193 97,5 100,0


Missing System 5 2,5
Total 198 100,0
Modul este 1, majoritatea persoanelor sunt de acord. Observam o distributie a
frecventelor diferite fata de cazul anterior, cu 21.2% din persoane in dezacord, doar 11.9%
avand o parere neutra si 65.2% de acord, deci majoritatea persoanelor considera ca
informatiile de pe Wikipedia sunt corecte.
Media ponderata de 0.518 arata ca majoritatea sunt de acord cu afirmatia.

Informatiile de pe Wikipedia sunt corecte


1,5
7,6
19,2
dezacord total

11,6 dezacord
indiferent
57,6
acord
acord total

5) In ce masura sunteti de acord cu afirmatia: internautii sunt persoane tinere

Statistics
ico2_4

N Valid 194

Missing 4
Mode 1

ico2_4

Cumulative
Frequency Percent Valid Percent Percent

Valid -2 3 1,5 1,5 1,5

-1 58 29,3 29,9 31,4

0 39 19,7 20,1 51,5

1 84 42,4 43,3 94,8

2 10 5,1 5,2 100,0

Total 194 98,0 100,0


Missing System 4 2,0
Total 198 100,0

Din nou modul este 1, dar respondentii se impart aproape egal intre acord si dezacord-
30.8% sunt in dezacord, 47.5% sunt de acord si 19.7% neutri. Media de 0.2 nu ne arata
neaparat ca persoanele sunt neutre cu privire la afirmatie, ci ca parerile sunt impartite, unii
cred ca internautii sunt persoane tinere, iar altii nu. Cel mai probabil, parerea generala este ca
internautii nu sunt numai persoane tinere.

Internautii sunt persoane tinere


1,5
5,1
29,3 dezacord total
dezacord
42,4
indiferent
19,7 acord
acord total

Analiza bivariata
1) Corelatia intre numarul de adulti membri ai familiei si numarul de ore
dormite/noapte

Symmetric Measures

Asymp. Std.
Value Errora Approx. Tb Approx. Sig.

Nominal by Nominal Phi ,638 ,026


Cramer's V ,241 ,026

Contingency Coefficient ,538 ,026


Interval by Interval Pearson's R -,088 ,070 -1,213 ,227c
Ordinal by Ordinal Spearman Correlation -,067 ,069 -,930 ,353c
N of Valid Cases 192

a. Not assuming the null hypothesis.


b. Using the asymptotic standard error assuming the null hypothesis.
c. Based on normal approximation.
Legaturadintre numarul de ore
dormite/noaptesi numarul de membri
adulti ai familiei
12

10

6
Series1
4

0
0 2 4 6 8

Pe axa Oy este reprezentat numarul de ore dormite/noapte, iar pe axa Ox numarul de


persoane adulte din familie.

Coeficientul de corelatie al lui Pearson ne arata o legatura indirecta foarte slaba, deci
nu putem afirma ca exista o legatura intre cele doua variabile, fapt confirmat si de tabel, in
care punctele sunt raspandite haotic, negrupate in jurul vreuneia dintre diagonale, astfel incat
sa putem spune ca exista vreo legatura intre variabile.

2) Corelatia intre “in ce masura sunteti de acord cu urmatoarea afirmatie: Informatiile de


pe Wikipedia sunt corecte” si sex

ico2_1 * iid2 Crosstabulation


Count

iid2

barbatesc femeiesc Total

ico2_1 -2 0 3 3

-1 10 28 38

0 5 18 23

1 19 95 114

2 3 12 15
Total 37 156 193
Symmetric Measures

Value Approx. Sig.

Nominal by Nominal Contingency Coefficient ,114 ,639


N of Valid Cases 193

Coeficientul de corelatie de 0.114 arata o legatura foarte slaba intre sex si masura in care
persoanele chestionate sunt de acord cu afirmatie. Acest lucru se poate observa si din tabelul
de contingenta, un numar mic, atat de femei, cat si de barbati, din total au ales variantele
extreme: dezacord total sau acord total (pentru ambele cazuri 3 in randul barbatilor si 15 in
randul femeilor, reprezentand procente de 8 respectiv 9%), majoritatea au ales acord (51%
dintre barbati si 60% dintre femei), iar restul au fost neutri.

Informatiiledepe Wikipediasunt
corecte
80,0
60,0
40,0 Barbati
20,0 Femei
0,0
Dezacord Dezacord Indiferent Acord Acord
total total

Se observa ca si respondentii de sex feminin si cei de sex masculin au frecvente


asemanatoare, fie ele mici sau mari, pentru aceleasi afirmatii.

3) Corelatia intre numarul de ore dormite/noapte si “in ce masura sunteti de acord cu


afirmatia: Mesajele electorale fac parte din spam”

inc3_va * ico2_0 Crosstabulation


Count

ico2_0

-2 -1 0 1 2 Total

inc3_va mediu 1 9 28 24 16 78

mult 1 1 5 3 4 14

putin 1 13 23 37 27 101
Total 3 23 56 64 47 193

Symmetric Measures

Value Approx. Sig.

Nominal by Nominal Contingency Coefficient ,201 ,419


N of Valid Cases 193
A fost folosita variabila realizata la primul punct. Avem un coeficient de corelatie de
0.201, adica o legatura directa slaba. Din tabelul de contingenta observam ca cei care dom
mediu si mult au avut cele mai mari frecvente pentru un raspuns neutru, pe cand cei care dorm
putin au cea mai mare frecventa pentru acord.

Mesajele electorale fac parte din spam in


functie de timpul dormit/noapte

40,0

30,0
Putin
20,0
Mediu
10,0
Mult
0,0
Dezacord Dezacord Indiferent Acord Acord
total total

Indiferent de numarul de ore dormite/noapte, persoanele au fost in dezacord total cu afirmatia,


majoritatea fiind in acord sau in acord total (51% din cei care dorm un numar mediu de ore,
50% din cei care dorm mult si 63% din cei care dorm putin). In concluzie, numarul ore
dormite/noapte nu influenteaza masura in care persoanele chestionate sunt de acord ca
mesajele electorale fac parte din spam.

www.aseonline.ro
Comunitatea studentilor din A.S.E.

S-ar putea să vă placă și