Documente Academic
Documente Profesional
Documente Cultură
Adrian MARINESCU
C u l e g e r e d e p ro bl e m e
rezolvate cu ajutorul
programului SPSS
1
Adrian MARINESCU
COLECTIVUL DE REDACŢIE
Redactor-şef: Ion IVAN
Coordonator editare: George IANCU
Tehnoredactor: Alexandra VIZITIU
Coperta: Mihai MANEA
© „Mihai Viteazul”
Bucureşti, 2009
Telefon: 021 4106550/1215 sau 1200
Fax: 0213104714
ISBN 978-606-532-020-8
2
Culegere de probleme rezolvate cu ajutorul programului SPSS
Cu vâ n t î n a in te
3
Adrian MARINESCU
4
Culegere de probleme rezolvate cu ajutorul programului SPSS
5
Adrian MARINESCU
1 2 3 4
6
Culegere de probleme rezolvate cu ajutorul programului SPSS
1 2 3 4 5
7
Adrian MARINESCU
8
Culegere de probleme rezolvate cu ajutorul programului SPSS
9
Adrian MARINESCU
10
Culegere de probleme rezolvate cu ajutorul programului SPSS
a b c
11
Adrian MARINESCU
Exemple:
1 2
12
Culegere de probleme rezolvate cu ajutorul programului SPSS
13
Adrian MARINESCU
14
Culegere de probleme rezolvate cu ajutorul programului SPSS
15
Adrian MARINESCU
1. POZIŢIONARE PE CELULĂ
2. CLIC PE BUTON
1 2
16
Culegere de probleme rezolvate cu ajutorul programului SPSS
3 4
17
Adrian MARINESCU
18
Culegere de probleme rezolvate cu ajutorul programului SPSS
19
Adrian MARINESCU
1. Introducerea datelor
Pentru desfăşurarea în bune condiţii a acestei prime
activităţi există trei variante între care se poate opta. Astfel:
1.1. Introducerea datelor în DATA EDITOR – paşii pe
care utilizatorul trebuie să-i parcurgă au fost
prezentaţi mai sus.
1.2. Deschiderea unui fişier de date deja existent (acestea
se recunosc uşor datorită extensiei specifice pe care
o au: sav).
1.3. Importarea unui fişier care poate fi diferit de
formatul cunoscut şi în acest caz trebuie selectată
opţiunea File open şi accesată caseta File of type.
Există şi cazuri când programul SPSS nu recunoaşte
tipul de fişier pe care utilizatorul doreşte să îl
importe. În acest caz, într-o primă etapă, se poate
încerca transformarea acestuia într-un format
recunoscut de SPSS. Chiar dacă este posibil să se
constate unele pierderi (ţin, în special, de formatul în
care sunt prezentate datele), totuşi este preferabil,
această operaţie, decât să fie reintroduse datele ce
urmează să fie prelucrate, mai ales în cazul unor
fişiere ce conţin multe sau foarte multe informaţii.
De asemenea, nu trebuie uitat faptul că se pot utiliza şi
variante rezultate din intersecţia celor trei menţionate anterior, de
exemplu: să se importe date dintr-un fişier de format diferit
(varianta 1.3.) care să poată fi introduse, fie într-un fişier deja
existent (varianta 1.2.) fie într-un nou fişier (varianta 1.1.).
Pentru a nu avea surprize neplăcute, recomandăm ca
intersecţiile prezentate anterior, să nu fie utilizate de către cei se
20
Culegere de probleme rezolvate cu ajutorul programului SPSS
2. Pregătirea datelor
În funcţie de datele obţinute sau, mai ales, de forma lor se
pot efectua, în principal, recodificări, selecţii, corectarea
eventualelor erori, transformarea variabilelor prin calcule,
declararea valorilor lipsă sau combinarea datelor din două fişiere
diferite. Toate aceste operaţii pot fi efectuate accesând, în funcţie
de ceea ce se doreşte meniurile DATA sau TRANSFORM.
21
Adrian MARINESCU
5. Efectuarea procedurii
După ce sunt selectate opţiunile dorite şi îndeplinite toate
cerinţele menţionate în fereastra utilizată, efectuarea procedurii va
începe în urma accesării butonului OK.
22
Culegere de probleme rezolvate cu ajutorul programului SPSS
6. Analiza rezultatelor
Rezultatele tuturor prelucrărilor descrise anterior, se
regăsesc în fereastra specifică pe care utilizatorul deja instruit
(măcar dacă a citit o dată, o lucrare de prezentare a uneia dintre
versiunile programului SPSS) ştie deja că poartă numele de
Output. De asemenea, amintim că pentru prezentarea prelucrării
datelor iniţiale, în funcţie de preferinţele utilizatorului, se poate
opta între prezentarea grafică şi cea de tip text. Odată afişate
rezultatele (indiferent de forma aleasă) rămâne la latitudinea
utilizatorului (am putea adăuga, în funcţie de experienţa sau
intuiţia acestuia), modul în care vor fi interpretate aceste rezultate
şi, dacă este cazul, elaborarea şi implementarea unor decizii.
De multe ori, corectitudinea interpretării datelor, cu
consecinţa elaborării şi implementării unor decizii, nu o putem
determina decât sub forma feedback-ului, adică mult mai târziu sau
câteodată, mult prea târziu. Cuantificarea în unităţi de timp a acestui
moment depinde foarte mult de domeniul în care se acţionează,
feedback-ul putând apare la câteva secunde, dar şi la distanţa unor
ani de la implementarea deciziei luate în urma interpretării
rezultatelor prelucrării datelor iniţiale, cu ajutorul programului SPSS.
Ca urmare, recomandăm ca interpretarea datelor obţinute (mai ales în
cazul unor probleme complexe şi care pot avea consecinţe
importante, pentru cel puţin un grup de persoane), să fie făcută de
către specialişti (varianta ideală) sau, în lipsa acestora, de către
persoane care au o minimă pregătire de specialitate.
23
Adrian MARINESCU
24
Culegere de probleme rezolvate cu ajutorul programului SPSS
cazuri
variabile
25
Adrian MARINESCU
26
Culegere de probleme rezolvate cu ajutorul programului SPSS
27
Adrian MARINESCU
28
Culegere de probleme rezolvate cu ajutorul programului SPSS
6. OUTPUT
Denumire
50
40
30
Count
20
10
0
a b c d e
Denumire
29
Adrian MARINESCU
sau histograme
50
40
Frequency 30
20
10
Mean = 3,01
Std. Dev. = 1,482
N = 183
0
0 1 2 3 4 5 6
Denumire
30
Culegere de probleme rezolvate cu ajutorul programului SPSS
II. D e f i n i r e a p r i me l o r d o u ă c o l o a n e . Î n g e n e r a l ,
c ol o an a u n de s un t t r ec ut e val or i l e se r e gă se şt e s u b
t i t u l a t ur a FR E C V E N Ţ Ă . A c e a s t ă t i t u l a t ur ă n u e s t e
o b l i g a t o r i e , e a p o a t e f i s c h i mb a t ă c u o r i c e a l t t i t l u ,
c o n f or m d o r i nţ e i u t i l i z at or ul ui , d ar e st e
r e c o ma n d a b i l c a n o u a d e n u mi r e s ă s u g e r e z e mă c a r
l a c e s e r e fe r ă u t i l i z a t o r u l , a l t f e l , r i s c u l c a p u b l i c u l
auditor (în cazul în care acesta există) să facă
confuzii, este foarte mare.
III. Etichetarea valorilor primului câmp (de obicei
numele acestuia face referire la domeniul de unde
provin datele şi poate fi utilizată fie forma generală –
denumire – fie una specifică, de exemplu: ocupaţie)
IV. Revenirea în ecranul DATA VIEW şi inserarea
datelor.
V. Ponderea datelor prin efectuarea paşilor DATA –
WEIGHT CASES şi menţionarea în fereastra
FREQUENCY VARIABLE a variabilei
FRECVENŢĂ (reamintim că verificarea corectitudinii
ponderării, se face prin controlarea apariţiei
mesajului WEIGHT ON în colţul dreapta jos al
ferestrei).
VI. Derularea analizei prin parcurgerea următorilor paşi:
ANALYZE – DESCRIPTIVE STATISTICS –
FREQUENCIES. La încheierea ultimului pas, în
fereastra nou deschisă primul câmp (să zicem că
poartă numele DENUMIRE), este transferat în
câmpul de variabile şi în final se apasă butonul OK.
VII. Apariţia OUTPUT
31
Adrian MARINESCU
Rezolvare:
Vom parcurge cele 7 etape prezentate anterior, după cum
urmează:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
32
Culegere de probleme rezolvate cu ajutorul programului SPSS
33
Adrian MARINESCU
V. Ponderea datelor
34
Culegere de probleme rezolvate cu ajutorul programului SPSS
Cumulative
Frequency Percent Valid Percent
Percent
creioane roşii 5 26,3 26,3 26,3
creioane verzi 7 36,8 36,8 63,2
creioane negre 4 21,1 21,1 84,2
creioane albastre 3 15,8 15,8 100,0
Total 19 100,0 100,0
Concluzii
După ce ne-am admirat destul „capodopera” pe care am
reuşit să o obţinem este timpul să tragem câteva concluzii. Chiar
dacă nu vrem să recunoaştem, programul SPSS ne ajută şi de data
aceasta: numai citind denumirea coloanelor tabelului de frecvenţă
şi avem deja o idee asupra ceea ce reprezintă rezultatele finale.
35
Adrian MARINESCU
37
Adrian MARINESCU
38
Culegere de probleme rezolvate cu ajutorul programului SPSS
V. Ponderea datelor
39
Adrian MARINESCU
Cumulative
Frequency Percent Valid Percent
Percent
40
Culegere de probleme rezolvate cu ajutorul programului SPSS
Concluzii
1. Conform coloanei „Frecvenţă”, datele au fost bine
introduse.
2. Coloana „Procent” indică procentul în care fiecare an
de fabricaţie se regăseşte în parcul auto al societăţii
comerciale.
3. După validarea rezultatelor obţinute, ultima coloană
conţine informaţii privind totalurile parţiale ale
procentelor în care se regăsesc, strict în ordine
crescătoare”, anii de fabricaţie.
41
Adrian MARINESCU
14
12
2009
10
2010
8
2011
6
2012
4
2013
2
0
2009 2010 2011 2012 2013
42
Culegere de probleme rezolvate cu ajutorul programului SPSS
Număr
Vârstă (ani)
Băieţi Fete
6 8 8
7 11 10
8 12 14
9 10 13
10 7 12
11 9 15
12 12 17
13 15 10
14 13 14
15 9 14
16 11 10
17 15 6
18 6 5
43
Adrian MARINESCU
44
Culegere de probleme rezolvate cu ajutorul programului SPSS
45
Adrian MARINESCU
46
Culegere de probleme rezolvate cu ajutorul programului SPSS
1 19
2 20
3 20
4 21
5 22
6 21
7 19
8 19
9 20
10 22
11 20
12 20
13 21
14 19
15 19
47
Adrian MARINESCU
48
Culegere de probleme rezolvate cu ajutorul programului SPSS
49
Adrian MARINESCU
50
Culegere de probleme rezolvate cu ajutorul programului SPSS
Statistics 1
Vârstă
N Valid 15 2
Missing 0 3
Mean 20,13
Median 20,00
4
Mode 19(a)
5
51
Adrian MARINESCU
Interpretarea output-ului:
1. Sunt 15 cazuri cu date valide intrate în analiză.
2. Nu sunt date lipsă.
3. Media de vârstă: 20,13 ani.
4. Mediana de vârstă (vârsta studentului, aflată
la mijlocul listei de vârste, de la cea mai mică la cea
mai mare) este 20,00 ani.
5. Mod de vârstă (valoarea cea mai comună) este
19 ani. Existenţa parantezei (a) indică faptul că sunt
mai multe mod-uri, dar a fost aleasă, pentru
prezentare, valoarea cea mai mică.
De asemenea, programul SPSS calculează şi tabelul de
frecvenţă pentru datele iniţiale:
Vârstă
Valid Cumulative
Frequency Percent
Percent Percent
Valid 19 5 33,3 33,3 33,3
20 5 33,3 33,3 66,7
21 3 20,0 20,0 86,7
22 2 13,3 13,3 100,0
Total 15 100,0 100,0
52
Culegere de probleme rezolvate cu ajutorul programului SPSS
53
Adrian MARINESCU
54
Culegere de probleme rezolvate cu ajutorul programului SPSS
55
Adrian MARINESCU
Valid Cumulative
Frequency Percent
Percent Percent
57
Adrian MARINESCU
58
Culegere de probleme rezolvate cu ajutorul programului SPSS
Rata şomajului
Regiunea de dezvoltare
BIM (%)
Nord - Vest 4,3
Centru 8,5
Nord – Est 5,0
Sud – Est 8,5
Bucureşti – Ilfov 4,1
Sud – Muntenia 8,2
Sud – Vest Oltenia 6,8
Vest 5,6
59
Adrian MARINESCU
60
Culegere de probleme rezolvate cu ajutorul programului SPSS
61
Adrian MARINESCU
î n a n u l 2 0 0 7 , î n c o n f o r m i t a t e c u d a t e l e p r e ze n t a t e î n
t a be l u l al ăt u r at :
62
Culegere de probleme rezolvate cu ajutorul programului SPSS
63
Adrian MARINESCU
64
Culegere de probleme rezolvate cu ajutorul programului SPSS
65
Adrian MARINESCU
1 2 3 4 5
Interpretarea output-ului
1. Numărul de cazuri este 15.
2. Valoarea minimă este 771.
3. Valoarea maximă este 3575.
4. Media setului de înregistrări este 1608,27.
5. Abaterea standard este de 786,685.
Revenind la ecranul cu înregistrări (etapa a 2-a) vom observa
apariţia unei noi coloane (cea de-a doua) în care sunt calculat scorurile
z sau standard pentru fiecare dintre cele 15 scoruri înregistrate.
66
Culegere de probleme rezolvate cu ajutorul programului SPSS
67
Adrian MARINESCU
68
Culegere de probleme rezolvate cu ajutorul programului SPSS
69
Adrian MARINESCU
70
Culegere de probleme rezolvate cu ajutorul programului SPSS
71
Adrian MARINESCU
Std.
N Min Max Mean Deviation
Cost 23 1018 4086 1830,96 755,466
Valid N
23
(listwise)
Interpretarea output-ului
1. Numărul de cazuri = 23.
2. Valoarea minimă = 1018.
3. Valoarea maximă = 4086.
4. Media setului de înregistrări = 1830,96.
5. Abaterea standard = 755,466.
Revenind la ecranul cu înregistrări (etapa a 2-a)
vizualizăm scorurile z sau standard pentru fiecare înregistrare.
72
Culegere de probleme rezolvate cu ajutorul programului SPSS
Câştigul nominal
Judeţ mediu net lunar
(lei / salariat)
Alba 933
Bihor 811
Bistriţa-Năsăud 905
Braşov 984
Cluj 1113
Covasna 792
Harghita 814
Maramureş 843
Mureş 950
Satu Mare 896
Sălaj 920
Sibiu 987
Sursă: Anuarul Statistic al României 2008, pag. 293.
73
Adrian MARINESCU
74
Culegere de probleme rezolvate cu ajutorul programului SPSS
75
Adrian MARINESCU
76
Culegere de probleme rezolvate cu ajutorul programului SPSS
77
Adrian MARINESCU
RECOMANDARE
78
Culegere de probleme rezolvate cu ajutorul programului SPSS
79
Adrian MARINESCU
80
Culegere de probleme rezolvate cu ajutorul programului SPSS
81
Adrian MARINESCU
V. Ponderarea datelor
82
Culegere de probleme rezolvate cu ajutorul programului SPSS
83
Adrian MARINESCU
84
Culegere de probleme rezolvate cu ajutorul programului SPSS
85
Adrian MARINESCU
86
Culegere de probleme rezolvate cu ajutorul programului SPSS
87
Adrian MARINESCU
88
Culegere de probleme rezolvate cu ajutorul programului SPSS
89
Adrian MARINESCU
90
Culegere de probleme rezolvate cu ajutorul programului SPSS
91
Adrian MARINESCU
92
Culegere de probleme rezolvate cu ajutorul programului SPSS
100
80
Count
60
40
20
0
Primar,gimnazial, Liceal,postliceal Universitar
profesional
Educaţie
93
Adrian MARINESCU
94
Culegere de probleme rezolvate cu ajutorul programului SPSS
95
Adrian MARINESCU
96
Culegere de probleme rezolvate cu ajutorul programului SPSS
V. Ponderarea datelor
97
Adrian MARINESCU
98
Culegere de probleme rezolvate cu ajutorul programului SPSS
99
Adrian MARINESCU
100
Culegere de probleme rezolvate cu ajutorul programului SPSS
Studii Studii
Studii Studii post-
primare sau liceale sau
universitare universitare
echivalente echivalente
101
Adrian MARINESCU
102
Culegere de probleme rezolvate cu ajutorul programului SPSS
103
Adrian MARINESCU
104
Culegere de probleme rezolvate cu ajutorul programului SPSS
105
Adrian MARINESCU
100 Sex
Masculin
Feminin
80
60
Count
40
20
0
Studii primare Studii liceale sau Studii Studii
sau echivalente echivalente universitare postuniversitare
Educaţie
106
Culegere de probleme rezolvate cu ajutorul programului SPSS
Număr de persoane
Grupa de vârstă (ani)
2006 2007
0- 4 1057804 1062537
5– 9 1098663 1090284
10 – 14 1177605 1135618
15 – 19 1653027 1541828
20 – 24 1599535 1640127
25 – 29 1778735 1740686
30 – 34 1689369 1715518
35 – 39 1869153 1929137
40 – 44 1192648 1200174
45 – 49 1463532 1392744
50 – 54 1528720 1544281
55 – 59 1310266 1360523
60 – 64 977303 984384
65 – 69 1041631 1004068
70 – 74 913325 918177
75 – 79 675967 690768
80 – 84 391080 403440
85 şi peste 166002 183269
Sursa datelor: pagina 45 din Anuarul statistic al României 2008.
107
Adrian MARINESCU
108
Culegere de probleme rezolvate cu ajutorul programului SPSS
109
Adrian MARINESCU
110
Culegere de probleme rezolvate cu ajutorul programului SPSS
Coeficientul
Descriptor
de corelaţie
111
Adrian MARINESCU
112
Culegere de probleme rezolvate cu ajutorul programului SPSS
IMPORTANT
113
Adrian MARINESCU
114
Culegere de probleme rezolvate cu ajutorul programului SPSS
Indicele câştigului
Anul Rata şomajului % salariului real faţă de
anul precedent %
115
Adrian MARINESCU
Observaţii:
116
Culegere de probleme rezolvate cu ajutorul programului SPSS
117
Adrian MARINESCU
118
Culegere de probleme rezolvate cu ajutorul programului SPSS
Rata Indice
Raportarea output-ului:
1. Corelaţia dintre rata şomajului şi indicele
câştigului salariului real faţă de anul precedent
este de –0,81, (conform recomandărilor literaturii de
specialitate corelaţia se rotunjeşte la două zecimale).
119
Adrian MARINESCU
120
Culegere de probleme rezolvate cu ajutorul programului SPSS
121
Adrian MARINESCU
8,0
7,5
Rata
7,0
6,5
6,0
Indice
122
Culegere de probleme rezolvate cu ajutorul programului SPSS
Concluzii:
1. Răspândirea rezultatelor este mai aproape de forma
rectilinie decât de forma curbilinie.
2. Valorile sunt plasate într-o bandă relativ îngustă,
ceea ce indică o corelaţie mare.
3. Linia de regresie este trasată din colţul stânga sus
până în dreapta jos, ceea ce sugerează o corelaţie
negativă
123
Adrian MARINESCU
Număr mediu de
Judeţ Bărbaţi Femei
salariaţi
*
Rezolvarea problemei se face prin parcurgerea celor
9 etape prezentate anterior:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
125
Adrian MARINESCU
126
Culegere de probleme rezolvate cu ajutorul programului SPSS
127
Adrian MARINESCU
128
Culegere de probleme rezolvate cu ajutorul programului SPSS
129
Adrian MARINESCU
Salariaţi
N 12
N 12
Raportarea output-ului:
1. Există un coeficient de corelaţie mare între
numărul de şomeri înregistraţi în anul 2007 şi
numărul mediu al salariaţilor din câteva judeţe
din ţară, uşor mai ridicat, în cazul angajaţilor de
sex feminin.
2. Nivelul de semnificaţie este mai mic de 0,05 în cazul
femeilor.
3. Sunt 10 grade de libertate, notate cu „DF”.
4. Formula finală: În anul 2007, pe baza datelor
problemei, la creşterea numărul mediu al
salariaţilor din câteva judeţe din ţară, se
înregistrează o creştere a numărului de şomeri.
130
Culegere de probleme rezolvate cu ajutorul programului SPSS
131
Adrian MARINESCU
şi ulterior, vom parcurge din nou paşii, pentru cea de-a doua
pereche. În final, de fiecare dată vom apăsa OK
132
Culegere de probleme rezolvate cu ajutorul programului SPSS
30000
Salariaţi
20000
10000
Femei
133
Adrian MARINESCU
134
Culegere de probleme rezolvate cu ajutorul programului SPSS
135
Adrian MARINESCU
136
Culegere de probleme rezolvate cu ajutorul programului SPSS
Rezolvare:
Pentru corelarea cele două variabile, trebuie să transformăm
în prealabil variabilei „Valoare” în valori cu semnificaţie de ordine
de rang, prin parcurgerea următoarelor etape:
a. Accesarea opţiunii TRANSFORM şi alegerea din
meniul acesteia a subopţiunii AUTOMATIC
RECODE.
b. Trecerea variabilei supuse transformării în partea
dreaptă a tabelului de variabile.
c. Tastarea noii denumiri în fereastra cu eticheta NEW
NAME– ADD NEW NAME şi activarea opţiunii OK.
137
Adrian MARINESCU
138
Culegere de probleme rezolvate cu ajutorul programului SPSS
139
Adrian MARINESCU
140
Culegere de probleme rezolvate cu ajutorul programului SPSS
141
Adrian MARINESCU
Poziţie Rang_preţ
Spearman's rho Poziţie Correlation Coefficient 1,000 ,545*
Sig. (2-tailed) . ,013
N 20 20
Rang_preţ Correlation Coefficient ,545* 1,000
Sig. (2-tailed) ,013 .
N 20 20
*. Correlation is significant at the 0.05 level (2-tailed).
142
Culegere de probleme rezolvate cu ajutorul programului SPSS
143
Adrian MARINESCU
15
Poziţie
10
0 5 10 15 20
Rang_preţ
144
Culegere de probleme rezolvate cu ajutorul programului SPSS
145
Adrian MARINESCU
Concluzii:
1. Răspândirea rezultatelor este mai aproape de forma
rectilinie decât de forma curbilinie.
2. Valorile sunt plasate într-o bandă relativ îngustă, ceea
ce indică o corelaţie mare.
3. Linia de regresie este trasată din colţul stânga jos până
în dreapta sus, ceea ce sugerează o corelaţie pozitivă.
2.5.4. Probleme propuse
I. Să se determine dacă, în anul 2007 a existat o
corelaţie între costul lunar orar al forţei de muncă şi câştigul
salarial nominal mediu net în câteva activităţi ale economiei
naţionale, conform datelor prezentate în tabelul următor:
Costul lunar Câştigul salarial
Activitate orar al forţei de nominal mediu
muncă (lei) net (lei)
Agricultură, vânătoare şi 7,56 748
silvicultură
Pescuit şi piscicultură 5,99 586
Industrie extractivă 20,49 1804
Industrie prelucrătoare 8,81 870
Energie electrică şi termică, gaze 16,64 1577
şi apă
Construcţii 9,04 881
Comerţ 8,24 823
Hoteluri şi restaurante 6,57 651
Transport, depozitare şi 12,89 1244
comunicaţii
Intermedieri financiare 27,27 2617
Învăţământ 11,82 1175
Sănătate şi asistenţă socială 10,87 948
Tranzacţii imobiliare şi alte servicii 11,27 1106
Administraţie publică şi apărare 14,39 1997
Sursă: Anuarul Statistic al României 2008, pag. 266 şi
pag. 282.
146
Culegere de probleme rezolvate cu ajutorul programului SPSS
147
Adrian MARINESCU
Alba 26 11
Arad 37 10
Argeş 32 7
Bacău 28 8
Bihor 36 10
Bistriţa-Năsăud 16 4
Botoşani 13 7
Brăila 10 4
Braşov 17 10
Bucureşti-Ilfov 1 9
Buzău 25 5
Călăraşi 14 5
Caraş-Severin 39 8
Cluj 30 6
Constanţa 34 12
Covasna 3 5
Dâmboviţa 5 7
Dolj 35 7
Galaţi 8 4
Giurgiu 2 3
148
Culegere de probleme rezolvate cu ajutorul programului SPSS
Gorj 21 9
Harghita 29 9
Hunedoara 33 14
Ialomiţa 7 7
Ia şi 19 5
Maramureş 27 13
Mehedinţi 12 5
Mureş 31 11
Neamţ 24 5
Olt 20 8
Prahova 9 14
Sălaj 4 4
Satu Mare 6 6
Sibiu 18 11
Suceava 40 16
Teleorman 23 5
Timiş 41 10
Tulcea 38 5
Vâlcea 22 11
Vaslui 15 5
Vrancea 11 5
149
Adrian MARINESCU
150
Culegere de probleme rezolvate cu ajutorul programului SPSS
2.6. Regresia
151
Adrian MARINESCU
152
Culegere de probleme rezolvate cu ajutorul programului SPSS
153
Adrian MARINESCU
154
Culegere de probleme rezolvate cu ajutorul programului SPSS
155
Adrian MARINESCU
156
Culegere de probleme rezolvate cu ajutorul programului SPSS
157
Adrian MARINESCU
2 3 4
a Dependent Variable: Lungime
158
Culegere de probleme rezolvate cu ajutorul programului SPSS
159
Adrian MARINESCU
160
Culegere de probleme rezolvate cu ajutorul programului SPSS
1200
900
Lungime
600
300
Suprafaţă
161
Adrian MARINESCU
162
Culegere de probleme rezolvate cu ajutorul programului SPSS
163
Adrian MARINESCU
1500
1
1200
2
900
Lungime
600
300
R Sq Linear = 0,669
Suprafaţă
IMPORTANT
Dacă plasarea variabilelor pe cele două axe s-a efectuat
greşit (ne dăm seama comparând output-ul tabelar cu diagrama
scatter) nu este o problemă: parcurgeţi din nou etapele construirii
diagramei scatter, dar aveţi grijă să inversaţi plasarea pe axe a
celor două variabile.
164
Culegere de probleme rezolvate cu ajutorul programului SPSS
165
Adrian MARINESCU
166
Culegere de probleme rezolvate cu ajutorul programului SPSS
167
Adrian MARINESCU
168
Culegere de probleme rezolvate cu ajutorul programului SPSS
169
Adrian MARINESCU
Interpretare:
1 = Constanta are valoarea de 4,253 şi reprezintă
punctul în care, pe diagrama scatter, linia de
regresie se intersectează cu axa verticală.
2 = Coeficientul nestandardizat al regresiei simple
are semnificaţia: pentru fiecare creştere cu o
unitate, a variabilei „Oraşe Municipii”, variabila
„Numărul şomerilor înregistraţi” creşte cu 0,001.
3 = Coeficientul standardizat al regresiei simple are
valoarea 0,514 şi reprezintă (mai mult sau mai
puţin) coeficientul de corelaţie Pearson între cele
ouă variabile ale problemei.
4 = Intervalul de încredere este 0,00 – 0,001, iar în
cazul acestuia, este foarte probabil (procentul de
probabilitate este de 95%) să varieze coeficientul
nestandardizat determinat pentru datele problemei.
170
Culegere de probleme rezolvate cu ajutorul programului SPSS
171
Adrian MARINESCU
12000
10000
Şomeri
8000
6000
4000
2000
4 6 8 10 12 14
Oraşe_Municipii
172
Culegere de probleme rezolvate cu ajutorul programului SPSS
173
Adrian MARINESCU
14000
12000
10000
Şomeri
8000
6000
4000
R Sq Linear = 0,265
2000
4 6 8 10 12 14
Oraşe_Municipii
174
Culegere de probleme rezolvate cu ajutorul programului SPSS
Y’ = 4,253 + 0,001X
unde:
X = valoarea pentru numărul de oraşe şi municipii
dintr-un judeţ
Y’ = cea mai bună predicţie a valorii pentru numărul de
şomeri înregistraţi.
175
Adrian MARINESCU
176
Culegere de probleme rezolvate cu ajutorul programului SPSS
Bihor 90 6706
Cluj 75 10203
Maramureş 63 7068
Sălaj 57 4739
Alba 67 10509
Braşov 48 12603
Covasna 40 6653
Harghita 58 7163
Mureş 91 10691
Sibiu 53 5806
177
Adrian MARINESCU
2.7. Eşantionarea
2.7.1. Recapitularea principalelor elemente teoretice
Chiar dacă, în prezent, nu este o procedură utilizată
frecvent în practica curentă, eşantionarea reprezintă unul dintre
elementele de bază ale statisticii. Momentul de glorie al acestei
proceduri s-a consumat în perioada în care tehnica de calcul nu
exista, sau nu era atât de dezvoltată, ca în momentul de faţă.
Închipuiţi-vă cum ar fi să trebuiască să efectuaţi analize
statistice asupra unor seturi imense de date şi având la dispoziţie
un buget limitat de timp.
Şi atunci, de ce mai trebuie studiată această tehnică?
Unul dintre răspunsurile posibile, la această întrebare, se
leagă de mai buna înţelegere a statisticii inferenţiale. Dacă mai
doriţi completări, amintiţi-vă de teoria sondajelor.
179
Adrian MARINESCU
180
Culegere de probleme rezolvate cu ajutorul programului SPSS
181
Adrian MARINESCU
182
Culegere de probleme rezolvate cu ajutorul programului SPSS
183
Adrian MARINESCU
184
Culegere de probleme rezolvate cu ajutorul programului SPSS
185
Adrian MARINESCU
186
Culegere de probleme rezolvate cu ajutorul programului SPSS
187
Adrian MARINESCU
188
Culegere de probleme rezolvate cu ajutorul programului SPSS
X. Interpretarea output-ului
a. Procent de 15%
N Minimum Maximum Mean Std. Deviation
Salariaţi 5 2280 4840 3647,00 1007,060
Valid N
5
(listwise)
189
Adrian MARINESCU
Alba 11151
Arad 16771
Argeş 17787
Bacău 19495
Bihor 30232
Bistriţa-Năsăud 9166
Botoşani 8581
Brăila 11489
Braşov 31155
Buzău 13061
Călăraşi 5503
Caraş-Severin 6395
Cluj 37859
Constanţa 31040
Covasna 8086
190
Culegere de probleme rezolvate cu ajutorul programului SPSS
191
Adrian MARINESCU
192
Culegere de probleme rezolvate cu ajutorul programului SPSS
193
Adrian MARINESCU
Medie
Sex Vârstă (ani)
Sport Matematică
Feminin 18 8,75 9,00
Feminin 19 8,60 8,80
Feminin 17 8,90 8,75
Feminin 18 8,95 9,10
Masculin 19 9,10 9,20
Feminin 15 9,00 9,00
Masculin 16 9,30 9,20
Feminin 13 9,25 9,00
Masculin 19 8,89 9,00
Masculin 19 9,10 8,80
Pentru rezolvarea problemei vom parcurge etapele
menţionate mai sus:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
194
Culegere de probleme rezolvate cu ajutorul programului SPSS
195
Adrian MARINESCU
196
Culegere de probleme rezolvate cu ajutorul programului SPSS
Dacă dorim să
selectăm numai
persoanele de
sex feminin
197
Adrian MARINESCU
Dacă dorim să
selectăm numai
persoanele de
sex masculin
198
Culegere de probleme rezolvate cu ajutorul programului SPSS
199
Adrian MARINESCU
Correlations
Sport Matematică
Sport Pearson Correlation 1 -,165
Sig. (2-tailed) ,574
N 14 14
Matematică Pearson Correlation -,165 1
Sig. (2-tailed) ,574
N 14 14
Interpretarea output-ului
a. Corelaţia se bazează pe cele 14 înregistrări selectate
din tabelul iniţial.
b. Corelaţia dintre rezultatele la Matematică şi
respectiv, cele înregistrate la Sport este de –0,165.
c. La un test de semnificaţie, two-tailed la nivelul de
probabilitate de 0,574 sau mai mic, corelaţia este
semnificativă.
200
Culegere de probleme rezolvate cu ajutorul programului SPSS
Formulă:
Între mediile obţinute de persoanele de sex feminin, la
disciplinele „Matematică” şi respectiv „Sport” există o corelaţie
negativă semnificativă (r = -0,165, DF = 12, p < 0,574). Persoanele
de sex feminin, cuprinse în analiză, cu un nivel ridicat al abilităţilor
matematice au un nivel scăzut al performanţelor sportive.
II. Având datele unor staţii meteorologice din
România, să se efectuează o analiza statistică, în vederea
determinării existenţei unei corelaţii între maxima absolută
anuală (grade Celsius) şi cantitatea de precipitaţii (mm).
Analiza va fi aplicată numai temperaturilor mai mari
de 39 de grade Celsius, înregistrate în anul 2007.
S ta ţi a Maxima absolută Cantitatea anuală
meteorologică anuală (grade Celsius) de precipitaţii (mm)
Satu Mare 3 9 ,2 708,9
Suceava 3 6 ,0 687,5
Oradea 4 0 ,4 655,5
Iaşi 4 0 ,1 513,6
Cluj-Napoca 3 8 ,0 806,3
Târgu Mureş 3 7 ,9 746,1
Bacău 4 0 ,3 603,8
Timişoara 4 1 ,1 649,2
Deva 4 0 ,0 655,9
S ib iu 3 8 ,3 777,3
Vârfu Omu 2 0 ,0 875,7
Galaţi 4 0 ,5 499,6
Târgu Jiu 4 0 ,7 1082,3
Buzău 4 0 ,3 542,4
Calafat 4 4 ,3 583,7
Turnu Măgurele 4 3 ,4 595,6
Bucureşti-Filaret 4 1 ,8 610,2
Constanţa 3 8 ,5 493,7
Sursa: Anuarul statistic al României 2008, pag. 17.
201
Adrian MARINESCU
202
Culegere de probleme rezolvate cu ajutorul programului SPSS
203
Adrian MARINESCU
204
Culegere de probleme rezolvate cu ajutorul programului SPSS
205
Adrian MARINESCU
Maxima_
anuală > 39
Precipitaţii (FILTER)
Precipitaţii Pearson Correlation 1 .a
Sig. (2-tailed) .
N 12 12
Maxima_anuală Pearson Correlation .a .a
> 39 (FILTER) Sig. (2-tailed) .
N 12 12
a. Cannot be computed because at least one of the variables is
constant.
206
Culegere de probleme rezolvate cu ajutorul programului SPSS
207
Adrian MARINESCU
208
Culegere de probleme rezolvate cu ajutorul programului SPSS
209
Adrian MARINESCU
Alba 376086
Arad 457713
Argeş 644236
Bacău 719844
Bihor 594131
Bistriţa-Năsăud 316689
Botoşani 454167
Brăila 365628
Braşov 593928
Buzău 488763
Călăraşi 315187
Caraş-Severin 327579
Cluj 692316
Constanţa 718330
Covasna 223364
Dâmboviţa 533330
Dolj 712187
Galaţi 614449
Giurgiu 283408
210
Culegere de probleme rezolvate cu ajutorul programului SPSS
Gorj 381643
Harghita 325611
Hunedoara 472284
Ialomiţa 290563
Iaşi 825100
Ilfov 294094
Maramureş 513000
Mehedinţi 298741
Mureş 581759
Neamţ 566059
Olt 475702
Prahova 821013
Sălaj 243157
Satu Mare 366270
Sibiu 423156
Suceava 705878
Teleorman 413064
Timiş 666866
Tulcea 250641
Vâlcea 411576
Sursă: Anuarul Statistic al României – 2008, pag. 48
211
Adrian MARINESCU
212
Culegere de probleme rezolvate cu ajutorul programului SPSS
213
Adrian MARINESCU
214
Culegere de probleme rezolvate cu ajutorul programului SPSS
215
Adrian MARINESCU
Grupa de vârstă
Grupa de ocupaţii
35-44 ani (%)
Funcţionari administrativi 31,5
Lucrători operativi în servicii, comerţ 29,3
şi asimilaţi
Agricultori şi lucrători calificaţi în 24,4
agricultură, silvicultură şi pescuit
Meşteşugari şi lucrători calificaţi în 32,0
meserii de tip artizanal, de reglare şi
întreţinere ale maşinilor şi instalaţiilor
Alte categorii 31,1
Sursă: Anuarul statistic al României – 2008, pag. 129
Pentru calcularea erorii standard derulăm toate etapele
prezentate mai sus:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
216
Culegere de probleme rezolvate cu ajutorul programului SPSS
217
Adrian MARINESCU
218
Culegere de probleme rezolvate cu ajutorul programului SPSS
219
Adrian MARINESCU
Grupa de vârstă
Grupa de ocupaţii
15-24 ani (%)
221
Adrian MARINESCU
Masculin Feminin
An
(mii persoane) (mii persoane)
2002 679 581
2003 665 563
2004 650 543
2005 643 544
2006 654 563
2007 642 556
Sursă: Anuarul statistic al României – 2008, pag. 155
222
Culegere de probleme rezolvate cu ajutorul programului SPSS
223
Adrian MARINESCU
Media obţinută în
Sexul studentului
Anul I Anul II
Feminin 8,45 8,75
Masculin 8,40 8,00
Masculin 8,25 8,30
Feminin 8,10 7,90
Feminin 8,40 9,30
Feminin 8,25 9,00
Masculin 8,00 9,20
Masculin 8,15 8,15
Feminin 9,00 9,10
Feminin 8,25 8,00
Masculin 6,90 7,80
Masculin 7,10 8,00
Feminin 8,20 8,25
Masculin 7,10 7,25
Feminin 8,10 8,15
Feminin 7,20 7,50
Feminin 7,90 7,10
Feminin 8.30 8,50
Masculin 7,70 8,15
Feminin 8,20 8,30
Feminin 7,70 8,20
Masculin 9,40 9,90
Masculin 9,50 9,80
Masculin 8,20 8,10
Masculin 7,20 7,90
224
Culegere de probleme rezolvate cu ajutorul programului SPSS
225
Adrian MARINESCU
226
Culegere de probleme rezolvate cu ajutorul programului SPSS
Std. Error
Mean N Std. Deviation
Mean
227
Adrian MARINESCU
Tabelul 2
Paired Samples Correlations
N Correlation Sig.
Pair 1 An_1 & An_2 30 ,759 ,000
Tabelul 3
Sig.
Paired Differences t df
(2-tailed)
Std. 95% Confidence
Std. Error Interval of the
Mean Deviation Mean Difference
Lower Upper
Pair 1 An_1 -
-,37567 ,56410 ,10299 -,58630 -,16503 -3,648 29 ,001
An_2
228
Culegere de probleme rezolvate cu ajutorul programului SPSS
229
Adrian MARINESCU
Câştig salarial
Activitate nominal (lei / salariat)
2006 2007
Celuloză, hârtie şi produse din hârtie 657 743
Edituri, poligrafie şi reproducerea 693 826
pe suporţi a înregistrărilor
Prelucrarea ţiţeiului, cocsificarea 1599 1700
cărbunelui şi tratarea combustibililor
nucleari
Substanţe şi produse chimice 1113 1298
Produse din cauciuc şi mase plastice 639 776
Fabricarea materialelor de construcţii 810 992
şi alte produse din materiale nemetalice
Metalurgie 1047 1159
Construcţii metalice şi produse din 739 897
metal
Maşini şi echipamente 796 926
Mijloace ale tehnicii de calcul şi de birou 643 756
Maşini şi aparate electrice 699 815
Echipamente pentru radio, tv şi 1152 1260
comunicaţii
Aparatură şi instrumente medicale, 735 814
de precizie, optice şi ceasornicărie
Mijloace de transport rutier 927 1039
Mijloace de transport neincluse la 985 1131
cele rutiere
Mobilier şi alte activităţi industriale 586 660
neclasificate în altă parte
Recuperarea deşeurilor 609 779
Sursă: Anuarul Statistic al României 2008, pag. 271.
230
Culegere de probleme rezolvate cu ajutorul programului SPSS
231
Adrian MARINESCU
232
Culegere de probleme rezolvate cu ajutorul programului SPSS
233
Adrian MARINESCU
Tabelul 2
Paired Samples Correlations
N Correlation Sig.
Tabelul 3
Paired Samples Test
Paired Differences t df
Sig.
Std. 95% Confidence (2-tailed)
Std.
Mean Error Interval of the
Deviation
Mean Difference
Lower Upper
Pair 1
An_2006 - -94,174 138,846 28,951 -154,216 -34,132 -3,253 22 ,004
An_2007
234
Culegere de probleme rezolvate cu ajutorul programului SPSS
235
Adrian MARINESCU
236
Culegere de probleme rezolvate cu ajutorul programului SPSS
237
Adrian MARINESCU
238
Culegere de probleme rezolvate cu ajutorul programului SPSS
239
Adrian MARINESCU
240
Culegere de probleme rezolvate cu ajutorul programului SPSS
241
Adrian MARINESCU
242
Culegere de probleme rezolvate cu ajutorul programului SPSS
243
Adrian MARINESCU
244
Culegere de probleme rezolvate cu ajutorul programului SPSS
Tabelul 1
Group Statistics
245
Adrian MARINESCU
Tabelul 2
Levene's
Test for
t-test for Equality of Means
Equality of
Variances
Std.
95% Confidence
Sig. (2- Mean Error
F Sig. t df Interval of the
tailed) Difference Differen
Difference
ce
Lower Upper
Notă
Equal ,083 ,775 -1,203 53 ,234 -,19267 ,16010 -,51378 ,12845
variances
assumed
Equal
variances 50,3
-1,198 ,236 -,19267 ,16077 -,51553 ,13019
not 18
assumed
246
Culegere de probleme rezolvate cu ajutorul programului SPSS
247
Adrian MARINESCU
248
Culegere de probleme rezolvate cu ajutorul programului SPSS
249
Adrian MARINESCU
250
Culegere de probleme rezolvate cu ajutorul programului SPSS
251
Adrian MARINESCU
252
Culegere de probleme rezolvate cu ajutorul programului SPSS
Std. Error
Denumire N Mean Std. Deviation Mean
Câştig_salaria Agricultură 18 989,22 106,908 25,198
Pescuit 18 754,56 230,852 54,412
Equal
variances 3,913 23,971 ,001 234,667 59,964 110,900 358,434
not assumed
253
Adrian MARINESCU
254
Culegere de probleme rezolvate cu ajutorul programului SPSS
255
Adrian MARINESCU
41 – 45 446 267
46 – 50 512 264
51 – 55 663 362
56 – 60 721 461
61 – 65 1524 497
66 – 70 1541 502
71 – 75 1705 589
76 – 80 1767 667
81 – 85 1829 637
86 – 90 3748 812
91 – 95 3999 951
256
Culegere de probleme rezolvate cu ajutorul programului SPSS
257
Adrian MARINESCU
258
Culegere de probleme rezolvate cu ajutorul programului SPSS
259
Adrian MARINESCU
260
Culegere de probleme rezolvate cu ajutorul programului SPSS
Canale
Respondenţi
Sport Artă SF Culturale Muzică
Femei 10 17 8 12 11
Bărbaţi 15 6 9 7 5
261
Adrian MARINESCU
262
Culegere de probleme rezolvate cu ajutorul programului SPSS
263
Adrian MARINESCU
264
Culegere de probleme rezolvate cu ajutorul programului SPSS
265
Adrian MARINESCU
266
Culegere de probleme rezolvate cu ajutorul programului SPSS
267
Adrian MARINESCU
268
Culegere de probleme rezolvate cu ajutorul programului SPSS
Cases
Valid Missing Total
N Percent N Percent N Percent
Sex * Program 100 100,0% 0 ,0% 100 100,0%
Program
Sport Artă SF Cultural Muzică Total
Sex Masculin Count 15 6 9 7 5 42
Expected Count 10,5 9,7 7,1 8,0 6,7 42,0
Residual 4,5 -3,7 1,9 -1,0 -1,7
Feminin Count 10 17 8 12 11 58
Expected Count 14,5 13,3 9,9 11,0 9,3 58,0
Residual -4,5 3,7 -1,9 1,0 1,7
Total Count 25 23 17 19 16 100
Expected Count 25,0 23,0 17,0 19,0 16,0 100,0
1 3 2
În cadrul acestui tabel sunt prezentate frecvenţa şi
frecvenţa aşteptată, pentru fiecare dintre celulele tabelului.
De exemplu, dacă analizăm datele prezentate în dreptul
persoanelor de sex feminin, care urmăresc programele de sport,
vom putea concluziona:
1. Numărul total de fete care preferă programele de
sport este 10.
2. Numărul anticipat de probabilitatea este 14,5.
3. Diferenţa dintre valorile de mai sus este de –4,5.
269
Adrian MARINESCU
Tabelul 3
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 7,518a 4 ,111
Likelihood Ratio 7,614 4 ,107
Linear-by-Linear
1,924 1 ,165
Association
N of Valid Cases 100
a. 0 cells (,0%) have expected count less than 5. The
minimum expected count is 6,72.
270
Culegere de probleme rezolvate cu ajutorul programului SPSS
Program
Sport Artă SF Cultural Muzică Total
Sex Masculin Count 15 6 9 7 5 42
Expected Count 10,5 9,7 7,1 8,0 6,7 42,0
% within Progra 60,0% 26,1% 52,9% 36,8% 31,3% 42,0%
Residual 4,5 -3,7 1,9 -1,0 -1,7
Feminin Count 10 17 8 12 11 58
Expected Count 14,5 13,3 9,9 11,0 9,3 58,0
% within Progra 40,0% 73,9% 47,1% 63,2% 68,8% 58,0%
Residual -4,5 3,7 -1,9 1,0 1,7
Total Count 25 23 17 19 16 100
Expected Count 25,0 23,0 17,0 19,0 16,0 100,0
% within Progra 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%
271
Adrian MARINESCU
272
Culegere de probleme rezolvate cu ajutorul programului SPSS
273
Adrian MARINESCU
274
Culegere de probleme rezolvate cu ajutorul programului SPSS
275
Adrian MARINESCU
276
Culegere de probleme rezolvate cu ajutorul programului SPSS
277
Adrian MARINESCU
278
Culegere de probleme rezolvate cu ajutorul programului SPSS
Cases
Valid Missing Total
N Percent N Percent N Percent
Judeţ * Person 48126 100,0% 0 ,0% 48126 100,0%
279
Adrian MARINESCU
Tabelul 2
Judeţ * Personal Crosstabulation
Personal
Medici Stomatologi Farmacişti Asistenţi Total
Judeţ Alba Count 632 161 249 2133 3175
Expected Count 756,2 183,7 190,7 2044,4 3175,0
% within Personal 5,5% 5,8% 8,6% 6,9% 6,6%
Residual -124,2 -22,7 58,3 88,6
Braşov Count 1228 301 352 3165 5046
Expected Count 1201,8 292,0 303,0 3249,2 5046,0
% within Personal 10,7% 10,8% 12,2% 10,2% 10,5%
Residual 26,2 9,0 49,0 -84,2
Bihor Count 1180 435 353 3902 5870
Expected Count 1398,0 339,7 352,5 3779,8 5870,0
% within Personal 10,3% 15,6% 12,2% 12,6% 12,2%
Residual -218,0 95,3 ,5 122,2
Bistriţa-Năsăud Count 406 124 124 1572 2226
Expected Count 530,2 128,8 133,7 1433,4 2226,0
% within Personal 3,5% 4,5% 4,3% 5,1% 4,6%
Residual -124,2 -4,8 -9,7 138,6
Cluj Count 406 124 124 1572 2226
Expected Count 530,2 128,8 133,7 1433,4 2226,0
% within Personal 3,5% 4,5% 4,3% 5,1% 4,6%
Residual -124,2 -4,8 -9,7 138,6
Covasna Count 346 75 77 1186 1684
Expected Count 401,1 97,5 101,1 1084,4 1684,0
% within Personal 3,0% 2,7% 2,7% 3,8% 3,5%
Residual -55,1 -22,5 -24,1 101,6
Harghita Count 384 111 139 1842 2476
Expected Count 589,7 143,3 148,7 1594,3 2476,0
% within Personal 3,4% 4,0% 4,8% 5,9% 5,1%
Residual -205,7 -32,3 -9,7 247,7
Maramureş Count 3158 645 533 5611 9947
Expected Count 2369,0 575,6 597,3 6405,0 9947,0
% within Personal 27,6% 23,2% 18,4% 18,1% 20,7%
Residual 789,0 69,4 -64,3 -794,0
Mureş Count 1790 280 407 4406 6883
Expected Count 1639,3 398,3 413,3 4432,1 6883,0
% within Personal 15,6% 10,1% 14,1% 14,2% 14,3%
Residual 150,7 -118,3 -6,3 -26,1
Satu Mare Count 530 162 191 1941 2824
Expected Count 672,6 163,4 169,6 1818,4 2824,0
% within Personal 4,6% 5,8% 6,6% 6,3% 5,9%
Residual -142,6 -1,4 21,4 122,6
Sălaj Count 321 74 94 1349 1838
Expected Count 437,7 106,4 110,4 1183,5 1838,0
% within Personal 2,8% 2,7% 3,3% 4,4% 3,8%
Residual -116,7 -32,4 -16,4 165,5
Sibiu Count 1081 293 247 2310 3931
Expected Count 936,2 227,5 236,1 2531,2 3931,0
% within Personal 9,4% 10,5% 8,5% 7,5% 8,2%
Residual 144,8 65,5 10,9 -221,2
Total Count 11462 2785 2890 30989 48126
Expected Count 11462,0 2785,0 2890,0 30989,0 48126,0
% within Personal 100,0% 100,0% 100,0% 100,0% 100,0%
280
Culegere de probleme rezolvate cu ajutorul programului SPSS
Î n c a dr ul a c e s t ui t a b e l s unt pr e z e nt a t e fr e c ve nţ a ş i
fr e c ve nţ a a ş t e pt a t ă , pe nt r u fi e c a r e di nt r e c e l ul e l e t a be l ul ui .
De e xe mpl u, da c ă a na l i z ă m da t e l e va l a bi l e pe nt r u
j udeţ ul Al b a, vo m put e a concl uzi o na:
1. Numărul total de medici din judeţul Alba este de 632.
2. Ac e s t nu mă r r e pr e z i nt ă 5,5 % di n t ot a l ul me di c i l or
din jud eţele luate în cal cul.
3. Nu mă r ul t ot a l de me di c i e s t e de 11 4 62.
Tabelul 3
Chi-Square Tests
Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 947,998a 33 ,000
Likelihood Ratio 947,840 33 ,000
Linear-by-Linear
76,129 1 ,000
Association
N of Valid Cases 48126
a. 0 cells (,0%) have expected count less than 5. The
minimum expected count is 97,45.
281
Culegere de probleme rezolvate cu ajutorul programului SPSS
Unităţi medicale
Judeţ Lab. de
Depozite Laboratoare
tehnică
farmaceutice medicale
dentară
Alba 1 56 35
Bihor 8 70 79
Bistriţa-Năsăud 1 18 45
Braşov 24 29 56
Cluj 34 146 143
Covasna 1 20 29
Harghita 4 40 51
Maramureş 7 25 67
Mureş 14 83 70
Satu Mare 3 39 41
S ă la j 1 19 32
S ib iu 11 31 73
Sursa: Anuarul Statistic al României 2008, pag. 380
281
Adrian MARINESCU
282
Culegere de probleme rezolvate cu ajutorul programului SPSS
283
Adrian MARINESCU
284
Culegere de probleme rezolvate cu ajutorul programului SPSS
Notă
Elev
Matematică Limba română
Ghiţă Aurel 6 9
Ghiţulescu Andreea 9 8
Ionescu Răzvan 9 10
Marinciu Andrei 5 6
Mercea Valentin 10 10
Militaru Costel 8 10
Mitulescu Marius 6 9
Mocanu Andreea 7 10
Moise Maria 6 8
Moştenescu Ionuţ 7 8
Petrescu Ionuţ 10 7
Pitulescu Ionuţ 10 9
Pop Adriana 7 5
Popescu Cornelia 8 6
Popoviciu Elena 9 5
Răduţă Constantin 7 7
Rădulescu Bogdan 8 8
Stoian Valentina 9 8
Teclu Şerban 8 9
Ţicleanu Ionuţ 9 7
Vasilescu Pertică 6 6
Vasileţ Petre 8 7
Vintilescu Adrian 10 6
Voinescu Cristian 7 6
285
Adrian MARINESCU
286
Culegere de probleme rezolvate cu ajutorul programului SPSS
287
Adrian MARINESCU
288
Culegere de probleme rezolvate cu ajutorul programului SPSS
289
Adrian MARINESCU
Tabelul 2
Test Statisticsb
Română -
Matematică
Z -,217a
Asymp. Sig. (2-tailed) ,828
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test
290
Culegere de probleme rezolvate cu ajutorul programului SPSS
291
Adrian MARINESCU
292
Culegere de probleme rezolvate cu ajutorul programului SPSS
293
Adrian MARINESCU
294
Culegere de probleme rezolvate cu ajutorul programului SPSS
295
Adrian MARINESCU
Intern - Export
Z -1,817a
Asymp. Sig. (2-tailed) ,069
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test
296
Culegere de probleme rezolvate cu ajutorul programului SPSS
297
Adrian MARINESCU
298
Culegere de probleme rezolvate cu ajutorul programului SPSS
299
Adrian MARINESCU
300
Culegere de probleme rezolvate cu ajutorul programului SPSS
Total
Judeţ
Instituţii de
Şomeri
învăţământ superior
301
Adrian MARINESCU
Dolj 14347 3
Galaţi 1849 2
Iaşi 2413 10
Maramureş 2841 2
Total
Judeţ Instituţii de
Şomeri
învăţământ superior
Mureş 2640 4
Prahova 12124 1
Sibiu 2100 4
Timiş 5487 8
Sursa: Anuarul Statistic al României 2008, pag. 230 şi 402
Pentru rezolvarea problemei vom parcurge cele 9 etape
prezentate anterior:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
302
Culegere de probleme rezolvate cu ajutorul programului SPSS
303
Adrian MARINESCU
304
Culegere de probleme rezolvate cu ajutorul programului SPSS
305
Adrian MARINESCU
306
Culegere de probleme rezolvate cu ajutorul programului SPSS
307
Adrian MARINESCU
308
Culegere de probleme rezolvate cu ajutorul programului SPSS
Frecvenţă
Mann-Whitney U ,000
Wilcoxon W 171,000
Z -5,139
Asymp. Sig. (2-tailed) ,000
Exact Sig. [2*(1-tailed a
,000
Sig.)]
a. Not corrected for ties.
b. Grouping Variable: Denumire
309
Adrian MARINESCU
310
Culegere de probleme rezolvate cu ajutorul programului SPSS
Galaţi 4466 4
Total
Judeţ 2
Suprafaţă (km ) Facultăţi private
Iaşi 5476 14
Mureş 6714 5
Sibiu 5432 4
Timiş 8697 15
Sursa: Anuarul Statistic al României 2008, pag. 16 şi 410
Pentru rezolvarea problemei vom parcurge cele 9 etape
prezentate anterior:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
311
Adrian MARINESCU
312
Culegere de probleme rezolvate cu ajutorul programului SPSS
313
Adrian MARINESCU
314
Culegere de probleme rezolvate cu ajutorul programului SPSS
315
Adrian MARINESCU
316
Culegere de probleme rezolvate cu ajutorul programului SPSS
317
Adrian MARINESCU
Test Statistics b
Frecvenţă
Mann-Whitney U ,000
Wilcoxon W 105,000
Z -4,505
Asymp. Sig. (2-tailed) ,000
Exact Sig. [2*(1-tailed a
,000
Sig.)]
a. Not corrected for ties.
b. Grouping Variable: Denumire
318
Culegere de probleme rezolvate cu ajutorul programului SPSS
319
Adrian MARINESCU
Braşov 3 6
Brăila 2
Bucureşti 35 81
Cluj 10 7
Constanţa 5 9
Dolj 3 5
Galaţi 2 4
Iaşi 10 14
Mureş 4 5
Sibiu 4 4
Timiş 8 15
Sursa: Anuarul Statistic al României 2008, pag. 402 şi 410
2.15. Valorile lipsă
2.15.1. Recapitularea principalelor elemente teoretice
Este posibil ca rezultatele unei cercetări să nu cuprindă
întreg setul de informaţii obţinut de la fiecare respondent. Ar fi
păcat să nu exploatăm toate datele colectate (nu mai punem la
socoteală volumul de muncă care ar deveni inutil…) din cauza
faptului că o informaţie lipseşte. Dacă setul ar fi de două sau chiar
trei informaţii, poate nu ar fi aşa de grav, dar gândiţi-vă, dacă tot
setul cuprinde 12-13 informaţii şi datorită lipsei unei valori, nu
veţi putea utiliza restul de 11-12 informaţii, v-ar conveni?
Aşa cum lucrările de specialitate recomandă, decât să nu
se introducă nimic în locul informaţiei lipsă (este posibil ca
programul SPSS să interpreteze „la bunul plac” setul de informaţii
şi în consecinţă, rezultatele analizei să fie greşite), trebuie
specificată (dar cu mare atenţie), valoarea lipsă, pentru a nu crea
premisele unei interpretări greşite. Practic, în vederea depăşirii
acestei etape, trebuie să stabilim, limitele datelor din coloana în
care lipseşte o valoare şi să o codificăm cu un număr situat, în
afara limitelor intervalului stabilit.
320
Culegere de probleme rezolvate cu ajutorul programului SPSS
321
Adrian MARINESCU
322
Culegere de probleme rezolvate cu ajutorul programului SPSS
Feminin 18 22 22
Feminin 16 23 26
Masculin 17 27
Feminin 17 21 22
Feminin 22 27
Masculin 17 30
Feminin 16 25 29
Masculin 18 27 27
Feminin 18 24 30
Masculin 17 28 26
323
Adrian MARINESCU
324
Culegere de probleme rezolvate cu ajutorul programului SPSS
B C A
325
Adrian MARINESCU
326
Culegere de probleme rezolvate cu ajutorul programului SPSS
327
Adrian MARINESCU
328
Culegere de probleme rezolvate cu ajutorul programului SPSS
329
Adrian MARINESCU
330
Culegere de probleme rezolvate cu ajutorul programului SPSS
331
Adrian MARINESCU
332
Culegere de probleme rezolvate cu ajutorul programului SPSS
Restaurante Stat 11 11 8
Baruri Stat 11 3 2
333
Adrian MARINESCU
334
Culegere de probleme rezolvate cu ajutorul programului SPSS
335
Adrian MARINESCU
B C A
336
Culegere de probleme rezolvate cu ajutorul programului SPSS
337
Adrian MARINESCU
338
Culegere de probleme rezolvate cu ajutorul programului SPSS
339
Adrian MARINESCU
340
Culegere de probleme rezolvate cu ajutorul programului SPSS
341
Adrian MARINESCU
342
Culegere de probleme rezolvate cu ajutorul programului SPSS
343
Adrian MARINESCU
Număr
Activitate Organizare
2005 2006 2007
Hoteluri, Persoane independente 1372 1677 1729
restaurante
Turism Asociaţii familiale 643 509 506
Turism Persoane independente 450 421 434
Transport Asociaţii familiale 5492 4349 4323
Transport Persoane independente 54741 46920 48368
Alte servicii Asociaţii familiale 37850 29971 29793
Alte servicii Persoane independente 109810 95715 98670
Sursa: Anuarul Statistic al României 2008, pag. 698
BIBLIOGRAFIE
344
Culegere de probleme rezolvate cu ajutorul programului SPSS
CUPRINS
Cuv ânt î n a i nt e . .... ... ... . .... ... ... ... ... ... .... ... ... ... ... ... .... ... ... .. 3
1. Prezentarea principalelor elemente ale
programului SPSS ..............................................................5
1.1. Generalităţi ................................................................... 5
1.2. Accesarea programului SPSS ....................................... 6
1.3. Definirea coloanelor tabelului ...................................... 8
1.4. Elemente de bază în analiza SPSS (recapitulare) ............ 23
1.5. Prezentarea rezultatelor (recapitulare) ........................ 25
2. Tipuri de probleme rezolvate ......................................... 30
2.1. Tabele de frecvenţă .................................................... 30
2.2. Calculul mediei, medianei şi a modulului ................. 46
2.3. Calculul abaterii standard ........................................... 60
2.4. Analiza relaţiei dintre 2 – n variabile ......................... 76
2.5. Coeficienţi de corelaţie ............................................. 110
2.6. Regresia .................................................................... 151
2.7. Eşantionarea .............................................................. 179
2.8. Selectarea cazurilor ................................................... 192
2.9. Eroarea standard ....................................................... 209
2.10. Testul t pentru eşantioane corelate ........................ 222
2.11. Testul t pentru eşantioane necorelate ..................... 238
2.12. Testul chi-square .................................................... 259
2.13. TESTUL WILCOXON (date corelate) ................... 283
2.14. Testul U Mann-Whitney ......................................... 300
2.15. Valorile lipsă ........................................................... 319
BIBLIOGRAFIE .............................................................. 342
345