Sunteți pe pagina 1din 346

Culegere de probleme rezolvate cu ajutorul programului SPSS

Adrian MARINESCU

C u l e g e r e d e p ro bl e m e
rezolvate cu ajutorul
programului SPSS

Editura Academiei Naţionale de Informaţii „Mihai Viteazul”


Bucureşti, 2010

1
Adrian MARINESCU

Descrierea CIP a Bibliotecii Centrale a României


MARINESCU, ADRIAN
Culegere de probleme rezolvate cu ajutorul programului SPSS /
Adrian Marinescu – Bucureşti: Editura Academiei Naţionale de
Informaţii „Mihai Viteazul”, 2010
Bibliogr.
ISBN 978-606-532-020-8
004:311+3
004.42 SPSS

COLECTIVUL DE REDACŢIE
Redactor-şef: Ion IVAN
Coordonator editare: George IANCU
Tehnoredactor: Alexandra VIZITIU
Coperta: Mihai MANEA

Bun de tipar: 10.02.2010. Apărut: aprilie 2010.


Tipărit sub comanda nr. 2160752/23.02. 2010
Editura Academiei Naţionale de Informaţii

© „Mihai Viteazul”
Bucureşti, 2009
Telefon: 021 4106550/1215 sau 1200
Fax: 0213104714
ISBN 978-606-532-020-8

2
Culegere de probleme rezolvate cu ajutorul programului SPSS

Cu vâ n t î n a in te

Statistica – de câte ori, diferite persoane (mai ales acelea


pentru care matematica, nu a fost printre preferinţe perioadei de
liceu) a căror activitate a fost cel puţin tangentă cu acest domeniu,
nu au simţit un fior rece (a se citi neplăcut) la gândul că vor trebui
să se „lupte” cu formule, mai lungi sau mai scurte, sau cu diferiţi
coeficienţi, pentru care, obligatoriu, trebuiau obţinute numeroase
informaţii sau respectate anumite condiţii?
Un prim pas a fost efectuat atunci când tehnica de calcul a
cunoscut o dezvoltare exponenţială, iar sistemele informatice au
devenit o obişnuinţă, încă de la grădiniţă.
Ulterior, au fost concepute programe, care de-a lungul
timpului şi pe baza feed-back-ului obţinut de la diferiţi utilizatori,
au fost îmbunătăţite, sau mai corect spus, au apărut noi versiuni ce
au încercat şi încearcă (procesul este cotinuu) să răspundă tuturor
solicitărilor. Pentru diferenţiere, aceste versiuni sunt numerotate,
iar în unele cazuri, versiunea depăşeşte numărul 10.
În această situaţie se regăseşte şi programul SPSS,
denumire prescurtată a consacratei „Statistical Package for the
Social Sciences” (Pachet de programe statistice aplicate ştiinţelor
sociale), program ajuns la data elaborării prezentei lucrări, la
varianta 17.
Prezentarea acestui program a fost foarte bine efectuată în
numeroase lucrări de specialitate(1,2) şi din această cauză a
prezenta din nou programul, nu cred că ar stârni vre-un interes

3
Adrian MARINESCU

deosebit pentru cititor. În aceste condiţii, consider că este mult


mai utilă o lucrare care să conţină moduri de rezolvare pentru
diferite probleme. Cum experienţa de cadru didactic mi-a oferit
prilejul să adun mai multe tipuri de probleme rezolvate cu ajutorul
programului SPSS, în cadrul fiecărui capitol, după o trecere în
revistă a noţiunilor teoretice (mai mult pentru reamintire, decât
pentru dobândirea unor cunoştinţe noi) sunt prezentate, în detaliu,
etapele de rezolvare a diferitelor tipuri de probleme.
Pentru fixarea modului de exploatare a programului SPSS,
pe diverse teme, în final, sunt menţionate o serie de probleme ce
îşi aşteaptă rezolvarea din partea cititorului, care a avut
curiozitatea (sau rezistenţa) de a parcurge lucrarea până la capăt.
De asemenea, pentru o mai bună familiarizare cu
output-urile, acestea sunt prezentate în lucrare exact în forma în
care au fost realizate de program

4
Culegere de probleme rezolvate cu ajutorul programului SPSS

1. Prezentarea principalelor elemente


ale programului SPSS
1.1. Generalităţi
Pentru reducerea timpului de prelucrare a datelor, în anul
1965, la Universitatea Stanford din California (SUA) a fost
elaborat primul program destinat în exclusivitate, analizei datelor
statistice. Accesibilitatea acestui program a făcut posibilă
răspândirea rapidă, în primul rând în cadrul universităţilor din
domeniul ştiinţelor sociale şi, în paralel, o continuă îmbunătăţire a
posibilităţilor de aplicaţie directă.
La ora elaborării acestei lucrări, pe site-ul www.spss.com
este oferită versiunea 17 a programului (dacă citiţi prea încet
această lucrare, s-ar putea ca la accesarea site-ului menţionat
anterior, să constataţi că a fost lansată versiunea 18).
Pentru încurajarea utilizării acestuia, programul este
comercializat la un preţ, mai mult decât modic, fiind posibilă şi
testarea pentru o perioadă limitată de timp, a ultimei variante.
Aşadar, odată achiziţionat programul, cumpărată o lucrare
de iniţiere în SPSS, sau printată de pe internet (vezi bibliografia
indicată la sfârşitul lucrării) nu ne rămâne decât să instalăm şi să
lansăm noul program.
Chiar dacă în unele cărţi de iniţiere (sau introducere) în
SPSS nu se menţionează varianta de Windows sub care rulează
optim noul program, reamintim faptul că versiunile 5 şi 6 ale
SPSS sunt adaptate pentru Windows 3.11, iar versiunile de la 7 în
sus (inclusiv varianta 17), pentru Windows 9X.
Dacă utilizatorul este începător şi are o versiune de SPSS
mai veche, acesta poate să stea liniştit: la nivelul său de
cunoaştere a programului, chiar dacă între variante pot exista
unele diferenţe, din punct de vedere al funcţionalităţii de

5
Adrian MARINESCU

ansamblu, toate variantele oferă aceleaşi posibilităţi. De aceea, în


cazul unui începător, oricât de veche este varianta deţinută aceasta
îl va ajuta să se acomodeze cu noul program, iar ulterior, în
funcţie de posibilităţi, la intrarea în posesie a unei versiuni mai
recente, perioada de acomodare, practic, aproape să nu mai existe.

1.2. Accesarea programului SPSS


La elaborarea noului program, autorii au dorit să ofere o
modalitate cât mai prietenoasă de accesare. Trebuie să
recunoaştem că obiectivul l-au îndeplinit cu brio: dacă la
instalarea programului nu vă apare o pictogramă SPSS (sau dacă
nu va preocupat acest aspect, ulterior instalării) care să vă permită
accesarea cu cea mai mare viteză, nu aveţi decât să activaţi
butonul START pentru a găsi lista de programe, iar ulterior,
după deschidere, să daţi dublu clic pe SPSS 13.0 for Windows.
Cei 4 paşi pot fi prezentaţi grafic, astfel:

1 2 3 4
6
Culegere de probleme rezolvate cu ajutorul programului SPSS

După cel de-al patrulea pas, trebuie să aşteptaţi un timp


(în funcţie de cât de performant este calculatorul dvs.), până ce
programul SPSS să înceapă să ruleze.
Activarea programul va deschide o fereastră de opţiuni :

1 2 3 4 5

În acest moment vă puteţi alege una dintre opţiunile de


continuare a activităţii. De cele mai multe ori programul are setată
opţiunea care este cel mai des utilizată şi anume Open an existing
data source (1). Această opţiune presupune că aţi lucrat anterior şi
că aveţi salvat un fişier la care a trebuit să renunţaţi temporar,
a mai lucra cu el. O altă posibilitate (cu o probabilitate de apariţie
mai redusă) ar fi importul unui fişier lucrat pe un alt calculator şi
importat în Program Files\SPSSEVAL. În acest caz, vă puteţi

7
Adrian MARINESCU

alege fişierul din fereastra de sub opţiunea Open an existing data


source, iar dacă sunt prea multe fişiere ş cel dorit nu este
evidenţiat, prin „tragerea” barei situate în partea dreaptă a ferestrei
(4) puteţi parcurge toată lista cu fişiere din Program
Files\SPSSEVAL.
După algerea fişierului dorit, la simpla activare a butonului
OK (3), acesta se va deschide şi veţi putea lucra cu datele
conţinute.
Dacă nu aveţi nimic salvat anterior, veţi putea închide
această fereastră cu un simplu clic (5).
În cazul în care nu mai doriţi ca această fereastră să
reapară, la o activare ulterioară, nu aveţi decât să bifaţi, cu
ajutorul unui clic, în căsuţa alăturată mesajului Don’t show this
dialog in the future (2).

1.3. Definirea coloanelor tabelului


Deoarece această etapă este foarte importantă pentru
derularea celorlalte etape, vom face o scurtă recapitulare a
noţiunilor explicate şi prezentate pe larg în cadrul celor două
lucrări de specialitate, recomandate anterior.
Pornim de la premisa că nu am avut nimic salvat anterior
(sau dacă considerăm că nu avem nevoie de acest
„pas intermediar”), vom închide fereastra cu opţiunile prezentate
mai sus.
Programul va afişa o matrice similară celei ce apare la
activarea programului Excel.
Chiar dacă la prima vedere, cele două matrici par identice,
cei ce s-au instruit în tainele celor două programe şi au făcut, cel
puţin, o comparaţie sumară, s-au convins că partea comună a
programelor SPSS şi Excel o reprezintă, în principal, elementele
de formă. Depinzând de gradul de cunoaştere a fiecărui program,
dar în special de scopul în care este folosit, utilizatorii pot
considera „mai bun” unul sau altul dintre programe. Personal,

8
Culegere de probleme rezolvate cu ajutorul programului SPSS

mă abţin de la a face comentarii pe această temă, deoarece


consider că fiecare program este foarte bun, dacă este folosit în
scopul pentru care a fost creat.
Odată deschis programul (verificăm ca pe bara de jos să
apară mesajul SPSS Processor is ready), în funcţie de datele
problemei ce urmează a fi studiată, trebuie definite coloane.
Definirea nu poate fi efectuată direct în tabelul principal,
ci numai într-un alt tabel care apare la activarea opţiunii
VARIABLE VIEW, aflată jos, în partea stângă a ecranului,
conform figurii alăturate:

9
Adrian MARINESCU

La activarea acestei opţiuni, deschidem un alt tabel în care


putem defini, atât denumirea coloanelor cât şi caracteristicile
fiecărei celule. Astfel:

Reamintim posibilităţile pe care le oferă programul SPSS


varianta 13, la activarea celulelor din dreptul fiecărei coloane:
- TYPE: oferă posibilitatea alegerii modului de introducere
a datelor colectate. La activarea unei celule (indiferent care) din
cadrul acestei coloane, prin intermediul unei ferestre, programul
ne prezintă toate opţiunile posibile.
Dintre acestea, cele mai uzitate sunt :
a. Numeric: datorită faptul că marea majoritate a datelor
sunt de formă numerică, programul este setat implicit,
pe această opţiune.

10
Culegere de probleme rezolvate cu ajutorul programului SPSS

b. Date: poate fi selectată opţiunea atunci cât datele se


referă la o anumită zi (ex: ziua de naştere a unor
subiecţi – 12.oct.2009).
c. String: se utilizează atunci când datele obţinute nu
sunt de formă numerică.

a b c

- WIDTH: cu ajutorul acestei opţiuni se poate modifica


lăţimea coloanei.
- DECIMALS: permite modificarea numărului de
zecimale în funcţie de forma sau natura datelor.
- LABEL: este folosită în cazul în care variabilele au
nume lungi. Importanţa acestei opţiuni a scăzut semnificativ,

11
Adrian MARINESCU

odată cu apariţia variantei SPSS 12 care a oferit posibilitatea


modificării lăţimii coloanei în funcţie de lungimea denumirii
câmpului.
- VALUES: această coloană permite definirea unor
categorii de subiecţi sau valori ale unor variabile, atunci când
informaţiile nu sunt sub formă numerică.

Exemple:

I. Datele colectate grupează subiecţii în funcţie de genul


acestora (masculin şi feminin). Etapele definirii sunt:
1. POZIŢIONARE PE CELULĂ (apare în cadrul celulei
un buton)
2. CLIC PE BUTON (apare o nouă fereastră).

1 2

12
Culegere de probleme rezolvate cu ajutorul programului SPSS

În cadrul noii ferestre, se parcurg etapele:


3. În dreptul etichetei VALUE SE ATRIBUIE UN
NUMĂR
4. În dreptul etichetei VALUE LABEL (trecerea se face
fie cu tasta TAB fie cu mouse-ul) SE TASTEAZĂ
GENUL PRIMEI CATEGORII DE SUBIECŢI.
În momentul începerii completării se activează butonul
ADD.
5. CLIC PE BUTONUL ADD (în ecranul alăturat apare
numărul şi genul căreia i-a fost atribuit). Astfel, în
final, definirea va fi de forma 1 = masculin şi
respectiv 2 = feminin. (rog ca persoanele de sex
feminin, să nu se supere că nu li s-a acordat prioritate,
dar am folosit codificarea internaţională de atribuire a
numerelor în conformitate cu codul numeric personal)
3 4

13
Adrian MARINESCU

În aceste condiţii, în final, fereastra va fi completată astfel:

14
Culegere de probleme rezolvate cu ajutorul programului SPSS

6. OK (după verificarea corectitudinii datelor).


7. Fereastra se închide, iar în celula în care s-a lucrat sunt
menţionate codificările.
6

15
Adrian MARINESCU

Trecând cu opţiunea DATA VIEW în tabelul principal şi


completând cu câmpurile cu datele problemei, la introducerea
cifrelor „1” sau „2”, automat programul afişează codificarea
efectuată:

II. Datele colectate grupează subiecţii în funcţie de


pregătirea profesională: manageri, economişti, jurişti,
ingineri şi jurnalişti. Etapele definirii sunt următoarele:

1. POZIŢIONARE PE CELULĂ
2. CLIC PE BUTON

1 2

16
Culegere de probleme rezolvate cu ajutorul programului SPSS

3. SE ATRIBUIE UN NUMĂR în dreptul etichetei


VALUE
4. În dreptul etichetei VALUE LABEL se tastează prima
categorie profesională.
5. CLIC PE BUTONUL ADD
6. Etapele 3-5 se repetă până la epuizarea tuturor
categoriilor de pregătire profesională. În aceste
condiţii, în final, definirea va fi de forma (respectăm
ordinea categoriilor de pregătire profesională expuse în
datele problemei) 1 = manageri, 2 = economişti,
3 = jurişti, 4 = ingineri şi respectiv 5 = jurnalişti.
7. OK

3 4

17
Adrian MARINESCU

etapele se repetă până la epuizarea tuturor categoriilor


de subiecţi. 7

18
Culegere de probleme rezolvate cu ajutorul programului SPSS

Odată închisă fereastra, se pot verifica codificările efectuate


în celula în care s-a lucrat.

- MISSING: această opţiune va fi prezentată în


momentul în care vom exemplifica cazul „valorilor lipsă”.
- TYPE: am lăsat la urmă această modalitate de definire
a unei coloane, datorită faptului că literatura de specialitate
prezintă detaliat, etapele pe care utilizatorul trebuie să le parcurgă
în acest caz. Nu insistem, doar prezentăm fereastra cu opţiuni care
se deschide cu un simplu clic.

19
Adrian MARINESCU

Recapitulând principalele posibilităţi de lucru cu ajutorul


programului specialiştii sunt de părere că, în principal, se pot
efectua 5 tipuri de activităţi şi anume:

1. Introducerea datelor
Pentru desfăşurarea în bune condiţii a acestei prime
activităţi există trei variante între care se poate opta. Astfel:
1.1. Introducerea datelor în DATA EDITOR – paşii pe
care utilizatorul trebuie să-i parcurgă au fost
prezentaţi mai sus.
1.2. Deschiderea unui fişier de date deja existent (acestea
se recunosc uşor datorită extensiei specifice pe care
o au: sav).
1.3. Importarea unui fişier care poate fi diferit de
formatul cunoscut şi în acest caz trebuie selectată
opţiunea File open şi accesată caseta File of type.
Există şi cazuri când programul SPSS nu recunoaşte
tipul de fişier pe care utilizatorul doreşte să îl
importe. În acest caz, într-o primă etapă, se poate
încerca transformarea acestuia într-un format
recunoscut de SPSS. Chiar dacă este posibil să se
constate unele pierderi (ţin, în special, de formatul în
care sunt prezentate datele), totuşi este preferabil,
această operaţie, decât să fie reintroduse datele ce
urmează să fie prelucrate, mai ales în cazul unor
fişiere ce conţin multe sau foarte multe informaţii.
De asemenea, nu trebuie uitat faptul că se pot utiliza şi
variante rezultate din intersecţia celor trei menţionate anterior, de
exemplu: să se importe date dintr-un fişier de format diferit
(varianta 1.3.) care să poată fi introduse, fie într-un fişier deja
existent (varianta 1.2.) fie într-un nou fişier (varianta 1.1.).
Pentru a nu avea surprize neplăcute, recomandăm ca
intersecţiile prezentate anterior, să nu fie utilizate de către cei se

20
Culegere de probleme rezolvate cu ajutorul programului SPSS

află la început de drum în exploatarea programului SPSS. Dacă


totuşi utilizatorul doreşte cu tot dinadinsul să experimenteze
aceste modalităţi de lucru şi minimalizează riscul pierderii unor
date, nu avem decât să-i ţinem pumnii şi totodată, să-i dorim
succes!
La încheierea sesiunii de lucru, în funcţie de destinaţia
datelor, reamintim că pentru înlesnirea transferului ulterior,
programul SPSS permite salvarea datelor şi în alte formate, ca de
exemplu FoxPro, Dbase, Lotus 1-2-3 şi, nu în ultimul rând, Excel.

2. Pregătirea datelor
În funcţie de datele obţinute sau, mai ales, de forma lor se
pot efectua, în principal, recodificări, selecţii, corectarea
eventualelor erori, transformarea variabilelor prin calcule,
declararea valorilor lipsă sau combinarea datelor din două fişiere
diferite. Toate aceste operaţii pot fi efectuate accesând, în funcţie
de ceea ce se doreşte meniurile DATA sau TRANSFORM.

21
Adrian MARINESCU

3. Selectarea procedurii statistice


Procedura dorită a fi utilizată poate fi accesată din
opţiunile Analyse sau Graphs.

4. Selectarea variabilelor ce urmează a fi prelucrate


În funcţie de obiectivul avut în vedere selectarea
variabilelor sau a câmpurilor de variabile se poate efectua cu
ajutorul opţiunilor existente în ferestrele de dialog aferente
fiecărei proceduri.

5. Efectuarea procedurii
După ce sunt selectate opţiunile dorite şi îndeplinite toate
cerinţele menţionate în fereastra utilizată, efectuarea procedurii va
începe în urma accesării butonului OK.

22
Culegere de probleme rezolvate cu ajutorul programului SPSS

6. Analiza rezultatelor
Rezultatele tuturor prelucrărilor descrise anterior, se
regăsesc în fereastra specifică pe care utilizatorul deja instruit
(măcar dacă a citit o dată, o lucrare de prezentare a uneia dintre
versiunile programului SPSS) ştie deja că poartă numele de
Output. De asemenea, amintim că pentru prezentarea prelucrării
datelor iniţiale, în funcţie de preferinţele utilizatorului, se poate
opta între prezentarea grafică şi cea de tip text. Odată afişate
rezultatele (indiferent de forma aleasă) rămâne la latitudinea
utilizatorului (am putea adăuga, în funcţie de experienţa sau
intuiţia acestuia), modul în care vor fi interpretate aceste rezultate
şi, dacă este cazul, elaborarea şi implementarea unor decizii.
De multe ori, corectitudinea interpretării datelor, cu
consecinţa elaborării şi implementării unor decizii, nu o putem
determina decât sub forma feedback-ului, adică mult mai târziu sau
câteodată, mult prea târziu. Cuantificarea în unităţi de timp a acestui
moment depinde foarte mult de domeniul în care se acţionează,
feedback-ul putând apare la câteva secunde, dar şi la distanţa unor
ani de la implementarea deciziei luate în urma interpretării
rezultatelor prelucrării datelor iniţiale, cu ajutorul programului SPSS.
Ca urmare, recomandăm ca interpretarea datelor obţinute (mai ales în
cazul unor probleme complexe şi care pot avea consecinţe
importante, pentru cel puţin un grup de persoane), să fie făcută de
către specialişti (varianta ideală) sau, în lipsa acestora, de către
persoane care au o minimă pregătire de specialitate.

1.4. Elemente de bază în analiza SPSS (recapitulare)


Reamintim câteva elemente, utilizate foarte des în cadrul
analizelor statistice:
a. Variabila: Conform Dicţionarului explicativ al limbii
române definiţia pentru cuvântul „variabil”, utilizat în
sens matematic este: cantitate care ia succesiv diferite

23
Adrian MARINESCU

valori. Atunci când fac referire la programul SPSS,


specialiştii consideră că, în practica curentă există şi
variabile standard, adică variabile care sunt măsurate
în mod frecvent. În cadrul acestei categorii poate fi
introdusă vârsta subiecţilor, variabilă de bază în cadrul
analizelor efectuate cu ajutorul programului SPSS.
La rândul lor, variabilele se împart în două categorii şi
anume: scorurile (indică cantitatea sau valoarea unei
caracteristici) şi variabilele nominale (în literatura de
specialitate mai poate fi întâlnită şi denumirea de
variabile categoriale şi sunt utilizate atunci când se
face o clasificare în funcţie de unul sau mai multe
tipuri de categorii). În literatura de specialitate mai pot
fi întâlnite asemenea tipuri de împărţiri ale variabilelor
dar ele sunt mai puţin utilizate în practică (exemplu:
variabile nominale, ordinale, de interval sau de raport).
De asemenea, nu trebuie uitat faptul că programul SPSS
este un program conceput pentru prelucrări statistice
şi de aceea variabilele trebuie să fie de tip numeric.
În cazul în care datele nu pot fi de tip statistic (exemplu
genul subiecţilor), recomandăm etichetarea lor.

b. Cazul: reprezintă suma tuturor informaţiilor pe care le


putem obţinute despre un subiect. Nu se poate
recomanda un număr minim de informaţii, dar putem
spune că trebuie să obţinem, în principal, toate
informaţiile necesare tipului de analiză propus pentru a
fi efectuat. Această recomandare se bazează pe
constatarea că, în practica curentă, există numeroase
cazuri (în special în cazul analizelor cu un grad de
complexitate ridicat) în care s-a plecat de la un anumit
tip de analiză şi s-a constatat pe parcurs, că analiza mai
trebuie aprofundată.

24
Culegere de probleme rezolvate cu ajutorul programului SPSS

Pentru a nu fi confundate cele două noţiuni, reamintim


faptul că variabilele se regăsesc pe verticala foii de calcul, în timp
ce cazurile sunt reprezentate pe orizontală.

cazuri

variabile

1.5. Prezentarea rezultatelor (recapitulare)


Pentru ilustrarea cea mai elocventă a rezultatelor unei
analize statistice cu ajutorul programului SPSS, în practica curentă
se foloseşte reprezentarea grafică. „Părinţii” programului au
înţeles importanţa acestui mod de reprezentare şi au „înzestrat”
programul cu numeroase opţiuni grafice. Rămâne la latitudinea
utilizatorului, forma de grafic pe care o va utiliza pentru a-şi
prezenta concluziile analizei. Cel mai ades este folosită
prezentarea rezultatelor cu ajutorul diagramei circulare, iar forma
aleasă (cu sau fără legendă, adăugarea etichetelor sau înlăturarea
lor, caracterele şi formatul textului, culorile diagramei, etc. sunt
prezentate pe larg în literatură) intră, în exclusivitate,

25
Adrian MARINESCU

în competenţa utilizatorului. Am introdus şi culoarea diagramei


pentru că există cazuri când auditorii au fost deranjaţi de culorile
alese pentru diagrama circulară, iar prezentatorul nu a mai reuşit
să le capteze atenţia până la sfârşitul expunerii.
Reamintim etapele pe care trebuie să le parcurgă utilizatorul
atunci când doreşte să reprezinte cu ajutorul unei diagrame circulare,
datele unei probleme în care întâlnim, de exemplu următoarele
valori: a = 44, b = 27, c = 35, d = 37 şi e = 40.

1. DEFINIREA COLOANELOR. – una ce va purta


numele DENUMIRE, iar a doua va fi
FRECVENŢA (de remarcat faptul că, neavând
zecimale, pentru ambele coloane a fost
selectată valoarea „0”). De asemenea, va fi
utilizată următoarea etichetare: a = 1, b = 2,
c = 3, d = 4, e = 5.

26
Culegere de probleme rezolvate cu ajutorul programului SPSS

2. INTRODUCEREA DATELOR. – datele cu ajutorul


cărora vom exemplifica prezentarea grafică sunt introduse în
ecranul DATA VIEW:

3. Selectarea GRAPHS şi, ulterior, opţiunea PIE

27
Adrian MARINESCU

4. Acţionare comandă DEFINE

5. Trecerea variabilei DENUMIRE în fereastra DEFINE


SLICES BY şi apoi OK.
OK

28
Culegere de probleme rezolvate cu ajutorul programului SPSS

6. OUTPUT
Denumire

Tot atât de bine reprezentarea grafică putea fi efectuată sub


formă de diagramă cu bare:

50

40

30
Count

20

10

0
a b c d e

Denumire

Cases weighted by Frecvenţa

29
Adrian MARINESCU

sau histograme
50

40

Frequency 30

20

10

Mean = 3,01
Std. Dev. = 1,482
N = 183
0
0 1 2 3 4 5 6

Denumire

Cases weighted by Frecvenţa

2. Tipuri de probleme rezolvate


2.1. Tabele de frecvenţă
1.1.1. Recapitularea principalelor elemente teoretice
Principala caracteristică a tabelelor de frecvenţă este legată
de faptul că evidenţiază uşor trăsăturile importante ale datelor
ceea ce permite efectuarea rapidă a analizelor şi prezentarea unui
output foarte elocvent.
Tabelele de frecvenţă numără toate valorile variabilelor
care participă la analiză.
2.1.2. Etapele obţinerii unui tabel de frecvenţă
Pentru unui output sub forma unui tabel de frecvenţă,
utilizatorul trebuie să parcurgă următoarele etape:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

30
Culegere de probleme rezolvate cu ajutorul programului SPSS

II. D e f i n i r e a p r i me l o r d o u ă c o l o a n e . Î n g e n e r a l ,
c ol o an a u n de s un t t r ec ut e val or i l e se r e gă se şt e s u b
t i t u l a t ur a FR E C V E N Ţ Ă . A c e a s t ă t i t u l a t ur ă n u e s t e
o b l i g a t o r i e , e a p o a t e f i s c h i mb a t ă c u o r i c e a l t t i t l u ,
c o n f or m d o r i nţ e i u t i l i z at or ul ui , d ar e st e
r e c o ma n d a b i l c a n o u a d e n u mi r e s ă s u g e r e z e mă c a r
l a c e s e r e fe r ă u t i l i z a t o r u l , a l t f e l , r i s c u l c a p u b l i c u l
auditor (în cazul în care acesta există) să facă
confuzii, este foarte mare.
III. Etichetarea valorilor primului câmp (de obicei
numele acestuia face referire la domeniul de unde
provin datele şi poate fi utilizată fie forma generală –
denumire – fie una specifică, de exemplu: ocupaţie)
IV. Revenirea în ecranul DATA VIEW şi inserarea
datelor.
V. Ponderea datelor prin efectuarea paşilor DATA –
WEIGHT CASES şi menţionarea în fereastra
FREQUENCY VARIABLE a variabilei
FRECVENŢĂ (reamintim că verificarea corectitudinii
ponderării, se face prin controlarea apariţiei
mesajului WEIGHT ON în colţul dreapta jos al
ferestrei).
VI. Derularea analizei prin parcurgerea următorilor paşi:
ANALYZE – DESCRIPTIVE STATISTICS –
FREQUENCIES. La încheierea ultimului pas, în
fereastra nou deschisă primul câmp (să zicem că
poartă numele DENUMIRE), este transferat în
câmpul de variabile şi în final se apasă butonul OK.
VII. Apariţia OUTPUT

31
Adrian MARINESCU

2.1.3. Probleme rezolvate


Pentru mai buna înţelegere a întregului mecanism de
obţinere a unui tabel de frecvenţă, prezentă în continuare două
exemple de probleme rezolvate:
a. Într-o cutie de creioane colorate sunt 5 creioane
roşii, 7 creioane verzi, 4 creioane negre şi 3 creioane
albastre. Să se alcătuiască tabelul de frecvenţe pe baza
datelor conţinute de problemă.

Rezolvare:
Vom parcurge cele 7 etape prezentate anterior, după cum
urmează:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

32
Culegere de probleme rezolvate cu ajutorul programului SPSS

II. Definirea primelor două coloane.


Cele două coloane se vor numi DENUMIRE şi respectiv
FRECVENŢĂ, numărul zecimalelor va fi egal cu zero.

III. Etichetarea valorilor primului câmp

33
Adrian MARINESCU

IV. Revenirea în ecranul DATA VIEW şi inserarea


datelor (Nu uitaţi ! În câmpul DENUMIRE veţi introduce valorile
pe care le-aţi stabilit în etapa precedentă: 1,2,...)

V. Ponderea datelor

34
Culegere de probleme rezolvate cu ajutorul programului SPSS

VI. Derularea analizei

VII. Apariţia OUTPUT


Denumire

Cumulative
Frequency Percent Valid Percent
Percent
creioane roşii 5 26,3 26,3 26,3
creioane verzi 7 36,8 36,8 63,2
creioane negre 4 21,1 21,1 84,2
creioane albastre 3 15,8 15,8 100,0
Total 19 100,0 100,0

Concluzii
După ce ne-am admirat destul „capodopera” pe care am
reuşit să o obţinem este timpul să tragem câteva concluzii. Chiar
dacă nu vrem să recunoaştem, programul SPSS ne ajută şi de data
aceasta: numai citind denumirea coloanelor tabelului de frecvenţă
şi avem deja o idee asupra ceea ce reprezintă rezultatele finale.

35
Adrian MARINESCU

Reamintim, pe scurt semnificaţia acestora:

1. Frequency: în această coloană sunt trecute valorile pe


care le-am introdus înainte de începerea analizei.
Pe lângă faptul că obţinem şi valoarea totală a datelor
introduse în coloana a doua din tabelul iniţial (vezi
etapa a IV-a), lecturându-le, putem verifica
corectitudinea lor.
2. Percent: Începând cu această coloană începem să
„recoltăm” rezultatele analizei efectuate. Astfel, în
cadrul acestei coloane, regăsim procentele în care
fiecare categorie de produse (în cazul de faţă: creioane)
este cuprinsă în total. Concret, dacă avem în vedere
creioanele de culoare roşie, privind procentul înscris în
dreptul acestei categorii, se poate concluziona că din
totalul de 19 creioane, 26,3% sunt creioane de
culoare roşie.
3. Valid Percent: această coloană, practic dublează
coloana precedentă, interpretarea fiind că programul
SPSS îşi verifică şi validează rezultatele obţinute în
urma analizei.
4. Cumulative Percent: cu excepţia primului procent
afişat, celelalte sunt obţinute din adunarea procentelor
precedente. Practic, dacă dorim să interpretăm
semnificaţia procentului afişat în tabel, în dreptul
etichetei „creioane verzi”, se poate spune că: 63,2%
din totalul creioanelor reprezintă TOTALUL
creioanele roşii ŞI verzi. Coborând mai jos, în
coloană: 84,2% din totalul creioanelor reprezintă
TOTALUL creioanelor roşii, verzi ŞI negre,
ş.a.m.d.
36
Culegere de probleme rezolvate cu ajutorul programului SPSS

b. La sfârşitul lunii septembrie 2009, parcul auto al


unei societăţi comerciale, ce îşi desfăşoară
activitatea în domeniul transporturilor de persoane,
cuprindea 40 de autoturisme cu următoarea
repartiţie, după anul de fabricaţie:
- anul 2004: 10 maşini:
- anul 2005: 7 maşini;
- anul 2006: 12 maşini;
- anul 2007: 5 maşini;
- anul 2008: 6 maşini.
Să se determine tabelul de frecvenţe pentru datele
prezentate în problemă.
*
În vederea rezolvării problemei de mai sus, parcurgem cele
7 etape prezentate anterior:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

37
Adrian MARINESCU

II. Definirea primelor două coloane.


Cele două coloane vor fi: DENUMIRE şi respectiv
FRECVENŢĂ, numărul zecimalelor va fi egal cu zero.

III. Etichetarea valorilor primului câmp

38
Culegere de probleme rezolvate cu ajutorul programului SPSS

IV. Revenirea în ecranul DATA VIEW şi inserarea datelor

V. Ponderea datelor

39
Adrian MARINESCU

VI. Derularea analizei

VIII. Apariţia OUTPUT


Denumire

Cumulative
Frequency Percent Valid Percent
Percent

anul 2005 7 17,5 17,5 42,5

anul 2006 12 30,0 30,0 72,5

anul 2007 5 12,5 12,5 85,0

anul 2008 6 15,0 15,0 100,0

Total 40 100,0 100,0

40
Culegere de probleme rezolvate cu ajutorul programului SPSS

Concluzii
1. Conform coloanei „Frecvenţă”, datele au fost bine
introduse.
2. Coloana „Procent” indică procentul în care fiecare an
de fabricaţie se regăseşte în parcul auto al societăţii
comerciale.
3. După validarea rezultatelor obţinute, ultima coloană
conţine informaţii privind totalurile parţiale ale
procentelor în care se regăsesc, strict în ordine
crescătoare”, anii de fabricaţie.

La ce ne-ar putea folosi asemenea informaţii?


Răspunsul este destul de simplu dacă avem în vedere şi
Catalogul privind clasificarea şi duratele normale de funcţionare a
mijloacelor fixe (la data elaborării prezentei lucrări este valabil
catalogul cuprins în cadrul Hotărârii Guvernului nr. 2139 din
30.11.2004, ce a fost publicată în Monitorul Oficial nr. 46 din
13.01.2005).
Conform datelor prezentate în cadrul grupei 2.3.2.1.1.1,
pentru autoturismele folosite în taximetrie, durata nominală de
funcţionare este de 3-5 ani. Dacă se consideră durata nominală
maximă (5 ani) şi perioada de exploatare, egală cu durata de
amortizare, după această perioadă este recomandabilă reînoirea
parcului auto. Dacă dorim să ţinem cont de această recomandare
(vorbim de recomandare, dar este posibil ca unele prevederi
legislative, existente, chiar să impună) ar trebui ca după 5 ani de
exploatare să reînoim parcul auto.
Pentru această, în baza procentelor afişate în coloana a
doua a output-ului rezultat din prelucrarea datelor, cu ajutorul
programului SPSS şi prezentat mai sus, putem să elaborăm o
situaţie asupra necesităţilor de achiziţie de autoturisme destinate
activităţii de taximetrie (tabelul nr. 1 şi graficul nr. 1):

41
Adrian MARINESCU

Tabelul nr. 1. Situaţia parcului auto


A nul de Nr. Procentul deţinut în Anul de înlocuire
achiziţie bucăţi parcul auto recomandat
anul 2004 10 25,0 2009
anul 2005 7 17,5 2010
anul 2006 12 30,0 2011
anul 2007 5 12,5 2012
anul 2008 6 15,0 2013

14
12
2009
10
2010
8
2011
6
2012
4
2013
2
0
2009 2010 2011 2012 2013

Graficul nr. 1. Data recomandată de înlocuire a autoturismelor


Conform celor de mai sus, rezultă că în anul 2009 trebuie
înlocuite 10 autoturisme (25% din totalul parcului auto destinat
activităţii de taximetrie), urmând ca „vârful” de efort financiar să
se înregistreze în anul 2011 atunci când vor trebui înlocuite
12 autoturisme, adică 30% din parcul auto.
Cunoscând aceste date, în calitate de manager general al
societăţii comerciale, pot să-mi planific din timp resursele
financiare, să testez piaţa de auto în căutarea celei mai bune oferte
şi, chiar după selectarea unui furnizor, să port negocieri asupra
reducerilor de preţ, ţinând cont de numărul mare de autoturisme
pe care intenţionez să le achiziţionez.

42
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.1.4. Probleme propuse spre rezolvare


I. În vederea stabilirii cerinţelor de şcolarizare dintr-
o zonă rurală, în urma unor studii demografice, efectuată în
mai multe localităţi învecinate, s-a stabilit că pe o rază de
maxim 5 kilometri sunt 286 de copii cu vârste cuprinse între 6
şi 18 ani, dintre care 138 de băieţi şi 148 de fete şi având
următoarea distribuţie după vârstă:

Număr
Vârstă (ani)
Băieţi Fete

6 8 8
7 11 10
8 12 14
9 10 13
10 7 12
11 9 15
12 12 17
13 15 10
14 13 14
15 9 14
16 11 10
17 15 6
18 6 5

Să se elaboreze tabelul de frecvenţe, în vederea


studierii posibilităţilor de şcolarizare a acestor copii.

43
Adrian MARINESCU

II. Să se elaboreze tabelul de frecvenţe, pentru fiecare


zonă în parte, având în vedere varianta medie de proiecţie a
populaţiei continentelor lumii între anii 2010 şi 2050 aşa cum
este ea stabilită în World Urbanization Prospects: The 2005
Revision Population Division of the Departament of Economic
and Social Affairs of the United Nations Secretariat:

Pe baza tabelelor de frecvenţă, să se facă câteva


comentarii asupra tendinţelor evolutive ale fiecărei zone luate
în consideraţie, din perspectiva datelor cuprinse în tabelul de
mai sus.

44
Culegere de probleme rezolvate cu ajutorul programului SPSS

III. Să se elaboreze tabelul de frecvenţă pentru


populaţia României înregistrată la 1 iulie 2007 şi grupată pe
următoarele grupe de vârstă (Sursa: Anuarul statistic al
României 2008)
Grupă de vârstă (ani) Total populaţie
0 –4 1.062.537
5–9 1.090.284
10 – 14 1.135.618
15 – 19 1.541.828
20 – 24 1.640.127
25 – 29 1.740.686
30 – 34 1.715.518
35 – 39 1.929.137
40 – 44 1.200.174
45 – 49 1.392.744
50 – 54 1.544.281
55 – 59 1.360.523
60 – 64 984.384
65 – 69 1.004.068
70 – 74 918.177
75 – 79 690.768
80 – 84 403.440
85 şi peste 183.269
TOTAL 21.537.563

45
Adrian MARINESCU

2.2. Calculul mediei, medianei şi a modulului


2.2.1. Recapitularea principalelor elemente teoretice
Programul SPSS oferă posibilitatea calculării unor
elemente care descriu principalele caracteristici ale variabilelor.
Pentru calcularea mediei şi a medianei singura cerinţă
constă în introducerea în cadrul procesului de prelucrare a unor
scoruri numerice.
Modul reprezintă valoarea cu cea mai mare frecvenţă şi de
aceea este posibil ca în cadrul unui set de valori să poată fi
întâlnite mai multe moduri, numărul acestora depinzând de
numărul de valori care apar cu frecvenţă egală.
2.2.2. Etapele calculării mediei, medianei şi a modulului
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
II. Definirea primei coloane în conformitate cu datele
problemei sau, dacă este cazul, cu dorinţa
utilizatorului. În funcţie de datele problemei, se
înlătură sau nu cele două zecimale.
III. Revenirea în ecranul DATA VIEW şi inserarea datelor.
IV. Derularea analizei prin parcurgerea următorilor paşi:
ANALYZE – DESCRIPTIVE STATISTICS –
FREQUENCIES. La încheierea ultimului pas,
în fereastra nou deschisă, se transferă cîmpul definit,
în lista de variabile. Se deselectează opţiunea
DISPLAY FREQUENCY TABLES şi se ignoră
mesajul apărut pe ecran.
V. Se accesează butonul STATISTICS, sunt selectate
opţiunile MEAN, MEDIAN şi MODE, clic pe
CONTINUE şi în final se apasă butonul OK din
tabelul anterior care reapare.
VI. Apariţia OUTPUT

46
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.2.3. Probleme rezolvate


Exemplificăm cele prezentate anterior, cu ajutorul a două
exemple de probleme rezolvate:
I. În cadrul unei grupe formate din 15 de studenţi
vârstele acestora variază între 19 şi 22 de ani, după cum
urmează:

Nr. student Vârstă (ani)

1 19
2 20
3 20
4 21
5 22
6 21
7 19
8 19
9 20
10 22
11 20
12 20
13 21
14 19
15 19

47
Adrian MARINESCU

Să se calculeze media, mediana şi modului folosind


datele din tabelul de mai sus.
În vederea rezolvării problemei de mai sus, parcurgem cele
6 etape prezentate anterior:

I. Accesarea programului şi trecerea în ecranul


VARIABLE VIEW.

II. Definirea primei coloane în conformitate cu datele


problemei sau, dacă este cazul, cu dorinţa
utilizatorului. În funcţie de datele problemei, se
înlătură sau nu cele două zecimale.

48
Culegere de probleme rezolvate cu ajutorul programului SPSS

În cazul de faţă, coloana se va numi VÂRSTĂ şi datorită


faptului că în datele problemei nu sunt trecute zecimale, acestea
vor fi eliminate din tabel:

III. Revenirea în ecranul DATA VIEW şi inserarea datelor

49
Adrian MARINESCU

IV. Derularea analizei prin parcurgerea următorilor paşi:


ANALYZE – DESCRIPTIVE STATISTICS –
FREQUENCIES

50
Culegere de probleme rezolvate cu ajutorul programului SPSS

V. Se accesează butonul STATISTICS, sunt selectate


opţiunile MEAN, MEDIAN şi MODE, clic pe
CONTINUE şi în final se apasă butonul OK din
tabelul anterior care reapare.

VI. Apariţia OUTPUT

Statistics 1

Vârstă
N Valid 15 2
Missing 0 3
Mean 20,13
Median 20,00
4
Mode 19(a)
5

51
Adrian MARINESCU

Interpretarea output-ului:
1. Sunt 15 cazuri cu date valide intrate în analiză.
2. Nu sunt date lipsă.
3. Media de vârstă: 20,13 ani.
4. Mediana de vârstă (vârsta studentului, aflată
la mijlocul listei de vârste, de la cea mai mică la cea
mai mare) este 20,00 ani.
5. Mod de vârstă (valoarea cea mai comună) este
19 ani. Existenţa parantezei (a) indică faptul că sunt
mai multe mod-uri, dar a fost aleasă, pentru
prezentare, valoarea cea mai mică.
De asemenea, programul SPSS calculează şi tabelul de
frecvenţă pentru datele iniţiale:
Vârstă

Valid Cumulative
Frequency Percent
Percent Percent
Valid 19 5 33,3 33,3 33,3
20 5 33,3 33,3 66,7
21 3 20,0 20,0 86,7
22 2 13,3 13,3 100,0
Total 15 100,0 100,0

În primul rând este un tabel de frecvenţă, şi din acest punct


de vedere toate elementele lui au fost prezentate pe larg în cadrul
subcapitolului 2.1.1.
Se poate adăuga faptul că datele cuprinse în cadrul celui
de-al doilea tabel, indică toate mod-urile de vârstă (reamintim că,
în tabelul anterior, programul SPSS nu prezenta decât un singur
mod, ales după criteriul vârstei celei mai mici), astfel, pe lângă
vârsta de 19 ani, se poate observa că şi vârsta de 20 de ani are tot
cea mai mare frecvenţă: 5.

52
Culegere de probleme rezolvate cu ajutorul programului SPSS

II. Să se calculeze media, mediana şi modului pensiei


medii lunare de asigurări sociale de stat exprimată în lei,
folosind datele din tabelul de mai jos.
Regiunea de Pensia medie lunară de
dezvoltare asigurări sociale de stat (lei)
Nord - Vest 386
Centru 416
Nord – Est 369
Sud – Est 379
Bucureşti – Ilfov 493
Sud – Muntenia 375
Sud –Vest Oltenia 369
Vest 420
Sursă: Anuarul Statistic al României 2008, pag. 360.
Pentru rezolvarea problemei de mai sus, parcurgem cele
6 etape prezentate anterior:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

53
Adrian MARINESCU

II. Definirea primei coloane în conformitate cu datele


problemei
Coloana se va numi PENSIE iar zecimalele vor fi
eliminate din tabel:

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

54
Culegere de probleme rezolvate cu ajutorul programului SPSS

IV. Derularea analizei prin parcurgerea următorilor


paşi: ANALYZE – DESCRIPTIVE STATISTICS
– FREQUENCIES.

55
Adrian MARINESCU

V. Se accesează butonul STATISTICS, sunt selectate


opţiunile MEAN, MEDIAN şi MODE, clic pe CONTINUE şi în
final se apasă butonul OK din tabelul anterior care reapare.

VI. Apariţia OUTPUT


Statistics
Pensie
Valid 8
N
Missing 0
Mean 400,88
Median 382,50
Mode 369

1. Sunt 8 cazuri cu date valide intrate în analiză.


2. Nu sunt date lipsă.
3. Media pensiei medii lunare de asigurări sociale de stat::
400,88 lei.
56
Culegere de probleme rezolvate cu ajutorul programului SPSS

4. Mediana pensiei medii lunare de asigurări sociale de


stat (valoarea pensiei, aflată la mijlocul listei de pensii, de la cea
mai mică la cea mai mare) este 382,50 lei.
5. Mod de pensie medie lunară de asigurări sociale de
stat (valoarea cea mai comună) este 369 lei.
Tabelul de frecvenţă pentru datele iniţiale, elaborat de
programul SPSS este următorul:
Pensie

Valid Cumulative
Frequency Percent
Percent Percent

Valid 369 2 25,0 25,0 25,0


375 1 12,5 12,5 37,5
379 1 12,5 12,5 50,0
386 1 12,5 12,5 62,5
416 1 12,5 12,5 75,0
420 1 12,5 12,5 87,5
493 1 12,5 12,5 100,0
Total 8 100,0 100,0

Datele cuprinse în cadrul acestui tabel, confirmă existenţa


unui singur mod mod-urile de vârstă (reamintim că, în tabelul
anterior, programul SPSS nu prezenta decât un singur mod de
pensie medie lunară de asigurări sociale de stat:: 369 lei.

2.2.4. Probleme propuse spre rezolvare


I. Să se calculeze media, mediana şi modul numărului
de salariaţi din industria prelucrătoare, înregistraţi la

57
Adrian MARINESCU

31 decembrie 2007, în conformitate cu datele din tabelul


de mai jos:
Total salariaţi
Activitate
(mii persoane)
Alimentară şi băuturi 193
Produse din tutun 2
Produse textile 60
Articole de îmbrăcăminte 226
Pielărie şi încălţăminte 90
Prelucrarea lemnului şi a produselor din lemn 73
Celuloză, hârtie şi produse din hârtie 14
Edituri, poligrafie şi reproducerea pe suporţi a 35
înregistrărilor
Prelucrarea ţiţeiului, cocsificarea cărbunelui şi 11
tratarea combustibililor nucleari
Substanţe şi produse chimice 48
Produse din cauciuc şi mase plastice 47
Fabricarea materialelor de construcţii şi alte 58
produse din minerale nemetalice
Metalurgie 49
Construcţii metalice şi produse din metal 100
Maşini şi echipamente (exclusiv echipamente 89
electrice şi optice)
Mijloace ale tehnicii de calcul şi de birou 4
Maşini şi aparate electrice 97
Echipamente pentru radio, televiziune şi 12
telecomunicaţii
Aparatură şi instrumente medicale de precizie, 15
optice şi ceasornicărie
Mijloace de transport rutier 65
Mijloace de transport neincluse la cele rutiere 61
Mobilier şi alte activităţi industriale neclasificate 101
în altă parte
Recuperarea deşeurilor 12
TOTAL 1462
Sursă: Anuarul Statistic al României 2008, pag. 138-139.

58
Culegere de probleme rezolvate cu ajutorul programului SPSS

II. Să se calculeze media, mediana şi modul ratei


şomajului BIM (Biroul Internaţional al Muncii) înregistrate
pe regiuni de dezvoltare la 31 decembrie 2007, în conformitate
cu datele din tabelul de mai jos:

Rata şomajului
Regiunea de dezvoltare
BIM (%)
Nord - Vest 4,3
Centru 8,5
Nord – Est 5,0
Sud – Est 8,5
Bucureşti – Ilfov 4,1
Sud – Muntenia 8,2
Sud – Vest Oltenia 6,8
Vest 5,6

Sursă: Anuarul Statistic al României 2008, pag. 166-171.

III. Să se calculeze media, mediana şi modul populaţiei


ocupate având statutul profesional de patron şi înregistrate,
pe regiuni de dezvoltare, la 31 decembrie 2007, în
conformitate cu datele din tabelul de mai jos:
Regiunea de Total populaţie cu statut profesional de
dezvoltare patron (mii persoane)
Nord - Vest 19
Centru 19
Nord – Est 22
Sud – Est 20
Bucureşti – Ilfov 18
Sud – Muntenia 18
Sud – Vest Oltenia 8
Vest 13
Sursă: Anuarul Statistic al României 2008, pag. 196-201.

59
Adrian MARINESCU

2.3. Calculul abaterii standard

2.3.1. Recapitularea principalelor elemente teoretice


Abaterea standard este un indice care reflectă diferenţa
mediei scorurilor faţă de media scorurilor luate în calcul şi are
întotdeauna o valoare pozitivă. Deoarece distanţa faţă de medie
poate să fie în ambele sensuri (imaginaţi-vă o dreaptă, un punct pe
aceasta şi un sens crescător, de la stânga la dreapta), specialiştii au
convenit ca numărul de abateri standard peste medie (situate în
exemplul nostru, în dreapta punctului) să fie considerate „+”
relativ la medie, iar numărul de abateri standard sub medie (situate
în stânga punctului, să fie considerate „–” (figura 2)

– relativ la medie Medie + relativ la medie


Figura 2. Stabilirea semnelor „+” şi „–” pe axă.

Ca urmare, valorile (scorurile) peste media eşantionului


vor avea un prefix pozitiv („+”), în timp ce valorile (scorurile)
care se vor plasa sub medie, vor avea un prefix negativ („–”).
În aceste condiţii, de exemplu, dacă pentru un set de
scoruri, vom avea o valoare a mediei de 10 şi o abatere standard
de ± 5, rezultă că faţă de media calculată, toate celelalte scoruri
componente ale setului considerat, se încadrează într-un interval
cuprins între 5 – 15.

60
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.3.2. Etapele calculării abaterii standard


Pentru calcularea abaterii standard, cu ajutorul
programului SPSS, a unui set de valori dat, este necesar să
parcurgem următoarele şase etape:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
II. Definirea primei coloane în conformitate cu datele
problemei sau, dacă este cazul, cu dorinţa
utilizatorului. În funcţie de datele problemei, se
înlătură sau nu cele două zecimale.
III. Revenirea în ecranul DATA VIEW şi inserarea
datelor.
IV. Derularea analizei prin parcurgerea următorilor paşi:
ANALYZE – DESCRIPTIVE STATISTICS –
DESCRIPTIVES. La încheierea ultimului pas, în
fereastra nou deschisă, se transferă câmpul definit, în
lista de variabile. Pentru vizualizarea abaterii
standard, pe fiecare înregistrare se va selecta
opţiunea SAVE STANDARDIZED VALUES AS
VARIABLES.
V. Se accesează butonul OPTIONS şi se verifică dacă
sunt deselectate MEAN, MEDIAN şi MODE
(dacă nu sunt deselectate, atunci se va acţiona în
consecinţă), clic pe CONTINUE şi în final se apasă
butonul OK din tabelul anterior care reapare.
VI. Apariţia OUTPUT

2.3.3. Probleme rezolvate


Exemplificăm cele prezentate în subcapitolul anterior, cu
ajutorul a două exemple de probleme rezolvate:
I . S ă s e c a l c u l e ze a b a t e r e a s t a n d a r d a c â ş t i g u l u i
s al a r i a l ne t , p e ac t i vi t ăţ i a l e e c o nom i e i n aţ i o na l e a R om ân i e i ,

61
Adrian MARINESCU

î n a n u l 2 0 0 7 , î n c o n f o r m i t a t e c u d a t e l e p r e ze n t a t e î n
t a be l u l al ăt u r at :

Câştig salarial nominal


Activitate
mediu net (lei)

Agricultură, vânătoare şi 987


silvicultură
Pescuit şi piscicultură 771
Industrie extractivă 2469
Industrie prelucrătoare 1146
Energie electrică şi 2141
termică, gaze şi apă
Construcţii 1180
Comerţ 1104
Hoteluri şi restaurante 861
Transport, depozitare şi 1680
comunicaţii
Intermedieri financiare 3575
Tranzacţii imobiliare şi alte 1486
servicii
Administraţie publică şi 2681
apărare
Învăţământ 1601
Sănătate şi asistenţă socială 1265
Celelalte activităţi ale 1177
economiei naţionale

Sursă: Anuarul Statistic al României 2008, pag. 270.

62
Culegere de probleme rezolvate cu ajutorul programului SPSS

Pentru rezolvarea problemei de mai sus, parcurgem cele


6 etape menţionate mai sus:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Definirea primei coloane în conformitate cu datele


problemei sau, dacă este cazul, cu dorinţa
utilizatorului. În funcţie de datele problemei, se
înlătură sau nu cele două zecimale.

63
Adrian MARINESCU

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

IV. Derularea analizei prin parcurgerea următorilor paşi:


ANALYZE – DESCRIPTIVE STATISTICS –
DESCRIPTIVES. La încheierea ultimului pas,
în fereastra nou deschisă, se transferă câmpul definit,
în lista de variabile. Pentru vizualizarea abaterii standard,
pe fiecare înregistrare se va selecta opţiunea SAVE
STANDARDIZED VALUES AS VARIABLES.

64
Culegere de probleme rezolvate cu ajutorul programului SPSS

V. Se accesează butonul OPTIONS şi se verifică dacă


sunt deselectate MEAN, MEDIAN şi MODE (dacă nu
sunt deselectate, atunci se va acţiona în consecinţă),
clic pe CONTINUE şi în final se apasă butonul OK din
tabelul anterior care reapare.

65
Adrian MARINESCU

VI. Apariţia OUTPUT


Descriptive Statistics

N Min. Max. Mean Std. Deviation


Salariu 15 771 3575 1608,27 786,685
Valid N (listwise) 15

1 2 3 4 5
Interpretarea output-ului
1. Numărul de cazuri este 15.
2. Valoarea minimă este 771.
3. Valoarea maximă este 3575.
4. Media setului de înregistrări este 1608,27.
5. Abaterea standard este de 786,685.
Revenind la ecranul cu înregistrări (etapa a 2-a) vom observa
apariţia unei noi coloane (cea de-a doua) în care sunt calculat scorurile
z sau standard pentru fiecare dintre cele 15 scoruri înregistrate.

66
Culegere de probleme rezolvate cu ajutorul programului SPSS

În final, conform recomandării specialiştilor, formula de


raportare este de forma: S-a determinat abaterea standard
a câştigului salarial net, pe activităţi ale economiei naţionale
a României, în anul 2007, ca fiind de 786,685 lei (N=15).
II. Să se calculeze abaterea standard a costului mediu
lunar al forţei de muncă pe un salariat, în industria
prelucrătoare a României, pe anul 2007 şi în conformitate cu
datele prezentate în tabelul alăturat:
Cost mediu lunar
Activitate al forţei de muncă /
salariat (lei)
Alimentară şi băuturi 1424
Produse din tutun 4086
Produse textile 1175
Articole de îmbrăcăminte 1045
Pielărie şi încălţăminte 1040
Prelucrarea lemnului şi a 1018
produselor din lemn
Celuloză, hârtie şi produse din 1563
hârtie
Edituri, poligrafie şi reproducerea 1532
pe suporţi a înregistrărilor
Prelucrarea ţiţeiului, cocsificarea 3340
cărbunelui şi tratarea
combustibililor nucleari
Substanţe şi produse chimice 2398
Produse din cauciuc şi mase plastice 1490

67
Adrian MARINESCU

Cost mediu lunar


Activitate al forţei de muncă /
salariat (lei)
Fabricarea materialelor de 1864
construcţii şi alte produse din
minerale nemetalice
Metalurgie 2556
Construcţii metalice şi produse din 1611
metal
Maşini şi echipamente (exclusiv 1783
echipamente electrice şi optice)
Mijloace ale tehnicii de calcul şi de 1576
birou
Maşini şi aparate electrice 1561
Echipamente pentru radio, 2564
televiziune şi telecominicaţii
Aparatură şi instrumente medicale 1661
de precizie, optice şi ceasornicărie
Mijloace de transport rutier 2112
Mijloace de transport neincluse la 2152
cele rutiere
Mobilier şi alte activităţi industriale 1169
neclasificate în altă parte
Recuperarea deşeurilor 1392

Sursă: Anuarul Statistic al României 2008, pag. 284.

68
Culegere de probleme rezolvate cu ajutorul programului SPSS

Rezolvarea problemei se face prin parcurgerea celor


6 etape prezentate anterior:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Definirea primei coloane.

69
Adrian MARINESCU

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

IV. Derularea analizei (ANALYZE – DESCRIPTIVE


STATISTICS – DESCRIPTIVES). Transferarea
cîmpului definit, în lista de variabile. Selectarea
opţiunii SAVE STANDARDIZED VALUES AS
VARIABLES.

70
Culegere de probleme rezolvate cu ajutorul programului SPSS

V. Se accesează butonul OPTIONS şi se verifică dacă


sunt deselectate MEAN, MEDIAN şi MODE, clic pe
CONTINUE şi în final se apasă butonul OK din tabelul
anterior care reapare.

71
Adrian MARINESCU

VI. Apariţia OUTPUT


Descriptive Statistics

Std.
N Min Max Mean Deviation
Cost 23 1018 4086 1830,96 755,466
Valid N
23
(listwise)

Interpretarea output-ului
1. Numărul de cazuri = 23.
2. Valoarea minimă = 1018.
3. Valoarea maximă = 4086.
4. Media setului de înregistrări = 1830,96.
5. Abaterea standard = 755,466.
Revenind la ecranul cu înregistrări (etapa a 2-a)
vizualizăm scorurile z sau standard pentru fiecare înregistrare.

72
Culegere de probleme rezolvate cu ajutorul programului SPSS

Formula de raportare: S-a determinat abaterea standard a


costului mediu al forţei de muncă, pe un salariat, pe activităţi ale
economiei naţionale a României, în anul 2007, ca fiind de
755,466 lei (N=23).

2.3.4. Probleme propuse spre rezolvare


I. Să se calculeze abaterea standard a câştigului
nominal mediu net lunar realizat în anul 2007, în următoarele
judeţe din Transilvania:

Câştigul nominal
Judeţ mediu net lunar
(lei / salariat)
Alba 933
Bihor 811
Bistriţa-Năsăud 905
Braşov 984
Cluj 1113
Covasna 792
Harghita 814
Maramureş 843
Mureş 950
Satu Mare 896
Sălaj 920
Sibiu 987
Sursă: Anuarul Statistic al României 2008, pag. 293.

73
Adrian MARINESCU

II. Să se calculeze abaterea standard a câştigului


nominal mediu brut lunar realizat în anul 2007,
în agricultură, vânătoare şi silvicultură, în
următoarele judeţe din România:
Câştigul nominal
Judeţ mediu brut lunar
(lei / salariat)
Argeş 981
Brăila 894
Buzău 832
Călăraşi 863
Constanţa 857
Dâmboviţa 1001
Dolj 965
Galaţi 997
Giurgiu 1040
Gorj 983
Ialomiţa 845
Ilfov 1002
Mehedinţi 1065
Municipiul Bucureşti 1134
Olt 891
Prahova 1011
Vâlcea 1120
Sursă: Anuarul Statistic al României 2008, pag. 294.

74
Culegere de probleme rezolvate cu ajutorul programului SPSS

III. Să se calculeze abaterea standard a câştigului


nominal mediu brut lunar realizat în anul 2007, în construcţii,
în următoarele judeţe din România:
Câştigul nominal
Judeţ mediu brut lunar
(lei / salariat)
Argeş 1084
Brăila 1005
Buzău 1054
Călăraşi 1030
Constanţa 1256
Dâmboviţa 1166
Dolj 1152
Galaţi 1149
Giurgiu 1248
Gorj 1069
Ialomiţa 1055
Ilfov 1336
Mehedinţi 1103
Municipiul Bucureşti 1321
Olt 1207
Prahova 1234
Vâlcea 1137
Sursă: Anuarul Statistic al României 2008, pag. 295.

75
Adrian MARINESCU

2.4. Analiza relaţiei dintre 2 – n variabile


2.4.1. Recapitularea principalelor elemente teoretice
Acest tip de analiză este necesar atunci când utilizatorul,
în rezolvarea unei probleme, trebuie să ia în considerare influenţa
mai multor factori.
Un element nou îl constituie faptul că pentru studierea mai
aprofundată a fenomenului, dar şi pentru formularea celor mai
bune concluzii, în practica curentă se utilizează tabele şi diagrame.
Dintre acestea, specialiştii recomandă utilizarea, cu precădere,
a diagramelor cu bare (histogramele) şi diagramele scatter.
Teoretic, alegerea tipului de diagramă rămâne la
latitudinea utilizatorului, acesta având libertatea de a alege forma
de diagramă pe care o consideră cea mai elocventă pentru
comunicarea concluziilor la care a ajuns. În practica curentă s-a
constatat că, pentru obţinerea unei eficienţe maxime în
transmiterea concluziilor, este obligatorie alegerea tipului de
diagramă în funcţie de tipul datelor disponibile. Astfel, dacă
informaţiile se prezintă sub forma unor variabile numerice,
eficienţa cea mai mare în comunicarea rezultatelor o are diagrama
scatter, iar dacă ele sunt variabile nominale, atunci cea mai bună
alegere o constituie tabelul de asociere.
Indiferent de forma aleasă, tabel de asociere sau diagramă,
nu trebuie uitat nici faptul că, asigurarea succesului are drept
condiţie esenţială etichetarea corectă a celor două forme de
prezentare. În funcţie de experienţa utilizatorului în prezentarea
cât mai eficientă a concluziilor, rezultatele obţinute în urma
analizei efectuate cu ajutorul programului SPSS, acesta poate
alege şi alte forme de prezentare sau să le mai „ajusteze” pe cele
existente, toate aceste în scopul creşterii eficienţei procesului de
comunicare. Nu de puţine ori se recomandă ca înainte de
prezentare, utilizatorul să se informeze asupra gradului de
instruire al receptorului pentru a putea astfel alege cea mai
eficientă formă de prezentare.

76
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.4.2. Etapele analizei relaţiei dintre 2 –n variabile


a. Tabelul de asociere
În acest caz, cele 9 etape sunt:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
II. Definirea primelor trei coloane, în conformitate cu
datele problemei sau, dacă este cazul, cu dorinţa
utilizatorului (în mod frecvent, a treia coloană se
denumeşte Frecvenţă). În funcţie de datele
problemei, se înlătură sau nu cele două zecimale.
III. Etichetarea valorilor primelor două câmpuri prin
completarea ferestrei ce se deschide la activarea
opţiunii VALUES.
IV. Revenirea în ecranul DATA VIEW şi inserarea datelor.
V. Ponderarea datelor prin parcurgerea paşilor: DATA –
WEIGHT CASES – se trece coloana FRECVENŢĂ
în câmpul de variabile – OK. Reamintim că dacă
această operaţie este efectuată corespunzător, atunci
în colţul dreapta-jos al ferestrei Data Editor apare
mesajul WEIGHT ON.
VI. Crearea tabelului de asociere prin parcurgerea
următorilor paşi: ANALYZE – TABLES – BASIC
TABLES.
VII. Plasarea celor două câmpuri de variabile pe rândurile
respectiv, coloanele tabelului (mutarea în fereastra
corespunzătoare etichetei DOWN şi respectiv
mutarea în fereastra corespunzătoare etichetei
ACROSS).
VIII. În opinia noastă această etapă nu este obligatorie,
ea putând fi opţională şi de aceea o prezentăm
separat în caseta intitulată „recomandare” (Dacă
însă aveţi nevoie de rezultate sub formă de ponderi,
atunci ea devine obligatorie !)

77
Adrian MARINESCU

RECOMANDARE

Este foarte posibil ca utilizatorul să dorească ca


rezultatele finale să cuprindă şi ponderea datelor iniţiale
din totalul lor. De aceea, în fereastra în care au fost
trecute cele două coloane, în câmpurile de variabile
(ACROSS, respectiv DOWN), vom accesa opţiunea
STATISTICS, continuând selecţia în funcţie de dorinţa
utilizatorului de afişare a procentelor. Cele mai uzitate
forme de prezentare sunt:
a. Afişşa
area în output a frecvenţelor ca procentaj
din numărul total. Paşi: TABLES% – ADD –
CONTINUE –OK.
b. Afişşa
area în output a procentelor pe coloană.
Paşi: COL% – ADD – CONTINUE – OK.
c. Afişşa
area în output a procentelor pe rânduri.
Paşi: ROW% – ADD – CONTINUE – OK.

IX. Interpretarea şi raportarea output-ului


b. Diagrame
Dacă dorim ca output-ul să fie prezentat sub formă de
grafic primele 9 etape rămân neschimbate ca în cazul în care
dorim să obţinem un tabel de frecvenţă. Odată obţinut tabelul,
de exemplu, cu afişarea procentelor pe coloană vom parcurge încă
6 etape (nu vă speriaţi de numărul relativ mare de etape pentru
prezentarea output-ului sub formă de grafic cu bare, în definitiv
primele 9 etape sunt comune cu etapele de realizare a tabelului de
frecvenţe, iar următoarele, dacă sunteţi atent, practic, decurg
aproape una din cealaltă):

78
Culegere de probleme rezolvate cu ajutorul programului SPSS

X. Copierea procentelor afişate pe coloană, în tabelul


de frecvenţe.
XI. Definirea unei noi coloane (pentru a sugera cât mai
bine conţinutul, propunem denumirea de PROCENT)
pentru care numărul de zecimale va fi preluat din
tabelul de frecvenţă (în cazul de faţă = 1).
XII. Revenirea în ecranul DATA VIEW şi completarea
noii coloane cu datele reţinute la etapa X.
XIII. Ponderarea în funcţie de noua coloană: DATA –
WEIGHT CASES – se trece coloana PROCENT în
câmpul de variabile – OK. Reamintim că în colţul
dreapta-jos al ferestrei Data Editor apare mesajul
WEIGHT ON, dacă această operaţie este efectuată
corespunzător.
XIV. Prelucrarea datelor prin intermediul comenzilor:
GRAPHS – BAR – STACKED – DEFINE.
Trecerea în câmpurile de variabile CATEGORY
AXIS şi respectiv DEFINE STACKS BY şi
selectarea opţiunii N OF CASES – OK
XV. Apariţia OUTPUT-ului sub formă de diagramă cu bare.
Aşa, că nu este prea greu?
2.4.3. Probleme rezolvate
I. Să se analizeze numărul şo şomerilor înregistraţi la
31 decembrie 2007 după nivelul de educaţie al acestora şi în
funcţie de datele cuprinse în tabelul următor:
Nivelul de educaţie
Primar,
Categorie Liceal şi
gimnazial, Universitar
postliceal
profesional
Şomeri cu experienţă
67637 29966 5303
în muncă1
Şomeri fără
6612 7815 4056
experienţă în muncă2

79
Adrian MARINESCU

Sursă: Anuarul Statistic al României 2008, pag. 232.


NOTĂ:
1. Persoane aflate în şomaj ca urmare a pierderii locului de
muncă (articolul 39 din Legea 76/2002 privind sistemul
asigurărilor pentru şomaj şi stimularea ocupării forţei de
muncă cu modificările şi completările ulterioare).
2. Absolvenţi ai instituţiilor de învăţământ (articolul 40 din
Legea 76/2002 privind sistemul asigurărilor pentru şomaj
şi stimularea ocupării forţei de muncă cu modificările şi
completările ulterioare).

I. Rezolvarea problemei se face prin parcurgerea celor


nouă etape prezentate anterior:

Accesarea programului şi trecerea în ecranul VARIABLE


VIEW.

80
Culegere de probleme rezolvate cu ajutorul programului SPSS

II. Definirea primelor trei coloane, în conformitate cu


datele problemei.

III. Etichetarea valorilor primelor două câmpuri.

Revenirea în ecranul DATA VIEW şi inserarea datelor.

81
Adrian MARINESCU

IV. Revenirea în ecranul DATA VIEW şi inserarea datelor.

V. Ponderarea datelor

82
Culegere de probleme rezolvate cu ajutorul programului SPSS

83
Adrian MARINESCU

VI. Crearea tabelului de asociere

VII. Plasarea câmpurilor de variabile.

84
Culegere de probleme rezolvate cu ajutorul programului SPSS

VIII. Ponderarea datelor (pentru cele 3 variante).


a. Afişarea frecvenţelor ca % din numărul total.

b. Afişarea procentelor pe coloană.

85
Adrian MARINESCU

c. Afişarea procentelor pe rânduri.

Odată ales tipul de prezentare a output-ului, indiferent de


forma aleasă (a, b sau c de la etapa a VIII-a) vom activa opţiunea
CONTINUE şi apoi, la închiderea ferestrei „Basic Tables
Statistics” vom da OK în fereastra „Basic Tables”.
IX. Apariţia OUTPUT
Pentru cele trei variante de afişare, output-ul se prezintă
astfel:
a. Afişarea frecvenţelor ca % din numărul total.
Şomeri cu Şomeri fără
experienţă experienţă
Table % Table %
Primar, gimnazial, profesional 55,7% 5,4%
Liceal, postliceal 24,7% 6,4%
Universitar 4,4% 3,3%

86
Culegere de probleme rezolvate cu ajutorul programului SPSS

Concluziile pe care le putem desprinde din analizarea


acestui tabel sunt următoarele: Pe baza datelor prezentate în
Anuarul Statistic al României 2008 din totalul de beneficiari
de indemnizaţie de şomaj, înregistraţi la 31 decembrie 2007,
61,1% fac parte din categoria persoanelor cu studii la nivel de
şcoală primară, gimnazială şi profesională, 31,1% au finalizat
studii liceale şi postliceale, în timp ce 7,7% reprezintă procentul
celor care au studii universitare.
O altă concluzie ar putea fi de forma: din totalul
beneficiarilor de indemnizaţie de şomaj, înregistraţi la
31 decembrie 2007, 84,8% sunt persoane ce pot fi incluse
în categoria „şomeri cu experienţă”, restul făcând parte din categoria
„şomeri fără experienţă”. Puteţi „descoperi” şi alte variante ?

b. Afişarea procentelor pe coloană.


Şomeri cu Şomeri fără
experienţă experienţă
Col % Col %
Primar, gimnazial, profesional 65,7% 35,8%
Liceal, postliceal 29,1% 42,3%
Universitar 5,2% 21,9%

Analizând datele prezentate în acest tip de output putem


concluziona că: pe baza datelor prezentate în Anuarul Statistic al
României 2008 din totalul de beneficiari de indemnizaţie de
şomaj, având statutul de şomeri cu experienţă, înregistraţi la
31 decembrie 2007, 65,7% fac parte din categoria persoanelor cu
studii la nivel de şcoală primară, gimnazială şi profesională,
29,1% au finalizate studiile liceale şi postliceale, în timp ce 5,2%
fac parte din categoria celor care au studii universitare.

87
Adrian MARINESCU

De asemenea, din totalul de beneficiari de indemnizaţie de


şomaj, având statutul de şomeri fără experienţă, înregistraţi la
31 decembrie 2007, 35,8% fac parte din categoria persoanelor cu
studii la nivel de şcoală primară, gimnazială şi profesională,
42,3% au finalizate studiile liceale şi postliceale, în timp ce 21,9%
fac parte din categoria celor care au studii universitare.
O altă formă de concluzie poate fi de genul: din totalul de
beneficiari de indemnizaţie de şomaj, având statutul de şomeri
fără experienţă, înregistraţi la 31 decembrie 2007, ponderea cea
mai mare o deţin persoanele cu studii la nivel de şcoală primară,
gimnazială şi profesională: 65,7%, în timp ce, din totalul
şomerilor fără experienţă, ponderea cea mai mare este deţinută de
persoanele care au finalizate studiile liceale şi postliceale: 42,3%.

c. Afişarea procentelor pe rânduri.

Şomeri cu Şomeri fără


Denumire experienţă experienţă
Row % Row %
Primar, gimnazial, profesional 91,1% 8,9%
Liceal, postliceal 79,3% 20,7%
Universitar 56,7% 43,3%

Analizând datele prezentate în acest tip de output putem


concluziona că: pe baza datelor prezentate în Anuarul Statistic al
României 2008, din totalul de beneficiari de indemnizaţie de
şomaj, având studii la nivel de şcoală primară, gimnazială sau
profesională, un procent de 91,1% îl reprezintă numărul şomerilor
cu experienţă, în timp ce 8,9% sunt şomeri fără experienţă.
Din totalul de beneficiari de indemnizaţie de şomaj, având
studii liceale şi postliceale, 79,3% dintre aceştia sunt şomeri cu
experienţă, iar 20,7% sunt şomeri fără experienţă.

88
Culegere de probleme rezolvate cu ajutorul programului SPSS

Situaţia este mai echilibrată la ultima categorie, cea


destinată persoanelor cu studii universitare, unde procentul de
şomerii cu experienţă (56,7%), se apropie cel mai mult dintre
toate categoriile analizate mai sus, de procentul de şomeri fără
experienţă, cotat la un nivel de 43,3%.
*
Dacă dorim să prezentăm Output-ul sub forma diagramei
cu bare nu avem decât să parcurgem şi celelalte 6 etape, astfel:

X. Copierea procentelor afişate pe coloană, în tabelul de


frecvenţe.
Copiem procentele obţinute la punctul b (Afişarea
procentelor pe coloană)

XI. Definirea unei noi coloane: denumire = PROCENT,


numărul de zecimale =1.

89
Adrian MARINESCU

XII. Completarea noii coloane în ecranul DATA


VIEW.

XIII. Ponderarea în funcţie de noua coloană

90
Culegere de probleme rezolvate cu ajutorul programului SPSS

91
Adrian MARINESCU

XIV. Prelucrarea datelor prin intermediul comenzilor:


GRAPHS – BAR – STACKED – DEFINE.

92
Culegere de probleme rezolvate cu ajutorul programului SPSS

XV. Apariţia OUTPUT-ului sub formă de diagramă cu bare.


120 Denumire
Şomeri cu experienţă
Şomeri fără experienţă

100

80
Count

60

40

20

0
Primar,gimnazial, Liceal,postliceal Universitar
profesional

Educaţie

Cases weighted by Procent

93
Adrian MARINESCU

Acesta nu este decât un exemplu de cum poate fi realizată


o prezentare sub forma unui grafic cu bare, programul SPSS
oferind mult mai multe forme de prezentare a acestor Output-uri.
Accesul la alte tipuri de grafice fiind extrem de facil,
putem concluziona că utilizarea uneia sau alteia dintre tipurile de
grafice ale programului, ţine mai mult de dificultatea alegerii,
decât de însuşirea etapelor ce trebuie parcurse.
La ce folosesc aceste analize?
Datele iniţiale fiind valabile la nivelul întregii ţări, la
prima vedere, concluziile pot să intereseze doar la nivel macro,
eventual pentru comparaţii cu situaţia înregistrată, la aceeaşi dată,
în alte ţări. Dar dacă datele care urmează să fie prelucrate se referă
la o anumită zonă din România, în care utilizatorul doreşte să
pornească o afacere? Nu credeţi că l-ar putea interesa câteva
aspecte cum ar fi: numărul de şomeri din zonă, dacă au sau nu o
experienţă în muncă, care este nivelul de pregătire al acestei forţe
de muncă, etc? Este o temă de reflexie interesantă, nu?
Un argument în plus îl poate constitui şi problema
următoare:
III. În vederea reducerii şomajului într-o zonă trebuie
efectuată o analiză asupra forţelor de muncă existente şi a
nivelului lor de pregătire. Datele obţinute în acest sens sunt
cuprinse în tabelul următor:

Formă de învăţământ Sex


finalizată Masculin Feminin
Şcoala primară sau forme 30 25
echivalente
Liceu sau forme echivalente 28 35
Studii universitare 55 47
Studii post-universitare 25 16

94
Culegere de probleme rezolvate cu ajutorul programului SPSS

Pentru început derulăm cele 9 etape prezentate anterior:


I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Definirea primelor trei coloane, în conformitate cu


datele problemei..

95
Adrian MARINESCU

III. Etichetarea valorilor primelor două câmpuri.

IV. Revenirea în ecranul DATA VIEW şi inserarea datelor.

96
Culegere de probleme rezolvate cu ajutorul programului SPSS

V. Ponderarea datelor

97
Adrian MARINESCU

VI. Crearea tabelului de asociere

98
Culegere de probleme rezolvate cu ajutorul programului SPSS

VII. Plasarea câmpurilor de variabile.

VIII. Ponderarea datelor (pentru cele 3 variante).


a. Afişarea frecvenţelor ca % din numărul total.

99
Adrian MARINESCU

b. Afişarea procentelor pe coloană.

c. Afişarea procentelor pe rânduri.

100
Culegere de probleme rezolvate cu ajutorul programului SPSS

Odată ales tipul de prezentare a tabelului de frecvenţă,


indiferent de forma aleasă (a, b sau c de la etapa a VIII-a) vom
activa opţiunea CONTINUE şi apoi, la închiderea ferestrei „Basic
Tables Statistics” vom da OK în fereastra „Basic Tables”.

IX. Apariţia OUTPUT


Pentru cele trei variante de afişare, tabelul de frecvenţă se
prezintă astfel:
a. Afişarea frecvenţelor ca % din numărul total.

Studii Studii
Studii Studii post-
primare sau liceale sau
universitare universitare
echivalente echivalente

Table % Table % Table % Table %


Masculin 11,5% 10,7% 21,1% 9,6%

Feminin 9,6% 13,4% 18,0% 6,1%

b. Afişarea procentelor pe coloană.

Studii Studii liceale


Studii Studii
primare sau sau
universitare postuniversitare
echivalente echivalente

Col % Col % Col % Col %

Masculin 54,5% 44,4% 53,9% 61,0%

Feminin 45,5% 55,6% 46,1% 39,0%

101
Adrian MARINESCU

c. Afişarea procentelor pe rânduri.


Studii Studii
Studii Studii post-
primare sau liceale sau
universitare universitare
echivalente echivalente
Row % Row % Row % Row %
Masculin 21,7% 20,3% 39,9% 18,1%
Feminin 20,3% 28,5% 38,2% 13,0%

La fel ca în exemplul precedent, dacă dorim să prezentăm


Output-ul sub forma diagramei cu bare nu avem decât să
parcurgem şi celelalte 6 etape, astfel:
X. Copierea procentelor afişate pe coloană, în tabelul de
frecvenţe.
Copiem procentele obţinute la punctul b (Afişarea
procentelor pe coloană)
XI. Definirea unei noi coloane: denumire = PROCENT,
numărul de zecimale =1.

102
Culegere de probleme rezolvate cu ajutorul programului SPSS

XII. Completarea noii coloane în ecranul DATA VIEW.

XIII. Ponderarea în funcţie de noua coloană.

103
Adrian MARINESCU

XIV. Prelucrarea datelor prin intermediul comenzilor:


GRAPHS – BAR – STACKED – DEFINE.

104
Culegere de probleme rezolvate cu ajutorul programului SPSS

105
Adrian MARINESCU

XV. Apariţia OUTPUT-ului sub formă de diagramă cu bare.

100 Sex
Masculin
Feminin

80

60
Count

40

20

0
Studii primare Studii liceale sau Studii Studii
sau echivalente echivalente universitare postuniversitare

Educaţie

Cases weighted by Procent

2.4.4. Probleme propuse spre rezolvare

I.. În vederea elaborării unor lucrări de sinteză privind


dinamica populaţiei în lume, Organizaţia Mondială a
Sănătăţii a solicitat fiecărei ţări membre, o situaţie a dinamicii
populaţiei pe anii 2006 şi 2007, indicând totodată grupele de
vârstă pentru care doreşte informaţii. În urma consultării
Institutului Naţional de Statistică, pentru perioada solicitată,
România a pus la dispoziţia solicitantului datele cuprinse în
tabelul de mai jos pe care vă rugăm, să le analizaţi şi eventual,
să le comentaţi.

106
Culegere de probleme rezolvate cu ajutorul programului SPSS

Număr de persoane
Grupa de vârstă (ani)
2006 2007
0- 4 1057804 1062537
5– 9 1098663 1090284
10 – 14 1177605 1135618
15 – 19 1653027 1541828
20 – 24 1599535 1640127
25 – 29 1778735 1740686
30 – 34 1689369 1715518
35 – 39 1869153 1929137
40 – 44 1192648 1200174
45 – 49 1463532 1392744
50 – 54 1528720 1544281
55 – 59 1310266 1360523
60 – 64 977303 984384
65 – 69 1041631 1004068
70 – 74 913325 918177
75 – 79 675967 690768
80 – 84 391080 403440
85 şi peste 166002 183269
Sursa datelor: pagina 45 din Anuarul statistic al României 2008.

107
Adrian MARINESCU

II. Analizaţi şi comentaţi situaţia populaţiei


înregistrată la data de 1.07.2007, pe sexe şi pe grupe de vârstă,
extrasă din Anuarul Statistic al României 2008.
Număr de persoane
Grupa de vârstă (ani)
Ambele sexe Feminin
0- 4 1062537 516671
5– 9 1090284 530428
10 – 14 1135618 554262
15 – 19 1541828 755065
20 – 24 1640127 800382
25 – 29 1740686 850157
30 – 34 1715518 836781
35 – 39 1929137 953321
40 – 44 1200174 597949
45 – 49 1392744 705364
50 – 54 1544281 797850
55 – 59 1360523 716297
60 – 64 984384 532536
65 – 69 1004068 567316
70 – 74 918177 534808
75 – 79 690768 415138
80 – 84 403440 254101
85 şi peste 183269 122417

108
Culegere de probleme rezolvate cu ajutorul programului SPSS

III. Analizaţi şi comentaţi durata medie a vieţii


înregistrată în România, în perioada 1989 - 2007 pe fiecare sex
în parte, conform datelor prezentate în tabelul de mai jos.
Sex
Grupa de ani
Masculin Feminin
1989 – 1991 66,59 73,05
1990 – 1992 66,56 73,17
1991 – 1993 66,06 73,17
1992 – 1994 65,88 73,32
1993 – 1995 65,70 73,36
1994 – 1996 65,30 73,09
1995 – 1997 65,19 73,00
1996 – 1998 65,46 73,32
1997 – 1999 66,05 73,67
1998 – 2000 67,03 74,20
1999 – 2001 67,69 74,84
2000 – 2002 67,61 74,90
2001 – 2003 67,42 74,78
2002 – 2004 67,74 75,06
2003 – 2005 68,19 75,47
2004 – 2006 68,74 75,80
2005 – 2007 69,17 76,14
Sursa datelor: pagina 71 din Anuarul statistic al României 2008.

109
Adrian MARINESCU

2.5. Coeficienţi de corelaţie


2.5.1. Recapitularea principalelor elemente teoretice
Programul SPSS permite calcularea mai multor tipuri de
coeficienţi de corelaţie. Dintre aceştia cel mai uzitat şi totodată,
cel mai comun, este coeficientul de corelaţie Pearson.
În practica curentă este posibil să mai întâlniţi şi alte tipuri
de coeficienţi de corelaţie cum ar fi coeficientul de corelaţie
biserial phi sau coeficientul de corelaţie Spearman, dar specialiştii
ne atrag atenţia că ei sunt doar variante ale coeficientului de
corelaţie Pearson. Acest coeficient se notează cu simbolul „r” şi el
a fost introdus în practica curentă de către Karl Pearson
(1857–1936), matematician, filozof al ştiinţei, biometrician
şi statistician englez.
Ca definiţie pentru acest coeficient, specialiştii ne propun
următoarea formulă: „Coeficientul Pearson este o măsură
numerică sau un indice al gradului de asociere între două seturi
de scoruri”. Ca valoare, coeficientul Pearson variază într-un
interval închis [-1, +1], valorile negative sau pozitive având
următoarele semnificaţii:.
„+” = corelaţie pozitivă (la creşterea scorurilor unei
variabile, cresc şi scorurile variabilei 2).
„ – ” = corelaţie negativă (la creşterea scorurilor unei
variabile scad scorurile variabilei 2).
De asemenea, în condiţiile în care este cunoscut faptul că,
un coeficient de corelaţie este un indice de măsurare al gradului de
asociere dintre două scoruri, o corelaţie de „+1” indică o asociere
perfectă între variabilele luate în analiză (la creşterea scorurilor
unei variabile se înregistrează, în acelaşi timp, o creştere a
scorurilor celei de-a doua variabile. Valoarea negativă indică
faptul că, la creşterea setului de valori asociat unei variabile, avem
o descreştere a scorurilor celei de-a doua variabile.
Valoarea „0” a coeficientului Pearson semnalează
dispersarea aleatorie, în jurul unei drepte, a tuturor punctelor, în
cazul în care utilizăm, pentru prezentare, diagrama scatter.

110
Culegere de probleme rezolvate cu ajutorul programului SPSS

Valoarea de mijloc a intervalului pozitiv sau a celui


negativ, ne semnalează corelaţia moderat negativă (în cazul unei
valori de –0,5 şi respectiv, o corelaţie moderat pozitivă, în cazul
unei valori de +0,5.
Un model de interpretare a valorilor coeficienţilor de
corelaţie a fost elaborat în anul 2000 de către W.G. Hopkins, astfel:

Coeficientul
Descriptor
de corelaţie

0.0–0.1 Foarte mic, neglijabil, nesubstanţial


0.1–0.3 Mic, minor
0.3–0.5 Moderat, mediu
0.5–0.7 Mare, ridicat, major
0.7–0.9 Foarte mare, foarte ridicat
Aproape perfect, descrie relaţia dintre două
0,9–1,0
variabile practic indistincte

Totodată, specialiştii au formulat două condiţii pentru


utilizarea, eficientă a coeficientului Pearson:
1. Măsurarea variabilelor luate în analiză pe scală de
interval / raport.
2. Existenţa unei forme a distribuţiei care nu se abate
sever de la curba normală.
Coeficientul de corelaţie Spearman este echivalentul
coeficientului de corelaţie Pearson, dar se utilizează pentru date
ordinale. El este cuprins în acelaşi interval şi anume [-1, +1],
interpretarea rezultatului efectuându-se, în mod identic cu
interpretarea dată celui obţinut pentru coeficientul Pearson.
Ca utilizare, coeficientul Spearman este recomandat în
momentul în care scorurile pentru o variabilă au un pronunţat
caracter de asimetrie.

111
Adrian MARINESCU

2.5.2. Etapele calculării coeficienţilor de corelaţie


Pearson şi Spearman
a. Coeficientul de corelaţie Pearson
În acest caz, cele 7 etape sunt:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
II. Definirea primelor două coloane, în conformitate cu
datele problemei şi înlăturarea celor două zecimale
(dacă este cazul).
III. Revenirea în ecranul DATA VIEW şi inserarea datelor.
IV. Declanşarea procedurii de calculare a coeficientului
Pearson prin selectarea opţiunilor, în următoarea
ordine: ANALYZE – CORRELATE - BIVARIATE.
V. Plasarea celor două câmpuri în lista de variabile.
VI. Selectarea din fereastra BIVARIATE a coeficientului
Pearson (în versiunile superioare ale programului
SPSS, de cele mai multe ori, această operaţie se
transformă în verificare, deoarece selectarea este
efectuată implicit de către program) şi activarea
butonului OK.
VII. Interpretarea şi raportarea output-ului.
b. Coeficientul de corelaţie Spearman
Cele 7 etape sunt următoarele:
1) Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
2) Definirea primelor două coloane, în conformitate cu
datele problemei şi înlăturarea celor două zecimale
(dacă este cazul).
3) Revenirea în ecranul DATA VIEW şi inserarea datelor.
4) Declanşarea procedurii de calculare a coeficientului
Spearman prin selectarea opţiunilor, în următoarea
ordine: ANALYZE – CORRELATE - BIVARIATE.

112
Culegere de probleme rezolvate cu ajutorul programului SPSS

5) Plasarea celor două câmpuri în lista de variabile.


6) Selectarea din fereastra BIVARIATE a coeficientului
Spearman şi activarea butonului OK.
7) Interpretarea şi raportarea output-ului.

IMPORTANT

Chiar dacă problema conţine mai multe categorii de date,


procedura de lucru este similară celei prezentate mai sus. În aceste
condiţii putem concluziona că, pentru validare (a se înţelege
„activarea butonului OK”), sunt necesare minim două variabile,
programul putând să proceseze până la 100 de variabile.
Singura deosebire între corelarea a două categorii de date
şi „n” (n<100) categorii de date, va consta în mărimea output-ului:
tabelul de corelaţii va prezenta intercorelaţiile fiecărei variabile cu
fiecare. Dar avem nevoie chiar de toate aceste intercorelaţii, mai
ales dacă numărul de variabile este foarte mare? Pentru cele mai
multe cazuri, răspunsul este unul negativ: cel mai ades, avem
nevoie de intercorelaţia unei singure variabile şi toate celelalte
variabile luate în analiză. Pentru obţinerea unui asemenea output
trebuie parcurse 9 etape (în succesiunea de mai jos, pentru
evidenţierea celor două etape suplimentare faţă de cele necesare
calculării coeficientului Pearson, acestea au fost bolduite):
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
II. Definirea unui număr de coloane, în concordanţă cu
datele problemei şi înlăturarea celor două zecimale
(dacă este cazul).
III. Revenirea în ecranul DATA VIEW şi inserarea datelor.
IV. Declanşarea procedurii de calculare a coeficientului
Pearson prin selectarea opţiunilor, în următoarea
ordine: ANALYZE – CORRELATE - BIVARIATE.
V. Plasarea câmpurilor în lista de variabile.

113
Adrian MARINESCU

VI. Selectarea din fereastra BIVARIATE a coeficientului


Pearson (în versiunile superioare ale programului
SPSS, de cele mai multe ori, această operaţie se
transformă în verificare, deoarece selectarea este
efectuată implicit de către program).
VII. Activarea opţiunii PASTE care va deschide
fereastra SYNTAX. Pe linia /VARIABLES (unde
sunt trecute toate variabilele separate fiecare cu
un spaţiu), se tastează clauza WITH între
variabile dorite, având grijă să rămână câte un
spaţiu în stânga şi în dreapta clauzei.
VIII. Activarea butonului RUN.
IX. Interpretarea şi raportarea output-ului.
De subliniat faptul că etapele suplimentare sunt valabile şi în
cazul în care dorim să calculăm coeficientul de corelaţie Spearman.
Totodată, menţionăm faptul că, indiferent de coeficientul
de corelaţie pe care dorim să îl calculăm (Pearson sau Spearman),
pentru o raportare cât mai elocventă, se recomandă utilizarea
diagramei scatter. În acest caz, în finalul analizei, trebuie să
parcurgem următoarele patru etape:
X. Revenirea la etapa a III-a (inserarea datelor în
ecranul DATA VIEW), selectarea GRAPH şi apoi
a opţiunii SCATTER/DOT.
XI. Selectarea opţiunilor SIMPLE şi DEFINE.
(în versiunile superioare ale programului SPSS, de
cele mai multe ori, această operaţie se transformă
în verificare, deoarece selectarea opţiunii SIMPLE
este încadrată în categoria „opţiuni predefinite”).
XII. În fereastra nou apărută denumită SIMPLE
SCATTERPLOT, pentru trecerea celor două
variabile pe axe, selectăm, conform dorinţei, o
variabilă pe care o mutăm prin activarea butonului,
în fereastra de sub opţiunea „Y Axis”, iar cea de-a
doua variabilă, în fereastra „X Axis”. În final
apăsăm OK.
XIII. Interpretarea output-ului

114
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.5.3. Probleme rezolvate


2.5.3.1. Coeficientul Pearson
I. Să se calculeze coeficientul de corelaţie Pearson, între
rata şomajului, înregistrată în perioada 2002 – 2007 şi indicii
câştigului salariului real, stabiliţi pentru aceeaşi perioadă,
conform datelor cuprinse în tabelul următor:

Indicele câştigului
Anul Rata şomajului % salariului real faţă de
anul precedent %

2002 8,4 102,4

2003 7,0 110,8

2004 8,0 110,5

2005 7,2 114,3

2006 7,3 109,0

2007 6,4 114,7

Sursă: Anuarul Statistic al României 2008, pag. 120 şi


pag. 265.
*
Rezolvarea problemei va consta în calcularea şi
interpretarea valorii coeficientului Pearson şi în conformitate cu
următoarele etape:

115
Adrian MARINESCU

I. Accesarea programului şi trecerea în ecranul


VARIABLE VIEW.

II. Definirea primelor două coloane, în conformitate cu


datele problemei şi înlăturarea celor două zecimale
(dacă este cazul).

Observaţii:

1. Vom defini primele două coloane, conform modului de


prezentare a datelor problemei şi anume: cu o singură
zecimală.
2. Deoarece denumirile celor două coloane ce cuprind
datele problemei sunt lungi (vezi coloanele 2 şi 3), în
rezolvarea problemei, vom folosi următoarele notaţii
prescurtate:
Rata şomajului % = Rata
Indicele câştigului salariului real faţă de anul
precedent % = Indice

116
Culegere de probleme rezolvate cu ajutorul programului SPSS

III. Revenirea în ecranul DATA VIEW şi inserarea


datelor.

117
Adrian MARINESCU

IV. Declanşarea procedurii de calculare a coeficientului


Spearman prin selectarea opţiunilor, în următoarea
ordine: ANALYZE – CORRELATE - BIVARIATE.

V. Plasarea celor două câmpuri în lista de variabile.

118
Culegere de probleme rezolvate cu ajutorul programului SPSS

VI. Selectarea din fereastra BIVARIATE a coeficientului


Pearsonn şi activarea butonului OK.
În acest caz opţiunea „coeficientul Pearson” este deja
selectată şi în acest caz, pentru afişarea output-ului, nu ne rămâne
altceva de făcut, decât să acţionăm butonul OK.
IX. Interpretarea şi raportarea output-ului.

Rata Indice

Rata Pearson Correlation 1 -,815(*)


Sig. (2-tailed) ,048
N 6 6
Indice Pearson Correlation -,815(*) 1
Sig. (2-tailed) ,048
N 6 6
* Correlation is significant at the 0.05 level (2-tailed).
Interpretarea datelor din tabel este următoarea (pentru o
înţelegere cât mai rapidă, în tabelul de mai sus acestea au fost
bolduite):
-0,815 Corelaţia dintre „Indice“ şi „Rată” este de –0,815
0,048 Testul de semnificaţie two-tailed
6 Numărul cazurilor pe care este bazată corelaţia

Raportarea output-ului:
1. Corelaţia dintre rata şomajului şi indicele
câştigului salariului real faţă de anul precedent
este de –0,81, (conform recomandărilor literaturii de
specialitate corelaţia se rotunjeşte la două zecimale).

119
Adrian MARINESCU

2. Nivelul de semnificaţie este 0,048, adică putem


spune că el este mai mic de 0,05.
3. În acest caz avem 4 grade de libertate, notate cu
„DF” (reamintim că este se calculează conform
formulei: „numărul de cazuri – 2”).
4. Formula finală: În perioada 2002 – 2007, pe baza datelor
problemei, la creşterea indicele câştigului salariului real
faţă de anul precedent, se înregistrează o scădere a ratei
şomajului (r = -0,815, DF=.4 şi p<0,05).

Pentru construirea diagramei scatter vom parcurge şi cele


4 etape suplimentare, astfel:

X. Revenirea la etapa a III (inserarea datelor în ecranul


DATA VIEW), selectarea GRAPH şi apoi a opţiunii
SCATTER/DOT.

120
Culegere de probleme rezolvate cu ajutorul programului SPSS

XI. Selectarea opţiunilor SIMPLE şi DEFINE.

XII. În fereastra nou apărută denumită SIMPLE


SCATTERPLOT, trecerea celor două variabile pe
axe. În final apăsăm OK.

121
Adrian MARINESCU

XIII. Interpretarea output-ului


8,5

8,0

7,5

Rata

7,0

6,5

6,0

102,0 104,0 106,0 108,0 110,0 112,0 114,0 116,0

Indice

Pentru trasarea liniei de regresie mai trebuie parcurse două


etape şi anume:

XIV. Dublu clic pe graficul din output (apar opţiunile)

122
Culegere de probleme rezolvate cu ajutorul programului SPSS

XV. Activarea opţiunii FIT LINE AT TOTAL

Concluzii:
1. Răspândirea rezultatelor este mai aproape de forma
rectilinie decât de forma curbilinie.
2. Valorile sunt plasate într-o bandă relativ îngustă,
ceea ce indică o corelaţie mare.
3. Linia de regresie este trasată din colţul stânga sus
până în dreapta jos, ceea ce sugerează o corelaţie
negativă

Concluziile de mai sus sunt confirmate de două aspecte:


valoarea negativă a coeficientului de corelaţie Pearson şi
interpretarea dată unui asemenea rezultat în cadrul modelului
W.G. Hopkins.

123
Adrian MARINESCU

II. Să se calculeze coeficientul de corelaţie Pearson


între numărul mediu de salariaţi, înregistraţi în comerţ, la
sfârşitul anului 2007, în unele judeţe din România şi numărul
de şomeri, pe fiecare sex în parte, din aceleaşi judeţe, în
conformitate cu datele cuprinse în tabelul următor:

Număr mediu de
Judeţ Bărbaţi Femei
salariaţi

Alba 11151 5404 5105

Bihor 30232 4076 2630

Bistriţa-Năsăud 9166 1624 1481

Braşov 31155 7011 5592

Cluj 37859 4936 5267

Covasna 8086 4017 2636

Harghita 8436 3896 3267

Maramureş 14016 4243 2825

Mureş 21592 6016 4675

Satu Mare 11337 2491 1589

Sălaj 7390 2618 2121

Sibiu 18176 3082 2724

Sursă: Anuarul Statistic al României 2008, pag. 222 şi


pag. 228.
124
Culegere de probleme rezolvate cu ajutorul programului SPSS

*
Rezolvarea problemei se face prin parcurgerea celor
9 etape prezentate anterior:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Definirea unui număr de coloane, în concordanţă cu


datele problemei şi înlăturarea celor două zecimale.

125
Adrian MARINESCU

III. Revenirea în ecranul DATA VIEW şi inserarea


datelor.

IV. Declanşarea procedurii de calculare a coeficientului


Pearson (ANALYZE – CORRELATE –
BIVARIATE).

126
Culegere de probleme rezolvate cu ajutorul programului SPSS

V. Plasarea câmpurilor în lista de variabile.

VI. Selectarea din fereastra BIVARIATE a coeficientului


Pearson

127
Adrian MARINESCU

VII. Activarea opţiunii PASTE care va deschide fereastra


SYNTAX. Pe linia / VARIABLES se tastează clauza
WITH între variabile dorite, având grijă să rămână
câte un spaţiu în stânga şi în dreapta clauzei.

128
Culegere de probleme rezolvate cu ajutorul programului SPSS

Nu uitaţi să lăsaţi spaţii în stânga şi respectiv, în dreapta


cuvântului „with”!

VIII. Activarea butonului RUN.

129
Adrian MARINESCU

IX. Interpretarea şi raportarea output-ului.

Salariaţi

Femei Pearson Correlation ,609(*)

Sig. (2-tailed) ,036

N 12

Bărbaţi Pearson Correlation ,574

Sig. (2-tailed) ,051

N 12

* Correlation is significant at the 0.05 level (2-tailed).

Raportarea output-ului:
1. Există un coeficient de corelaţie mare între
numărul de şomeri înregistraţi în anul 2007 şi
numărul mediu al salariaţilor din câteva judeţe
din ţară, uşor mai ridicat, în cazul angajaţilor de
sex feminin.
2. Nivelul de semnificaţie este mai mic de 0,05 în cazul
femeilor.
3. Sunt 10 grade de libertate, notate cu „DF”.
4. Formula finală: În anul 2007, pe baza datelor
problemei, la creşterea numărul mediu al
salariaţilor din câteva judeţe din ţară, se
înregistrează o creştere a numărului de şomeri.

Şi în acest caz, pentru construirea diagramei scatter trebuie


să parcurgem cele 4 etape suplimentare prezentate anterior:

130
Culegere de probleme rezolvate cu ajutorul programului SPSS

X. Revenirea la etapa a III (inserarea datelor în ecranul


DATA VIEW), selectarea GRAPH şi apoi a opţiunii
SCATTER / DOT.

Înainte de parcurgerea următoarei etape, vom stabili


perechile de variabile pentru care dorim reprezentarea grafică, dar
şi priorităţile de reprezentare ale acestora. În cazul de faţă vom
reprezenta în primul rând relaţia „salariaţi – femei” şi apoi
perechea „salariaţi – bărbaţi”.
XI. Selectarea opţiunilor SIMPLE şi DEFINE.

131
Adrian MARINESCU

XII. În fereastra nou apărută denumită SIMPLE


SCATTERPLOT, trecerea perechea prioritară.

şi ulterior, vom parcurge din nou paşii, pentru cea de-a doua
pereche. În final, de fiecare dată vom apăsa OK

132
Culegere de probleme rezolvate cu ajutorul programului SPSS

XIII. Interpretarea output-ului


a. Pentru perechea „salariaţi – femei”
40000

30000

Salariaţi

20000

10000

1000 2000 3000 4000 5000 6000

Femei

Pentru trasarea liniei de regresie:


XIV. Dublu clic pe graficul din output (apar opţiunile)

133
Adrian MARINESCU

XV. Activarea opţiunii FIT LINE AT TOTAL

b. Pentru perechea „salariaţi – bărbaţi”


XIV. Dublu clic pe graficul din output (apar opţiunile)

134
Culegere de probleme rezolvate cu ajutorul programului SPSS

XV. Activarea opţiunii FIT LINE AT TOTAL

Concluzie: o mai bună corelaţie pozitivă se înregistrează în


cazul perechii de variabile „salariaţi – femei”.

2.5.3.2. Coeficientul Spearman


Deoarece, atunci când variabilele sunt de tip ordinal,
pentru aplicarea coeficientului de corelaţie Spearman procedeul
de lucru este identic cu cel aplicat în cazul coeficientului
Pearson, aplicaţiile vor prezenta cazul în care variabilele sunt
măsurate pe scale diferite, caz în care apar noi etape de lucru.
Concret, înainte de parcurgerea etapelor prezentate anterior,
valorile uneia dintre variante trebuie în ordine de rang, după care
se aplică testul Spearman.

135
Adrian MARINESCU

III. Un grup de 20 de subiecţi au fost testaţi în legătură


cu aerodinamicitatea a 20 de autoturisme. Să se calculeze
coeficientul de corelaţie Spearman între ordinea preferinţelor
şi preţul autoturismelor exprimat în euro. Ordinea exprimată
de către subiecţi este prezentată în tabelul următor:

Poziţie Valoare (euro)


9 13128
11 9989
19 14150
8 11720
6 8848
11 8929
7 9215
12 11120
17 12619
18 11201
1 10728
10 10699
14 13210
16 12990
15 13150
2 9948
4 7490
3 11048
5 14143
13 12615

136
Culegere de probleme rezolvate cu ajutorul programului SPSS

Rezolvare:
Pentru corelarea cele două variabile, trebuie să transformăm
în prealabil variabilei „Valoare” în valori cu semnificaţie de ordine
de rang, prin parcurgerea următoarelor etape:
a. Accesarea opţiunii TRANSFORM şi alegerea din
meniul acesteia a subopţiunii AUTOMATIC
RECODE.
b. Trecerea variabilei supuse transformării în partea
dreaptă a tabelului de variabile.
c. Tastarea noii denumiri în fereastra cu eticheta NEW
NAME– ADD NEW NAME şi activarea opţiunii OK.

I. Accesarea programului şi trecerea în ecranul


VARIABLE VIEW.

137
Adrian MARINESCU

II. Definirea primelor două coloane, în conformitate cu


datele problemei şi înlăturarea celor două zecimale.

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

138
Culegere de probleme rezolvate cu ajutorul programului SPSS

a. Accesarea opţiunii TRANSFORM şi alegerea din


meniul acesteia a subopţiunii AUTOMATIC RECODE.

b. Trecerea variabilei supuse transformării în partea


dreaptă a tabelului de variabile.

139
Adrian MARINESCU

c. Tastarea noii denumiri în fereastra cu eticheta NEW


NAME – ADD NEW NAME şi activarea opţiunii OK.

Output-ul rezultat poate fi închis, revenindu-se la tabelul cu


variabilele iniţiale la care s-a adăugat o nouă coloană ce poartă denumire
pe care i-am atribuit-o în prealabil (în cazul de faţă „Rang_preţ”). La
parcurgerea fiecărei valori (se observă că ele sunt identice cu cele înscrise
în coloana precedentă), în fereastra de deasupra apare poziţia în ierarhia
stabilită de program (exemplu: pentru prima poziţie, valoarea 13128
ocupă poziţia a 16-a în ierarhia celor 20 de valori înscrise în coloană).

140
Culegere de probleme rezolvate cu ajutorul programului SPSS

Odată efectuată operaţia de recodare, se poate trece la


etapa următoare a calculării coeficientului de corelaţie Spearman
şi anume la etapa a IV-a:
IV. Declanşarea procedurii de calculare a coeficientului
Spearman (ANALYZE – CORRELATE – BIVARIATE).

V. Plasarea câmpurilor în lista de variabile.

141
Adrian MARINESCU

VI. Selectarea din fereastra BIVARIATE a coeficientului


Spearman şi activarea butonului OK.

VII. Interpretarea şi raportarea output-ului.


Correlations

Poziţie Rang_preţ
Spearman's rho Poziţie Correlation Coefficient 1,000 ,545*
Sig. (2-tailed) . ,013
N 20 20
Rang_preţ Correlation Coefficient ,545* 1,000
Sig. (2-tailed) ,013 .
N 20 20
*. Correlation is significant at the 0.05 level (2-tailed).

Pentru construirea diagramei scatter trebuie să parcurgem


cele 4 etape suplimentare prezentate anterior:

142
Culegere de probleme rezolvate cu ajutorul programului SPSS

VIII. Revenirea la tabel, selectarea GRAPH şi apoi a


opţiunii SCATTER/DOT.

IX. Selectarea opţiunilor SIMPLE şi DEFINE.

143
Adrian MARINESCU

X. În fereastra nou apărută denumită SIMPLE


SCATTERPLOT, trecerea perechea prioritară.

XI. Interpretarea output-ului


20

15
Poziţie

10

0 5 10 15 20

Rang_preţ

Dacă dorim să trasăm şi linia de regresie:

144
Culegere de probleme rezolvate cu ajutorul programului SPSS

XII. Dublu clic pe graficul din output (apar opţiunile)

XIII. Activarea opţiunii FIT LINE AT TOTAL

145
Adrian MARINESCU

Concluzii:
1. Răspândirea rezultatelor este mai aproape de forma
rectilinie decât de forma curbilinie.
2. Valorile sunt plasate într-o bandă relativ îngustă, ceea
ce indică o corelaţie mare.
3. Linia de regresie este trasată din colţul stânga jos până
în dreapta sus, ceea ce sugerează o corelaţie pozitivă.
2.5.4. Probleme propuse
I. Să se determine dacă, în anul 2007 a existat o
corelaţie între costul lunar orar al forţei de muncă şi câştigul
salarial nominal mediu net în câteva activităţi ale economiei
naţionale, conform datelor prezentate în tabelul următor:
Costul lunar Câştigul salarial
Activitate orar al forţei de nominal mediu
muncă (lei) net (lei)
Agricultură, vânătoare şi 7,56 748
silvicultură
Pescuit şi piscicultură 5,99 586
Industrie extractivă 20,49 1804
Industrie prelucrătoare 8,81 870
Energie electrică şi termică, gaze 16,64 1577
şi apă
Construcţii 9,04 881
Comerţ 8,24 823
Hoteluri şi restaurante 6,57 651
Transport, depozitare şi 12,89 1244
comunicaţii
Intermedieri financiare 27,27 2617
Învăţământ 11,82 1175
Sănătate şi asistenţă socială 10,87 948
Tranzacţii imobiliare şi alte servicii 11,27 1106
Administraţie publică şi apărare 14,39 1997
Sursă: Anuarul Statistic al României 2008, pag. 266 şi
pag. 282.

146
Culegere de probleme rezolvate cu ajutorul programului SPSS

II. Să se stabilească existenţa unui coeficient de


corelaţie între maxima absolută anuală (grade Celsius) şi
cantitatea anuală de precipitaţii înregistrată în anul 2007 în
următoarele staţii meteorologice din România
Maxima Cantitatea
Staţia meteorologică absolută anuală anuală de
(grade Celsius) precipitaţii
Satu Mare 3 9 ,2 708,9
Suceava 3 6 ,0 687,5
Oradea 4 0 ,4 655,5
Iaşi 4 0 ,1 513,6
Cluj-Napoca 3 8 ,0 806,3
Târgu Mureş 3 7 ,9 746,1
Bacău 4 0 ,3 603,8
Timişoara 4 1 ,1 649,2
Deva 4 0 ,0 655,9
S ib iu 3 8 ,3 777,3
Vârfu Omu 2 0 ,0 875,7
Galaţi 4 0 ,5 499,6
Tîrgu Jiu 40,7 1082,3
Buzău 40,3 542,4
Calafat 44,3 583,7
Turnu Măgurele 43,4 595,6
Bucureşti Filaret 41,8 610,2
Constanţa 38,5 493,7
Sursă: Anuarul Statistic al României 2008, pag. 17.

147
Adrian MARINESCU

III. Să se stabilească existenţa unui coeficient de


corelaţie între judeţele ierarhizate după suprafaţa totală (km2)
şi numărul de oraşe şi municipii existente, la sfârşitul anului
2007, în România, conform următoarei situaţii:

Judeţ Poziţia în Numărul de oraşe şi


ierarhie municipii

Alba 26 11
Arad 37 10
Argeş 32 7
Bacău 28 8
Bihor 36 10
Bistriţa-Năsăud 16 4
Botoşani 13 7
Brăila 10 4
Braşov 17 10
Bucureşti-Ilfov 1 9
Buzău 25 5
Călăraşi 14 5
Caraş-Severin 39 8
Cluj 30 6
Constanţa 34 12
Covasna 3 5
Dâmboviţa 5 7
Dolj 35 7
Galaţi 8 4
Giurgiu 2 3

148
Culegere de probleme rezolvate cu ajutorul programului SPSS

Judeţ Poziţia în Numărul de oraşe şi


ierarhie municipii

Gorj 21 9
Harghita 29 9
Hunedoara 33 14
Ialomiţa 7 7
Ia şi 19 5
Maramureş 27 13
Mehedinţi 12 5
Mureş 31 11
Neamţ 24 5
Olt 20 8
Prahova 9 14
Sălaj 4 4
Satu Mare 6 6
Sibiu 18 11
Suceava 40 16
Teleorman 23 5
Timiş 41 10
Tulcea 38 5
Vâlcea 22 11
Vaslui 15 5
Vrancea 11 5

Sursă: Anuarul Statistic al României 2008, pag. 16.

149
Adrian MARINESCU

IV. Să se stabilească existenţa unui coeficient de


corelaţie între câteva dintre principalele centre universitare,
ierarhizate după numărul de locuitori şi numărul de facultăţi
care funcţionau în anul 2007, în România, conform
următoarei situaţii:
Poziţia în Numărul de
Centru universitar
ierarhie facultăţi
Arad 12 23
Baia Mare 15 11
Braşov 8 25
Bucureşti 1 169
Cluj-Napoca 3 52
Constanţa 5 30
Craiova 6 24
Galaţi 7 19
Iaşi 2 51
Oradea 10 24
Petroşani 19 3
Piteşti 11 14
Ploieşti 9 5
S ib iu 13 21
Suceava 16 9
Târgovişte 18 9
Târgu Jiu 17 7
Târgu Mureş 14 16
Timişoara 4 47
Sursă: Anuarul Statistic al României 2008, pag. 404 şi
pag. 48-51.

150
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.6. Regresia

2.6.1. Recapitularea principalelor elemente teoretice


Dacă am stabilit că există un tip de relaţie între două
(sau mai multe) variabile sau chiar datele problemei ne indică
acest lucru, atunci putem estima scorul unei variabile pornind de
la scorul obţinut de către cealaltă variabilă. Acest lucru îl putem
efectua cu atât mai bine, cu cât corelaţia este mai puternică.
Chiar dacă, pentru determinarea regresiei, se pot folosi
date asemănătoare celor utilizate în calcularea coeficienţilor de
corelaţie, ea este utilizată mai rar, în practica curentă atunci când
sunt luate în calcul numai două variabile.
Deasemenea, reamintim că literatura de specialitate
precizează că tehnica regresiei începe să devine mai importantă cu
cât, pentru predicţie, sunt folosite mai multe variabile (tehnica
regresiei multiple). Singura problemă ridicată de tehnica regresiei
simple constă în posibilitatea de confundare a variabilei
independente cu cea dependentă. Pentru înlăturarea acestui
impediment, specialiştii recomandă utilizarea diagramei scatter a
relaţiei dintre cele două variabile. Astfel, utilizatorul trebuie să se
asigure că pe axa orizontală (axa „X”) este reprezentată variabila
independentă, iar axa verticală (axa „Y”) este rezervată variabilei
dependente. Totodată, reamintim faptul că panta liniei de regresie
reprezintă descrierea matematică a relaţiei dintre cele două
variabile luate în calcul.

2.6.2. Etapele procesării unei regresii simple şi a unei


diagrame de regresie

Cele 8 etape ale tehnicii regresiei sunt:


I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

151
Adrian MARINESCU

II. Definirea primelor două coloane, în conformitate cu


datele problemei şi înlăturarea celor două zecimale
(dacă este cazul).
III. Revenirea în ecranul DATA VIEW şi inserarea
datelor.
IV. Declanşarea tehnicii regresiei simple prin selectarea
opţiunilor, în următoarea ordine: ANALYZE –
REGRESSION - LINEAR.
V. Plasarea celor două câmpuri în lista de variabile.
VI. Selectarea opţiunii STATISTICS.
VII. Selectarea opţiunii CONFIDENCE INTERVALS,
apoi selectarea opţiunii CONTINUE care închide
fereastra deschisă la etapa precedentă şi în final OK.
VIII. Interpretarea şi raportarea output-ului.

În cazul în care se doreşte construirea, pe baza datelor


problemei, a unei diagrame scatter, ulterior parcurgerii celor
8 etape ale tehnicii regresiei, prezentate mai sus, mai sunt
necesare 4 etape:

IX. Revenirea la etapa a III-a (după completarea datelor).


Şi selectarea, în ordine, a opţiunilor GRAPHS –
SCATTER DOT
X. Selectarea opţiunii DEFINE şi se verifică dacă
opţiunea SIMPLE este deja selectată (la versiunile
mai recente ale programului SPSS această opţiune
este predefinită).
XI. Plasarea celor două variabile pe axe prin selectarea lor
şi trecerea în fereastrele plasate sub etichetele „Y Axis”
şi respectiv „X Axis”, şi apăsarea butonului OK.
XII. Apariţia diagramei scatter şi interpretarea output-ului.

152
Culegere de probleme rezolvate cu ajutorul programului SPSS

Ulterior, pentru încadrarea liniei de regresie în diagrama


scatter astfel construită şi în scopul stabilirii gradului în care
relaţia celor două variabile este sau nu de tip curbiliniu, trebuie
parcurse încă 3 etape:
XIII. Dublu clic în interiorul output-ului pentru
deschiderea „Chart Editor”.
XIV. Selectarea în ordine a opţiunilor ELEMENTS – FIT
LINE AT TOTAL - CLOSE (din fereastra
PROPERTIES)
XV. Apariţia diagramei scatter cu linia de regresie trasată
şi interpretarea output-ului.
2.6.3. Probleme rezolvate
I. Să se utilizeze tehnica regresiei simple şi să se
interpreteze diagrama scatter rezultată, în cazul principalelor
caracteristici (lungimea cursului de apă şi respectiv, suprafaţa
bazinului) ale cursurilor de apă din România, ordonate
descrescător, după lungimea cursului de apă, în tabelul următor:

Denumirea Lungimea cursului Suprafaţa bazinului


cursului de apă de apă (km) (km2)
Dunăre 1075 33250
Mureş 761 27890
Prut 742 10990
Olt 615 24050
Siret 559 42890
Ialomiţa 417 10350
Someş 376 15740
Argeş 350 12550

153
Adrian MARINESCU

Denumirea Lungimea cursului Suprafaţa bazinului


cursului de apă de apă (km) (km2)

Jiu 339 10080


Buzău 302 5264
Dâmboviţa 286 2824
Bistriţa 283 7039
Jijia 275 5757
Târnava Mare 246 6253
Timiş 244 5673
Crişul Alb 234 4240
Vedea 224 5430
Moldova 213 4299
Bârlad 207 7220
Târnava Mică 196 2071
Prahova 193 3738
Neajlov 186 3720
Olteţ 185 2663
Someşul Mic 178 3773
Suceava 173 2298
Bega 170 2362
Arieş 166 3005
Trotuş 162 4456
Sursă: Anuarul Statistic al României 2008, pag. 12.

154
Culegere de probleme rezolvate cu ajutorul programului SPSS

Pentru rezolvarea problemei vom parcurge etapele


menţionate mai sus:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Definirea primelor două coloane, în conformitate cu


datele problemei şi înlăturarea celor două zecimale.

155
Adrian MARINESCU

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

IV. Declanşarea tehnicii regresiei simple prin selectarea


opţiunilor, în următoarea ordine: ANALYZE –
REGRESSION – LINEAR.

156
Culegere de probleme rezolvate cu ajutorul programului SPSS

V. Plasarea celor două câmpuri în lista de variabile.

VI. Selectarea opţiunii STATISTICS.

157
Adrian MARINESCU

VII. Selectarea opţiunii CONFIDENCE INTERVALS


(1), apoi selectarea opţiunii CONTINUE(2) care
închide fereastra deschisă la etapa precedentă şi în
final OK(3).
1
3

VIII. Interpretarea şi raportarea output-ului.


1

Unstandardized Standardized 95% Confidence Interval


Model Coefficients Coefficients for B
t Sig. Upper
B Std. Error Beta
Lower Bound Bound
Constant 163,346 34,104 4,790 ,000 93,245 233,448
,818
.018 .002 7,242 ,000 .013 .023
Lungime

a Dependent Variable: Lungime

2 3 4
a Dependent Variable: Lungime

158
Culegere de probleme rezolvate cu ajutorul programului SPSS

Forma tabelară a acestui output conţine elementele pe


baza cărora se poate analiza o regresie simplă, astfel:
1. = Constanta are valoarea de 163,346 şi reprezintă
punctul în care, pe diagrama scatter, linia de
regresie se intersectează cu axa verticală.
2. = Coeficientul nestandardizat al regresiei simple
cu următoarea semnificaţie pentru problema în
cauză: pentru fiecare creştere cu o unitate, a
variabilei „Lungimea cursului de apă”, variabila
„Suprafaţa bazinului” creşte cu 0,018.
3. = Coeficientul standardizat al regresiei simple
(0,818). Reprezintă (mai mult sau mai puţin)
coeficientul de corelaţie Pearson între cele ouă
variabile ale problemei şi anume „Lungimea
cursului de apă”, respectiv „Suprafaţa bazinului”.
4. = Reprezintă marginile intervalului de încredere:
0,013 – 0,023 în care este foarte probabil
(procentul de probabilitate este de 95%) să
varieze coeficientul nestandardizat determinat
pentru datele problemei.
Adesea, în literatura de specialitate, în cazul în care
aplicăm tehnica regresiei, având în vedere două variabile,
întâlnim recomandarea cercetării diagramei scatter.
Ne vom conforma şi vom parcurge, în continuare, cele
patru etape descrise anterior, astfel:

159
Adrian MARINESCU

IX. Revenirea la etapa a III-a (după completarea datelor)


şi selectarea, în ordine, a opţiunilor GRAPHS –
SCATTER DOT.

X. Selectarea opţiunii DEFINE şi se verifică dacă opţiunea


SIMPLE este deja selectată (la versiunile mai recente
ale programului SPSS această opţiune este predefinită).

160
Culegere de probleme rezolvate cu ajutorul programului SPSS

XI. Plasarea celor două variabile pe axe prin selectarea lor


şi trecerea în fereastrele plasate sub etichetele
„Y Axis” şi respectiv „X Axis”, şi apăsarea butonului
OK. În problemă: „Lungime” = variabilă dependentă,
iar „Suprafaţă” = variabilă independentă.

XII. Apariţia diagramei scatter şi interpretarea output-ului.


1500

1200

900
Lungime

600

300

0 10000 20000 30000 40000 50000

Suprafaţă

161
Adrian MARINESCU

Pentru încadrarea liniei de regresie în diagrama scatter de


mai sus şi în scopul stabilirii gradului în care relaţia celor două
variabile este sau nu de tip curbiliniu, vom parcurge,
în completare şi ultimele 3 etape prezentate mai sus. În final,
având toate elementele necesare vom putea concluziona, cu cea
mai mică probabilitate de a greşi, datele rezultate.

XIII. Dublu clic în interiorul output-ului pentru deschiderea


„Chart Editor”.

162
Culegere de probleme rezolvate cu ajutorul programului SPSS

XIV. Selectarea în ordine a opţiunilor ELEMENTS – FIT


LINE AT TOTAL-CLOSE.

163
Adrian MARINESCU

XV. Apariţia diagramei scatter cu linia de regresie


trasată şi interpretarea output-ului.

1500

1
1200

2
900
Lungime

600

300

R Sq Linear = 0,669

0 10000 20000 30000 40000 50000

Suprafaţă

Interpretarea o vom face în baza elementelor diagramei


scatter:
1 = Punctele de pe diagramă sunt foarte apropiate de
linia de regresie, iar răspândirea lor sugerează o linie
dreaptă de unde tragem concluzia că relaţia celor două
variabile nu este de tip curbiliniu. Chiar dacă avem
3 puncte mai depărtate de linia de regresie nu putem să
afirmăm că avem valori atipice.
2 = Linia de regresie are o pantă pozitivă: pe diagrama
scatter din partea stângă jos spre partea dreaptă sus.

IMPORTANT
Dacă plasarea variabilelor pe cele două axe s-a efectuat
greşit (ne dăm seama comparând output-ul tabelar cu diagrama
scatter) nu este o problemă: parcurgeţi din nou etapele construirii
diagramei scatter, dar aveţi grijă să inversaţi plasarea pe axe a
celor două variabile.

164
Culegere de probleme rezolvate cu ajutorul programului SPSS

O posibilă formă de raportare ar putea fi: Diagrama


scatter a relaţiei dintre suprafaţa bazinului şi lungimea cursului
de apă stabileşte o relaţie liniară pozitivă, între cele două
variabile, fiind posibilă, cu o probabilitate de 95%, predicţia
stabilirii lungimii cursului de apă cunoscând suprafaţa bazinului.
Ecuaţia este
Y’ = 163,35 + 0,018X
unde:
X = valoarea pentru suprafaţa bazinului
Y’ = cea mai bună predicţie a valorii pentru lungimea
cursului de apă.

II. Să se utilizeze tehnica regresiei simple şi să se


interpreteze diagrama scatter rezultată, în cazul numărului
total de oraşe şi municipii şi respectiv, numărul de şomeri
înregistraţi în judeţele din nord-vest şi centrul României,
conform datelor din tabelul următor:

Numărul de oraşe Numărul de şomeri


Judeţ
şi municipii înregistraţi
Bihor 10 6706
Bistriţa - Năsăud 4 3105
Cluj 6 10203
Maramureş 13 7068
Satu Mare 6 4080
Sălaj 4 4739
Alba 11 10509
Braşov 10 12603

165
Adrian MARINESCU

Numărul de oraşe Numărul de şomeri


Judeţ
şi municipii înregistraţi
Covasna 5 6653
Harghita 9 7163
Mureş 11 10691
Sibiu 11 5806

Sursă: Anuarul Statistic al României 2008, pag. 16 şi


pag. 228.

Pentru rezolvarea problemei vom parcurge etapele


menţionate mai sus:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

166
Culegere de probleme rezolvate cu ajutorul programului SPSS

II. Definirea primelor două coloane, în conformitate cu


datele problemei şi înlăturarea celor două zecimale.

III. Revenirea în ecranul DATA VIEW şi inserarea


datelor.

167
Adrian MARINESCU

IV. Declanşarea tehnicii regresiei simple prin selectarea


opţiunilor, în următoarea ordine: ANALYZE –
REGRESSION – LINEAR.

V. Plasarea celor două câmpuri în lista de variabile.

168
Culegere de probleme rezolvate cu ajutorul programului SPSS

VI. Selectarea opţiunii STATISTICS.

VII. Selectarea opţiunii CONFIDENCE INTERVALS,


apoi selectarea opţiunii CONTINUE care închide
fereastra deschisă la etapa precedentă şi în final OK.

169
Adrian MARINESCU

VIII. Interpretarea şi raportarea output-ului.


Unstandardized Standardized 95% Confidence
Coefficients Coefficients Interval for B
Model t Sig
Lower Upper
B Std. Error Beta
Bound Bound

Constant 4,253 2,301 1,849 ,094 -,873 9,379

Şomeri ,001 ,000 ,514 1,897 ,087 ,000 ,001

a. Dependent Variable: Oraşe_Municipii

Interpretare:
1 = Constanta are valoarea de 4,253 şi reprezintă
punctul în care, pe diagrama scatter, linia de
regresie se intersectează cu axa verticală.
2 = Coeficientul nestandardizat al regresiei simple
are semnificaţia: pentru fiecare creştere cu o
unitate, a variabilei „Oraşe Municipii”, variabila
„Numărul şomerilor înregistraţi” creşte cu 0,001.
3 = Coeficientul standardizat al regresiei simple are
valoarea 0,514 şi reprezintă (mai mult sau mai
puţin) coeficientul de corelaţie Pearson între cele
ouă variabile ale problemei.
4 = Intervalul de încredere este 0,00 – 0,001, iar în
cazul acestuia, este foarte probabil (procentul de
probabilitate este de 95%) să varieze coeficientul
nestandardizat determinat pentru datele problemei.

170
Culegere de probleme rezolvate cu ajutorul programului SPSS

Etapele cercetării diagramei scatter:


IX. Revenirea la etapa a III-a (după completarea datelor). Şi
selectarea, în ordine, a opţiunilor GRAPHS –
SCATTER DOT.

X. Selectarea opţiunii DEFINE şi se verifică dacă opţiunea


SIMPLE este deja selectată (la versiunile mai recente
ale programului SPSS această opţiune este predefinită).

171
Adrian MARINESCU

XI. Plasarea celor două variabile pe axe prin selectarea


lor, trecerea în tabelul de variabile şi apăsarea
butonului OK.

XII. Apariţia diagramei scatter şi interpretarea output-ului.


14000

12000

10000
Şomeri

8000

6000

4000

2000

4 6 8 10 12 14

Oraşe_Municipii

172
Culegere de probleme rezolvate cu ajutorul programului SPSS

Încadrarea liniei de regresie în diagrama scatter:


XIII. Dublu clic în interiorul output-ului pentru deschiderea
„Chart Editor”.

XIV. Selectarea ELEMENTS – FIT LINE AT TOTAL –


CLOSE.

173
Adrian MARINESCU

XV. Apariţia diagramei scatter cu linia de regresie trasată


şi interpretarea output-ului.

14000

12000

10000
Şomeri

8000

6000

4000

R Sq Linear = 0,265

2000

4 6 8 10 12 14

Oraşe_Municipii

174
Culegere de probleme rezolvate cu ajutorul programului SPSS

Interpretarea o vom face în baza elementelor diagramei


scatter:

1 = Punctele de pe diagramă sunt relativ, apropiate de linia


de regresie, iar răspândirea lor sugerează o linie
dreaptă de unde tragem concluzia că relaţia celor
două variabile nu este de tip curbiliniu.
2 = Linia de regresie are o pantă pozitivă: pe diagrama
scatter din partea stângă jos spre partea dreaptă sus.

Mod d e r a por t ar e p os i bi l : Di a gr ama scat t er a rel aţ i ei


di nt re „Or a şe_M uni ci p i i ” şi „Num ărul şo meri l or î nregi st raţ i ”
stabileşte o relaţie liniară pozitiv ă, între cel e două v ari abile ,
fiind posi bilă, cu o pr obabilitate de 95%, pr edicţia stab ilirii
num ărul ui de şo meri c unosc ând n umă rul d e oraşe şi mu ni ci pi i
dintr-un jud eţ.
Ecuaţia este

Y’ = 4,253 + 0,001X
unde:
X = valoarea pentru numărul de oraşe şi municipii
dintr-un judeţ
Y’ = cea mai bună predicţie a valorii pentru numărul de
şomeri înregistraţi.

2.5.4. Probleme propuse

I. Să se utilizeze tehnica regresiei simple şi să se


interpreteze diagrama scatter rezultată, în cazul numărului
total de oraşe şi municipii şi respectiv, numărul de şomeri
înregistraţi în unele judeţe din sudul şi estul României,
conform datelor din tabelul următor:

175
Adrian MARINESCU

Numărul de oraşe Numărul de şomeri


Judeţ
şi municipii înregistraţi
Bacău 8 10355
Botoşani 7 6391
Iaşi 5 17695
Neamţ 5 7800
Suceava 16 9457
Vaslui 5 15619
Brăila 4 5215
Buzău 5 10604
Constanţa 12 10858
Galaţi 4 12589
Tulcea 5 3461
Vrancea 5 5658
Ilfov 8 2128
Argeş 7 12985
Călăraşi 5 4965
Dâmboviţa 7 11366
Giurgiu 3 4090
Ialomiţa 7 7435
Prahova 14 12124

Sursă: Anuarul Statistic al României 2008, pag. 16 şi


pag. 228.

176
Culegere de probleme rezolvate cu ajutorul programului SPSS

II. Să se utilizeze tehnica regresiei simple şi să se


interpreteze diagrama scatter rezultată, în cazul numărului
total de comune şi respectiv, numărul de şomeri înregistraţi în
judeţele din nord-vest şi centrul României, conform datelor
din tabelul următor:

Numărul de Numărul de şomeri


Judeţ
comune înregistraţi

Bihor 90 6706

Bistriţa - Năsăud 58 3105

Cluj 75 10203

Maramureş 63 7068

Satu Mare 58 4080

Sălaj 57 4739

Alba 67 10509

Braşov 48 12603

Covasna 40 6653

Harghita 58 7163

Mureş 91 10691

Sibiu 53 5806

Sursă: Anuarul Statistic al României 2008, pag. 16 şi


pag. 228.

177
Adrian MARINESCU

III. Să se utilizeze tehnica regresiei simple şi să se


interpreteze diagrama scatter rezultată, în cazul numărului
total de sate şi respectiv, numărul de şomeri, numai de sex
feminin, înregistraţi în unele judeţe din sudul şi estul
României, conform datelor din tabelul următor:
Numărul de şomeri
Judeţ Numărul de sate de sex feminin
înregistraţi
Bacău 491 4340
Botoşani 333 2530
Iaşi 418 6996
Neamţ 344 3585
Suceava 379 4212
Vaslui 449 5534
Brăila 140 1860
Buzău 475 4569
Constanţa 188 6779
Galaţi 180 5422
Tulcea 133 1497
Vrancea 331 2289
Ilfov 91 1189
Argeş 576 5963
Călăraşi 160 2115
Dâmboviţa 353 5128
Giurgiu 167 1881
Ialomiţa 127 3217
Prahova 405 5904
Sursă: Anuarul Statistic al României 2008, pag. 16 şi pag. 228.
178
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.7. Eşantionarea
2.7.1. Recapitularea principalelor elemente teoretice
Chiar dacă, în prezent, nu este o procedură utilizată
frecvent în practica curentă, eşantionarea reprezintă unul dintre
elementele de bază ale statisticii. Momentul de glorie al acestei
proceduri s-a consumat în perioada în care tehnica de calcul nu
exista, sau nu era atât de dezvoltată, ca în momentul de faţă.
Închipuiţi-vă cum ar fi să trebuiască să efectuaţi analize
statistice asupra unor seturi imense de date şi având la dispoziţie
un buget limitat de timp.
Şi atunci, de ce mai trebuie studiată această tehnică?
Unul dintre răspunsurile posibile, la această întrebare, se
leagă de mai buna înţelegere a statisticii inferenţiale. Dacă mai
doriţi completări, amintiţi-vă de teoria sondajelor.

2.7.2. Etapele eşantionării


În vederea eşantionării unui set de date, avem de parcurs
10 etape:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
II. Definirea primelor două coloane, în conformitate cu
datele problemei şi înlăturarea celor două zecimale
(dacă este cazul).
III. Revenirea în ecranul DATA VIEW şi inserarea
datelor.
IV. Declanşarea procedurii eşantionare prin selectarea
opţiunilor, în următoarea ordine: DATA-SELECT
CASES.
V. Selectarea din fereastra SELECT CASES a două
opţiuni, în ordinea: RANDOM SAMPLE OF CASES –
SAMPLE .

179
Adrian MARINESCU

VI. Selectarea din fereastra nou apărută a preferinţei


pentru care optează utilizatorul: fie un procent din
totalul cazurilor (se specifică mărimea acestui
procent), fie selectarea unui numărul de cazuri din
totalul dorit (se completează aceste opţiuni pe rândul
doi al ferestrei).
VII. Marcarea datelor selectate de către program.
VIII. Analiza statistică propriu-zisă. Exemplu: prin
selectarea opţiunilor, în ordinea: ANALYZE –
DESCRIPTIVE STATISTICS – DESCRIPTIVES
IX. Introducerea câmpului cu date selectate în tabelul de
variabile şi apăsarea butonului OK.
X. Interpretarea output-ului

2.7.3. Probleme rezolvate


Datorită utilizării reduse a tehnicii de eşantionare, vom
prezenta o singură problemă rezolvată şi respectiv, o singură
problemă propusă. Dacă aveţi nemulţumiri legate de numărul mic
de probleme de rezolvat, vă recomand să vă testaţi cunoştinţele şi
să vă construiţi singuri probleme. Poate fi un util test, în ceea ce
priveşte capacitatea dumneavoastră de creaţie.

I. Să se eşantioneze din totalul de salariaţi din


Administraţie publică şi apărare, cuprinşi în Anuarul statistic
al României – 2008, pe fiecare judeţ în parte:

b. 15% dintre datele prezentate în tabelul alăturat


c. 20 de cazuri din total.

180
Culegere de probleme rezolvate cu ajutorul programului SPSS

Judeţ Număr mediu de salariaţi


Alba 3665
Arad 4402
Argeş 5331
Bacău 4410
Bihor 5028
Bistriţa-Năsăud 3285
Botoşani 3048
Brăila 3141
Braşov 4886
Buzău 3863
Călăraşi 2821
Caraş-Severin 4126
Cluj 4840
Constanţa 5896
Covasna 2039
Dâmboviţa 4635
Dolj 6110
Galaţi 4650
Giurgiu 2860
Gorj 3515
Harghita 3060

181
Adrian MARINESCU

Judeţ Număr mediu de salariaţi


Hunedoara 4899
Ialomiţa 2727
Iaşi 5558
Ilfov 2836
Maramureş 3198
Mehedinţi 2916
Municipiul Bucureşti 35539
Mureş 4082
Neamţ 3987
Olt 4441
Prahova 6054
Sălaj 2280
Satu Mare 2801
Sibiu 3006
Suceava 5054
Teleorman 4001
Timiş 5298
Tulcea 3006
Vâlcea 4154
Vaslui 3108
Vrancea 3420
Sursă: Anuarul Statistic al României – 2008, pag. 222

182
Culegere de probleme rezolvate cu ajutorul programului SPSS

Pentru rezolvarea problemei, vom parcurge cele 10 etape


prezentate anterior:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Definirea primei coloane şi înlăturarea celor două


zecimale.

183
Adrian MARINESCU

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

IV. Declanşarea procedurii eşantionare prin selectarea


opţiunilor, în următoarea ordine: DATA-SELECT
CASES.

184
Culegere de probleme rezolvate cu ajutorul programului SPSS

V. Selectarea din fereastra SELECT CASES a două opţiuni,


în ordinea: RANDOM SAMPLE OF CASES - SAMPLE.

VI. Selectarea preferinţei utilizatorului


b. Procent de 15%

185
Adrian MARINESCU

b. 20 de cazuri din total.

VII. Marcarea datelor selectate de către program.


a. Procent de 15%

186
Culegere de probleme rezolvate cu ajutorul programului SPSS

c. 20 de cazuri din total.

VIII. Analiza statistică (ANALYZE – DESCRIPTIVE


STATISTICS –DESCRIPTIVES)
a. Procent de 15%

187
Adrian MARINESCU

b. 20 de cazuri din total.

IX. Introducerea câmpului cu date selectate în tabelul de


variabile şi apăsarea butonului OK.
a. Procent de 15%

188
Culegere de probleme rezolvate cu ajutorul programului SPSS

b. 20 de cazuri din total.

X. Interpretarea output-ului
a. Procent de 15%
N Minimum Maximum Mean Std. Deviation
Salariaţi 5 2280 4840 3647,00 1007,060
Valid N
5
(listwise)

Conform cerinţei au fost selectate aproximativ 15% din


totalul cazurilor. Pentru acestea, în tabel sunt prezentate câteva
caracteristici şi anume valoarea minimă şi respectiv, maximă
selectată, media valorilor, precum şi deviaţia standard.
b. 20 de cazuri din total.
N Minimum Maximum Mean Std. Deviation
Salariaţi 20 2039 35539 5742,95 7120,562
Valid N
20
(listwise)

189
Adrian MARINESCU

2.7.4. Probleme propuse

I. Să se eşantioneze din totalul de salariaţi din comerţ,


cuprinşi în Anuarul statistic al României – 2008, pe fiecare
judeţ în parte:

a. 5% dintre datele prezentate în tabelul alăturat


b. 20 de cazuri din total.

Judeţ Număr mediu de salariaţi

Alba 11151
Arad 16771
Argeş 17787
Bacău 19495
Bihor 30232
Bistriţa-Năsăud 9166
Botoşani 8581
Brăila 11489
Braşov 31155
Buzău 13061
Călăraşi 5503
Caraş-Severin 6395
Cluj 37859
Constanţa 31040
Covasna 8086

190
Culegere de probleme rezolvate cu ajutorul programului SPSS

Judeţ Număr mediu de salariaţi


Dâmboviţa 10784
Dolj 27980
Galaţi 19722
Giurgiu 5550
Gorj 9358
Harghita 8436
Hunedoara 21429
Ialomiţa 8073
Iaşi 25194
Ilfov 24537
Maramureş 14016
Mehedinţi 4669
Municipiul Bucureşti 162130
Mureş 21592
Neamţ 16356
Olt 6479
Prahova 25695
Sălaj 7390
Satu Mare 11337
Sibiu 18176
Suceava 16816
Teleorman 7409
Timiş 33170
Tulcea 5276
Vâlcea 13203
Vaslui 6476
Vrancea 9453
Sursă: Anuarul Statistic al României – 2008, pag. 222

191
Adrian MARINESCU

2.8. Selectarea cazurilor


2.8.1. Recapitularea principalelor elemente teoretice
De cele mai multe ori, în practica curentă, pentru efectuarea
unei analize statistice, datele colectate pot fi grupate în subgrupuri.
De exemplu, dacă dorim să ierarhizăm liceele dintr-o anumită
localitate, în funcţie de procentul de promovabilitate la facultate,
pentru absolvenţii de liceu, un criteriu de grupare îl poate constitui
sexul acestora: masculin şi feminin. A grupa datele obţinute, după
acest criteriu şi a le analiza separat, înseamnă o mare risipă de timp.
Pentru evitarea acestui inconvenient, programul SPSS
oferă posibilitatea selectării datelor, în funcţie de cerinţele impuse
de către utilizator. Specialiştii recomandă această metodă
deoarece, câteodată, gruparea datelor după anumite criterii, oferă
posibilitatea înţelegerii mai clare a tendinţelor şi în final,
formularea unor concluzii mai valoroase.
2.8.2. Etapele eşantionării
În vederea eşaşantionării unui set de date, avem de parcurs
8 etape:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
II. Definirea coloanelor, în conformitate cu datele
problemei şi înlăturarea celor două zecimale (dacă
este cazul).
III. Revenirea în ecranul DATA VIEW şi inserarea
datelor.
IV. Selectarea datelor cu ajutorul opţiunilor DATA –
SELECT CASE.
V. Din noua fereastră deschisă, selectarea opţiunilor IF
CONDITION IS SATISFIED – IF
VI. Trecerea în tabelul de variabile a câmpului vizat şi
tastarea condiţiei impuse de utilizator.
VII. Apăsarea butonului CONTINUE şi ulterior a
butonului OK, în ecranul care reapare.
VIII. Efectuarea analizei statistice dorite.

192
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.8.3. Probleme rezolvate


I. Pe un eşantion de adolescenţi cu vârste cuprinse între
12 şi 19 ani se efectuează o analiza statistică, în vederea
determinării existenţei unei corelaţii între sex, vârstă, abilităţi
sportive şi respectiv matematice, ale subiecţilor. Datele
necesare analizei sunt prezentate în tabelul următor:
Medie
Sex Vârstă (ani)
Sport Matematică
Masculin 12 9,40 8,40
Feminin 15 9,45 8.50
Masculin 16 8,97 9,20
Feminin 13 9,05 9,10
Feminin 17 8,99 8,45
Masculin 19 8,60 8.88
Masculin 16 9,15 9,25
Masculin 17 8,79 8,30
Feminin 15 9,03 9,10
Feminin 16 8,88 9,00
Feminin 14 9,35 8,75
Feminin 13 8,89 8,40
Masculin 14 9,25 9,10
Masculin 15 9,50 9,50
Masculin 18 9,10 9,00
Feminin 19 9,00 8,75

193
Adrian MARINESCU

Medie
Sex Vârstă (ani)
Sport Matematică
Feminin 18 8,75 9,00
Feminin 19 8,60 8,80
Feminin 17 8,90 8,75
Feminin 18 8,95 9,10
Masculin 19 9,10 9,20
Feminin 15 9,00 9,00
Masculin 16 9,30 9,20
Feminin 13 9,25 9,00
Masculin 19 8,89 9,00
Masculin 19 9,10 8,80
Pentru rezolvarea problemei vom parcurge etapele
menţionate mai sus:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

194
Culegere de probleme rezolvate cu ajutorul programului SPSS

II. Definirea primelor patru coloane, în conformitate


cu datele problemei, codificarea şi înlăturarea celor
două zecimale, unde este cazul.

195
Adrian MARINESCU

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

IV. Selectarea datelor cu ajutorul opţiunilor DATA –


SELECT CASE.

196
Culegere de probleme rezolvate cu ajutorul programului SPSS

V. Din noua fereastră deschisă, selectarea opţiunilor


IF CONDITION IS SATISFIED – IF

VI. Trecerea în tabelul de variabile a câmpului vizat şi


tastarea condiţiei impuse de utilizator.

Dacă dorim să
selectăm numai
persoanele de
sex feminin

197
Adrian MARINESCU

Dacă dorim să
selectăm numai
persoanele de
sex masculin

În continuare vom exemplifica numai pentru persoanele de


sex feminin (toujours la famme…)
VII. Apăsarea butonului CONTINUE şi ulterior a
butonului OK, în ecranul care reapare.

198
Culegere de probleme rezolvate cu ajutorul programului SPSS

Observăm că toate înregistrările în dreptul cărora pe prima


coloană, apare o bară oblică, nu au fost selectate. Observăm că
toate înregistrările ce au menţionat, în coloana a doua, sexul
masculin, apar barate. Pentru verificare, în ultima coloană se face
precizarea statutului ei (selectată sau neselectată).
VIII. Efectuarea analizei statistice dorite.
Să presupunem că dorim să efectuăm determinăm
coeficientul de corelaţie Pearson, între mediile obţinute de către
persoanele de sex feminin, la sport şi matematică.
În aceste condiţii nu avem decât să urmăm etapele pe care
deja le cunoaştem şi cu ajutorul cărora am rezolvat probleme de
acest tip:
VIII. a. Selectăm, în ordine ANALYZE – CORRELATE –
BIVARIATE.

199
Adrian MARINESCU

VIII. b. Trecem datele vizate în câmpul de variabile şi


apăsăm butonul OK în condiţiile predefinirii
coeficientului Pearson,.

Correlations

Sport Matematică
Sport Pearson Correlation 1 -,165
Sig. (2-tailed) ,574
N 14 14
Matematică Pearson Correlation -,165 1
Sig. (2-tailed) ,574
N 14 14
Interpretarea output-ului
a. Corelaţia se bazează pe cele 14 înregistrări selectate
din tabelul iniţial.
b. Corelaţia dintre rezultatele la Matematică şi
respectiv, cele înregistrate la Sport este de –0,165.
c. La un test de semnificaţie, two-tailed la nivelul de
probabilitate de 0,574 sau mai mic, corelaţia este
semnificativă.

200
Culegere de probleme rezolvate cu ajutorul programului SPSS

Formulă:
Între mediile obţinute de persoanele de sex feminin, la
disciplinele „Matematică” şi respectiv „Sport” există o corelaţie
negativă semnificativă (r = -0,165, DF = 12, p < 0,574). Persoanele
de sex feminin, cuprinse în analiză, cu un nivel ridicat al abilităţilor
matematice au un nivel scăzut al performanţelor sportive.
II. Având datele unor staţii meteorologice din
România, să se efectuează o analiza statistică, în vederea
determinării existenţei unei corelaţii între maxima absolută
anuală (grade Celsius) şi cantitatea de precipitaţii (mm).
Analiza va fi aplicată numai temperaturilor mai mari
de 39 de grade Celsius, înregistrate în anul 2007.
S ta ţi a Maxima absolută Cantitatea anuală
meteorologică anuală (grade Celsius) de precipitaţii (mm)
Satu Mare 3 9 ,2 708,9
Suceava 3 6 ,0 687,5
Oradea 4 0 ,4 655,5
Iaşi 4 0 ,1 513,6
Cluj-Napoca 3 8 ,0 806,3
Târgu Mureş 3 7 ,9 746,1
Bacău 4 0 ,3 603,8
Timişoara 4 1 ,1 649,2
Deva 4 0 ,0 655,9
S ib iu 3 8 ,3 777,3
Vârfu Omu 2 0 ,0 875,7
Galaţi 4 0 ,5 499,6
Târgu Jiu 4 0 ,7 1082,3
Buzău 4 0 ,3 542,4
Calafat 4 4 ,3 583,7
Turnu Măgurele 4 3 ,4 595,6
Bucureşti-Filaret 4 1 ,8 610,2
Constanţa 3 8 ,5 493,7
Sursa: Anuarul statistic al României 2008, pag. 17.

201
Adrian MARINESCU

Pentru rezolvare vom urma, în primul rând, procedura de


selectare a cazurilor şi ulterior, procedura aplicată în cazul
calculării coeficientului de corelaţie Pearson.
I. Accesarea programului şi trecerea în ecranul VARIABLE
VIEW.

II. Definirea primelor două coloane şi înlăturarea celor


două zecimale, unde este cazul.

202
Culegere de probleme rezolvate cu ajutorul programului SPSS

III. Revenirea în ecranul DATA VIEW şi inserarea


datelor.

IV. Selectarea datelor cu ajutorul opţiunilor DATA –


SELECT CASE.

203
Adrian MARINESCU

V. Din noua fereastră deschisă, selectarea opţiunilor


IF CONDITION IS SATISFIED – IF

VI. Trecerea în tabelul de variabile a câmpului vizat


şi tastarea condiţiei impuse de problemă (Tmax >39).

204
Culegere de probleme rezolvate cu ajutorul programului SPSS

VII. Apăsarea butonului CONTINUE şi ulterior a


butonului OK, în ecranul care reapare.

Pentru determinarea coeficientului de corelaţie Pearson:


VIII. a. Selectăm, în ordine ANALYZE – CORRELATE –
BIVARIATE.

205
Adrian MARINESCU

VIII. b. Trecem datele vizate în câmpul de variabile şi


apăsăm butonul OK în condiţiile predefinirii coeficientului
Pearson.

În acest caz output-ul este:


Correlations

Maxima_
anuală > 39
Precipitaţii (FILTER)
Precipitaţii Pearson Correlation 1 .a
Sig. (2-tailed) .
N 12 12
Maxima_anuală Pearson Correlation .a .a
> 39 (FILTER) Sig. (2-tailed) .
N 12 12
a. Cannot be computed because at least one of the variables is
constant.

206
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.8.4. Probleme propuse


I. Într-o universitate, 50 de studenţi cu vârste între 19 – 24
ani, au urmat disciplina X, la care au obţinut note cuprinse între
7,80 şi 10,00. Să se determine coeficientul de corelaţie pentru:
a. Medii şi toţi studenţii cu vârsta mai mare sau
egală cu 21 de ani.
b. Medii şi studenţii de sex feminin cu vârsta mai
mică de 23 ani.
c. Medii şi studenţii de sex masculin cu vârsta
cuprinsă între 22 – 24 ani.
Sex Vârstă (ani) Medie
Masculin 19 9 ,4 0
Feminin 21 9 ,4 5
Masculin 22 8 ,9 7
Feminin 21 8 ,2 0
Feminin 19 7 ,9 0
Masculin 23 7 ,8 0
Masculin 23 10,00
Feminin 20 10,00
Masculin 24 9 ,4 0
Feminin 22 9 ,2 0
Masculin 21 8 ,1 0
Feminin 23 8 ,2 0
Masculin 24 8 .5 0
Masculin 20 9 ,1 0
Feminin 23 8 ,7 5
Masculin 19 9 ,2 0
Feminin 24 7 ,9 0
Feminin 21 9 ,9 0
Masculin 22 7 ,9 0
Feminin 24 9 .0 0
Masculin 22 8 ,2 0

207
Adrian MARINESCU

Sex Vârstă (ani) Medie


Masculin 23 9 ,1 0
Masculin 24 8 ,8 0
Feminin 20 9 ,2 0
Feminin 23 9 ,9 0
Feminin 23 10,00
Masculin 23 10,00
Masculin 22 8 ,5 0
Feminin 22 9 ,3 0
Feminin 21 8 ,8 0
Masculin 22 9 ,0 0
Feminin 23 9 ,4 0
Feminin 22 8 ,1 0
Feminin 22 9 ,1 0
Feminin 20 9 ,0 0
Masculin 21 9 ,9 0
Feminin 19 8 ,3 0
Masculin 24 8 ,6 0
Feminin 24 8 ,2 0
Masculin 22 7 ,9 0
Masculin 23 8 ,0 0
Masculin 24 9 ,2 0
Masculin 21 9 ,1 0
Feminin 22 8 ,9 0
Feminin 23 9 ,3 0
Feminin 21 9 ,4 0
Masculin 20 9 ,7 0
Feminin 20 8 ,5 0
Masculin 19 8 ,3 0
Feminin 22 9 ,0 0
Pentru o mai bună justificare a concluziilor, în fiecare
caz în parte, vor fi analizate şi concluzii diagramei scatter.

208
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.9. Eroarea standard

2.9.1. Recapitularea principalelor elemente teoretice

Dacă în cazul scorurilor, poartă denumirea de abatere


standard, aceeaşi procedură aplicată eşantioanelor poartă
denumirea de eroare standard. Chiar dacă există două tipuri de
eroare standard (aplicată unui set de date şi respectiv, eroarea
standard estimată), programul SPSS nu calculează decât una
singură şi anume eroarea standard estimată.
Importanţă erorii standard estimate (în continuare vom
folosi denumirea prescurtată: eroare standard) rezidă din faptul că
ea reprezintă un pas intermediar în aplicarea testului t.

2.9.2. Etapele calculării erorii standard

În vederea eşantionării unui set de date, avem de parcurs


7 etape:

I. Accesarea programului şi trecerea în ecranul


VARIABLE VIEW.
II. Definirea primei coloane, în conformitate cu datele
problemei şi înlăturarea celor două zecimale
(dacă este cazul).
III. Revenirea în ecranul DATA VIEW şi inserarea datelor.
IV. Declanşarea procedurii de calcul prin selectarea
opţiunilor, în următoarea ordine: ANALYZE-
DESCRIPTIVE STATISTICS - DESCRIPTIVE.
V. Introducerea câmpului de date în tabelul de variabile
şi activarea butonului OPTIONS.
VI. Selectarea opţiunii S.E.mean – CONTINUE şi în
final, clic pe OK, în ecranul care reapare.
VII. Interpretarea output-ului.

209
Adrian MARINESCU

2.9.3. Probleme rezolvate


I. Să se calculeze eroarea standard a populaţiei
existente la 1 iulie 2007, în câteva judeţe din România.

Judeţ Numărul de locuitori

Alba 376086
Arad 457713
Argeş 644236
Bacău 719844
Bihor 594131
Bistriţa-Năsăud 316689
Botoşani 454167
Brăila 365628
Braşov 593928
Buzău 488763
Călăraşi 315187
Caraş-Severin 327579
Cluj 692316
Constanţa 718330
Covasna 223364
Dâmboviţa 533330
Dolj 712187
Galaţi 614449
Giurgiu 283408

210
Culegere de probleme rezolvate cu ajutorul programului SPSS

Judeţ Număr mediu de salariaţi

Gorj 381643
Harghita 325611
Hunedoara 472284
Ialomiţa 290563
Iaşi 825100
Ilfov 294094
Maramureş 513000
Mehedinţi 298741
Mureş 581759
Neamţ 566059
Olt 475702
Prahova 821013
Sălaj 243157
Satu Mare 366270
Sibiu 423156
Suceava 705878
Teleorman 413064
Timiş 666866
Tulcea 250641
Vâlcea 411576
Sursă: Anuarul Statistic al României – 2008, pag. 48

211
Adrian MARINESCU

Pentru calcularea erorii standard vom parcurge cele


7 etape prezentate anterior:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Definirea primei coloane şi înlăturarea zecimalelor

212
Culegere de probleme rezolvate cu ajutorul programului SPSS

III. Revenirea în ecranul DATA VIEW şi inserarea


datelor.

IV. Declanşarea procedurii de calcul prin selectarea


opţiunilor, în următoarea ordine: ANALYZE-
DESCRIPTIVE STATISTICS – DESCRIPTIVE.

213
Adrian MARINESCU

V. Introducerea câmpului de date în tabelul de variabile


şi activarea butonului OPTIONS.

VI. Selectarea opţiunii S.E.mean – CONTINUE şi în final,


clic pe OK, în ecranul care reapare.

214
Culegere de probleme rezolvate cu ajutorul programului SPSS

VII. Interpretarea output-ului.


N Minimum Maximum Mean Std.
Statistic Statistic Statistic Statistic Std.Error Statistic
Populaţie 38 223364 825100 482787,79 27917,06 172425,2
Valid N
38
(listwise)

Chiar dacă eroarea standard este considerată o simplă


informaţie şi de cele mai multe ori nici nu trebuie raportată, datele
din tabelul de mai sus pot oferi câteva repere şi anume:
În analiza statistică au fost luate în consideraţie 38 de
înregistrări, valorile sunt cuprinse în intervalul 223364 – 825100
(adică, dintre judeţele analizate, cea mai mică populaţie o are
judeţul Covasna, iar cea mai numeroasă populaţie o are
judeţul Iaşi).
În medie populaţia judeţelor luate în calcul este de
482787,79 locuitori.
Pentru media datelor prezentate în problemă, eroarea
standard este de 27917,06 (rotunjim la două zecimale).
II. Să se calculeze eroarea standard a procentului
populaţiei urbane ocupată, încadrată în grupa de vârstă 35-40
de ani şi existentă la 1 iulie 2007, în România.
Grupa de vârstă
Grupa de ocupaţii
35-44 ani (%)
Legislativ, executiv, înalţi conducători 30,5
ai administraţiei publice, conducători
şi funcţionari din unităţile economico-
sociale şi politice
Specialişti cu ocupaţii intelectuale şi 23,4
ştiinţifice
Tehnicieni, maiştri şi asimilaţi 27,5

215
Adrian MARINESCU

Grupa de vârstă
Grupa de ocupaţii
35-44 ani (%)
Funcţionari administrativi 31,5
Lucrători operativi în servicii, comerţ 29,3
şi asimilaţi
Agricultori şi lucrători calificaţi în 24,4
agricultură, silvicultură şi pescuit
Meşteşugari şi lucrători calificaţi în 32,0
meserii de tip artizanal, de reglare şi
întreţinere ale maşinilor şi instalaţiilor
Alte categorii 31,1
Sursă: Anuarul statistic al României – 2008, pag. 129
Pentru calcularea erorii standard derulăm toate etapele
prezentate mai sus:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

216
Culegere de probleme rezolvate cu ajutorul programului SPSS

II. Definirea primei coloane şi înlăturarea zecimalelor

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

217
Adrian MARINESCU

IV. Declanşarea procedurii de calcul prin selectarea


opţiunilor, în următoarea ordine: ANALYZE –
DESCRIPTIVE STATISTICS – DESCRIPTIVE.

V. Introducerea câmpului de date în tabelul de variabile


şi activarea butonului OPTIONS.

218
Culegere de probleme rezolvate cu ajutorul programului SPSS

VI. Selectarea opţiunii S.E.mean – CONTINUE şi în


final, clic pe OK, în ecranul care reapare.

VII. Interpretarea output-ului.


Descriptive Statistics

N Minimum Maximum Mean Std.


Statistic Statistic Statistic Statistic Std. Error Statistic
Procent 8 23,4 32,0 28,713 1,1658 3,2974
Valid N (listwis 8

În analiza statistică au fost luate în consideraţie


8 înregistrări, procentele fiind cuprinse în intervalul 23,4% – 32%
corespunzător grupei de ocupaţii „Specialişti cu ocupaţii
intelectuale şi ştiinţifice” şi respectiv, „Meşteşugari şi lucrători
calificaţi în meserii de tip artizanal, de reglare şi întreţinere ale
maşinilor şi instalaţiilor”. Media procentelor din problemă este
28,71%, iar eroarea standard are valoarea de 1,17.

219
Adrian MARINESCU

2.9.4. Probleme propuse


I. Să se calculeze eroarea standard a procentului
populaţiei urbane ocupată, încadrată în grupa de vârstă
15-24 de ani şi existentă la 1 iulie 2007, în România.

Grupa de vârstă
Grupa de ocupaţii
15-24 ani (%)

Legislativ, executiv, înalţi conducători


ai administraţiei publice, conducători 2,0
şi funcţionari din unităţile economico-
sociale şi politice

Specialişti cu ocupaţii intelectuale şi 2,6


ştiinţifice

Tehnicieni, maiştri şi asimilaţi 4,2

Funcţionari administrativi 11,6

Lucrători operativi în servicii, comerţ 7,1


şi asimilaţi

Agricultori şi lucrători calificaţi în 6,8


agricultură, silvicultură şi pescuit

Meşteşugari şi lucrători calificaţi în


meserii de tip artizanal, de reglare şi 6,8
întreţinere ale maşinilor şi
instalaţiilor

Alte categorii 8,8

Sursă: Anuarul statistic al României – 2008, pag. 129


220
Culegere de probleme rezolvate cu ajutorul programului SPSS

II. Să se calculeze eroarea standard a numărului de


conflicte înregistrate în fiecare lună a anului 2007, în România,
în conformitate cu datele prezentate în tabelul alăturat:

Lună Număr de conflicte


Ianuarie 9
Februarie 11
Martie 6
Aprilie 7
Mai 15
Iunie 6
Iulie 8
August 5
Septembrie 3
Octombrie 3
Noiembrie 7
Decembrie 6
Sursă: Anuarul statistic al României – 2008, pag. 150

III. Având în vedere datele privind populaţia


participantă la activitatea economică, în regiunea nord-vest
a României, în perioada 2002 - 2007, să se calculeze eroarea
standard pentru:
a. Populaţia de sex masculin.
b. Populaţia de sex feminin
c. Populaţia participantă la activitatea economică,
indiferent sexul acesteia, din perioada 2003 – 2007.

221
Adrian MARINESCU

Masculin Feminin
An
(mii persoane) (mii persoane)
2002 679 581
2003 665 563
2004 650 543
2005 643 544
2006 654 563
2007 642 556
Sursă: Anuarul statistic al României – 2008, pag. 155

2.10. Testul t pentru eşantioane corelate

2.10.1. Recapitularea principalelor elemente teoretice


În literatura de specialitate mai putem întâlni şi alte
denumiri, precum: Testul t pentru eşantioane dependente sau
Testul t pentru eşantioane perechi. Specialiştii recomandă
utilizarea acestei proceduri în două cazuri şi anume:
1. Când datele problemei se referă la aceeaşi respondenţi
dar interogaţi la momente diferite (cu referire directă
la studiile de tipul „înainte” sau „după”).
2. Când aceeaşi respondenţi îşi exprimă opinia în
legătură cu două situaţii diferite (Cel mai des utilizat
exemplu în literatura de specialitate este cel în care
respondenţii apreciază atât pe cei de acelaşi sex cu el,
cât şi pe cei de sex opus).
Avantajul folosirii acestui test constă în obţinerea mai
multor date despre situaţia analizată, precum şi apropierea acestui
model („înainte” sau „după”) de modelul experimental.

222
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.10.2. Etapele testului t pentru eşantioane corelate


Aplicarea testului t, pe un set de date se poate efectua prin
parcurgerea a 6 etape şi anume:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
II. Etichetarea şi definirea primelor două coloane, în
conformitate cu datele problemei şi înlăturarea celor
două zecimale (dacă este cazul).
III. Revenirea în ecranul DATA VIEW şi inserarea datelor.
IV. Declanşarea procedurilor specifice testului t, prin
selectarea opţiunilor, în următoarea ordine:
ANALYZE-COMPARE MEANS – PAIRED
SAMPLES T TEST.
V. Trecerea celor două câmpurilor sub CURRENT
SELECTIONS, lângă eticheta VARIABLE 1,
respectiv VARIABLE 2, trecerea lor în lista
variabilelor relaţionate şi apăsarea OK
VI. Interpretarea output-ului
2.10.3. Probleme rezolvate
I. Pentru determinarea evoluţiei unui grup de 30 de
studenţi în anii I şi II de studii, să se aplice testul t asupra
mediilor anuale obţinute de aceştia, conform datelor din
tabelul alăturat:
Media obţinută în
Sexul studentului
Anul I Anul II
Feminin 7,92 9,13
Masculin 6,43 8,19
Feminin 6,37 7,77
Masculin 6,20 6,25
Feminin 9,10 9,30

223
Adrian MARINESCU

Media obţinută în
Sexul studentului
Anul I Anul II
Feminin 8,45 8,75
Masculin 8,40 8,00
Masculin 8,25 8,30
Feminin 8,10 7,90
Feminin 8,40 9,30
Feminin 8,25 9,00
Masculin 8,00 9,20
Masculin 8,15 8,15
Feminin 9,00 9,10
Feminin 8,25 8,00
Masculin 6,90 7,80
Masculin 7,10 8,00
Feminin 8,20 8,25
Masculin 7,10 7,25
Feminin 8,10 8,15
Feminin 7,20 7,50
Feminin 7,90 7,10
Feminin 8.30 8,50
Masculin 7,70 8,15
Feminin 8,20 8,30
Feminin 7,70 8,20
Masculin 9,40 9,90
Masculin 9,50 9,80
Masculin 8,20 8,10
Masculin 7,20 7,90

224
Culegere de probleme rezolvate cu ajutorul programului SPSS

Pentru rezolvarea problemei, vom parcurge cele 6 etape


prezentate anterior, astfel:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Etichetarea şi definirea primelor două coloane, în


conformitate cu datele problemei şi înlăturarea celor
două zecimale (dacă este cazul).

225
Adrian MARINESCU

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

IV. Declanşarea procedurilor specifice testului t, prin


selectarea opţiunilor, în următoarea ordine:
ANALYZE-COMPARE MEANS – PAIRED
SAMPLES T TEST.

226
Culegere de probleme rezolvate cu ajutorul programului SPSS

V. Trecerea celor două câmpurilor sub CURRENT


SELECTIONS, lângă eticheta VARIABLE 1,
respectiv VARIABLE 2, trecerea lor în lista
variabilelor relaţionate şi apăsarea OK.

VI. Interpretarea output-ului


În cazul aplicării testului t, output-ul este format din trei
tabele, fiecare conţinând următoarele informaţii:
Tabelul 1
Paired Samples Statistics

Std. Error
Mean N Std. Deviation
Mean

An_1 7,9323 30 ,82865 ,15129


Pair 1
An_2 8,3080 30 ,79476 ,14510

Primul tabel conţine informaţii legate de:


Mean = media datelor înscrise în fiecare coloană.
N = numărul de cazuri luate în analiză
Std. Deviation = abaterea standard pentru cele două coloane

227
Adrian MARINESCU

Pentru datele problemei, analizând informaţiile din tabel,


putem afirma: Au fost luate în calcul 30 de cazuri, media fiecărui
an de studii fiind 7,93 la primul an de studii şi respectiv 8,31 la anul
II. Abaterea standard este de 0,83 la primul an şi 0,79 la cel de-al
doilea an, valori foarte apropiate pentru cele două seturi de date.

Tabelul 2
Paired Samples Correlations

N Correlation Sig.
Pair 1 An_1 & An_2 30 ,759 ,000

Principala informaţie, din cadrul acestui tabel este legată


de gradul de corelaţie dintre seturile de valori analizate
(Correlation).
În cazul de faţă, corelaţia între mediile obţinute de către
cei 30 de studenţi, în cei doi ani de studii, este de 0,76.
Această valoare indică o corelaţie medie, dar totuşi, pentru
datele problemei este nesemnificativă, deoarece este mai mare de
0,05, valoare considerată ca prag de semnificaţie.

Tabelul 3

Paired Samples Test

Sig.
Paired Differences t df
(2-tailed)
Std. 95% Confidence
Std. Error Interval of the
Mean Deviation Mean Difference

Lower Upper

Pair 1 An_1 -
-,37567 ,56410 ,10299 -,58630 -,16503 -3,648 29 ,001
An_2

228
Culegere de probleme rezolvate cu ajutorul programului SPSS

Acest ultim tabel conţine toate componentele relevante ale


testului t aplicat, astfel:
Mean = diferenţa mediilor celor două coloane
analizate.
t = valoarea testului t (valoarea este
rezultatului raportului dintre „Mean” şi
„Std. Error Mean (eeroarea standard a
mediei)”.
df = numărul gradelor de libertate
Sig.(2-tailed) = nivelul de semnificaţie (pentru a fi
semnificativ acest test, valoarea trebuie să
fie mai mică ca 0,05).
În cazul problemei de faţă, se poate afirma: diferenţa între
mediilor celor doi ani de studii este de –0,38, avem 29 de grade de
libertate, iar testul t are valoarea de –3,65. Testul este semnificativ
deoarece valoarea Sig.(2-tailed) este mai mică de 0,05: 0,01.
II. Să se aplice testul t asupra evoluţiei câştigurilor
salariale nominale din perioada 2006-2007, ale
femeilor ce îşi desfăşoară activitatea, în domeniul
industriei prelucrătoare, conform datelor din
tabelul alăturat:
Câştig salarial
Activitate nominal (lei / salariat)
2006 2007
Alimentară şi băuturi 595 709
Produse din tutun 2194 1666
Produse textile 556 664
Articole de îmbrăcăminte 511 616
Pielărie şi încălţăminte 499 603
Prelucrarea lemnului şi a produselor 485 606
din lemn (exclusiv mobilă)

229
Adrian MARINESCU

Câştig salarial
Activitate nominal (lei / salariat)
2006 2007
Celuloză, hârtie şi produse din hârtie 657 743
Edituri, poligrafie şi reproducerea 693 826
pe suporţi a înregistrărilor
Prelucrarea ţiţeiului, cocsificarea 1599 1700
cărbunelui şi tratarea combustibililor
nucleari
Substanţe şi produse chimice 1113 1298
Produse din cauciuc şi mase plastice 639 776
Fabricarea materialelor de construcţii 810 992
şi alte produse din materiale nemetalice
Metalurgie 1047 1159
Construcţii metalice şi produse din 739 897
metal
Maşini şi echipamente 796 926
Mijloace ale tehnicii de calcul şi de birou 643 756
Maşini şi aparate electrice 699 815
Echipamente pentru radio, tv şi 1152 1260
comunicaţii
Aparatură şi instrumente medicale, 735 814
de precizie, optice şi ceasornicărie
Mijloace de transport rutier 927 1039
Mijloace de transport neincluse la 985 1131
cele rutiere
Mobilier şi alte activităţi industriale 586 660
neclasificate în altă parte
Recuperarea deşeurilor 609 779
Sursă: Anuarul Statistic al României 2008, pag. 271.

230
Culegere de probleme rezolvate cu ajutorul programului SPSS

Pentru rezolvarea problemei, vom parcurge cele 6 etape


prezentate anterior, astfel:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Etichetarea şi definirea primelor două coloane, în


conformitate cu datele problemei şi înlăturarea celor
două zecimale (dacă este cazul).

231
Adrian MARINESCU

III. Revenirea în ecranul DATA VIEW şi inserarea


datelor.

IV. Declanşarea procedurilor specifice testului t, prin


selectarea opţiunilor, în următoarea ordine:
ANALYZE – COMPARE MEANS – PAIRED
SAMPLES T TEST.

232
Culegere de probleme rezolvate cu ajutorul programului SPSS

V. Trecerea celor două câmpurilor sub CURRENT


SELECTIONS, lângă eticheta VARIABLE 1,
respectiv VARIABLE 2, trecerea lor în lista
variabilelor relaţionate şi apăsarea OK.

VI. Interpretarea output-ului


Informaţiilor conţinute de către cele 3 tabele sunt următoarele:
Tabelul 1
Paired Samples Statistics

Std. Std. Error


Mean N
Deviation Mean
Pair 1 An_2006 837,78 23 395,426 82,452
An_2007 931,96 23 311,941 65,044

Analizând informaţiile din tabel, putem afirma: În analiză


au fost luate în calcul 23 de cazuri, media câştigurilor salariale
nominale fiind de 837,78 lei în anul 2006 şi respectiv 931,96 lei în
anul 2007. Abaterea standard este de 395,43 la primul an şi
311,94 la cel de-al doilea an, diferenţă relativ mare între cele două
valori (26,76%).

233
Adrian MARINESCU

Tabelul 2
Paired Samples Correlations

N Correlation Sig.

Pair 1 An_2006 & An_2007 23 ,950 ,000

În cazul de faţă, corelaţia între cele două seturi de date,


este de 0,95.
Această valoare indică o corelaţie medie, dar totuşi, pentru
datele problemei este nesemnificativă, deoarece este mai mare de
0,05, valoare considerată ca prag de semnificaţie.

Tabelul 3
Paired Samples Test

Paired Differences t df
Sig.
Std. 95% Confidence (2-tailed)
Std.
Mean Error Interval of the
Deviation
Mean Difference

Lower Upper

Pair 1
An_2006 - -94,174 138,846 28,951 -154,216 -34,132 -3,253 22 ,004
An_2007

Pe baza informaţiilor cuprinse în cadrul acestui ultim tabel,


se poate afirma: diferenţa între cele două seturi de date este de
–94,17, avem 22 de grade de libertate, iar testul t are valoarea de
–3,25. Testul este semnificativ deoarece valoarea Sig. (2-tailed)
este mai mică de 0,05: 0,04.

234
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.10.4. Probleme propuse

I. Să se aplice testul t asupra evoluţiei câştigurilor


salariale nominale medii din perioada 2006-2007, ale
salariaţilor ce îşi desfăşoară activitatea, în domeniul industriei
prelucrătoare, conform datelor din tabelul alăturat:

Câştig salarial nominal


(lei / salariat)
Activitate
2006 2007

Alimentară şi băuturi 660 799


Produse din tutun 2168 2163
Produse textile 578 701
Articole de îmbrăcăminte 521 632
Pielărie şi încălţăminte 514 622
Prelucrarea lemnului şi a produselor 476 602
din lemn (exclusiv mobilă)
Celuloză, hârtie şi produse din 795 901
hârtie
Edituri, poligrafie şi reproducerea pe 725 877
suporţi a înregistrărilor
Prelucrarea ţiţeiului, cocsificarea 1774 1960
cărbunelui şi tratarea combustibililor
nucleari
Substanţe şi produse chimice 1170 1352

235
Adrian MARINESCU

Câştig salarial nominal


Activitate (lei / salariat)
2006 2007
Produse din cauciuc şi mase 727 846
plastice
Fabricarea materialelor de 859 1043
construcţii şi alte produse din
materiale nemetalice
Metalurgie 1116 1282
Construcţii metalice şi produse 789 942
din metal
Maşini şi echipamente 868 1009
Mijloace ale tehnicii de calcul şi de 735 858
birou
Maşini şi aparate electrice 792 900
Echipamente pentru radio, tv şi 1430 1474
comunicaţii
Aparatură şi instrumente 834 940
medicale, de precizie, optice şi
ceasornicărie
Mijloace de transport rutier 987 1175
Mijloace de transport neincluse la 1040 1202
cele rutiere
Mobilier şi alte activităţi industriale 588 683
neclasificate în altă parte
Recuperarea deşeurilor 709 794
Sursă: Anuarul Statistic al României 2008, pag. 271.

236
Culegere de probleme rezolvate cu ajutorul programului SPSS

II. Să se aplice testul t asupra evoluţiei categoriilor de


cheltuielilor din perioada 2006-2007, ale gospodăriilor de
salariaţi, exprimate ca procent din cheltuielile băneşti totale,
efectuate în fiecare an, conform datelor din tabelul alăturat:
Total (% / gospodărie)
Categorie de cheltuieli băneşti
2006 2007
Cumpărarea de alimente şi băuturi 2 1 ,8 2 1 ,2
consumate
Cumpărarea de mărfuri nealimentare 2 2 ,1 2 2 ,3
Plata serviciilor 2 0 ,0 1 9 ,0
Cheltuieli pentru investiţii 1 ,9 2 ,1
Cheltuieli de producţie 0 ,4 0 ,4
Impozite, contribuţii, cotizaţii, taxe 2 1 ,7 2 3 ,1
Contravaloarea consumului de produse 9 ,0 8 ,7
agricole din resurse proprii
Sursă: Anuarul Statistic al României 2008, pag. 286
III. Să se aplice testul t asupra evoluţiei
cat egorii l or de chel t ui eli di n peri oada 2006- 2007, al e
gospodări i lor de salari aţ i , expri m at e ca procent di n
chel t ui el il e t ot al e de consum , ef ect uat e î n f i ecare an,
c o nf o r m da t e l o r di n ta be l ul a l ă tur a t :
Categorie de cheltuieli băneşti Total (% / gospodărie)
2006 2007
Produse agroalimentare şi băuturi 3 7 ,9 3 7 ,1
nealcolice
Băuturi alcoolice, tutun 5 ,9 6 ,3
Îmbrăcăminte şi încălţăminte 7 ,4 7 ,9
Locuinţă, apă, electricitate, gaze şi alţi 1 6 ,4 1 5 ,1
combustibili
Mobilier, dotarea şi întreţinerea locuinţei 4 ,5 5 ,3

237
Adrian MARINESCU

Categorie de cheltuieli băneşti Total (% / gospodărie)


2006 2007
S ă n ă ta te 2 ,3 2 ,2
Transport 8 ,0 7 ,6
Comunicaţii 6 ,0 6 ,1
Recreere şi cultură 5 ,2 5 ,5
Educaţie 1 ,2 1 ,1
Hoteluri, cafenele şi restaurante 1 ,4 1 ,5
Diverse produse şi servicii 3 ,8 4 ,3
Sursă: Anuarul Statistic al României 2008, pag. 288

2.11. Testul t pentru eşantioane necorelate


2.11.1. Recapitularea principalelor elemente teoretice
Acest test este folosit în cazul în care, utilizatorul
constată că seturile de variabile provin din două categori diferite
de oameni. De asemenea, se observă că scorurile fiecărei categorii
analizate, diferă cantitativ. Scopul testului este de a verifica dacă
mediile pentru seturile supuse analizei, diferă semnificativ una
faţă de cealaltă.
Reamintim că, în literatura de specialitate, acest test mai
este cunoscut şi sub numele de Testul t pentru eşantioane
independente.

2.11.2. Etapele testului t pentru eşantioane necorelate


Aplicarea testului t, pe un set de date se poate efectua prin
parcurgerea a 8 etape şi anume:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
II. Etichetarea şi definirea primelor două coloane, în
conformitate cu datele problemei şi înlăturarea celor
două zecimale (dacă este cazul).

238
Culegere de probleme rezolvate cu ajutorul programului SPSS

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.


IV. Declanşarea procedurilor specifice testului t, prin
selectarea opţiunilor, în următoarea ordine: ANALYZE
– COMPARE MEANS – INDEPENDENT SAMPLES
T TEST.
V. Trecerea celor două câmpurilor, unul în lista
variabilelor de test (denumire: Test Variable(s)), iar
cel de-al doilea în căsuţa Grouping Variable).
VI. Selectarea opţiunii DEFINE GROUP.
VII. Introducerea codurilor stabilite la etapa a 2-a, în
dreptul ferestrelor etichetate „Group 1” şi respectiv
„Group 2”, activarea butoanelor CONTINUE şi OK
(din ecranul care reapare)
VIII. Interpretarea output-ului.
2.11.3. Probleme rezolvate
I. Să se analizeze cu ajutorul testului t pentru
eşantioane necorelate evoluţia a notelor obţinute la disciplina
„Statistică” de către un grup de 30 de studenţi şi notele
obţinute la disciplina „Management” obţinute de către un alt
grup de 25, conform datelor din tabelul alăturat:
Notele obţinute la Notele obţinute la
disciplina „Statistică” disciplina „Management”
8,40 7,35
7,90 8,40
8,60 7,30
7,25 8,40
8,80 9,10
9,20 9,10
8,50 9,00

239
Adrian MARINESCU

Notele obţinute la Notele obţinute la


disciplina „Statistică” disciplina „Management”
9,30 8,80
8,75 8,40
9,15 8,90
8,50 9,50
9,30 9,90
7,70 8,20
8,20 8,50
9,05 9,00
8,85 9,00
8,40 8,60
9,10 9,20
7,60 8,00
7,70 8,30
7,85 8,20
8,05 8,50
7,80 7,80
7,90 8,75
8,20 8.70
9,20
8,10
8,15
7,90
8,70

240
Culegere de probleme rezolvate cu ajutorul programului SPSS

Pentru rezolvarea problemei, vom parcurge cele 8 etape


prezentate anterior, astfel:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Etichetarea şi definirea primelor două coloane. Cele


două discipline vor primi câte un număr de cod:
1= Statistică şi 2=Management.

241
Adrian MARINESCU

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

242
Culegere de probleme rezolvate cu ajutorul programului SPSS

IV. Declanşarea procedurilor specifice testului t, prin


selectarea opţiunilor, în următoarea ordine: ANALYZE
– COMPARE MEANS – INDEPENDENT SAMPLES
T TEST.

V. Trecerea celor două câmpurilor, unul în lista


variabilelor de test (Nota în Test Variable(s)),
Disciplina în căsuţa Grouping Variable).

243
Adrian MARINESCU

VI. Selectarea opţiunii DEFINE GROUP.

VII. Introducerea codurilor stabilite la etapa a 2-a, în dreptul


ferestrelor etichetate „Group 1” şi respectiv „Group 2”
(în problema de faţă: Statistică = 1, respectiv
Management = 2), activarea butoanelor CONTINUE
şi OK (din ecranul care reapare)

244
Culegere de probleme rezolvate cu ajutorul programului SPSS

VIII. Interpretarea output-ului.


Dacă, în cazul testului t aplicat eşantioanelor corelate,
input-ul prezenta informaţiile în cadrul a trei tabele, rezultatele
aplicării testului t pentru eşantioane necorelate sunt prezentate
numai în cadrul a două tabele şi anume:

Tabelul 1
Group Statistics

Std. Std. Error


Denumire N Mean
Deviation Mean

Notă Statistică 30 8,4033 ,57893 ,10570

Management 25 8,5960 ,60569 ,12114

Pentru o mai bună evidenţiere a informaţiilor care ne


interesează, acestea sunt bolduite şi au următoarea semnificaţie:
N = numărul de cazuri pentru fiecare grup în
parte.
Mean = media datelor înscrise în dreptul fiecărui
grup.
Std. Deviation = abaterea standard pentru fiecare grup.

În aceste condiţii, putem comenta datele înscrise în primul


tabel, astfel: La disciplina „Statistică” 30 de studenţi au fost
examinaţi şi au primit note a căror medie este de 8,40, iar abaterea
standard este de 0,58. La disciplina „Management”, cei 25 de
studenţi au primit note a căror medie este de 8,59, abaterea
standard fiind, în acest caz de 0,61.

245
Adrian MARINESCU

Tabelul 2

Independent Samples Test

Levene's
Test for
t-test for Equality of Means
Equality of
Variances

Std.
95% Confidence
Sig. (2- Mean Error
F Sig. t df Interval of the
tailed) Difference Differen
Difference
ce

Lower Upper

Notă
Equal ,083 ,775 -1,203 53 ,234 -,19267 ,16010 -,51378 ,12845
variances
assumed

Equal
variances 50,3
-1,198 ,236 -,19267 ,16077 -,51553 ,13019
not 18
assumed

Pentru evidenţierea celor mai importante informaţii,


acestea au fost bolduite, iar semnificaţia lor este următoarea:
Sig = valoarea semnificaţiei pentru testul Levene. Are
o importanţă majoră în alegerea informaţiilor
cuprinse în Tabelul 2 deoarece, dacă are valoarea
mai mare de 0,05 sunt utilizate informaţiile de pe
primul rând, iar dacă valoarea Testului Levene este
mai mică de 0,05 sunt analizate informaţiile de pe
cel de-al doilea rând.

246
Culegere de probleme rezolvate cu ajutorul programului SPSS

Mean = diferenţa mediilor celor două coloane


analizate.
t = valoarea testului t (valoarea este rezultatului
raportului dintre „Mean Difference
(media diferenţei)” şi „Std. Error Mean
(eeroarea standard a mediei)”.
df = numărul gradelor de libertate
Sig.(2-tailed) = nivelul de semnificaţie (pentru a fi
semnificativ acest test, valoarea trebuie să
fie mai mică ca 0,05).
Deoarece, în cazul de faţă, valoarea semnificaţiei pentru
Testul Levene este mai mare de 0,05, vor fi analizate datele afişate
pe primul rând al celui de-al doilea tabel. Astfel: Pentru variante
egale (vezi prima coloană)valoarea Testului t este –1,203, care cu
53 de grade de libertate este semnificativ la 0,234 pentru
nivelul two-tailed
Ca mod de raportare se poate folosi următoarea formă:
Media notelor obţinute de studenţii examinaţi la disciplina
„Statistică” (M=8,40, SD=0,57) este mai mică” (t=-1,203,
DF=53, two-tailed p=0,234) decât media notelor obţinute de
către studenţii care au fost examinaţi la disciplina
„Management” (M=8,59, SD=0,61)
Dacă dorim să utilizăm şi informaţiile cuprinse în
intervalele de încredere, am putea adăuga: Intervalul de încredere
95% pentru diferenţa între notele obţinute la „Statistică” şi
respectiv, la disciplina „Management” este de la –0,51 – +0,13.
Deoarece, acest interval cuprinde şi valoarea 0,00,
diferenţa nu este statistic semnificativă la nivelul de semnificaţie
two-tailed de 5%.
II. Să se analizeze cu ajutorul testului t pentru
eşantioane necorelate câştigurile salariale nominale brute

247
Adrian MARINESCU

obţinute în anul 2007, în judeţele din nordul ţării, în domeniile


„Agricultură, vânătoare şi silvicultură” şi respectiv „Pescuit şi
piscicultură”, conform datelor cuprinse în tabelul următor :

Câştiguri salariale (lei/salariat)


Judeţ
Agricultură, vânătoare şi Pescuit şi
silvicultură piscicultură
Alba 1108 600
Bacău 1027 685
Bihor 966 1025
Bistriţa-Năsăud 837 563
Botoşani 876 658
Braşov 1066 1060
Cluj 1080 1272
Covasna 826 513
Harghita 914 1187
Iaşi 1147 733
Maramureş 991 470
Mureş 877 779
Neamţ 937 643
Sălaj 925 535
Satu Mare 1043 744
Sibiu 1106 676
Suceava 1162 708
Vaslui 918 731
Sursă: Anuarul Statistic al României – 2008, pag. 294

248
Culegere de probleme rezolvate cu ajutorul programului SPSS

Pentru rezolvare, vom parcurge cele 8 etape menţionate


anterior şi anume:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Etichetarea şi definirea primelor două coloane. Cele


două discipline vor primi câte un număr de cod:
1 = Agricultură şi 2 = Pescuit.

249
Adrian MARINESCU

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

250
Culegere de probleme rezolvate cu ajutorul programului SPSS

IV. Declanşarea procedurilor specifice testului t, prin


selectarea opţiunilor, în următoarea ordine:
ANALYZE-COMPARE MEANS – INDEPENDENT
SAMPLES T TEST.

V. Trecerea celor două câmpurilor, unul în lista


variabilelor de test („Câştig” în Test Variable(s)),
„Denumire” în căsuţa Grouping Variable).

251
Adrian MARINESCU

VI. Selectarea opţiunii DEFINE GROUP.

VII. Introducerea codurilor stabilite la etapa a 2-a, în


dreptul ferestrelor etichetate „Group 1” şi respectiv
„Group 2” ( Agricultură = 1, respectiv Pescuit = 2),
activarea butoanelor CONTINUE şi OK (din ecranul
care reapare)

252
Culegere de probleme rezolvate cu ajutorul programului SPSS

VIII. Interpretarea output-ului.


Tabelul 1
Group Statistics

Std. Error
Denumire N Mean Std. Deviation Mean
Câştig_salaria Agricultură 18 989,22 106,908 25,198
Pescuit 18 754,56 230,852 54,412

2.11.4. Probleme propuse

Independent Samples Test

Levene's Test for


Equality of t- test for Equality of Means
Variances

Std. 95% Confidence


Mean Interval of the
Sig. Error
F Sig. t df Differen Difference
(2-tailed) Differen
ce
ce Lower Upper
Câştig Equal
salarial variances 4,770 ,036 3,913 34 ,000 234,667 59,964 112,806 356,528
assumed

Equal
variances 3,913 23,971 ,001 234,667 59,964 110,900 358,434
not assumed

I. Pe datele prezentate în tabelul alăturat să se


analizeze:
a. Cu ajutorul testului t pentru eşantioane
necorelate evoluţia a notelor obţinute la
disciplinele „Drept” şi „Limba Română”.
b. Corelaţia notelor obţinute de persoanele de sex
feminin.
c. Corelaţia notelor obţinute de persoanele de sex
masculin.

253
Adrian MARINESCU

Notele obţinute Notele obţinute la


Sex la disciplina disciplina „Limba
„Drept” Română”

Masculin 9,45 9,25

Feminin 8,80 9,10

Feminin 8,90 9,10

Feminin 9,10 9,30

Masculin 9,20 8,80

Feminin 7,70 8,00

Feminin 8,20 8,40

Masculin 7,80 7,80

Masculin 9,20 9,30

Masculin 8,30 8,20

Feminin 8,45 8,50

Feminin 9,20 9,40

Masculin 8,10 8,00

Masculin 8,25 8,20

Feminin 8,90 9,20

Feminin 9,10 9,10

Feminin 9,00 9,40

254
Culegere de probleme rezolvate cu ajutorul programului SPSS

Notele obţinute Notele obţinute la


Sex la disciplina disciplina „Limba
„Drept” Română”

Masculin 8,00 8,40


Feminin 9,05 9,30
Feminin 8,45 9,20
Feminin 9,00 9,30
Masculin 9,00 9,10
Feminin 8,75 9,00
Feminin 8,60 8,80
Masculin 9,60 9,30
Masculin 7,90 7,90
Masculin 8,30 8,00
Masculin 8,70 8,50
Masculin 8,80 8,70
Masculin 9,30 9,20
Masculin 8,40 8,35
Feminin 8,50 9,05
Feminin 8,40 8,50
Feminin 8,85 9,00
Feminin 8,45 9,20

255
Adrian MARINESCU

II. Să se analizeze cu ajutorul testului t pentru eşantioane


necorelate evoluţia numărului total de pensionari din sistemul
asigurărilor sociale de stat şi a numărului total de persoane
pensionate la limită de vârstă existenţi la 31 decembrie 2007,
pentru un nivel mediu lunar al pensiei cuprins între 41 – 1000 lei,
conform datelor prezentate în tabelul alăturat.

Nivelul mediu Numărul de


Numărul pensionarilor
lunar al pensiei pensionari din
la limită de vârstă
(lei / persoană) asigurări

41 – 45 446 267

46 – 50 512 264

51 – 55 663 362

56 – 60 721 461

61 – 65 1524 497

66 – 70 1541 502

71 – 75 1705 589

76 – 80 1767 667

81 – 85 1829 637

86 – 90 3748 812

91 – 95 3999 951

96 – 100 4537 1053

101 – 110 13152 4061

256
Culegere de probleme rezolvate cu ajutorul programului SPSS

Nivelul mediu Numărul de


Numărul pensionarilor
lunar al pensiei pensionari din
la limită de vârstă
(lei / persoană) asigurări

111 – 120 13627 3891

121 – 130 30350 9635

131 – 140 26254 11451

141 – 150 29402 13269

151 – 160 35572 18069

161 – 170 37443 16794

171 – 180 41326 16631

181 – 190 45319 16226

191 – 200 50210 16320

201 – 210 53273 16354

211 - 220 53687 16773

221 – 230 53454 17491

231 – 240 54085 18542

241 –250 55255 19712


Sursă: Anuarul Statistic al României 2008, pag. 346
III. Să se analizeze cu ajutorul testului t pentru
eşantioane necorelate evoluţia numărului total de bilete
pentru tratament balnear acordate prin asigurările sociale de

257
Adrian MARINESCU

stat, în câteva judeţe din România şi totalul cheltuielilor cu


protecţia socială a şomerilor înregistrate în aceleaşi zone
conform datelor prezentate în tabelul alăturat.

Numărul de Cheltuieli cu protecţia


Judeţ
bilete socială (lei)

Bihor 23756 20605256


Ialomiţa 14869 19857261
Bistriţa Năsăud 9198 24604113
Mehedinţi 3132 18489791
Sibiu 1062 25212087
Neamţ 3687 29860762
Sălaj 1383 20558939
Argeş 80 51642783
Prahova 6171 67952531
Timiş 8665 21487859
Vâlcea 42075 27635990
Covasna 19777 18729599
Constanţa 26751 36030067
Hunedoara 7295 69801116
Caraş-Severin 25200 43056469
Brăila 8188 14953158
Arad 5293 24313831

258
Culegere de probleme rezolvate cu ajutorul programului SPSS

Numărul de Cheltuieli cu protecţia


Judeţ
bilete socială (lei)

Iaşi 2799 40851949


Maramureş 2075 59481078
Bacău 7101 40100474
Suceava 8593 37495753
Braşov 1470 105627073
Dâmboviţa 5794 28542134
Gorj - 48567296
Buzău 3290 29405392
Mureş 7090 27524763
Harghita 6767 32669587
Cluj 1414 40176078
Sursă: Anuarul Statistic al României 2008, pag. 349 şi
pag, 358

2.12. Testul chi-square


2.12.1. Recapitularea principalelor elemente teoretice
Acest test, denumit în literatura de specialitate şi Testul
Chi-pătrat pentru asocierea variabilelor, este folosit în mod
curent, atunci când utilizatorul doreşte să evalueze existenţa unei
diferenţe semnificative între două sau mai multe eşantioane cu
obligativitatea ca acestea să fie formate din date nominale.
Reamintim că, pentru aplicarea corectă a acestui test
frecvenţele (datele cu care se lucrează) nu trebuie transformate în
procente deoarece, în acest caz, este posibil să avem erori.

259
Adrian MARINESCU

O altă particularitate a testului o constituie obligativitatea ca


datele obţinute pentru fiecare caz analizat, să fie introduse
o singură dată. Ca mijloc de verificare, recomandăm ca, după
introducerea datelor, să se verifice egalitatea dintre numărul total
de cazuri şi frecvenţele totale.
2.12.2. Etapele testului chi-square
Aplicarea testului chi-square, pe un set de date se poate
efectua prin parcurgerea a 11 etape şi anume:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
II. Etichetarea şi definirea a unui număr de coloane, în
conformitate cu datele problemei şi înlăturarea celor
două zecimale (dacă este cazul).
III. Revenirea în ecranul DATA VIEW şi inserarea datelor.
IV. Ponderarea datelor prin selectarea opţiunilor în
ordinea: DATA – WEIGHT CASES
V. Trecerea câmpului de frecvenţă în fereastra cu titlul
FREQUENCY VARIABLE-OK
VI. Selectarea în ordine: ANALYZE – DESCRIPTIVE
STATISTICS – CROSSTABS
VII. Trecerea câmpurilor vizate în casetele Row(s) şi
respectiv Column(s).
VIII. Selectarea opţiunilor STATISTICS –CHI-SQUARE-
CONTINUE.
IX. Selectarea opţiunii CELLS
X. În secţiunea COUNTS se selectează EXPECTED, iar
în secţiunea UNSTANDARDIZED, opţiunea
RESIDUALS. În funcţie de scopul urmărit se
selectează o opţiune din secţiunea PERCENTAGES
– CONTINUE – OK
XI. Interpretarea output-ului.

260
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.12.3. Probleme rezolvate


I. Să se stabilească relaţia dintre preferinţele pentru
câteva genuri de programe tv şi respectiv sexul
respondenţilor, în cazul unui grup de 100 de persoane cu
vârste cuprinse între 20 – 45 de ani. Opţiunile acestora sunt
prezentate în tabelul următor:

Canale
Respondenţi
Sport Artă SF Culturale Muzică

Femei 10 17 8 12 11
Bărbaţi 15 6 9 7 5

Pentru rezolvare, vom parcurge cele 11 etape menţionate


anterior şi anume:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

261
Adrian MARINESCU

II. Etichetarea şi definirea a unui număr de coloane, în


conformitate cu datele problemei şi înlăturarea celor
două zecimale.(În problemă: Coloana 1=Sex, Coloana
2=Program, cu codificarea: 1=Sport, 2=Artă, 3=SF,
4=Cultural, 5=Muzică), Coloana 3= Frecvenţă.
a. Codificare pentru coloana „Sex”:

b. Codificare pentru coloana „Program”:

262
Culegere de probleme rezolvate cu ajutorul programului SPSS

Etichetarea coloanei a treia

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

263
Adrian MARINESCU

264
Culegere de probleme rezolvate cu ajutorul programului SPSS

IV. Ponderarea datelor prin selectarea opţiunilor în


ordinea: DATA – WEIGHT CASES

V. Trecerea câmpului de frecvenţă în fereastra cu titlul


FREQUENCY VARIABLE-OK.

265
Adrian MARINESCU

Dacă procedura a fost urmată întocmai, după activarea


tastei OK, în dreapta-jos, pe ecran, trebuie să fie afişat mesajul
WEIGHT ON

VI. Selectarea în ordine: ANALYZE – DESCRIPTIVE


STATISTICS – CROSSTABS.

266
Culegere de probleme rezolvate cu ajutorul programului SPSS

VII. Trecerea câmpurilor vizate în casetele Row(s) şi


respectiv Column(s).

VIII. Selectarea opţiunilor STATISTICS – CHI-SQUARE


– CONTINUE.

267
Adrian MARINESCU

IX. Selectarea opţiunii CELLS

X. În secţiunea COUNTS se selectează EXPECTED,


iar în secţiunea RESIDUALS, opţiunea
UNSTANDARDIZED. În funcţie de scopul urmărit se
selectează o opţiune din secţiunea PERCENTAGES –
CONTINUE – OK

268
Culegere de probleme rezolvate cu ajutorul programului SPSS

XI. Interpretarea output-ului.


Output-ul afişat, în urma aplicării testului chi-square este
format din trei tabele, astfel:
Tabelul1
Case Processing Summary

Cases
Valid Missing Total
N Percent N Percent N Percent
Sex * Program 100 100,0% 0 ,0% 100 100,0%

În cadrul acestui tabel este afişat numărul total de cazuri


(„N” din coloana „Valid”), indicându-se totodată faptul că nu se
înregistrează valori lipsă („N” din coloana „Missing”).
Tabelul 2
Sex * Program Crosstabulation

Program
Sport Artă SF Cultural Muzică Total
Sex Masculin Count 15 6 9 7 5 42
Expected Count 10,5 9,7 7,1 8,0 6,7 42,0
Residual 4,5 -3,7 1,9 -1,0 -1,7
Feminin Count 10 17 8 12 11 58
Expected Count 14,5 13,3 9,9 11,0 9,3 58,0
Residual -4,5 3,7 -1,9 1,0 1,7
Total Count 25 23 17 19 16 100
Expected Count 25,0 23,0 17,0 19,0 16,0 100,0

1 3 2
În cadrul acestui tabel sunt prezentate frecvenţa şi
frecvenţa aşteptată, pentru fiecare dintre celulele tabelului.
De exemplu, dacă analizăm datele prezentate în dreptul
persoanelor de sex feminin, care urmăresc programele de sport,
vom putea concluziona:
1. Numărul total de fete care preferă programele de
sport este 10.
2. Numărul anticipat de probabilitatea este 14,5.
3. Diferenţa dintre valorile de mai sus este de –4,5.

269
Adrian MARINESCU

Tabelul 3
Chi-Square Tests

Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 7,518a 4 ,111
Likelihood Ratio 7,614 4 ,107
Linear-by-Linear
1,924 1 ,165
Association
N of Valid Cases 100
a. 0 cells (,0%) have expected count less than 5. The
minimum expected count is 6,72.

Acest ultim tabel indică valoarea coeficientului Pearson


chi-square (în cazul de faţă, acesta are valoarea 7,518), numărul
gradelor de libertate (pentru problema dată, avem 4 grade de
libertate), precum şi semnificaţia two-tailed (deoarece pentru
datele analizate, această valoare este de 0,111, valoare superioară
pragului de 0,05, concluzia este că, în acest caz, coeficientul
chi-square nu este semnificativ).
Dacă dorim ca ouputul (mai precis, tabelul 2 ) să conţină, în
loc de cifre, procente trebuie să ne întoarcem la etapa a X-a:
În secţiunea COUNTS se selectează EXPECTED, iar în secţiunea
RESIDUALS, opţiunea UNSTANDARDIZED. În funcţie de scopul
urmărit se selectează o opţiune din secţiunea PERCENTAGES –
CONTINUE – OK şi să alegem o opţiune din secţiunea boldită.
Să exemplificăm această posibilitate prin alegerea
procentului pe coloană pentru datele problemei:

270
Culegere de probleme rezolvate cu ajutorul programului SPSS

Vom constata că, ouput-ul se modifică numai în cazul


tabelului 2
Tabelul 2
Sex * Program Crosstabulation

Program
Sport Artă SF Cultural Muzică Total
Sex Masculin Count 15 6 9 7 5 42
Expected Count 10,5 9,7 7,1 8,0 6,7 42,0
% within Progra 60,0% 26,1% 52,9% 36,8% 31,3% 42,0%
Residual 4,5 -3,7 1,9 -1,0 -1,7
Feminin Count 10 17 8 12 11 58
Expected Count 14,5 13,3 9,9 11,0 9,3 58,0
% within Progra 40,0% 73,9% 47,1% 63,2% 68,8% 58,0%
Residual -4,5 3,7 -1,9 1,0 1,7
Total Count 25 23 17 19 16 100
Expected Count 25,0 23,0 17,0 19,0 16,0 100,0
% within Progra 100,0% 100,0% 100,0% 100,0% 100,0% 100,0%

Observăm că, faţă de tabelul 2, rezultat în urma


neselectării niciuneia dintre opţiunile secţiunii PERCENTAGES,
apar date noi, grupate sub titulatura „% within Program”
În cazul de faţă, alegerea opţiunii „Column” ne calculează,
procentul în care se regăsesc persoanele de sex masculin,
respectiv, de sex feminin în dreptul fiecărui program tv. În aceste
condiţii, putem afirma că:
1. din totalul persoanelor care preferă programul de
sport, 60% sunt de sex masculin, iar 40% sunt de
sex feminin.
2. din totalul persoanelor care preferă programul de
artă, 26,1% sunt de sex masculin, iar 73,9% sunt de
sex feminin.
3. din totalul persoanelor care preferă programul de SF,
52,9% sunt de sex masculin, iar 47,1% sunt de
sex feminin.
4. din totalul persoanelor care preferă programul de
cultură, 36,8% sunt de sex masculin, iar 63,2% sunt
de sex feminin.

271
Adrian MARINESCU

5. din totalul persoanelor care preferă programul de


muzică, 31,2% sunt de sex masculin, iar 68,8% sunt
de sex feminin.
6. şi în sfârşit, din totalul de respondenţi, 42,0% sunt de
sex masculin şi 58,0% de sex feminin.
Bazându-ne pe puterea de deducţie a cititorului,
considerăm că nu mai trebuie să exemplificăm şi pentru cazurile
în care, din secţiunea PERCENTAGES, utilizatorul optează
pentru „Row” sau pentru „Total”. Dacă însă curiozitatea nu vă dă
pace, puteţi încerca singuri aceste opţiuni, cu condiţia respectării
etapelor, dar mai ales a ordinii, prezentate anterior.
II. Să se stabilească relaţia dintre categoriile de
personal medico-sanitar şi respectiv judeţele din nord-vestul şi
centrul ţării, conform datelor menţionate în Anuarul Statistic
al României – 2008 şişi prezentate în tabelul alăturat:
Personal medico-sanitar
Judeţ
Medici Stomatologi Farmacişti Asistenţi
Alba 632 161 249 2133
Bihor 1180 435 353 3902
Bistriţa-Năsăud 406 124 124 1572
Braşov 1228 301 352 3165
Cluj 406 124 124 1572
Covasna 346 75 77 1186
Harghita 384 111 139 1842
Maramureş 3158 645 533 5611
Mureş 1790 280 407 4406
Satu Mare 530 162 191 1941
S ă la j 321 74 94 1349
S ib iu 1081 293 247 2310
Sursa: Anuarul Statistic al României 2008, pag. 381

272
Culegere de probleme rezolvate cu ajutorul programului SPSS

Pentru rezolvare, vom parcurge cele 11 etape menţionate


anterior şi anume:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Etichetarea şi definirea a unui număr de coloane, în


conformitate cu datele problemei şi înlăturarea celor
două zecimale.(În problemă: Coloana 1=Judeţ,
cu codificarea 1…12, în ordinea alfabetică a
judeţelor, Coloana 2=Personal, cu codificarea 1...4
în ordinea din tabel şi Coloana 3=Frecvenţă)
Codificarea pentru judeţ:

273
Adrian MARINESCU

Codificarea pentru Personal

Etichetarea ultimei coloane (Frecvenţă)

274
Culegere de probleme rezolvate cu ajutorul programului SPSS

III. Revenirea în ecranul DATA VIEW şi inserarea


datelor.

IV. Ponderarea datelor prin selectarea opţiunilor în


ordinea: DATA – WEIGHT CASES

275
Adrian MARINESCU

V. Trecerea câmpului de frecvenţă în fereastra cu titlul


FREQUENCY VARIABLE-OK.

Dacă procedura a fost urmată întocmai, după activarea


tastei OK, în dreapta-jos, pe ecran, trebuie să fie afişat mesajul
WEIGHT ON

276
Culegere de probleme rezolvate cu ajutorul programului SPSS

VI. Selectarea în ordine: ANALYZE – DESCRIPTIVE


STATISTICS – CROSSTABS.

VII. Trecerea câmpurilor vizate în casetele Row(s) şi


respectiv Column(s).

277
Adrian MARINESCU

VIII. Selectarea opţiunilor STATISTICS –CHI-SQUARE-


CONTINUE.

IX. Selectarea opţiunii CELLS

278
Culegere de probleme rezolvate cu ajutorul programului SPSS

X. În secţiunea COUNTS se selectează EXPECTED,


iar în secţiunea UNSTANDARDIZED, opţiunea
RESIDUALS şi din secţiunea PERCENTAGES –
opţiunea COLUMN (ca exemplu) - CONTINUE – OK

XI. Interpretarea output-ului.


Output-ul afişat, în urma aplicării testului chi-square este
format din trei tabele, astfel:
Tabelul1
Case Processing Summary

Cases
Valid Missing Total
N Percent N Percent N Percent
Judeţ * Person 48126 100,0% 0 ,0% 48126 100,0%

În cadrul acestui tabel este afişat numărul total de înregistrări


(„N” din coloana „Valid”), indicându-se totodată faptul că nu se
înregistrează valori lipsă („N” din coloana „Missing”).

279
Adrian MARINESCU

Tabelul 2
Judeţ * Personal Crosstabulation

Personal
Medici Stomatologi Farmacişti Asistenţi Total
Judeţ Alba Count 632 161 249 2133 3175
Expected Count 756,2 183,7 190,7 2044,4 3175,0
% within Personal 5,5% 5,8% 8,6% 6,9% 6,6%
Residual -124,2 -22,7 58,3 88,6
Braşov Count 1228 301 352 3165 5046
Expected Count 1201,8 292,0 303,0 3249,2 5046,0
% within Personal 10,7% 10,8% 12,2% 10,2% 10,5%
Residual 26,2 9,0 49,0 -84,2
Bihor Count 1180 435 353 3902 5870
Expected Count 1398,0 339,7 352,5 3779,8 5870,0
% within Personal 10,3% 15,6% 12,2% 12,6% 12,2%
Residual -218,0 95,3 ,5 122,2
Bistriţa-Năsăud Count 406 124 124 1572 2226
Expected Count 530,2 128,8 133,7 1433,4 2226,0
% within Personal 3,5% 4,5% 4,3% 5,1% 4,6%
Residual -124,2 -4,8 -9,7 138,6
Cluj Count 406 124 124 1572 2226
Expected Count 530,2 128,8 133,7 1433,4 2226,0
% within Personal 3,5% 4,5% 4,3% 5,1% 4,6%
Residual -124,2 -4,8 -9,7 138,6
Covasna Count 346 75 77 1186 1684
Expected Count 401,1 97,5 101,1 1084,4 1684,0
% within Personal 3,0% 2,7% 2,7% 3,8% 3,5%
Residual -55,1 -22,5 -24,1 101,6
Harghita Count 384 111 139 1842 2476
Expected Count 589,7 143,3 148,7 1594,3 2476,0
% within Personal 3,4% 4,0% 4,8% 5,9% 5,1%
Residual -205,7 -32,3 -9,7 247,7
Maramureş Count 3158 645 533 5611 9947
Expected Count 2369,0 575,6 597,3 6405,0 9947,0
% within Personal 27,6% 23,2% 18,4% 18,1% 20,7%
Residual 789,0 69,4 -64,3 -794,0
Mureş Count 1790 280 407 4406 6883
Expected Count 1639,3 398,3 413,3 4432,1 6883,0
% within Personal 15,6% 10,1% 14,1% 14,2% 14,3%
Residual 150,7 -118,3 -6,3 -26,1
Satu Mare Count 530 162 191 1941 2824
Expected Count 672,6 163,4 169,6 1818,4 2824,0
% within Personal 4,6% 5,8% 6,6% 6,3% 5,9%
Residual -142,6 -1,4 21,4 122,6
Sălaj Count 321 74 94 1349 1838
Expected Count 437,7 106,4 110,4 1183,5 1838,0
% within Personal 2,8% 2,7% 3,3% 4,4% 3,8%
Residual -116,7 -32,4 -16,4 165,5
Sibiu Count 1081 293 247 2310 3931
Expected Count 936,2 227,5 236,1 2531,2 3931,0
% within Personal 9,4% 10,5% 8,5% 7,5% 8,2%
Residual 144,8 65,5 10,9 -221,2
Total Count 11462 2785 2890 30989 48126
Expected Count 11462,0 2785,0 2890,0 30989,0 48126,0
% within Personal 100,0% 100,0% 100,0% 100,0% 100,0%

280
Culegere de probleme rezolvate cu ajutorul programului SPSS

Î n c a dr ul a c e s t ui t a b e l s unt pr e z e nt a t e fr e c ve nţ a ş i
fr e c ve nţ a a ş t e pt a t ă , pe nt r u fi e c a r e di nt r e c e l ul e l e t a be l ul ui .
De e xe mpl u, da c ă a na l i z ă m da t e l e va l a bi l e pe nt r u
j udeţ ul Al b a, vo m put e a concl uzi o na:
1. Numărul total de medici din judeţul Alba este de 632.
2. Ac e s t nu mă r r e pr e z i nt ă 5,5 % di n t ot a l ul me di c i l or
din jud eţele luate în cal cul.
3. Nu mă r ul t ot a l de me di c i e s t e de 11 4 62.

Tabelul 3

Chi-Square Tests

Asymp. Sig.
Value df (2-sided)
Pearson Chi-Square 947,998a 33 ,000
Likelihood Ratio 947,840 33 ,000
Linear-by-Linear
76,129 1 ,000
Association
N of Valid Cases 48126
a. 0 cells (,0%) have expected count less than 5. The
minimum expected count is 97,45.

Acest ultim tabel indică valoarea coeficientului Pearson


chi-square (în cazul de faţă, acesta are valoarea 947,998),
numărul gradelor de libertate (pentru problema dată, avem
33 grade de libertate), precum şi semnificaţia two-tailed
(deoarece pentru datele analizate, această valoare este de 0,001,
valoare inferioară pragului de 0,05, concluzia este că, în acest
caz, coeficientul chi-square este semnificativ).

281
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.12.4. Probleme propuse


I. Să se stabilească relaţia dintre câteva tipuri de
unităţi sanitare şi respectiv judeţele din nord-vestul şi centrul
ţării, conform datelor menţionate în Anuarul Statistic al
României – 2008 şişi prezentate în tabelul alăturat:

Unităţi medicale

Judeţ Lab. de
Depozite Laboratoare
tehnică
farmaceutice medicale
dentară

Alba 1 56 35
Bihor 8 70 79
Bistriţa-Năsăud 1 18 45
Braşov 24 29 56
Cluj 34 146 143
Covasna 1 20 29
Harghita 4 40 51
Maramureş 7 25 67
Mureş 14 83 70
Satu Mare 3 39 41
S ă la j 1 19 32
S ib iu 11 31 73
Sursa: Anuarul Statistic al României 2008, pag. 380

281
Adrian MARINESCU

II. Să se stabilească relaţia dintre producţia privată


medie la hectar, la principalele culturi şi respectiv judeţele din
sudul ţării, conform datelor menţionate în Anuarul Statistic al
României – 2008 şi prezentate în tabelul alăturat:

Producţia privată la principalele culturi


Judeţ Ceapă Varză Furaje Furaje
Pepeni
uscată a lb ă verzi perene
Argeş 778 1124 150 17487 12938
Călăraşi 393 214 461 7732 6218
Dâmboviţa 1174 5357 163 21175 13078
Giurgiu 464 683 45 18338 7559
Ialomiţa 341 373 3438 13309 10901
Prahova 692 732 158 11905 6282
Teleorman 1581 772 1463 15167 5852
Dolj 1389 2665 4649 9522 5826
Gorj 976 1178 51 5263 4660
Mehedinţi 564 831 1260 7189 3991
Olt 763 1667 1312 6201 5599
Vâlcea 821 1199 2 4553 4539
Ilfov 10058 21598 2354 8661 11247
Bucureşti 2000 11526 100 10025 4503
Brăila 7315 16694 10400 3198 11974

282
Culegere de probleme rezolvate cu ajutorul programului SPSS

Producţia privată la principalele culturi


Judeţ Ceapă Varză Furaje Furaje
Pepeni
uscată a lb ă verzi perene
Buzău 7754 16032 10131 6575 10946
Constanţa 14850 20086 12435 11977 9644
Galaţi 7728 30317 20918 7764 12509
Tulcea 13718 19474 10876 4337 8097
Vrancea 8028 20948 17704 11164 13874
Sursa: Anuarul Statistic al României 2008, pag. 625-626

2.13. TESTUL WILCOXON (date corelate)

2.13.1. Recapitularea principalelor elemente teoretice


Dacă datele problemei se referă la subiecţi evaluaţi de două
ori, pe o scală oarecare de interval, iar variabilele obţinute nu
întrunesc condiţiile pentru utilizarea testului t (concret: scorurile nu
sunt uniform distribuite, adică sub formă de clopot), atunci se
utilizează testul Wilcoxon.
Acest test face parte din categoria testelor de date ordinale
deoarece utilizează proceduri de tip non-parametric şi apelează
totodată, la diferenţele dintre valorile perechi, precum şi la
ordonarea lor.
De asemenea, trebuie reamintit faptul că testele
nonparametrice (din care face parte şi acest test) nu se axează pe
caracteristicile respondenţilor, aşa cum o fac testele parametrice
(de exemplu testul t).

283
Adrian MARINESCU

2.13.2. Etapele aplicării testului WILCOXON


În vederea aplicării acestei proceduri, trebuie parcurse
următoarele 6 etape:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
II. Definirea coloanelor, în conformitate cu datele
problemei şi înlăturarea celor două zecimale (dacă
este cazul).
III. Revenirea în ecranul DATA VIEW şi inserarea datelor.
IV. Declanşarea analizei parcurgând succesiv
ANALYSE – NONPARAMETRIC TESTS – 2
RELATED SAMPLES.
V. În fereastra deschisă de ultima opţiune:
1. Trecerea coloanelor în câmpul de variabile.
2. Din secţiunea TEST TYPE, selectarea opţiunii
WILCOXON şi apoi OK.
VI. Interpretarea output-ului.

2.13.3. Probleme rezolvate


I. Să se aplice testul Wilcoxon pe notele obţinute de
elevii unei clase de liceu la disciplinele matematică şi limba
română în anul şcolar 2008-2009:
Notă
Elev
Matematică Limba română
Bunea Daniel 10 6
Chiriac Dan 5 10
Constantinescu Dan 7 7
Dinescu Andrei 6 9
Donose Ion 7 9
Dumitrescu Dan 9 5

284
Culegere de probleme rezolvate cu ajutorul programului SPSS

Notă
Elev
Matematică Limba română
Ghiţă Aurel 6 9
Ghiţulescu Andreea 9 8
Ionescu Răzvan 9 10
Marinciu Andrei 5 6
Mercea Valentin 10 10
Militaru Costel 8 10
Mitulescu Marius 6 9
Mocanu Andreea 7 10
Moise Maria 6 8
Moştenescu Ionuţ 7 8
Petrescu Ionuţ 10 7
Pitulescu Ionuţ 10 9
Pop Adriana 7 5
Popescu Cornelia 8 6
Popoviciu Elena 9 5
Răduţă Constantin 7 7
Rădulescu Bogdan 8 8
Stoian Valentina 9 8
Teclu Şerban 8 9
Ţicleanu Ionuţ 9 7
Vasilescu Pertică 6 6
Vasileţ Petre 8 7
Vintilescu Adrian 10 6
Voinescu Cristian 7 6

285
Adrian MARINESCU

Pentru rezolvarea problemei vom parcurge cele 6 etape


prezentate anterior:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Definirea coloanelor, în conformitate cu datele problemei


şi înlăturarea celor două zecimale (dacă este cazul).

286
Culegere de probleme rezolvate cu ajutorul programului SPSS

III. Revenirea în ecranul DATA VIEW şi inserarea


datelor.

IV. Declanşarea analizei parcurgând succesiv


ANALYSE – NONPARAMETRIC TESTS – 2
RELATED SAMPLES.

287
Adrian MARINESCU

V. În fereastra deschisă de ultima opţiune:


1. Trecerea coloanelor în câmpul de variabile.
Această operaţie se desfăşoară în două etape şi anume:
1: dublu clic pe fiecare câmp = câmpurile sunt transferate
în secţiunea Current Selections.
2: cu ajutorul butonului aflat la mijlocul ferestrei, se
reuşeşte mutarea în câmpul de variabile

288
Culegere de probleme rezolvate cu ajutorul programului SPSS

2. Din secţiunea TEST TYPE, selectarea opţiunii


WILCOXON şi apoi OK.

VI. Interpretarea output-ului.


Constatăm că, în urma aplicării testului Wilcoxon,
output-ul rezultat este sub forma a două tabele.
Tabelul 1
Ranks

N Mean Rank Sum of Ranks


Română - Matemati Negative Rank 13a 13,12 170,50
Positive Ranks 12b 12,88 154,50
Ties 5c
Total 30
a. Română < Matematică
b. Română > Matematică
c. Română = Matematică

289
Adrian MARINESCU

Tabelul 2
Test Statisticsb

Română -
Matematică
Z -,217a
Asymp. Sig. (2-tailed) ,828
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test

În literatura de specialitate este specificat faptul că primul


tabel poate fi ignorat, deoarece el prezintă numai situaţia datelor
din tabel, în ordinea stabilită de utilizator. În cazul problemei de
faţă, tabelul menţionează faptul că, în 13 cazuri nota la limba
română este mai mică decât cea obţinută la matematică, în
12 cazuri situaţia este inversă, iar în 5 cazuri, notele sunt egale.
În schimb cel de-al doilea tabel indică nivelul de
semnificaţie al testului Wilcoxon. Este calculat scorul z (în cazul
de faţă el este de –0,217), iar nivelul probabilităţii acestuia, indicat
un rând mai jos (pentru problema de faţă probabilitatea two-tailed
este de 0,828), se compară cu nivelul de 5%. Conform datelor
din tabelul 2, pentru problema de faţă probabilitatea calculată este
mai mare decât nivelul de 5% ceea ce înseamnă că diferenţa dintre
cele două variabile nu este semnificativă statistic.

II. Să se aplice testul Wilcoxon asupra datelor cuprinse


în tabelul următor, date extrase din Anuarul Statistic al
României 2008, ce fac referinţă la transportul portuar al unor
grupe de mărfuri, înregistrate în anul 2007, la export, precum
şi la intern. Datele prezentate mai jos se referă strict

290
Culegere de probleme rezolvate cu ajutorul programului SPSS

la mărfurile încărcate, iar în cazul grupelor, au fost reţinute


numai acelea care au prezentat valori (în acelaşi timp, la
ambele grupe), în perioada menţionată.

Total mărfuri (t)


Denumire
Export Intern
Cereale 2062 140
Lemn şi plută 1014 6
Produse alimentare şi 9 27
nutreţuri pentru animale
Seminţe uleioase, fructe 711 130
oleaginoase şi grăsimi
Produse petroliere 3213 36
Minereuri de fier, deşeuri de 2679 3452
fier şi oţel, zgură de furnal
Minereuri şi deşeuri neferoase 203 42
Produse metalice 3073 883
Ciment, var nestins, materiale 441 3171
prefabricate pentru construcţii
Minerale brute sau prelucrate 157 297
Îngrăşăminte 1290 444
Produse chimice derivate din 94 1
cărbune şi gudron
Echipamente, maşini şi 74 3
aparate pentru transport
Articole fabricate din metal 26 14
Articole diverse 5794 39
Sursa: Anuarul Statistic al României 2008, pag. 750

291
Adrian MARINESCU

Pentru rezolvare, trebuie să parcurgem cele 6 etape


prezentate anterior:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Definirea coloanelor, în conformitate cu datele problemei


şi înlăturarea celor două zecimale (dacă este cazul).

292
Culegere de probleme rezolvate cu ajutorul programului SPSS

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

IV. Declanşarea analizei parcurgând succesiv ANALYSE


– NONPARAMETRIC TESTS – 2 RELATED
SAMPLES.

293
Adrian MARINESCU

V. În fereastra deschisă de ultima opţiune:


1. Trecerea coloanelor în câmpul de variabile.
Această operaţie se desfăşoară în două etape, conform
celor specificate la problema anterioară.

294
Culegere de probleme rezolvate cu ajutorul programului SPSS

2. Din secţiunea TEST TYPE, selectarea opţiunii


WILCOXON şi apoi OK.

VI. Interpretarea output-ului.


Similar problemei precedente, ouput-ul conţine două
tabele, astfel:
Tabelul 1
Ranks

N Mean Rank Sum of Ranks


Intern - Export Negative Ranks 11a 8,36 92,00
Positive Ranks 4b 7,00 28,00
Ties 0c
Total 15
a. Intern < Export
b. Intern > Export
c. Intern = Export

Chiar dacă se recomandă ignorarea acestui tabel, nu putem să


nu constatăm că numai în 4 cazuri din 15, cantitatea de mărfurile

295
Adrian MARINESCU

încărcate pentru intern a fost mai mare decât cantitatea transportată


pentru extern.
Tabelul 2
Test Statistics b

Intern - Export
Z -1,817a
Asymp. Sig. (2-tailed) ,069
a. Based on positive ranks.
b. Wilcoxon Signed Ranks Test

Conform datelor calculate din acest tabel, scorul z este de


–1,877, probabilitatea lui two-tailed fiind de 0,069. Ca urmare se
poate afirma că diferenţa dintre cele două variabile nu este
semnificativă statistic la un nivel de 5%.
2.13.4. Probleme propuse
I. Să se aplice testul Wilcoxon asupra datelor cuprinse
în tabelul următor, date extrase din Anuarul Statistic al
României 2008, ce fac referinţă la transportul portuar al unor
grupe de mărfuri, înregistrate în anul 2007, la import, precum
şi la intern (datele prezentate mai jos se referă strict la
mărfurile descărcate).
Total mărfuri (t)
Denumire
Import Intern
Cereale 2260 155
Lemn şi plută 6 46
Produse alimentare şi nutreţuri 293 37
pentru animale
Seminţe uleioase, fructe oleaginoase 45 236
şi grăsimi
Produse petroliere 766 5

296
Culegere de probleme rezolvate cu ajutorul programului SPSS

Minereuri de fier, deşeuri de fier 5667 3578


şi oţel, zgură de furnal
Total mărfuri (t)
Denumire
Import Intern
Minereuri şi deşeuri neferoase 859 57
Produse metalice 1334 791
Ciment, var nestins, materiale 699 2523
prefabricate pentru construcţii
Minerale brute sau prelucrate 720 3314
Îngrăşăminte 516 201
Produse chimice derivate din 39 261
cărbune şi gudron
Echipamente, maşini şi aparate 65 7
pentru transport
Articole fabricate din metal 15 51
Articole diverse 6867 29
Sursa: Anuarul Statistic al României 2008, pag. 751
II. Să se aplice testul Wilcoxon asupra datelor privind
transportul rutier efectuat în cont propriu şi respectiv,
contraplată în anul 2007, conform următorului tabel.
Datele ce urmează a fi prelucrate au fost extrase din
Anuarul Statistic al României 2008.
Total mărfuri (mii tone)
Denumire Cont
Contra plată
propriu
Cereale 3750 914
Cartofi, alte legume şi fructe 440 400
Animale vii, sfeclă de zahăr 523 131

297
Adrian MARINESCU

Lemn şi plută 10864 2665


Produse şi fibre textile 224 324
Total mărfuri (mii tone)
Denumire
Cont propriu Contra plată
Produse alimentare şi nutreţuri
pentru animale 19721 14414
Seminţe uleioase, fructe
oleaginoase şi grăsimi 439 114
Combustibili minerali solizi 1049 1873
Petrol brut 1193 131
Produse petroliere 5933 1446
Minereuri de fier, deşeuri de
fier şi oţel, zgură de furnal 3151 1184
Minereuri şi deşeuri neferoase 1227 371
Produse metalice 3917 2563
Ciment, var nestins, materiale
prefabricate pentru construcţii 30063 11201
Minerale brute sau prelucrate 116356 49844
Îngrăşăminte 247 128
Produse chimice derivate din
cărbune şi gudron 69 1129
Celuloză şi deşeuri de hârtie 417 208
Produse chimice altele decât cele
derivate din cărbune şi gudron 844 979
Echipamente, maşini şi aparate
pentru transport 3923 5320
Articole fabricate din metal 1046 1476
Sticlă, sticlărie, produse ceramice 501 1406
Piele, textile, confecţii 2540 11495

298
Culegere de probleme rezolvate cu ajutorul programului SPSS

Articole diverse 18807 19709


Sursa: Anuarul Statistic al României 2008, pag. 755
III. Să se aplice testul Wilcoxon asupra datelor privind
totalul de drumuri publice modernizate sau cu îmbrăcăminţi
uşoare rutiere existente în anul 2007, în centrul şi nordul ţării,
aşa cum sunt ele prezentate în tabelul următor:
Drumuri publice (km)
Judeţ Cu îmbrăcăminţi
Modernizate
uşoare rutiere
Alba 540 479
Bacău 650 522
Bihor 679 755
Bistriţa-Năsăud 384 342
Botoşani 375 450
Braşov 454 475
Cluj 612 739
Covasna 296 275
Harghita 510 318
Iaşi 401 635
Maramureş 543 495
Mureş 423 743
Neamţ 468 546
Sălaj 309 488
Satu Mare 801 60
Sibiu 312 558
Suceava 1051 400

299
Adrian MARINESCU

Vaslui 582 292


Sursa: Anuarul Statistic al României 2008, pag. 762
2.14. Testul U Mann-Whitney

2.14.1. Recapitularea principalelor elemente teoretice


Acest test se aplică atunci când datele problemei sunt
neralaţionate. Aşa cum testul Wilcoxon este echivalentul
non-parametric al testului t pentru eşantioane perechi, testul U
Mann-Whitney este echivalentul non-parametric al testului
t pentru eşantioane independente.

2.14.2. Etapele testului U Mann-Whitney


În vederea aplicării testului U Mann-Whitney trebuie
parcurse următoarele 9 etape:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
II. Definirea coloanelor, în conformitate cu datele
problemei şi înlăturarea celor două zecimale
(dacă este cazul).
III. Revenirea în ecranul DATA VIEW şi inserarea datelor.
IV. Declanşarea analizei parcurgând succesiv ANALYSE
– NONPARAMETRIC TESTS – 2 INDEPENDENT
SAMPLES.
În fereastra deschisă de ultima opţiune:
V. Trecerea unei coloane în câmpul de variabile cu
eticheta TEST VARIABLE LIST.
VI. Trecerea celei de-a doua coloane, în câmpul cu
eticheta GROUPING VARIABLE.
VII. Selectarea opţiunii DEFINE.

300
Culegere de probleme rezolvate cu ajutorul programului SPSS

VIII. Introducerea codificării efectuate în ferestrele


GROUP 1 şi respectiv GROUP 2, apoi selectarea
opţiunii CONTINUE şi OK în ecranul care reapare.
IX. Interpretarea output-ului.
2.14.3. Probleme rezolvate
I. Să se aplic e testul U Man n-Whi tney asu pr a a do uă
categorii d e date şi anume un a referitoa re la totalul d e
şomeri înr egistraţi la sfârşitul a nul ui 2007 în unele judeţe
din Româ n ia, iar cea de-a d oua , referitoare la număr ul de
i ns t i t uţ i i de î nv ă ţ ă m â n t s upe r i o r c e f unc ţ i o n e a ză î n c a p i t a l a
de ju deţ, î n co nformi tate cu da tele menţio nate în ta belul
de mai j os:

Total
Judeţ
Instituţii de
Şomeri
învăţământ superior

Alba Iulia 5359 2


Arad 4929 2
Argeş 12985 2
Bacău 3434 2
Bihor 1606 4
Braşov 5723 3
Bucureşti 18288 35
Caraş-Severin 8967 1
Cluj 3211 10
Constanţa 5204 5

301
Adrian MARINESCU

Dolj 14347 3
Galaţi 1849 2
Iaşi 2413 10
Maramureş 2841 2
Total
Judeţ Instituţii de
Şomeri
învăţământ superior
Mureş 2640 4
Prahova 12124 1
Sibiu 2100 4
Timiş 5487 8
Sursa: Anuarul Statistic al României 2008, pag. 230 şi 402
Pentru rezolvarea problemei vom parcurge cele 9 etape
prezentate anterior:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

302
Culegere de probleme rezolvate cu ajutorul programului SPSS

II. Definirea coloanelor, în conformitate cu datele


problemei şi înlăturarea celor două zecimale (dacă este
cazul). Astfel, pentru prima coloană „Denumire”, vom
eticheta cu: 1 = numărul total de şomeri înregistraţi la
sfârşitul anului 2007 în unele judeţe din România
şi respectiv 2 = numărul de facultăţi de stat ce
funcţionează în capitalele judeţelor respective. În aceste
condiţii, vom parcurge următorii paşi:
a. Definim numărul de zecimale:

b. Etichetăm conform celor menţionate mai sus, prima


dată pentru „Şomeri”, iar în al doilea rând, „Numărul
de facultăţi de stat”:
- pentru datele privind numărul total de şomeri:

303
Adrian MARINESCU

- pentru numărul de facultăţi:

Al doilea câmp care va cuprinde datele prezentate în tabel,


va fi etichetat „Frecvenţă”:

304
Culegere de probleme rezolvate cu ajutorul programului SPSS

305
Adrian MARINESCU

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

IV. Declanşarea analizei parcurgând succesiv ANALYSE


– NONPARAMETRIC TESTS – 2 INDEPENDENT
SAMPLES.

În fereastra deschisă de ultima opţiune:

306
Culegere de probleme rezolvate cu ajutorul programului SPSS

V. Trecerea unei coloane în câmpul de variabile cu


eticheta TEST VARIABLE LIST.

VI. Trecerea celei de-a doua coloane, în câmpul cu


eticheta GROUPING VARIABLE.

307
Adrian MARINESCU

VII. Selectarea opţiunii DEFINE.

VIII. Introducerea codificării efectuate în ferestrele


GROUP 1 şi respectiv GROUP 2, apoi selectarea
opţiunii CONTINUE şi OK în ecranul care reapare.

308
Culegere de probleme rezolvate cu ajutorul programului SPSS

IX. Interpretarea output-ului.


În acest caz, output-ul se prezintă sub forma a două tabele:
Tabel 1
Ranks

Denumire N Mean Rank Sum of Ranks


Frecvenţă Şomeri 18 27,50 495,00
Numărul de
18 9,50 171,00
facultăţi de stat
Total 36

Tabelul are o importanţă mai mică (unii specialişti în


domeniu recomandă chiar ignorarea acestui prim tabel) deoarece
indică numai rangul mediu calculat pentru cei doi parametri.
În exemplul prezentat anterior, din tabelul nr.1 observăm că media
pentru parametrul „Şomeri” este de 27,50, în timp ce, pentru cel
de-al doilea parametru („Numărul de facultăţi de stat”), rangul
mediu este de 9,50. Comparând cele două valori obţinute (27,50
respectiv 9,50), deducem că valorile menţionate în prima coloană
a tabelului din problemă („Şomeri”) au tendinţa să fie mai mari
decât valorile din coloana a doua („Numărul de facultăţi de stat”),
dar acest lucru se poate observa şi cu ochiul liber prin simpla
lecturare a datelor problemei!
Tabelul 2
Test Statistics b

Frecvenţă
Mann-Whitney U ,000
Wilcoxon W 171,000
Z -5,139
Asymp. Sig. (2-tailed) ,000
Exact Sig. [2*(1-tailed a
,000
Sig.)]
a. Not corrected for ties.
b. Grouping Variable: Denumire

309
Adrian MARINESCU

Acest tabel include indicii calculaţi prin aplicarea testului


U Mann-Whitney, astfel: valoarea U este de 0,00 care este
semnificativă, din punct de vedere statistic, la nivelul afişat pe
ultimul rând al tabelului (Exact Sig.[2* (1-tailed Sig.)], adică 0,00.
În ceea ce priveşte scorul Z, în problemă, valoarea calculată
de –5,139 ea este semnificativă la nivelul de 0,00, valoare calculată
pentru datele problemei şi înscrisă în tabel, în dreptul etichetei
Asymp.Sig.(2-tailed).
Ca mod de raportare se poate folosi următoarea formulare:
„Testul U Mann-Whitney a concluzionat că scorurile
numărului de total de şomeri din unele judeţe ale României sunt
semnificativ mai mari decât cele înregistrate în cazul numărului
total de facultăţi de stat ce funcţionează în capitalele judeţelor
respective (U = 0,00, N1=18, N2=18, two-tailed = 0,00.)”.
II. Să se aplice testul U Mann-Whitney asupra a două
categorii de date şi anume una referitoare la suprafaţa totală a
unor judeţe din România, iar cea de-a doua, referitoare la
numărul de facultăţi private ce funcţionează în capitala de judeţ,
în conformitate cu datele menţionate în tabelul de mai jos:
Total
Judeţ 2
Suprafaţă (km ) Facultăţi private
Arad 7754 15
Argeş 6826 3
Bihor 7544 4
Braşov 5363 6
Brăila 4766 2
Bucureşti 238 81
Cluj 6674 7
Constanţa 7071 9
Dolj 7414 5

310
Culegere de probleme rezolvate cu ajutorul programului SPSS

Galaţi 4466 4
Total
Judeţ 2
Suprafaţă (km ) Facultăţi private
Iaşi 5476 14
Mureş 6714 5
Sibiu 5432 4
Timiş 8697 15
Sursa: Anuarul Statistic al României 2008, pag. 16 şi 410
Pentru rezolvarea problemei vom parcurge cele 9 etape
prezentate anterior:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Definirea coloanelor, în conformitate cu datele


problemei şi înlăturarea celor două zecimale. Astfel,
pentru prima coloană denumită „Număr total”, vom
eticheta cu: 1 = numărul total de şomeri înregistraţi

311
Adrian MARINESCU

la sfârşitul anului 2007 în unele judeţe din România


şi respectiv 2 = numărul de facultăţi de stat ce
funcţionează în capitalele judeţelor respective.
În aceste condiţii, vom parcurge următorii paşi:
c. Definim numărul de zecimale:

d. Etichetăm conform celor menţionate mai sus, prima


dată pentru „Suprafaţă”, iar în al doilea rând,
„Numărul de facultăţi private”:

312
Culegere de probleme rezolvate cu ajutorul programului SPSS

- pentru numărul de facultăţi private:

Al doilea câmp care va cuprinde datele prezentate în tabel,


va fi etichetat „Frecvenţă”:

313
Adrian MARINESCU

III. Revenirea în ecranul DATA VIEW şi inserarea datelor.

IV. Declanşarea analizei parcurgând succesiv


ANALYSE – NONPARAMETRIC TESTS – 2
INDEPENDENT SAMPLES.

314
Culegere de probleme rezolvate cu ajutorul programului SPSS

În fereastra deschisă de ultima opţiune:


V. Trecerea unei coloane în câmpul de variabile cu
eticheta TEST VARIABLE LIST.

VI. Trecerea celei de-a doua coloane, în câmpul cu


eticheta GROUPING VARIABLE.

315
Adrian MARINESCU

VII. Selectarea opţiunii DEFINE.

VIII. Introducerea codificării efectuate în ferestrele


GROUP 1 şi respectiv GROUP 2, apoi selectarea
opţiunii CONTINUE şi OK în ecranul care reapare.

316
Culegere de probleme rezolvate cu ajutorul programului SPSS

IX. Interpretarea output-ului.


Tabelul 1
Ranks

Denumire N Mean Rank Sum of Ranks


Frecvenţă Suprafaţă 14 21,50 301,00
Facultăţi private 14 7,50 105,00
Total 28

Tabelul are o importanţă mai mică deoarece indică numai


rangul mediu calculat pentru cei doi parametri. Astfel, media
pentru parametrul „Suprafaţă” este de 21,50, în timp ce, pentru cel
de-al doilea parametru („Numărul de facultăţi private”), rangul
mediu este de 7,50. Comparând cele două valori obţinute (21,50
respectiv 7,50), deducem că valorile menţionate în prima coloană
a tabelului din problemă („Suprafaţă”) au tendinţa să fie mai mari
decât valorile din coloana a doua („Numărul de facultăţi private”),
dar această concluzie putem să aplicăm şi metoda „mult mai
complicată” a citirii directe!
Tabelul 2

317
Adrian MARINESCU

Test Statistics b

Frecvenţă
Mann-Whitney U ,000
Wilcoxon W 105,000
Z -4,505
Asymp. Sig. (2-tailed) ,000
Exact Sig. [2*(1-tailed a
,000
Sig.)]
a. Not corrected for ties.
b. Grouping Variable: Denumire

Tabelul 2 prezintă indicii calculaţi prin aplicarea testului


U Mann-Whitney, astfel: valoarea U este de 0,00 care este
semnificativă, din punct de vedere statistic, la nivelul afişat pe ultimul
rând al tabelului (Exact Sig.[2* (1-tailed Sig.)], adică 0,00.
În ceea ce priveşte scorul Z, în problemă, valoarea
calculată de –4,505, ea este semnificativă la nivelul de 0,00,
valoare calculată pentru datele problemei şi înscrisă în tabel, în
dreptul etichetei Asymp.Sig.(2-tailed).
Ca mod de raportare se poate folosi următoarea formulare:
„Testul U Mann-Whitney a concluzionat că scorurile
numărului de total de şomeri din unele judeţe ale României sunt
semnificativ mai mari decât cele înregistrate în cazul numărului
total de facultăţi de stat ce funcţionează în capitalele judeţelor
respective (U = 0,00, N1=14, N2=14, two-tailed = 0,00.)”.
2.14.4. Probleme propuse
I. Să se aplice testul U Mann-Whitney asupra a două
categorii de date şi anume una referitoare la suprafaţa totală a
unor judeţe din România, iar cea de-a doua, referitoare la
numărul de şomeri din aceleaşi judeţe, în conformitate cu
datele menţionate în tabelul de mai jos:
Judeţ Total

318
Culegere de probleme rezolvate cu ajutorul programului SPSS

Suprafaţă (km2) Şomeri


Arad 7754 4929
Argeş 6826 12985
Bihor 7544 1606
Braşov 5363 5723
Brăila 4766 1050
Bucureşti 238 18288
Cluj 6674 3211
Constanţa 7071 5204
Dolj 7414 14347
Galaţi 4466 1847
Total
Judeţ 2
Suprafaţă (km ) Şomeri
Iaşi 5476 2413
Mureş 6714 2640
Sibiu 5432 2100
Timiş 8697 5487
Sursa: Anuarul Statistic al României 2008, pag. 16 şi 230
II. Să se aplice testul U Mann-Whitney asupra a două
categorii de date şi anume una referitoare la numărul total de
instituţii de învăţământ superior, iar cea de-a doua, referitoare la
numărul de facultăţi private din unele judeţe ale României, în
conformitate cu datele menţionate în tabelul de mai jos:
Total
Judeţ Instituţii de
Facultăţi private
învăţământ superior
Arad 2 15
Argeş 2 3
Bihor 4 4

319
Adrian MARINESCU

Braşov 3 6
Brăila 2
Bucureşti 35 81
Cluj 10 7
Constanţa 5 9
Dolj 3 5
Galaţi 2 4
Iaşi 10 14
Mureş 4 5
Sibiu 4 4
Timiş 8 15
Sursa: Anuarul Statistic al României 2008, pag. 402 şi 410
2.15. Valorile lipsă
2.15.1. Recapitularea principalelor elemente teoretice
Este posibil ca rezultatele unei cercetări să nu cuprindă
întreg setul de informaţii obţinut de la fiecare respondent. Ar fi
păcat să nu exploatăm toate datele colectate (nu mai punem la
socoteală volumul de muncă care ar deveni inutil…) din cauza
faptului că o informaţie lipseşte. Dacă setul ar fi de două sau chiar
trei informaţii, poate nu ar fi aşa de grav, dar gândiţi-vă, dacă tot
setul cuprinde 12-13 informaţii şi datorită lipsei unei valori, nu
veţi putea utiliza restul de 11-12 informaţii, v-ar conveni?
Aşa cum lucrările de specialitate recomandă, decât să nu
se introducă nimic în locul informaţiei lipsă (este posibil ca
programul SPSS să interpreteze „la bunul plac” setul de informaţii
şi în consecinţă, rezultatele analizei să fie greşite), trebuie
specificată (dar cu mare atenţie), valoarea lipsă, pentru a nu crea
premisele unei interpretări greşite. Practic, în vederea depăşirii
acestei etape, trebuie să stabilim, limitele datelor din coloana în
care lipseşte o valoare şi să o codificăm cu un număr situat, în
afara limitelor intervalului stabilit.

320
Culegere de probleme rezolvate cu ajutorul programului SPSS

2.15.2. Etapele analizei în cazul valorilor lipsă


În vederea realizării unei analize, chiar şi în condiţiile în
care lipsesc o parte din date, trebuie să parcurgem 7 etape:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.
II. Definirea coloanelor, în conformitate cu datele
problemei şi înlăturarea celor două zecimale (dacă
este cazul).
III. În dreptul coloanelor cu date lipsă, se activează
opţiunea MISSING, în cadrul căreia se menţionează
valoarea pe care programul trebuie să nu o ia în
calcul deoarece ea ţine locul unei valori lipsă.
IV. Revenirea în ecranul DATA VIEW şi inserarea
datelor, cu recomandarea unei atenţii sporite la
valoarea lipsă.
V. Declanşarea analizei parcurgând succesiv
ANALYSE – CORRELATE – BIVARIATE
VI. În fereastra deschisă de opţiunea BIVARIATE:
Trecerea coloanelor în câmpul de variabile.
Activarea butonului OPTIONS şi definirea opţiunii
utilizatorului (pairwise sau listwise).
Activarea CONTINUE şi OK în fereastra care reapare.
VII. Interpretarea output-ului.
2.15.3. Probleme rezolvate
I. Pentru determinarea unui coeficient de corelaţie între
punctajele obţinute la disciplinele „Sport” şi respectiv
„Statistică”, au fost chestionaţi 30 de elevii ai unei clase de liceu,
iar rezultatele colectate sunt prezentate în tabelul alăturat.
Pentru o departajare cât mai fină, abilităţile sportive,
precum şi rezultatele obţinute la disciplina statistică au fost
notate pe o scară de la 1 la 30. Să se analizeze cele două

321
Adrian MARINESCU

ouput-uri rezultate în urma utilizării opţiunilor pairwise şi


respectiv listwise.
Scor la disciplina
Sex Vârstă
Sport Statistică
Masculin 17 28 17
Feminin 16 29 21
Feminin 18 26 26
Feminin 17 29 28
Masculin 16 30 29
Feminin 17 27 28
Masculin 16 27 26
Scor la disciplina
Sex Vârstă
Sport Statistică
Masculin 18 29 28
Masculin 18 28 25
Masculin 17 25 22
Feminin 24 23
Masculin 16 28 24
Masculin 17 23 27
Feminin 18 23 22
Masculin 16 27 21
Feminin 17 21 20
Masculin 16 20 23
Feminin 16 29 22
Masculin 17 25 24
Masculin 16 24 25

322
Culegere de probleme rezolvate cu ajutorul programului SPSS

Feminin 18 22 22
Feminin 16 23 26
Masculin 17 27
Feminin 17 21 22
Feminin 22 27
Masculin 17 30
Feminin 16 25 29
Masculin 18 27 27
Feminin 18 24 30
Masculin 17 28 26

Înainte de a parcurge cele 7 etape prezentate anterior,


analizând datele din tabel, trebuie să stabilim câteva repere:
a. Lipsesc patru valori şi anume, două pentru coloana
„Vârstă” şi câte una pentru coloanele „Sport” şi
respectiv „Statistică”.
b. Intervalul de valori din coloana „Vârstă” este 16 –18.
c. Intervalul de valori din cadrul coloanei „Sport”
este 20– 30.
d. Intervalul de valori din cadrul coloanei „Statistică”
este 17 – 30.
e. Pe baza intervalelor determinate anterior, codificăm cu
valori situate în afara marginilor, astfel:
- 20 valorile lipsă din coloana „Vârstă”.
- 31 valoarea lipsă din coloana „Sport”.
- 31 valoarea lipsă din coloana „Statistică”.
Pentru rezolvarea problemei, parcurgem, în continuare,
cele 7 etape:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

323
Adrian MARINESCU

II. Definirea coloanelor, în conformitate cu datele problemei


şi înlăturarea celor două zecimale (dacă este cazul).

Pentru ultima coloană (Sex) vom codifica cu 1 = elevii de


sex masculin şi respectiv cu 2 = elevii de sex feminin.

324
Culegere de probleme rezolvate cu ajutorul programului SPSS

III. În dreptul coloanelor cu date lipsă activează opţiunea


MISSING, în cadrul căreia se menţionează valoarea
pe care programul trebuie să nu o ia în calcul
deoarece ea ţine locul unei valori lipsă (pentru
exerciţiul de faţă reamintim numerele pe care le-am
stabilit să înlocuiască valorile lipsă din tabel:
• 20 valorile lipsă din coloana „Vârstă”.
• 31 valoarea lipsă din coloana „Sport”.
• 31 valoarea lipsă din coloana „Statistică”.
Astfel, pentru coloana „Vârstă, paşii (pe care îi vom repeta
pentru toate coloanele cu valori lipsă) sunt:
a. Activarea MISSING.
b. Alegerea opţiunii DISCRETE MISSING VALUE
c. Înscrierea valorii adoptate.

B C A

325
Adrian MARINESCU

pentru coloana „Sport”:

şi în sfârşit, pentru coloana „Statistică”:

326
Culegere de probleme rezolvate cu ajutorul programului SPSS

IV. Revenirea în ecranul DATA VIEW şi inserarea


datelor, cu recomandarea unei atenţii sporite la
valoarea lipsă.

V. Declanşarea analizei parcurgând succesiv


ANALYSE – CORRELATE – BIVARIATE

327
Adrian MARINESCU

VI. În fereastra deschisă de opţiunea BIVARIATE:


1. Trecerea coloanelor în câmpul de variabile.
2. Activarea butonului OPTIONS şi definirea
opţiunii utilizatorului (pairwise sau listwise).
3. Activarea CONTINUE şi OK în fereastra care
reapare.
Alegerea uneia dintre opţiunile apărute, în urma activării
butonului OPTIONS, depinde de scopul urmărit de către
utilizator, astfel:
a. Se alege opţiunea Exclude cases listwise, în cazul în
care se doreşte ca analiza de corelaţie să cuprindă
numai cazurile pentru care există tot setul de informaţii
şi nu se admit valori lipsă.
b. Se alege opţiunea Exclude cases pairwise, în cazul în
care utilizatorul doreşte ca analiza de corelaţie să
cuprindă orice pereche de variabile.
Parcurgem cei 3 paşi prezentaţi anterior:
1. Trecerea coloanelor în câmpul de variabile.

328
Culegere de probleme rezolvate cu ajutorul programului SPSS

2. Activarea butonului OPTIONS şi definirea


opţiunii utilizatorului (pairwise sau listwise).

3. Activarea CONTINUE şi OK în fereastra care reapare.

329
Adrian MARINESCU

VII. Interpretarea output-ului.


Este de la sine înţeles că, în funcţie de opţiunea aleasă
anterior, va fi afişată şi forma output-ului. În cazul în care am ales
opţiunea Exclude cases pairwise:
Correlations

Vârstă Sport Statistică Sex


Vârstă Pearson Correlation 1 -,097 -,198 ,185
Sig. (2-tailed) ,629 ,323 ,347
N 28 27 27 28
Sport Pearson Correlation -,097 1 ,215 -,175
Sig. (2-tailed) ,629 ,272 ,363
N 27 29 28 29
Statistică Pearson Correlation -,198 ,215 1 -,104
Sig. (2-tailed) ,323 ,272 ,592
N 27 28 29 29
Sex Pearson Correlation ,185 -,175 -,104 1
Sig. (2-tailed) ,347 ,363 ,592
N 28 29 29 30

330
Culegere de probleme rezolvate cu ajutorul programului SPSS

Dacă urmărim diagonala a doua a datelor trecute în tabel


în dreptul rândului „N”(dreapta jos către stânga sus), se poate
verifica numărul total de înregistrări din coloana respectivă.
Astfel, în coloana „Vârstă” lipsesc două înregistrări din
totalul de 30 (vezi tabelul din datele problemei), în coloanele
„Sport” şi respectiv “Statistică” lipseşte câte o înregistrare, iar
ultima coloană („Sex”) are înregistrări, pentru toate cele 30 de
cazuri. Conform datelor calculate în dreptul etichetei
Sig. (2-tailed), pentru fiecare intersecţie dintre coloanele şi
respectiv rândurile output-ului, la nivelul 0,05, în nici un caz, nu
se înregistrează corelaţii semnificative.

331
Adrian MARINESCU

În cazul în care am ales opţiunea Exclude cases listwise:


Correlationsa

Vârstă Sport Statistică Sex


Vârstă Pearson Correlation 1 -,100 -,210 ,198
Sig. (2-tailed) ,626 ,303 ,332
Sport Pearson Correlation -,100 1 ,254 -,122
Sig. (2-tailed) ,626 ,210 ,554
Statistică Pearson Correlation -,210 ,254 1 -,084
Sig. (2-tailed) ,303 ,210 ,682
Sex Pearson Correlation ,198 -,122 -,084 1
Sig. (2-tailed) ,332 ,554 ,682
a. Listwise N=26

În urma excluderii tuturor cazurilor în care există


informaţii lipsă, rămân numai 26 de cazuri validate (această
informaţie se regăseşte în rândul de sub output: Listwise N=26).
În cazul „Valorilor lipsă”, raportarea nu diferă cu nimic
faţă de tipurile de raportări prezentate anterior.
Cu această ocazie, puteţi să parcurgeţi capitolele anterioare,
această activitate fiind un bun exerciţiu şi pentru memorie.
II. Să se determine existenţa coeficienţilor de corelaţie
între cifrele de afaceri pentru întreprinderile cu activitate
principală de servicii de piaţă, prestate în principal, pentru
populaţie înregistrate în perioada 2005-2007, pe unele activităţi
ale economiei naţionale şi în conformitate cu datele prezentate în
tabelul alăturat. Să se analizeze cele două ouput-uri rezultate în
urma utilizării opţiunilor pairwise şi respectiv listwise.
Formă de Cifră de afaceri (milioane lei)
Activitate
proprietate 2005 2006 2007
Hoteluri Stat 59 59 80
Hoteluri Privat 1934 2411 2844
Campinguri Stat - - -
Campinguri Privat 133 253 359

332
Culegere de probleme rezolvate cu ajutorul programului SPSS

Cifră de afaceri (milioane lei)


Formă de
Activitate
proprietate
2005 2006 2007

Restaurante Stat 11 11 8

Restaurante Privat 1817 2435 3195

Baruri Stat 11 3 2

Baruri Privat 1399 1987 2120

Agenţii de turism Stat 4 5 -

Agenţii de turism Privat 1247 1714 2255

Producţie filme Stat 13 14 12

Producţie filme Privat 389 395 473

Activităţi radio tv Stat 536 564 552

Activităţi radio tv Privat 1079 1364 1670

Artă şi spectacole Stat - - -

Artă şi spectacole Privat 203 249 281

Activităţi sportive Stat 704 945 1115

Activităţi sportive Privat 1153 1894 2773

Sursa: Anuarul Statistic al României 2008, pag. 696.

333
Adrian MARINESCU

Pentru rezolvarea problemei, vom parcurge, în continuare,


etapele prezentate anterior:
I. Accesarea programului şi trecerea în ecranul
VARIABLE VIEW.

II. Definirea coloanelor, în conformitate cu datele


problemei şi înlăturarea celor două zecimale (dacă
este cazul).
În cazul de faţă vom parcurge paşii:
a. Definirea coloanei „Activităţi” şi codificarea
acestora cu 1,2,3,…

334
Culegere de probleme rezolvate cu ajutorul programului SPSS

b. Definirea coloanei „Formă” şi codificarea cu 1 şi 2

c. Definirea coloanelor ce indică cifra de afaceri anuală ep


fiecare an în parte (atenţie: tastăm fără pauză anul şi numărul lui):

335
Adrian MARINESCU

III. În dreptul coloanelor cu date lipsă activează opţiunea


MISSING, în cadrul căreia se menţionează valoarea
pe care programul trebuie să nu o ia în calcul
deoarece ea ţine locul unei valori lipsă. Datorită
valorilor extrem de diferite din problema de faţă,
pentru toate coloanele aflate în această situaţie, vom
înlocui cu 100 valorile lipsă.
Astfel, pentru coloana „Anul2005”vom parcurge următorii
paşi (pe care îi vom repeta pentru toate coloanele cu valori lipsă:
a. Activarea MISSING.
b. Alegerea opţiunii DISCRETE MISSING VALUE
c. Înscrierea valorii adoptate.

B C A

336
Culegere de probleme rezolvate cu ajutorul programului SPSS

pentru coloana „Anul 2006”:

şi în sfârşit, pentru coloana „Anul 2007”:

337
Adrian MARINESCU

IV. Revenirea în ecranul DATA VIEW şi inserarea


datelor, cu recomandarea unei atenţii sporite la
valoarea lipsă.

V. Declanşarea analizei parcurgând succesiv ANALYSE


– CORRELATE – BIVARIATE

338
Culegere de probleme rezolvate cu ajutorul programului SPSS

VI. În fereastra deschisă de opţiunea BIVARIATE:


1. Trecerea coloanelor în câmpul de variabile.

2. Activarea butonului OPTIONS şi definirea opţiunii


utilizatorului
3. Activarea CONTINUE şi OK.
a. Exclude cases listwise

339
Adrian MARINESCU

b. Exclude cases pairwise

VII. Interpretarea output-ului.


a. În cazul activării opţiunii Exclude cases pairwise
(reamintim că această opţiune se activează în cazul în care
utilizatorul doreşte ca analiza de corelaţie să cuprindă orice
pereche de variabile).
Correlations

Activitate Formă Anul2005 Anul2006 Anul2007


Activitate Pearson Correlation 1 ,000 -,067 -,032 ,001
Sig. (2-tailed) 1,000 ,806 ,907 ,999
N 18 18 16 16 15
Formă Pearson Correlation ,000 1 ,641** ,656** ,638*
Sig. (2-tailed) 1,000 ,007 ,006 ,010
N 18 18 16 16 15
Anul2005 Pearson Correlation -,067 ,641** 1 ,991** ,970**
Sig. (2-tailed) ,806 ,007 ,000 ,000
N 16 16 16 16 15
Anul2006 Pearson Correlation -,032 ,656** ,991** 1 ,990**
Sig. (2-tailed) ,907 ,006 ,000 ,000
N 16 16 16 16 15
Anul2007 Pearson Correlation ,001 ,638* ,970** ,990** 1
Sig. (2-tailed) ,999 ,010 ,000 ,000
N 15 15 15 15 15
**. Correlation is significant at the 0.01 level (2-tailed).
*. Correlation is significant at the 0.05 level (2-tailed).

340
Culegere de probleme rezolvate cu ajutorul programului SPSS

În diagonala a doua (dreapta jos – stânga sus) verificăm


datele validate din tabel şi constatăm existenţa unor factori de
corelaţie la nivelul de o,o1 şi respectiv 0,05.
b. În cazul activării opţiunii Exclude cases listwise
Chiar dacă am schimbat opţiunea de analiză (reamintim că
opţiunea Excluse cases listwise se utilizează când se doreşte ca
analiza de corelaţie să cuprindă numai cazurile pentru care există
tot setul de informaţii şi nu se admit valori lipsă) se constată
existenţă a două tipuri de corelaţii: una este semnificativă la un
nivel de 0,01, iar cea de-a doua, la un nivel de 0,05.
a
Correlations

Activitate Formă Anul2005 Anul2006 Anul2007


Activitate Pearson Correlatio 1 ,000 -,069 -,033 ,001
Sig. (2-tailed) 1,000 ,807 ,907 ,999
Formă Pearson Correlatio ,000 1 ,611* ,629* ,638*
Sig. (2-tailed) 1,000 ,015 ,012 ,010
Anul2005 Pearson Correlatio -,069 ,611* 1 ,991** ,970**
Sig. (2-tailed) ,807 ,015 ,000 ,000
Anul2006 Pearson Correlatio -,033 ,629* ,991** 1 ,990**
Sig. (2-tailed) ,907 ,012 ,000 ,000
Anul2007 Pearson Correlatio ,001 ,638* ,970** ,990** 1
Sig. (2-tailed) ,999 ,010 ,000 ,000
*. Correlation is significant at the 0.05 level (2-tailed).
**. Correlation is significant at the 0.01 level (2-tailed).
a. Listwise N=15

2.15.4. Probleme propuse


I. Să se determine existenţa coeficienţilor de corelaţie
între cifrele de afaceri pentru întreprinderile cu activitate
principală de servicii de piaţă, prestate în principal, pentru
populaţie înregistrate în perioada 2005-2007, pe activităţi din
domeniul transporturilor şi în conformitate cu datele

341
Adrian MARINESCU

prezentate în tabelul alăturat. Să se analizeze cele două


ouput-uri rezultate în urma utilizării opţiunilor pairwise şi
respectiv listwise.

Cifră de afaceri (milioane lei)


Formă de
Tip de transport
proprietate
2005 2006 2007

Căi ferate Stat 2635 2680 2776


Căi ferate Privat 1071 1205 1739
Terestre Stat 621 667 685
Terestre Privat 10270 13459 16188
Conducte Stat 1046 1181 1314
Conducte Privat - - -
Apă Stat 8 2 2
Apă Privat 579 644 813
Aeriene Stat 820 844 891
Aeriene Privat 361 561 1116
Activităţi anexe Stat 2339 2395 2454
Activităţi anexe Privat 4196 5252 5976
Poştă Stat 715 815 1043
Poştă Privat 277 361 687
Telecomunicaţii Stat 317 350 403
Telecomunicaţii Privat 12130 14834 16519

Sursa: Anuarul Statistic al României 2008, pag. 697

342
Culegere de probleme rezolvate cu ajutorul programului SPSS

II. Să se determine existenţa unor coeficienţi de


corelaţie între diverse tipuri de organizaţii ale administraţiei
private din perioada 2002-2007. Să se analizeze cele două
ouput-uri rezultate în urma utilizării opţiunilor pairwise şi
respectiv listwise.
Număr
Organizaţie
2002 2003 2004 2005 2006 2007
Sindicate 6065 - 6852 7338 8034 8224
Partide, 118 54 - 54 54 54
formaţiuni
Uniuni 1533 1748 1816 2750 3724 -
profesionale
Fundaţii, 33052 32888 32595 - 57350 62101
asociaţii
Religioase - 15651 16201 16787 18377 18886
Sursa: Anuarul Statistic al României 2008, pag. 699
III. Să se determine existenţa unor coeficienţi de
corelaţie între două forme de organizare a întreprinzătorilor
privaţi şi numărul acestora din perioada 2005-2007. Să se
analizeze cele două ouput-uri rezultate în urma utilizării
opţiunilor pairwise şi respectiv listwise.
Număr
Activitate Organizare
2005 2006 2007
Industrie Asociaţii familiale 36038 28537 28367
Industrie Persoane independente 51349 45846 47262
Comerţ Asociaţii familiale 58425 46264 45989
Comerţ Persoane independente 16722 17700 18247

343
Adrian MARINESCU

Număr
Activitate Organizare
2005 2006 2007
Hoteluri, Persoane independente 1372 1677 1729
restaurante
Turism Asociaţii familiale 643 509 506
Turism Persoane independente 450 421 434
Transport Asociaţii familiale 5492 4349 4323
Transport Persoane independente 54741 46920 48368
Alte servicii Asociaţii familiale 37850 29971 29793
Alte servicii Persoane independente 109810 95715 98670
Sursa: Anuarul Statistic al României 2008, pag. 698

BIBLIOGRAFIE

1. Howitt D, Cramer D. Introducere în SPSS pentru psihologie:


versiunile SPSS 10,11,12 şi 13, Iaşi,
Editura Polirom, 2006
2. Popa M. Statistică psihologică- cu aplicaţii SPSS
– Bucureşti, Editura Universităţii din
Bucureşti, 2004
3*** Dicţionarul explicativ al Limbii
Române, Bucureşti, Editura Univers
Enciclopedic, 1998
4*** Anuarul statistic al României 2008,
Bucureşti, Institutul Naţional de
Statistică, 2008

344
Culegere de probleme rezolvate cu ajutorul programului SPSS

CUPRINS

Cuv ânt î n a i nt e . .... ... ... . .... ... ... ... ... ... .... ... ... ... ... ... .... ... ... .. 3
1. Prezentarea principalelor elemente ale
programului SPSS ..............................................................5
1.1. Generalităţi ................................................................... 5
1.2. Accesarea programului SPSS ....................................... 6
1.3. Definirea coloanelor tabelului ...................................... 8
1.4. Elemente de bază în analiza SPSS (recapitulare) ............ 23
1.5. Prezentarea rezultatelor (recapitulare) ........................ 25
2. Tipuri de probleme rezolvate ......................................... 30
2.1. Tabele de frecvenţă .................................................... 30
2.2. Calculul mediei, medianei şi a modulului ................. 46
2.3. Calculul abaterii standard ........................................... 60
2.4. Analiza relaţiei dintre 2 – n variabile ......................... 76
2.5. Coeficienţi de corelaţie ............................................. 110
2.6. Regresia .................................................................... 151
2.7. Eşantionarea .............................................................. 179
2.8. Selectarea cazurilor ................................................... 192
2.9. Eroarea standard ....................................................... 209
2.10. Testul t pentru eşantioane corelate ........................ 222
2.11. Testul t pentru eşantioane necorelate ..................... 238
2.12. Testul chi-square .................................................... 259
2.13. TESTUL WILCOXON (date corelate) ................... 283
2.14. Testul U Mann-Whitney ......................................... 300
2.15. Valorile lipsă ........................................................... 319
BIBLIOGRAFIE .............................................................. 342

345