Documente Academic
Documente Profesional
Documente Cultură
CURSUL
MODULUL 1
PROGRAMUL DE ANALIZ STATISTIC SPSS, PREZENTARE
GENERAL
STATISTICI DESCRIPTIVE CU SPSS
Titular curs:
Conf. univ. dr. Marian POPA
Email: popamarian@gmail.com
Not:
2/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Cuprins:
3/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
SPSS for Windows este un pachet de programe destinat analizei statistice a datelor.
Dei exist o varietate de programe de acest gen (SAS, Statistica for Windows, GraphPad, MS
Excel, care are i el funcii statistice), SPSS se distinge prin structurarea riguroas i uurina
utilizrii, chiar i pentru nceptori.
Cea mai recent versiune disponibil la aceast dat este SPSS 15.0, dar acest manual nu
acoper n mod special o anumit versiune, ci face referire n general la versiunile de SPSS sub
Windows. De altfel, toate versiunile sub Windows, ncepnd cu SPSS v.5, prezint similitudini
majore, diferenele fiind neeseniale. Toate versiunile SPSS sub Windows ofer acelai pachet de
funcii statistice de baz, iar diferenele, chiar dac sunt, nu sunt relevante la nivelul unui curs
introductiv de statistic.
L Acest simbol plasat naintea unei propoziii indic introducerea unei informaii
importante, care se impune a fi reinut.
L Ne vom axa pe o prezentare sintetic, axat pe esenial, considernd cunoscute
elementele de baz de operare n mediul Windows.
4/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
L O sesiune de lucru cu SPSS presupune, n mod necesar, existena unei baze de date.
L SPSS opereaz cu o singur baz de date la un moment dat. De la versiunea 14, SPSS
poate deschide simultan mai multe baze de date.
L Pentru a deschide o alt baz de date, sau pentru a crea una nou, cea aflat n lucru va fi
nchis. Programul solicit salvarea ei prealabil, dac acest lucru nu a fost deja efectuat.
L Dac vrem s prelucrm date aflate n baze de date (fiiere) diferite, este necesar
aducerea lor n aceeai baz de date (procedura DATA-Merge files, care va fi descris mai
trziu).
L Meniurile ferestrei Data Editor nu se vor activa integral dect atunci cnd va exista cel
puin o variabil definit i valori pentru cel puin un caz.
L Baza de date SPSS poate fi creat direct, cu ajutorul structurii (ferestrei) Data Editor, sau
poate fi deschis cu ajutorul comenzii File-Open, aa cum vom exemplifica mai trziu.
L Fiierele cu baze de date SPSS au extensia .sav.
5/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
SPSS permite, n afara operrii prin intermediul meniurilor, i lucrul direct cu proceduri
definite de utilizator. Aceasta se face n interiorul unei ferestre speciale care permite, pe de o
parte, editarea procedurilor, iar pe de alt parte, lansarea lor n execuie.
Imaginea de mai jos red comenzile SPSS pentru calcularea procedurii de calcul a
indicatorilor statistici descriptivi, redai mai sus, n fereastra SPSS Viewer.
Meniurile de tip list se aseamn cu meniurile altor programe sub Windows. Fr a intra
n amnunte, iat o descriere succint a meniurilor pentru fereastra DATA EDITOR:
6/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Casetele de dialog sunt formulare grafice care permit declararea i setarea procedurilor de
calcul cu SPSS. Acestea se deschid dup lansarea n execuie a unei comenzi din meniu. Uneori,
caseta principal, care se deschide direct din meniu, are comenzi de deschidere a uneia sau mai
multor casete secundare. Odat deschis o caset secundar, revenirea la caseta principal se
poate face numai prin finalizarea i nchiderea casetei secundare.
Dei sunt diferite de la o procedura la alta, casetele de dialog au o concepie comun.
Redm mai jos, spre exemplificare, caseta principal Descriptives i caseta secundar
Descriptives: Options, care sunt activate din meniul Statistics-Summarize-Descriptives...
Butoane de comenzi:
OK: Ruleaz procedura i nchide caseta de dialog principal.
Paste: Copie comenzile procedurii ntr-o fereastr Syntax, de unde poate fi editat i lansat
direct. Recomandat pentru situaiile n care dorim s modificm manual procedura (necesit
cunotine avansate).
Reset: Reseteaz caseta de dialog, aducnd-o la setrile implicite de sistem, fr s pstreze nici o
setare anterioar. Recomandat atunci cnd dorim restructurarea complet a unei proceduri
anterior executat din acea caset.
Cancel: Anuleaz setrile efectuate dup deschiderea casetei.
Help: Informaii de ajutor contextuale pentru procedura definit de caseta respectiv.
7/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Opiuni:
(a) Introducerea direct a datelor n DATA EDITOR
1 Introducerea datelor (b) Deschiderea unui fiier de date SPSS (extensia .sav)
(c) Importarea unui fiier de format diferit (se alege din caseta
File open/File of type)
Corecia erorilor, selecii, recodificri, transformarea variabilelor
2 Pregtirea datelor prin calcule, declararea valorilor lips, combinarea datelor din
dou fiiere diferite (meniurile Data, Transform)
Selectarea procedurii
3 Meniurile Statistics (sau Analyze) i Graphs
satistice
Selectarea variabilelor
n conformitate cu configuraia casetei de dialog care este afiat
4 ce urmeaz a fi supuse
la fiecare procedura
prelucrrii
Se acioneaz butonul OK din caseta de dialog a procedurii
5 Rularea procedurii L Butonul devine activ numai atunci cnd sunt ntrunite
condiiile presupuse de procedura respectiv
Rezultatele prelucrrilor sunt afiate ntr-o fereastr specific
6 Analiza rezultatelor (SPSS Viewer), cu funciuni de editare grafic sau de tip text, n
funcie de versiune.
Se editeaz rezultatele afiate n Viewer, aducndu-le la forma
dorit sub aspect grafic
7 Editarea rezultatelor
L Dublu clic pe un element din Viewer conduce la intrarea
elementului respectiv n regim de editare)
Inserarea datelor ntr-un Rezultatele din SPSS Viewer se preiau cu Select/Copy i se
8
document depun cu Paste n orice tip de editor de documente.
L SPSS este un program puternic de analiz statistic a datelor. Utilizarea lui optim presupune,
n mod necesar, stpnirea de ctre operator a cunotinelor teoretice de statistic.
L Aa cum un program de editare grafic nu compenseaz lipsa de talent la desen, nici SPSS nu
poate fi cu adevrat exploatat de ctre cei care nu au cunotine de statistic. n lipsa acestora,
nici alegerea procedurilor i nici interpretarea rezultatelor nu va fi cu adevrat posibil.
8/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
3. Editarea datelor
O baz de date n SPSS este o structur format din linii i coloane, la intersecia crora
se formeaz celulele care conin, fiecare, o anumit unitate de informaie.
L Existena unei baze de date deschis n fereastra Data Editor este o condiie obligatorie
pentru operarea cu SPSS.
L SPSS opereaz numai cu o singur baz de date deschis la un moment dat.
n linii generale, pentru crearea unei baze de date proprii n SPSS, se procedeaz astfel:
Se lanseaz SPSS
Se definesc variabilele bazei de date n domeniul Data Editor
Se introduc datele pentru fiecare caz (subiect) n parte
Se salveaz baza de date (extensia specific este .sav)
Definirea variabilelor
9/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
L n versiunile mai recente de SPSS editarea variabilei nu presupune acest tip de caset,
dar toatele elementele ei constitutive se regsesc.
Numele variabilei:
Orice variabil SPSS trebuie s aib un nume. Cele mai importante aspecte legate de
denumirea variabilelor sunt urmtoarele:
L Trebuie sa fie format din minim 1, maxim 8 caractere, primul caracter fiind o liter.
L Nu sunt suportate caractere speciale cum ar fi spaiu sau semne de punctuaie.
Caractere ca $, @, # sau _ pot fi utilizate n interiorul numelui de variabil. De exemplu,
a_#_$1 este un nume valid.
L Terminarea numelui cu caracterul _ va fi evitat, deoarece poate da conflict cu
variabilele create automat de SPSS, i care au aceast terminaie.
L Terminarea numelui cu semnul . va fi evitat, deoarece punctul este terminatorul uzual al
comenzilor SPSS, ceea ce poate conduce la erori.
L n cazul utilizrii unor caractere improprii, apare un mesaj de eroare i se permite
corectarea numelui.
L Alegerea numelui este la latitudinea operatorului. Respectarea anumitor convenii poate fi
ns extrem de util, mai ales dac avem de a face cu o baza de date cu multe variabile.
Iat cteva recomandri utile n acest sens (ele nu sunt obligatorii):
Numele s exprime, pe ct posibil, coninutul variabilei
Pentru variabile nrudite, se va utiliza o schem de denumire care s
exprime acest lucru. De exemplu, dac avem variabile care cuprind
10/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Aa cum se observ n caseta Define Variable Type din imaginea de mai sus, SPSS poate
opera cu o varietate de tipuri de variabile. Fiecrui tip i corespund anumite proprieti
(caracteristici) care trebuie definite de operator. Cele mai uzuale sunt tipurile:
11/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
[Caracter] (String), care cuprind valori exprimate sub form de caractere alfanumerice (litere sau
chiar cifre).
Proprieti
numrul de caractere rezervat, care este fixat implicit la 8 dar poate fi
modificat dup dorin.
L SPSS face distincie ntre variabile de tip caracter scurte (Short string) i lungi (Long
string). Primele au maxim 8 caractere i pot fi incluse n unele proceduri statistice
(semnificaia diferenei ntre medii, de exemplu), pe cnd celelalte nu pot fi utilizate dect n
operaii de listare (cazul variabilei de genul nume, de ex.).
L Dei permis, utilizarea variabilelor string nu este de preferat. Toate variabilele care
suport codificri vor fi, de preferin, introduse cu valori numerice, deoarece utilizarea
acestora n proceduri statistice nu este limitat de nici o restricie.
Uniti de timp calendaristic sau orar [Date], care pot include valori de timp ntr-un format
specificat, aa cum se vede n imagine.
Proprieti
formatul de introducere, care poate fi unul din cele evideniate n caseta
Define Variable Type/Date
Exemplu: dd-mmm-yyyy presupune introducerea unor valori de genul 21-FEB-2001
(luna fiind scris obligatoriu dup prescurtarea ei n englez).
Exist o mare varietate de formate pentru acest tip de variabil, acoperind, practic, orice
cerin posibil din partea utilizatorului.
Nu vom prezenta i celelalte tipuri de variabile, ele fiind mai puin folosite, dar facem
precizarea c semnificaia lor poate fi gsit n Help-ul casetei Define Variable Type.
L Tipul unei variabile poate fi schimbat ulterior prin simpla redefinire a acesteia. Se va
acorda atenie mesajelor care pot s apar i care avertizeaz asupra eventualelor
pierderi de informaie prin schimbarea tipului variabilei.
L Opiunile din zona Measurement (Scale, Ordinal, Nominal), care se regsesc doar la
versiuni SPSS de la 7.0 n sus, nu au ntotdeauna o utilitate practic, dar marcarea lor
corect este necesar pentru anumite proceduri statistice sau grafice.
12/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
L Dei nimic nu ne oblig s aplicm etichete variabilelor i valorilor, este foarte recomandabil
ca ele s fie atribuite.
L Etichetele ajut la citirea mai uoar a rezultatelor (deoarece apar alturi de acestea). n plus,
etichetele sunt asociate prelucrrilor grafice (histograme, bare, etc.) fapt care reduce
necesitatea de a le introduce ulterior prin editarea respectivelor grafice.
L Pentru a ti cum s declarm etichetele este bine s ni le imaginm ca fiind nscrise pe axele
de referin ale unui grafic. Dac se potrivesc, atunci au fost bine definite.
L Oricum, ele vor putea fi modificate ulterior sau editate direct n SPSS Viewer.
Pentru declararea valorilor lips se acioneaz butonul Missing Values din caseta Define
Variables, care genereaz apariia casetei de dialog alturate.
13/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
L Dei nu pare foarte evident acum, utilitatea funciei de declarare a valorilor lips nu
trebuie subestimat. Foarte adesea suntem nevoii s scoatem din prelucrri anumite
valori (care nu pot fi totui, pur i simplu, terse). S ne gndim numai la valorile extreme
ale unei distribuii, a cror meninere n anumite prelucrri poate determina modifcri
semnificative a rezultatelor.
tergerea unei variabile se face prin selectarea acesteia (clic pe capul de variabil) i
acionarea tastei Delete (sau se comand din meniul Edit-Cut).
Inserarea unei variabile se face prin plasarea cursorului-celul pe coloana variabilei n
stnga creia dorim s inserm noua variabil (sau prin selectarea variabilei respective),
dup care se comand, din meniul Data-Insert variable. Dup aceasta, se definete
variabila inserat (nume, tip, etichete).
tergerea cazurilor se face n mod similar variabilelor, prin selectarea acestora (clic pe
capul de linie) i tasta Delete (sau Edit-Cut). Se pot selecta mai multe cazuri simultan
(drag cu mouse-ul pe capul liniilor) dup care se terg ca mai sus.
Inserarea cazurilor se face dup plasarea cursorului pe linia deasupra creia dorim s
inserm un nou caz, dup care se acioneaz n meniul Data-Insert case.
14/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
L Pentru versiunile de SPSS de la 7 n sus, clic dreapta pe capul de coloan sau de linie,
produce un meniu contextual care permite un acces mai rapid la funciile de
inserare/tergere a variabilelor sau cazurilor.
L SPSS nu permite Undo (n meniul Edit) dect limitat la ultima aciune. Din acest motiv,
tergerea variabilelor sau a cazurilor trebuie s se fac cu atenie, pentru c datele pot fi
definitiv pierdute. Se va reine, totui, c baza de date se actualizeaz pe hard disk numai
dup salvarea comandat de utilizator. Ca urmare...
L Orice modificare efectuat nu produce efecte dect asupra datelor din memoria de lucru,
fiierul rmnnd nemodificat.
L n cazul unei aciuni care produce efecte nedorite asupra bazei de date, exist soluia
nchiderii bazei de date, fr a se accepta salvarea cerut de program, dup care se
deschide fiierul respectiv din nou.
- Apariia unor cazuri inutile, (umplute cu system missing values) la sfritul unei baze
de date.
Explicaie: Introducerea inutil a unei valori ntr-o variabil, valoare care apoi este
tears. Cu toate acestea, SPSS a creat deja un caz nou, pe care l-a umplut cu system missing
values.
Soluie: Selectarea cazului prin apsarea pe capul de linie i acionarea tastei Delete (sau
Edit-Cut).
- Apariia unor variabile inutile (nedorite).
Explicaie: La introducerea din greeal a unei valori ntr-o variabil nedefinit n
prealabil, SPSS creeaz automat o variabil implicit, pe care o denumete VAR00001.
Soluie: Se selecteaz variabil respectiv (clic de mouse pe capul de coloan) i se
acioneaz tasta Delete (sau Edit-Cut).
15/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
privire la aceiai
subieci)
Sexul SEX Numeric, Width 1, Decimal Sex 1=feminin
Places 0 2=masculin
Vrsta (n ani VIRSTA Numeric, Width 2, Decimal Vrsta
mplinii; sau n Places 0
luni dac dorim (presupunem c nu avem
mai mult precizie) subeici cu vrsta peste 99 de
ani)
Extraversiune EXTRAV Numeric, Width 2, Decimal Extraversiune
Places 0
(nu se poate obine o valoare
mai mare de 100 i nu exist
zecimale)
Nevrozism NEVRO Numeric, Width 2, Decimal Nevrozism
Places 0
(nu se poate obine o valoare
mai mare de 100 i nu exist
zecimale)
Lie LIE Numeric, Width 1, Decimal Minciun
Places 0
(nu se poate obine o valoare
mai mare de 9 i nu exist
zecimale)
Dei am scris aici numele de variabile cu litere mari, n SPSS se scriu cu litere mici,
majusculele nefiind recunoscute n numele de variabile. Se observ faptul c pentru variabile ale
cror nume exprim exact coninutul (SEX, VIRSTA) se poate utiliza fr nici un inconvenient
numele i ca etichet. Pentru a fi mai explicii, s spunem c numele variablei este util n primul
rnd SPSS-ului pentru a manipula variabilele, n timp ce etichetele sunt necesare mai ales
utilizatorului pentru a nelege cu uurin la ce se refer o variabil al crui nume prea scurt.
Avem alturat imaginea DATA EDITOR pentru primii trei subieci introdui cu
variabilele de mai sus:
16/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
a fiecrei nregistrri este suficient (i absolut necesar), scutind un mare volum de munc
pe care l-ar implica introducerea numelor. Vom avea grij ns, ca pe documentul original s
scriem codul numeric aferent fiecrui subiect, astfel nct, la nevoie, s se poat identifica
numele (pentru corecii, de ex.)
L Variabile multiple pentru ntrebri cu rspuns multiplu: De obicei, o ntrebare prezint un
singur rspuns, dar pot fi situaii n care o ntrebare prezint rspunsuri multiple care pot fi
alese n acelai timp. De exemplu: Ce activiti preferai pentru timpul liber? 1. sport; 2.
filme; 3. petreceri cu prieteni..., etc. ntr-un asemenea caz ne putem atepta s avem mai
multe rspunsuri la aceeai ntrebare. Soluia pentru introducerea datelor este, de aceea,
crearea mai multor variabile, cte una pentru fiecare variant de rspuns. Astfel, vom avea
variabila SPORT care poate primi dou valori, sa zicem 1 dac este aleas i 0 dac nu
este aleas, i aa mai departe. n acest mod vom putea analiza frecvena alegerilor pentru
fiecare variant de rspuns n parte.
L Evitarea variabilelor redundante: Dac la un test nu sunt posibile, de exemplu, dect
rspunsuri corecte sau greite, atunci nu este necesar s declarm o variabil pentru corecte
i una pentru greite dac suma lor d totalul rspunsurilor.
O baz de date aflat n lucru nu are un corespondent ntr-un fiier dect dup ce se
execut o salvare a acesteia. Acest lucru nu trebuie niciodat uitat. Spre deosebire de WORD de
exemplu, SPSS nu are o funcie de salvare automat dup un interval de timp prestabilit. Cu alte
cuvinte, indiferent ce modificri facem n Data Editor pe ecran, datele respective vor fi salvate
numai la comanda explicit a operatorului.
Pentru o baz de date nou creat, salvarea se face n mod similar cu orice alt program
cunoscut: File-Save as, care deschide urmtoarea caset de dialog:
Se alege locaia de salvare (Save in)
Se d un nume fiierului (File name)
Se verific tipul de fiier (formatul implicit pentru baze de date SPSS are extensia .sav)
Se acioneaz Save
L SPSS poate salva i n alte formate, dintre cele mai importante fiind: Dbase sau
FoxPro, Lotus 1-2-3, Excel. Salvarea n aceste formate poate fi util pentru transferul
datelor pentru prelucrri ulterioare n alte programe.
17/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
L n cazul deschiderii unui fiier de alt tip dect SPSS, se va alege tipul respectiv din
lista Files of type. n cazul n care SPSS nu recunoate tipul de fiier n care se afl
datele noastre, putem ncerca transformarea lor prealabil din formatul original ntr-
un format recunoscut de SPSS. Dei exist riscul pierderii unor aspecte ce in de
formatul de reprezentare a datelor, operaiunea scutete totui un mare volum de
munc.
18/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Dac privim variabilele SPSS din punctul de vedere al modului n care au fost create,
putem distinge dou categorii:
4 variabile primare care includ valori rezultate direct din cercetare si care au fost introduse,
de regul, de la tastatur;
5 variabile secundare rezultate prin transformrile aplicate variabilelor primare.
Se utilizeaz atunci cnd dorim s obinem o variabil prin adunarea valorilor din dou
sau mai multe variabile. Imaginea de mai jos prezint o tabel de date SPSS care cuprinde
scorurile la trei examene pariale (scor_1, scor_2 si scor_3). Dorim s realizm o variabil care s
cuprind un scor general, prin nsumarea celor trei variabile. Se poate observa c unii dintre
subieci nu au valori la toate cele trei scoruri (valori lips de sistem).
19/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Deoarece, prin calculare, o nou variabil este plasat dup toate variabilele existente, am
preferat s inserm o nou variabil imediat dup cele trei pe care dorim s le nsumm. n acest
fel avem i posibilitatea s controlm uor corectitudinea operaiei de nsumare
Se apeleaz procedura Transform-Compute, care deschide caseta de mai jos:
3. Se apas butonul OK
4. Deoarece variabila total exist, SPSS ne ntreab dac dorim s modificm coninutul
acesteia. Dac nu ar exista o variabil cu acest nume, rezultatul operaiei de calcul ar fi
depus ntr-o variabil creat automat i amplasat dup ultima variabil din baza de date.
20/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Rspundem OK, deoarece tim c Rezultatul operaiei se vede n imaginea de mai jos:
am creat aceast variabil tocmai
pentru a depune n ea suma.
Presupunnd c n loc de sum ne-ar interesa media valorilor de la mai multe variabile, se
procedeaz n mod similar. Expresia de calcul a mediei este MEAN (expresie_numeric,
expresie_numeric, ...), unde ... arat c putem pune oricte variabile (sau valori) numerice, cu
virgul ntre ele. Ca i n cazul sumei, se poate realiza o expresie cu clauza TO, cu condiia ca
variabilele pentru care se realizeaz media s se afle una dup alta n tabela SPSS.
Reamintim c funcia MEAN poate fi scris de la tastatur sau poate fi adus din lista de
funcii, prin selectare i acionarea butonului .
Este de la sine neles c expresia de calcul poate fi realizat i ntr-o manier direct, fr
utilizarea funciei MEAN, astfel: (scor_1+scor_2+scor_3)/3
6 Se va face o distincie clar ntre suma sau media astfel obinute, care se refer la suma sau
media valorilor de la mai multe variabile, pentru acelai subiect, i suma sau media pe care
am calcula-o pe vertical, la nivelul fiecrei variabile n parte, pe ntreaga distribuie de
valori, pentru toi subiecii.
7 Se pot realiza diverse alte funcii de transformare, utilizndu-se marea varietate de funcii
care se gsesc n lista Functions, i a cror semnificaie se poate afl din Help-ul casetei
Compute.
21/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
SPSS ofer funcii de transformare cu variabilele de tip cronologic. Dintre acestea vom
exemplifica cu realizarea unei variabile care s conin anul naterii, extras dintr-o variabil care
conine data naterii. Imaginea de mai jos este extras din baza de date Employee data.sav (care
se gsete n folderul de instalare al SPSS, n C: Program Files)
Observm c exist] variabila bdate, care conine data naterii. Pentru a avea vrsta,
trebuie s calculm diferena dintre anul curent (s zicem, 2000)1 i anul naterii: Pentru aceasta
trebuie s facem diferena dintre anul curent (2000) i anul naterii, care se afl n cmpul bdate.
Pentru a avea variabila ce urmeaz a fi creat n apropierea variabilei bdate, vom insera o
variabil (denumind-o virsta, de tip numeric, cu doi ntregi). Apoi utilizm procedura Compute
din meniul Transform:
1
Anul n care a fost scris acest exemplu.
22/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Se face diferena dintre valoarea cea mai mare i valoarea cea mai mic a unei distribuii
Se mparte valoarea obinut la mrimea posibil (estimat) a intervalului
Se selecteaz mrimea intervalului care conduce la un numr de clase cuprins ntre 5 i
15
Se determin limita inferioar a primului interval (trebuie s fie un multiplu al mrimii
intervalului)
Se determin limita superioar a primului interval
Se construiesc intervalele de clas pentru fiecare interval, fiind ateni s avem clase
suprapuse sau intervale neacoperite
n principiu, dei este recomandabil obinerea unei grupri de frecvene pe 5-15 clase, se
poate opta pentru un numr de clase care servete cel mai bine interesul de cercetare. De
exemplu, n cazul unei distribuii de vrst exprimat n ani, este preferabil s se opteze pentru
clase de cinci sau zece ani, acestea avnd i o anumit semnificaie psihologic.
23/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
anumite valori convenionale pentru categorii de virsta. Pentru aceasta putem efectua
recodificarea variabilei virsta pentru a obine o distribuie grupat de frecvene, astfel:
Se lanseaz procedura Recode - Into Defferent Variables din meniul Transform:
Atenie, se poate alege i opiune Into Same Variables, dar nu este recomandabil
deoarece, n cazul unei erori, nu mai avem la dispoziie variabila iniial pentru o nou
recodificare.
Dei relativ complicat, caseta de declarare a noilor valori n funcie de cele vechi este
uor de neles.
24/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
n zona Old value, se alege una dintre variantele de definire a valorilor de la care se
pleac. S zicem c am ales soluia s recodificm anii pe intervale de zece ani, primul interval
fiind 29-39, al doilea 40-49, .a.m.d.
Pentru aceasta activm opiunea Range i scriem valorile limite al intervalului dorit.
Dup aceasta, n zona New value oValue scriem care este valoarea convenional pe care
o atribuim acestei clase.
n fine, acionm butonul Add pentru a definitiva operaiunea i trecem la definirea
urmtoarei clase, pn terminm.
n zona OldNew se poate observa lista recodificrilor definite.
Se acioneaz butonul Continue i, la revenirea n caseta anterioar, butonul OK.
Rezultatul operaiuni se vede mai jos:
Se observ corespondena dintre valoarea din variabila virsta, cu valoarea din variabila
v_clase. Pentru valoarea 71, avem missing value n variabila v_clase, deoarece nu am definit un
interval care s cuprind aceast vrst. De regul, aceast situaie este determinat de o eroare de
definire a intervalelor de clas. Pentru a o repara, ar trebui s intrm din nou n procedura Recode
i s redefinim clasele. Atenie, la declararea intervalelor de grupare n clase sau categorii, trebuie
avut grij ca intervalele s nu se suprapun i s nu aib distane ntre ele!
Transformarea operat pe variabila virst nu este de loc inutil. Dac am fi dorit s
vedem n ce msur este o relaie ntre nivelul salariului i vrst, ar fi fost oarecum impropriu
(fr a fi propriu-zis o greeal ) s utilizm o statistic parametric (corelaia). n analizele
statistice pe vrste este recomandabil, totui, s operm cu grupe de vrst.
25/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Variabila vizat (scor) este trecut n lista Variable(s), se seteaz modul de ordonare (am
ales atribuirea rangului 1 valorii celei mai mari) iar apoi am acionat butonul OK. Procedura
permite fixarea unor parametri de transformare cu ajutorul butoanelor Rank i Ties.
Caseta Rank Cases: Types, permite alegerea unui mod de atribuire a rangurilor. De
exemplu, bifnd Rank, se atribuie fiecrei valori chiar rangul ei. Pentru a afla ce efect au celelalte
opiuni, se poate face clic dreapta de mouse pe textul opiunii sau se apas butonul Help al
casetei.
Caseta Rank Cases: Ties, permite alegerea modului de atribuire a rangurilor pentru valori
egale. Astfel, piunea Mean, atribuie rangul mediu. De exemplu, pentru valorile 9, 11, 11, 11, 13,
valoarea 11 va primi rangul 3 (ca medie a rangurilor 2, 3 i 4). Celelalte opiuni vizeaz
atribuirea rangului cel mai mic (Low), al celui mai mare (High).
Procedura se finalizeaz prin crearea unei noi variabile, pe care SPSS o denumete
automat, care conine poziia de rang a fiecrei valori din variabila scor, n raport cu celelalte
valori ale distribuiei (n imagine, 250 are rangul 1, iar 119, rangul 6).
26/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Imaginea din caset descrie sortarea bazei de date, cresctor (Ascending), dup valorile
variabilei scor (rezultatul se vede n imaginea de mai jos).
Se poate efectua sortarea simultan dup mai multe variabile, fiecare n sensul dorit, de
exemplu: grup(Ascending) i scor(Descending).
8 Sortarea bazei de date (aranjarea ordonat dup valorile uneia sau mai multor
variabile) nu are nici un efect asupra rezultatelor obinute cu diversele proceduri de
analiz statistic.
9 Sortarea poate fi utilizat pentru scoaterea unor rapoarte (liste de cazuri) ale bazei de
date atunci cnd se dorete ca acestea s fie ordonate (alfabetic sau dup alte criterii).
27/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Baza de date SPSS poate fi mprit n subgrupuri, pentru analiza separat a fiecrui grup
n parte. Atunci cnd datele sunt organizate pe subgrupuri, orice procedur de analiz efectuat se
aplic automat separat pentru fiecare subgrup n parte, ca i cum ar fi mai multe baze de date
analizate n paralel.
Procedura este: Data-Split File iar caseta de dialog este cea de mai jos:
Opiunile sunt:
Analyze all cases, do not create groups (pentru analiza integral a datelor)
Compare groups (rezultatele vor fi afiate astfel nct s poat fi uor comparate)
Organize output by groups (rezultatele vor fi afiate n Viewer, separat pe grupuri)
10 Operaia Split File nu produce nici o modificare vizibil asupra bazei de date.
Singurul efect se vede n zona de afiare a rezultatelor, unde toate procedurile de
analiz vor fi afiate pentru fiecare subgrup n parte.
11 Pentru a se reveni la analiza intergral a datelor, se va reveni n procedura Split File
i se va seta opiunea Analyze all cases....
Selectarea unui set de date permite aplicarea procedurilor de analiz numai pe cazurile
selectate. Dac nu se opteaz pentru tergerea cazurilor neselectate, ele vor fi pstrate i vor putea
fi reintroduse n analiz dup anularea selectrii. Procedura este Data-Select Cases....
Pentru exemplificare, s ne propunem selectarea din baza de date din imaginea de mai sus
a cazurilor aparinnd grupului 1.
Imaginea prezint:
n partea stng, baza de date
La mijloc, caseta principal Select Cases care are:
o Zona listei de variabile
o Zona fixare a condiiilor de selectare Select, unde:
All cases este setarea implicit i nseamn c toate datele intr n
analiz;
If condition is satisfied, se bifeaz atunci cnd se dorete declararea unei
condiii de selectare bazat pe o funcie;
IF este butonul de deschidere a casetei pentru declararea condiiei, care
deschide caseta Select Cases: If. n cazul nostru, am trecut variabila grup
n zona de editare a funcie i am declarat-o egal cu 1. Astfel, toate
cazurile din baza de date care au grup=1 vor fi analizate, celelalte fiind
28/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Dup finalizarea operaiei de selectare de mai sus, baza de date se prezint n felul
urmtor:
Se observ:
Marcarea cu o diagonal a capului de linie corespunztor cazurilor neselectate
Apariia unei variabile de sistem filter_$ care conine valoarea 0 pentru cazurile
neselectate i valoarea 1 pentru cazurile selectate. Aceast variabil poate fi ulterior
utilizat n procedurile de analiz, ca variabil independent (caz n care se va anula
situaia de selectare, prin bifarea opiunii All cases).
Selectarea este utilizat n mod obinuit pentru alegerea temporar a unui set de date.
Adesea se uit anularea unei selectri existente atunci cnd se revine la analiza tuturor cazurilor.
Efectul este obinerea unor rezultate pe date pariale. Este recomandabil ca nainte de a trece la o
procedur de analiz s se verifice dac baza de date nu se afl sub efectul unei operaii de
selectare anterioar.
29/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Am trecut n lista Break Variable(s) variabila subject, adic variabila dup care se
grupeaz (agreg ) datele.
Am trecut n lista Aggregate variable(s) variabila score care urmeaz s fie recalculat
prin agregare. Se observ c va rezulta o nou variabil (score_1) egal cu media scorului
(MEAN(score)) fiecrui subiect pentru toate apariiile n baza de date.
ATENIE: n lista Aggregate variable(s) nu sunt acceptate dect variabile numerice.
Acesta este nc un motiv pentru a utiliza numai variabile de tip numeric la crearea bazelor de
date SPSS.
30/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Opiunile din zona inferioar a casetei permit alegerea unor funcii de agregare bazate pe
procentajul valorilor
Oricum, nu se poate alege dect o singur funcie de agregare, celelalte putnd fi folosite
doar pentru o agregare ulterioar.
Se apas Continue i se revine la caseta principal de dialog.
Aici trebuie aleas opiunea de a se crea un fiier nou (Create new data file), caz n care
procedura trimite rezultatul n fiierul AGGR.SAV sau ntr-un fiier denumit de noi prin apsarea
butonului , sau nlocuirea fiierului de lucru (Replace wrking data
file), caz n care vom avea pe ecran noul fiier rezultat prin agregare, opiune preferat de noi aici.
Se apas OK.
31/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Se deschid pe rnd cele dou baze de date i se sorteaz dup variabila cheie, comun
(care nu trebuie s aib valori duble n nici una dintre cele dou baze de date).
32/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Se deschide caseta Add Variables from... (vezi stnga) care are mai multe zone:
- Excluded variables: conine lista vaiabilelor cu acelai nume n ambele baze de date.
Printre ele se afl i variabila cheie dup care se va face concatenarea. n exemplul
nostru, exist p singur variabil exclus care este chiar variabila cheie (id). Variabila
cheie se selecteaz, dup care se trece cu n zona Key Variables (aa cum se vede n
imaginea din dreapta).
- Dac exist variabile excluse pe care dorim s le adugm, le selectm, apsm butonul
Rename i le trecem n lista New Working Data File cu .
- Zona New Working Data File conine lista variabilelor din fiierul care va rezulta prin
concatenare. Se observ c variabilele din fiierul curent sunt marcate cu (*) iar cele
adugate cu (+).
- Opiunea Match cases on key variables in sorted files este bifat implicit.
Lista New Working Data File poate fi gestionat dup dorin, excluznd variabile care
nu se doresc adugate. Dac se marcheaz Indicate case source as variable, se creeaz automat o
variabil care indic fiierul surs al fiecrei variabile.
Se apas OK dup care apare mesajul de atenionare de mai jos. Acesta avertizeaz c
adugarea variabilelor va eua dac bazele de date nu sunt sortate. Se apas OK, dac sortarea a
fost fcut sau Cancel, dac se dorete abandonarea procedurii.
33/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Dac procedura a fost corect executat, baza de date curent apare astfel:
Se observ faptul c au fost adugate cele dou variabile noi (v_3 i v_4) cu toate
cazurile lor, iar pentru variabilele v_1 i v_2 au fost puse valori lips cazurilor 6 i 7 care nu
existau n fiierul iniial.
Noul fiier curent este fr nume (Untitled) ceea ce presupune salvarea lui pentru
conservarea rezultatului operaiei de concatenare. n versiunile mai recente de SPSS, fiierul
concatenat are numele fiierului curent la care s-au adugat variabile.
Dac la cazurile existente n baza de date curent (de lucru) dorim s adugm cazuri
(subieci) dintr-o alt baz de date, se utilizeaz procedura Add Cases din meniul Data-Merge
files. Avem, spre exemplu, dou baze de date care conin aceleai variabile. n stnga, sunt
subiecii identificai ca 1,2, 3, 4, 5 (coduri numerice convenionale), iar n dreapta subiecii
identificai ca 5,6,7,8,9,10.
Bazele de date pot cuprinde i variabile care nu sunt comune, cum este cazul variabilei
v_3, care vor putea fi adugate sau nu odat cu cazurile.
34/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
35/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Se deschide caseta Traspose (stnga) n care mutm variabilele v_1 i v_2 n lista
Variable(s), iar variabila id n zona Name Variable: (vezi n dreapta).
36/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Astfel, valorile variabile id vor da numele variabilelor din noul fiier rezultat prin
transpunere, aa cum se vede n imagine:
Dac facem operaia invers, putem obine vechea form de aranjare a datelor, aa cum
se vede mai jos:
6. Bibliografie minimal
M. Popa, 2004, Statistic psihologic cu aplicaii SPSS, Editura Universitii din Bucureti
(http://popamarian.googlepages.com)
37/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Cuprins:
38/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
L Aceste proceduri ofer, fiecare, prelucrri distincte, dar conin i rezultate comune.
Alegerea uneia sau alteia dintre ele depinde de necesitile de analiz.
3. Procedura Frequencies
Este singura procedur care permite analiza de frecvene. La apariia casetei Frequencies,
variabila pe care dorim s o supunem analizei va fi trecut n lista de calcul Variable(s), prin
selectarea ei i acionarea butonului de transfer (). Pot fi incluse mai multe variabile simultan
n aceast list, rezultatele fiind afiate distinct, pentru fiecare n parte.
39/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
Rezultatele sunt afiate n SPSS Viewer n forma de mai jos (dar unele sub altele, nu
alturat, aa cum sunt prezentate aici):
40/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
4. Procedura Descriptives
5. Procedura Explore
Procedura Explore este cea mai complex dintre toate procedurile statisticii descriptive i
se poate utiliza atunci cnd se dorete o analiz exhaustiv a variabilei (sau variabilelor).
Caseta principal Explore
41/42
Copyright DEPARTAMENT ID 2011
M. Popa Modul 4 (SPSS prezentare general, statistici descriptive)
6. Bibliografie minimal
M. Popa, 2004, Statistic psihologic cu aplicaii SPSS, Editura Universitii din Bucureti
(http://popamarian.googlepages.com)
42/42
Copyright DEPARTAMENT ID 2011