Sunteți pe pagina 1din 15

M.

Popa – Aplicaţii SPSS – Prezentare generală

SPSS prezentare generală

„SPSS for Windows” este un pachet de programe destinat analizei statistice a datelor.
Deşi există o varietate de programe de acest gen (SAS, Statistica for Windows, GraphPad, MS
Excel, care are şi el funcţii statistice), SPSS se distinge prin structurarea riguroasă şi uşurinţa
utilizării, chiar şi pentru începători.
Cea mai recentă versiune disponibilă la această dată este SPSS 14.0, dar acest manual nu
acoperă în mod special o anumită versiune, ci face referire în general la versiunile sub Windows.
În esenţă, toate versiunile sub Windows oferă acelaşi pachet de funcţii statistice de bază, iar
diferenţele, chiar dacă sunt, nu sunt relevante la nivelul unui curs introductiv de statistică.
 Acest simbol plasat înaintea unei propoziţii indică introducerea unei informaţii
importante, care se impune a fi reţinută.
 Ne vom axa pe o prezentare sintetică, considerând cunoscute elementele de bază de
operare în mediul Windows.

Funcţii de bază ale SPSS

Dacă privim în ansamblu funcţiile pachetului de programe SPSS, acestea sunt


următoarele:

 Editarea datelor (construirea bazelor de date, transformări ale variabilelor)


 Prelucrarea statistică a datelor (statistici descriptive, teste de semnificaţie)
 Prezentarea rezultatelor, sub formă numerică sau grafică
 Realizarea unor proceduri proprii de prelucrare sau de a modifica procedurile
standard SPSS. Această opţiune este rezervată utilizatorilor avansaţi şi nu va face
obiectul prezentării în acest manual.

Domeniile de lucru în SPSS

Particularitatea principală a interfeţei de lucru cu SPSS este aceea că rezervă fiecăreia


dintre funcţiile de mai sus un domeniu special („ecran”, sau „fereastră”). Astfel, la lansarea
programului, acesta deschide automat o fereastră rezervată editării datelor (Data Editor) şi una
afişării rezultatelor (Viewer). Putem numi aceste ferestre şi domenii de lucru, deoarece la nivelul
fiecăruia avem la dispoziţie o varietate de funcţii şi opţiuni specifice. Ca să le înţelegem mai uşor,
trebuie să ne imaginăm „domeniile de lucru” ca fiind „ferestre” distincte, similare celor ale
documentelor Word, cu deosebirea că, în acest caz, fiecare fereastra acoperă funcţii specifice.
Trecerea de la o fereastră la alta se face într-unul din următoarele moduri:
 Din meniul SPSS/Windows, prin alegerea ferestrei dorite;
 Utilizând butoanele din bara de comenzi directe a ferestrei SPSS;
 Utilizând butoanele de pe bara de sarcini a sistemului de operare (din partea de
jos a ecranului).

Mai departe, vom prezenta pe rând domeniile de lucru enunţate.

Domeniul bazei de date (Data Editor)

La lansarea programului SPSS se deschide fereastra domeniului de editare a datelor


(SPSS Data Editor). Ea se prezintă ca în imaginea de mai jos, având caracteristicile obişnuite ale
unei ferestre Windows, cu o structură de linii şi coloane:

1/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală

- pe coloane sunt variabilele (de ex., cod_sub, rezultat)


- pe linii sunt cazurile (în acest caz, cinci subiecţi)

 O sesiune de lucru cu SPSS presupune, în mod necesar, existenţa unei baze de date.
 SPSS operează cu o singură bază de date la un moment dat. De la versiunea 14, SPSS
poate deschide simultan mai multe baze de date.
 Pentru a deschide o altă bază de date, sau pentru a crea una nouă, cea aflată în lucru va fi
închisă. Programul solicită salvarea ei prealabilă, dacă acest lucru nu a fost deja efectuat.
 Dacă vrem să prelucrăm date aflate în baze de date (fişiere) diferite, este necesară
aducerea lor în aceeaşi bază de date (procedura DATA-Merge files, care va fi descrisă mai
târziu).
 Meniurile ferestrei Data Editor nu se vor activa integral decât atunci când va exista cel
puţin o variabilă definită şi valori pentru cel puţin un caz.
 Baza de date SPSS poate fi creată direct, cu ajutorul structurii (ferestrei) Data Editor, sau
poate fi deschisă cu ajutorul comenzii File-Open, aşa cum vom exemplifica mai târziu.
 Fişierele cu baze de date SPSS au extensia .sav.

Domeniul afişării rezultatelor (Viwer)

SPSS depune rezultatele prelucrărilor într-o secţiune aparte a domeniului de lucru.


Aceasta cuprinde toate rezultatele, atât de tip numeric cât şi de tip grafic. Fereastra respectivă
(Viewer) este organizată în două zone distincte: una pentru navigare (în partea stângă) şi alta
pentru afişarea rezultatelor (în partea dreaptă).

 Fişierul rezultat prin salvarea acestei ferestre are extensia .spo


 Un fişier cu rezultate SPSS nu poate fi deschis decât din programul SPSS

2/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală

 Dacă se doreşte transmiterea rezultatelor în afara SPSS se va proceda fie la „exportul”


rezultatelor cu procedura corespunzătoare din meniul File/Export, fie la transferarea prin
Select/Copy/Paste într-un editor grafic de tipul MS Word.

Domeniul de editare a procedurilor directe (Syntax)

SPSS permite, în afara operării prin intermediul meniurilor, şi lucrul direct cu proceduri
definite de utilizator. Aceasta se face în interiorul unei ferestre speciale care permite, pe de o
parte, editarea procedurilor, iar pe de altă parte, lansarea lor în execuţie.
Imaginea de mai jos redă comenzile SPSS pentru calcularea procedurii de calcul a
indicatorilor statistici descriptivi, redaţi mai sus, în fereastra SPSS Viewer.

 Utilizarea directă a procedurilor Syntax impune aprofundarea SPSS.


 Se poate seta afişarea procedurilor curente în SPSS Viewer, concomitent cu rezultatele.
(Edit/Options/Viewe/Display commands in the log).

Meniurile SPSS

Meniurile de tip listă se aseamănă cu meniurile altor programe sub Windows. Fără a intra
în amănunte, iată o descriere succintă a meniurilor pentru fereastra DATA EDITOR:

Meniul Funcţii principale Observaţii


File Operaţii de deschidere şi salvare de fişiere
Operaţii de Select/Copy/Cut/Paste, Find şi, cel
Edit mai important, setarea caracteristicilor de lucru ale
SPSS (Options-în versiunile pt. Win 9X)
În cazul ferestrei Data Editor, setează modul de
View afişare: cu sau fără bara de butoane, cu sau fără
liniile despărţitoare ale celulelor.
Funcţii de operare cu variabilele; definire,
Importante pentru pregătirea
Data inserare, ştergere, selectare, sortare, adiţionare de
datelor în vederea prelucrării
fişiere, etc.
Funcţii de modificare a datelor prin calculare, Importante pentru pregătirea
Transform
recodificare. datelor în vederea prelucrării
Prin opţiunile fiecărei
Statistics
Grupează procedurile de calcul statistic proceduri se pot obţine şi
(Analyze)
reprezentări grafice specifice
Graph Grupează procedurile de reprezentare grafică
Informaţii despre variabile, structurare pe seturi de
Utilities
variabile

3/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală

Meniul Funcţii principale Observaţii


Lista ferestrelor deschise cu posibilitatea de
Window
selecţie
Aici se află un tutorial extrem
de sugestiv de operare cu
SPSS, iar de la versiunea 7.5
Help Informaţii de ajutor în sus, o procedură de sprijin
în alegerea tipului de
prelucrare statistică (Statistic
Coach)

Casetele de dialog

Casetele de dialog sunt „formulare grafice” care permit declararea şi setarea procedurilor de
calcul cu SPSS. Acestea se deschid după lansarea în execuţie a unei comenzi din meniu. Uneori,
caseta principală, care se deschide direct din meniu, are comenzi de deschidere a uneia sau mai
multor casete secundare. Odată deschisă o casetă secundară, revenirea la caseta principală se
poate face numai prin finalizarea şi închiderea casetei secundare.
Deşi sunt diferite de la o procedura la alta, casetele de dialog au o concepţie comună.
Redăm mai jos, spre exemplificare, caseta principală Descriptives şi caseta secundară
Descriptives: Options, care sunt activate din meniul Statistics-Summarize-Descriptives...

Caseta principală Descriptives Caseta secundară Descriptives: Options

Lista de variabile Lista de variabile


disponibile supuse procedurii

Buton de transfer Butonul de finalizare a


Check Box variabile casetei secundare

Butoane de comenzi:
OK: Rulează procedura şi închide caseta de dialog principală.
Paste: Copie comenzile procedurii într-o fereastră Syntax, de unde poate fi editată şi lansată
direct. Recomandat pentru situaţiile în care dorim să modificăm manual procedura (necesită
cunoştinţe avansate).
Reset: Resetează caseta de dialog, aducând-o la setările implicite de sistem, fără să păstreze nici o
setare anterioară. Recomandat atunci când dorim restructurarea completă a unei proceduri
anterior executată din acea casetă.
Cancel: Anulează setările efectuate după deschiderea casetei.
Help: Informaţii de ajutor contextuale pentru procedura definită de caseta respectivă.

4/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală

Casetele de dialog păstrează setările ultimei utilizări, ceea ce face ca la următoarea


apelare să fie în aceeaşi stare. Acest lucru înseamnă că, dacă se doreşte efectuarea aceleiaşi
proceduri, cu aceleaşi variabile, este suficient să fie apăsat butonul OK.

Paşii analizei statistice cu SPSS

În principiu, prelucrarea datelor cu SPSS presupune următoarele etape:

Opţiuni:
(a) Introducerea directă a datelor în DATA EDITOR
1 Introducerea datelor (b) Deschiderea unui fişier de date SPSS (extensia .sav)
(c) Importarea unui fişier de format diferit (se alege din caseta
File open/File of type)
Corecţia erorilor, selecţii, recodificări, transformarea variabilelor
2 Pregătirea datelor prin calcule, declararea valorilor lipsă, combinarea datelor din
două fişiere diferite (meniurile Data, Transform)
Selectarea procedurii
3 Meniurile Statistics (sau Analyze) şi Graphs
satistice
Selectarea variabilelor
În conformitate cu configuraţia casetei de dialog care este afişată
4 ce urmează a fi supuse
la fiecare procedura
prelucrării
Se acţionează butonul OK din caseta de dialog a procedurii
5 Rularea procedurii  Butonul devine activ numai atunci când sunt întrunite
condiţiile presupuse de procedura respectivă
Rezultatele prelucrărilor sunt afişate într-o fereastră specifică
6 Analiza rezultatelor (SPSS Viewer), cu funcţiuni de editare grafică sau de tip text, în
funcţie de versiune.
Se editează rezultatele afişate în Viewer, aducându-le la forma
dorită sub aspect grafic
7 Editarea rezultatelor
 Dublu clic pe un element din Viewer conduce la intrarea
elementului respectiv în regim de editare)
Inserarea datelor într-un Rezultatele din SPSS Viewer se preiau cu Select/Copy şi se
8
document depun cu Paste în orice tip de editor de documente.

 SPSS este un program puternic de analiză statistică a datelor. Utilizarea lui optimă presupune,
în mod necesar, stăpânirea de către operator a cunoştinţelor teoretice de statistică.
 Aşa cum un program de editare grafică nu compensează lipsa de talent la desen, nici SPSS nu
poate fi cu adevărat exploatat de către cei care nu au cunoştinţe de statistică. În lipsa acestora,
nici alegerea procedurilor şi nici interpretarea rezultatelor nu va fi cu adevărat posibilă.

5/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală

Editarea datelor

O bază de date în SPSS este o structură formată din linii şi coloane, la intersecţia cărora
se formează celulele care conţin, fiecare, o anumită unitate de informaţie.
 Existenţa unei baze de date deschisă în fereastra Data Editor este o condiţie obligatorie
pentru operarea cu SPSS.
 SPSS operează numai cu o singură bază de date deschisă la un moment dat.

În principiu, o bază de date SPSS se obţine pe una din următoarele căi:

a) Crearea ei prin operaţiunea de definire a variabilelor şi introducerea datelor de la


tastatură;
b) Deschiderea unei baze de date SPSS, existente pe un suport de memorie;
c) Importarea unei baze de date din alt format decât SPSS

În continuare, vom trata pe rând fiecare din cele trei situaţii:

a) Crearea unei baze de date SPSS

În linii generale, pentru crearea unei baze de date proprii în SPSS, se procedează astfel:
 Se lansează SPSS
 Se definesc variabilele bazei de date în domeniul Data Editor
 Se introduc datele pentru fiecare caz (subiect) în parte
 Se salvează baza de date (extensia specifică este .sav)

Definirea variabilelor

 se acţionează Define variable din meniul Data


 o soluţie mai directă este dublu clic pe capul de coloană

 În versiunile de SPSS mai recente, editarea variabilelor se face într-o fereastră


specială, diferită de DATA EDITOR, care se deschide automat atunci când se trece
pe editarea unei variabile. Cu toate acestea, elementele de bază rămân aceleaşi ca al
versiunile anterioare.

Ca urmare a operaţiei de mai sus, apare o casetă de dialog ca în imaginea următoare


(forma ei nu diferă substanţial de la o versiune de SPSS la alta). Dacă privim caseta, vom observa
următoarele elemente:

6/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală

• Variable Name: zona de declarare a numelui de variabilă. VAR00001 este numele


implicit al primei variabile. Acesta se şterge, pentru a fi înlocuit cu numele pe care
dorim să îl dăm variabilei (deşi numele implicit VAR00001 este unul valid, este
recomandabil să fie înlocuit cu unul adecvat, creat de utilizator).
• Variable Description este o zona informativă în care sunt afişate caracteristicile
predefinite ale noii variabile. Aceste caracteristici se pot seta în Edit-Options (sau
Preferences, la unele versiuni).
• Change Settings, este o zonă care cuprinde butoane de comenzi pentru modificarea
setărilor implicite:
• În zona Measurement, se permite declararea tipului de măsurare specific variabilei:
Scale (Interval/Raport); Ordinal; Nominal. Deşi declararea scalei de măsurare nu are
un efect asupra prelucrărilor ulterioare, este recomandabil ca această opţiune să fie
corect setată, fie şi ca un exerciţiu de conştientizare a naturii fiecărei variabile.
• Butoanele OK (pentru finalizarea definirii variabilei, Cancel (pentru renunţarea la
definirea variabilei, Help (informaţii legate de definirea variabilelor)

 În versiunile mai recente de SPSS editarea variabilei nu presupune acest tip de casetă,
dar toatele elementele ei constitutive se regăsesc.

Numele variabilei:

Orice variabilă SPSS trebuie să aibă un nume. Cele mai importante aspecte legate de
denumirea variabilelor sunt următoarele:
 Trebuie sa fie format din minim 1, maxim 8 caractere, primul caracter fiind o literă.
 Nu sunt suportate caractere „speciale” cum ar fi spaţiu sau semne de punctuaţie.
Caractere ca $, @, # sau _ pot fi utilizate în interiorul numelui de variabilă. De exemplu,
a_#_$1 este un nume valid.
 Terminarea numelui cu caracterul _ va fi evitată, deoarece poate da conflict cu
variabilele create automat de SPSS, şi care au această terminaţie.
 Terminarea numelui cu semnul . va fi evitată, deoarece punctul este terminatorul uzual al
comenzilor SPSS, ceea ce poate conduce la erori.
 În cazul utilizării unor caractere improprii, apare un mesaj de eroare şi se permite
corectarea numelui.
 Alegerea numelui este la latitudinea operatorului. Respectarea anumitor convenţii poate fi
însă extrem de utilă, mai ales dacă avem de a face cu o baza de date cu multe variabile.
Iată câteva recomandări utile în acest sens (ele nu sunt obligatorii):
• Numele să exprime, pe cât posibil, conţinutul variabilei
• Pentru variabile „înrudite”, se va utiliza o schemă de denumire care să
exprime acest lucru. De exemplu, dacă avem variabile care cuprind

7/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală

valori ale timpului de reacţie măsurat în mai multe condiţii, putem


declara variabilele tr_1, tr_2, tr_3 ş.a.m.d.
• caracterul underscore „_” este recomandabil ca separator în cadrul
numelui de variabilă). Dacă într-o situaţie de acest gen am avea 10 sau
mai multe „momente”, este de preferat să se declare nume de genul
tr_01, tr_02,...tr_10, etc., deoarece ulterior SPSS aranjează alfabetic
variabilele în listele de selecţie şi astfel se păstrează ordinea dorită.
 Într-o bază de date nu pot exista două variabile cu acelaşi nume!
 Există o serie de cuvinte „rezervate”, a căror utilizare ca nume de variabile nu este
acceptată de program. Acestea sunt: ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT,
OR, THRU, TO, WITH.
 Până la versiunea 10, SPSS poate gestiona maximum 32768 de variabile şi 2.15 miliarde
de cazuri.
 Începând cu versiunea 10, nu mai există limită pentru numărul de variabile. Oricum, nu
este practic să se lucreze cu milioane de variabile simultan, fiind de preferat să se
realizeze baze de date care conţin doar variabilele care prezintă interes.
 Există însă limite pentru numărul de variabile care pot fi analizate simultan cu fiecare
procedură. Acest lucru nu ar trebui să ne preocupe în condiţiile în care numărul permis
este greu de atins în condiţiile cercetărilor uzuale de psihologie.

Definirea „tipului” de variabilă

Tipul de variabilă se referă la natura informaţiei pe care o codifică variabila respectivă.


• Se acţionează butonul Type de pe caseta Define Variable
• Apare caseta Define Variable Type

Aşa cum se observă în caseta Define Variable Type din imaginea de mai sus, SPSS poate
opera cu o varietate de tipuri de variabile. Fiecărui tip îi corespund anumite proprietăţi
(caracteristici) care trebuie definite de operator. Cele mai uzuale sunt tipurile:

[Numeric], care cuprind valori de tip numeric cu sau fără zecimale.


Proprietăţi:
• numărul de cifre necesare pentru exprimarea „întregilor”
• numărul de „zecimale”
EXEMPLE:
• Pentru o variabilă în care vom introduce vârsta în ani împliniţi, vom defini Type
Numeric cu Width 2 (presupunând că nu avem subiecţi cu vârsta peste 100 de
ani) şi Decimal Places 0.
• Pentru o variabilă în care vom introduce rezultatul la un test exprimat în scoruri
T cu o zecimală, definim Type Numeric cu Width 2 şi Decimal Places 1.

8/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală

[Caracter] (String), care cuprind valori exprimate sub formă de caractere alfanumerice (litere sau
chiar cifre).
Proprietăţi
• numărul de caractere rezervat, care este fixat implicit la 8 dar poate fi
modificat după dorinţă.
 SPSS face distincţie între variabile de tip caracter „scurte” (Short string) şi „lungi” (Long
string). Primele au maxim 8 caractere şi pot fi incluse în unele proceduri statistice
(semnificaţia diferenţei între medii, de exemplu), pe când celelalte nu pot fi utilizate decât în
operaţii de listare (cazul variabilei de genul „nume”, de ex.).
 Deşi permisă, utilizarea variabilelor „string” nu este de preferat. Toate variabilele care
suportă codificări vor fi, de preferinţă, introduse cu valori numerice, deoarece utilizarea
acestora în proceduri statistice nu este limitată de nici o restricţie.

Unităţi de timp calendaristic sau orar [Date], care pot include valori de timp într-un format
specificat, aşa cum se vede în imagine.
Proprietăţi
• formatul de introducere, care poate fi unul din cele evidenţiate în caseta
Define Variable Type/Date
Exemplu: dd-mmm-yyyy presupune introducerea unor valori de genul „21-FEB-2001”
(luna fiind scrisă obligatoriu după prescurtarea ei în engleză).

Există o mare varietate de formate pentru acest tip de variabilă, acoperind, practic, orice
cerinţă posibilă din partea utilizatorului.

 Variabilele de tip Date beneficiază de funcţii speciale de tratare şi analiză în SPSS.

Nu vom prezenta şi celelalte tipuri de variabile, ele fiind mai puţin folosite, dar facem
precizarea că semnificaţia lor poate fi găsită în Help-ul casetei Define Variable Type.
 Tipul unei variabile poate fi schimbat ulterior prin simpla redefinire a acesteia. Se va
acorda atenţie mesajelor care pot să apară şi care avertizează asupra eventualelor
pierderi de informaţie prin schimbarea tipului variabilei.
 Opţiunile din zona Measurement (Scale, Ordinal, Nominal), care se regăsesc doar la
versiuni SPSS de la 7.0 în sus, nu au întotdeauna o utilitate practică, dar marcarea lor
corectă este necesară pentru anumite proceduri statistice sau grafice.

Etichetarea variabilelor şi a valorilor

Etichetarea este o formă de descriere explicită a conţinutului variabilei, având în vedere


că numele variabilei nu poate fi mai mare de 8 caractere (limitare care dispare la versiunile mai
recente de SPSS). Etichetarea se poate practica atât la nivelul variabilei, dar şi la valorile pe care
le conţine, în cazul variabilelor de tip nominal sau ordinal.

9/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală

Pentru etichetare se apasă butonul Labels de pe caseta Define Variable. Se deschide o


nouă casetă (Define Labels), care conţine spaţii pentru eticheta variabilei (Variable Label) şi
pentru etichetele valorilor (Value labels).
 Eticheta variabilei nu se supune restricţiilor pentru nume, putând conţine oricâte caractere
(max. 255), dar şi spaţii sau alte semne grafice tipăribile.
 Etichetele pentru valori vor fi introduse una câte una, astfel:
 se plasează valoarea etichetată în zona Value
 se introduce eticheta corespunzătoare în zona Value label
 se acţionează butonul Add
 operaţiunea se reia pentru toate valorile pe care dorim să le etichetăm.
Imaginea prezintă etichetarea valorilor unei variabile care se referă la calificativul la un
examen. Se observă că valoarea 1 are eticheta SLAB, valoarea 2, eticheta MEDIU iar valoarea 3,
eticheta BUN (încă nu a fost acţionat butonul Add pentru a fi finalizată declaraţia etichetei acestei
valori).

 Deşi nimic nu ne obligă să aplicăm etichete variabilelor şi valorilor, este foarte recomandabil
ca ele să fie atribuite.
 Etichetele ajută la citirea mai uşoară a rezultatelor (deoarece apar alături de acestea). În plus,
etichetele sunt asociate prelucrărilor grafice (histograme, bare, etc.) fapt care reduce
necesitatea de a le introduce ulterior prin editarea respectivelor grafice.
 Pentru a şti cum să declarăm etichetele este bine să ni le imaginăm ca fiind înscrise pe axele
de referinţă ale unui grafic. Dacă „se potrivesc”, atunci au fost bine definite.
 Oricum, ele vor putea fi modificate ulterior sau editate direct în SPSS Viewer.

Declararea valorilor lipsă (missing values)

Valorile lipsă sunt de două tipuri:


 valori lipsă de sistem (system missing values) adică valori care lipsesc din baza de date
(nu au fost introduse, nu au fost recoltate). Forma lor de evidenţiere pe ecran este un
punct plasat în celula respectivă.
 valori lipsă declarate de utilizator (user missing values) adică valori pe care utilizatorul le
declară ca atare. Acestea pot exista în baza de date, dar utilizatorul, din diverse motive,
nu doreşte să fie luate în calcul. Atenţie, odată declarate, aceste valori nu sunt şterse şi
nici nu sunt marcate în mod evident pe ecran.

Pentru declararea valorilor lipsă se acţionează butonul Missing Values din caseta Define
Variables, care generează apariţia casetei de dialog alăturate.

10/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală

Se observă că există mai multe opţiuni:


 declararea a trei valori distincte ca fiind lipsă (Discrete missing values)
 declarea unui domeniu de valori lipsă (Range of missing values)
 declararea unui domeniu la care se poate adăuga şi o valoare distinctă (Range plus one
discrete missing value)

 Deşi nu pare foarte evidentă acum, utilitatea funcţiei de declarare a valorilor lipsă nu
trebuie subestimată. Foarte adesea suntem nevoiţi să scoatem din prelucrări anumite
valori (care nu pot fi totuşi, pur şi simplu, şterse). Să ne gândim numai la valorile extreme
ale unei distribuţii, a căror menţinere în anumite prelucrări poate determina modifcări
semnificative a rezultatelor.

În concluzie, declararea variabilelor se compune din următoarele operaţiuni:

 Atribuirea numelui (maxim 8 caractere)


 Definirea tipului (numeric, caracter, data)
 Atribuirea etichetei variabilei
 Atribuirea etichetei valorilor, în cazul variabilelor măsurate pe scale nominale
sau ordinale
 Declararea valorilor lipsă (care nu au fost recoltate în procesul de măsurare, din
diferite motive)

Ştergerea şi inserarea variabilelor

 Ştergerea unei variabile se face prin selectarea acesteia (clic pe capul de variabilă) şi
acţionarea tastei Delete (sau se comandă din meniul Edit-Cut).
 Inserarea unei variabile se face prin plasarea cursorului-celulă pe coloana variabilei în
stânga căreia dorim să inserăm noua variabilă (sau prin selectarea variabilei respective),
după care se comandă, din meniul Data-Insert variable. După aceasta, se defineşte
variabila inserată (nume, tip, etichete).

Ştergerea şi inserarea cazurilor

 Ştergerea cazurilor se face în mod similar variabilelor, prin selectarea acestora (clic pe
capul de linie) şi tasta Delete (sau Edit-Cut). Se pot selecta mai multe cazuri simultan
(drag cu mouse-ul pe capul liniilor) după care se şterg ca mai sus.
 Inserarea cazurilor se face după plasarea cursorului pe linia deasupra căreia dorim să
inserăm un nou caz, după care se acţionează în meniul Data-Insert case.

11/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală

 Pentru versiunile de SPSS de la 7 în sus, clic dreapta pe capul de coloană sau de linie,
produce un meniu contextual care permite un acces mai rapid la funcţiile de
inserare/ştergere a variabilelor sau cazurilor.
 SPSS nu permite Undo (în meniul Edit) decât limitat la ultima acţiune. Din acest motiv,
ştergerea variabilelor sau a cazurilor trebuie să se facă cu atenţie, pentru că datele pot fi
definitiv pierdute. Se va reţine, totuşi, că baza de date se actualizează pe hard disk numai
după salvarea comandată de utilizator. Ca urmare...
 Orice modificare efectuată nu produce efecte decât asupra datelor din memoria de lucru,
fişierul rămânând nemodificat.
 În cazul unei acţiuni care produce efecte nedorite asupra bazei de date, există soluţia
închiderii bazei de date, fără a se accepta salvarea cerută de program, după care se
deschide fişierul respectiv din nou.

Erori frecvente la editarea datelor

- Apariţia unor cazuri inutile, (umplute cu system missing values) la sfârşitul unei baze
de date.
Explicaţie: Introducerea inutilă a unei valori într-o variabilă, valoare care apoi este
ştearsă. Cu toate acestea, SPSS a creat deja un caz nou, pe care l-a umplut cu system missing
values.
Soluţie: Selectarea cazului prin apăsarea pe capul de linie şi acţionarea tastei Delete (sau
Edit-Cut).
- Apariţia unor variabile inutile (nedorite).
Explicaţie: La introducerea din greşeală a unei valori într-o variabilă nedefinită în
prealabil, SPSS creează automat o variabilă implicită, pe care o denumeşte VAR00001.
Soluţie: Se selectează variabilă respectivă (clic de mouse pe capul de coloană) şi se
acţionează tasta Delete (sau Edit-Cut).

Exemplu practic de realizare a unei baze de date

Să ne imaginăm că am aplicat testul Eysenck Personality Inventory, care vizează


următoarele caracteristici de personalitate: extraversiunea, nevrozismul şi atitudinea defensivă
(scala Lie). Pentru analiza datelor suntem interesaţi să raprtăm rezultatele la o serie de
caracteristic demografice ale subiecţilor, să zicem sexul şi vârsta. În plus, pentru a avea controlul
datelor dorim să inregistrăm şi identitatea subiecţilor. Pentru fiecare dintre informaţiile pe care
dorim să le introducem în baza de date vom crea câte o variabilă, aşa cum este descrisă în tabelul
următor:

Variabila Numele Tipul variabilei Eticheta Etichetele


variabilei variabilei valorilor
Identitatea COD numeric, Width 2, Decimal Identitate Nu se aplică
subiecţielor (optăm pentru Places 0 etichete decât
(esentiala pentru a un cod (presupunem că nu avem mai la valorile
asigura identitatea numeric dacă mult de 99 subiecţi) variabilelor de
fiecarei inregistrari nu avem tip categorial
inparte si pentru nevoie de (nominale sau
realizarea numele ordinale)
corespondentelor subiecţilor)
cu alte baze de date
in care avem
informatii cu

12/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală

privire la aceiaşi
subiecţi)
Sexul SEX Numeric, Width 1, Decimal Sex 1=feminin
Places 0 2=masculin
Vârsta (în ani VIRSTA Numeric, Width 2, Decimal Vârsta
împliniţi; sau în Places 0
luni dacă dorim (presupunem că nu avem
mai multă precizie) subeicţi cu vârsta peste 99 de
ani)
Extraversiune EXTRAV Numeric, Width 2, Decimal Extraversiune
Places 0
(nu se poate obţine o valoare
mai mare de 100 şi nu există
zecimale)
Nevrozism NEVRO Numeric, Width 2, Decimal Nevrozism
Places 0
(nu se poate obţine o valoare
mai mare de 100 şi nu există
zecimale)
Lie LIE Numeric, Width 1, Decimal „Minciună”
Places 0
(nu se poate obţine o valoare
mai mare de 9 şi nu există
zecimale)

Deşi am scris aici numele de variabile cu litere mari, în SPSS se scriu cu litere mici,
majusculele nefiind recunoscute în numele de variabile. Se observă faptul că pentru variabile ale
căror nume exprimă exact conţinutul (SEX, VIRSTA) se poate utiliza fără nici un inconvenient
numele şi ca etichetă. Pentru a fi mai expliciţi, să spunem că numele variablei este util în primul
rând SPSS-ului pentru a manipula variabilele, în timp ce etichetele sunt necesare mai ales
utilizatorului pentru a înţelege cu uşurinţă la ce se referă o variabilă al cărui nume prea scurt.
Avem alăturat imaginea DATA EDITOR pentru primii trei subiecţi introduşi cu
variabilele de mai sus:

 Insistăm pe declararea, cu precădere, a variabilelor de tip numeric. SPSS este un program de


prelucrare statistică, fapt care presupune date numerice. Deşi el poate opera şi cu date de tip
caracter, acestea nu sunt acceptate pentru toate tipurile de proceduri statistice. Pentru a nu
avea surprize, este recomandabil să fie utilizate variabile de tip numeric în toate cazurile. De
exemplu, variabila sex, poate fi declarată de tip caracter (cu valorile M si F) dar, la fel de
bine, de tip numeric (cu valorile convenţionale 1 şi, respectiv, 2). În acest din urma caz,
pentru explicitarea valorilor se vor folosi etichetele de valoare (value label).
 Introducerea unei variabile care să conţină numele subiecţilor poate fi necesară doar dacă ne
propunem realizarea unor liste ale subiecţilor din baza de date. Altfel, identificarea numerică

13/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală

a fiecărei înregistrări este suficientă (şi absolut necesară), scutind un mare volum de muncă
pe care l-ar implica introducerea numelor. Vom avea grijă însă, ca pe documentul original să
scriem codul numeric aferent fiecărui subiect, astfel încât, la nevoie, să se poată identifica
numele (pentru corecţii, de ex.)
 Variabile multiple pentru întrebări cu răspuns multiplu: De obicei, o întrebare prezintă un
singur răspuns, dar pot fi situaţii în care o întrebare prezintă răspunsuri multiple care pot fi
alese în acelaşi timp. De exemplu: „Ce activităţi preferaţi pentru timpul liber? 1. sport; 2.
filme; 3. petreceri cu prieteni...”, etc. Într-un asemenea caz ne putem aştepta să avem mai
multe răspunsuri la aceeaşi întrebare. Soluţia pentru introducerea datelor este, de aceea,
crearea mai multor variabile, câte una pentru fiecare variantă de răspuns. Astfel, vom avea
variabila „SPORT” care poate primi două valori, sa zicem „1” dacă este aleasă şi „0” dacă nu
este aleasă, şi aşa mai departe. În acest mod vom putea analiza frecvenţa alegerilor pentru
fiecare variantă de răspuns în parte.
 Evitarea variabilelor redundante: Dacă la un test nu sunt posibile, de exemplu, decât
răspunsuri corecte sau greşite, atunci nu este necesar să declarăm o variabilă pentru „corecte”
şi una pentru „greşite” dacă suma lor dă totalul răspunsurilor.

Salvarea bazei de date din Data Editor

O bază de date aflată în lucru nu are un corespondent într-un fişier decât după ce se
execută o salvare a acesteia. Acest lucru nu trebuie niciodată uitat. Spre deosebire de WORD de
exemplu, SPSS nu are o funcţie de salvare automată după un interval de timp prestabilit. Cu alte
cuvinte, indiferent ce modificări facem în Data Editor pe ecran, datele respective vor fi salvate
numai la comanda explicită a operatorului.
Pentru o bază de date nou creată, salvarea se face în mod similar cu orice alt program
cunoscut: File-Save as, care deschide următoarea casetă de dialog:
 Se alege locaţia de salvare (Save in)
 Se dă un nume fişierului (File name)
 Se verifică tipul de fişier (formatul implicit pentru baze de date SPSS are extensia .sav)
 Se acţionează Save

 SPSS poate salva şi în alte formate, dintre cele mai importante fiind: Dbase sau
FoxPro, Lotus 1-2-3, Excel. Salvarea în aceste formate poate fi utilă pentru transferul
datelor pentru prelucrări ulterioare în alte programe.

Deschiderea unei baze de date SPSS

O bază de date creată cu SPSS se deschide cu comanda File-Open, care activează


următoarea casetă de dialog:
 Se alege locaţia de citire (Look in)
 Se indică fişierul dorit (selectarea cu mouse-ul) în fereastra de căutare

14/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală

 Se indică tipul de fişier ce urmează a fi deschis (implicit este de tip SPSS cu


extensia .sav)
 Se acţionează Open

 În cazul deschiderii unui fişier de alt tip decât SPSS, se va alege tipul respectiv din
lista Files of type. În cazul în care SPSS nu recunoaşte tipul de fişier în care se află
datele noastre, putem încerca transformarea lor prealabilă din formatul original într-
un format recunoscut de SPSS. Deşi există riscul pierderii unor aspecte ce ţin de
formatul de reprezentare a datelor, operaţiunea scuteşte totuşi un mare volum de
muncă.

Sarcină de lucru

1. Se va crea o baza de date corespunzătoare următoarei structuri de valori:

- cod de identitate subiect (numeric, fără zecimale)


- data naşterii (zz-ll-aaaa)
- genul (masculin, feminin)
- tip de liceu absolvit (industrial, teoretic, artistic)
- scorul la un test de inteligenţă verbală (numeric, fără zecimale)
- scorul la un test de inteligenţă abstractă (numeric, fără zecimale)
- timpul de reacţie (numeric, cu două zecimale)

2. Variabilele vor fi etichetate


3. Valorile variabilelor categoriale vor fi etichetate
4. Se vor introduce valori fictive, pentru un număr de 10 subiecţi.

15/15
Actualizat la: 27.02.2006