Documente Academic
Documente Profesional
Documente Cultură
„SPSS for Windows” este un pachet de programe destinat analizei statistice a datelor.
Deşi există o varietate de programe de acest gen (SAS, Statistica for Windows, GraphPad, MS
Excel, care are şi el funcţii statistice), SPSS se distinge prin structurarea riguroasă şi uşurinţa
utilizării, chiar şi pentru începători.
Cea mai recentă versiune disponibilă la această dată este SPSS 14.0, dar acest manual nu
acoperă în mod special o anumită versiune, ci face referire în general la versiunile sub Windows.
În esenţă, toate versiunile sub Windows oferă acelaşi pachet de funcţii statistice de bază, iar
diferenţele, chiar dacă sunt, nu sunt relevante la nivelul unui curs introductiv de statistică.
Acest simbol plasat înaintea unei propoziţii indică introducerea unei informaţii
importante, care se impune a fi reţinută.
Ne vom axa pe o prezentare sintetică, considerând cunoscute elementele de bază de
operare în mediul Windows.
1/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală
O sesiune de lucru cu SPSS presupune, în mod necesar, existenţa unei baze de date.
SPSS operează cu o singură bază de date la un moment dat. De la versiunea 14, SPSS
poate deschide simultan mai multe baze de date.
Pentru a deschide o altă bază de date, sau pentru a crea una nouă, cea aflată în lucru va fi
închisă. Programul solicită salvarea ei prealabilă, dacă acest lucru nu a fost deja efectuat.
Dacă vrem să prelucrăm date aflate în baze de date (fişiere) diferite, este necesară
aducerea lor în aceeaşi bază de date (procedura DATA-Merge files, care va fi descrisă mai
târziu).
Meniurile ferestrei Data Editor nu se vor activa integral decât atunci când va exista cel
puţin o variabilă definită şi valori pentru cel puţin un caz.
Baza de date SPSS poate fi creată direct, cu ajutorul structurii (ferestrei) Data Editor, sau
poate fi deschisă cu ajutorul comenzii File-Open, aşa cum vom exemplifica mai târziu.
Fişierele cu baze de date SPSS au extensia .sav.
2/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală
SPSS permite, în afara operării prin intermediul meniurilor, şi lucrul direct cu proceduri
definite de utilizator. Aceasta se face în interiorul unei ferestre speciale care permite, pe de o
parte, editarea procedurilor, iar pe de altă parte, lansarea lor în execuţie.
Imaginea de mai jos redă comenzile SPSS pentru calcularea procedurii de calcul a
indicatorilor statistici descriptivi, redaţi mai sus, în fereastra SPSS Viewer.
Meniurile SPSS
Meniurile de tip listă se aseamănă cu meniurile altor programe sub Windows. Fără a intra
în amănunte, iată o descriere succintă a meniurilor pentru fereastra DATA EDITOR:
3/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală
Casetele de dialog
Casetele de dialog sunt „formulare grafice” care permit declararea şi setarea procedurilor de
calcul cu SPSS. Acestea se deschid după lansarea în execuţie a unei comenzi din meniu. Uneori,
caseta principală, care se deschide direct din meniu, are comenzi de deschidere a uneia sau mai
multor casete secundare. Odată deschisă o casetă secundară, revenirea la caseta principală se
poate face numai prin finalizarea şi închiderea casetei secundare.
Deşi sunt diferite de la o procedura la alta, casetele de dialog au o concepţie comună.
Redăm mai jos, spre exemplificare, caseta principală Descriptives şi caseta secundară
Descriptives: Options, care sunt activate din meniul Statistics-Summarize-Descriptives...
Butoane de comenzi:
OK: Rulează procedura şi închide caseta de dialog principală.
Paste: Copie comenzile procedurii într-o fereastră Syntax, de unde poate fi editată şi lansată
direct. Recomandat pentru situaţiile în care dorim să modificăm manual procedura (necesită
cunoştinţe avansate).
Reset: Resetează caseta de dialog, aducând-o la setările implicite de sistem, fără să păstreze nici o
setare anterioară. Recomandat atunci când dorim restructurarea completă a unei proceduri
anterior executată din acea casetă.
Cancel: Anulează setările efectuate după deschiderea casetei.
Help: Informaţii de ajutor contextuale pentru procedura definită de caseta respectivă.
4/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală
Opţiuni:
(a) Introducerea directă a datelor în DATA EDITOR
1 Introducerea datelor (b) Deschiderea unui fişier de date SPSS (extensia .sav)
(c) Importarea unui fişier de format diferit (se alege din caseta
File open/File of type)
Corecţia erorilor, selecţii, recodificări, transformarea variabilelor
2 Pregătirea datelor prin calcule, declararea valorilor lipsă, combinarea datelor din
două fişiere diferite (meniurile Data, Transform)
Selectarea procedurii
3 Meniurile Statistics (sau Analyze) şi Graphs
satistice
Selectarea variabilelor
În conformitate cu configuraţia casetei de dialog care este afişată
4 ce urmează a fi supuse
la fiecare procedura
prelucrării
Se acţionează butonul OK din caseta de dialog a procedurii
5 Rularea procedurii Butonul devine activ numai atunci când sunt întrunite
condiţiile presupuse de procedura respectivă
Rezultatele prelucrărilor sunt afişate într-o fereastră specifică
6 Analiza rezultatelor (SPSS Viewer), cu funcţiuni de editare grafică sau de tip text, în
funcţie de versiune.
Se editează rezultatele afişate în Viewer, aducându-le la forma
dorită sub aspect grafic
7 Editarea rezultatelor
Dublu clic pe un element din Viewer conduce la intrarea
elementului respectiv în regim de editare)
Inserarea datelor într-un Rezultatele din SPSS Viewer se preiau cu Select/Copy şi se
8
document depun cu Paste în orice tip de editor de documente.
SPSS este un program puternic de analiză statistică a datelor. Utilizarea lui optimă presupune,
în mod necesar, stăpânirea de către operator a cunoştinţelor teoretice de statistică.
Aşa cum un program de editare grafică nu compensează lipsa de talent la desen, nici SPSS nu
poate fi cu adevărat exploatat de către cei care nu au cunoştinţe de statistică. În lipsa acestora,
nici alegerea procedurilor şi nici interpretarea rezultatelor nu va fi cu adevărat posibilă.
5/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală
Editarea datelor
O bază de date în SPSS este o structură formată din linii şi coloane, la intersecţia cărora
se formează celulele care conţin, fiecare, o anumită unitate de informaţie.
Existenţa unei baze de date deschisă în fereastra Data Editor este o condiţie obligatorie
pentru operarea cu SPSS.
SPSS operează numai cu o singură bază de date deschisă la un moment dat.
În linii generale, pentru crearea unei baze de date proprii în SPSS, se procedează astfel:
Se lansează SPSS
Se definesc variabilele bazei de date în domeniul Data Editor
Se introduc datele pentru fiecare caz (subiect) în parte
Se salvează baza de date (extensia specifică este .sav)
Definirea variabilelor
6/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală
În versiunile mai recente de SPSS editarea variabilei nu presupune acest tip de casetă,
dar toatele elementele ei constitutive se regăsesc.
Numele variabilei:
Orice variabilă SPSS trebuie să aibă un nume. Cele mai importante aspecte legate de
denumirea variabilelor sunt următoarele:
Trebuie sa fie format din minim 1, maxim 8 caractere, primul caracter fiind o literă.
Nu sunt suportate caractere „speciale” cum ar fi spaţiu sau semne de punctuaţie.
Caractere ca $, @, # sau _ pot fi utilizate în interiorul numelui de variabilă. De exemplu,
a_#_$1 este un nume valid.
Terminarea numelui cu caracterul _ va fi evitată, deoarece poate da conflict cu
variabilele create automat de SPSS, şi care au această terminaţie.
Terminarea numelui cu semnul . va fi evitată, deoarece punctul este terminatorul uzual al
comenzilor SPSS, ceea ce poate conduce la erori.
În cazul utilizării unor caractere improprii, apare un mesaj de eroare şi se permite
corectarea numelui.
Alegerea numelui este la latitudinea operatorului. Respectarea anumitor convenţii poate fi
însă extrem de utilă, mai ales dacă avem de a face cu o baza de date cu multe variabile.
Iată câteva recomandări utile în acest sens (ele nu sunt obligatorii):
• Numele să exprime, pe cât posibil, conţinutul variabilei
• Pentru variabile „înrudite”, se va utiliza o schemă de denumire care să
exprime acest lucru. De exemplu, dacă avem variabile care cuprind
7/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală
Aşa cum se observă în caseta Define Variable Type din imaginea de mai sus, SPSS poate
opera cu o varietate de tipuri de variabile. Fiecărui tip îi corespund anumite proprietăţi
(caracteristici) care trebuie definite de operator. Cele mai uzuale sunt tipurile:
8/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală
[Caracter] (String), care cuprind valori exprimate sub formă de caractere alfanumerice (litere sau
chiar cifre).
Proprietăţi
• numărul de caractere rezervat, care este fixat implicit la 8 dar poate fi
modificat după dorinţă.
SPSS face distincţie între variabile de tip caracter „scurte” (Short string) şi „lungi” (Long
string). Primele au maxim 8 caractere şi pot fi incluse în unele proceduri statistice
(semnificaţia diferenţei între medii, de exemplu), pe când celelalte nu pot fi utilizate decât în
operaţii de listare (cazul variabilei de genul „nume”, de ex.).
Deşi permisă, utilizarea variabilelor „string” nu este de preferat. Toate variabilele care
suportă codificări vor fi, de preferinţă, introduse cu valori numerice, deoarece utilizarea
acestora în proceduri statistice nu este limitată de nici o restricţie.
Unităţi de timp calendaristic sau orar [Date], care pot include valori de timp într-un format
specificat, aşa cum se vede în imagine.
Proprietăţi
• formatul de introducere, care poate fi unul din cele evidenţiate în caseta
Define Variable Type/Date
Exemplu: dd-mmm-yyyy presupune introducerea unor valori de genul „21-FEB-2001”
(luna fiind scrisă obligatoriu după prescurtarea ei în engleză).
Există o mare varietate de formate pentru acest tip de variabilă, acoperind, practic, orice
cerinţă posibilă din partea utilizatorului.
Nu vom prezenta şi celelalte tipuri de variabile, ele fiind mai puţin folosite, dar facem
precizarea că semnificaţia lor poate fi găsită în Help-ul casetei Define Variable Type.
Tipul unei variabile poate fi schimbat ulterior prin simpla redefinire a acesteia. Se va
acorda atenţie mesajelor care pot să apară şi care avertizează asupra eventualelor
pierderi de informaţie prin schimbarea tipului variabilei.
Opţiunile din zona Measurement (Scale, Ordinal, Nominal), care se regăsesc doar la
versiuni SPSS de la 7.0 în sus, nu au întotdeauna o utilitate practică, dar marcarea lor
corectă este necesară pentru anumite proceduri statistice sau grafice.
9/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală
Deşi nimic nu ne obligă să aplicăm etichete variabilelor şi valorilor, este foarte recomandabil
ca ele să fie atribuite.
Etichetele ajută la citirea mai uşoară a rezultatelor (deoarece apar alături de acestea). În plus,
etichetele sunt asociate prelucrărilor grafice (histograme, bare, etc.) fapt care reduce
necesitatea de a le introduce ulterior prin editarea respectivelor grafice.
Pentru a şti cum să declarăm etichetele este bine să ni le imaginăm ca fiind înscrise pe axele
de referinţă ale unui grafic. Dacă „se potrivesc”, atunci au fost bine definite.
Oricum, ele vor putea fi modificate ulterior sau editate direct în SPSS Viewer.
Pentru declararea valorilor lipsă se acţionează butonul Missing Values din caseta Define
Variables, care generează apariţia casetei de dialog alăturate.
10/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală
Deşi nu pare foarte evidentă acum, utilitatea funcţiei de declarare a valorilor lipsă nu
trebuie subestimată. Foarte adesea suntem nevoiţi să scoatem din prelucrări anumite
valori (care nu pot fi totuşi, pur şi simplu, şterse). Să ne gândim numai la valorile extreme
ale unei distribuţii, a căror menţinere în anumite prelucrări poate determina modifcări
semnificative a rezultatelor.
Ştergerea unei variabile se face prin selectarea acesteia (clic pe capul de variabilă) şi
acţionarea tastei Delete (sau se comandă din meniul Edit-Cut).
Inserarea unei variabile se face prin plasarea cursorului-celulă pe coloana variabilei în
stânga căreia dorim să inserăm noua variabilă (sau prin selectarea variabilei respective),
după care se comandă, din meniul Data-Insert variable. După aceasta, se defineşte
variabila inserată (nume, tip, etichete).
Ştergerea cazurilor se face în mod similar variabilelor, prin selectarea acestora (clic pe
capul de linie) şi tasta Delete (sau Edit-Cut). Se pot selecta mai multe cazuri simultan
(drag cu mouse-ul pe capul liniilor) după care se şterg ca mai sus.
Inserarea cazurilor se face după plasarea cursorului pe linia deasupra căreia dorim să
inserăm un nou caz, după care se acţionează în meniul Data-Insert case.
11/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală
Pentru versiunile de SPSS de la 7 în sus, clic dreapta pe capul de coloană sau de linie,
produce un meniu contextual care permite un acces mai rapid la funcţiile de
inserare/ştergere a variabilelor sau cazurilor.
SPSS nu permite Undo (în meniul Edit) decât limitat la ultima acţiune. Din acest motiv,
ştergerea variabilelor sau a cazurilor trebuie să se facă cu atenţie, pentru că datele pot fi
definitiv pierdute. Se va reţine, totuşi, că baza de date se actualizează pe hard disk numai
după salvarea comandată de utilizator. Ca urmare...
Orice modificare efectuată nu produce efecte decât asupra datelor din memoria de lucru,
fişierul rămânând nemodificat.
În cazul unei acţiuni care produce efecte nedorite asupra bazei de date, există soluţia
închiderii bazei de date, fără a se accepta salvarea cerută de program, după care se
deschide fişierul respectiv din nou.
- Apariţia unor cazuri inutile, (umplute cu system missing values) la sfârşitul unei baze
de date.
Explicaţie: Introducerea inutilă a unei valori într-o variabilă, valoare care apoi este
ştearsă. Cu toate acestea, SPSS a creat deja un caz nou, pe care l-a umplut cu system missing
values.
Soluţie: Selectarea cazului prin apăsarea pe capul de linie şi acţionarea tastei Delete (sau
Edit-Cut).
- Apariţia unor variabile inutile (nedorite).
Explicaţie: La introducerea din greşeală a unei valori într-o variabilă nedefinită în
prealabil, SPSS creează automat o variabilă implicită, pe care o denumeşte VAR00001.
Soluţie: Se selectează variabilă respectivă (clic de mouse pe capul de coloană) şi se
acţionează tasta Delete (sau Edit-Cut).
12/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală
privire la aceiaşi
subiecţi)
Sexul SEX Numeric, Width 1, Decimal Sex 1=feminin
Places 0 2=masculin
Vârsta (în ani VIRSTA Numeric, Width 2, Decimal Vârsta
împliniţi; sau în Places 0
luni dacă dorim (presupunem că nu avem
mai multă precizie) subeicţi cu vârsta peste 99 de
ani)
Extraversiune EXTRAV Numeric, Width 2, Decimal Extraversiune
Places 0
(nu se poate obţine o valoare
mai mare de 100 şi nu există
zecimale)
Nevrozism NEVRO Numeric, Width 2, Decimal Nevrozism
Places 0
(nu se poate obţine o valoare
mai mare de 100 şi nu există
zecimale)
Lie LIE Numeric, Width 1, Decimal „Minciună”
Places 0
(nu se poate obţine o valoare
mai mare de 9 şi nu există
zecimale)
Deşi am scris aici numele de variabile cu litere mari, în SPSS se scriu cu litere mici,
majusculele nefiind recunoscute în numele de variabile. Se observă faptul că pentru variabile ale
căror nume exprimă exact conţinutul (SEX, VIRSTA) se poate utiliza fără nici un inconvenient
numele şi ca etichetă. Pentru a fi mai expliciţi, să spunem că numele variablei este util în primul
rând SPSS-ului pentru a manipula variabilele, în timp ce etichetele sunt necesare mai ales
utilizatorului pentru a înţelege cu uşurinţă la ce se referă o variabilă al cărui nume prea scurt.
Avem alăturat imaginea DATA EDITOR pentru primii trei subiecţi introduşi cu
variabilele de mai sus:
13/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală
a fiecărei înregistrări este suficientă (şi absolut necesară), scutind un mare volum de muncă
pe care l-ar implica introducerea numelor. Vom avea grijă însă, ca pe documentul original să
scriem codul numeric aferent fiecărui subiect, astfel încât, la nevoie, să se poată identifica
numele (pentru corecţii, de ex.)
Variabile multiple pentru întrebări cu răspuns multiplu: De obicei, o întrebare prezintă un
singur răspuns, dar pot fi situaţii în care o întrebare prezintă răspunsuri multiple care pot fi
alese în acelaşi timp. De exemplu: „Ce activităţi preferaţi pentru timpul liber? 1. sport; 2.
filme; 3. petreceri cu prieteni...”, etc. Într-un asemenea caz ne putem aştepta să avem mai
multe răspunsuri la aceeaşi întrebare. Soluţia pentru introducerea datelor este, de aceea,
crearea mai multor variabile, câte una pentru fiecare variantă de răspuns. Astfel, vom avea
variabila „SPORT” care poate primi două valori, sa zicem „1” dacă este aleasă şi „0” dacă nu
este aleasă, şi aşa mai departe. În acest mod vom putea analiza frecvenţa alegerilor pentru
fiecare variantă de răspuns în parte.
Evitarea variabilelor redundante: Dacă la un test nu sunt posibile, de exemplu, decât
răspunsuri corecte sau greşite, atunci nu este necesar să declarăm o variabilă pentru „corecte”
şi una pentru „greşite” dacă suma lor dă totalul răspunsurilor.
O bază de date aflată în lucru nu are un corespondent într-un fişier decât după ce se
execută o salvare a acesteia. Acest lucru nu trebuie niciodată uitat. Spre deosebire de WORD de
exemplu, SPSS nu are o funcţie de salvare automată după un interval de timp prestabilit. Cu alte
cuvinte, indiferent ce modificări facem în Data Editor pe ecran, datele respective vor fi salvate
numai la comanda explicită a operatorului.
Pentru o bază de date nou creată, salvarea se face în mod similar cu orice alt program
cunoscut: File-Save as, care deschide următoarea casetă de dialog:
Se alege locaţia de salvare (Save in)
Se dă un nume fişierului (File name)
Se verifică tipul de fişier (formatul implicit pentru baze de date SPSS are extensia .sav)
Se acţionează Save
SPSS poate salva şi în alte formate, dintre cele mai importante fiind: Dbase sau
FoxPro, Lotus 1-2-3, Excel. Salvarea în aceste formate poate fi utilă pentru transferul
datelor pentru prelucrări ulterioare în alte programe.
14/15
Actualizat la: 27.02.2006
M. Popa – Aplicaţii SPSS – Prezentare generală
În cazul deschiderii unui fişier de alt tip decât SPSS, se va alege tipul respectiv din
lista Files of type. În cazul în care SPSS nu recunoaşte tipul de fişier în care se află
datele noastre, putem încerca transformarea lor prealabilă din formatul original într-
un format recunoscut de SPSS. Deşi există riscul pierderii unor aspecte ce ţin de
formatul de reprezentare a datelor, operaţiunea scuteşte totuşi un mare volum de
muncă.
Sarcină de lucru
15/15
Actualizat la: 27.02.2006