Documente Academic
Documente Profesional
Documente Cultură
SPSS for Windows este un pachet de programe destinat analizei statistice a datelor.
Dei exist o varietate de programe de acest gen (SAS, Statistica for Windows, GraphPad, MS
Excel, care are i el funcii statistice), SPSS se distinge prin structurarea riguroas i uurina
utilizrii, chiar i pentru nceptori.
Cea mai recent versiune disponibil la aceast dat este SPSS 14.0, dar acest manual nu
acoper n mod special o anumit versiune, ci face referire n general la versiunile sub Windows.
n esen, toate versiunile sub Windows ofer acelai pachet de funcii statistice de baz, iar
diferenele, chiar dac sunt, nu sunt relevante la nivelul unui curs introductiv de statistic.
Acest simbol plasat naintea unei propoziii indic introducerea unei informaii
importante, care se impune a fi reinut.
Ne vom axa pe o prezentare sintetic, considernd cunoscute elementele de baz de
operare n mediul Windows.
Funcii de baz ale SPSS
Dac privim n ansamblu funciile pachetului de programe SPSS, acestea sunt
urmtoarele:
O sesiune de lucru cu SPSS presupune, n mod necesar, existena unei baze de date.
SPSS opereaz cu o singur baz de date la un moment dat. De la versiunea 14, SPSS
poate deschide simultan mai multe baze de date.
Pentru a deschide o alt baz de date, sau pentru a crea una nou, cea aflat n lucru va fi
nchis. Programul solicit salvarea ei prealabil, dac acest lucru nu a fost deja efectuat.
Dac vrem s prelucrm date aflate n baze de date (fiiere) diferite, este necesar
aducerea lor n aceeai baz de date (procedura DATA-Merge files, care va fi descris mai
trziu).
Meniurile ferestrei Data Editor nu se vor activa integral dect atunci cnd va exista cel
puin o variabil definit i valori pentru cel puin un caz.
Baza de date SPSS poate fi creat direct, cu ajutorul structurii (ferestrei) Data Editor, sau
poate fi deschis cu ajutorul comenzii File-Open, aa cum vom exemplifica mai trziu.
Fiierele cu baze de date SPSS au extensia .sav.
2/15
Actualizat la: 27.02.2006
Meniurile SPSS
Meniurile de tip list se aseamn cu meniurile altor programe sub Windows. Fr a intra
n amnunte, iat o descriere succint a meniurilor pentru fereastra DATA EDITOR:
Meniul
File
Funcii principale
Operaii de deschidere i salvare de fiiere
Operaii de Select/Copy/Cut/Paste, Find i, cel
mai important, setarea caracteristicilor de lucru ale
Edit
SPSS (Options-n versiunile pt. Win 9X)
n cazul ferestrei Data Editor, seteaz modul de
afiare: cu sau fr bara de butoane, cu sau fr
View
liniile despritoare ale celulelor.
Funcii de operare cu variabilele; definire,
inserare, tergere, selectare, sortare, adiionare de
Data
fiiere, etc.
Funcii de modificare a datelor prin calculare,
Transform
recodificare.
Statistics
(Analyze)
Graph
Utilities
Observaii
3/15
Actualizat la: 27.02.2006
Meniul
Window
Help
Funcii principale
Lista ferestrelor deschise cu posibilitatea de
selecie
Observaii
Informaii de ajutor
Casetele de dialog
Casetele de dialog sunt formulare grafice care permit declararea i setarea procedurilor de
calcul cu SPSS. Acestea se deschid dup lansarea n execuie a unei comenzi din meniu. Uneori,
caseta principal, care se deschide direct din meniu, are comenzi de deschidere a uneia sau mai
multor casete secundare. Odat deschis o caset secundar, revenirea la caseta principal se
poate face numai prin finalizarea i nchiderea casetei secundare.
Dei sunt diferite de la o procedura la alta, casetele de dialog au o concepie comun.
Redm mai jos, spre exemplificare, caseta principal Descriptives i caseta secundar
Descriptives: Options, care sunt activate din meniul Statistics-Summarize-Descriptives...
Caseta principal Descriptives
Lista de variabile
disponibile
Check Box
Lista de variabile
supuse procedurii
Buton de transfer
variabile
Butonul de finalizare a
casetei secundare
Butoane de comenzi:
OK: Ruleaz procedura i nchide caseta de dialog principal.
Paste: Copie comenzile procedurii ntr-o fereastr Syntax, de unde poate fi editat i lansat
direct. Recomandat pentru situaiile n care dorim s modificm manual procedura (necesit
cunotine avansate).
Reset: Reseteaz caseta de dialog, aducnd-o la setrile implicite de sistem, fr s pstreze nici o
setare anterioar. Recomandat atunci cnd dorim restructurarea complet a unei proceduri
anterior executat din acea caset.
Cancel: Anuleaz setrile efectuate dup deschiderea casetei.
Help: Informaii de ajutor contextuale pentru procedura definit de caseta respectiv.
4/15
Actualizat la: 27.02.2006
Introducerea datelor
Pregtirea datelor
3
4
Selectarea procedurii
satistice
Selectarea variabilelor
ce urmeaz a fi supuse
prelucrrii
Rularea procedurii
Analiza rezultatelor
Editarea rezultatelor
Opiuni:
(a) Introducerea direct a datelor n DATA EDITOR
(b) Deschiderea unui fiier de date SPSS (extensia .sav)
(c) Importarea unui fiier de format diferit (se alege din caseta
File open/File of type)
Corecia erorilor, selecii, recodificri, transformarea variabilelor
prin calcule, declararea valorilor lips, combinarea datelor din
dou fiiere diferite (meniurile Data, Transform)
Meniurile Statistics (sau Analyze) i Graphs
n conformitate cu configuraia casetei de dialog care este afiat
la fiecare procedura
Se acioneaz butonul OK din caseta de dialog a procedurii
Butonul devine activ numai atunci cnd sunt ntrunite
condiiile presupuse de procedura respectiv
Rezultatele prelucrrilor sunt afiate ntr-o fereastr specific
(SPSS Viewer), cu funciuni de editare grafic sau de tip text, n
funcie de versiune.
Se editeaz rezultatele afiate n Viewer, aducndu-le la forma
dorit sub aspect grafic
Dublu clic pe un element din Viewer conduce la intrarea
elementului respectiv n regim de editare)
Rezultatele din SPSS Viewer se preiau cu Select/Copy i se
depun cu Paste n orice tip de editor de documente.
SPSS este un program puternic de analiz statistic a datelor. Utilizarea lui optim presupune,
n mod necesar, stpnirea de ctre operator a cunotinelor teoretice de statistic.
Aa cum un program de editare grafic nu compenseaz lipsa de talent la desen, nici SPSS nu
poate fi cu adevrat exploatat de ctre cei care nu au cunotine de statistic. n lipsa acestora,
nici alegerea procedurilor i nici interpretarea rezultatelor nu va fi cu adevrat posibil.
5/15
Actualizat la: 27.02.2006
Editarea datelor
O baz de date n SPSS este o structur format din linii i coloane, la intersecia crora
se formeaz celulele care conin, fiecare, o anumit unitate de informaie.
Existena unei baze de date deschis n fereastra Data Editor este o condiie obligatorie
pentru operarea cu SPSS.
SPSS opereaz numai cu o singur baz de date deschis la un moment dat.
n principiu, o baz de date SPSS se obine pe una din urmtoarele ci:
a) Crearea ei prin operaiunea de definire a variabilelor i introducerea datelor de la
tastatur;
b) Deschiderea unei baze de date SPSS, existente pe un suport de memorie;
c) Importarea unei baze de date din alt format dect SPSS
n continuare, vom trata pe rnd fiecare din cele trei situaii:
a) Crearea unei baze de date SPSS
n linii generale, pentru crearea unei baze de date proprii n SPSS, se procedeaz astfel:
Se lanseaz SPSS
Se definesc variabilele bazei de date n domeniul Data Editor
Se introduc datele pentru fiecare caz (subiect) n parte
Se salveaz baza de date (extensia specific este .sav)
Definirea variabilelor
se acioneaz Define variable din meniul Data
o soluie mai direct este dublu clic pe capul de coloan
6/15
Actualizat la: 27.02.2006
n versiunile mai recente de SPSS editarea variabilei nu presupune acest tip de caset,
dar toatele elementele ei constitutive se regsesc.
Numele variabilei:
Orice variabil SPSS trebuie s aib un nume. Cele mai importante aspecte legate de
denumirea variabilelor sunt urmtoarele:
Trebuie sa fie format din minim 1, maxim 8 caractere, primul caracter fiind o liter.
Nu sunt suportate caractere speciale cum ar fi spaiu sau semne de punctuaie.
Caractere ca $, @, # sau _ pot fi utilizate n interiorul numelui de variabil. De exemplu,
a_#_$1 este un nume valid.
Terminarea numelui cu caracterul _ va fi evitat, deoarece poate da conflict cu
variabilele create automat de SPSS, i care au aceast terminaie.
Terminarea numelui cu semnul . va fi evitat, deoarece punctul este terminatorul uzual al
comenzilor SPSS, ceea ce poate conduce la erori.
n cazul utilizrii unor caractere improprii, apare un mesaj de eroare i se permite
corectarea numelui.
Alegerea numelui este la latitudinea operatorului. Respectarea anumitor convenii poate fi
ns extrem de util, mai ales dac avem de a face cu o baza de date cu multe variabile.
Iat cteva recomandri utile n acest sens (ele nu sunt obligatorii):
Numele s exprime, pe ct posibil, coninutul variabilei
Pentru variabile nrudite, se va utiliza o schem de denumire care s
exprime acest lucru. De exemplu, dac avem variabile care cuprind
7/15
Actualizat la: 27.02.2006
Aa cum se observ n caseta Define Variable Type din imaginea de mai sus, SPSS poate
opera cu o varietate de tipuri de variabile. Fiecrui tip i corespund anumite proprieti
(caracteristici) care trebuie definite de operator. Cele mai uzuale sunt tipurile:
[Numeric], care cuprind valori de tip numeric cu sau fr zecimale.
Proprieti:
numrul de cifre necesare pentru exprimarea ntregilor
numrul de zecimale
EXEMPLE:
Pentru o variabil n care vom introduce vrsta n ani mplinii, vom defini Type
Numeric cu Width 2 (presupunnd c nu avem subieci cu vrsta peste 100 de
ani) i Decimal Places 0.
Pentru o variabil n care vom introduce rezultatul la un test exprimat n scoruri
T cu o zecimal, definim Type Numeric cu Width 2 i Decimal Places 1.
8/15
Actualizat la: 27.02.2006
[Caracter] (String), care cuprind valori exprimate sub form de caractere alfanumerice (litere sau
chiar cifre).
Proprieti
numrul de caractere rezervat, care este fixat implicit la 8 dar poate fi
modificat dup dorin.
SPSS face distincie ntre variabile de tip caracter scurte (Short string) i lungi (Long
string). Primele au maxim 8 caractere i pot fi incluse n unele proceduri statistice
(semnificaia diferenei ntre medii, de exemplu), pe cnd celelalte nu pot fi utilizate dect n
operaii de listare (cazul variabilei de genul nume, de ex.).
Dei permis, utilizarea variabilelor string nu este de preferat. Toate variabilele care
suport codificri vor fi, de preferin, introduse cu valori numerice, deoarece utilizarea
acestora n proceduri statistice nu este limitat de nici o restricie.
Uniti de timp calendaristic sau orar [Date], care pot include valori de timp ntr-un format
specificat, aa cum se vede n imagine.
Proprieti
formatul de introducere, care poate fi unul din cele evideniate n caseta
Define Variable Type/Date
Exemplu: dd-mmm-yyyy presupune introducerea unor valori de genul 21-FEB-2001
(luna fiind scris obligatoriu dup prescurtarea ei n englez).
Exist o mare varietate de formate pentru acest tip de variabil, acoperind, practic, orice
cerin posibil din partea utilizatorului.
Variabilele de tip Date beneficiaz de funcii speciale de tratare i analiz n SPSS.
Nu vom prezenta i celelalte tipuri de variabile, ele fiind mai puin folosite, dar facem
precizarea c semnificaia lor poate fi gsit n Help-ul casetei Define Variable Type.
Tipul unei variabile poate fi schimbat ulterior prin simpla redefinire a acesteia. Se va
acorda atenie mesajelor care pot s apar i care avertizeaz asupra eventualelor
pierderi de informaie prin schimbarea tipului variabilei.
Opiunile din zona Measurement (Scale, Ordinal, Nominal), care se regsesc doar la
versiuni SPSS de la 7.0 n sus, nu au ntotdeauna o utilitate practic, dar marcarea lor
corect este necesar pentru anumite proceduri statistice sau grafice.
Etichetarea variabilelor i a valorilor
Etichetarea este o form de descriere explicit a coninutului variabilei, avnd n vedere
c numele variabilei nu poate fi mai mare de 8 caractere (limitare care dispare la versiunile mai
recente de SPSS). Etichetarea se poate practica att la nivelul variabilei, dar i la valorile pe care
le conine, n cazul variabilelor de tip nominal sau ordinal.
9/15
Actualizat la: 27.02.2006
Dei nimic nu ne oblig s aplicm etichete variabilelor i valorilor, este foarte recomandabil
ca ele s fie atribuite.
Etichetele ajut la citirea mai uoar a rezultatelor (deoarece apar alturi de acestea). n plus,
etichetele sunt asociate prelucrrilor grafice (histograme, bare, etc.) fapt care reduce
necesitatea de a le introduce ulterior prin editarea respectivelor grafice.
Pentru a ti cum s declarm etichetele este bine s ni le imaginm ca fiind nscrise pe axele
de referin ale unui grafic. Dac se potrivesc, atunci au fost bine definite.
Oricum, ele vor putea fi modificate ulterior sau editate direct n SPSS Viewer.
Declararea valorilor lips (missing values)
Valorile lips sunt de dou tipuri:
valori lips de sistem (system missing values) adic valori care lipsesc din baza de date
(nu au fost introduse, nu au fost recoltate). Forma lor de evideniere pe ecran este un
punct plasat n celula respectiv.
valori lips declarate de utilizator (user missing values) adic valori pe care utilizatorul le
declar ca atare. Acestea pot exista n baza de date, dar utilizatorul, din diverse motive,
nu dorete s fie luate n calcul. Atenie, odat declarate, aceste valori nu sunt terse i
nici nu sunt marcate n mod evident pe ecran.
Pentru declararea valorilor lips se acioneaz butonul Missing Values din caseta Define
Variables, care genereaz apariia casetei de dialog alturate.
10/15
Actualizat la: 27.02.2006
11/15
Actualizat la: 27.02.2006
Pentru versiunile de SPSS de la 7 n sus, clic dreapta pe capul de coloan sau de linie,
produce un meniu contextual care permite un acces mai rapid la funciile de
inserare/tergere a variabilelor sau cazurilor.
SPSS nu permite Undo (n meniul Edit) dect limitat la ultima aciune. Din acest motiv,
tergerea variabilelor sau a cazurilor trebuie s se fac cu atenie, pentru c datele pot fi
definitiv pierdute. Se va reine, totui, c baza de date se actualizeaz pe hard disk numai
dup salvarea comandat de utilizator. Ca urmare...
Orice modificare efectuat nu produce efecte dect asupra datelor din memoria de lucru,
fiierul rmnnd nemodificat.
n cazul unei aciuni care produce efecte nedorite asupra bazei de date, exist soluia
nchiderii bazei de date, fr a se accepta salvarea cerut de program, dup care se
deschide fiierul respectiv din nou.
Erori frecvente la editarea datelor
Apariia unor cazuri inutile, (umplute cu system missing values) la sfritul unei baze
de date.
Explicaie: Introducerea inutil a unei valori ntr-o variabil, valoare care apoi este
tears. Cu toate acestea, SPSS a creat deja un caz nou, pe care l-a umplut cu system missing
values.
Soluie: Selectarea cazului prin apsarea pe capul de linie i acionarea tastei Delete (sau
Edit-Cut).
- Apariia unor variabile inutile (nedorite).
Explicaie: La introducerea din greeal a unei valori ntr-o variabil nedefinit n
prealabil, SPSS creeaz automat o variabil implicit, pe care o denumete VAR00001.
Soluie: Se selecteaz variabil respectiv (clic de mouse pe capul de coloan) i se
acioneaz tasta Delete (sau Edit-Cut).
-
Numele
variabilei
COD
(optm pentru
un cod
numeric dac
nu avem
nevoie de
numele
subiecilor)
Tipul variabilei
numeric, Width 2, Decimal
Places 0
(presupunem c nu avem mai
mult de 99 subieci)
Eticheta
variabilei
Identitate
Etichetele
valorilor
Nu se aplic
etichete dect
la valorile
variabilelor de
tip categorial
(nominale sau
ordinale)
12/15
Actualizat la: 27.02.2006
privire la aceiai
subieci)
Sexul
SEX
Vrsta (n ani
mplinii; sau n
luni dac dorim
mai mult precizie)
VIRSTA
Extraversiune
EXTRAV
Nevrozism
NEVRO
Lie
LIE
Sex
1=feminin
2=masculin
Vrsta
Extraversiune
Nevrozism
Minciun
Dei am scris aici numele de variabile cu litere mari, n SPSS se scriu cu litere mici,
majusculele nefiind recunoscute n numele de variabile. Se observ faptul c pentru variabile ale
cror nume exprim exact coninutul (SEX, VIRSTA) se poate utiliza fr nici un inconvenient
numele i ca etichet. Pentru a fi mai explicii, s spunem c numele variablei este util n primul
rnd SPSS-ului pentru a manipula variabilele, n timp ce etichetele sunt necesare mai ales
utilizatorului pentru a nelege cu uurin la ce se refer o variabil al crui nume prea scurt.
Avem alturat imaginea DATA EDITOR pentru primii trei subieci introdui cu
variabilele de mai sus:
a fiecrei nregistrri este suficient (i absolut necesar), scutind un mare volum de munc
pe care l-ar implica introducerea numelor. Vom avea grij ns, ca pe documentul original s
scriem codul numeric aferent fiecrui subiect, astfel nct, la nevoie, s se poat identifica
numele (pentru corecii, de ex.)
Variabile multiple pentru ntrebri cu rspuns multiplu: De obicei, o ntrebare prezint un
singur rspuns, dar pot fi situaii n care o ntrebare prezint rspunsuri multiple care pot fi
alese n acelai timp. De exemplu: Ce activiti preferai pentru timpul liber? 1. sport; 2.
filme; 3. petreceri cu prieteni..., etc. ntr-un asemenea caz ne putem atepta s avem mai
multe rspunsuri la aceeai ntrebare. Soluia pentru introducerea datelor este, de aceea,
crearea mai multor variabile, cte una pentru fiecare variant de rspuns. Astfel, vom avea
variabila SPORT care poate primi dou valori, sa zicem 1 dac este aleas i 0 dac nu
este aleas, i aa mai departe. n acest mod vom putea analiza frecvena alegerilor pentru
fiecare variant de rspuns n parte.
Evitarea variabilelor redundante: Dac la un test nu sunt posibile, de exemplu, dect
rspunsuri corecte sau greite, atunci nu este necesar s declarm o variabil pentru corecte
i una pentru greite dac suma lor d totalul rspunsurilor.
Salvarea bazei de date din Data Editor
O baz de date aflat n lucru nu are un corespondent ntr-un fiier dect dup ce se
execut o salvare a acesteia. Acest lucru nu trebuie niciodat uitat. Spre deosebire de WORD de
exemplu, SPSS nu are o funcie de salvare automat dup un interval de timp prestabilit. Cu alte
cuvinte, indiferent ce modificri facem n Data Editor pe ecran, datele respective vor fi salvate
numai la comanda explicit a operatorului.
Pentru o baz de date nou creat, salvarea se face n mod similar cu orice alt program
cunoscut: File-Save as, care deschide urmtoarea caset de dialog:
Se alege locaia de salvare (Save in)
Se d un nume fiierului (File name)
Se verific tipul de fiier (formatul implicit pentru baze de date SPSS are extensia .sav)
Se acioneaz Save
SPSS poate salva i n alte formate, dintre cele mai importante fiind: Dbase sau
FoxPro, Lotus 1-2-3, Excel. Salvarea n aceste formate poate fi util pentru transferul
datelor pentru prelucrri ulterioare n alte programe.
Deschiderea unei baze de date SPSS
O baz de date creat cu SPSS se deschide cu comanda File-Open, care activeaz
urmtoarea caset de dialog:
Se alege locaia de citire (Look in)
Se indic fiierul dorit (selectarea cu mouse-ul) n fereastra de cutare
14/15
Actualizat la: 27.02.2006
n cazul deschiderii unui fiier de alt tip dect SPSS, se va alege tipul respectiv din
lista Files of type. n cazul n care SPSS nu recunoate tipul de fiier n care se afl
datele noastre, putem ncerca transformarea lor prealabil din formatul original ntrun format recunoscut de SPSS. Dei exist riscul pierderii unor aspecte ce in de
formatul de reprezentare a datelor, operaiunea scutete totui un mare volum de
munc.
Sarcin de lucru
1. Se va crea o baza de date corespunztoare urmtoarei structuri de valori:
-
15/15
Actualizat la: 27.02.2006