Laborator 1b - Definirea Variabilelor in IBM SPSS Statistics

Cristian Opariuc-Dan
I.5.1
Definirea variabilelor i introducerea datelor n IBM SPSS Statistics
Figura I-16 Fereastra principal IBM SPSS Statistics
IBM SPSS Statistics a ajuns la versiunea 22 n momentul n care scriem

aceste rnduri i ofer faciliti avansate de procesare statistic a datelor,
folosind o interfa grafic foarte prietenoas, relativ uor de nvat, elemente
care au stat la baza popularitii sale.
48
Msurarea n tiinele socio-umane
Pentru nceput, vom observa asemnarea cu un alt program, mult mai

bine cunoscut, i anume Microsoft Excel. Chiar dac se pot face analize de date
suficient de elaborate folosind Microsoft Excel, utilizarea unei aplicaii
specializate n analiza de date ofer o mai mare flexibilitatea i o mai bun
claritate. Microsoft Excel este, totui, un program pentru foi de calcul tabelar i
nu o aplicaie dedicat analizei de date.
n IBM SPSS Statistics, ca n orice alt aplicaie de analiz de date,
variabilele sunt reprezentate pe coloane iar datele se introduc pe rnduri.
Numele variabilelor se afieaz n capul de
tabel, fiind, implicit, var. Primul lucru pe
care va trebui s-l remarcm este tabulatorul
de comutare ntre modul de vizualizare a
Figura I-17 Tabulatorul de comutare a
modului de vizualizare
datelor i modul de definire a variabilelor,

situat n colul din dreapta jos al ferestrei
principale (vezi Figura I-17). Butonul Data View comut n seciunea destinat
introducerii datelor, aceasta fiind seciunea implicit, activ atunci cnd pornii
programul. Doar c, pentru a putea introduce datele, va trebui s fi definit n
prealabil variabilele. Nu este cazul nostru, din acest motiv va trebui s efectum
click pe butonul Variable View pentru a comuta n seciunea de definire a
variabilelor, practic o implementare computerizat a tabelului meta-datelor
discutat mai sus.
Figura I-18 Structura tabelului meta-datelor n IBM SPSS Statistics
Prima coloan a tabelului meta-datelor, Name, se refer la numele

variabilei, acel nume inteligibil pentru computer, nu pentru om. n conformitate
49
cu specificaiile prevzute n tabelul meta-datelor proiectat (vezi Tabel I-1), aici

vom introduce varsta pentru a denumi variabila Vrsta subiecilor, gen
pentru a denumi variabila Gen biologic, niv_edu pentru nivelul educaional,
i aa mai departe.
Urmtoarele trei coloane (Type, Width i Decimals) permit, toate
trei,
stabilirea
tipului
acesteia.
Ne
reamintim c variabila varsta a fost

Figura I-19 Definirea tipului unei variabile
definit ca numeric, fr zecimale,
compus din trei cifre N(3). Dup ce am terminat de introdus numele variabilei
i am prsit celula, IBM SPSS Statistics a completat automat tipul variabilei, n
funcie de configuraia sa, definind-o drept N(8.2). Adic, o variabil numeric,
avnd 8 caractere ntregi i dou caractere zecimale. Dimensiunea este mult
prea mare fa de ce avem noi nevoie, prin urmare vom scrie, n celula
Decimals, n loc de 2 cifra 0, iar n celula Width, n loc de 8 cifra 3.
Rareori vom avea nevoie s
schimbm tipul variabilei, deoarece,
aa cum tim, n analiza de date se
impune
acestora.
codarea
Dac
numeric
dorim,
putem
efectua click n celula Type din

Figura I-20 Modificarea tipului de variabil
dreptul variabilei pe care o definim,

moment n care, n partea dreapt,
se va afia un buton ce conine trei puncte de suspensie (
), pe care
putem aps pentru a se afia fereastra din Figura I-20. Primele patru opiuni
reprezint diferite moduri de definire a numerelor, n partea dreapt putnd
50
stabili numrul de cifre ale ntregilor i numrul de cifre ale zecimalelor, la fel ca
mai sus.
Opiunea
Date
are
vedere date de tip calendaristic.

Dac o alegem, n partea dreapt
dispar
elementele
Width
Decimals i apare o list din care

putei selecta formatul de dat
Figura I-21 Configurarea tipului calendaristic de
date
calendaristic
solicitat
pentru
introducerea scorurilor. Tipul de
dat calendaristic se poate folosi, de exemplu, dac dorim s stocm data

naterii, pentru ca ulterior, la analiza datelor, s putem calcula vrsta exact a
persoanelor n ani, luni, zile i ore, n funcie de nivelul de precizie solicitat.
Datele calendaristice se utilizeaz mai mult n medicin sau acolo unde putem
vorbi despre analiza seriilor temporare, ori n cercetrile experimentale de
supravieuire din industria farmaceutic.
Opiunile Dollar i Custom
currency intuii la ce se refer; n
mod cert la monede. Dac alegei
dolar, sumele vor fi exprimate n
moneda american, fiind precedate
de simbolul $. n definitiv, o
Figura I-22 Configurarea tipului monetar de date
moned este tot un numr, aa c, la

configurarea opiunii, alturi de lista
de alegere a modului de reprezentare, reapar elementele Width i Decimal

Places. Cealalt opiune permite definirea unei alte monede, exceptnd
51
dolarul. Putem alege formatul de reprezentare, numrul de ntregi i numrul

de zecimale, la fel ca n cazul monedei americane.
Opiunea String definete
iruri de caractere, texte, fiind
folosit atunci cnd avem itemi cu
rspunsuri
Altceva.
deschise,
Ce?
sau
de
genul
Altcineva.
Care? i permite introducerea de

Figura I-23 Configurarea tipului text de date
text brut. Singura modalitate de

configurare ine de numrul de
caractere acceptate, valoare pe care o putem introduce n caseta Characters.

Dup cum tii deja, un astfel de tip de date este nerecomandat n analiz, din
acest motiv fiind foarte rar folosit. Singura utilizare oarecum pertinent ar fi
aceea n care am stoca numele persoanelor, n vederea unei identificri
ulterioare.
Ultimul tip de date, Restricted Numeric, este un numr ntreg, fr
zecimale, dar la care se completeaz cu zero valorile din fa. De exemplu, dac
l-am defini ca N(3), atunci valoarea 9 va fi reprezentat ca 009 i nu simplu,
9.
Dup ce am terminat configurarea tipului variabilei, putem apsa
butonul OK pentru a memora aceste setri, sau butonul Cancel dac dorim
s prsim formularul i s revenim la configuraia iniial, fr a reine noua
configuraie.
Dac numele variabilei, aa cum l recunoate computerul, a fost
introdus n celula coloanei Name, denumirea acesteia, inteligibil pentru om,
se va introduce n celula coloanei Label. n cazul nostru, acolo vom scrie,
52
pentru variabila varsta, eticheta Vrsta subiecilor. Dac lsm

necompletat aceast celul, n rapoartele generate de IBM SPSS Statistic se va
folosi numele variabilei. Acesta va fi nlocuit dac exist informaii despre
etichet, fapt care permite o afiare mult mai elegant i mai comprehensibil
a informaiilor. Iat de ce v recomandm s completai ntotdeauna celula
Label.
Coloanele Columns i Align nu afecteaz definiia variabilelor, ci
felul n care sunt afiate datele. n celula Align putem specifica modul n care
se aliniaz textul: la dreapta (Right) n cazul numerelor, la stnga (Left) sau
centrat (Center) n cazul textelor, ns aceast convenie poate fi ignorat. n
definitiv, putei configura aspectul dup preferinele dumneavoastr. Celula
Columns permite stabilirea limii coloanei de date. Cu ct numrul este mai
mare, cu att limea coloanei variabilei respective va fi, i ea, mai mare. Nu ar
trebui s v facei probleme privind aceast valoare, deoarece putei s
modificai limea unei coloane trgnd cu mausul de linia de separaie dintre
dou coloane, ca la orice tabel.
Coloana Measure permite definirea unei caracteristici foarte
importante pentru o variabil, i anume nivelul de msur. La crearea unei
variabile, nivelul de msur nu este precizat (Unknown). Putem alege nivelul
de interval sau de raport n cazul variabilelor continui, parametrice, alegnd
opiunea Scale. Dac variabila este una discret i are categorii ordonate, vom
alege opiunea Ordinal, iar dac avem n vedere o variabil categorial,
opiunea ce va trebui aleas este Nominal.
Ultima coloan, Role, corespunde oarecum scopului variabilei din
tabelul meta-datelor (Tabel I-1). Opiunea implicit este Input i vizeaz o
variabil ale crei valori sunt introduse manual. Vorbim, astfel, de variabile
53
realizate prin observare direct, din surse externe de date, aceasta fiind situaia
tuturor variabilelor din exemplul nostru. Opiunea Target are n vedere
realizarea variabilei din alte variabile, prin transformri sau calcule. De exemplu,
dac din variabila varsta construim o nou variabil, numit grup_varsta,
aceast nou variabil este considerat de acest tip. Atunci cnd o variabil se
poate realiza i direct, i prin calcul, opiunea aleas va fi Both. De exemplu,
variabila varsta poate fi de acest tip, dac iniial am introdus manual datele,
apoi am decis s eliminm valorile vrstei pentru toi subiecii minori, acest
lucru fiind obinut n urma unei operaiuni de transformare. Opiunea None
arat c variabilei nu i-a fost atribuit niciun rol sau c rolul su nu este bine
cunoscut. De obicei, se folosete atunci cnd datele sunt importate dintr-un alt
program sau am preluat o baz de date de la o persoan nefamiliarizat suficient
cu aceast aplicaie, i nu tim cum s-au obinut, astfel, datele. Opiunile
Partition i Split se folosesc n cazul variabilelor pe baza crora se scindeaz,
logic, fiierul de date, diferena dintre ele innd doar de modul n care s-au
mprit datele. Dac scindarea bazei de date s-a realizat folosind un criteriu de
selecie a cazurilor n care s-a inclus variabila, atunci aceasta are un rol de
partiionare. Dac este vorba despre o variabil categorial, pe baza categoriilor
acesteia mprindu-se fiierul, atunci avem de a face cu o variabil Split. Spre
exemplu, putem alege una dintre cele dou opiuni dac facem analize de date
separat pentru brbai i separat pentru femei (variabila gen fiind o variabil
cu rol de Split), sau dac alegem spre analiz doar brbaii cu vrsta peste 20
de ani (variabilele gen i varsta sunt variabile de partiionare).
Declararea rolului unei variabile nu are vreun efect asupra analizei de
date, aa cum tim, ns poate comunica unui alt cercettor modul n care au
fost obinute i prelucrate datele, fapt ce arat o tratare profesional i serioas
54
a acestor sarcini. Iat cum am
reuit s definim prima variabil, vrsta
subiecilor:
Figura I-24 Definirea complet a variabilei varsta
I.5.1.1
Definirea valorilor ce vor fi tratate drept cazuri lips
Au rmas doar dou coloane pe care nu le-am discutat, una dintre

acestea fiind coloana Missing, ce nu se refer la tratarea situaiilor n care
lipsesc valori din baza de date, ci la momentele cnd anumite valori ar trebui
tratate drept cazuri lips. Pentru a defini asemenea situaii, vom apsa pe
acelai buton cu puncte de suspensie, ce va putea fi observat atunci cnd
efectum click n celula variabilei, din coloana Missing.
Implicit,
IBM
SPSS
Statistics
presupune c nu dorim s definim valori ce

vor fi tratate drept cazuri lips, asemenea
situaii innd doar de absena efectiv a
scorurilor.
Figura I-25 Definirea valorilor tratate
drept cazuri lips
Din
acest
motiv,
opiunea
selectat atunci cnd deschidei formularul

este No missing values. Am putea, spre
exemplu, desfura un sondaj de opinie, n care anumite ntrebri s aib

variantele de rspuns Nu tiu i Nu rspund. De multe ori, studiile
sociologice, mai ales n cazul opiniilor politice, presupun excluderea variantelor
de tip Nu tiu/Nu rspund, tocmai pentru a se putea sesiza distribuia
preferinelor persoanelor hotrte. Iat de ce asemenea variante de rspuns
primesc, de obicei, coduri numerice 99 sau 98, pentru o asemenea codare
optnd i n exemplul de fa. Nu putem renuna de tot la cele dou variante,
lsnd celulele necompletate, deoarece situaia nehotrilor ar putea fi
55
solicitat n vederea unei alte analize, ns putem alege opiunea Discrete

missing values. Se activeaz cele trei casete, corespunztoare introducerii unui
numr maxim de trei valori unice, acestea fiind tratate drept cazuri lips.
n situaia n care am dori ca ambele
Figura I-26 Tratarea unor valori
unice drept cazuri lips
categorii, att Nu tiu (98) ct i Nu rspund

(99), s fie tratate drept cazuri lips, computerul
ignorndu-le ca i cnd ar fi celule necompletate, am include codurile acestora

n dou dintre cele trei caste de text, ca n Figura I-26. Dac am mai avea o
variant de rspuns, de exemplu Niciunul (9), am putea include i aceast
valoare n cea de-a treia caset. IBM SPSS Statistics nu permite introducerea a
mai mult de trei valori care s fie tratate drept cazuri lips, ns sunt foarte rare
situaiile n care chiar am avea nevoie de aa ceva.
Un alt scenariu ar fi acela n care ni s-ar
solicita s tratm minorii i persoanele care nu
Figura I-27 Tratarea unui interval de au vrut, n mod explicit, s declare vrsta, ca i
valori i a unei valori unice drept
cazuri lips
cnd nu ar fi completat celulele acestei
variabile, adic s tratm aceste situaii drept cazuri lips. Minore sunt toate
persoanele cu vrsta cuprins ntre 0 i 18 ani, iar pentru persoanele care au
refuzat explicit s comunice vrsta, am ales codul 999. Realizai c ntr-o
asemenea situaie, n mod obligatoriu ar trebui s includem valoarea 999 ca
valoare discret pentru cazuri lips, altminteri ar rezulta o medie de vrst
matusalemic. Problema nu ine de aceast valoare unic, ci de intervalul de
vrst cuprins ntre 0 i 17 ani, prin urmare vom alege ultima opiune, Range
plus one optional discrete missing value. n primele dou casete putem stabili
intervalul de valori, specificnd 0 ani drept limit inferioar (Low) i 17 ani
drept limit superioar (High) iar n a treia caset (Discrete value) putem
56
introduce 999 ani, codul pentru situaia n care persoanele refuz s declare
vrsta. Problema a fost rezolvat, nu rmne dect s apsm butonul OK
pentru a memora configuraia sau Cancel pentru a prsi fereastra fr a
reine setrile.
I.5.1.2
Definirea categoriilor variabilelor calitative.
Din moment ce am terminat definirea variabilei varsta, vom trece la

urmtoarea variabil, i anume gen. Avem deja cunotinele necesare pentru
a face acest lucru, prin urmare nu vom relua toate operaiunile.
Figura I-28 Definirea meta-datelor pentru variabila gen
Tipul variabilei este, n mod cert, numeric, avnd nevoie de o singur

cifr pentru a stoca cele dou categorii, convenind s notm cu 1 genul
masculin i cu 2 genul feminin (vezi Tabel I-1). Nu uitm, desigur, s specificm
nivelul de msur, n cazul de fa cel nominal.
Toat chestiunea este c
aceast codare dummy am realizato noi, n tabelul meta-datelor, iar
IBM SPSS Statistics habar nu are c
brbaii sunt notai cu 1 i femeile
cu 2, atta vreme ct nu gsim o
Figura I-29 Codarea dummy a unei categorii
cale prin care s-i putem comunica
asta. Aceast cale chiar exist, iar pentru a o accesa este suficient s apsai
butonul cu punctele de suspensie ce apare dac vei da click pe celula variabilei
gen, n dreptul coloanei Values, ultima coloan nediscutat.
57
O codare dummy presupune, aa cum am menionat mai sus, stabilirea

valorii (un numr) i a etichetei (calitatea). Pentru genul masculin, valoarea este
1, acest numr urmnd a fi introdus n caseta Value. Eticheta acestei valori
(calitatea) este, n mod evident, Masculin, textul urmnd a fi introdus n caseta
Label. Pentru a memora aceast codare, va trebui s apsm butonul Add,
care, ntre timp, s-a activat. Vom observa cum informaiile din cele dou casete
se terg, iar asocierea valoare-etichet a fost nregistrat n lista central.
Operaiunea se repet i
pentru asocierea 2 Feminin,
introducnd
asociere
suplimentar, 3 Nedeterminat,
ns observm c, din neatenie, am
comis o greeal la denumirea
Figura I-30 Modificarea codrii unei categorii
genului feminin. Pentru a o corecta,
vom selecta asocierea fcnd click pe elementul corespunztor din list. n acel
moment, se vor ncrca, n cele dou casete de sus, valoarea i eticheta codrii
selectate. Vom opera modificrile dorite, apoi vom apsa butonul Change
pentru a le memora.
n cazul n care dup selecie
nu se modific nimic n cele dou
casete,
se
activeaz
butonul
Remove, apsarea acestuia avnd

ca
efect
tergerea
categoriei
selectate. Dac am considera c

Figura I-31 tergerea unei categorii
includerea celei de-a treia categorii,
Nedeterminat, nu reprezint o idee prea bun, am putea selecta acest

58
element i apsa butonul menionat. Imediat, asocierea va fi eliminat din list,

categoria fiind, i ea, tears.
Desigur, toate aceste operaiuni, pe care le-am efectuat pn n acest
moment, au un caracter temporar. Ele devin permanente numai dup apsarea
butonului OK. n cazul n care apsai butonul Cancel, codarea dummy va fi
ignorat.
n acest fel vei defini i
variabila niv_edu, inclusiv codarea
dummy, innd cont c acesta are
categorii ordonate, prin urmare vei
alege nivelul de msur ordinal.
A mai rmas o singur
Figura I-32 Codarea dummy n cazul variabilei
niv_edu
variabil de definit, iq, variabila n

care vom memora scorurile pentru
coeficientul de inteligen i care nu pune niciun fel de probleme dac ai neles

cele prezentate pn n acest moment. Prin urmare, ne putem acum bucura de
tabelul meta-datelor, implementat n IBM SPSS Statistics.
Figura I-33 Tabelul complet al meta-datelor variabilelor, implementat n IBM SPSS Statistics
I.5.1.3
Realizarea variabilelor i salvarea bazei de date
Am ajuns la jumtatea drumului, ns avem satisfacia de a fi creat o baz

de date cu variabile foarte bine definite i care respect exigenele oricrui nivel
de cercetare. Nu rmne dect s trecem la cea de a doua etap, la realizarea
acestor variabile, adic la introducerea scorurilor. Folosind tabulatorul de
59
comutare a modului de vizualizare, acela situat n colul din stnga-jos al

ferestrei principale, vom apsa pe Data View pentru a prsi modul de
configurare a variabilelor i a intra n modul de introducere a datelor.
Baza de date este goal, doar
nu v-ai fi ateptat s se populeze
Figura I-34 Structura bazei de date n modul de
vizualizare a datelor
singur. Capul de tabel conine

numele variabilelor, iar dac vei ine
mausul circa 2 secunde deasupra unui nume, vei putea afla, ntr-o etichet
ajuttoare, i denumirea sa.
n acest moment, ne vom
deplasa n celula primului rnd din
Figura I-35 Baz de date completat cu scoruri n prima coloan i vom introduce
modul de afiare al valorilor
vrsta primei persoane, n cazul
nostru, 23 de ani. Apsm apoi tasta Tab sau sgeata orientat nspre dreapta
pentru a introduce genul biologic. Cum acea persoan este brbat, vom scrie
cifra 1, iar n urmtoarea coloan vom scrie cifra 3, deoarece subiectul a absolvit
doar gimnaziul. n fine, acesta pare a fi un geniu, chiar dac nu a mai urmat
liceul, deoarece coeficientul su de inteligen este 125. O nou apsare a tastei
Tab ne va conduce la prima coloan a celui de-al doilea rnd, pregtind
introducerea unui al doilea subiect.
Acest mod de vizualizare i introducere a datelor poart numele de
vizualizare bazat pe valori, deoarece se afieaz, n cazul
Figura I-36 Mod de
vizualizare bazat
pe valori
variabilelor discrete, valorile categoriilor, exprimate numeric.

Pe bara de instrumente, n zona din dreapta, se afl butonul
de comutare ntre modul de vizualizare bazat pe valori (cazul
n care butonul nu este apsat) i modul de vizualizare bazat pe etichete (cazul

60
n care butonul apare ca fiind apsat), acionarea succesiv a acestuia

comutnd, n mod repetat, ntre cele dou moduri.
n vizualizarea bazat pe
etichete, variabilele discrete nu mai
Figura I-37 Baz de date completat cu scoruri n sunt
modul de afiare al etichetelor
prezentate
sub
form
numeric, ci direct n varianta
calitativ, conform codrii dummy. Chiar dac dumneavoastr vei tasta numere
n continuare, acestea vor fi prezentate ca etichete asociate. Putei alege orice
variant dorii, fiecare are avantaje i dezavantaje, ns modul de vizualizare
bazat pe valori este considerat a fi mai rapid.
Dup ce ai creat o baz de date, v recomandm s o
salvai ntr-un fiier pe disc. Putei face acest lucru foarte
Figura I-38 Salvarea
simplu, apsnd butonul de forma unei dischete albastre,
i ncrcarea bazei
de date
situat pe bara de instrumente sau accesnd opiunea Save
ori Save As din meniul File. Dac baza de date este nou creat, vi se va
solicita numele fiierului, toate bazele de date IBM SPSS Statistics, indiferent de
versiune, avnd extensia sav. ncrcarea unei baze de date IBM SPSS Statistics
se poate face apsnd butonul sub forma unui dosar galben sau accesnd
meniul File, submeniul Open i opiunea Data. Nu intrm n detalii,
deoarece operaiunile de salvare i ncrcare a fiierelor reprezint lucruri
cunoscute, sarcinii curente ale utilizatorilor de computere.
n continuare, ai putea petrece un timp cu baza de date nou creat i s
o completai cu date, astfel nct s reuii s strngei circa 30-40 de
nregistrri. Nu uitai s salvai, din cnd n cnd, deoarece riscai s pierdei tot
ce ai lucrat n cazul n care vi se blocheaz computerul sau se ntrerupe curentul
electric.
61
I.5.1.4
Utilizarea sintaxei pentru crearea unei baze de date
Procedeele descrise anterior sunt foarte bune atunci cnd avem de

definit un numr relativ redus de variabile. Exist i cercetri n care putem lucra
cu sute sau mii de variabile, mai ales n domeniul psihometriei, la construcia
sau adaptarea instrumentelor de diagnostic psihologic. n cazul n care am lucra
cu un chestionar avnd 400 sau 500 de itemi, ne-ar lua foarte mult timp pentru
a defini, urmnd etapele de mai sus, toate aceste variabile.
Ne putem pune problema dac nu cumva ar exista o modalitate mai
rapid, mai eficient de a face acest lucru, iar rspunsul l vom gsi doar dac
apelm la limbajul de script al IBM SPSS Statistic i nvm s lucrm cu fiierele
de sintax.
S considerm cazul n care am avea de studiat
proprietile unei scale de anxietate format din 420
de ntrebri dihotomice (cu rspuns de tip Da/Nu),
urmnd, de asemenea, s stocm vrsta subiecilor,
genul biologic i nivelul educaional. Pe lng
variabilele gen, varsta i niv_edu, definite deja,
vom avea alte 420 de variabile, de la anx001 la
anx420. n total, un numr de 423 de variabile pe
care va trebui s le definim pentru a construi o baz de date, iar dac ne-am
apuca s o facem folosind modul Variable View, este posibil s dureze cel puin
o zi ntreag.
Ar fi mai simplu i mai
rapid dac am accesa meniul
File, am alege submeniul
New i opiunea Syntax
pentru a crea un nou fiier de
sintax, n care s putem scrie
comenzi fr a trebui s nvm
programare.
Figura I-39 Aplicaia IBM SPSS Statistics destinat
introducerii de sintax
Cea mai mare parte a

ferestrei
este
destinat
introducerii codului SPSS, aplicaia beneficiind i de o bar de instrumente cu
62
ajutorul creia se pot efectua diferite aciuni. O parte a sintaxei este nativ SPSS,
provenind de la versiunile mai vechi, o alt parte putnd reprezenta cod n
adevratul sens al cuvntului, deoarece versiunile noi IBM SPSS Statistics au
implementat i limbajul de programare Python, pe care l putei accesa doar
dac ai optat i pentru instalarea acestuia atunci cnd a fost instalat IBM SPSS
Statistics.
Pentru ceea ce ne intereseaz, sintaza nativ SPSS este suficient, prin
urmare nu vom lungi expunerea cu alte limbaje de programare. Vom da click n
fereastra de editare a codului i vom ncerca s definim prima variabil, genul
biologic.
* DEFINIRE VARIABILA "gen".
n mod sigur v-ai fi ateptat la altceva mai complicat. n realitate nu am

scris nicio linie de sintaz, doar am introdus un comentariu. n SPSS, comentariile
ncep cu o stelu (*) i in pn cnd ntlnim semnul punct (.).
NUMERIC gen (F1.0).
Iat prima comand real n SPSS, pe care o scriem pe urmtoarea linie.

n acest moment am definit o variabil numit gen (este numele tiut de
computer, echivalentul coloanei Name), am definit tipul numeric (echivalentul
coloanei Type) i am precizat numrul de cifre (1) i numrul de zecimale (0),
folosind expresia (F1.0), litera F provenind de la Format. Evident, comanda
se ncheie cu semnul punct (.).
VARIABLE LABELS gen 'Genul biologic al subiecilor'.
A venit momentul s stabilim denumirea, echivalentul coloanei Label.

Pe a treia linie, vom scrie comanda de mai sus, urmat de numele variabilei
creia dorim s-i atribuim o etichet (variabila gen) i de textul etichetei, ntre
ghilimele simple, sintaxa terminndu-se, din nou, cu semnul punct (.). Astfel, am
stabilit i denumirea variabilei n limbaj inteligibil pentru om.
VALUE LABELS gen 1 'Masculin' 2 'Feminin'.
Desigur, urmeaz codarea dummy, echivalentul coloanei Values.

Lucrurile par a fi chiar mai simple n comparaie cu metoda descris anterior.
Observm c trebuie s scriem comanda, urmat de numele variabilei pe care o
vom coda, apoi categoriile, una dup alta, nti valoarea, apoi eticheta ntre
ghilimele simple. Nu uitm s scriem aceast comand pe o linie nou i s o
ncheiem cu semnul punct (.).
VARIABLE LEVEL gen (NOMINAL).
63
Ultimul lucru pe care l mai avem de fcut este s stabilim nivelul de

msur. Astfel, vom scrie pe o linie nou comanda specificat mai sus, urmat
de numele variabilei i de precizarea, ntre paranteze, a nivelului de msur, n
cazul de fa fiind vorba despre nivelul nominal. Nu uitm s nchidem comanda
folosind semnul punct (.).
Dac au fost respectate toate cele expuse mai sus, n fiierul
dumneavoastr de sintax va trebui s avei urmtoarele comenzi pentru a
defini variabila gen:
Figura I-40 Comenzi necesare definirii variabilei gen
Definirea variabilei varsta este chiar mai simpl, aceasta fiind o

variabil continu, fr codare, i nu ar trebui s v pun niciun fel de probleme.
* DEFINIRE VARIABILA "varsta".
NUMERIC varsta (F3.0).
VARIABLE LABELS varsta 'Vrsta subiecilor n ani mplinii'.
VARIABLE LEVEL varsta (SCALE).
n cazul variabilei niv_edu, s urmrim o situaie interesant i care ne

va clarifica rolul semnului punct (.):
Codarea dummy, n cazul acestei variabile, implic destul de multe

categorii. Dac le-am pune pe o singur linie, am risca s pierdem irul i s ne
ncurcm. Iat c, sintaxa SPSS permite scrierea unei comenzi pe mai multe linii,
programul considernd o comand ncheiat atunci cnd ntlnete punctul.
64
Pn n acest moment lucrurile sunt destul de clare i suficient de simple.

Urmeaz partea cea mai mare consumatoare de timp, aceea n care va trebui s
crem cele 420 de variabile dihotomice, corespunztoare celor 420 de itemi ai
scalei de anxietate.
* DEFINIRE ITEMI SCALA DE ANXIETATE.
NUMERIC anx001 TO anx420 (F1.0).
VARIABLE LEVEL anx001 TO anx420 (SCALE).
Doar att? Exact! Sunt suficiente dou linii pentru a crea 420 de variabile,
linii pe care le putem scrie n 20 de secunde, dar care ne pot salva cel puin o zi
de munc. i ca s sintetizm, ntregul cod necesar pentru a crea baza de date
este scris astfel:
* DEFINIRE VARIABILA "gen".
NUMERIC gen (F1.0).
VARIABLE LABELS gen 'Genul biologic al subiecilor'.
VALUE LABELS gen 1 'Masculin' 2 'Feminin'.
VARIABLE LEVEL gen (NOMINAL).
* DEFINIRE VARIABILA "varsta".
NUMERIC varsta (F3.0).
VARIABLE LABELS varsta 'Vrsta subiecilor n ani mplinii'.
VARIABLE LEVEL varsta (SCALE).
* DEFINIRE VARIABILA niv_edu.
NUMERIC niv_edu (F1.0).
VARIABLE LABELS niv_edu 'Nivelul educaional'.
VALUE LABELS niv_edu 1 'Fr studii' 2 'Primare (1-4)' 3
'Gimnaziu (5-8)' 4 'Liceu (9-12)' 5 'Bacalaureat' 6
'Universitate (Licen)' 7 'Universitate (Master)' 8 'Doctorat'
9 'Postdoctorale'.
VARIABLE LEVEL niv_edu (ORDINAL).
* DEFINIRE ITEMI SCALA DE ANXIETATE.
NUMERIC anx001 TO anx420 (F1.0).
VARIABLE LEVEL anx001 TO anx420 (SCALE).
Acest cod poate fi salvat ntr-un fiier (avnd extensia sps) i poate fi
executat n totalitate alegnd, din meniul Run, comanda All. Aceast aciune
ar trebui s funcioneze cel puin teoretic, doar c genereaz erori la ncercarea
de creare a unei baze de date noi. Din acest motiv, nainte de a rula codul, vom
crea o variabil oarecare n baza de date, folosind modul tradiional, Variable
View, chiar dac ulterior o vom terge:
Figura I-41 Prezena unei variabile oarecare nainte de rularea sintaxei
65
Acum putem rula liniti sintaxa, accesnd comanda de mai sus, i n doar
cteva fraciuni de secund toate cele 423 de variabile ale bazei de date vor fi
create.
Figura I-42 Baz de date cu 423 de variabile creat prin sintax SPSS
Mai rmne un singur lucru de fcut: s dm click pe primul rnd al

tabelului meta-datelor pentru a selecta variabila creat manual (n cazul de fa
variabila numit de_sters, apoi s apsm tasta Delete pentru a o terge.
Iat c am reuit cu un efort minim, de doar cteva minute, c crem o baz de
date cu foarte multe variabile, apelnd la puterea ascuns n sintaxa
programului IBM SPSS Statistics.
Sintagma nu conteaz ct munceti, ci cum munceti i arat
veridicitatea i n acest caz. Am fi putut petrece ore sau zile definind variabilele
bazei de date, sau am fi apelat la sintaz, ntregul proces durnd doar cteva
minute. Din acest motiv, pare a fi o idee bun s includem, acolo unde va fi cazul,
i sintaza SPSS, dumneavoastr alegnd stilul de lucru care v convine cel mai
mult.
66

Laborator 1b - Definirea Variabilelor in IBM SPSS Statistics

Încărcat de

Informații document

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Laborator 1b - Definirea Variabilelor in IBM SPSS Statistics

Încărcat de

Drepturi de autor:

Formate disponibile

Cristian Opariuc-Dan

Definirea variabilelor i introducerea datelor n IBM SPSS Statistics

Figura I-16 Fereastra principal IBM SPSS Statistics

IBM SPSS Statistics a ajuns la versiunea 22 n momentul n care scriem

Msurarea n tiinele socio-umane

Pentru nceput, vom observa asemnarea cu un alt program, mult mai

datelor i modul de definire a variabilelor,

Figura I-18 Structura tabelului meta-datelor n IBM SPSS Statistics

Prima coloan a tabelului meta-datelor, Name, se refer la numele

cu specificaiile prevzute n tabelul meta-datelor proiectat (vezi Tabel I-1), aici

reamintim c variabila varsta a fost

definit ca numeric, fr zecimale,

efectua click n celula Type din

dreptul variabilei pe care o definim,

se va afia un buton ce conine trei puncte de suspensie (

Msurarea n tiinele socio-umane

vedere date de tip calendaristic.

Decimals i apare o list din care

introducerea scorurilor. Tipul de

dat calendaristic se poate folosi, de exemplu, dac dorim s stocm data

moned este tot un numr, aa c, la

de alegere a modului de reprezentare, reapar elementele Width i Decimal

dolarul. Putem alege formatul de reprezentare, numrul de ntregi i numrul

Care? i permite introducerea de

text brut. Singura modalitate de

caractere acceptate, valoare pe care o putem introduce n caseta Characters.

Msurarea n tiinele socio-umane

pentru variabila varsta, eticheta Vrsta subiecilor. Dac lsm

Msurarea n tiinele socio-umane

a acestor sarcini. Iat cum am

reuit s definim prima variabil, vrsta

Figura I-24 Definirea complet a variabilei varsta

Definirea valorilor ce vor fi tratate drept cazuri lips

Au rmas doar dou coloane pe care nu le-am discutat, una dintre

presupune c nu dorim s definim valori ce

selectat atunci cnd deschidei formularul

exemplu, desfura un sondaj de opinie, n care anumite ntrebri s aib

solicitat n vederea unei alte analize, ns putem alege opiunea Discrete

categorii, att Nu tiu (98) ct i Nu rspund

ignorndu-le ca i cnd ar fi celule necompletate, am include codurile acestora

Msurarea n tiinele socio-umane

Definirea categoriilor variabilelor calitative.

Din moment ce am terminat definirea variabilei varsta, vom trece la

Figura I-28 Definirea meta-datelor pentru variabila gen

Tipul variabilei este, n mod cert, numeric, avnd nevoie de o singur

cale prin care s-i putem comunica

O codare dummy presupune, aa cum am menionat mai sus, stabilirea

genului feminin. Pentru a o corecta,

Remove, apsarea acestuia avnd

selectate. Dac am considera c

includerea celei de-a treia categorii,

Nedeterminat, nu reprezint o idee prea bun, am putea selecta acest

Msurarea n tiinele socio-umane

element i apsa butonul menionat. Imediat, asocierea va fi eliminat din list,

variabil de definit, iq, variabila n

coeficientul de inteligen i care nu pune niciun fel de probleme dac ai neles

Realizarea variabilelor i salvarea bazei de date

Am ajuns la jumtatea drumului, ns avem satisfacia de a fi creat o baz

comutare a modului de vizualizare, acela situat n colul din stnga-jos al

singur. Capul de tabel conine

variabilelor discrete, valorile categoriilor, exprimate numeric.

n care butonul nu este apsat) i modul de vizualizare bazat pe etichete (cazul

Msurarea n tiinele socio-umane

n care butonul apare ca fiind apsat), acionarea succesiv a acestuia