Documente Academic
Documente Profesional
Documente Cultură
Laborator 1b - Definirea Variabilelor in IBM SPSS Statistics
Laborator 1b - Definirea Variabilelor in IBM SPSS Statistics
I.5.1
principale (vezi Figura I-17). Butonul Data View comut n seciunea destinat
introducerii datelor, aceasta fiind seciunea implicit, activ atunci cnd pornii
programul. Doar c, pentru a putea introduce datele, va trebui s fi definit n
prealabil variabilele. Nu este cazul nostru, din acest motiv va trebui s efectum
click pe butonul Variable View pentru a comuta n seciunea de definire a
variabilelor, practic o implementare computerizat a tabelului meta-datelor
discutat mai sus.
49
Cristian Opariuc-Dan
stabilirea
tipului
acesteia.
Ne
compus din trei cifre N(3). Dup ce am terminat de introdus numele variabilei
i am prsit celula, IBM SPSS Statistics a completat automat tipul variabilei, n
funcie de configuraia sa, definind-o drept N(8.2). Adic, o variabil numeric,
avnd 8 caractere ntregi i dou caractere zecimale. Dimensiunea este mult
prea mare fa de ce avem noi nevoie, prin urmare vom scrie, n celula
Decimals, n loc de 2 cifra 0, iar n celula Width, n loc de 8 cifra 3.
Rareori vom avea nevoie s
schimbm tipul variabilei, deoarece,
aa cum tim, n analiza de date se
impune
acestora.
codarea
Dac
numeric
dorim,
putem
), pe care
putem aps pentru a se afia fereastra din Figura I-20. Primele patru opiuni
reprezint diferite moduri de definire a numerelor, n partea dreapt putnd
50
stabili numrul de cifre ale ntregilor i numrul de cifre ale zecimalelor, la fel ca
mai sus.
Opiunea
Date
are
elementele
Width
calendaristic
solicitat
pentru
Cristian Opariuc-Dan
deschise,
Ce?
sau
de
genul
Altcineva.
Cristian Opariuc-Dan
realizate prin observare direct, din surse externe de date, aceasta fiind situaia
tuturor variabilelor din exemplul nostru. Opiunea Target are n vedere
realizarea variabilei din alte variabile, prin transformri sau calcule. De exemplu,
dac din variabila varsta construim o nou variabil, numit grup_varsta,
aceast nou variabil este considerat de acest tip. Atunci cnd o variabil se
poate realiza i direct, i prin calcul, opiunea aleas va fi Both. De exemplu,
variabila varsta poate fi de acest tip, dac iniial am introdus manual datele,
apoi am decis s eliminm valorile vrstei pentru toi subiecii minori, acest
lucru fiind obinut n urma unei operaiuni de transformare. Opiunea None
arat c variabilei nu i-a fost atribuit niciun rol sau c rolul su nu este bine
cunoscut. De obicei, se folosete atunci cnd datele sunt importate dintr-un alt
program sau am preluat o baz de date de la o persoan nefamiliarizat suficient
cu aceast aplicaie, i nu tim cum s-au obinut, astfel, datele. Opiunile
Partition i Split se folosesc n cazul variabilelor pe baza crora se scindeaz,
logic, fiierul de date, diferena dintre ele innd doar de modul n care s-au
mprit datele. Dac scindarea bazei de date s-a realizat folosind un criteriu de
selecie a cazurilor n care s-a inclus variabila, atunci aceasta are un rol de
partiionare. Dac este vorba despre o variabil categorial, pe baza categoriilor
acesteia mprindu-se fiierul, atunci avem de a face cu o variabil Split. Spre
exemplu, putem alege una dintre cele dou opiuni dac facem analize de date
separat pentru brbai i separat pentru femei (variabila gen fiind o variabil
cu rol de Split), sau dac alegem spre analiz doar brbaii cu vrsta peste 20
de ani (variabilele gen i varsta sunt variabile de partiionare).
Declararea rolului unei variabile nu are vreun efect asupra analizei de
date, aa cum tim, ns poate comunica unui alt cercettor modul n care au
fost obinute i prelucrate datele, fapt ce arat o tratare profesional i serioas
54
subiecilor:
I.5.1.1
IBM
SPSS
Statistics
Din
acest
motiv,
opiunea
Cristian Opariuc-Dan
variabile, adic s tratm aceste situaii drept cazuri lips. Minore sunt toate
persoanele cu vrsta cuprins ntre 0 i 18 ani, iar pentru persoanele care au
refuzat explicit s comunice vrsta, am ales codul 999. Realizai c ntr-o
asemenea situaie, n mod obligatoriu ar trebui s includem valoarea 999 ca
valoare discret pentru cazuri lips, altminteri ar rezulta o medie de vrst
matusalemic. Problema nu ine de aceast valoare unic, ci de intervalul de
vrst cuprins ntre 0 i 17 ani, prin urmare vom alege ultima opiune, Range
plus one optional discrete missing value. n primele dou casete putem stabili
intervalul de valori, specificnd 0 ani drept limit inferioar (Low) i 17 ani
drept limit superioar (High) iar n a treia caset (Discrete value) putem
56
introduce 999 ani, codul pentru situaia n care persoanele refuz s declare
vrsta. Problema a fost rezolvat, nu rmne dect s apsm butonul OK
pentru a memora configuraia sau Cancel pentru a prsi fereastra fr a
reine setrile.
I.5.1.2
asta. Aceast cale chiar exist, iar pentru a o accesa este suficient s apsai
butonul cu punctele de suspensie ce apare dac vei da click pe celula variabilei
gen, n dreptul coloanei Values, ultima coloan nediscutat.
57
Cristian Opariuc-Dan
asociere
suplimentar, 3 Nedeterminat,
ns observm c, din neatenie, am
comis o greeal la denumirea
Figura I-30 Modificarea codrii unei categorii
vom selecta asocierea fcnd click pe elementul corespunztor din list. n acel
moment, se vor ncrca, n cele dou casete de sus, valoarea i eticheta codrii
selectate. Vom opera modificrile dorite, apoi vom apsa butonul Change
pentru a le memora.
n cazul n care dup selecie
nu se modific nimic n cele dou
casete,
se
activeaz
butonul
efect
tergerea
categoriei
Figura I-33 Tabelul complet al meta-datelor variabilelor, implementat n IBM SPSS Statistics
I.5.1.3
Cristian Opariuc-Dan
mausul circa 2 secunde deasupra unui nume, vei putea afla, ntr-o etichet
ajuttoare, i denumirea sa.
n acest moment, ne vom
deplasa n celula primului rnd din
Figura I-35 Baz de date completat cu scoruri n prima coloan i vom introduce
modul de afiare al valorilor
vrsta primei persoane, n cazul
nostru, 23 de ani. Apsm apoi tasta Tab sau sgeata orientat nspre dreapta
pentru a introduce genul biologic. Cum acea persoan este brbat, vom scrie
cifra 1, iar n urmtoarea coloan vom scrie cifra 3, deoarece subiectul a absolvit
doar gimnaziul. n fine, acesta pare a fi un geniu, chiar dac nu a mai urmat
liceul, deoarece coeficientul su de inteligen este 125. O nou apsare a tastei
Tab ne va conduce la prima coloan a celui de-al doilea rnd, pregtind
introducerea unui al doilea subiect.
Acest mod de vizualizare i introducere a datelor poart numele de
vizualizare bazat pe valori, deoarece se afieaz, n cazul
Figura I-36 Mod de
vizualizare bazat
pe valori
prezentate
sub
form
calitativ, conform codrii dummy. Chiar dac dumneavoastr vei tasta numere
n continuare, acestea vor fi prezentate ca etichete asociate. Putei alege orice
variant dorii, fiecare are avantaje i dezavantaje, ns modul de vizualizare
bazat pe valori este considerat a fi mai rapid.
Dup ce ai creat o baz de date, v recomandm s o
salvai ntr-un fiier pe disc. Putei face acest lucru foarte
Figura I-38 Salvarea
simplu, apsnd butonul de forma unei dischete albastre,
i ncrcarea bazei
de date
situat pe bara de instrumente sau accesnd opiunea Save
ori Save As din meniul File. Dac baza de date este nou creat, vi se va
solicita numele fiierului, toate bazele de date IBM SPSS Statistics, indiferent de
versiune, avnd extensia sav. ncrcarea unei baze de date IBM SPSS Statistics
se poate face apsnd butonul sub forma unui dosar galben sau accesnd
meniul File, submeniul Open i opiunea Data. Nu intrm n detalii,
deoarece operaiunile de salvare i ncrcare a fiierelor reprezint lucruri
cunoscute, sarcinii curente ale utilizatorilor de computere.
n continuare, ai putea petrece un timp cu baza de date nou creat i s
o completai cu date, astfel nct s reuii s strngei circa 30-40 de
nregistrri. Nu uitai s salvai, din cnd n cnd, deoarece riscai s pierdei tot
ce ai lucrat n cazul n care vi se blocheaz computerul sau se ntrerupe curentul
electric.
61
Cristian Opariuc-Dan
I.5.1.4
ajutorul creia se pot efectua diferite aciuni. O parte a sintaxei este nativ SPSS,
provenind de la versiunile mai vechi, o alt parte putnd reprezenta cod n
adevratul sens al cuvntului, deoarece versiunile noi IBM SPSS Statistics au
implementat i limbajul de programare Python, pe care l putei accesa doar
dac ai optat i pentru instalarea acestuia atunci cnd a fost instalat IBM SPSS
Statistics.
Pentru ceea ce ne intereseaz, sintaza nativ SPSS este suficient, prin
urmare nu vom lungi expunerea cu alte limbaje de programare. Vom da click n
fereastra de editare a codului i vom ncerca s definim prima variabil, genul
biologic.
* DEFINIRE VARIABILA "gen".
63
Cristian Opariuc-Dan
64
Doar att? Exact! Sunt suficiente dou linii pentru a crea 420 de variabile,
linii pe care le putem scrie n 20 de secunde, dar care ne pot salva cel puin o zi
de munc. i ca s sintetizm, ntregul cod necesar pentru a crea baza de date
este scris astfel:
* DEFINIRE VARIABILA "gen".
NUMERIC gen (F1.0).
VARIABLE LABELS gen 'Genul biologic al subiecilor'.
VALUE LABELS gen 1 'Masculin' 2 'Feminin'.
VARIABLE LEVEL gen (NOMINAL).
* DEFINIRE VARIABILA "varsta".
NUMERIC varsta (F3.0).
VARIABLE LABELS varsta 'Vrsta subiecilor n ani mplinii'.
VARIABLE LEVEL varsta (SCALE).
* DEFINIRE VARIABILA niv_edu.
NUMERIC niv_edu (F1.0).
VARIABLE LABELS niv_edu 'Nivelul educaional'.
VALUE LABELS niv_edu 1 'Fr studii' 2 'Primare (1-4)' 3
'Gimnaziu (5-8)' 4 'Liceu (9-12)' 5 'Bacalaureat' 6
'Universitate (Licen)' 7 'Universitate (Master)' 8 'Doctorat'
9 'Postdoctorale'.
VARIABLE LEVEL niv_edu (ORDINAL).
* DEFINIRE ITEMI SCALA DE ANXIETATE.
NUMERIC anx001 TO anx420 (F1.0).
VARIABLE LEVEL anx001 TO anx420 (SCALE).
Acest cod poate fi salvat ntr-un fiier (avnd extensia sps) i poate fi
executat n totalitate alegnd, din meniul Run, comanda All. Aceast aciune
ar trebui s funcioneze cel puin teoretic, doar c genereaz erori la ncercarea
de creare a unei baze de date noi. Din acest motiv, nainte de a rula codul, vom
crea o variabil oarecare n baza de date, folosind modul tradiional, Variable
View, chiar dac ulterior o vom terge:
65
Cristian Opariuc-Dan
Acum putem rula liniti sintaxa, accesnd comanda de mai sus, i n doar
cteva fraciuni de secund toate cele 423 de variabile ale bazei de date vor fi
create.
Figura I-42 Baz de date cu 423 de variabile creat prin sintax SPSS
66