Sunteți pe pagina 1din 8

M.

Popa Aplicaii SPSS - Transformarea variabilelor

Operaii de transformare a variabilelor

Dac privim variabilele SPSS din punctul de vedere al modului n care au fost create,
putem distinge dou categorii:
a) variabile primare care includ valori rezultate direct din cercetare si care au fost
introduse, de regul, de la tastatur;
b) variabile secundare rezultate prin transformrile aplicate variabilelor primare.
Exemple de situaii n care se impune transformarea variabilelor:
 Avem mai multe variabile primare care conin rspunsurile la ntrebrile unei scale
de tip Lickert i suntem interesai s calculm (ntr-o variabil secundar) suma
rspunsurilor la toate sau la o parte a ntrebrilor;
 Avem un numr de variabile primare n care se afl rezultatul parial pentru fiecare
minut din cele 10 cte dureaz un test de calcul aritmetic, i dorim s crem o nou
variabil (secundar) n care s avem media performanei pe cele 10 minute sau
constana (prin abaterea standard) a performanei pe cele 10 minute, pentru fiecare
subiect;
 Avem o variabil care conine data naterii i dorim s crem pe baza ei o alt
variabil, care s conin vrsta;
 Dorim s transformm variabila care conine vrsta ntr-o alt variabil, care conine
valori pentru categorii de vrst.
Pentru toate aceste situaii, care sunt unele dintre cele mai des ntlnite, dar i pentru
multe altele nc, SPSS ofer proceduri de transformare n meniul Transform. n continuare, vom
prezenta cteva dintre cele mai frecvent utilizate funcii de transformare a variabilelor.

nsumarea valorilor variabilelor


Se utilizeaz atunci cnd dorim s obinem o variabil prin adunarea valorilor din dou
sau mai multe variabile. Imaginea de mai jos prezint o tabel de date SPSS care cuprinde
scorurile la trei examene pariale (scor_1, scor_2 si scor_3). Dorim s realizm o variabil care s
cuprind un scor general, prin nsumarea celor trei variabile. Se poate observa c unii dintre
subieci nu au valori la toate cele trei scoruri (valori lips de sistem).

1/8
Actualizat la: 27.02.2006

M. Popa Aplicaii SPSS - Transformarea variabilelor

Deoarece, prin calculare, o nou variabil este plasat dup toate variabilele existente, am
preferat s inserm o nou variabil imediat dup cele trei pe care dorim s le nsumm. n acest
fel avem i posibilitatea s controlm uor corectitudinea operaiei de nsumare
Se apeleaz procedura Transform-Compute, care deschide caseta de mai jos:

n caseta Compute Variable se efectueaz urmtoarea succesiune de operaii:


1. Se introduce numele noii variabile n zona Target Variable (total). Dac variabila nu
exist, ea va fi creat automat de SPSS.
2. Se scrie expresia de nsumare n zona Numeric Expression, ntr-una din formele de mai
jos, la alegere:
a. Utiliznd funcia SUM (expresie numeric, expresie numeric, ...), aa cum se
vede i n zona listei Functions: Ea poate fi scris de la tastatur sau selectat din
lista de funcii i ridicat prin acionarea butonului . Atenie, sintaxa fiecrei
funcii trebuie respectat ntocmai. n cazul nostru, variabilele numerice se vor
scrie ntre paranteze, una cte una, cu virgul ntre ele. Variabilele pot fi scrise de
la tastatur sau mutate la rndul lor din lista de variabile cu butonul .
Dac variabilele ce vor fi nsumate se afl n baza de date una dup alta, ca n
cazul exemplului nostru, atunci avem posibilitatea s scriem o expresie de
nsumare simplificat, astfel SUM (prima_variabil TO ultima_variabil). n
acest caz, clauza TO va fi cuprins ntre spaii, pentru a nu fi confundat cu un
nume de variabil. Aceast opiune ne sugereaz ct de important poate fi s
aranjm corespunztor variabilele n structura unei tabele SPSS.
b. Prin adunarea una cte una a fiecrei variabile care se nsumeaz
(scor_1+scor_2+scor_3). Avantajul acestei variante este c variabilele
respective nu trebuie s fie plasate una lng alta n baza de date. Dezavantajul
este c, dac expresia conine multe variabile, dureaz mai mult completarea ei.
Atenie, dac oricare dintre variabilele nsumate cu aceast expresie are o valoare
lips, pentru un caz, atunci totalul va fi o valoare lips! Acest neajuns nu se
ntlnete dac se face adunarea cu funcia SUM, ca la punctul a.
3. Se apas butonul OK
4. Deoarece variabila total exist, SPSS ne ntreab dac dorim s modificm coninutul
acesteia. Dac nu ar exista o variabil cu acest nume, rezultatul operaiei de calcul ar fi
depus ntr-o variabil creat automat i amplasat dup ultima variabil din baza de date.

2/8
Actualizat la: 27.02.2006

M. Popa Aplicaii SPSS - Transformarea variabilelor

Rspundem OK, deoarece tim c


am creat aceast variabil tocmai
pentru a depune n ea suma.

Rezultatul operaiei se vede n imaginea de mai jos:

Calcularea mediei a dou sau mai multe variabile


Presupunnd c n loc de sum ne-ar interesa media valorilor de la mai multe variabile, se
procedeaz n mod similar. Expresia de calcul a mediei este MEAN (expresie_numeric,
expresie_numeric, ...), unde ... arat c putem pune oricte variabile (sau valori) numerice, cu
virgul ntre ele. Ca i n cazul sumei, se poate realiza o expresie cu clauza TO, cu condiia ca
variabilele pentru care se realizeaz media s se afle una dup alta n tabela SPSS.

Reamintim c funcia MEAN poate fi scris de la tastatur sau poate fi adus din lista de
funcii, prin selectare i acionarea butonului .
Este de la sine neles c expresia de calcul poate fi realizat i ntr-o manier direct, fr
utilizarea funciei MEAN, astfel: (scor_1+scor_2+scor_3)/3
 Se va face o distincie clar ntre suma sau media astfel obinute, care se refer la suma
sau media valorilor de la mai multe variabile, pentru acelai subiect, i suma sau media
pe care am calcula-o pe vertical, la nivelul fiecrei variabile n parte, pe ntreaga
distribuie de valori, pentru toi subiecii.
 Se pot realiza diverse alte funcii de transformare, utilizndu-se marea varietate de funcii
care se gsesc n lista Functions, i a cror semnificaie se poate afl din Help-ul casetei
Compute.

Extragerea valorii anului dintr-o variabil de tip cronologic (date)


SPSS ofer funcii de transformare cu variabilele de tip cronologic. Dintre acestea vom
exemplifica cu realizarea unei variabile care s conin anul naterii, extras dintr-o variabil care

3/8
Actualizat la: 27.02.2006

M. Popa Aplicaii SPSS - Transformarea variabilelor

conine data naterii. Imaginea de mai jos este extras din baza de date Employee data.sav (care
se gsete n folderul de instalare al SPSS, n C: Program Files)

Observm c exist] variabila bdate, care conine data naterii. Pentru a avea vrsta,
trebuie s calculm diferena dintre anul curent (s zicem, 2000)1 i anul naterii: Pentru aceasta
trebuie s facem diferena dintre anul curent (2000) i anul naterii, care se afl n cmpul bdate.
Pentru a avea variabila ce urmeaz a fi creat n apropierea variabilei bdate, vom insera o
variabil (denumind-o virsta, de tip numeric, cu doi ntregi). Apoi utilizm procedura Compute
din meniul Transform:

n cmpul Target variable introducem numele noii variabile (virsta).


n zona Numeric Expression vom scrie expresia de transformare, care se bazeaz pe
funcia XDATE.YEAR().
Aceast funcie are ca rezultat extragerea valorii care reprezint anul dintr-o variabil de
tip dat calendaristic. n cazul nostru, XDATE.YEAR(bdate) va extrage valoarea anului din
variabila cronologic bdate.
Ca urmare, putem scrie expresia astfel: 2000-XDATE.YEAR(bdate)
Mai jos putem vedea rezultatul procedurii Compute:

Anul n care a fost scris acest exemplu.

4/8
Actualizat la: 27.02.2006

M. Popa Aplicaii SPSS - Transformarea variabilelor

Se observ n variabil virsta, valorile rezultate prin transformare. Desigur, transformarea


putea fi efectuat i n dou etape. Mai nti prin extragerea anului naterii ntr-o variabil
separat i apoi, prin efectuarea unei noi transformri, realizarea diferenei dintre anul curent i
anul naterii. Am preferat o soluie ntr-o singur etap pentru c este mai operativ.
 Posibilitile de transformare a variabilelor oferite de SPSS permit crearea unor noi
variabile pe baza celor existente, n funcie de necesitile de prelucrare pe care le avem.
n toate cazurile ns, nu se va alege soluia modificrii valorilor dintr-o variabil
primar peste valorile deja existente. Cu alte cuvinte, este recomandabil s crem prin
transformare variabile noi, deoarece odat pierdute valorile unei variabile primare, ne va
fi imposibil s le reconstituim, n cazul n care am fcut o greeal de transformare.

Recodificarea variabilelor
Recodificarea unei variabile nseamn convertirea valorilor acesteia, cu scopul obinerii
unei distribuii bazat pe frecvene cumulate. Limitele claselor de grupare nu sunt stabilite
automat de SPSS, ci se aleg de ctre utilizator. Procesul este similar cu crearea unei tabele de
frecvene grupate, despre care ne amintim c poate fi derulat n maniera descris mai jos:

Se face diferena dintre valoarea cea mai mare i valoarea cea mai mic a unei distribuii
Se mparte valoarea obinut la mrimea posibil (estimat) a intervalului
Se selecteaz mrimea intervalului care conduce la un numr de clase cuprins ntre 5 i
15
Se determin limita inferioar a primului interval (trebuie s fie un multiplu al mrimii
intervalului)
Se determin limita superioar a primului interval
Se construiesc intervalele de clas pentru fiecare interval, fiind ateni s avem clase
suprapuse sau intervale neacoperite

n principiu, dei este recomandabil obinerea unei grupri de frecvene pe 5-15 clase, se
poate opta pentru un numr de clase care servete cel mai bine interesul de cercetare. De
exemplu, n cazul unei distribuii de vrst exprimat n ani, este preferabil s se opteze pentru
clase de cinci sau zece ani, acestea avnd i o anumit semnificaie psihologic.
n urma transformrii de mai sus, am obinut variabila virsta. Utilizarea ei ca atare n
analize statistice nu este uzual, de aceea ar fi foarte util obinerea unei variabile care s asocieze
anumite valori convenionale pentru categorii de virsta. Pentru aceasta putem efectua
recodificarea variabilei virsta pentru a obine o distribuie grupat de frecvene, astfel:
5/8
Actualizat la: 27.02.2006

M. Popa Aplicaii SPSS - Transformarea variabilelor

Se lanseaz procedura Recode - Into Defferent Variables din meniul Transform:

Atenie, se poate alege i opiune Into Same Variables, dar nu este recomandabil
deoarece, n cazul unei erori, nu mai avem la dispoziie variabila iniial pentru o nou
recodificare.

Paii de efectuat la apariia casetei Recode into Different Variable:


se trece variabila virsta n zona Numeric Variable Output Variable. Semnul
ntrebrii arat c se ateapt numele variabilei ce urmeaz s fie creat prin
recodificare.
Acest nume se scrie n zona: Name, dup care se apas butonul Change.
n zona Label se introduce eticheta variabilei nou create
Am ales, absolut convenional, ca nume al variabilei recodificate v_clase.
Urmeaz acum s descriem limitele claselor de recodificare. Pentru aceasta, se acioneaz
butonul Old and New Values

Dei relativ complicat, caseta de declarare a noilor valori n funcie de cele vechi este uor
de neles.

6/8
Actualizat la: 27.02.2006

M. Popa Aplicaii SPSS - Transformarea variabilelor

n zona Old value, se alege una dintre variantele de definire a valorilor de la care se
pleac. S zicem c am ales soluia s recodificm anii pe intervale de zece ani, primul interval
fiind 29-39, al doilea 40-49, .a.m.d.
Pentru aceasta activm opiunea Range i scriem valorile limite al intervalului dorit.
Dup aceasta, n zona New value oValue scriem care este valoarea convenional pe care
o atribuim acestei clase.
n fine, acionm butonul Add pentru a definitiva operaiunea i trecem la definirea
urmtoarei clase, pn terminm.
n zona OldNew se poate observa lista recodificrilor definite.
Se acioneaz butonul Continue i, la revenirea n caseta anterioar, butonul OK.
Rezultatul operaiuni se vede mai jos:

Se observ corespondena dintre valoarea din variabila virsta, cu valoarea din variabila
v_clase. Pentru valoarea 71, avem missing value n variabila v_clase, deoarece nu am definit un
interval care s cuprind aceast vrst. De regul, aceast situaie este determinat de o eroare de
definire a intervalelor de clas. Pentru a o repara, ar trebui s intrm din nou n procedura Recode
i s redefinim clasele. Atenie, la declararea intervalelor de grupare n clase sau categorii, trebuie
avut grij ca intervalele s nu se suprapun i s nu aib distane ntre ele!
Transformarea operat pe variabila virst nu este de loc inutil. Dac am fi dorit s
vedem n ce msur este o relaie ntre nivelul salariului i vrst, ar fi fost oarecum impropriu
(fr a fi propriu-zis o greeal ) s utilizm o statistic parametric (corelaia). n analizele
statistice pe vrste este recomandabil, totui, s operm cu grupe de vrst.

Ordonarea dup rang a valorilor unei variabile


Aa cum am spus n cuprinsul seciunii teoretice, este posibil s ne confruntm cu o
variabil cantitativ ale crei valori nu respect condiiile unei statistici parametrice (vezi figura
din stnga, unde valoarea 250 este excesiv). ntr-o situaie de acest gen, una din soluiile posibile
este transformarea de rang, cu procedura Transform-Rank cases (caseta din dreapta):

7/8
Actualizat la: 27.02.2006

M. Popa Aplicaii SPSS - Transformarea variabilelor

Variabila vizat (scor) este trecut n lista Variable(s), se seteaz modul de ordonare (am
ales atribuirea rangului 1 valorii celei mai mari) iar apoi am acionat butonul OK. Procedura
permite fixarea unor parametri de transformare cu ajutorul butoanelor Rank i Ties.
Caseta Rank Cases: Types, permite alegerea unui mod de atribuire a rangurilor. De
exemplu, bifnd Rank, se atribuie fiecrei valori chiar rangul ei. Pentru a afla ce efect au celelalte
opiuni, se poate face clic dreapta de mouse pe textul opiunii sau se apas butonul Help al
casetei.

Caseta Rank Cases: Ties, permite alegerea modului de atribuire a rangurilor pentru valori
egale. Astfel, piunea Mean, atribuie rangul mediu. De exemplu, pentru valorile 9, 11, 11, 11, 13,
valoarea 11 va primi rangul 3 (ca medie a rangurilor 2, 3 i 4). Celelalte opiuni vizeaz
atribuirea rangului cel mai mic (Low), al celui mai mare (High).

Procedura se finalizeaz prin crearea unei noi variabile, pe care SPSS o denumete
automat, care conine poziia de rang a fiecrei valori din variabila scor, n raport cu celelalte
valori ale distribuiei (n imagine, 250 are rangul 1, iar 119, rangul 6).

8/8
Actualizat la: 27.02.2006

S-ar putea să vă placă și