Sunteți pe pagina 1din 8

M.

Popa Aplica ii SPSS - Transformarea variabilelor

Opera ii de transformare a variabilelor

Dac privim variabilele SPSS din punctul de vedere al modului n care au fost create, putem distinge dou categorii: a) variabile primare care includ valori rezultate direct din cercetare si care au fost introduse, de regul, de la tastatur; b) variabile secundare rezultate prin transformrile aplicate variabilelor primare. Exemple de situa ii n care se impune transformarea variabilelor: Avem mai multe variabile primare care con in rspunsurile la ntrebrile unei scale de tip Lickert i suntem interesa i s calculm (ntr-o variabil secundar) suma rspunsurilor la toate sau la o parte a ntrebrilor; Avem un numr de variabile primare n care se afl rezultatul par ial pentru fiecare minut din cele 10 cte dureaz un test de calcul aritmetic, i dorim s crem o nou variabil (secundar) n care s avem media performan ei pe cele 10 minute sau constan a (prin abaterea standard) a performan ei pe cele 10 minute, pentru fiecare subiect; Avem o variabil care con ine data naterii i dorim s crem pe baza ei o alt variabil, care s con in vrsta; Dorim s transformm variabila care con ine vrsta ntr-o alt variabil, care con ine valori pentru categorii de vrst. Pentru toate aceste situa ii, care sunt unele dintre cele mai des ntlnite, dar i pentru multe altele nc, SPSS ofer proceduri de transformare n meniul Transform. n continuare, vom prezenta cteva dintre cele mai frecvent utilizate func ii de transformare a variabilelor.

nsumarea valorilor variabilelor


Se utilizeaz atunci cnd dorim s ob inem o variabil prin adunarea valorilor din dou sau mai multe variabile. Imaginea de mai jos prezint o tabel de date SPSS care cuprinde scorurile la trei examene par iale (scor_1, scor_2 si scor_3). Dorim s realizm o variabil care s cuprind un scor general, prin nsumarea celor trei variabile. Se poate observa c unii dintre subiec i nu au valori la toate cele trei scoruri (valori lips de sistem).

1/8
Actualizat la: 27.02.2006

M. Popa Aplica ii SPSS - Transformarea variabilelor

Deoarece, prin calculare, o nou variabil este plasat dup toate variabilele existente, am preferat s inserm o nou variabil imediat dup cele trei pe care dorim s le nsumm. n acest fel avem i posibilitatea s controlm uor corectitudinea opera iei de nsumare Se apeleaz procedura Transform-Compute, care deschide caseta de mai jos:

n caseta Compute Variable se efectueaz urmtoarea succesiune de opera ii: 1. Se introduce numele noii variabile n zona Target Variable (total). Dac variabila nu exist, ea va fi creat automat de SPSS. 2. Se scrie expresia de nsumare n zona Numeric Expression, ntr-una din formele de mai jos, la alegere: a. Utiliznd func ia SUM (expresie numeric, expresie numeric, ...), aa cum se vede i n zona listei Functions: Ea poate fi scris de la tastatur sau selectat din lista de func ii i ridicat prin ac ionarea butonului . Aten ie, sintaxa fiecrei func ii trebuie respectat ntocmai. n cazul nostru, variabilele numerice se vor scrie ntre paranteze, una cte una, cu virgul ntre ele. Variabilele pot fi scrise de la tastatur sau mutate la rndul lor din lista de variabile cu butonul . Dac variabilele ce vor fi nsumate se afl n baza de date una dup alta, ca n cazul exemplului nostru, atunci avem posibilitatea s scriem o expresie de nsumare simplificat, astfel SUM (prima_variabil TO ultima_variabil). n acest caz, clauza TO va fi cuprins ntre spa ii, pentru a nu fi confundat cu un nume de variabil. Aceast op iune ne sugereaz ct de important poate fi s aranjm corespunztor variabilele n structura unei tabele SPSS. b. Prin adunarea una cte una a fiecrei variabile care se nsumeaz (scor_1+scor_2+scor_3). Avantajul acestei variante este c variabilele respective nu trebuie s fie plasate una lng alta n baza de date. Dezavantajul este c, dac expresia con ine multe variabile, dureaz mai mult completarea ei. Aten ie, dac oricare dintre variabilele nsumate cu aceast expresie are o valoare lips, pentru un caz, atunci totalul va fi o valoare lips! Acest neajuns nu se ntlnete dac se face adunarea cu func ia SUM, ca la punctul a. 3. Se apas butonul OK 4. Deoarece variabila total exist, SPSS ne ntreab dac dorim s modificm con inutul acesteia. Dac nu ar exista o variabil cu acest nume, rezultatul opera iei de calcul ar fi depus ntr-o variabil creat automat i amplasat dup ultima variabil din baza de date.

2/8
Actualizat la: 27.02.2006

M. Popa Aplica ii SPSS - Transformarea variabilelor

Rspundem OK, deoarece tim c am creat aceast variabil tocmai pentru a depune n ea suma.

Rezultatul opera iei se vede n imaginea de mai jos:

Calcularea mediei a dou sau mai multe variabile


Presupunnd c n loc de sum ne-ar interesa media valorilor de la mai multe variabile, se procedeaz n mod similar. Expresia de calcul a mediei este MEAN (expresie_numeric, expresie_numeric, ...), unde ... arat c putem pune oricte variabile (sau valori) numerice, cu virgul ntre ele. Ca i n cazul sumei, se poate realiza o expresie cu clauza TO, cu condi ia ca variabilele pentru care se realizeaz media s se afle una dup alta n tabela SPSS.

Reamintim c func ia MEAN poate fi scris de la tastatur sau poate fi adus din lista de func ii, prin selectare i ac ionarea butonului . Este de la sine n eles c expresia de calcul poate fi realizat i ntr-o manier direct, fr utilizarea func iei MEAN, astfel: (scor_1+scor_2+scor_3)/3 Se va face o distinc ie clar ntre suma sau media astfel ob inute, care se refer la suma sau media valorilor de la mai multe variabile, pentru acelai subiect, i suma sau media pe care am calcula-o pe vertical, la nivelul fiecrei variabile n parte, pe ntreaga distribu ie de valori, pentru to i subiec ii. Se pot realiza diverse alte func ii de transformare, utilizndu-se marea varietate de func ii care se gsesc n lista Functions, i a cror semnifica ie se poate afl din Help-ul casetei Compute.

Extragerea valorii anului dintr-o variabil de tip cronologic (date)


SPSS ofer func ii de transformare cu variabilele de tip cronologic. Dintre acestea vom exemplifica cu realizarea unei variabile care s con in anul naterii, extras dintr-o variabil care

3/8
Actualizat la: 27.02.2006

M. Popa Aplica ii SPSS - Transformarea variabilelor

con ine data naterii. Imaginea de mai jos este extras din baza de date Employee data.sav (care se gsete n folderul de instalare al SPSS, n C: Program Files)

Observm c exist] variabila bdate, care con ine data naterii. Pentru a avea vrsta, trebuie s calculm diferen a dintre anul curent (s zicem, 2000)1 i anul naterii: Pentru aceasta trebuie s facem diferen a dintre anul curent (2000) i anul naterii, care se afl n cmpul bdate. Pentru a avea variabila ce urmeaz a fi creat n apropierea variabilei bdate, vom insera o variabil (denumind-o virsta, de tip numeric, cu doi ntregi). Apoi utilizm procedura Compute din meniul Transform:

n cmpul Target variable introducem numele noii variabile (virsta). n zona Numeric Expression vom scrie expresia de transformare, care se bazeaz pe func ia XDATE.YEAR(). Aceast func ie are ca rezultat extragerea valorii care reprezint anul dintr-o variabil de tip dat calendaristic. n cazul nostru, XDATE.YEAR(bdate) va extrage valoarea anului din variabila cronologic bdate. Ca urmare, putem scrie expresia astfel: 2000-XDATE.YEAR(bdate) Mai jos putem vedea rezultatul procedurii Compute:

Anul n care a fost scris acest exemplu.

4/8
Actualizat la: 27.02.2006

M. Popa Aplica ii SPSS - Transformarea variabilelor

Se observ n variabil virsta, valorile rezultate prin transformare. Desigur, transformarea putea fi efectuat i n dou etape. Mai nti prin extragerea anului naterii ntr-o variabil separat i apoi, prin efectuarea unei noi transformri, realizarea diferen ei dintre anul curent i anul naterii. Am preferat o solu ie ntr-o singur etap pentru c este mai operativ. Posibilit ile de transformare a variabilelor oferite de SPSS permit crearea unor noi variabile pe baza celor existente, n func ie de necesit ile de prelucrare pe care le avem. n toate cazurile ns, nu se va alege solu ia modificrii valorilor dintr-o variabil primar peste valorile deja existente. Cu alte cuvinte, este recomandabil s crem prin transformare variabile noi, deoarece odat pierdute valorile unei variabile primare, ne va fi imposibil s le reconstituim, n cazul n care am fcut o greeal de transformare.

Recodificarea variabilelor
Recodificarea unei variabile nseamn convertirea valorilor acesteia, cu scopul ob inerii unei distribu ii bazat pe frecven e cumulate. Limitele claselor de grupare nu sunt stabilite automat de SPSS, ci se aleg de ctre utilizator. Procesul este similar cu crearea unei tabele de frecven e grupate, despre care ne amintim c poate fi derulat n maniera descris mai jos: Se face diferen a dintre valoarea cea mai mare i valoarea cea mai mic a unei distribu ii Se mparte valoarea ob inut la mrimea posibil (estimat) a intervalului Se selecteaz mrimea intervalului care conduce la un numr de clase cuprins ntre 5 i 15 Se determin limita inferioar a primului interval (trebuie s fie un multiplu al mrimii intervalului) Se determin limita superioar a primului interval Se construiesc intervalele de clas pentru fiecare interval, fiind aten i s avem clase suprapuse sau intervale neacoperite

n principiu, dei este recomandabil ob inerea unei grupri de frecven e pe 5-15 clase, se poate opta pentru un numr de clase care servete cel mai bine interesul de cercetare. De exemplu, n cazul unei distribu ii de vrst exprimat n ani, este preferabil s se opteze pentru clase de cinci sau zece ani, acestea avnd i o anumit semnifica ie psihologic. n urma transformrii de mai sus, am ob inut variabila virsta. Utilizarea ei ca atare n analize statistice nu este uzual, de aceea ar fi foarte util ob inerea unei variabile care s asocieze anumite valori conven ionale pentru categorii de virsta. Pentru aceasta putem efectua recodificarea variabilei virsta pentru a ob ine o distribu ie grupat de frecven e, astfel: 5/8
Actualizat la: 27.02.2006

M. Popa Aplica ii SPSS - Transformarea variabilelor

Se lanseaz procedura Recode - Into Defferent Variables din meniul Transform:

Aten ie, se poate alege i op iune Into Same Variables, dar nu este recomandabil deoarece, n cazul unei erori, nu mai avem la dispozi ie variabila ini ial pentru o nou recodificare.

Paii de efectuat la apari ia casetei Recode into Different Variable: se trece variabila virsta n zona Numeric Variable Output Variable. Semnul ntrebrii arat c se ateapt numele variabilei ce urmeaz s fie creat prin recodificare. Acest nume se scrie n zona: Name, dup care se apas butonul Change. n zona Label se introduce eticheta variabilei nou create Am ales, absolut conven ional, ca nume al variabilei recodificate v_clase. Urmeaz acum s descriem limitele claselor de recodificare. Pentru aceasta, se ac ioneaz butonul Old and New Values

Dei relativ complicat, caseta de declarare a noilor valori n func ie de cele vechi este uor de n eles.

6/8
Actualizat la: 27.02.2006

M. Popa Aplica ii SPSS - Transformarea variabilelor

n zona Old value, se alege una dintre variantele de definire a valorilor de la care se pleac. S zicem c am ales solu ia s recodificm anii pe intervale de zece ani, primul interval fiind 29-39, al doilea 40-49, .a.m.d. Pentru aceasta activm op iunea Range i scriem valorile limite al intervalului dorit. Dup aceasta, n zona New value oValue scriem care este valoarea conven ional pe care o atribuim acestei clase. n fine, ac ionm butonul Add pentru a definitiva opera iunea i trecem la definirea urmtoarei clase, pn terminm. n zona OldNew se poate observa lista recodificrilor definite. Se ac ioneaz butonul Continue i, la revenirea n caseta anterioar, butonul OK. Rezultatul opera iuni se vede mai jos:

Se observ coresponden a dintre valoarea din variabila virsta, cu valoarea din variabila v_clase. Pentru valoarea 71, avem missing value n variabila v_clase, deoarece nu am definit un interval care s cuprind aceast vrst. De regul, aceast situa ie este determinat de o eroare de definire a intervalelor de clas. Pentru a o repara, ar trebui s intrm din nou n procedura Recode i s redefinim clasele. Aten ie, la declararea intervalelor de grupare n clase sau categorii, trebuie avut grij ca intervalele s nu se suprapun i s nu aib distan e ntre ele! Transformarea operat pe variabila virst nu este de loc inutil. Dac am fi dorit s vedem n ce msur este o rela ie ntre nivelul salariului i vrst, ar fi fost oarecum impropriu (fr a fi propriu-zis o greeal ) s utilizm o statistic parametric (corela ia). n analizele statistice pe vrste este recomandabil, totui, s operm cu grupe de vrst.

Ordonarea dup rang a valorilor unei variabile


Aa cum am spus n cuprinsul sec iunii teoretice, este posibil s ne confruntm cu o variabil cantitativ ale crei valori nu respect condi iile unei statistici parametrice (vezi figura din stnga, unde valoarea 250 este excesiv). ntr-o situa ie de acest gen, una din solu iile posibile este transformarea de rang, cu procedura Transform-Rank cases (caseta din dreapta):

7/8
Actualizat la: 27.02.2006

M. Popa Aplica ii SPSS - Transformarea variabilelor

Variabila vizat (scor) este trecut n lista Variable(s), se seteaz modul de ordonare (am ales atribuirea rangului 1 valorii celei mai mari) iar apoi am ac ionat butonul OK. Procedura permite fixarea unor parametri de transformare cu ajutorul butoanelor Rank i Ties. Caseta Rank Cases: Types, permite alegerea unui mod de atribuire a rangurilor. De exemplu, bifnd Rank, se atribuie fiecrei valori chiar rangul ei. Pentru a afla ce efect au celelalte op iuni, se poate face clic dreapta de mouse pe textul op iunii sau se apas butonul Help al casetei.

Caseta Rank Cases: Ties, permite alegerea modului de atribuire a rangurilor pentru valori egale. Astfel, p iunea Mean, atribuie rangul mediu. De exemplu, pentru valorile 9, 11, 11, 11, 13, valoarea 11 va primi rangul 3 (ca medie a rangurilor 2, 3 i 4). Celelalte op iuni vizeaz atribuirea rangului cel mai mic (Low), al celui mai mare (High).

Procedura se finalizeaz prin crearea unei noi variabile, pe care SPSS o denumete automat, care con ine pozi ia de rang a fiecrei valori din variabila scor, n raport cu celelalte valori ale distribu iei (n imagine, 250 are rangul 1, iar 119, rangul 6).

8/8
Actualizat la: 27.02.2006