Sunteți pe pagina 1din 14

ANALIZA COMPUTERIZATĂ A DATELOR

Unitatea de învăţare 4.
SELECTAREA, RECODAREA ŞI TRANSFORMAREA VARIABILELOR

1. Comanda SELECT CASES

Uneori este necesară selectarea anumitor cazuri din populaţie pentru a face o prelucrare
statistică. Spre exemplu, vrem să vedem dacă legătura dintre salariul iniţial şi salariul final are aceeaşi
valoare la subiecţii care au studii generale. Subiecţii sunt împărţiţi în grupe în funcţie de nivelul de studii
(studii), fiind codificaţi cu 1 în baza de date.
Pentru a selecta numai subiecţii care au studii generale, se foloseşte comanda SELECT
CASES din meniul DATA. Activarea meniului este urmată de apariţia următoarei ferestre:

În câmpul din stânga al ferestrei sunt prezentate toate variabilele din baza de date. În dreapta
ferestrei apar mai multe opţiuni. Pe noi ne interesează opţiunea IF CONDITION IS SATISFIED,
deoarece vrem să selectăm numai cazurile care îndeplinesc o anumită condiţie (să aibă valoarea 1 la
variabila studii adică să fie numai subiecţi cu studii generale).
Această opţiune se alege cu un simplu click stânga al mouse-ului:

Se activează butonul IF, care deschide următoarea casetă de dialog:

Se selectează variabila în funcţie de ce se face selecţia şi se trece în câmpul dintre dreapta


sus. În cazul nostru se selectează variabila STUDII şi se trece în câmpul din dreapta:

151
RUXANDRA-LOREDANA GHERASIM

Se adăugă condiţia. Pentru exemplul nostru, variabila Studii trebuie să aibă numai valoarea 1
(STUDII=1). Se poate folosi tastatura sau se pot activa butoanele cu cifre şi semne ce se găsesc sub
acest câmp. Condiţia va arăta astfel:

Se apasă apoi butonul CONTINUE pentru a salva condiţia:

Se activează butonul OK, baza de date modificându-se, cum se poate observa şi în imaginea
de mai jos:

La sfârşitul bazei de date apare o nouă variabilă, intitulată FILTER_$, care indică rezultatul
selecţiei. Cazurile neselectate sunt “tăiate”, adică ele vor fi ignorate de la analiză. În partea din dreapta-

152
ANALIZA COMPUTERIZATĂ A DATELOR

jos a ecranului apare anunţul FILTER ON, care avertizează utilizatorul cu privire la activarea unei

comenzi de selecţie .

IMPORTANT
Selectarea datelor nu implică şi efectuarea analizei statistice. După selecţie trebuie făcută prelucrarea
statistică a datelor.

EXEMPLU
În cazul nostru trebuie utilizată comanda de analiză a corelaţiei dintre salariul iniţial şi cel final.
Se obţine următorul tabel în fereastra cu rezultate:

Rezultatul obţinut este următorul: r=0,69, p=0,056. În continuare vom interpreta aceste
rezultate:
 semnul corelaţiei: corelaţie pozitivă, legătura este direct proporţională. În cazul subiecţilor cu studii
generale se constată că nivelul mic al salariului iniţial se asociază cu un nivel mic al salariului final,
salariul iniţial mediu se asociază cu un salar final mediu, salariul iniţial mare se asociază cu un salar
final mare.
 mărimea absolută a coeficientului: puterea legăturii dintre cele două variabile este ridicată, valoarea
lui r depăşeşte valoarea de 0,50.
 pragul de semnificaţie: valoarea pragului de semnificaţie este mai mare de 0,050, deci nu există o
legătură semnificativă între salariul iniţial şi final al subiecţilor care au studii generale.
 proporţia de varianţă explicată de relaţia este r2=0,47, deci relaţia găsită apare la 47% dintre
subiecţii cu studii generale. Explicaţia lipsei de semnificaţie a corelaţiei dintre cele două variabile (în
condiţiile în care coeficientul de corelaţie are valoare ridicată) este numărul mic de subiecţi. Numărul
de subiecţi din analiză influenţează valoarea pragului de semnificaţie al corelaţiei dar nu şi puterea
legăturii dintre variabile.
După folosirea acestui “filtru” este indicată dezactivarea. Pentru dezactivarea selecţiei, se
deschide din nou în meniul iniţial DATA - SELECT CASES. În partea de jos a ferestrei se găseşte buton
RESET. Se activează apoi butonul OK, astfel, comanda de filtrare a datelor dispare.

APLICAŢIE
Analizaţi legătura dintre variabilele nivel sociabilitate şi nivel optimism, doar pentru subiecţii de
gen feminin (baza de date BD1).

153
RUXANDRA-LOREDANA GHERASIM

2. COMANDA SPLIT FILE

Uneori însă dorim să vedem ce se întâmplă pentru fiecare subgrup de subiecţi în parte. Pentru
baza de date BAZA2.sav, vom analiza legătura dintre variabilele salariul iniţial şi salariul final pentru
toate categoriile de subiecţi în funcţie de variabila STUDII (nu numai pentru subiecţii cu studii generale
dar şi pentru cei cu studii medii şi superioare). Pentru a nu repeta comanda SELECT CASES de multe
ori se poate utiliza o altă comandă din meniul DATA, şi anume comanda SPLIT FILE. Activarea
comenzii SPLIT FILE deschide următoarea fereastră:

Dintre opţiunile din dreapta alegem ORGANIZE OUTPUT BY GROUPS şi apoi, cu ajutorul
săgeţii, introducem variabila de grupare (STUDII) în câmpul care se activează sub această opţiune:

După apăsarea butonului OK, în partea dreaptă-jos a bazei de date apare anunţul SPLIT FILE
ON, care avertizează utilizatorii că baza de date este împărţită în funcţie de condiţiile (nivelurile)

variabilei de grupare . La fel ca şi în cazul comenzii SELECT CASES, simpla împărţire a bazei de
date nu asigură prelucrarea statistică. De aceea, trebuie folosită comanda CORRELATIOS pentru a
analiza legătura dintre variabilele salariu iniţial şi final al subiecţilor.
Rezultatele analizei statistice sunt prezentate separat, în fişierul OUTPUT, pentru fiecare
condiţie a variabilei independente: studii generale, medii şi superioare:
nivelul de studii al subiecţilor = studii generale

154
ANALIZA COMPUTERIZATĂ A DATELOR

nivelul de studii al subiecţilor = studii medii

nivelul de studii al subiecţilor = studii superioare

APLICAŢIE
Analizaţi legătura dintre variabilele nivel sociabilitate şi nivel optimism, atât pentru subiecţii de
gen feminin, cât şi pentru subiecţii de gen masculin (baza de date BD1).

3. RECODIFICAREA VARIABILELOR

Uneori este necesar ca scorurile brute obţinute de subiecţii unui studiu să fie transformate
pentru a putea verifica ipoteza studiului. Aplicaţia SPSS are o serie de comenzi care permit
transformarea sau recodificarea unei variabile cantitative într-o variabilă calitativă, prin crearea unei noi
variabile în baza de date sau modificarea valorilor unei variabile existente în baza de date.

EXEMPLU
Pentru a exemplifica utilizarea comenzilor de recodificare vom crea o nouă bază de date
(baza5.sav) care conţine mediile obţinute de elevi la sfârşitul anului şcolar. Valorile variabilei sunt:
Media: 8,03, 8,73, 9,19, 8,81, 7,88, 9,06, 9,04, 6,86, 7,69, 7,80, 8,06, 9,06, 7,71, 7,16, 8,88,
8,49, 7,78, 9,76, 8,10, 7,49, 7,79, 6,91, 6,81, 7,54
Vom împărţi elevii în două grupe (grupul elevilor cu performanţe bune şi grupul elevilor cu
performanţe slabe). Împărţirea elevilor în două grupe se realizează în funcţie de mediană, acest
indicator statistic împărţind şirul de scoruri în două parţi egale (proba medianei). Deci vom calcula mai
întâi valoarea medianei şi apoi vom împărţi subiecţii în grupe în funcţie de valoarea acestui indicator.
Pentru calculul medianei vom folosi comanda DESCRIPTIV STATISTICS– FREQUENCIES:

155
RUXANDRA-LOREDANA GHERASIM

Pentru exemplul nostru mediana are valoare 7,95. Subiecţii care au valori mai mici ca mediana
(7,95) vor forma grupul celor cu performanţe scăzute, iar subiecţii care au valori mai mari decât
mediana vor forma grupul celor cu performanţe ridicate. Pentru recodificarea variabilei MEDIA se
utilizează opţiunea RECODE care se găseşte la meniul TRANSFORM:

Comanda RECODE are două opţiuni de recodificare. Se poate păstra variabila ce urmează să
fie recodificată (INTO SAME VARIABLES) sau se poate crea o nouă variabilă (INTO DIFFERENT
VARIABLES).

3.1. Comanda RECODE INTO DIFFERENT VARIABLES


Selectăm opţiunea de creare a unei noi variabile care să cuprindă grupele obţinute în urma
recodificării. Se selectează opţiunea INTO DIFFERENT VARIABLES, ceea ce are ca urmare apariţia
următoarei casete de dialog:

3 2
1

5
4

1. câmpul care conţine variabilele din baza de date;


2. în câmpul NAME de la OUT VARIABLE se introduce numele variabilei create;
3 în câmpul INPUT VARIABLE →OUTPUT VARIABLE se introduce atât variabila ce urmează să fie
recodificată cât şi numele noii variabile;
4. butonul OLD AND NEW VALUE permite recodificarea variabilei iniţiale
5 butonul IF permite crearea unei noi variabile doar prin selecţia anumitor valori ale variabilei iniţiale

Pentru exemplul nostru vom trece


variabila pe care dorim să o recodificăm,
MEDIA, în câmpul din mijloc al ferestrei cu
ajutorul butonului de trecere. Vom denumi
noua variabilă NIVPERF. Noul nume se
tastează în câmpul NAME al câmpului
OUTPUT VARIABLE:

Pentru ca noul nume al variabilei să apară în câmpul din mijloc INPUT VARIABLE →OUTPUT
VARIABLE şi astfel să aibă loc recodificarea, se activează butonul CHANGE din câmpul OUTPUT
VARIABLE:

156
ANALIZA COMPUTERIZATĂ A DATELOR

Se activează butonul OLD AND NEW VALUE pentru a defini valorile noii variabile. Activarea
acestui buton deschide următoarea casetă de dialog:

Această fereastră prezintă mai multe câmpuri:


1. câmpul OLD VALUE se referă valorile variabilei iniţiale
2. câmpul NEW VALUE face referire la valorile noii variabile
3. în câmpul OLD→NEW se reunesc opţiunile de recodificarea a variabilelor
În exemplul nostru, trebuie ca valorile variabilei MEDIA (variabila iniţială) să le redefinim,
formând o nouă variabilă. Astfel, subiecţii care au obţinut scoruri mai mici decât mediana (7,95) vor
forma grupul subiecţilor cu performanţa scăzută, care va reprezenta valoarea 1 a variabilei NIVPERF
(ce va fi creată). În consecinţă, vom activa opţiunea RANGE, LOWEST THROUGH din câmpul OLD
VALUE şi vom trece în câmpul
activat valoarea medianei
(7,95). Cu alte cuvinte această
opţiune va însemna că toate
valorile variabilei MEDIA mai
mici de 7,95 vor fi recodificate,
prind valoarea în cadrul noii
variabile NIVPERF. În câmpul
NEW VALUE, în câmpul de
lângă opţiunea VALUE, vom
tasta valoarea 1:

157
RUXANDRA-LOREDANA GHERASIM

Se apasă apoi butonul ADD al câmpului OLD→NEW, pentru a putea recodifica următoarele
valori. Apoi se activează opţiunea
RANGE, THROUGH HIGHEST din
câmpul OLD VALUE şi se trece în
câmpul activat valoarea medianei
(7,95). Această opţiune va însemna
că valorile mai mari de 7,95 ale
variabilei MEDIA vor fi recodificate în
variabila NIVPERF primind valoarea
2. În consecinţă, în câmpul NEW
VALUE, în câmpul de lângă opţiunea
VALUE, vom tasta valoarea 2, după
cum se poate observa şi în imaginea
din dreapta.
Pentru a fi reţinută şi această a doua condiţie de recodificare, se acţionează din nou butonul
ADD din câmpul OLD→NEW. În concluzie, scorurile mai mici de 7,95 ale variabilei MEDIA vor primi
valoarea 1 în cadrul variabilei
NIVPERF, iar valorile mai mari de
7,95 ale variabilei MEDIA vor
reprezenta valoarea 2 al variabilei
NIVPERF, imaginea din stânga.
Se activează apoi butonul
CONTINUE şi butonul OK al
ferestrei RECODE INTO A
DIFFERENT VARIABLES, ceea
ce duce la modificarea bazei de
date, cum se poate observa şi în
imaginea din stânga.

Se observă că în baza de date apare noua variabilă NIVPERF, cu


două valori. Puteţi verifica dacă recodificarea a fost corect realizată în
imaginea din dreapta.

APLICAŢIE
Împărţiţi în două părţi scorurile subiecţilor la variabila nivel
sociabilitate, în care 1 va reprezenta nivel scăzut iar 2 va reprezenta nivel
ridicat (baza de date BD1).

Există posibilitatea de a împărţi valorile unei variabile în mai mult de


două grupe.

EXEMPLU
Pentru exemplificare vom împărţi scorurile la variabila MEDIA în trei
parţi egale. Prima treime va alcătui grupul subiecţilor cu performanţă
scăzută, a doua treime grupul subiecţilor cu performanţă medie, iar ultima
treime grupul subiecţilor cu performanţă ridicată. Pentru a putea face

158
ANALIZA COMPUTERIZATĂ A DATELOR

împărţirea, mai întâi trebuie să calculăm valorile corespunzătoare percentilelor care împart şirul de
scoruri în 3 parţi egale (fiecare parte reprezentând 33,33% din total). Se foloseşte comanda
DESCRIPTIV STATISTICS– FREQUENCIES. Din câmpul PERCENTILE VALUES se bifează opţiunea
PERCENTILE şi se introduc centilele care împart şirul de scoruri în 3 parţi egale (adică 33,33% şi
66,66%).

Subiecţii cu valori mai mici de 7,73 vor forma grupul celor cu performanţa scăzută (grupul 1), cei
cu valori cuprinse între 7,73 şi 8,64 vor forma grupul subiecţilor cu performanţă de nivel mediu (grupul
2), iar cei cu medii mai mari de 8,64 vor reprezenta grupului cu performanţa ridicată (grupul 3).
Pentru a crea această nouă variabilă se activează meniul TRANSFORM – RECODE - INTO
DIFFERENT VARIABLES. Vom denumi noua variabila NIVPERF2, tastând noul nume în câmpul NAME
al câmpului OUT VARIABLE şi
apoi activând butonul CHANGE.
În acest exemplu, scorurile
mai mici de 7,73 ale variabilei
MEDIA vor forma primul grupului 1,
adică nivelul 1 al noii variabile
NIVPERF2. Vom activa opţiunea
RANGE, LOWEST THROUGH din
câmpul OLD VALUE şi vom trece
în câmpul activat valoarea 7,73, iar
în câmpul NEW VALUE vom trece
valoarea 1. Se activează apoi
butonul ADD al câmpului OLD→NEW, pentru a putea introduce următoarea condiţie.
Valorile variabilei MEDIE
cuprinse între 7,73 şi 8,64 vor
reprezenta nivelul 2 al
variabilei NIVPERF2. Se
activează prima opţiune
RANGE THROUGH şi se
tastează valorile minime şi
maxime. În câmpul NEW
VALUE se trece valoarea 2,
cum se poate observa şi în
imaginea alăturată.
Activăm apoi butonul
ADD al câmpului OLD→NEW. Pentru crearea ultimului grup, care cuprinde valori mai mari de 8,64 se
activează opţiunea RANGE, THROUGH HIGHEST din câmpul OLD VALUE. În câmpul NEW VALUE se
trece valoarea 3, apoi se activează butonul ADD.
Se activează apoi butonul CONTINUE şi butonul OK al ferestrei RECODE INTO A DIFFERENT
VARIABLES, ceea ce duce la modificarea bazei de date, cum se poate observa şi în imaginea
alăturată:

159
RUXANDRA-LOREDANA GHERASIM

Se observă că în baza de date apare noua variabilă NIVPERF2,


cu trei valori.

3.2. COMANDA RECODE INTO SAME VARIABLES

Rezultate similare se obţin dacă se utilizează comanda


RECODE opţiunea INTO SAME VARIABLES, cu excepţia faptului că se
păstrează numele iniţial al variabilei recodificate. Pentru exemplificare
vom utiliza aceeaşi bază de date (baza5.sav) şi vom împărţi în două
scorurile subiecţilor. Activarea comenzii duce la apariţia casete de dialog:

În câmpul din stânga apar toate variabilele din baza de date, în câmpul din dreapta se introduc
variabilele pe care dorim să le recodificăm. În exemplu nostru vrem să recodificăm variabila Media.
Trecem variabila în câmpul din dreapta:

Se activează butonul OLD AND NEW VALUES, care are aceleaşi opţiuni ca în cazul opţiunii
anteriore de transformare într-o variabilă diferită:

160
ANALIZA COMPUTERIZATĂ A DATELOR

Recodificare se realiză la
fel ca în exemplu anterior, când am
utilizat opţiunea de recodificare
într-o altă variabilă (imaginea din
dreapta):

După confirmarea
recodificării să vedem modificările
din baza de date. Se constată că
s-au modificat valorile variabilei
MEDIA, aceasta având acum
aceleaşi valori ca şi variabila
NIVPERF. Acest lucru demonstrează că cele două opţiuni duc la acelaşi
rezultat (imaginea din dreapta).

TEMĂ DE REFLECŢIE
Comenzile Recode into different variables şi Recode into same
variables conduc la acelaşi rezultat. De ce ar fi uneori preferabil să folosim
Recode into different variable? Care este avantajul folosirii comenzii
Recode into same variable?

4. INVERSAREA VALORILOR VARIABILELOR

Comanda de recodificare poate fi utilizată şi pentru recodificarea


valorilor scorurilor obţinute la diferiţi itemi.
Pentru a exemplifica utilizarea acestor comenzi de
recodificare vom crea o nouă bază de date (baza6.sav)
care conţine patru variabile: NRCHEST (codul de
identificare), PRES (Câtă încredere aveţi în preşedinte?),
GUV (Câtă încredere aveţi în guvern?), PARLAM (Câtă
încredere aveţi în parlament?). Prezentăm scorurile
obţinute de 16 dintre subiecţi.
Pentru itemii 1 şi 3 subiecţii au răspuns pe o scală
de la 1 (foarte puţin) la 4 (foarte mult). La itemul 2, însă,
subiecţii au răspuns pe o scală de la 1 (foarte mult) la 4
(foarte puţin). Pentru a vedea atitudinea subiecţilor faţă de
instituţiile statului ar trebui să însumăm răspunsurile
subiecţilor de la cei 3 itemi. Pentru a putea face acest lucru
ar trebui ca răspunsurile de la itemul 2 să fie transformate,
pentru ca scala de evaluare să aibă aceeaşi semnificaţie cu a ceilalţi doi itemi (valoarea 1 să însemne
foarte puţin iar valoare 4 să însemne foarte mult).
Recodificarea în acest caz presupune inversarea scalei de evaluare pentru itemul 2, adică
valoarea 1 a itemului să devină 4 (ceea ce înseamnă foarte mult), valoarea 2 să devină 3, valoarea 3 să
devină 2, iar valoarea 4 a itemului să devină 1 (ceea ce înseamnă foarte puţin).

161
RUXANDRA-LOREDANA GHERASIM

Pentru recodificare ar putea fi utilizată oricare dintre cele două opţiuni prezentate anterior
RECODE INTO SAME
VARIABLES sau INTO
DIFFERENT VARIABLES. Vom
folosi comanda RECODE INTO
DIFFERENT VARIABLES pentru a
putea verifica dacă recodificarea a
fost realizată. Vom redenumi
variabila recodificată GUV_R:

Vom activa butonul OLD AND NEW VARIABLES. Pentru inversarea scalei de evaluare a
itemului vom folosi numai
opţiunile VALUE din câmpul
OLD VALUE şi NEW VALUE.
Astfel, valoarea 1 a vechii
variabile devine 4 pentru noua
variabilă, deci se tastează 1 în
dreptul opţiunii VALUE din
câmpul OLD VALUE şi cifra 4 în
dreptul opţiunii VALUE din
câmpul NEW VALUE.

Se activează butonul ADD din


câmpul OLD→NEW. Apoi se tastează 2 în
câmpul de la opţiunea VALUE din câmpul
OLD VALUE şi cifra 3 în câmpul de la
opţiunea VALUE din câmpul NEW VALUE:

La fel se procedează şi pentru celelalte valori care trebuie recodificate. În final trebuie să avem
următoarele transformări în câmpul OLD→NEW:

162
ANALIZA COMPUTERIZATĂ A DATELOR

După activarea butonului CONTINUE şi butonului OK al ferestrei principale, baza de date va


conţine o nouă variabilă (GUV_R) care conţine valorile inversate ale itemului 2:

5. CALCULAREA SCORULUI TOTAL – COMANDA TRANSFORM COMPUTE

Pentru a calcula scorul total la atitudinea faţă de instituţiile statului, trebuie să însumăm
scorurile subiecţilor obţinute la cei trei itemi. Pentru a putea face acest lucru se foloseşte meniul
TRANSFORM, opţiunea COMPUTE:

3
1

Prezentăm caracteristicile principale ale acestei ferestre:


1. în câmpul TARGET VARIABLE se tastează numele noii variabile
2. în acest câmp sunt prezentate variabilele din baza de date
3. în câmpul NUMERIC EXPRESSION se introduce formula de calcul a noii variabile; sub acest
câmp se găsesc butoane cu cifre şi semne, dar şi un câmp cu funcţii complexe care pot fi utilizate
pentru calculul noilor variabile.
Pentru exemplu nostru vom numi noua variabila ATIT, deci vom tasta numele noii variabile în
câmpul TARGET VARIABLE:

163
RUXANDRA-LOREDANA GHERASIM

Apoi vom scrie formula de calcul care va consta în însumarea scorurilor obţinute la cele trei
variabile: PRES, GUV_R şi PARLAM. Variabile sunt trecute în câmpul NUMERIC EXPRESSION
folosind butonul de trecere. Semnul plus se introduce de la tastatură sau folosind butoanele care se
găsesc sub câmpul NUMERIC EXPRESSION:

După activarea butonului OK în baza de date apare o nouă variabila, cu numele ATIT.

Această nouă variabilă reprezintă atitudinea subiecţilor faţă de instituţiile statului şi reprezintă
suma răspunsurilor la cei trei itemi.

164