Documente Academic
Documente Profesional
Documente Cultură
Unitatea de învăţare 4.
SELECTAREA, RECODAREA ŞI TRANSFORMAREA VARIABILELOR
Uneori este necesară selectarea anumitor cazuri din populaţie pentru a face o prelucrare
statistică. Spre exemplu, vrem să vedem dacă legătura dintre salariul iniţial şi salariul final are aceeaşi
valoare la subiecţii care au studii generale. Subiecţii sunt împărţiţi în grupe în funcţie de nivelul de studii
(studii), fiind codificaţi cu 1 în baza de date.
Pentru a selecta numai subiecţii care au studii generale, se foloseşte comanda SELECT
CASES din meniul DATA. Activarea meniului este urmată de apariţia următoarei ferestre:
În câmpul din stânga al ferestrei sunt prezentate toate variabilele din baza de date. În dreapta
ferestrei apar mai multe opţiuni. Pe noi ne interesează opţiunea IF CONDITION IS SATISFIED,
deoarece vrem să selectăm numai cazurile care îndeplinesc o anumită condiţie (să aibă valoarea 1 la
variabila studii adică să fie numai subiecţi cu studii generale).
Această opţiune se alege cu un simplu click stânga al mouse-ului:
151
RUXANDRA-LOREDANA GHERASIM
Se adăugă condiţia. Pentru exemplul nostru, variabila Studii trebuie să aibă numai valoarea 1
(STUDII=1). Se poate folosi tastatura sau se pot activa butoanele cu cifre şi semne ce se găsesc sub
acest câmp. Condiţia va arăta astfel:
Se activează butonul OK, baza de date modificându-se, cum se poate observa şi în imaginea
de mai jos:
La sfârşitul bazei de date apare o nouă variabilă, intitulată FILTER_$, care indică rezultatul
selecţiei. Cazurile neselectate sunt “tăiate”, adică ele vor fi ignorate de la analiză. În partea din dreapta-
152
ANALIZA COMPUTERIZATĂ A DATELOR
jos a ecranului apare anunţul FILTER ON, care avertizează utilizatorul cu privire la activarea unei
comenzi de selecţie .
IMPORTANT
Selectarea datelor nu implică şi efectuarea analizei statistice. După selecţie trebuie făcută prelucrarea
statistică a datelor.
EXEMPLU
În cazul nostru trebuie utilizată comanda de analiză a corelaţiei dintre salariul iniţial şi cel final.
Se obţine următorul tabel în fereastra cu rezultate:
Rezultatul obţinut este următorul: r=0,69, p=0,056. În continuare vom interpreta aceste
rezultate:
semnul corelaţiei: corelaţie pozitivă, legătura este direct proporţională. În cazul subiecţilor cu studii
generale se constată că nivelul mic al salariului iniţial se asociază cu un nivel mic al salariului final,
salariul iniţial mediu se asociază cu un salar final mediu, salariul iniţial mare se asociază cu un salar
final mare.
mărimea absolută a coeficientului: puterea legăturii dintre cele două variabile este ridicată, valoarea
lui r depăşeşte valoarea de 0,50.
pragul de semnificaţie: valoarea pragului de semnificaţie este mai mare de 0,050, deci nu există o
legătură semnificativă între salariul iniţial şi final al subiecţilor care au studii generale.
proporţia de varianţă explicată de relaţia este r2=0,47, deci relaţia găsită apare la 47% dintre
subiecţii cu studii generale. Explicaţia lipsei de semnificaţie a corelaţiei dintre cele două variabile (în
condiţiile în care coeficientul de corelaţie are valoare ridicată) este numărul mic de subiecţi. Numărul
de subiecţi din analiză influenţează valoarea pragului de semnificaţie al corelaţiei dar nu şi puterea
legăturii dintre variabile.
După folosirea acestui “filtru” este indicată dezactivarea. Pentru dezactivarea selecţiei, se
deschide din nou în meniul iniţial DATA - SELECT CASES. În partea de jos a ferestrei se găseşte buton
RESET. Se activează apoi butonul OK, astfel, comanda de filtrare a datelor dispare.
APLICAŢIE
Analizaţi legătura dintre variabilele nivel sociabilitate şi nivel optimism, doar pentru subiecţii de
gen feminin (baza de date BD1).
153
RUXANDRA-LOREDANA GHERASIM
Uneori însă dorim să vedem ce se întâmplă pentru fiecare subgrup de subiecţi în parte. Pentru
baza de date BAZA2.sav, vom analiza legătura dintre variabilele salariul iniţial şi salariul final pentru
toate categoriile de subiecţi în funcţie de variabila STUDII (nu numai pentru subiecţii cu studii generale
dar şi pentru cei cu studii medii şi superioare). Pentru a nu repeta comanda SELECT CASES de multe
ori se poate utiliza o altă comandă din meniul DATA, şi anume comanda SPLIT FILE. Activarea
comenzii SPLIT FILE deschide următoarea fereastră:
Dintre opţiunile din dreapta alegem ORGANIZE OUTPUT BY GROUPS şi apoi, cu ajutorul
săgeţii, introducem variabila de grupare (STUDII) în câmpul care se activează sub această opţiune:
După apăsarea butonului OK, în partea dreaptă-jos a bazei de date apare anunţul SPLIT FILE
ON, care avertizează utilizatorii că baza de date este împărţită în funcţie de condiţiile (nivelurile)
variabilei de grupare . La fel ca şi în cazul comenzii SELECT CASES, simpla împărţire a bazei de
date nu asigură prelucrarea statistică. De aceea, trebuie folosită comanda CORRELATIOS pentru a
analiza legătura dintre variabilele salariu iniţial şi final al subiecţilor.
Rezultatele analizei statistice sunt prezentate separat, în fişierul OUTPUT, pentru fiecare
condiţie a variabilei independente: studii generale, medii şi superioare:
nivelul de studii al subiecţilor = studii generale
154
ANALIZA COMPUTERIZATĂ A DATELOR
APLICAŢIE
Analizaţi legătura dintre variabilele nivel sociabilitate şi nivel optimism, atât pentru subiecţii de
gen feminin, cât şi pentru subiecţii de gen masculin (baza de date BD1).
3. RECODIFICAREA VARIABILELOR
Uneori este necesar ca scorurile brute obţinute de subiecţii unui studiu să fie transformate
pentru a putea verifica ipoteza studiului. Aplicaţia SPSS are o serie de comenzi care permit
transformarea sau recodificarea unei variabile cantitative într-o variabilă calitativă, prin crearea unei noi
variabile în baza de date sau modificarea valorilor unei variabile existente în baza de date.
EXEMPLU
Pentru a exemplifica utilizarea comenzilor de recodificare vom crea o nouă bază de date
(baza5.sav) care conţine mediile obţinute de elevi la sfârşitul anului şcolar. Valorile variabilei sunt:
Media: 8,03, 8,73, 9,19, 8,81, 7,88, 9,06, 9,04, 6,86, 7,69, 7,80, 8,06, 9,06, 7,71, 7,16, 8,88,
8,49, 7,78, 9,76, 8,10, 7,49, 7,79, 6,91, 6,81, 7,54
Vom împărţi elevii în două grupe (grupul elevilor cu performanţe bune şi grupul elevilor cu
performanţe slabe). Împărţirea elevilor în două grupe se realizează în funcţie de mediană, acest
indicator statistic împărţind şirul de scoruri în două parţi egale (proba medianei). Deci vom calcula mai
întâi valoarea medianei şi apoi vom împărţi subiecţii în grupe în funcţie de valoarea acestui indicator.
Pentru calculul medianei vom folosi comanda DESCRIPTIV STATISTICS– FREQUENCIES:
155
RUXANDRA-LOREDANA GHERASIM
Pentru exemplul nostru mediana are valoare 7,95. Subiecţii care au valori mai mici ca mediana
(7,95) vor forma grupul celor cu performanţe scăzute, iar subiecţii care au valori mai mari decât
mediana vor forma grupul celor cu performanţe ridicate. Pentru recodificarea variabilei MEDIA se
utilizează opţiunea RECODE care se găseşte la meniul TRANSFORM:
Comanda RECODE are două opţiuni de recodificare. Se poate păstra variabila ce urmează să
fie recodificată (INTO SAME VARIABLES) sau se poate crea o nouă variabilă (INTO DIFFERENT
VARIABLES).
3 2
1
5
4
Pentru ca noul nume al variabilei să apară în câmpul din mijloc INPUT VARIABLE →OUTPUT
VARIABLE şi astfel să aibă loc recodificarea, se activează butonul CHANGE din câmpul OUTPUT
VARIABLE:
156
ANALIZA COMPUTERIZATĂ A DATELOR
Se activează butonul OLD AND NEW VALUE pentru a defini valorile noii variabile. Activarea
acestui buton deschide următoarea casetă de dialog:
157
RUXANDRA-LOREDANA GHERASIM
Se apasă apoi butonul ADD al câmpului OLD→NEW, pentru a putea recodifica următoarele
valori. Apoi se activează opţiunea
RANGE, THROUGH HIGHEST din
câmpul OLD VALUE şi se trece în
câmpul activat valoarea medianei
(7,95). Această opţiune va însemna
că valorile mai mari de 7,95 ale
variabilei MEDIA vor fi recodificate în
variabila NIVPERF primind valoarea
2. În consecinţă, în câmpul NEW
VALUE, în câmpul de lângă opţiunea
VALUE, vom tasta valoarea 2, după
cum se poate observa şi în imaginea
din dreapta.
Pentru a fi reţinută şi această a doua condiţie de recodificare, se acţionează din nou butonul
ADD din câmpul OLD→NEW. În concluzie, scorurile mai mici de 7,95 ale variabilei MEDIA vor primi
valoarea 1 în cadrul variabilei
NIVPERF, iar valorile mai mari de
7,95 ale variabilei MEDIA vor
reprezenta valoarea 2 al variabilei
NIVPERF, imaginea din stânga.
Se activează apoi butonul
CONTINUE şi butonul OK al
ferestrei RECODE INTO A
DIFFERENT VARIABLES, ceea
ce duce la modificarea bazei de
date, cum se poate observa şi în
imaginea din stânga.
APLICAŢIE
Împărţiţi în două părţi scorurile subiecţilor la variabila nivel
sociabilitate, în care 1 va reprezenta nivel scăzut iar 2 va reprezenta nivel
ridicat (baza de date BD1).
EXEMPLU
Pentru exemplificare vom împărţi scorurile la variabila MEDIA în trei
parţi egale. Prima treime va alcătui grupul subiecţilor cu performanţă
scăzută, a doua treime grupul subiecţilor cu performanţă medie, iar ultima
treime grupul subiecţilor cu performanţă ridicată. Pentru a putea face
158
ANALIZA COMPUTERIZATĂ A DATELOR
împărţirea, mai întâi trebuie să calculăm valorile corespunzătoare percentilelor care împart şirul de
scoruri în 3 parţi egale (fiecare parte reprezentând 33,33% din total). Se foloseşte comanda
DESCRIPTIV STATISTICS– FREQUENCIES. Din câmpul PERCENTILE VALUES se bifează opţiunea
PERCENTILE şi se introduc centilele care împart şirul de scoruri în 3 parţi egale (adică 33,33% şi
66,66%).
Subiecţii cu valori mai mici de 7,73 vor forma grupul celor cu performanţa scăzută (grupul 1), cei
cu valori cuprinse între 7,73 şi 8,64 vor forma grupul subiecţilor cu performanţă de nivel mediu (grupul
2), iar cei cu medii mai mari de 8,64 vor reprezenta grupului cu performanţa ridicată (grupul 3).
Pentru a crea această nouă variabilă se activează meniul TRANSFORM – RECODE - INTO
DIFFERENT VARIABLES. Vom denumi noua variabila NIVPERF2, tastând noul nume în câmpul NAME
al câmpului OUT VARIABLE şi
apoi activând butonul CHANGE.
În acest exemplu, scorurile
mai mici de 7,73 ale variabilei
MEDIA vor forma primul grupului 1,
adică nivelul 1 al noii variabile
NIVPERF2. Vom activa opţiunea
RANGE, LOWEST THROUGH din
câmpul OLD VALUE şi vom trece
în câmpul activat valoarea 7,73, iar
în câmpul NEW VALUE vom trece
valoarea 1. Se activează apoi
butonul ADD al câmpului OLD→NEW, pentru a putea introduce următoarea condiţie.
Valorile variabilei MEDIE
cuprinse între 7,73 şi 8,64 vor
reprezenta nivelul 2 al
variabilei NIVPERF2. Se
activează prima opţiune
RANGE THROUGH şi se
tastează valorile minime şi
maxime. În câmpul NEW
VALUE se trece valoarea 2,
cum se poate observa şi în
imaginea alăturată.
Activăm apoi butonul
ADD al câmpului OLD→NEW. Pentru crearea ultimului grup, care cuprinde valori mai mari de 8,64 se
activează opţiunea RANGE, THROUGH HIGHEST din câmpul OLD VALUE. În câmpul NEW VALUE se
trece valoarea 3, apoi se activează butonul ADD.
Se activează apoi butonul CONTINUE şi butonul OK al ferestrei RECODE INTO A DIFFERENT
VARIABLES, ceea ce duce la modificarea bazei de date, cum se poate observa şi în imaginea
alăturată:
159
RUXANDRA-LOREDANA GHERASIM
În câmpul din stânga apar toate variabilele din baza de date, în câmpul din dreapta se introduc
variabilele pe care dorim să le recodificăm. În exemplu nostru vrem să recodificăm variabila Media.
Trecem variabila în câmpul din dreapta:
Se activează butonul OLD AND NEW VALUES, care are aceleaşi opţiuni ca în cazul opţiunii
anteriore de transformare într-o variabilă diferită:
160
ANALIZA COMPUTERIZATĂ A DATELOR
Recodificare se realiză la
fel ca în exemplu anterior, când am
utilizat opţiunea de recodificare
într-o altă variabilă (imaginea din
dreapta):
După confirmarea
recodificării să vedem modificările
din baza de date. Se constată că
s-au modificat valorile variabilei
MEDIA, aceasta având acum
aceleaşi valori ca şi variabila
NIVPERF. Acest lucru demonstrează că cele două opţiuni duc la acelaşi
rezultat (imaginea din dreapta).
TEMĂ DE REFLECŢIE
Comenzile Recode into different variables şi Recode into same
variables conduc la acelaşi rezultat. De ce ar fi uneori preferabil să folosim
Recode into different variable? Care este avantajul folosirii comenzii
Recode into same variable?
161
RUXANDRA-LOREDANA GHERASIM
Pentru recodificare ar putea fi utilizată oricare dintre cele două opţiuni prezentate anterior
RECODE INTO SAME
VARIABLES sau INTO
DIFFERENT VARIABLES. Vom
folosi comanda RECODE INTO
DIFFERENT VARIABLES pentru a
putea verifica dacă recodificarea a
fost realizată. Vom redenumi
variabila recodificată GUV_R:
Vom activa butonul OLD AND NEW VARIABLES. Pentru inversarea scalei de evaluare a
itemului vom folosi numai
opţiunile VALUE din câmpul
OLD VALUE şi NEW VALUE.
Astfel, valoarea 1 a vechii
variabile devine 4 pentru noua
variabilă, deci se tastează 1 în
dreptul opţiunii VALUE din
câmpul OLD VALUE şi cifra 4 în
dreptul opţiunii VALUE din
câmpul NEW VALUE.
La fel se procedează şi pentru celelalte valori care trebuie recodificate. În final trebuie să avem
următoarele transformări în câmpul OLD→NEW:
162
ANALIZA COMPUTERIZATĂ A DATELOR
Pentru a calcula scorul total la atitudinea faţă de instituţiile statului, trebuie să însumăm
scorurile subiecţilor obţinute la cei trei itemi. Pentru a putea face acest lucru se foloseşte meniul
TRANSFORM, opţiunea COMPUTE:
3
1
163
RUXANDRA-LOREDANA GHERASIM
Apoi vom scrie formula de calcul care va consta în însumarea scorurilor obţinute la cele trei
variabile: PRES, GUV_R şi PARLAM. Variabile sunt trecute în câmpul NUMERIC EXPRESSION
folosind butonul de trecere. Semnul plus se introduce de la tastatură sau folosind butoanele care se
găsesc sub câmpul NUMERIC EXPRESSION:
După activarea butonului OK în baza de date apare o nouă variabila, cu numele ATIT.
Această nouă variabilă reprezintă atitudinea subiecţilor faţă de instituţiile statului şi reprezintă
suma răspunsurilor la cei trei itemi.
164