Sunteți pe pagina 1din 10

Analiza datelor

ORGANIZAREA DATELOR PENTRU ANALIZ


Pentru a rspunde ct mai bine cerinelor, SPSS pune la dispoziie proceduri pentru
efectuarea multor operaii de organizare a datelor astfel nct s poat fi realizate analize ct
mai diverse i complexe. Astfel, n cazul n care se dorete efectuarea unor analize la nivelul
unei pri din cazurile nregistrate devine necesar ordonarea dup anumite criterii a bazei de date
sau mprirea acesteia n subgrupuri. Dac se dorete extinderea analizei prin includerea altor
variabile nregistrate n alte fiiere sau prin includerea altor cazuri nregistrate n alte fiiere, cu
ajutorul SPSS sunt posibile aceste lucruri.
Aceste proceduri sunt prezentate n continuare.
Sortarea bazei de date
Sortarea este operaia de aranjare a bazei de date fie n funcie de numele fiecrei
variabile, fie n funcie de ordinea cresctoare/descresctoare a valorilor unei variabile. Cea
mai util dintre cele dou variante este sortarea cazurilor dup a numite criterii. Acesta este
util atunci cnd se face vizualizarea valorilor n vederea identificrii valorilor excesive, cnd
se dorete identificarea unei anumite valori tipice vizual sau atunci cnd se dorete listarea
ordonat a bazei de date.
Comanda utilizat este Sort cases din meniul Data. Acesta determin afiarea ferestrei
Sort Cases:

Din lista variabilelor incluse n baza de date se aleg variabila sau variabilele care vor
constitui criteriile de ordonare i se vor aduce n caseta Sort by folosind butonul
.
n imaginea de mai sus se realizeaz sortarea bazei de date, cresctor (Ascending), dup
valorile variabilei Curent salary.
n cazul sortrii simultane dup mai multe variabile, se poate stabili sensul operaiei
(ascendent sau descendent) separat pentru fiecare variabil n parte.
Trebuie reinut c sortarea bazei de date nu are efecte asupra rezultatelor obinute cu
diversele proceduri de analiz statistic.
n cazul sortrii variabilelor se utilizeaz comanda Sort variables din meniul Data
care va afia fereastra:

Analiza datelor

Variabilele pot fi sortate dup oricare dintre caracteristicile lor ascendent sau
descendent.
mprirea bazei de date n subgrupuri
Baza de date SPSS poate fi mprit n subgrupuri, pentru analiza separat a fiecrui
grup n parte. Atunci cnd datele sunt organizate pe subgrupuri, orice procedur de analiz
efectuat se aplic automat separat pentru fiecare subgrup n parte, ca i cum ar fi mai multe baze
de date analizate n paralel.
Procedura este Data-Split File, apelarea sa permite deschiderea ferestrei de mai jos:

Fereastra pune la dispoziie mai multe opiuni:


1. Analyze all cases, do not create groups permite analiza complet a datelor din baza de
date curent, fr a crea grupuri.
2. Compare groups permite crearea de grupuri i afiarea rezultatelor prelucrrilor pe
grupuri n aa fel nct s fie uor de comparat.
3. Organize output by groups permite crearea de grupuri iar rezultatele se afieaz separat
pe grupuri.
Dup apelarea procedurii Split File nu vei observa nici o modificare vizibil asupra bazei de
date. Efectul procedurii va fi vizibil n fereastra SPSS Viewer a rezultatelor atunci cnd vor fi
afiate rezultatele prelucrrilor ulterioare.
Selectarea anumitor cazuri
Selectarea doar a cazurilor care respect anumite criterii n vederea aplicrii
procedurilor de prelucrare numai asupra acestora este o operaie care apare uzual n cazul unei
cercetri. Fereastra care se deschide dup apelarea acestei comenzi este:

Analiza datelor

Prin activarea opiunii If condition is satisified i acionarea butonului If... se pot selecta
doar cazurile care ndeplinesc anumite condiii. Dup apsarea butonului If... se deschide
fereastra urmtoare:

n imaginea de mai sus s-a dorit selectarea cazurilor pentru care variabila gender (sex)
are valoarea m, adic selectarea cazurilor care se refer la brbai.
Cazurile neselectate pot fi terse dup finalizarea procedurii de selectare prin bifarea
opiunii Delete unselected cases din fereastra Select Cases.
Se poate selecta un eantion aleator din toat baza de date dac se utilizeaz opiunea
Random sample of cases caz n care se deschide o fereastr secundar care permite specificarea
unui procent din totalul cazurilor sau unui numr exact de cazuri din toat baza de date.

Analiza datelor

Exist i alte variante de a selecta cazurile ce trebuiesc analizate. n fereastra Select


Cases n zona Output se stabilete modul n care vor fi tratate cazurile selectate n sensul
utilizrii lor n analiz sau copierii lor n alt baz de date.
Odat activat opiunea de selectare a cazurilor se va observa marcarea cu o linie
diagonal a cazurilor neselectate respectiv apariia n baza de date a unei variabile noi
filter_$, variabil de sistem care va avea valoarea 1 pentru cazurile selectate i 0 pentru
cazurile neselectate.
Agregarea cazurilor multiple
Putem avea situaii n care, n aceeai baz de date, s existe, din diverse motive, mai
multe nregistrri care vizeaz subieci cu unele caracteristici identice.
De exemplu, baza de date din imaginea alturat cuprinde mai multe informaii despre
subieci care au acelai sex sau acelai mediu de provenien. Dac dorim s agregm
informaiile coninute n baza de date pe medii sau sexe se poate apela aceast procedur. La
finalul derulrii sale se vor obine doar attea nregistrri cte valori are variabila dup care se
face agregarea n acelai fiier sau ntr-un fiier nou. Dac agregarea se va face dup variabila
mediu vom obine dou nregistrri, una pentru valoarea 1 mediu urban i una pentru
valoarea 2 mediu rural.

Procedura de agregare se lanseaz din meniul Data-Aggregate, care deschide urmtoarea


fereastr:

Analiza datelor

Se plaseaz n lista Break Variable(s) variabila dup care se face agregarea datelor. n
lista Aggregate variable(s) se trec variabilele care urmeaz s fie agregate. Se observ c vor
rezulta mai multe variabile (cte o variabil nou pentru fiecare variabil ce va fi agregat)
denumite automat (de exemplu pentru Alte_venituri
va fi creat variabila
Alte_venituri_mean) care vor fi egale n cazul de fa cu media valorilor variabilelor iniiale
(Alte_venituri_mean= MEAN(Alte_venituri)). Din acest motiv este uor de neles de ce sunt
acceptate dect variabile numerice pentru aceast procedur.
Dac agregarea va fi fcut nu prin determinarea mediei valorilor variabilelor iniiale,
ci prin alte funcii, atunci se poate apela la butonul Functions care deschide fereastra de
mai jos i n care se poate face alegere dintre mai multe variante de agregare.

First value prima valoare


Last value ultima valoare
Number of cases numrul de nregistrri
5

Analiza datelor

Standard deviation abaterea standard


Minimum value valoarea minim
Maximum valoarea maxim
Sum of values suma valorilor
Opiunile din zona inferioar a casetei permit alegerea unor funcii de agregare bazate pe
procentajul valorilor
Oricum, nu se poate alege dect o singur funcie de agregare, celelalte putnd fi folosite doar
pentru o agregare ulterioar.
Dac se dorete redenumirea variabilelor rezultate n urma agregrii se poate aciona butonul
Name&Label care deschide fereastra de mai jos, n care se pot face operaiile necesare.

Tot n fereastra de agregare, n zona Save, se mai pot specifica variantele de pstrare a variabilelor
rezultate, fie n acelai fiier (Add aggregate variabiles in the active dataset) cu variabilele iniiale fie ntrun fiier nou (Create new dataset containing onlz the aggregated variables) pentru care trebuie specificat
numele n caseta Dataset name.
Rezultatul operaiei de agregare se poate observa n imaginea de mai jos.

Concatenarea bazelor de date


Operaia de concatenare a bazelor de date poate urmri:
1) adugarea unor variabile din alt baz de date
2) adugarea unor cazuri din alt baz de date
Prima operaie se poate realiza folosind succesiunea de comenzi
Data Merge files Add variables
iar a doua prin
Data Merge files Add cases
Adugarea unor variabile din alt baz de date
Folosirea comenzilor descrise mai sus va avea ca rezultat deschiderea urmtoarei
ferestre

Analiza datelor

n aceasta se va selecta din care fiiere deschise vor fi adugate noile variabile n
fiierul activ. n exemplul de fa se vor aduga variabile din fiierul Exemplu_1.sav n
fiierul activ Test.sav .
Se apas dup aceea Continue i se deschide alt fereastr

n lista New Active Dataset vei observa coninutul fiierului activ Test.sav, dup
adugarea variabilelor noi. n list variabilele adugate sunt cele care au dup nume (+), iar
acela care au (*) sunt variabilele care existau n fierul activ nainte de concatenare.
Dac o variabil cu acelai nume exist n ambele fiiere atunci ea nu va fi adugat
automat, dar va fi trecut n lista Excluded variables unde poate fi utilizat pentru alte operaii
de actualizare.
Rezultatul operaiei arat astfel:

Analiza datelor

Adugarea unor cazuri din alt baz de date


Adugarea de cazuri noi se face dup aceleai principii ca i adugarea de noi
variabile. Dup succesiunea de comenzi menionat mai sus se deschide fereastra

n care se selecteaz fiierul din care se face adugarea de noi cazuri la fiierul activ, apoi
dup apsarea butonului Continue, prin fereastra urmtoare

Analiza datelor

se precizeaz modul n care se adaug noile cazuri. n lista din stnga Unpaired Variables
sunt trecute automat variabilele din fiierul activ care nu au corespondent n fiierul din care
se vor introduce cazurile noi. n lista Variables in New Active Dataset sunt trecute variabilele
care au corespondent n fiierul din care se vor introduce noile cazuri.
Restricii i condiii la adugarea cazurilor:
Variabilele cu acelai nume trebuie s fie de acelai tip. Nu pot fi adugate valori de tip ir
de caractere n continuarea unor valori de tip numeric, sau invers.
Variabilele de tip ir de caractere trebuie s fie definite pe aceeai lungime. Dac nu sunt,
se vor redefini.
Inversarea liniilor cu coloanele
n mod normal, ntr-o baz de date liniile reprezint cazuri iar coloanele reprezint
variabile. Uneori se poate dovedi necesar ca acestea s fie inversate, astfel nct cazurile s se
afle pe coloane ar variabilele pe linii. Unul dintre motive, l-ar putea constitui, de exemplu,
posibilitatea de a aplica proceduri statistice la nivel intrasubiect, pe coloane, care nu
disponibile la nivel intersubiect, pe variabile.
S lum ca exemplu baza da date:

Se lanseaz procedura Transpose... din meniul Data:


Se deschide fereastra Traspose n care mutm variabilele n lista Variable(s), iar
variabila n zona Name Variable.

Analiza datelor

Astfel, valorile variabilei ID_Chestionar vor da numele variabilelor din noul fiier
rezultat prin transpunere, aa cum se vede n imagine:

10

S-ar putea să vă placă și