Documente Academic
Documente Profesional
Documente Cultură
Comanda este preluata din meniu: Data Select Cases, iar dupa ce se scrie conditia (pentru
inregistrarile care vor ramane in baza) se bifeaza Deleted (in loc de filtered cum se face pentru filtre)
Daca au fost sterse chestionare din baza de date se mai verifica inca o data parametrii proiectului.
FM si PM trebuie informati asupra chestionarelor scoase din baza si motivelor pentru care a fost luata
aceasta decizie.
Pentru orice neregula aparuta (numar prea mic de inregistrari, dezechilibrare cote, etc.) se anunta PM
ul sau responsabilul de proiect (pt cele nonDaedalus), in vederea luarii unei decizii.
3. ETICHETAREA
Etichetele reprezinta asocierea variabilelor din baza cu un text explicativ care, la efectuarea unei analize
pe variabila respectiva va fi afisat in output in locul numelui variabilei.
Analog pot fi atribuite si etichete pentru valorile unei variabile; lungimea acestora nu poate depasi 60 de
caractere (inclusiv spatii, virgule etc.), in aceasta situatie ele vor fi trunchiate. Pentru etichetele mai
lungi de 60 de caractere se reformuleaza afirmatia (fara a-i schimba sensul sau a omite anumite chestii
importante) astfel incat aceasta sa se incadreze in lungimea de 60 char.
Etichetele usureaza citirea unui output in SPSS dar nu au nici o influenta asupra variabilelor.
Etichetarea se face in limba engleza. Pentru etichetarea valorilor, input-ul este chestionarul tradus in
limba engleza, etichetele fiind de fapt optiunile de raspuns la fiecare intrebare. Pentru etichetarea
variabilelor input-ul este fisierul de specificatii de raport / etichetare (realizat de catre AD); Etichetarea
variabilelor corespunde de fapt unui titlu care se da pentru fiecare intrebare. Pentru variabilele
dihotomice, eticheta fiecarei variabile din cadrul intrebarii este de fapt identificata cu optiunile din
chestionar; valorile pentru astfel de variabile (0 si 1) nu se eticheteaza. Etichetele pentru grupuri de
variabile multiplu raspuns se vor prelua din specificatiile de raport.
Pentru etichetarea variabilelor se foloseste sintaxa:
var lab q05 Unaided Awareness.
Daca, o data definite etichetele pentru o variabila, mai descoperim noi valori (pe care nu le-am etichetat
inainte) sau cream noi valori (ex. cele de DK/NA) pentru etichetarea acestora se foloseste sintaxa add
val lab in loc de val lab. Daca am folosi val lab fara add in fata, in urma sintaxei se vor sterge toate
etichetele definite inainte si vor ramane doar cele scrise ultimele.
!! La etichetarea valorilor variabilelor de venit/ cheltuieli..., se trec doar sumele in Euro/ $ nu si cele in
lei, iar moneda in care acestea se evalueaza se trece doar in eticheta variabilei (Personal Monthly Net
Income (EURO)) nu si in etichetele de valori:
val lab d01
1 "Less than 75"
2 "75 - 250 "
3 "250 - 450 "
4 " 450 - 650 "
5 "650 - 850"
6 "More than 850 "
99 "DK/ NA".
Iata o sintaxa de etichetare gresita, nu atat din punc de vedere al functionarii, cat al textului etichetelor:
val lab d01
1 "Less than 2,7 mil lei (75 EURO)"
2 "2,7 - 9 mil lei (75 - 250 EURO)"
3 "9 - 16,2 mil lei (250 - 450 EURO)"
4 "16,2 - 23,4 mil lei (450 - 650 EURO)"
5 "23,4 - 30,6 mil lei (650 - 850 EURO)"
6 "More than 30,6 mil lei ( 850 EURO)"
99 "DK/ NA".
Pentru etichetarea demograficelor exista standarde predefinite astfel incat, indiferent de studiu,
etichetarea acestora se face pe baza template-ului de demografice.
Modul de scriere a etichetelor pentru variabile respectiv seturi (grupuri multiplu raspuns) urmeaza
standardele folosite in scrierea titlurilor in limba engleza (inceputul fioecarui cuvant se scrie cu CAPS,
mai putin prepozitiile) : Breakdown by Age; Consumption Frequency in the Past 12 Months. Etichetele
pentru valori se scriu normal, cu litera mare doar la inceputul primului cuvant. La preluarea etichetelor
din chestionar sau din specificatiile de etichetare/ raport si aducearea lor in Excel/ SPSS trebuie urmarit
ca acestea sa nu inceapa cu spatii.(ex: 11 Less than 1000 . Daca exista asemenea spatii, acestea
trebuie sterse. Dupa ghilimeaua care marcheaza inceputul etichetei nu trebuie sa fie spatii)
Verificarile care se fac dupa etichetarae bazei de date sunt:
- toate variabilele/ valorile variabilelor au fost etichetate conform standardelor
- etichetele nu au fost trunchiate.
Setari legate de afisare
Afisarea etichetelor in listele de variabile cu Options/General; pentru afisarea in tabele Options/Output
labeling; pentru afisarea etichetelor valorilor in editorul de date in meniul View se bifeaza optiunea
Labels.
4. CURATARE/ VALIDARE (General)
4.1 Filtrarea datelor
Filtrarea datelor reprezinta selectia temporara a unui subset de cazuri bazat pe anumite conditii criteriu;
in aceasta situatie cazurile care nu indeplinesc conditia respectiva sunt ascunse; se pot realiza astfel
analize numai pe subsetul respectiv, apoi sa se revina la setul complet .
Structura unui filtru
Variabila filtru
Blocul DA
Blocul NU
Q 5. Intentionati sa incheiati o polita de asigurare de viata in viitor?
1 Da
Q 6. In ce orizont de timp?
1 mai putin de 6 luni
2 6 - 12 luni
4 2 - 3 ani
5 peste 3 ani
2 Nu
3 1 - 2 ani
Se scrie conditia in
functie de care
cream filtrul
Pentru a scoate un filtru de pe baza ( pentru a reveni la toate cazurile din baza), comanda utilizata este:
use all sau filer off.
Daca in conditia pe care o punem la crearea filtrului se au in vedere mai multe variabile intre care exista
o anumita relatie se utilizeaza operatori logici (and, or etc.). Atunci cand utilizam astfel de operatori
logici trebuie acordata mare atentie ordinii in care acestia apar si modului in care folosim parantezele
pentru a determina prioritatile.
Important: Comenzile de transformarea a datelor (de ex recode) nu tin cont de filtru si actioneaza pe
toata baza de date. Filtrele sunt folosite doar pentru a scoate din baza anumiti respondenti (care nu
indeplinesc o conditie) si a observa datele pe o baza mai mica.
4.2 Recodificarea
Codificare este operatia prin care i se asociaza fiecarui raspuns un numar ; in general mai multor
raspunsuri asemanatoare li se asociaza acelasi cod .
Recodificarea se refera la modificarea categoriilor de valori pe care le poate lua o anumita variabila.
Aceasta operatie este realizata mai ales la restrangerea numarului de valori pe care le poate lua o
variabila intr-un numar mic de categorii relevante care sa usureze analiza. (De exemplu daca
transformam varsta care este o variabila continua intr-o variabila cu cateva categorii de varsta). De
asemenea, recodificarea este utilizata la tratarea valorilor lipsa (recode (sysmis=99)).
Recodificarea se poate face prin modificarea valorilor variabilei initiale sau prin crearea unei noi
variabile cu codurile respective Transform Recode Into same variables sau Into Different
variables
Exemple si comentar ii
In general la restrangeri ( recodificari) este indicat sa se creeze o variabila noua, variabila veche
ramanand cu valorile originale, pentru a putea fi folosita la o eventuala recodificare diferita ; numai in
masura in care suntem siguri ca nu vom mai avea nevoie de valorile variabilei initiale se alege
recodificarea pentru aceeasi variabila (de ex la curatare transformarea zerourilor in valori missing)
valorile din variabila initiala care nu sunt specificate in ce se transforma li se atribuie automat
valoarea missing
Folosirea comenzii copy old value (else = copy) pentru valorile care raman neschimbate
Pentru a aplica recodificari numai asupra unei selectii de cazuri se foloseste optiunea If sau do if,
punerea unui filtru nu functioneaza in cazul recodificarilor:
if q05=8 q06=4.
exe.
sau
do if q05=8.
recode q06 (6=4) (3=4).
end if.
exe.
O situatie aparte de recodificare este aceea in care respondentul poate da o valoare exprimata in
orice unitate de masura (Unitatile de masura sunt variabile controlabile in chestionar fie predefinite,
fie codificate ulterior)
Ex: Q 1. Cat intentionati sa platiti pentru aceste pachete de servicii, incluzand TVA?
.......................... 1 USD
2 EURO
3 ROL (lei vechi)
Pentru prelucrarea acestui tip de intrebare este necesar ca suma sa fie exprimata intr-o singura unitate de
masura; astfel vom avea nevoie de o serie de recodificari.
Presupunem 1USD=30.000lei si 1 Euro=36.000lei 1USD=0.83EURO
Daca variabila de cheltuieli este q15 iar q15_moneda este variabila in care se trece moneda in care este
exprimata suma., sintaxa este urmatoarea:
Cream o noua variabila Q15r (suma finala trebuie exprimata in EURO):
if q15_moneda=1 q15r=q15*0.83.
if q15_moneda=2 q15r=q15.
if q15_moneda=3 q15r=q15/36000.
if q15_moneda=3 q15r=q15/3.6.
exe.
Astfel am obtinut o noua variabila in care toate sumele sunt exprimate in euro. Pentru aceasta, PD
trebuie sa informeze SD asupra tipului de moneda in care se vrea variabila finala; tot astfel se trateaza si
sumele cu/ fara TVA. Trebuie sa verificam cum a fost intrebarea in chestionar (daca e sau nu inclus
TVA-ul) si sa ne informam cu se vrea prelucrata aceasta intrebare (cu/ fara TVA); si dupa caz, variabila
se imparte sau se inmulteste cu 1,19.