Documente Academic
Documente Profesional
Documente Cultură
Cornelia Mureşan
CUPRINS
PROIECTAREA ŞI
GESTIONAREA BAZELOR DE DATE ____________________________ 1
2
Modul 6. Gestionarea bazei de date_____________________________________ 47
6.1. Transformarea variabilelor cu procedura Recode _____________________________ 47
6.2. Recodificarea valorilor în aceeaşi variabilă _________________________________ 48
6.3. Căutarea datelor în Editorul de date _______________________________________ 50
6.4. Obţinerea unei variabile noi prin recodificare _______________________________ 51
6.5. Recodificarea automată_________________________________________________ 52
6.6. Obţinerea unor variabile noi prin calcul numeric _____________________________ 53
6.7. Obţinerea unor variabile noi prin calcul cu date calendaristice __________________ 56
6.8. Selectarea cazurilor după diverse criterii ___________________________________ 59
6.9. Împărţirea cazurilor în grupe de analizat ___________________________________ 60
6.10. Ordonarea cazurilor după diverse criterii __________________________________ 63
6.11. Ponderarea cazurilor __________________________________________________ 64
Modul 7. Întocmirea rapoartelor _______________________________________ 65
7.1. Rapoarte de tip listă ___________________________________________________ 66
7.2. Rapoarte cu informaţii rezumative pe linii __________________________________ 68
7.3. Rapoarte cu informaţii rezumative pe coloane _______________________________ 70
BIBLIOGRAFIE ____________________________________________________ 73
3
Modul 1. Aspecte elementare
În domeniul informaticii, termenul de “bază de date” are un sens mai larg decât
cel utilizat deja foarte curent în viaţa de zi cu zi. Aici, prin bază de date se înţelege
ansamblul fişierelor de date, a programelor de prelucrare şi a altor tipuri de fişiere care
acoperă necesităţile unei anumite aplicaţii. În cazul concret al unor aplicaţii de tip
dBASE, sau FoxPro sau Access, categoria de „alte tipuri de fişiere” este reprezentată
prin:
- fişiere de tip query (cerere), care permit realizarea unui view (vedere) sau
operaţiuni de actualizare asupra unuia sau mai multor fişier de date,
- fişiere de tip form (formular), care permit aranjarea într-o anumită formă, pe
ecran, a setului de câmpuri ce defineşte structura unui fişier de date,
Înregistrare – setul de date ale diferitelor câmpuri definite în structura unui fişier
de date, date care se referă la un anumit obiect.
4
Windows, unde înregistrările pot fi introduse în baza de date, apoi organizate rapid după
orice criteriu şi regăsite, într-un timp scurt.
Programe pentru:
Definirea unor forme (video-formulare) concepute de utilizator
Efectuarea unor calcule statistice, ştiinţifice sau financiare
Filtrarea datelor oferite unor categorii de utilizatori
Sortări
Obţinerea unor rapoarte
Obţinerea etichetelor pentru corespondenţă
5
1.3. Pachetul statistic SPSS
Pachetul statistic Statistical Package for Social Sciences (SPSS), în varianta lui
sub Windows, aduce pentru prima dată un Editor pentru date care permite construirea
unei baze de date relaţionale. Deşi acest produs software nu este un SGBD consacrat, el
poate fi utilizat cu succes în aplicaţiile din domeniul ştiinţelor sociale.
6
-
Figura 1.1. Procesul de cercetare
Teorie
&
Practică
Ipoteze
Conceptualizare
Operaţionalizare
Selectarea subiecţilor
Anchetă/ Design
Design corelaţional experimental
Grupuri experimentale ,
Interviuri
grupuri de control
Adminstrări de Observaţii/administrare
chestionare teste sau chestionare
Colectare date
Interpretare rezultate
7
1.4. Procesul de analiză statistică a datelor
Aducerea Pas 1
datelor în
memoria
internă
Pas 2
Selectarea unei
proceduri
Pas 3
Selectarea
variabilelor
Pasul care ne interesează în prima fază este cel de introducere a datelor într-un
fişier de date sau, după caz, de aducere al datelor în memoria internă.
8
1. Aducerea datelor în memoria internă
Se pot citi date din fişiere proprii altor produse software. Cele mai
cunoscute sunt bazele de date dBASE, FoxPro sau Access; fişierele tip
foaie de calcul produse cu tabelatorul Excel; sau fişiere simple de tip
text ASCII, produse cu orice editoare de texte. Desigur, pentru a
“importa” astfel de date, trebuie respectate nişte reguli clare şi trebuie
furnizate informaţii suplimentare de conversie, în cadrul procedurilor
iniţiate de SPSS.
3. Selectarea variabilelor
Cele mai multe din procedurile SPSS cer precizarea variabilelor. Acestea sunt
listate în casetele de dialog ale procedurilor, iar utilizatorul va trebui să indice
variabilele care intră în analiză.
4. Interpretarea rezultatelor
O şedinţă de lucru cu SPSS constă în mai multe reluări a celor patru faze: în mai
multe operaţiuni de management al datelor, sau mai multe proceduri de analiză a datelor.
De multe ori ceea ce hotărâm să facem în continuare depinde de rezultatele unei
operaţiuni anterioare. Utilizatorul (sau după caz, cercetătorul) foloseşte SPSS ca un
asistent docil, dar foarte puternic şi capabil, ale cărui performanţe depind de abilitatea
cercetătorului de a lua deciziile cele mai potrivite.
9
Modul 2. Introducere în SPSS sub Windows
SPSS sub Windows funcţionează sub controlul unui mediu grafic GUI (Graphical
User Interface), utilizând un sistem de meniuri descriptive şi casete de dialog care
uşurează mult interfaţa om-calculator. Cele mai multe operaţiuni sunt declanşate şi duse
la capăt prin punctare şi clic cu mouse-ul, chiar dacă lucrul cu tastatura este oricând o a
doua alternativă.
Ceea ce vom vedea prima dată va fi modulul Data Editor (vezi figura 2.1). În
afara acestui modul, SPSS mai are încă trei: modulul Output Navigator – modul care se
10
ocupă de afişarea rezultatelor prelucrărilor, precum şi de modificarea aspectului lor - ,
modulul Chart Editor – modul care facilitează manipularea şi gestionarea graficelor
obţinute prin SPSS – şi modulul Sintax - . pentru păstrarea comenzilor SPSS în vederea
repetării lor într-o altă şedinţă de lucru.
SPSS v7.5 poate lucra într-o varietate de moduri, dar majoritatea procedurilor pot
fi accesate făcând selecţii din meniuri. Meniul principal al Editorului de date, cea mai
utilizată componentă a pachetului, conţine nouă meniuri:
File. Se utilizează pentru a crea fişiere noi SPSS, pentru a deschide fişiere
existente, pentru a citi fişiere de tip spreadsheet sau bază de date create cu alte
programe software. Meniul File se mai utilizează pentru crearea şi deschiderea
altor fişiere SPSS, adică fişiere de grafice, de rezultate sau de sintaxă.
Edit. Se utilizează pentru a modifica sau copia texte din ferestrele de rezultate sau
de sintaxă.
Statistics. Procedurile statistice se selectează din acest meniu. Cele mai comune
proceduri statistice sunt: tabelele de frecvenţe, tabelele de asociere, calculul
indicatorilor statistici descriptivi, analiza varianţei, corelaţia sau regresia liniară.
11
Graphs. Meniul Graphs se foloseşte pentru a crea diagrame de bare, diagrame
circulare, histograme, diagrame de împrăştiere şi alte grafice în culori şi de mare
rezoluţie. Chiar şi unele proceduri statistice pot genera grafice. Orice grafic poate
fi îmbunătăţit cu ajutorul Editorului de grafice (Chart Editor).
Cele mai comune comenzi SPSS, folosite în mod uzual, pot fi accesate prin
intermediul unor pictograme situate imediat sub linia de meniuri, în linia de pictograme
(Tool Bar). Această linie este prezentă la oricare din ferestrele modulelor SPSS, dar poate
conţine pictograme diferite, adaptate situaţiei (vezi figura 2.1).
Unele din pictograme s-ar putea întâmpla să nu fie eligibile în anumite situaţii
chiar dacă apar pe ecran. O scurtă explicaţie a ceea ce reprezintă ele poate fi obţinută
foarte simplu prin plasarea indicatorului mouse-ului pe ele.
Cele mai multe proceduri SPSS afişează casete de dialog prin intermediul cărora
adună toate informaţiile necesare ducerii la bun sfârşit a operaţiunilor cerute de utilizator.
Pentru că aceste casete oferă informaţii utile în alegerile pe care utilizatorul le are
de făcut şi pentru că aceste casete sunt foarte asemănătoare între ele, să aruncăm o
privire, de exemplu, pe cea folosită la deschiderea unui fişier: figura 2.2
Această casetă conţine o zonă etichetată Look in unde va apare directorul curent
(BazeDate, în exemplu). Dacă fişierul căutat nu este în directorul curent, acesta poate fi
schimbat cu ajutorul pictogramelor din această zonă.
Fişierele sunt listate în zona cea mai întinsă a casetei de dialog. De exemplu, în
figura 2.2 putem vedea patru fişiere. Oricare dintre ele poate fi deschisă. Alegerea se face
prin pointare şi clic pe butonul stâng al mouse-ului.
12
Figura 2.2. Caseta de dialog Open File
Numele fişierului selectat va apare in zona File name. Această informaţie poate fi
şi tastată dacă se doreşte folosirea tastaturii şi nu a mouse-ului.
Nu toate fişierele din directorul curent sunt listate în casetă. Ele sunt filtrate cu
ajutorul extensiilor consacrate pentru diverse tipuri de fişiere. Observăm că în exemplu,
toate cele trei fişiere au extensia .sav. Zona Files of type oferă însă posibilitatea selectării
altor tipuri inclusiv a tuturor tipurilor, deci posibilitatea neutilizării filtrelor.
În partea dreapta jos a casetei se găsesc “butoanele”, adică acele zone care
declanşează acţiuni. Clic pe butonul Open produce deschiderea fişierului selectat. Clic pe
butonul Paste produce doar un text cu comanda de deschidere a fişierului selectat,
comandă ce se va scrie într-un fişier de tip sintaxă, în vederea folosirii lui ulterioare.
Butonul Cancel anulează operaţiunea în curs, fără să declanşeze procedura pentru care se
făceau pregătirile. După acţionarea butoanelor casetele de dialog dispar de pe ecran.
Unele casete de dialog pot conţine “butoane radio” şi / sau “căsuţe pentru bifare”
(check box). Ele nu declanşează acţiuni imediate dar permit optarea pentru anumite
13
variante ale procedurilor. Butoanele radio se deosebesc de căsuţele pentru bifare prin
faptul că numai unul dintr-o zonă poate fi ales şi una din alegeri este obligatorie. În cazul
căsuţelor pentru bifare, acestea pot fi bifate sau nu, indiferent câte sunt într-o casetă de
dialog. Butoanele radio au o aparenţă circulară iar opţiunea aleasă se marchează cu un
punct (). Căsuţele pentru bifare au aparenţă pătratică şi opţiunile alese vor fi marcate cu
o bifă [] .
14
Modul 3. Proiectarea unei baze de date
Editorul de date (Data Editor) este un modul SPSS care afişează o fereastră tip
spreadsheet (foaie de calcul) utilizată la crearea şi editarea fişierelor de date SPSS. El se
foloseşte atât la introducerea datelor direct de pe un chestionar cât şi la vizualizarea
informaţiilor deja introduse, cum ar fi fişe medicale, baze de date cu angajaţii sau clienţii
unor agenţii, rezultate obţinute în urma unor testări şi multe altele. Fereastra Editorului de
date se deschide automat la începutul unei şedinţe de lucru SPSS, vezi figura 2.1.
Dacă nu se deschide un alt fişier de date, Editorul de date rămâne gol. Înainte de a
introduce date trebuie să avem în vedere câteva lucruri:
3.2. Un exemplu
Datele utilizate în acest curs aparţin bazei de date Martie97.sav. Ea conţine 1.298
cazuri, reprezentând un eşantion naţional al populaţiei României, iar variabilele conţinute
se referă la întrebări de opinie legate de situaţia socială, economică, politică a României,
reprezentând Barometrul de opinie editat de Fundaţia pentru o Societate Deschisă.
Fişierul de date conţine şi câteva caracteristici de identificare a subiecţilor şi
gospodăriilor din care fac parte (gen, vârstă, naţionalitate, domiciliu, nivel de educaţie
etc.). Ancheta de teren a avut loc în martie 1997.
15
Variabilele din Barometru acoperă toate scalele nivelelor de măsură şi permit
exemplificarea celor mai variaţi indicatori şi proceduri statistice.
În caseta de dialog Define Variable din meniul Data putem gestiona 5 categorii de
informaţii: numele variabilei, tipul variabilei, etichetele, valorile omise şi formatul
coloanei. Aceste informaţii sunt tot atâtea aspecte ale structurii bazei de date şi se
definesc pentru fiecare variabilă în parte.
16
este inclus în chestionar, dar care va fi utilă în identificarea respondenţilor – codul
numeric al respondentului. Pentru a atribui un nume variabilei:
SPSS arată definiţiile curente pentru variabilă; în acest caz numele implicit al
variabilei este VAR00001. Până ce acesta este selectat se poate înlocui cu un nume nou,
mai uşor de recunoscut, ca reprezentând numărul de identificare al respondentului.
17
Numele trebuie să înceapă cu o literă
Lungimea unui nume nu trebuie să depăşească 8 caractere
Utilizarea spaţiilor şi a caracterelor speciale (! ? “ *) este interzisă
Fiecare nume de variabilă trebuie să fie unic
18
Acesta este formatul implicit, definit în SPSS, şi semnifică faptul că informaţiile
sunt afişate numeric cu maximum 8 poziţii care includ un punct şi două cifre pentru
partea zecimală. De exemplu “1” se va afişa ca “1.00”. Aceasta mai înseamnă şi că
formatul de afişare a rezultatelor obţinute în urma procedurilor SPSS se vor afişa tot cu 8
poziţii şi 2 cifre pentru zecimale.
Apoi se poate schimba lungimea variabilei cod la 4 poziţii, fără cifre zecimale, ca
în figura 3.2.
19
3.7. Adăugarea etichetelor descriptive pentru variabile şi valori
Adăugarea etichetelor descriptive este foarte utilă, chiar dacă se poate lucra şi fără
ele. Etichetele adăugate variabilelor şi valorilor lor îmbunătăţesc mult listingurile cu
rezultate şi uşurează analiza.
Tabelul 3.1 rezumă informaţiile descriptive pentru o parte a variabilelor din baza
de date Martie97. Un astfel de tabel se numeşte catalog de coduri.
Adăugarea etichetelor pentru variabile şi valorile lor se face tot prin intermediul
casetei de dialog Define Variable (figura 3.3), anume prin acţionarea butonului Labels.
Se va deschide o nouă casetă de dialog, ca cea din figura 3.4. După specificarea valorii şi
a etichetei corespunzătoare se utilizează butonul Add pentru a adăuga atribuirea în lista de
20
atribuiri. Se repetă adăugarea atribuirilor până se epuizează lista de valori, iar la urmă se
acţionează butonul Continue.
Una din consecinţele cele mai nedorite ale colectării datelor prin intermediul
chestionarelor este lipsa unor informaţii sau incorectitudinea altora. Aceste situaţii pot
apare din diverse motive printre care ar fi: incapacitatea subiectului de a răspunde la o
întrebare, furnizarea unor răspunsuri inadecvate, omisiuni făcute de cei care codifică
datele etc.
21
O altă situaţie in care lipsesc valori este cea în care chiar chestionarul permite
răspunsuri ca “nu ştiu” sau “refuz să răspund” sau “nici unul din răspunsurile de mai
sus”. Şi pentru astfel de informaţii trebuie prevăzute coduri care să servească introducerii
în fişierul de date. Cu toate acestea vom dori să excludem aceşti subiecţi din anumite
analize sau anumite tabele. De exemplu, se întâmplă deseori ca o anumită proporţie a
respondenţilor să răspundă cu “nu ştiu” la o întrebare privind o opinie politică. Deşi
această proporţie este interesantă prin ea însăşi, putem cere un tabel care să arate
informaţii numai despre cei care şi-au exprimat o opinie.
Indiferent din ce raţiune, avem nevoie să înregistrăm apariţia uneia din aceste
situaţii prin atribuirea unei valori “omise”. O alternativă ar fi să lăsăm liberă celula
Editorului de date, dar acesta va genera o altă problemă potenţială: aceea de a nu mai fi
capabili să distingem între situaţiile ca cele descrise mai sus şi erorile făcute cu ocazia
introducerii datelor.
Figura 3.5. Declararea valorii omise prin caseta de dialog Define Missing Values
22
Caseta de dialog Define Missing Values prevede o mulţime de situaţii alternative
pentru definirea valorilor omise. Implicit SPSS tratează toate valorile ca fiind valide.
Putem declara până la trei valori distincte, discrete, ca fiind valori omise, sau putem
specifica un interval (range în lb.engleză) de valori ca fiind omise, sau un interval şi o
valoare discretă. În exemplul nostru avem o valoare omisă “x”, dar pentru că este o
variabilă de tip şir (string în lb.engl.), este bine să atribuim şi valoarea blank (spaţiu) ca
valori omise. Aceasta este necesară pentru că spaţiul (blankul) este un caracter legitim
pentru variabilele de tip şir, spre deosebire de variabilele numerice, iar atribuirea lui ca
valoare omisă va preveni situaţiile în care cazurile invalide vor fi incluse în tabelele de
analiză.
Valorile omise pot fi de două tipuri diferite: sistem, care apar de fapt atunci când
există omisiuni în setul de date, şi utilizator, care sunt declarate ca atare în Editorul de
date. Nici una din ele nu sunt utilizate în analizele statistice.
Figura 3.6. Tabel de frecvenţe care arată tratarea valorilor omise sistem şi utilizator
23
Valori omise sistem
Când o celulă dintr-o variabilă numerică este lăsată necompletată, SPSS plasează
automat un punct zecimal în aceea celulă. Acest punct este referit întotdeauna ca valoare
omisă sistem. Cazurile cu valori omise sistem sunt excluse din majoritatea procedurilor
de analiză statistică şi de transformare a datelor.
Deseori este util a se face distincţia între motivele pentru care valorile sunt omise.
De exemplu, pentru variabila “mservici” din Barometrul opiniei publice din Martie97 s-a
atribuit valoarea omisă 0 , cu eticheta “NS / NR / NC” (abrevieri de la “nu ştiu”, “non-
raspuns” si “nu comentez”). Aceste situaţii sunt bine determinate şi nu coincid cu acelea
în care informaţia privind mulţumirea faţă de serviciu nu a fost în mod eronat introdusă în
baza de date.
De regulă, cel mai bine este să declarăm lăţimea coloanei cu un caracter mai lung
decât numele variabilei, sau cu un caracter mai lung decât valoarea cea mai lungă. Dacă
avem variabile de tip şir lung (Long String), s-ar putea să nu dorim să vedem tot textul
afişat, aşa că vom alege o lăţime a coloanei mai mică.
24
3.11. Definirea variabilelor adiţionale
Se va deschide caseta de dialog Define Variable, unde vom completa mai în întâi
numele variabilei, apoi tipul, lungimea, etichetele pentru variabilă şi pentru valori,
formatul coloanei, valorile omise.
În cazul variabilei localit, care este de tip şir lung, vom vedea că butonul Missing
Values pentru valoarea omisă nu este un buton eligibil. Există o regulă în SPSS şi anume
că variabilele de tip şir lung (adică peste 8 caractere lungime) nu pot avea valori omise.
În multe alte situaţii în care contextul este de aşa natură că anumite opţiuni nu au sens,
SPSS face ineligibile anumite butoane şi zone din casetele de dialog, spre avantajul
utilizatorului care astfel este împiedicat să facă declaraţii fără sens.
Dacă într-o celulă nu se introduce nimic, iar aceasta aparţine unei variabile
numerice, va apare un punct zecimal şi se va atribui o valoare omisă sistem.
SPSS nu previne utilizatorul când acesta introduce date eronate. Singura validare
pe care totuşi o face este să nu permită introducerea caracterelor alfabetice în câmpurile
numerice. Dacă observaţi o informaţie greşit introdusă puneţi cursorul pe celula în care
apare acea informaţie şi retastaţi informaţia în mod corect. Dacă doriţi să faceţi o
corectură celula trebuie deschisă iar corectura se face în linia de editare (echivalentă liniei
pentru formule dintr-un tabelator). Deschiderea celulei active se face fie prin dublu-clic ,
fie prin apăsarea tastei F2.
Cea ce s-a introdus până acum în fişierul de date sunt codurile valorilor din
chestionar. Etichetele, deşi definite, nu sunt de fapt afişate. Pentru a vedea etichete în loc
de coduri se poate cere comanda Value Labels din meniul Utilities.
25
Chiar şi în această situaţie, trebuie să reţinem că pentru introducerea datelor noi
folosim întotdeauna codurile şi nu etichetele. Avem însă o alternativă: să alegem o
etichetă de valoare dintr-o listă afişată pe ecran după ce facem clic pe celula în care vrem
să introducem informaţia cu butonul din dreapta al mouse-ului. Urmăriţi de exemplu lista
afişată pentru o celulă din coloana ulscoala, în figura 3.7.
26
3.16. Salvarea fişierului de date
Dacă părăsiţi SPSS în acest punct al şedinţei de lucru, toate datele şi informaţiile
adiţionale atribuite variabilelor, valorilor variabilelor şi valorilor omise, se pierd. Toate
aceste informaţii put lua însă o formă permanentă dacă salvaţi fişierul de date după ce aţi
definit variabilele şi informaţiile adiţionale de descriere a lor.
Pentru a salva un fişier de date, fereastra Editorului de date trebuie să fie fereastra
activă. Salvarea pentru prima oară se face cu comanda Save As din meniul File, pentru că
acesta permite specificarea numelui fişierului în caseta de dialog care se deschide (vezi
figura 3.8). extensia implicită pentru un fişier de date SPSS este .sav. Ca să fim siguri că
salvăm un fişier de date şi nu unul din celelalte tipuri permise de SPSS trebuie să ne
asigurăm că zona Save as Type are ca şi conţinut SPSS (*.sav).
Dacă dorim să salvăm fişierul într-un alt director decât cel curent, care apare în
zona Save in, o putem face schimbând directorul prin intermediul butoanelor din partea
de sus a casetei de dialog.
27
3.17. Diferenţa dintre Save As şi Save
SPSS ţine evidenţa ferestrelor deschise în timpul şedinţei. Dacă ceva din ceea ce
s-a produs nu a fost salvat, SPSS întreabă explicit dacă se doreşte salvarea. De exemplu,
28
dacă am declanşat procedura Frequencies pentru a obţine o tabelă de frecvenţe, acesta s-a
afişat în fereastra Output1al Navigatorului de rezultate. De aceea SPSS ne va întreba dacă
dorim să salvăm fişierul cu rezultate, vezi figura 3.9. Extensia implicită pentru fişierele
cu rezultate este .spo. Aceasta, împreună cu alte informaţii identice cu cele de la salvarea
unui fişier de date pot fi văzute în caseta de dialog care se deschide în cazul unui răspuns
afirmativ, ca în figura 3.10.
29
Modul 4. Utilizarea Editorului de date II. Facilităţi adiţionale
În procesul de definire a datelor există situaţii când este posibil să salvăm un timp
considerabil. O astfel de situaţie este cazul când avem mai multe variabile care au
aceleaşi caracteristici (etichete, valori, valori omise etc.), şi în care se pot utiliza
şabloanele pentru date. De exemplu, variabilele mmedic, mtranspo, mlocuit, mservici,
mbanii, mtara, mcuraten din Barometru conţin răspunsuri codificate identic şi cu acelaşi
cod pentru valoarea omisă pentru întrebări privind cât de mulţumit este respondentul în
legătură cu asistenţa medicală, transportul în comun, locuinţa în care trăieşte, banii pe
care îi are, viaţa politică sau curăţenia localităţii. Aceste variabile ar putea fi grupate în
aşa-numitele “atitudini curente”.
Pentru a defini un şablon cu definiţiile comune, vom cere din meniul principal:
30
Data
Templates
Define
Prin acţionarea butonului Value Labels vom putea defini etichetele pentru valori,
ca în figura 4.2, iar apoi valoarea omisă, ca în figura 4.3.
31
Figura 4.3. Definirea valorii omise pentru şablonul “ATIT.CURENTE”
Pentru a aplica un şablon unui set de variabile, acestea trebuie mai întâi selectate.
Vom ieşi deci din procedura de definire a şabloanelor, prin acţionarea butonului Close,
apoi vom selecta cele 7 variabile din setul “atitudini curente” prin clic pe numele primei
variabile din set şi extinderea selecţiunii prin tragere (drag, în lb.engleză). După ce
variabilele au fost selectate (figura 4.4) :
- se acţionează butonul OK
32
Figura 4.4. Aplicarea şablonului “ATIT.CURENTE”
O altă situaţie în care procesul de definire a datelor poate fi accelerat este cea în
care deţinem deja un fişier de date cu aceleaşi variabile, caz tipic pentru fişierele generate
periodic, de exemplu lunar. Din moment ce procesul de definire a datelor este acelaşi ca
pentru prima oară, informaţiile de dicţionar (adică, etichetele pentru variabile şi pentru
valori, valorile omise, tipul variabilelor şi formatele de afişare în coloane) pot fi preluate
de la un alt fişier.
33
Pentru aplicarea unui dicţionar de date fişierului curent de date, se va cere din
linia de meniul File, Apply Data Dictionary, iar apoi se va alege fişierul sursă din lista de
fişiere SPSS care vor apare într-o casetă de dialog.
Prin evidenţierea numelui variabilei în lista din partea stângă, apar informaţiile de
dicţionar corespunzătoare în partea dreaptă. După ce am citit informaţiile dorite, putem
ieşi acţionând butonul Close, putem copia informaţiile în fereastra de sintaxă cu butonul
Paste, sau putem să ne întoarcem în Editorul de date unde variabila să fie selectată,
acţionând butonul Go To.
34
4.4. Obţinerea unui catalog de coduri
Informaţiile de dicţionar ale unui fişier de date SPSS, aşa cum au fost ele definite
cu ajutorul Editorului de date, pot fi obţinute şi prin procedura File Info din meniul
Utilities. Ele nu mai au o formă tabelară, dar conţin acelaşi tip de informaţii (vezi figura
4.6).
Pentru salvare se va alege comanda Save sau Save As, din meniul File, având
fereastra Navigatorului activă, şi elementul de rezultat selectat în panoul din stânga.
35
Modul 5. Căutarea erorilor şi analize statistice exploratorii
Vom explora în cele ce urmează câteva din cele mai comune căi de a descrie
datele dintr-o bază de date prin intermediul procedurilor de statistică elementară
Frequencies şi Descriptives. De foarte multe ori vom vedea că aceste două proceduri sunt
suficiente pentru a răspunde la multe din întrebările cercetării. Procedurile Crosstabs şi
Means sunt utile în investigarea unor posibile relaţii între două variabile. Aceste patru
proceduri, la care se adaugă şi procedura Explore, nu sunt numai tehnici puternice
descriptive, dar constituie tot atâtea mijloace de investigaţie necesare înaintea
întreprinderii unor analize statistice mai sofisticate.
36
valoare distinctă a variabilei selectate, se va afişa numărul de apariţii, procentul pe care
acesta-l reprezintă din întregul eşantion şi procentul cumulativ. Ca opţiuni, pot fi selectate
grafice ca diagrama de bare, histograma (care vor fi alese în funcţie de tipul variabilei),
valorile pentru anumite percentile sau indicatori statistici descriptivi.
Statistics
Summarize
Crosstabs…
Putem studia relaţia între mservici şi venit, sau între orice alte variabile între care
bănuim că ar putea exista o legătură.
37
Figura 5.2. Procedura Crosstabs
m i
C
d e
e
ta
pu
l o
r
ot
t
t
t u
u
uu
t
2
1
0
6
9 Gm
0
0
8
5
3 f
2
1
8
1
2 T
Figura 5.3. Tabel de asociere între gen şi satisfacţia în muncă (frecvenţe absolute)
Conţinutul celulelor aşa cum apare sub formă de frecvenţe absolute (figura 5.3)
nu exprimă relaţia dintre cele două variabile. Pentru a putea compara diversele grupuri
între ele, trebuie să folosim o măsură independentă de numărul cazurilor cuprinse în
grupul respectiv; fiecare grup având un număr diferit de cazuri (359 persoane de sex
masculin şi 293 persoane de sex feminin). O exprimare în procente a frecvenţelor din
fiecare celulă permite comparaţiile dorite (figura 5.4).
38
m it
d e
o
s
e a
p
tlu
or
r
T
ul
ll
l
to
t
ttu
u
uu
t
2
1
06
9Gm
C
%
%
%
%
%
% G
r e
0
0
85
3 f
C e
%
%
%
%
%
% G
r e
2
1
81
2TC o
%
%
%
%
%
% G
r e
Figura 5.4. Tabel de asociere între gen şi satisfacţia în muncă (frecvenţe procentuale)
Observaţie: Cum putem spune dacă într-un astfel de tabel procentele din
celule reprezintă procentajul pe linii sau pe coloane? Dacă în coloana numită
Total procentul înscris în fiecare celulă este 100%, avem de-a face cu procente pe
linii. Dacă pe linia numită Total procentul înscris în fiecare celulă este 100%,
avem de-a face cu procente pe coloane.
39
Observaţie: Mediana, modul, cuartilele şi percentilele nu pot fi calculate aici, ele
se determină cu procedura Frequencies.
40
Putem studia de exemplu media notelor la matematică obţinute într-o clasă,
separat pentru fete şi băieţi. Sau putem studia diferenţele privind media de vârstă pentru
femei şi bărbaţi într-un eşantion reprezentativ al populaţiei României (vezi figura 5.6).
Subgrupurile pot fi formate atunci când cazurile pot fi divizate pe baza uneia sau
mai multor variabile de grupare.
Variabila sub studiu este deci de tip interval iar variabila de grupare este
categorială.
Rezultatul este o tabelă care afişează pentru variabila în cauză media, abaterea
standard şi efectivul fiecărei categorii de grupare.
41
5.5. Procedura Explore
Calculează indicatori statistici descriptivi pentru toate cazurile sau pentru subgrupuri
de cazuri.
Calculează percentilele distribuţiei variabilei, atât pentru toate cazurile cât şi pentru
subgrupuri de cazuri;
42
Pentru declanşare vom alege din linia de meniu:
Statistics
Summarize
Explore
În Dependent List se trece variabila pe care dorim s-o explorăm (variabilă tip
interval). Variabila factor este o variabilă de grupare, care se alege în cazul în care dorim
să calculăm statistici pentru subgrupuri de cazuri ale variabilei numerice studiate.
100
1105
1097
834 968
90
766
80 953
1007
943 1117
60
40
20
vârsta
0
N= 72 121 338 121
Multumit de - serviciu
Fig.5.8. Grafic boxplot pentru legătura dintre satisfacţia în muncă şi vârstă (Martie97)
Este important să fim siguri că datele noastre sunt corecte. Avem aşadar interesul
să căutăm cât mai multe tipuri de erori posibile. Câteva din cele mai des utilizate metode
sunt tratate în cele ce urmează.
Erorile pot apare din mai multe motive şi în mai multe faze ale unei cercetări. Cu
cât există mai multe faze cu atât posibilitatea apariţiei unui nou tip de erori creşte. Erorile
43
pot apare încă din faza de aplicare a chestionarului: respondentul sau operatorul de
interviu bifează o altă căsuţă decât cea corectă. În etapa de codificare a chestionarului, în
cazurile când codificarea nu apare direct pe formularul chestionar, se pot introduce erori
suplimentare. O altă sursă de erori este etapa de introducere a datelor în baza de date.
Cele mai des utilizate proceduri de localizare a erorilor sunt Case Summaries,
Frequencies şi Descriptives. Dar şi procedurile Crosstabs şi Explore pot fi utile.
În exemplul din figura 5.9 se poate vedea un tabel de frecvenţe pentru variabila
temere1 (temerile românilor) unde apare un cod (9) care nu face parte din valorile
prevăzute.
mau l
r
r
r
u c
c
ce
8
6
7
7V
1
9
7
7
52
8
6
7
23
4
3
4
54
3
3
4
95
1
2
2
16
2
5
5
57
8
4
4
98
1
1
1
09
4
6
0T
5
4M
0
5
4T
9
0T o
44
Comanda Descriptives este utilă pentru depistarea erorilor similare, dar pentru
variabile continue, măsurate pe scale de nivel interval sau rapoarte. Această procedură
furnizează valorile minime şi cele maxime întâlnite în baza de date şi astfel putem vedea
dacă apar valori neplauzibile. De exemplu, dacă ştim că eşantionul era compus din
indivizi majori (cum este cazul la Barometrul opiniei publice), o vârstă minimă de 10 ani
nu putea să apară decât dintr-o eroare. Un nivel de educaţie de 0 ani este la fel de
improbabil (deşi nu imposibil).
t d
N
ei
imm
a
8
8
2
0
5 V
9
0
4
4
8 N
8V
În cazul exemplului din figura 5.10 vârstele minimă (18) şi maximă (92) întâlnite
în eşantion sunt plauzibile, dar pentru variabila nringosp (număr de indivizi în
gospodărie) valoarea zero (0) nu are sens.
45
u a
m
l t u
v
ne i a
t
o u- cr
12
32
22
34
32
31
42
21
51
32
61
11
72
22
81
23
92
42
12
13 0
12
32 1
12
32 2
12
21 3
12
32 4
11
23 5
5
55T
N o
a
L .
i
Unele erori pot fi tratate mai uşor decât altele. În exemplul de la procedura
Frequencies, dacă am fi găsit o vârstă de 99 ani, probabil că problema se putea rezolva
prin declararea codului 99 ca valoare omisă. Acest tip de eroare este uşor de corectat.
46
Modul 6. Gestionarea bazei de date
Datele cu care lucrăm pot proveni din surse diferite şi pot fi într-o stare care nu
este perfectă pentru noi. Deseori există valori ne-valide, anumite valori vrem să le
excludem din anumite calcule, sau vrem să creăm variabile noi pe bază de calcule. Aceste
probleme pot fi soluţionate utilizând proceduri din meniul Transform (vezi figura 6.1).
Când observăm erori în date (cum este codul 9 pentru variabila temere1 din vezi
modulul 5) vom dori să corectăm valoarea eronată şi să o transformăm într-una corectă.
Dacă altfel nu este posibil, poate vom dori să o transformăm în valoare omisă sistem.
De multe ori avem variabile continue cu foarte multe valori distincte, cum este de
exemplu vârsta. Pentru anumite proceduri grupele de vârstă, cu mai puţine clase, sunt
47
mai convenabile. Vom dori să obţinem o variabilă nouă grvârsta, prin conversia valorilor
din variabila vârsta.
Una din procedurile din meniul Transform este Recode. Scopul ei este să schimbe
valorile existente într-o variabilă. Se pot schimba valorile existente într-o anumită
variabilă şi înlocui valorile originale, sau se pot schimba valorile pentru o anumită
variabilă într-o variabilă nouă. Totul depinde dacă avem interesul să păstrăm valorile
“vechi” – caz în care vom folosi Recode into Diferent Variables -, sau nu avem acest
interes (de exemplu datele care conţin erori) - caz în care vom utiliza varianta Recode
into Same Variables.
Setul de date poate conţine valori care nu corespund nici unuia din răspunsurile
valide din chestionar, cum este cazul variabilei temere1. Putem corecta răspunsul, dacă
avem datele originale, sau putem să transformăm codul invalid într-o valoare diferită.
48
După cererea Transform, Recode, Into Same Variable, vom trece variabila
temere1 din lista din stânga în lista din dreapta numită Numeric Variables (vezi figura
6.2). Pentru a specifica valoarea care trebuie modificată vom acţiona butonul Old and
New Values… .
SPSS va deschide caseta de dialog corespunzătoare acestui buton (vezi figura 6.3)
unde vom specifica valoarea pe care dorim să o schimbăm şi noua valoare care o va
înlocui. Dacă avem mai multe astfel de valori le vom specifica pe toate şi le vom adăuga
în lista transformări din dreapta casetei numită Old -> New, cu ajutorul butonului Add.
49
Range, Lowest through - pentru transformarea unui interval de valori de la
valoarea întâlnită cea mai mică şi până la valoarea
specificată
De cealaltă parte a casetei de dialog există două opţiuni pentru valorile “noi”. Acestea
sunt:
Dacă transformarea din procedura Recode a avut loc cu succes, nici o valoare 9 nu
ar trebui să mai existe în fişierul nostru de date, iar SPSS ar trebui să dea un mesaj care să
indice că această valoare nu a fost găsită. Astfel, valoarea 13 va fi eliminată permanent
din această versiune a fişierului.
Pentru a scoate caseta de dialog Search for Data de pe ecran va trebui să acţionăm
butonul OK pentru preluarea mesajului, iar apoi butonul Close pentru terminarea
căutărilor.
50
Figura 6.4. Caseta de dialog Search for Data
De foarte multe ori suntem în situaţia de a dori utilizarea uneia din variabilele
noastre dar într-o formă diferită, cum ar fi grupele de vârstă în locul vârstei exacte. În loc
să schimbăm valorile iniţiale în valori noi, putem crea o variabilă noua, adiţională, care să
conţină noile coduri, şi în acelaşi timp să păstrăm şi valorile vechi în variabila originală.
Vom utiliza o tehnică identică cu cea de mai sus, dar vom cere varianta Into
Different Variables al procedurii Recode. Figura 6.5 arată cum putem transforma valorile
variabilei vârsta în valorile variabilei noi grvarsta.
51
Figura 6.5. Caseta de dialog Recode into Different Variables şi caseta de dialog Old and
New Variables pentru variabila nouă “grvarsta”
52
6.6. Obţinerea unor variabile noi prin calcul numeric
De cele mai multe ori apare momentul în care manipularea datelor devine o
chestiune esenţială. Trebuie introduse variabile noi, obţinute prin calcule mai mult sau
mai puţin complexe, trebuie ordonate datele după diverse criterii, sau cazurile trebuie
împărţite în grupuri care să fie examinate într-un mod asemănător, dar separat unele de
altele.
SPSS poate crea variabile noi ale căror valori să fie obţinute din valorile
variabilelor deja existente, cu ajutorul unor formule de calcul. Aceste formule pot conţine
operatori aritmetici şi logici, funcţii aritmetice, pentru şiruri, pentru date calendaristice
sau de timp, şi o multitudine de funcţii statistice. În cele ce urmează vom compara
funcţiile aritmetice şi cele statistice pentru a vedea diferenţele între ele.
Fişierul de date pe care îl vom utiliza, Fracturi.sav, este un fişier care conţine
informaţii privind internările într-un spital. Un pacient poate avea nevoie de mai mult
decât o vizită, cum putem vedea în figura 6.6.
53
Calcule aritmetice
Pentru a utiliza procedura de calcul vom selecta Compute din meniul Transform
(figura 6.1). Acesta generează o casetă de dialog ca în figura 6.7. Aici vom specifica
numele variabilei ţintă (care poate fi o variabilă nouă dar poate fi şi una deja existentă).
Caseta de dialog mai are butoane pentru o serie de operaţii aritmetice, relaţionale
şi logice. Semnele pentru operanţii sunt următoarele:
În urma executării procedurii din exemplu vom obţine o variabilă nouă spitmed,
reprezentând numărul mediu de zile de spitalizare pentru fiecare caz internat (figura 6.8).
Observăm că multe din cazuri nu au valori pentru variabila nouă. Acest lucru se
datorează faptului că multe din cele trei variabile spitaliz_ conţin valori omise sistem, şi
calculele nu pot fi efectuate.
54
Figura 6.8. Medii calculate cu operaţii aritmetice standard
Dacă dorim să obţinem numărul mediu de zile spitalizare, bazat numai pe valorile
valide ale fiecărui caz, putem apela la funcţiile statistice ale SPSS. Procedura Compute
permite accesul la o mare varietate de funcţii predefinite care lucrează cu variabile
numerice, alfanumerice, date calendaristice sau care generează valori aleatoare după
distribuţii statistice standard.
Vom utiliza aici funcţia MEAN care calculează media zilelor de spitalizare ţinând
cont de valorile efectiv existente pentru fiecare caz. Noua variabilă rezultată o vom numi
spitmean, pentru a face distincţie de cea calculată înainte prin operaţii aritmetice. Funcţia
MEAN poate fi găsită în lista de funcţii a casetei de dialog Compute Variable prin clic
pe zona Functions, apoi prin defilare până la litera M.
55
Figura 6.9. Calculul mediei “spitmean” cu funcţia MEAN
SPSS are o mare varietate de proceduri de calcul şi de funcţii destinate altor date
decât cele numerice. Chiar dacă datele numerice sunt pe de departe cele mai cunoscute
tipuri de date pentru majoritatea dintre noi, datele de tip text şi / sau dată calendaristică
sunt foarte frecvent utilizate în seturile de date. Din acest motiv, este foarte util ca cel
care gestionează fişierele de date să cunoască ceea ce poate face cu ele.
Datele calendaristice pot fi afişate într-o varietate de forme, care sunt definite în
caseta Define Variable Type din procedura Define Variable (vezi modulul 3). Aceste
forme se referă la formatul în care vedem datele pe ecranul monitorului (de exemplu,
ll/zz/aa, zz.ll.aaaa etc.) dar, intern, datele calendaristice sunt memorate sub forma unor
numere întregi care reprezintă numărul de secunde scurse de la 14 octombrie 1582 (data
introducerii calendarului Gregorian). Astfel, calculele cu datele calendaristice constau în
calcule matematice cu secunde şi convertirea acestora în intervale de timp (minute, ore,
zile etc.) după cum cere natura variabilei. Totodată există câteva funcţii predefinite, cu
ajutorul cărora se pot extrage anumite informaţii (de exemplu, luna) din datele
calendaristice.
56
Calculul duratelor pe baza a două date calendaristice
dataext – dataint
57
Calculul vârstei pe baza a două date calendaristice
Fişele pacienţilor unui spital conţin şi vârsta lor. Această informaţie poate fi şi ea
calculată din data naşterii (datanas) şi data internării (dataint). Ca şi durata spitalizării,
vârsta se calculează după formula:
58
6.8. Selectarea cazurilor după diverse criterii
Pentru anumite proceduri putem utiliza subseturi de cazuri, sau putem reţine doar
anumite cazuri în Editorul de date. Acest procedeu de “filtrare” nu înlătură cazurile care
nu ne interesează în momentul respectiv. Toate cazurile rămân în Editorul de date, dar
numai cele care satisfac criteriile de filtrare sunt utilizate în analiză. Există bineînţeles şi
opţiunea de “ştergere” a cazurilor înlăturate, dar acest lucru nu se face decât la o cerere
explicită. Dacă dorim să analizăm un grup selectat de cazuri vom utiliza filtrarea, dacă
dorim să lucrăm intensiv cu cazuri selectate, ştergerea este probabil mai eficientă.
Filtrarea se poate cere prin intermediul comenzii Select Cases din meniul Data.
Caseta de dialog Select Cases din figura 6.12 arată faptul că, iniţial, toate cazurile sunt
selectate (All cases este ales). Prin alegerea butonului If condition is satisfied, numai
cazurile care îndeplinesc criteriile din caseta If… vor fi selectate. Alegerea butonului
Random sample of cases va permite formarea unui eşantion aleator dintre cazurile
fişierului. Utilizarea unei variabile filtru Use filter variable permite reţinerea pentru
analiză doar a cazurilor care au valori diferite de 0 pentru variabila specificată. Starea
implicită este fără variabilă filtru, întrucât toate cazurile sunt selectate în mod curent (All
cases este ales).
59
În zona Unselected cases putem indica dacă dorim să filtrăm doar cazurile
(Filtered) sau dorim să ştergem cazurile neselectate (Deleted).
În figura 6.13 putem vedea cum în fişierul Martie97.sav s-au selectat numai
respondenţii de genul feminin de vârstă sub 30 ani.
60
De exemplu, dacă dorim să generăm tabele de frecvenţe pentru variabila mtrai,
care exprim cât de mulţumiţi sunt respondenţii Barometrului opiniei publice de traiul lor,
dar separat pentru fiecare gen, vom împărţi fişierul Martie97 în subgrupe determinate de
variabila gen, apoi vom cere generarea tabelului de frecvenţe pentru variabila mtrai.
61
Frequencies
Genul respondentului = masculin
Statisticsa
N
Valid Missing
Multumit de felul in care trãieste 624 0
a. Genul respondentului = 1 mas culin
a
Multumit de felul in care trã ieste
Valid Cumulative
Frequency Percent Percent Percent
Valid 0 NS / NR 2 .3 .3 .3
1 deloc multumit 61 9.8 9.8 10.1
2 nu prea multumit 250 40.1 40.1 50.2
3 des tul de multumit 293 47.0 47.0 97.1
4 foarte multumit 18 2.9 2.9 100.0
Total 624 100.0 100.0
Total 624 100.0
a. Genul respondentului = 1 mas culin
Statisticsa
N
Valid Missing
Multumit de felul in care trãieste 674 0
a. Genul respondentului = 2 feminin
a
Multumit de felul in care trã ieste
Valid Cumulative
Frequency Percent Percent Percent
Valid 0 NS / NR 2 .3 .3 .3
1 deloc multumit 87 12.9 12.9 13.2
2 nu prea multumit 295 43.8 43.8 57.0
3 des tul de multumit 267 39.6 39.6 96.6
4 foarte multumit 23 3.4 3.4 100.0
Total 674 100.0 100.0
Total 674 100.0
a. Genul respondentului = 2 feminin
62
6.10. Ordonarea cazurilor după diverse criterii
Procedura Sort cases din meniul Data permite ordonarea cazurilor din fişierul de
date după diverse criterii, în ordine ascendentă sau descendentă.
63
6.11. Ponderarea cazurilor
Dacă fiecare linie din baza de date reprezintă mai multe cazuri cu aceleaşi valori
pentru fiecare variabilă, putem specifica acest lucru prin intermediul procedurii Weight
Cases din meniul Data. Prin ponderare cazurile sunt tratate diferit. Unele sunt luate în
considerare de mai multe ori, altele de mai puţine ori. Ponderarea se utilizează pentru a
obţine estimaţii ale unei populaţii când unele categorii au fost sub-reprezentate în
eşantion. Ponderarea se mai poate utiliza în raportări despre o populaţie pe baza unui
eşantion.
O situaţie frecventă în care trebuie utilizată ponderarea este atunci când dorim să
introducem date în fişier nu pe baza unor cazuri individuale, ci din tabele de frecvenţe.
Fiecare linie valoare posibilă a variabilei se va introduce o singură dată, apoi se va
introduce frecvenţa cu care apare. După aceea urmează o declarare a câmpului cu
frecvenţele ca variabilă ce serveşte pentru ponderare.
De exemplu, figura 6.16 arată cum s-au atribuit valorile ratelor de fertilitate (fx)
realizate de fiecare grupă de vârstă fertilă (grvr), în diverşi ani calendaristici (an),
populaţiei feminine a judeţelor din România (judeţ).
64
Modul 7. Întocmirea rapoartelor
Deşi util din multe puncte de vedere, mai ales pentru căutarea erorilor, procedura
Case Summaries este restricţionară într-un anumit sens: ea nu permite controlul cazurilor
afişate. Pentru a deţine un astfel de control trebuie să utilizăm una din procedurile Report
Summaries in Row sau Report Summaries in Columns, ale aceluiaşi meniu (figura 7.1). În
65
definirea unui raport se utilizează două categorii de variabile: variabile de raportare şi
variabile de întrerupere.
Variabile de raportare
Sunt variabilele care se doresc a fi listate şi pentru care se cer satisticile. Aceste
variabile sunt afişate în coloane separate.
Variabile de întrerupere
Rapoartele de tip listă sunt similare celor obţinute cu procedura Case Summaries.
Lista cazurilor afişează valorile variabilelor sau etichetele lor, iar cazurile pot fi aşezate în
altă ordine decât cea existentă în fişier.
66
De exemplu, pentru a produce o listă a internărilor pacienţilor din fişierul
Fracturi.sav vom trece în zona variabilelor de întrerupere Break Columns variabila după
care dorim să ordonăm cazurile. Este vorba de variabila care identifică pacienţii “id”.
Observăm că valorile acestui câmp se repetă, pentru că un acelaşi pacient a fost internat
de mai multe ori şi fiecare internare a fost însoţită de o nouă înregistrare în baza de date.
Vom dori să avem toate datele legate de un pacient grupate în raport şi nu disparate aşa
cum ele apar în fişierul de date. Paranteza (A) care însoţeşte numele variabilei id(A) se
referă la ordinea de sortare: dacă este (A) cazurile vor apare în ordine crescătoare a
valorilor (Ascending), iar dacă este (D) cazurile vor apare în ordine descrescătoare a
valorilor (Descending). În exemplul nostru pacienţii nu vor fi puşi în ordine alfabetică de
la A la Z cum ar trebui să fie ordonarea crescătoare a câmpurilor de tip text, pentru că id
este de fapt un câmp numeric, iar numele pacienţilor sunt doar etichetele valorilor
numerice.
Ceea ce este esenţial în producerea unui raport de tip listă este alegerea bifarea
căsuţei Display Cases din partea stângă jos a casetei de dialog. Apoi se acţionează
butonul OK. Raportul obţinut este ilustrat în figura 7.3.
67
7.2. Rapoarte cu informaţii rezumative pe linii
Observăm în figura 7.2 că există două butoane Summary: unul aparţine zonei
variabilelor de întrerupere Break Columns, iar celălalt, din partea dreaptă, aparţine zonei
Report valabil la nivelul întregului raport. Dacă statisticile rezumative dorim să le
obţinem pentru fiecare grup de cazuri vom utiliza butonul Summary de la variabilele de
întrerupere, iar dacă le dorim pentru întregul fişier vom utiliza butonul Summary general.
În exemplul nostru, unde însumările vrem să le facem pentru fiecare pacient vom
acţiona butonul Summary de la Break Variable, vezi figura 7.4. Pentru ca acesta să fie
eligibil id(A) trebuie mai întâi selectat.
Dintre indicatorii statistici ce pot fi calculaţi bifăm suma valorilor (Sum of values)
şi numărul de cazuri (Number of cases). S-ar mai putea selecta media, minimul, maximul,
procente sub / peste / între o valoare specificată, abaterea standard, varianţa, oblicitatea
68
sau ascuţimea (vezi figura 7.4). Pentru exemplul nostru aceşti ultimi indicatori nu au
sens.
Observăm că la fiecare pacient au mai fost introduse două linii unul de Sum, cu
suma valorilor variabilelor de raportare, şi alta cu N, un contor al numărul de valori
afişate. Acesta este formatul unui raport cu informaţii rezumative pe linii.
Suma datelor de internare produce un număr fără sens, iar numărul de valori
pentru duratele de spitalizare este o informaţie redundantă. Dacă dorim să le eliminăm
din raport o putem face cu ajutorul editorului Navigatorului de rezultate. Acest editor
permite modificarea oricărui rezultat produs în fereastra Navigatorului de rezultate.
Trebuie doar să facem dublu-clic în aria raportului. Apoi putem opera toate modificările
în stilul unui procesor de texte. Ceea ce putem obţine este, de exemplu, un raport
modificat ca cel din figura 7.6.
69
Figura 7.6. Raport modificat în fereastra Navigatorului de rezultate
Butoanele Options, Format, Layout şi Titles care mai apar în caseta de dialog
Report Summaries in Rows permit rafinarea formatelor de afişare în raport, alinierea
coloanelor, introducerea titlurilor, a antetelor şi subsolurilor, a datei curente, schimbarea
paginării etc., la nivelul variabilelor de întrerupere sau al întregului raport. Lăsăm
cititorului care dispune de un calculator înzestrat cu SPSS să exploreze aceste posibilităţi.
Raportul care se pregăteşte în figura 7.7 este unul declanşat cu comanda Report
Summaries in Columns. După cum putem observa în zona Data Columns se specifică
70
numele variabilelor de raportare, dar şi tipul informaţiei rezumative corespunzătoare.
Rezumatele nu se vor repeta identic pentru fiecare variabilă, ca în cazul rapoartelor
rezumative pe linii, ceea ce ne scuteşte de a mai introduce o etapă suplimentară de
modificări ale raportului generat.
71
Figura 7.8. Raport cu informaţii rezumative pe coloane
72
BIBLIOGRAFIE
Babbie, Earl, 1991 – The Practice of Social Research, Wadsworth publishing Company,
Belmont, California, 493 p.
Bryman, Alan & Cramer, Duncan, 1992 – Quantitative data analysis for social scientists,
Routledge Edition, 294 p.
Mioriţa, Ilie, 1993 – dBASEB IV Sistemul de meniuri pe înţelesul tuturor, Editura Teora,
Bucureşti, 216 p.
Mureşan, Cornelia & colab., 1990 - Totul despre dBASE, vol. 1, Editura TDB, Cluj-
Napoca, 320 p.
Mureşan, Cornelia & colab., 1991 - Totul despre dBASE, vol. 2, Editura TDB, Cluj-
Napoca, 200 p.
Norusis, J. Marija, 1992 – SPSS for Windows. Basw System User’s Guide, SPSS Inc.,
672 p.
Rotariu T., Bădescu G., Culic I., Mezei E., Mureşan C., 1999 – Metode statistice aplicate
în ştiinţele sociale, Editura Polirom, Iaşi, 335 p.
73