Sunteți pe pagina 1din 86

Aplicaii SPSS

Marian Popa

MARIAN POPA...................................................................................................1
SPSS prezentare general...................................................................................................................................3
................................................................................................................................................................................6
Paii analizei statistice cu SPSS..........................................................................................................................6
Editarea datelor....................................................................................................................................................8
Exemplu practic de realizare a unei baze de date..........................................................................................15
Operaii de transformare a variabilelor..........................................................................................................19
nsumarea valorilor variabilelor................................................................................................................19

.........................................................................................................................21
Calcularea mediei a dou sau mai multe variabile....................................................................................21
Extragerea anului dintr-o variabil de tip cronologic (date) ....................................................................22
Recodificarea variabilelor.........................................................................................................................24
Ordonarea dup rang a valorilor unei variabile........................................................................................26
Organizarea datelor pentru analiz.................................................................................................................27
Sortarea bazei de date...............................................................................................................................27
mprirea bazei de date n subgrupuri......................................................................................................28
Selectarea unor seturi de date....................................................................................................................28
Calcularea indicatorilor statistici descriptivi..................................................................................................31
Teste parametrice...............................................................................................................................................35
Testul z (t) pentru media unui singur eantion .........................................................................................35
Testul t pentru eantioane independente...................................................................................................37
Analiza de varian unifactorial (One Way ANOVA)............................................................................40
Testul t pentru eantioane dependente (perechi).......................................................................................44
Coeficientul de corelaie liniar Pearson (r).............................................................................................46
Regresia liniar simpl..............................................................................................................................51
Analiza de consisten intern (Cronbach alfa)........................................................................................57
Teste neparametrice nominale..........................................................................................................................65
Testul z al proporiei pentru un singur eantion........................................................................................65
Testul semnelor.........................................................................................................................................67
Testul Chi-ptrat al asocierii (independeei).............................................................................................69
Testul Chi-ptrat pentru coresponden (goodness of fit).........................................................................72
Testul z al diferenei dintre dou proporii independente.........................................................................74
Teste neparametrice pentru date ordinale......................................................................................................77
Testul Mann-Whitney (U) pentru dou eantioane independente............................................................77
Testul Wilcoxon pentru dou eantioane perechi.....................................................................................79
Testul Kruskal-Wallis pentru mai mult de dou eantioane independente...............................................81
Testul Friedman pentru msurri repetate................................................................................................83
Coeficientul de corelaie pentru date ordinale (Spearman).......................................................................84

-2-

SPSS prezentare general


SPSS for Windows este un pachet de programe destinat analizei statistice a
datelor. Dei exist o varietate de programe de acest gen (SAS, Statistica for Windows,
GraphPad, MS Excel, care are i el funcii statistice), SPSS se distinge prin structurarea
riguroas i uurina utilizrii, chiar i pentru nceptori.
Cea mai recent versiune disponibil la aceast dat este SPSS 12.0. Acest manual
nu acoper n mod special o anumit versiune, ci face referire n general la versiunile sub
Windows. n esen, toate versiunile sub Windows ofer acelai pachet de funcii statistice
iar diferenele, chiar dac sunt, nu sunt relevante la nivelul unui curs introductiv de
statistic.
Simbolul care precede aceast propoziie indic introducerea unei informaii
importante, care se impune a fi reinut.
Ne vom axa pe o prezentare sintetic, axat pe esenial, considernd cunoscute
elementele de baz de operare n mediul Windows.
Funcii de baz ale SPSS

editarea datelor (construirea bazelor de date, transformri ale variabilelor)


prelucrarea statistic a datelor (statistici descriptive, teste de semnificaie)
prezentarea rezultatelor, sub form numeric sau grafic
realizarea unor proceduri proprii de prelucrare sau de a modifica procedurile
standard SPSS. Aceast opiune este rezervat utilizatorilor avansai i nu va
face obiectul prezentrii n acest manual.

Domeniile de lucru n SPSS


Particularitatea principal a interfeei de lucru cu SPSS este aceea c rezerv
fiecreia dintre funciile de mai sus un domeniu special (ecran, sau fereastr). Astfel, la
lansarea programului, acesta deschide automat o fereastra rezervat editrii datelor (Data
Editor) i una afirii rezultatelor (Viewer). Putem numi aceste ferestre i domenii de lucru,
deoarece la nivelul fiecruia avem la dispoziie o varietate de funcii i opiuni specifice.
Ca s nelegem mai bine, trebuie s ne imaginm domeniile de lucru ca fiind ferestre
distincte, similare celor ale documentelor Word, cu deosebirea c, n acest caz, fiecare
fereastra acoper funcii specifice.
Trecerea de la o fereastr la alta se face ntr-unul din urmtoarele moduri:
Din meniul SPSS/Windows, prin alegerea ferestrei dorite;
Utiliznd butoanele din bara de comenzi directe a ferestrei SPSS;
Utiliznd butoanele de pe bara de sarcini a sistemului de operare (din partea
de jos a ecranului).

-3-

Domeniul bazei de date (Data Editor)


La lansarea programului SPSS se deschide fereastra domeniului de editare a datelor
(SPSS Data Editor). Ea se prezint ca n imaginea de mai jos, avnd caracteristicile
obinuite ale unei ferestre Windows, cu o structur de linii i coloane:
- pe coloane sunt variabilele (de ex., cod_sub, rezultat)
- pe linii sunt cazurile (n acest caz, cinci subieci)

O sesiune de lucru cu SPSS presupune, n mod necesar, existena unei baze


de date.

SPSS opereaz cu o singur baz de date la un moment dat.

Pentru a deschide o alt baz de date, sau a crea una nou, cea aflat n
lucru va fi nchis. Programul solicit salvarea ei prealabil, dac acest lucru nu a
fost deja efectuat.

Dac vrem s prelucrm date aflate n baze de date (fiiere) diferite, este
necesar aducerea lor n aceeai baz de date (procedura DATA-Merge files, care va
fi descris mai trziu).

Meniurile ferestrei Data Editor nu se vor activa integral dect atunci cnd
va exista cel puin o variabil definit i valori pentru cel puin un caz.

Baza de date SPSS poate fi creat direct, cu ajutorul structurii (ferestrei)


Data Editor, sau poate fi deschis cu ajutorul comenzii File-Open, aa cum vom
exemplifica mai trziu.
Domeniul afirii rezultatelor (Viwer)
SPSS depune rezultatele prelucrrilor ntr-o seciune aparte a domeniului de lucru.
Aceasta cuprinde toate tipurile de rezultate, att de tip numeric ct i de tip grafic. Fereastra
respectiv (Viewer) este organizat n dou zone distincte: una pentru navigare (n partea
stng) i alta pentru afiarea rezultatelor (n partea dreapt).

-4-

Fiierul rezultat prin salvarea acestei ferestre are extensia .SPO


Un fiier cu rezultate SPSS nu poate fi deschis dect din SPSS
Dac se dorete transmiterea rezultatelor n afar SPSS se va proceda fie la
exportul rezultatelor cu procedura corespunztoare din meniul File/Export, fie la
transferarea prin Select/Copy/Paste ntr-un editor grafic de tipul MS Word.
Domeniul de editare a procedurilor directe (Syntax)
SPSS permite, n afara operrii prin intermediul mediurilor, i lucrul direct cu
proceduri definite de utilizator. Aceasta se face n interiorul unei ferestre speciale, care
permite, pe de o parte, editarea procedurilor, iar pe de alt parte, lansare lor n execuie.
Imaginea de mai jos red comenzile SPSS pentru calcularea procedurii de calcul
indicatorilor statistici descriptivi, redai mai sus, n fereastra SPSS Viewer.

Utilizarea direct a procedurilor impune aprofundarea SPSS


Se poate seta afiarea procedurilor curente n SPSS Viewer, concomitent cu
rezultatele. (Edit/Options/Viewe/Display commands in the log)

-5-

Meniurile SPSS
Meniurile de tip list se aseamn cu meniurile altor programe sub Windows. Fr a intra n
amnunte, iat o prezentare succint a meniurilor pentru fereastra DATA EDITOR:

Meniul
File

Funcii principale
Observaii
Operaii de deschidere i salvare de fiiere
Operaii de Select/Copy/Cut/Paste, Find i, cel
Edit
mai important, setarea caracteristicilor de lucru
ale SPSS (Options-n versiunile pt. Win 9X)
n cazul ferestrei Data Editor, seteaz modul
View
de afiare: cu sau fr bara de butoane, cu sau
fr liniile despritoare ale celulelor.
Funcii de operare cu variabilele; definire,
Importante pentru
Data
inserare, tergere, selectare, sortare, adiionare pregtirea datelor n
de fiiere, etc.
vederea prelucrrii
Importante pentru
Funcii de modificare a datelor prin calculare,
Transform
pregtirea datelor n
recodificare.
vederea prelucrrii
Prin opiunile fiecrei
Statistics
proceduri se pot obine i
Grupeaz procedurile de calcul statistic
(Analyze)
reprezentri grafice
specifice
Graph
Grupeaz procedurile de reprezentare grafic
Informaii despre variabile, structurare pe
Utilities
seturi de variabile
Lista ferestrelor deschise cu posibilitatea de
Window
selecie
Aici se afl un tutorial
extrem de sugestiv de
operare cu SPSS, iar de la
versiunea 7.5 n sus, o
Help
Informaii de ajutor
procedur de sprijin n
alegerea tipului de
prelucrare statistic
(Statistic Coach)

Paii analizei statistice cu SPSS


n principiu, prelucrarea datelor cu SPSS presupune urmtoarele etape:

Introducerea datelor

Opiuni:
(a) Introducerea direct a datelor n DATA EDITOR
(b) Deschiderea unui fiier de date SPSS (extensia .SAV)
(c) Importarea unui fiier de format diferit (se alege din
caseta File open/File of type)

-6-

2
3
4

Pregtirea datelor
Selectarea procedurii
satistice
Selectarea variabilelor
ce urmeaz a fi supuse
prelucrrii

Rularea procedurii

Analiza rezultatelor

Editarea rezultatelor

Inserarea datelor ntrun document

Corecia erorilor, selecii, recodificri, transformarea


variabilelor prin calcule, declararea valorilor lips,
combinarea datelor din dou fiiere diferite (meniurile Data,
Transform)
Meniurile Statistics (sau Analyze) i Graphs
n conformitate cu configuraia casetei de dialog care este
afiat la fiecare procedura
Se acioneaz butonul OK din caseta de dialog a procedurii
Butonul devine activ numai atunci cnd sunt ntrunite
condiiile presupuse de procedura respectiv
Rezultatele prelucrrilor sunt afiate ntr-o fereastr
specific (SPSS Viewer), cu funciuni de editare grafic sau
de tip text, n funcie de versiune.
Se editeaz rezultatele afiate n Viewer, aducndu-le la
forma dorit sub aspect grafic
Dublu clic pe un element din Viewer conduce la intrarea
elementului respectiv n regim de editare)
Rezultatele din SPSS Viewer se preiau cu Select/Copy i se
depun cu Paste n orice tip de editor de documente.

SPSS este un program puternic de analiz statistic a datelor. Utilizarea lui optim
presupune, n mod necesar, stpnirea de ctre operator a cunotinelor teoretice de
statistic.
Aa cum un program de editare grafic nu compenseaz lipsa de talent la desen, nici
SPSS nu poate fi cu adevrat exploatat de ctre cei care nu au cunotine de statistic.
n lipsa acestora, nici alegerea procedurilor i nici interpretarea rezultatelor nu va fi cu
adevrat posibil.

-7-

Editarea datelor
O baz de date n SPSS este o structur format din linii i coloane, la intersecia
crora se formeaz celulele care conin, fiecare, o anumit unitate de informaie.
Existena unei baze de date deschis n fereastra Data Editor este o condiie
obligatorie pentru operarea cu SPSS
SPSS opereaz numai cu o singur baz de date deschis la un moment dat
n principiu, o baz de date SPSS se obine pe una din urmtoarele ci:
a) Crearea ei prin operaiunea de definire a variabilelor i introducerea datelor de la
tastatur;
b) Deschiderea unei baze de date SPSS, existente pe un suport de memorie;
c) Importarea unei baze de date din alt format dect SPSS
n continuare, vom trata pe rnd, fiecare din cele trei situaii:
a) Crearea unei baze de date SPSS
n linii generale, pentru crearea unei baze de date proprii n SPSS, se procedeaz astfel:
Se lanseaz SPSS
Se definesc variabilele bazei de date n domeniul Data Editor
Se introduc datele pentru fiecare caz (subiect) n parte
Se salveaz baza de date (extensia specific este *.sav)
Definirea variabilelor
se acioneaz Define variable din meniul Data
soluie mai direct este dublu clic pe capul de coloan

n versiunile de SPSS mai recente, editarea variabilelor se face ntr-o fereastr


special. Cu toate acestea, elementele de baz rmn aceleai ca al versiunile
anterioare.

-8-

Ca urmare a operaiei de mai sus, apare o caset de dialog ca n imaginea de mai jos
(forma ei nu difer substanial de la o versiune de SPSS la alta). Dac privim caseta, vom
observa urmtoarele elemente:

Variable Name: zona de declarare a numelui de variabil. VAR00001 este


numele implicit al primei variabile. Acesta se terge, pentru a fi nlocuit cu
numele pe care dorim s l dm variabilei.
Variable Description, este o zona informativ n care sunt afiate caracteristicile
predefinite ale noii variabile. Aceste caracteristici se pot seta n Edit-Options
(sau Preferences, la unele versiuni).
Change Settings, este o zon care cuprinde butoane de comenzi pentru
modificarea setrilor implicite:
n zona Measurement, se permite declararea tipului de msurare specific
variabilei: Scale (Interval/Raport); Ordinal; Nominal
Butoanele OK (pentru finalizarea definirii variabilei, Cancel (pentru renunarea
la definirea variabilei, Help (informaii legate de definirea variabilelor)

n versiunile mai recente de SPSS editarea variabilei nu presupune acest tip de


caset, dar toatele elementele ei constitutive se regsesc.
Numele variabilei:
Orice variabil SPSS trebuie s aib un nume. Cele mai importante aspecte legate
de denumirea variabilelor sunt urmtoarele:

Trebuie sa fie format din minim 1, maxim 8 caractere,

Nu sunt suportate caractere speciale cum ar fi spaiu sau semne de


punctuaie

-9-


n cazul utilizrii unor caractere improprii, apare un mesaj de eroare i se
permite corectarea numelui.

Alegerea numelui este la latitudinea operatorului. Respectarea anumitor


convenii poate fi, ns, extrem de util, mai ales dac avem de a face cu o baza de
date cu multe variabile. Iat cteva recomandri utile n acest sens (ele nu sunt
obligatorii):

Numele s exprime, pe ct posibil, coninutul variabilei

Pentru variabile nrudite, se va utiliza o schem de


denumire care s exprime acest lucru. De exemplu, dac avem
variabile care cuprind valori ale timpului de reacie msurat n mai
multe condiii, putem declara variabilele TR_1, TR_2, TR_3
.a.m.d.,

caracterul underscore este recomandabil ca separator n


cadrul numelui de variabil). Dac ntr-o situaie de acest gen am
avea 10 sau mai multe momente, este de preferat s se declare
nume de genul TR_01, TR_02,...TR_10, etc., deoarece ulterior
SPSS aranjeaz alfabetic variabilele n listele de selecie i, astfel, se
pstreaz ordinea dorit.

ntr-o baz de date nu pot exista dou variabile cu acelai nume!

Exist o serie de cuvinte rezervate, a cror utilizare ca nume de variabile


nu este acceptat de program. Acestea sunt: ALL, AND, BY, EQ, GE, GT, LE, LT,
NE, NOT, OR, THRU, TO, WITH.
Definirea tipului de variabil
Tipul de variabil se refer la

Se acioneaz butonul Type de pe caseta Define Variable

Apare caseta Define Variable Type

, unde se marcheaz tipul variabilei i se declar caracteristicile acesteia


(Width, Decimal Places, n cazul variabilelor numerice)

Se acioneaz butonul Continue, pentru a se reveni la caseta Define


Variable.
Aa cum se observ n caseta Define Variable Type din imaginea de mai sus, SPSS poate
opera cu o varietate de tipuri de variabile. Fiecrui tip i corespund anumite proprieti
(caracteristici) care trebuie definite de operator. Cele mai uzuale sunt tipurile:
- 10 -

[Numeric], care cuprind valori de tip numeric cu sau fr zecimale.


Proprieti:
numrul de cifre necesare pentru exprimarea ntregilor
numrul de zecimale
EXEMPLE:
Pentru o variabil n care vom introduce vrsta n ani mplinii, vom defini Type
Numeric cu Width 2 (presupunnd c nu avem subieci cu vrsta peste 100 de ani)
i Decimal Places 0.
Pentru o variabil n care vom introduce rezultatul la un test exprimat n scoruri T
cu o zecimal, definim Type Numeric cu Width 2 i Decimal Places 1.
[Caracter] (String), care cuprind valori exprimate sub form de caractere alfanumerice
(litere sau chiar cifre).
Proprieti
numrul de caractere rezervat, care este fixat implicit la 8, dar poate fi
modificat dup dorin.
SPSS face distincie ntre variabile de tip caracter scurte (Short string) i lungi
(Long string). Primele au maxim 8 caractere i pot fi incluse n unele proceduri
statistice (semnificaia diferenei ntre medii, de exemplu), pe cnd celelalte nu pot fi
utilizate dect n operaii de listare (cazul variabilei de genul nume, de ex.).
Dei permis, utilizarea variabilelor string nu este de preferat. Toate variabilele care
suport codificri vor fi, de preferin, introduse cu valori numerice. Utilizarea acestora
n proceduri statistice nu este limitat de nici o restricie.
Uniti de timp calendaristic sau orar [Date], care pot include valori de timp ntr-un
format specificat, aa cum se vede n imagine.
Proprieti
formatul de ntroducere, care poate fi unul din cele evideniate n caseta
Define Variable Type/Date
Exemplu: dd-mmm-yyyy presupune introducerea unor valori de genul 21-FEB2001 (luna fiind scris obligatoriu dup prescurtarea ei n englez).

Exist o mare varietate de formate pentru acest tip de variabil, acoperind, practic,
orice cerin posibil din partea utilizatorului.

- 11 -

Variabilele de tip Date beneficiaz de funcii speciale de tratare i analiz n


SPSS.
Nu vom prezenta i celelalte tipuri de variabile, ele fiind mai puin folosite, dar
facem precizarea c semnificaia lor poate fi gsit n Help-ul casetei Define Variable Type.
Tipul unei variabile poate fi schimbat ulterior prin simpla redefinire a acesteia.
Se va acorda atenie mesajelor care pot s apar i care avertizeaz asupra
eventualelor pierderi de informaie prin schimbarea tipului.
Opiunile din zona Measurement (Scale, Ordinal, Nominal), care se regsesc
doar la versiuni SPSS de la 7.0 n sus, nu au ntotdeauna o utilitate practic dar
marcarea lor corect este necesar pentru anumite proceduri statistice sau
grafice.
Etichetarea variabilelor i a valorilor
Etichetarea este o form de descriere explicit a coninutului variabilei (avnd n
vederea c numele variabilei nu poate fi mai mare de 8 caractere). Etichetarea se poate
practica att la nivelul variabilei dar i la valorile pe care le conine, n cazul variabilelor de
tip nominal sau ordinal.
Pentru etichetare se apas butonul Labels de pe caseta Define Variable. Se
deschide o nou caset (Define Labels), care conine spaii pentru eticheta variabilei
(Variable Label) i pentru etichetele valorilor (Value labels).
Eticheta variabilei nu se supune restriciilor pentru nume, putnd conine oricte
caractere (max. 255), dar i spaii sau alte semne grafice tipribile.
Etichetele pentru valori vor fi introduse una cte una, astfel:
se plaseaz valorea etichetatn zona Value
se introduce eticheta corespunztoare n zona Value label
se acioneaz butonul Add
Operaiunea se reia pentru toate valorile pe care dorim s le etichetm.
Imaginea prezint etichetarea valorilor unei variabile care se refer la calificativul
la un examen. Se observ c valoarea 1 are eticheta SLAB, valoarea 2, eticheta MEDIU iar
valoarea 3, eticheta BUN (nc nu a fost acionat butonul Add pentru a fi finalizat
declaraia etichetei acestei valori).

- 12 -

Dei nimic nu ne oblig s aplicm etichete variabilelor i valorilor, este foarte


recomandabil ca ele s fie atribuite.
Etichetele ajut la citirea mai uoar a rezultatelor (deoarece apar alturi de acestea). n
plus, etichetele sunt asociate prelucrrilor grafice (histograme, bare, etc.) fapt care
reduce necesitatea de a le introduce ulterior prin editarea respectivelor grafice.
Pentru a ti cum s declarm etichetele, este bine s ni le imaginm ca fiind nscrise pe
axele de referin ale unui grafic. Dac se potrivesc, atunci au fost bine definite.
Oricum, ele vor putea fi modificate ulterior sau editate direct n SPSS Viewer.
Declararea valorilor lips (missing values)
Valorile lips sunt de dou tipuri:
valori lips de sistem (system missing values) adic valori care lipsesc din baza de
date (nu au fost introduse). Forma lor de evideniere pe ecran este un punct plasat n
celula respectiv.
valori lips declarate de utilizator (user missing values) adic valori pe care
utilizatorul le declar ca atare. Acestea pot exista n baza de date dar utilizatorul,
din diverse motive, nu dorete s fie luate n calcul. Atenie, odat declarate, aceste
valori nu sunt terse i nici nu sunt marcate n mod evident pe ecran.
Pentru declararea valorilor lips se acioneaz butonul Missing Values din caseta
Define Variables, care genereaz apariia casetei de dialog alturate.

Se observ c exist mai multe opiuni:


declararea a trei valori distincte ca fiind lips (Discrete missing values)
declarea unui domeniu de valori lips (Range of missing values)
declararea unui domeniu la care se poate aduga i o valoare distinct (Range plus
one discrete missing value)
Dei nu pare foarte evident acum, utilitatea funciei de declarare a valorilor lips
nu trebuie subestimat. Foarte adesea suntem nevoii s scoatem din prelucrri
anumite valori (care nu pot fi totui, pur i simplu, terse). S ne gndim numai la
valorile extreme ale unei distribuii, a cror meninere n anumite prelucrri poate
determina modifcri semnificative a rezultatelor.
n concluzie, declararea variabilelor se compune din urmtoarele operaiuni:
- 13 -

Atribuirea numelui (maxim 8 caractere)


Definirea tipului (numeric, caracter, data)
Atribuirea etichetei variabilei
Atribuirea etichetei valorilor, n cazul variabilelor msurate pe scale
nominale sau ordinale
Declararea valorilor lips (care nu au fost recoltate n procesul de msurare,
din diferite motive)

tergerea i inserarea variabilelor


tergerea unei variabile se face prin selectarea acesteia (clic pe capul de variabil)
i acionarea tastei Delete (sau se comand din meniul Edit-Cut).
Inserarea unei variabile se face prin plasarea cursorului-celul pe coloana variabilei
n stnga creia dorim s inserm noua variabil (sau prin selectarea variabilei
respective), dup care se comand, din meniul Data-Insert variable. Dup aceasta,
se definete variabila inserat (nume, tip, etichete).
tergerea i inserarea cazurilor
tergerea cazurilor se face n mod similar variabilelor, prin selectarea acestora (clic
pe capul de linie) i tasta Delete (sau Edit-Cut). Se pot selecta mai multe cazuri
simultan (drag cu mouse-ul pe capul liniilor) dup care se terg ca mai sus.
Inserarea cazurilor se face dup plasarea cursorului pe linia deasupra creia dorim
s inserm un nou caz, dup care se acioneaz n meniul Data-Insert case.

Pentru versiunile de SPSS de la 7 n sus, clic dreapta pe capul de coloan


sau de linie, produce un meniu contextual care permite un acces mai rapid la
funciile de inserare/tergere.

SPSS nu permite Undo (n meniul Edit) dect limitat la ultima aciune. Din
acest motiv, tergerea variabilelor sau a cazurilor trebuie s se fac cu atenie,
pentru c datele pot fi definitiv pierdute. Se va reine, totui, c baza de date se
actualizeaz pe hard disk numai dup salvarea comandat de utilizator. Ca urmare...

Orice modificare efectuat nu produce efecte dect asupra datelor din


memoria de lucru, fiierul rmnnd nemodificat.

n cazul unei aciuni care produce efecte nedorite asupra bazei de date,
exist soluia nchiderii bazei de date, fr a se accepta salvarea cerut de program,
dup care se deschide fiierul respectiv din nou.
Erori frecvente
- Apariia unor cazuri inutile, (umplute cu system missing values) la sfritul unei
baze de date.
Explicaie: Introducerea inutil a unei valori ntr-o variabil, valoare care apoi este
tears. Cu toate acestea, SPSS a creat deja un caz nou, pe care l-a umplut cu system
missing values.
Soluie: Selectarea cazului prin apsarea pe capul de linie i acionarea tastei Delete
(sau Edit-Cut).
- 14 -

Apariia unor variabile inutile (nedorite).


Explicaie: La introducerea din greeal a unei valori ntr-o variabil nedefinit n
prealabil, SPSS creeaz automat o variabil implicit, pe care o denumete VAR00001.
Soluie: Se selecteaz variabil resectiv (clic de mouse pe capul de coloan) i se
acioneaz tasta Delete (sau Edit-Cut).

Exemplu practic de realizare a unei baze de date


S ne imaginm c am aplicat testul Eysenck Personality Inventory, care vizeaz
urmtoarele caracteristici de personalitate: extraversiunea, nevrozismul i atitudinea
defensiv (scala Lie). Pentru analiza datelor suntem interesai s raprtm rezultatele la o
serie de caracteristic demografice ale subiecilor, s zicem: sexul i vrsta. n plus, pentru a
avea controlul datelor dorim s inregistrm i identitatea subiecilor.
Pentru fiecare dintre informaiile pe care dorim s le introducem n baza de date vom crea
cte o variabil.
Variabila
Numele
Tipul variabilei
Eticheta
Etichetele
variabilei
variabilei
valorilor
Identitatea
COD (optm
numeric, Width 2,
Identitate
Nu se aplic
subiecielor
pentru un cod
Decimal Places 0
etichete
(esentiala pentru numeric dac
(presupunem c nu
dect la
a asigura
nu avem
avem mai mult de 99
valorile
identitatea
nevoie de
subieci)
variabilelor
fiecarei
numele
de tip
inregistrari
subiecilor)
categorial
inparte si pentru
(nominale
realizarea
sau
corespondentelor
ordinale)
cu alte baze de
date in care avem
informatii cu
privire la aceiai
subieci)
Sexul
SEX
Numeric, Width 1,
Sex
1=feminin
Decimal Places 0
2=masculin
Vrsta (n ani
VIRSTA
Numeric, Width 2,
Vrsta
mplinii; sau n
Decimal Places 0
luni dac dorim
(presupunem c nu
mai mult
avem subeici cu
precizie)
vrsta peste 99 de ani)
Extraversiune
EXTRAV
Numeric, Width 2,
Extraversiune
Decimal Places 0
(nu se poate obine o
valoare mai mare de
100 i nu exist
zecimale)
Nevrozism
NEVRO
Numeric, Width 2,
Nevrozism

- 15 -

Lie

LIE

Decimal Places 0
(nu se poate obine o
valoare mai mare de
100 i nu exist
zecimale)
Numeric, Width 1,
Decimal Places 0
(nu se poate obine o
valoare mai mare de 9
i nu exist zecimale)

Minciun

Se observ faptul c pentru variabile ale cror nume exprim exact coninutul
(SEX, VRSTA) se poate utiliza fr nici un inconvenient numele i ca etichet. Pentru a
fi mai explicii, s spunem c numele variablei este util n primul rnd SPSS-ului pentru a
manipula variabilele, n timp ce etichetele sunt necesare mai ales utilizatorului pentru a
nelege cu uurin la ce se refer o variabil al crui nume prea scurt
Avem alturat, imaginea DATA EDITOR pentru primii trei subieci introdui cu
variabilele de mai sus:

Insistm pe declararea, cu precdere, a


variabilelor de tip numeric: SPSS este un program de prelucrare statistic, fapt care
implic date numerice. Dei el poate opera i cu date de tip caracter, acestea nu sunt
acceptate pentru toate tipurile de proceduri statistice. Pentru a nu avea surprize, este
recomandabil s fie utilizate variabile de tip numeric n toate cazurile. De exemplu,
variabila sex, poate fi declarat de tip caracter (cu valorile M si F) dar, la fel de bine, de
tip numeric (cu valorile convenionale 1 i, respectiv, 2). n acest din urma caz, pentru
explicitarea valorilor se vor folosi etichetele de valoare (value label).

Introducerea unei variabile care s conin


numele subiecilor poate fi necesar doar dac ne propunem realizarea unor liste ale
subiecilor din baza de date. Altfel, identificarea numeric a fiecrei nregistrri este
suficient (i absolut necesar), scutind un mare volum de munc pe care l-ar implica
introducerea numelor. Vom avea grij ns, ca pe documentul original s scriem codul

- 16 -

numeric aferent fiecrui subiect, astfel nct, la nevoie, s se poat identifica numele
(pentru corecii, de ex.)

Variabile multiple pentru ntrebri cu rspuns


multiplu: De obicei, o ntrebare prezint un singur rspuns, dar pot fi situaii n care o
ntrebare prezint rspunsuri multiple care pot fi alese n acelai timp. De exemplu: Ce
activiti preferai pentru timpul liber? 1. sport; 2. filme; 3. petreceri cu prieteni...,
etc. ntr-un asemenea caz ne putem atepta s avem mai multe rspunsuri la aceeai
ntrebare. Soluia pentru introducerea datelor este, de aceea, crearea mai multor
variabile, cte una pentru fiecare variant de rspuns. Astfel, vom avea variabila
SPORT care poate primi dou valori, sa zicem 1 dac este aleas i 0 dac nu
este aleas, i aa mai departe. n acest mod vom putea analiza frecvena alegerilor
pentru fiecare variant de rspuns n parte.

Evitarea variabilelor redundante: Dac la un test


nu sunt posibile, de exemplu, dect rspunsuri corecte sau greite, atunci nu este
necesar s declarm o variabil pentru corecte i una pentru greite dac suma lor
d totalul rspunsurilor.
Salvarea bazei de date din Data Editor
O baz de date aflat n lucru nu are un corespondent ntr-un fiier dect dup ce se
execut o salvare a acesteia. Acest lucru nu trebuie niciodat uitat. Spre deosebire de
WORD de exemplu, SPSS nu are o funcie de salvare automat dup un interval de timp
prestabilit. Cu alte cuvinte, indiferent ce modificri facem n Data Editor pe ecran, datele
respective vor fi salvate numai la comanda explicit a operatorului.
Pentru o baz de date nou creat, salvarea se face n mod similar cu orice alt
program cunoscut: File-Save as, care deschide urmtoarea caset de dialog:
Se alege locaia de salvare (Save in)
Se d un nume fiierului (File name)
Se verific tipul de fiier (formatul implicit pentru baze de date SPSS are extensia
.sav)
Se acioneaz Save

SPSS poate salva i n alte formate, dintre cele mai importante fiind: Dbase sau
FoxPro, Lotus 1-2-3, Excel. Salvarea n aceste formate poate fi util pentru
transferul datelor pentru prelucrri ulterioare n alte programe.

- 17 -

Deschiderea unei baze de date SPSS


O baz de date creat cu SPSS se deschide cu comanda File-Open, care activeaz
urmtoarea caset de dialog:
Se alege locaia de citire (Look in)
Se indic fiierul dorit (selectarea cu mouse-ul) n fereastra de cutare
Se indic tipul de fiier ce urmeaz a fi deschis (implicit este de tip SPSS
cu extensia .sav)
Se acioneaz Open

n cazul deschiderii unui fiier de alt tip dect SPSS, se va alege tipul respectiv
din lista Files of type. n cazul n care SPSS nu recunoate tipul de fiier n care
se afl datele noastre, putem ncerca transformarea lor prealabil din formatul
original ntr-un format recunoscut de SPSS. Dei exist riscul pierderii unor
aspecte ce in de formatul de reprezentare a datelor, operaiunea scutete totui
un mare volum de munc.

- 18 -

Operaii de transformare a variabilelor


Dac privim variabilele SPSS din punctul de vedere al modului n care au fost
create, putem distinge dou categorii:
b) variabile primare care includ valori rezultate direct din cercetare si au fost
introduse, de regul, de la tastatur.
c) variabile secundare rezultate prin transformrile aplicate variabilelor primare.
Exemple de situaii n care se impune transformarea variabilelor:
Avem mai multe variabile primare care conin rspunsurile la
ntrebrile unei scale de tip Lickert i suntem interesai s calculm
(ntr-o variabil secundar) suma rspunsurilor.
Avem un numr de variabile primare n care se afl rezultatul parial
pentru fiecare minut din cele 10 cte dureaz un test de calcul aritmetic
i dorim s crem o nou variabil ( secundar) n care s avem media
performanei pe cele 10 minute sau abaterea standard a performanei pe
cele 10 minute, pentru fiecare subiect,
Avem o variabil care conine data naterii i dorim s crem pe baza ei
o alt variabil, care s conin vrsta.
Dorim s transformm variabila care conine vrsta, ntr-o alt variabil
care conine valori pentru categorii de vrst.
Pentru toate aceste situaii, care sunt unele dintre cele mai des ntlnite, dar i
pentru multe altele nc, SPSS ofer proceduri de transformare n meniul Transform.
n continuare, vom prezenta cteva dintre cele mai frecvent utilizate funcii de
transformare a variabilelor.
nsumarea valorilor variabilelor
Se utilizeaz atunci cnd dorim s obinem o variabil prin adunarea valorilor din
dou sau mai multe variabile.
Imaginea de mai jos prezint o tabel de date SPSS care cuprinde scorurile la trei
examene pariale (scor_1, scor_2 si scor_3). Dorim s realizm o variabil care s cuprind
un scor general, prin nsumarea celor trei variabile. Se poate observa c unii dintre subieci
nu au valori la toate cele trei scoruri (valori lips de sistem).

- 19 -

Deoarece prin calculare, o nou variabil este plasat dup toate variabilele
existente, am preferat s inserm o nou variabil imediat dup cele trei pe care dorim s le
nsumm. n acest fel avem i posibilitatea s controlm uor corectitudinea operaiei de
nsumare
Se apeleaz procedura Transform-Compute, care deschide caseta de mai jos:

Se efectueaz urmtoarea succesiune de operaii:


1. Se introduce numele noii variabile n zona Target Variable (total).
2. Se scrie expresia de nsumare n zona Numeric Expression.
Funcia este SUM (expresie numeric, expresie numeric, ...), aa cum se
vede i n zona listei Functions: Ea poate fi scris de la tastatur sau
selectat din lista de funcii i ridicat prin acionarea butonului .
Atenie, sintaxa fiecrei funcii trebuie respectat ntocmai. n cazul nostru,
variabilele numerice se vor scrie ntre paranteze, una cte una, cu virgul
ntre ele. Variabilele pot fi scrise de la tastatur sau mutate la rndul lor din
lista de variabile cu butonul .
- 20 -

Dac variabilele ce vor fi nsumate se afl n baza de date una dup alta, ca
n cazul exemplului nostru, atunci avem posibilitatea s scriem o expresie
de nsumare simplificat, astfel SUM (prima_variabil TO
ultima_variabil). n acest caz, clauza TO va fi cuprins ntre spaii, pentru
a nu fi confundat cu un nume de variabil. Aceast opiune ne sugereaz
ct de important poate fi s aranjm corespunztor variabilele n structura
unei tabele SPSS.
3. Se apas butonul OK
4. Deoarece variabila total exist, SPSS ne ntreab dac dorim s modificm
coninutul acesteia. Dac nu ar exista o variabil cu acest nume, rezultatul operaiei
de calcul ar fi depus ntr-o variabil creat automat i amplasat dup ultima
variabil din baza de date.
Rspundem OK, deoarece tim c am
creat aceast variabil tocmai pentru a
depune n ea suma.

Rezultatul operaiei se vede n imaginea de


mai jos:

Calcularea mediei a dou sau mai multe variabile


Presupunnd c n loc de sum, ne-ar interesa media valorilor de la mai multe
variabile, se procedeaz n mod similar. Expresia de calcul a mediei este MEAN
(expresie_numeric, expresie_numeric, ...), unde ... arat c putem pune oricte variabile
(sau valori) numerice, cu virgul ntre ele. Ca i n cazul sumei, se poate realiza o expresie
cu clauza TO, cu condiia ca variabilele pentru care se realizeaz media s se afle una dup
alta n tabela SPSS.

- 21 -

Reamintim c funcia MEAN poate fi scris de la tastatur sau poate fi adus din
lista de funcii, prin selectare i acionarea butonului .
Este de la sine neles c expresia de calcul poate fi realizat i ntr-o manier
simpl i direct, fr utilizarea funciilor (SUM sau MEAN), astfel:
Pentru sum: scor_1+scor_2+scor_3
Pentru medie: (scor_1+scor_2+scor_3)/3
Se va face o distincie clar ntre suma sau media astfel obinute, care se refer la
suma sau media valorilor de la mai multe variabile, pentru acelai subiect, i suma
sau media pe care am calcula-o pe vertical, la nivelul fiecrei variabile n parte, pe
ntreaga distribuie
Se pot realiza diverse alte funcii de transformare, utilizndu-se marea varietate de
funcii care se gsesc n lista Functions i a cror semnificaie se poate afl din
Help-ul casetei Compute.
Extragerea anului dintr-o variabil de tip cronologic (date)
SPSS ofer funcii de transformare cu variabilele de tip cronologic. Dintre acestea,
vom exemplifica cu realizarea unei variabile care s conin anul naterii, s zicem, scos
dintr-o variabil care conine data naterii. Imaginea de mai jos este extras din baza de
date Employee data.sav

Observm c variabila bdate, care conine data naterii. Pentru a avea vrsta,
trebuie s calculm diferena dintre anul curent (s zicem, 2000) i anul naterii: Pentru

- 22 -

aceasta trebuie s facem diferena dintre anul curent (2000) i anul naterii, care se afl n
cmpul bdate.
Pentru a avea variabila ce urmeaz a fi creat n apropierea variabilei bdate, vom
insera o variabil (denumind-o virsta, de tip numeric, cu doi ntregi). Apoi utilizm
procedura Compute din meniul Transform:

n cmpul Target variable introducem numele noii variabile (virsta).


n zona Numeric Expression vom scrie expresia de transformare, care se bazeaz pe
funcia XDATE.YEAR().
Aceast funcie are ca rezultat extragerea valorii care reprezint anul dintr-o
variabil de tip dat calendaristic. n cazul nostru, XDATE.YEAR(bdate)=anul naterii
Ca urmare, putem scrie expresia astfel: 2000-XDATE.YEAR(bdate)
Mai jos putem vedea rezultatul procedurii Compute:

Se observ n variabil virsta, valorile rezultate prin transformare (corespunztoare


anului 2000).Desigur, transformarea putea fi efectuat i n dou etape. Mai nti prin
extragerea anului naterii ntr-o variabil separat i, apoi, prin efectuarea unei noi
transformri realizarea diferenei dintre anul curent i anul naterii. Am preferat o soluie
ntr-o singur etap pentru c este mai operativ.
Posibilitile de transformare a variabilelor oferite de SPSS permit crearea unor noi
variabile pe baza celor existente, n funcie de necesitile de prelucrare pe care le
avem. n toate cazurile, ns, nu se va alege soluia modificrii valorilor dintr-o

- 23 -

variabil primar peste valorile deja existente. Cu alte cuvinte, este recomandabil
s crem prin transformare variabile noi, i nu s modificm valorile existente din
variabilele primare a cror pierdere ar necesita reintroducerea lor, n caz de
necesitate.
Recodificarea variabilelor
Recodificarea unei variabile nseamn convertirea valorilor acesteia, cu scopul
obinerii unei distribuii bazat pe frecvene cumulate. Procesul este similar cu crearea unei
tabele de frecvene grupate i ne reamintim c poate fi derulat n maniera descris mai jos:
Pai pentru gruprii de frecvene:
Se face diferena dintre valoarea cea mai mare i valoarea cea mai mic a unei
distribuii
Se mparte valoarea obinut la mrimea posibil (estimat) a intervalului
Se selecteaz mrimea intervalului care conduce la un numr de clase cuprins ntre
5 i 15
Se determin limita inferioar a primului interval (trebuie s fie un multiplu al
mrimii intervalului)
Se determin limita superioar a primului interval
Se construiesc intervalele de clas pentru fiecare interval, fiind ateni s avem clase
suprapuse sau intervale neacoperite
n principiu, dei este recomandabil obinerea unei grupri de frecvene pe 5-15
clase, se poate opta pentru un numr de clase care servete cel mai bine interesul de
cercetare. De exemplu, n cazul unei distribuii de vrst exprimat n ani, este preferabil s
se opteze pentru clase cincinale sau decade, acestea avnd i o anumit semnificaie
psihologic.
n urma transformrii de mai sus, am obinut variabila virsta. Utilizarea ei ca atare
n analize statistice este improprie, de aceea ar fi foarte util obinerea unei variabile care s
asocieze anumite valori convenionale pentru categorii de virsta. Pentru aceasta putem
efectua recodificarea variabilei virsta pentru a obine o distribuie grupat de frecvene,
astfel:
Se lanseaz procedura Recode - Into Defferent Variables din meniul Transform:

Atenie, se poate alege i opiune Into Same Variables, dar nu este recomandabil
deoarece, n cazul unei erori, nu mai avem la dispoziie variabila iniial pentru o nou
recodificare.

- 24 -

Pai de efectuat la apariia casetei Recode into Defferent Variable:


se trece variabila virsta n zona Numeric Variable Output Variable. Semnul
ntrebrii arat c se ateapt numele variabilei ce urmeaz s fie creat prin
recodificare.
Acest nume se scrie n zona: Name, dup care se apas butonul Change.
Am ales, absolut convenional, ca nume al variabilei recodificate, v_clase.
Urmeaz acum s descriem limitele claselor de recodificare. Pentru aceasta, se
acioneaz butonul Old and New Values

Dei relativ complicat, caseta de declarare a noilor valori n funcie de cele vechi este uor de neles.

n zona Old value, se alege una dintre variantele de definire a valorilor de la care se
pleac. S zicem c am ales soluia s recodificm anii pe intervale de zece ani, primul interval
fiind 29-39, al doilea 40-49, .a.m.d.
Pentru aceasta activm opiunea Range i scriem valorile limite al intervalului dorit.
Dup aceasta, n zona New value oValue, scriem care este valoarea pe care o asignm
acestei clase.
n fine, acionm butonul Add pentru a definitiva operaiunea i trecem la definirea
urmtoarei clase, pn terminm.
n zona OldNew se poate observa lista recodificrilor definite.
Se acioneaz butonul Continue i, la revenirea n caseta anterioar, butonul OK.
Rezultatul operaiuni se vede mai jos:

- 25 -

Se observ corespondena dintre valoarea din variabila virsta, cu valoarea din


variabila v_clase. Pentru valoarea 71, avem missing value n variabila v_clase, deoarece nu
am definit un interval care s cuprind aceast vrst. (De regul, aceast situaie este
determinat de o eroare de definire a intervalelor de clas. Pentru a o repara, ar trebui s
intrm din nou n procedura Recode i s redefinim clasele).
relua.

Transformarea operat pe variabila vrst nu este de loc inutil. Dac am fi dorit s


vedem n ce msur este o relaie ntre nivelul salariului i vrst, ar fi fost oarecum
impropriu (fr a fi propriu-zis o greeal ) s utilizm o statistic parametric (corelaia).
n analizele statistice pe vrste este recomandabil, totui, s operm cu grupe de vrst.
Ordonarea dup rang a valorilor unei variabile
Aa cum am spus n cuprinsul primei pri a acestui volum, este posibil s
ne confruntm cu o variabil cantitativ ale crei valori nu respect condiiile unei statistici
parametrice (vezi figura din stnga, unde valoarea 250 este excesiv). ntr-o situaie de
acest gen, una din soluiile posibile este transformarea de rang, cu procedura TransformRank cases (caseta din dreapta):

- 26 -

Variabila vizat (scor) este trecut n lista Variable(s), se seteaz modul de


ordonare (am ales atribuirea rangului 1 valorii celei mai mari) iar apoi am acionat butonul
OK. Procedura permite fixarea unor parametri de transformare cu ajutorul butoanelor Rank
i Ties, asupra crora nu insistm aici.

Organizarea datelor pentru analiz


SPSS permite efectuarea unor operaii de organizare a datelor care prezint un
interes aparte pentru faza de analiz. Acestea sunt: sortarea, mprirea fiierului n
subgrupuri, selectarea unor seturi de date, combinarea fisierelor (adugarea de cazuri,
adugarea de variabile). Le vom trece n revist, pe rnd.
Sortarea bazei de date
Sortarea este operaia de aranjare a bazei de date n funcie de ordinea
cresctoare/descresctoare a valorilor unei variabile. Ea este util mai ales pentru
inspectarea direct a valorilor de la extrema unei distribuii sau pentru listarea ordonat a
bazei de date. Procedura utilizat este: Data-Sort.
Baza de date nesortat

Caseta Sort Cases

Imaginea din caset descrie sortarea bazei de date, cresctor (Ascending), dup
valorile variabilei scor (rezultatul se vede n imaginea de mai jos).

Se poate efectua sortarea simultan dup mai multe variabile, fiecare n sensul
dorit, de exemplu: grup(Ascending) i scor(Descending).
- 27 -

mprirea bazei de date n subgrupuri


Baza de date SPSS poate fi mprit n subgrupuri, pentru analiz distinct. Atunci
cnd datele sunt astfel organizate, orice procedur de analiz se va efectua distinct pentru
fiecare subgrup.
Procedura este: Data-Split File iar caseta de dialog este cea de mai jos:

Opiunile sunt:
Analyze all cases, do not create groups (pentru analiza integral a datelor)
Compare groups (rezultatele vor fi afiate astfel nct s poat fi uor comparate)
Organize output by groups (rezultatele vor fi afiate n Viewer, separat pe grupuri)

Operaia nu produce nici o modificare vizibil asupra bazei de date. Singurul efect
se vede n zona de afiare a rezultatelor, unde toate procedurile de analiz vor fi
afiate pentru fiecare subgrup n parte.
Pentru a se reveni la analiza intergral a datelor, se va reveni n procedura Split File
i se va seta opiunea Analyze all cases....
Selectarea unor seturi de date
Selectarea unui set de date permite aplicarea procedurilor de analiz numai pe
cazurile selectate. Dac nu se opteaz pentru tergerea datelor neselectate, ele vor fi
pstrate i vor putea fi reintroduse n analiz. Procedura este Data-Select Cases....
Pentru exemplificare, s ne propunem selectarea din baza de date din imaginea de
mai sus a cazurilor aparinnd grupului 1.
Imaginea prezint:
n partea stng, baza de date
La mijloc, caseta principal Select Cases care are:
o Zona listei de variabile
o Zona fixare a condiiilor de selectare Select, unde:

- 28 -

All cases este setarea implicit i nseamn c toate datele intr n


analiz
If condition is satisfied, se bifeaz atunci cnd se dorete declararea
unei condiii de selectare bazat pe o funcie
IF este butonul de deschidere a casetei pentru declararea condiiei,
care deschide caseta Select Cases: if. n cazul nostru, am trecut
variabila grup n zona de editare a functie i am declarat-o egal cu
1. Astfel, toate cazurile din baza de date care au grup=1 vor fi
analizate, celelalte fiind ignorate. Exemplul se bazeaz pe o selecie
simpl, dar sunt permise selecii bazate pe funcii mai complicate
sau care pot s includ combinaii de variabile.
Random sample of cases, permite selectarea unui set aleator de cayuri din
baya de date
Based on time por case range, permite selectarea cazurilor n funcie de
poziia din baza de date.
Use filter variable, selecteaz pe baza valorile unei variabile filtru
Unselected cases Are, permite opiunea de filtrare a cazurilor neselctate
(Filtered) sau de eliminare a lor (Deleted). n acest din urma caz, cazurile
neselectate vor fi terse, dar baza de date, dar actualizarea fiierului de pe
hard disk se va face numai dup prima comanda Save.

o
o
o
o

Dup finalizarea operaiei de selectare de mai sus, baza de date se prezint n felul
urmtor:

- 29 -

Se observ:
Marcarea cu o diagonal a capului de linie corespunztor cazurilor neselectate
Apariia unei variabile de sistem filter_$ care conine valoarea 0 pentru cazurile
neselectate i valoarea 1 pentru cazurile selectate. Aceast variabil poate fi ulterior
utilizat n procedurile de analiz, ca variabil independent (caz n care se va anula
situaia de selectare, prin bifarea opiunii All cases).

Selectarea este utilizat n mod obinuit, pentru alegerea temporar a unui set de
date. Adesea se uit anularea unei selectri existente, atunci cnd se dorete
revenirea al analiza tuturor cazurilor. Efectul este obinerea unor rezultate pe date
pariale.
Alte operaii de organizare a datelor pentru analiz
Opiunile SPSS pentru organizarea datelor sunt mult mai numeroase dect cele
descrise mai sus. Fr a le trata n amnunt, ne vom mulumi s le prezentm sumar:
Agregarea cazurilor, atunci cnd exist nregistrri multiple pentru fiecare subiect i
se dorete pstrarea uneia singure (Data-Agregate)
Adugarea unor cazuri din alt baz de date SPSS (Data-Merge Files-Add cases...)
Adugarea unor variabile din alt baz de date SPSS (Data-Merge Files-Add
variables...)
Inversarea liniilor cu coloanele (Data-Transpose...)

- 30 -

Calcularea indicatorilor statistici descriptivi


Reamintim faptul c statistica descriptiv are ca obiectiv analiza caracteristicilor
variabilelor. Principalele elemente de statistic descriptiv sunt:
reprezentarea ntregii distribuii, pe cale:
o numeric (analiza de frecvene)
o grafic (bar, histogram, box-plot, stem and leaf)
valorile tendinei centrale
o mod
o medie
o median
valorile mprtierii
o amplitudine
o abatere standard
valorile formei distribuiei
o
indice de simetrie (skewness)
o
indice de boltire (kurtosis)
SPSS ofer posibiliti variate de reprezentare i de calcul a acestor indicatori. n
acest sens exist, pe de o parte, proceduri specializate i, pe de alt parte, opiuni care pot fi
accesate din interiorul altor proceduri. Fie i acest aspect numai, ar trebui s sugereze c
analiza statistic descriptiv, n ciuda caracterului ei elementar, este o component
indispensabil a analizei statistice.
n ceea ce privete procedurile specializate, ele se lanseaz din meniul StatisticsSummarize (sau Analyze-Descriptive statistics, pentru versiunile mai noi de SPSS) i sunt
grupate n trei proceduri: Frequencies, Descriptives i Explore.
Aceste proceduri ofer prelucrri distincte dar conin i rezultate comune.
Alegerea uneia sau alteia dintre ele depinde de necesitile de analiz.

Procedura Frequencies
Este singura care permite analiza de frecvene.
La apariia casetei Frequencies, variabila pe care dorim s o supunem analizei va fi
trecut n lista de calcul Variable(s), prin selectarea ei i acionarea butonului de transfer
- 31 -

(). Pot fi incluse mai multe variabile n aceast list, rezultatele fiind afiate distinct,
pentru fiecare n parte.

Se va observa pe caseta de mai sus bifarea opiunii pentru tabela de frecvene, care
este funcia specific a acestei proceduri. n plus, prin acionarea butoanelor din partea de
jos a casetei se pot seta alte analize, astfel:
Butonul Statistics
Butonul Chart
Butonul Format
Se aleg indicatorii statistici Se alege tipul de Se aleg diverse moduri de
descriptivi dorii
grafic dorit
prezentare a rezultatelor

Rezultatele sunt afiate n SPSS Viewer n forma de mai jos (dar unele sub altele,
nu alturat, aa cum sunt aranjai aici):
Indicatorii statistici
descriptivi

Tabelul de frecvene

Histograma

Procedura Descriptives

- 32 -

Aceast procedur vizeaz doar indicatorii statistici descriptivi. La lansare,


Satistics-Descriptives, se deschide caseta principal Descriptives.
Se trec variabilele vizate n lista Variable(s)
(dac dorim calcularea scorurilor z, se
Se aleg indicatorii dorii din Options
bifeaz opiunea din stnga-jos a casetei )

Rezultatul analizei, din Viewer

Imaginea bazei de date, n care se vede


apariia variabilei zscor (denumit automat
de progarm) cu valorile transformate n
scoruri z.

Procedura Explore
Procedura Explore este cea mai complex dintre toate procedurile statisticii
descriptive i se poate utiliza atunci cnd se dorete o analiz exhaustiv a variabilei (sau
variabilelor).
Caseta principal Explore

n Dependent List se includ variabilele de analizat


n Factor List se includ eventualele variabile categoriale, n funcie de care se
dorete analiza variabilei analizate

- 33 -

Label cases by, permite etichetarea cazurilor la afiare (rar utilizat)


Display, permite alegerea opiunilor de afiare a rezultatelor numerice (Statistics),
grafice (Plots) sau ambele categorii (Both)
Butonul Statistics deschide caseta pentru alegerea unor indicatori (dar procedura
analizeaz, implicit toi indicatorii statistici descriptivi, de baz)
Butonul Plots, permite alegerea reprezentrilor grafice dorite:

Butonul Options, permite setarea modului de tratare a valorilor lips

Rezultatele analizei Explore, definit mai sus, se prezint astfel:


Indicatorii statistici

Reprezentarea stem-and-leaf

Reprezentarea Box plot

- 34 -

Teste parametrice
Testul z (t) pentru media unui singur eantion
Utilizare
Testul z pentru un singur eantion este utilizat pentru se testa diferena dintre media
unui eantion fa de media cunoscut a populaiei din care face parte. Atunci cnd
volumul eantionului este mic (N<30) este utilizat o variant denumit testul t pentru un
singur eantion.
Utilizarea acestui test statistic este condiionat de cunoaterea mediei populaiei.
Dac populaia are o extindere mare, acest lucru este dificil de realizat (n afara cazurilor n
care exist studii speciale, cum sunt cele antropometrice, de exemplu). Dintre variabilele
psihologice ale crei medii pentru populaie este cunoscut, este inteligena, exprimat n
uniti QI (=100). Testul poate fi utilizat, ns, atunci cnd populaia are o extindere mai
redus. De exemplu, dac a fost evaluat nivelul de satisfacie ntr-o organizaie, se poate
testa diferena dintre nivelul de satisfacie la nivelul unei secii fa de media satisfaciei la
nivelul ntregii organizaii (populaie).
Condiii de aplicare
Condiia teoretic de baz este normalitatea distribuiei de eantionare. n temeiul
teoremei limitei centrale, cu ct volumul eantionului este mai mare, cu att normalitatea
distribuiei de eantionare este mai sigur.
Aranjarea datelor
Datele supuse testrii trebuie s fie incluse ntr-o variabil SPSS de tip numeric.
Procedura: Statistics-Compare Means-One Sample T Test

Variabila
testat

Caseta principal
Variabila testat este trecut n lista
Test Variable(s)
n zona Test Value se nscrie media
populaiei (100 n cazul nostru)

Caseta Options permite alegerea


pragului de semnificaie.
Confidence Interval 95% este
echivalent cu p=0.05 i este
implicit pentru toate testele
statistice

Rezultate

- 35 -

Primul tabel include statistica descriptiv a variabilei testate (N, media, ab.std,
eroarea standard a mediei)
Al doilea tabel include rezultatele testului statistic: t=6.254, df=4, p=0.03, diferena
fa de media populaiei (22.6) i limitele inferioar (12.57) i superioar (32.63) ale
intervalului de ncredere pentru media populaiei estimat de eantionul de cercetare.
Concluzia testului: media eantionului de cercetare difer semnificativ de QI=100,
ca medie a populaiei.

- 36 -

Testul t pentru eantioane independente


Utilizare
Testul t pentru eantioane independente este utilizat pentru testarea diferenei dintre
mediile aceleiai variabile dependente msurate pe dou grupuri, formate din subieci
diferii. Exemplu: testarea diferenei dintre media scorului la o scal de sociabilitate
aplicat unor copii crescui n familie i unor copii crescui n instituii de ocrotire. n acest
caz, scorul la sociabilitate este variabila dependent, msurat pe scal cantitativ
(interval/raport) iar mediul de educare este variabila independent, exprimat pe scal
nominal dihotomic (familie/instituie de ocrotire)
Condiii
Teoretic, testul t poate fi utilizat pentru eantioane orict de mici, dac distribuia
de eantionare pentru cele dou grupuri este normal i dac variana valorilor n cele dou
grupuri nu difer semnificativ. n ce privete condiia egalitii varianei, ea este testat cu
un teste specifice. Unul dintre acestea este testul Levene, iar n funcie dac rezultatul su
programul calculeaz testul t pe dou ci, aa cum vom vedea mai jos.
Dac variabila dependent nu ntrunete condiiile pentru testul t, se poate apela la
teste neparametrice, astfel:
Testul z pentru proporii (compararea procentului de sociabili din cele dou
grupuri)
Testul Mann-Whitney U, dac se transform valorile variabilei sociabilitate
n valori de rang
Aranjarea datelor
Tabela de date SPSS va conine variabila dependent, de tip numeric, i variabila
independent, de tip nominal, cu dou valori, n funcie de apartenena la un grup sau altul.
Variabila independent poate fi de tip string (codificnd cele dou grupuri cu valori de
genul A i B) sau de tip numeric (cu codificarea convenional 1 i 2). Din principiu,
ns, recomandm cea de a doua variant.

Procedura: Statistics-Compare means-Indpendent Samples T Test

- 37 -

n caseta principal se trece variabila dependent (soc) n lista Test Variable(s) (pot
fi testate mai multe variabile simultan) iar variabila independent (grup), n zona Grouping
Variable. n acest moment, programul ataeaz variabilei dependente dou semne de
ntrebare, sugernd introducerea valorilor care definesc cele dou grupuri. Concomitent, se
activeaz butonul Define Groups a crui acionare deschide caseta secundar Define
Groups, unde se introduc valorile care definesc cele dou grupuri comparate (ordinea lor
nu este relevant). Dup acionarea butonului Continue, caseta principal devine complet
i se poate aciona OK pentru efectuarea testului.

Rezultate

- 38 -

n primul tabel (Group Statistics) avem statistica descriptiv a celor dou grupuri.
Se va observa c programul descrie grupurile prin intermediul etichetelor valorilor. Dac
acestea nu ar fi fost definite, n loc de institutie i familie ar fi aprut 1, respectiv, 2.
Al doilea tabel are dou linii:
Pe prima avem rezultatele testului t pentru cazul asumrii omogenitii varianei
(Levenes Test for Equality of Variances). n cazul nostru, ele sunt egale (Sig.=0.666, ceea
ce se traduce ca o valoare p=0.666, deci mai mare de 0.05 pentru distribuia F a testului
Levene, pe care nu o discutm aici). Ca urmare, vom citi pe aceast linie rezultatul testului:
t=-2.42, df=12, Sig.=0.045.
Pe a doua linie avem rezultatele testului t pentru cazul n care nu s-ar ntruni
condiia de omogenitate a varianei pentru cele dou grupuri. Dac semnificaia testului
Levene ar fi fost mai mic sau egal cu 0.05, rezultatului testului t s-ar fi citit pe aceast
linie.
Pentru exemplul nostru, rezultatul testului t permite acceptarea ipotezei cercetrii,
conform creia copiii crescui n mediu familial sunt mai sociabili (m=22.00) dect cei
crescui n mediu instituional (m=17.71).

- 39 -

Analiza de varian unifactorial (One Way ANOVA)


Utilizare
n mod obinuit, analiza de varian este utilizat pentru a testa semnificaia dintre
mediile msurate pe mai mult de dou grupuri independente (compuse din subieci diferii).
n acest caz valorile variabilei dependente sunt exprimate pe scal cantitativ (I/R) iar
valorile variabila independent este de tip categorial.
Dac se utilizeaz ANOVA pentru a testa diferena dintre dou medii obinute pe
grupuri independente, rezultatul ei este echivalent cu al testului t pentru grupuri
independente (menionm, ns, c aceast utilizare este neuzual).
Exemplu: Se compar media timpului de reacie pentru trei grupuri experimentale,
supuse fiecare, anterior evalurii vitezei de reacie, unui oc electric de intensitate mic,
medie sau mare. n acest caz s-ar putea obiecta c variabila independent se exprim
pe o scal ordinal dar, n esen, ea este de tip categorial, fapt ce justific aplicarea testului
ANOVA.
Condiii
Variabila dependent trebuie s fie de tip I/R i s respecte condiia de
normalitate a distribuiei de eantionare pentru fiecare dintre grupurile supuse
comparaiei. Din fericire, testul F este remarcabil de robust n cazul nclcrii
acestei condiii. ANOVA este mai vulnerabil n situaia cnd distribuia
variabilei dependente este prea aplatizat sau prea nalt (kurtosis0) dect n
cazul asimetriei (skewness0). Cu ct volumul grupurilor supuse comparaiei
este mai mare, cu att aspectele legate de normalitatea distribuiei au un efect
mai mic asupra ANOVA.
Variana valorilor variabilei dependente n interiorul grupurilor definite prin
valorile variabilei independente trebuie s fie egal. Aceast condiie se
numete omogenitatea varianei. nclcarea acestei condiii nu invalideaz testul
ANOVA, care este destul de robust i n acest caz. n orice caz, se vor analiza
cu atenie cazurile care prezint valori extreme, care au un efect important
asupra varianei. Egalitatea (omogenitatea varianei) poate fi testat cu testul
Levene.
Aranjarea datelor
Se construiete o variabil independent (definit ca factor n contextul ANOVA)
care conine codurile de apartenen a cazurilor la fiecare dintre grupurile supuse analizei
(n cazul nostru 1=oc mic, 2=oc mediu, 3=oc mare) i variabila dependent, care conine
valorile timpului de reacie.

- 40 -

Se va reine c procedura ANOVA nu suport variabila independent de tip


string. n imagine baza de date SPSS este ordonat dup variabila shoc dar acest lucru
nu este necesar pentru procedura de calcul.
Procedura: Statistics-Compare Means-One-Way ANOVA...
Caseta principal One-Way ANOVA:
Variabila dependent de trece n lista
Dependent List (pot fi testate mai multe
variabile simultan)
Variabila independent se trece n zona
Factor.

Caseta Post Hoc Multiple Comparison:


Se aleg testele de analiz post-hoc, pentru
testarea diferenei dintre medii luate dou
cte dou. Pentru c nu tim inc dac
variana este omogen, vom bifa cte un test
pentru fiecare caz (Bonferoni, pentru
varian neomogen i Tamhane T2, pentru
varian omogen).

n caseta Options, bifm Descriptives, Homogeneity-of-variance i Means Plot.

- 41 -

Dup finalizarea setrilor se apas OK pe caseta principal i se analizeaz


rezultatele.
Rezultate

Tabelul Descriptives prezint indicatorii descriptivi ai variabilei dependente pentru


grupurile analizate.

Tabelul Test of Homogeneity of Variance conine rezultatul testului Levene. O


valoare neseminificativ a acestuia (cum este cazul nostru p=0.988), conduce la concluzia
c dispersiile n interiorul celor trei grupuri sunt omogene).

Tabelul ANOVA conine rezultatului testului F a crui valoare este 35.264 pentru
un prag p=0.000. Atenie, p=0.000 nu se va nelege ca p=0 ci ca p<0.001. n raportul de
cercetare este chiar recomandabil s nu se utilizeze valoarea 0.000 care poate sugera
certitudinea rezultatului.

Tabelul Post Hoc Tests Multiple Comparisons prezint comparaiile mediilor


celor trei grupuri, luate dou cte dou. Reamintim c comparaiile repetate dintre mediile a
mai mult de dou grupuri conduc la acumularea de eroare de tip I. Testele post-hoc sunt

- 42 -

astfel n concepute nct s minimizeze acest neajuns. Totui, ele nu vor fi n nici un caz
luate n considerare dac testul F nu atinge pragul de semnificaie statistic (p<0.05).
Avnd n vedere c testul Levene a confirmat omogenitatea varianei, se vor citi
valorile pentru testul Bonferoni (n caz contrar, s-ar fi citit cele pentru testul Tamhane).
Valorile aunt uor de analizat: n prima coloana avem definite grupurile analizate
(etichetarea valorilor variabilei independente ajut mult la inteligibilitatea tabelului). n
coloana a patra (Sig.) se afl semnificaiile pentru diferena dintre medii. Astfel, putem
constata faptul c timpul de reacie dintre grupul supus ocului de mica intensitate i cel
supus ocului de medie intensitate nu difer semnificativ (p=0.520). n acelai timp, grupul
supus unui oc mic difer de grupul supus unui oc mare (p<0.001), la fel ca i n cazul
comparaiei dintre grupul cu oc mediu i cel cu oc mare (p<0.001).
Cu alte cuvinte, variaia semnificativ a timpului de reacie n funcie de cele trei
categorii de intensitate a ocului electric, provine cu precdere de la efectul pe care l are
ocul mare, care provoac o ncetinire a timpului de reacie consistent fa celelalte
dou categorii de oc electric.
Aceasta concluzie este ntrit i de reprezentarea grafic a mediei timpului de
reacie ale celor trei grupuri.

Aa cum se poate observa, timpul de reacie crete mai accentuat la grupul cu oc


mare n timp ce mediile primelor dou niveluri de oc sunt relativ apropiate.

- 43 -

Testul t pentru eantioane dependente (perechi)


Utilizare
Testul t al diferenei mediilor a dou eantioane dependente permite evaluarea
semnificaiei variaiei unei anumite caracteristici la aceeai indivizi n dou situaii diferite
(de exemplu, nainte i dup aciunea unei anumite condiii, ori n dou contexte
diferite, indiferent de momentul manifestrii acestora). Avantajul major al acestui model
statistic este acela c surprinde variaia numit intrasubiect, prin faptul c baza de calcul
este diferena dintre cele dou valori ale fiecrui subiect n parte.
Exemplu: Un grup de subieci efectueaz operaii aritmetice n condiii de linite i,
ulterior, n condiii de zgomot puternic. Ipoteza cercetrii este c zgomotul determin o
reducere a capacitii de calcul numeric.
Condiii
Condiia teoretic a testului este normalitatea distribuiei de eantionare a
distribuiei de diferene. Ca i n celelalte cazuri, teorema limitei centrale determin
normalizarea distribuiei de eantionare pe msur ce volumul eantionului crete.
n situaia n care condiia nu se ndeplinete, se pot utiliza teste neparametrice
echivalente: testul semnului (pentru date nominale) sau testul Wilcoxon (pentru date
ordinale).
Aranjarea datelor
Vor fi create dou variabile distincte, ambele cantitative, msurate pe scal de tip
I/R, care primesc cte o valoare pentru fiecare subiect.

- 44 -

Procedura: Statistics-Compare Means-Paired Sample T Test...


Se selecteaz cu un clic de mouse, pe rnd,
fiecare dintre cele dou variabile. Astfel se
constituie perechea de variabile n zona
Curent selection.

O dat constituit, perechea de variabile se


trece n lista Paired Variables cu butonul de
transfer (). Pot fi create mai multe perechi
de variabile i prelucrate simultan.

Caseta Options permite alegerea pragului de semnificaie (implicit 0.05).


Rezultate

Primul tabel conine statistica descriptiv pentru cele dou variabile.


Al doilea tabel conine testul de corelaie Pearson (r) dintre cele dou variabile.
Evaluarea intensitatea asocierii liniare dintre cele dou variabile este legitim n acest
context, dar ofer o informaie diferit de testul diferenei dintre medii. Alegerea testului de
corelaie sau al testului t se decide n funcie de obiectivul cercetrii.

- 45 -

n fine, ultimul tabel prezint rezultatul testului: t=5.076, df=9, p=0.001. Acesta
permite respingerea ipotezei de nul i acceptarea ipotezei cercetrii, zgomotul afecteaz
capacitatea de calcul aritmetic.
Coeficientul de corelaie liniar Pearson (r)
Utilizare
Corelaia Pearson (r) msoar gradul de asociere dintre variabile. Aceasta se refer
la gradul i sensul de variaie concomitent a valorilor unei variabile n raport cu cealalt,
dup un model de tip liniar.
Domeniul de variaie a coeficientului de corelaie Pearson (r) este ntre r=-1
(corelaie perfect negativ) i r=+1 (corelaie perfect pozitiv). Absena oricrei legaturi
(corelaii) dintre variabile se traduce prin r=0.
Exemplu: Testul de corelaie implic dou variabile dar, adesea, ntr-o cercetare
psihologic numrul variabilelor supuse corelaiei este mai mare de dou. Acest fapt
conduce la ceea ce se numete o matrice de corelaii care este un tabel ale cror celule
cuprind corelaiile dintre perechile de variabile. Pentru exemplificare, s lum n
considerare situaia n care se urmrete evidenierea legturii (asocierii) dintre anxietate i
agresivitate, pe de o parte, i preferina pentru risc pe de alt parte.
Condiii
Condiia principal pentru calcularea coeficientului de corelaie liniar Pearson este
ca variabilele implicate s fie msurate pe scal de interval/raport (alturi de existena unei
forme a distribuiei care nu se abate sever de la curba normal).
Testele neparametrice alternative, pentru cazul n care condiiile pentru utilizarea
testului Pearson nu se ndeplinesc, sunt: testul chi-ptrat (pentru date nominale) sau
coeficienii de corelaie Spearman sau Kendall (pentru date ordinale).
Aranjarea datelor
Se creeaz variabile distincte pentru fiecare caracteristic supus testrii.

Procedura: Statistics-Corelate-Bivariate
Variabilele supuse corelaiei vor fi trecute n lista Variables:
- 46 -

Testul implicit, din zona Correlation Coefficients, este Pearson, dar se poate bifa un
altul (Kendall sau Spearman), dac datele sunt neparametrice.
Tipul implicit de testare a ipotezei este bilateral (Two-tailed), dar se poate alege
unilateral (dac exist o justificare solid).
Flag significant correlations, determin marcarea cu un asterisc a coeficienilor
semnificativi la p=0.05 i cu dou asteriscuri a celor semnificativi la p=0.01. Acest lucru
este util atunci cnd matricea de corelaie este mare, pentru a scoate n eviden valorile
semnificative ale lui r.

Rezultate

Tabelul rezultatelor cuprinde matricea de corelaii a variabilelor analizate. El este


redundant, deoarece prezint aceleai corelaii de dou ori, odat deasupra diagonalei,
odat sub diagonal. Corelaiile variabilelor cu ele nsele sunt perfect pozitive (r=1) i nu
prezint, desigur, nici un interes.
Fiecare celul include urmtoarele informaii:
valoarea lui r
nivelul p
numrul de subieci (N)

- 47 -

n cazul nostru, consemnm corelaii negative dar nesemnificative ntre anxietate i


agresivitate (r=-0.38, p=0.26), pe de o parte, i ntre anxietate i preferina pentru risc, pe
de alt parte (r=-0.40, p=0.24). n acelai timp, se constat o corelaie semnificativ
(r=0.96, p<0.001) ntre agresivitate i preferina pentru risc. Precizm faptul c raportarea
coeficienilor de corelaie se face cu dou zecimale, chiar dac programele i calculeaz cu
trei zecimale.
Dezavantajul acestui tip de tabel const n faptul c avem de fapt o dubl prezentare
a corelaiilor, deasupra diagonalei i sub diagonal. Pentru corelaii implicnd multe
variabile tabelul se va cit cu relativ dificultate.
S presupunem c suntem interesai de corelaiile dintre anxietate i agresivitate cu
variabila preferin pentru risc, nu i de corelaia dintre anxietate i agresivitate. n acest
caz, n caseta principala, Bivariate Correlations, prezentat mai sus, variabilele vor fi
introduse astfel nct variabila preferina pentru risc sa fie ultima din list. Apoi se apas
butonul Paste, al crui efect este deschiderea domeniului Syntax, ca o fereastr distinct, n
care se afl sintaxa procedurii de corelaie. Acolo, pe linia /VARIABLES=anx agresiv risc,
se insereaz cuvntul WITH, avnd grij s existe spaiu att n sting ct i n dreapta sa.

inserai WITH

Mai departe, se selecteaz ntreaga procedur (cu ajutorul mouse-ului) i se apas


pe butonul Run () de pe bara de comenzi a ferestrei
Rezultatul din Viewer va arta ca mai jos:

Este evident c aceast modalitate se poate aplica pentru orict variabile, dac avem
grij s le aezm separat n list i s includem clauza WITH ntre cele dou categorii de
variabile. Nu pot fi incluse mai multe clauze WITH n aceeai procedur.

- 48 -

Ulterior, putem reveni n fereastra Syntax pentru a o nchide (cu File-Close),


salvnd sau nu procedura astfel modificat.
Expresia grafica a corelaiei (Scatterplot)
Caracterul i intensitatea corelaiei dintre dou variabile se evideniaz extrem de
sugestiv cu ajutorul unei proceduri grafice specifice, numit scatterplot.
Aceasta se lanseaz din meniul principal Graphs-Scatter... care deschide
urmtoarea caset de dialog:

n cazul nostru, s presupunem c dorim reprezentarea grafic a corelaiei dintre


agresivitate i preferina pentru risc, singura semnificativ. n acest scop, selectm pe
caseta Scatterplot opiunea Simple i apsm Define.

Trecem variabila Agresivitate pe axa Y i variabila Preferina pentru risc pe axa Z


(se poate la fel de bine i invers). Se apas OK i se obine graficul din imaginea
urmtoare, care sugereaz foarte clar existena unei asocieri de tip liniar ntre cele dou
variabile.

- 49 -

Reprezentarea grafic este surs de informaii cu privire la natura relaiei dintre


variabile, motiv pentru care este recomandabil utilizarea frecvent a acesteia. Mai mult, ea
este necesar n special atunci cnd valoarea corelaiei este redus, sau nesemnificativ,
deoarece graficul poate scoate n eviden o legtura de alt tip dect liniar.
O corelaie r=0.92, ca cea obinut mai sus, ntre agresivitate i preferin pentu
risc, este improbabil s se ntlneasc ntr-un studiu real. De fapt, dac s-ar
ntmpla s apar, ar trebui s concluzionm mai degrab c cele dou variabile
se confund, dect c sunt distincte.

- 50 -

Regresia liniar simpl


Utilizare
Analiza de regresie este o aplicaie a corelaiei, utilizat n scopuri de predicie.
Dac evalum agrsesivitatea ca trstur de personalitate i preferina pentru risc ca
expresie a numrului de incidente n trafic, la conductorii auto, se poate estima pe baza
agresivitii riscul de accident nc nainte de dobndirea carnetului de ofer. Acest tip de
regresie, n care exist o singur variabil predictor (agresivitatea) i o variabil criteriu
(tendina spre risc) se numete regresie liniar simpl. Mai frecvent utilizat este regresia
multipl, care efectueaz predicii bazate pe mai multe variabile predictor asupra unei
variabile criteriu. Vom prezenta mai jos regresia liniar simpl, ca o form de introducere
n analiza de regresie, mai uor de neles.
Exemplu: Predicia rezultatului statistic pe baza cunotinelor de matematic,
evaluate anterior nceperii cursului de statistic.
Condiii
Din punct de vedere statistic, condiiile variabilelor care sunt supuse analizei de
regresie sunt aceleai ca n cazul corelaiei, deoarece regresia liniar este o aplicaie a
acesteia.
Din punct de vedere metodologic, predicia presupune, de regul, evaluarea
variabilei predictor anterior variabilei criteriu. Acest fapt poate sugera o relaie de tip
cauzal ntre variabile, dar numai dac sunt ntrunite i alte condiii (cum ar fi izolarea
efectelor altor variabile).
Aranjarea datelor
Structura de variabile este similar analizei de corelaie.

- 51 -

Procedura: n principiu, analiza de regresie ncepe cu coeficientul de corelaie


dintre variabile i vizualizarea imaginii scatterplot. n cazul nostru, urmnd procedura
prezentat mai sus, am obinut o corelaie r=0.74 (p=0.002). Aceste valori confirm
existena unei legturi pozitive semnificative, ntre cunotinele de matematic i
performana la statistic. O idee mai exact ne ofer coeficientul de determinare r2=0,5476.
Acesta ne spune c 54% din variaia performanei la statistic este explicat de variaia
valorilor la variabila cunotine de matematic. Deducem c restul de 46% din
performana la statistic este explicat de alte variabile, necunoscute n aceast faz1.
Pe baza acestor concluzii se poate trece la analiza de regresie a crei finalitate este
aceea de obinere a coeficienilor a (termenul liber, sau originea dreptei de regresie) i b
(panta dreptei de regresie), cu ajutorul crora se poate estima n viitor performana la
statistic pe baza rezultatului la un test de cunotine matematice aplicat n prima zi de
coal. Nendoielnic, o astfel de procedur s-ar justifica mai ales pentru identificarea
studenilor cu poteniale dificulti i care, tocmai fiind avertizai n legtur cu aceste
dificulti vor putea s acorde statisticii o atenie sporit, n vederea obinerii unui rezultat
peste nivelul celui prezis.
Lansarea procedurii: Statistics-Regression-Linear...

n caseta principal Linear Regression, se trece variabila criteriu n zona Dependent


iar variabila criteriu n zona Independent(s).

n caseta Statistics, bifm Estimates pentru


obinerea coeficienilor de regresie (opiune
implicit)

n caseta Regression Save, bifm Predicted


Values-Unstandardized i ResidualsUnstandardized, care vor avea ca efect
crearea de variabile distincte n baza de date.
Prediction interval (individual) va calcula
limitele de ncredere pentru valorile prezise.

Facem precizarea c valorile i aprecierile nu se bazeaz pe un studiu reale.

- 52 -

Valorile prezise sunt valorile rezultate pe baza modelului de predicie.


Valorile reziduale se calculeaz ca diferen ntre valorile variabilei criteriu si
cele prezise pe baza modelului de regresie.
Analiza rezultatelor

Tabelul Model Summary ofer valoarea coeficientului de regresie, notat cu R, care


este identic cu coeficientul de corelaie dintre cele dou variabile. Dac modelul de regresie
ar fi avut mai multe variabile predictor, R ar fi fost coeficientul de corelaie multipl dintre
predictori i criteriu. Interpretarea este similar coeficientului de corelaie simpl, la fel ca
i pentru R2, care este coeficientul de determinare al lui R. Valoarea lui ne spune c 55%
din variaia performanei la statistic este explicat de variaia variabilei cunotine de
matematic. Adjusted R Square este o corecie a lui R2 n funcie de numrul de
predictori i numrul de subieci.

Tabelul Coefficients conine coeficienii B (nestandardizai) i coeficientul beta


(standardizat), care pot fi utilizai, la alegere, n ecuaia de predicie.
Astfel, de exemplu, dac un student realizeaz un scor de 30 la testul de cunotine de
matematic, se poate estima performan final la statistic cu ajutorul relaiei:

stat _ fin = a + b * mat _ in = 3.406 + 0.854 * 30 = 29.02

unde 3.406 este originea iar 0.854 este panta dreptei de regresie.

- 53 -

Sau, dac predicia se face pe baza unui scor standardizat z al variabilei mat_in (s zicem,
0.93), atunci:

stat _ fin = beta * mat _ in = 0.742 * 0.93 = 0.69

n acest caz termenul liber are valoarea 0, deoarece originea dreptei pentru scoruri
standardizate se afl n 0.
Desigur, scorurile astfel prezise sunt estimri, atta timp ct corelaia dintre variabile nu
este perfect. Iar estimrile conin cu att mai mult eroare cu ct corelaia dintre variabile este
mai mic (punctele graficului de corelaie fiind mai ndeprtate de dreapta de regresie).
La finalul procedurii analizei de regresie, cu setrile de mai sus, n baza de date apar
cteva variabile noi, aa cum se vede n imaginea de mai jos.

Variabila pre_1, conine valorile prezise pe baza modelului de regresie.

Variabila res_1, conine diferena dintre valoarea real i valoarea prezis


Variabilele lici_1 i lici_2, conin limitele inferioar i superioar ale intervalului de
ncredere pentru fiecare valoare n parte. Pentru a nelege mai bine problema limitelor, s
privim prima valoare prezis de pe coloana pre_1 (25.598). Cu un nivel de ncredere de
95% (echivalent cu o probabilitate de eroare de 0.05), putem spune c valoarea adevrat
pentru stat_fin prezis pe baza valorii mat_in=26, s-ar afla n intervalul 21.77 i 29.41.
n fine, rezultatele conin i imaginea scatterplot a relaiei dintre valorile mat_in i
scorurile z ale variabilei pre_1.

- 54 -

Imaginea este identic cu ceea ce am prezentat n cazul corelaiei. Singura


deosebire este dat de trasarea dreptei. Aceasta se face de ctre operator, n felul urmtor:
- se acioneaz dublu clic de mouse pe imaginea graficului din Viewer. prin care...
- graficul este trecut deschis ntr-o fereastr individual de editare, n care...
- se execut procedura Chart-Options-Fit Line- Fit Options. La captul acestei serii
de aciuni apare caseta de mai jos unde se marcheaz Linear regression.

Facem precizarea c acest procedeu de trasare a liniei n interiorul scatterplotului


este utilizabil i n cazul corelaiei. Dac se alege alt model dect cel liniar (de exemplu,
Quadratic regression) se va obine linia de regresie sub form curbilinie, punnd n
eviden abaterile de la modelul liniar. Acest lucru este cu deosebire util atunci cnd
corelaia este mic, fapt care se poate datora faptului c relaia dintre variabile nu urmeaz
un model liniar (vezi exemplul din prima seciune a manualului, bazat pe corelaia dintre
scorurile z i probabilitile de sub curba normal).
Ce utilizm, corelaia sau regresia?
Corelaia i regresia liniar sunt similare i, de aceea, uor de confundat. n unele
situaii pot fi utilizate ambele proceduri.

- 55 -

Se calculeaz corelaia liniar:


atunci cnd exist dou variabile msurate pe aceiai subieci i se dorete
evaluarea gradului de asociere ntre variabile
atunci cnd distribuiile de eantionare ale celor dou variabile sunt normale (atunci
cnd cel puin una dintre variabile este manipulat, nu se calculeaz corelaia
Pearson)
Se calculeaz regresia liniar:
atunci cnd una dintre variabile precede i poate fi cauza celeilalte variabile
atunci cnd una dintre variabile este manipulat, se calculeaz regresia
atenie, calculele regresiei nu sunt simetrice, ca urmare, inversnd variabilele n
ecuaia de regresie se va obine o linie de regresie diferit, n timp ce dac se
inverseaz ordinea variabilelor n calcularea corelaiei, se obine acelai coeficient
r.

- 56 -

Analiza de consisten intern (Cronbach alfa)


Utilizare
Una din condiiile fundamentale a unui instrument de evaluare psihologic este
aceea de a fi sigur i consistent. Exprimat cu alte cuvinte, aceasta nseamn ca itemii din
care este constituit (ntrebri sau sarcini de alt natur) s contribuie la constituirea
semnificaiei unui construct psihic anume: scala unui chestionar, scorul la o caracteristic
psihic de performan, etc. n mod practic i direct exprimat, un instrument este sigur i
consistent atunci cnd itemii din care este compus coreleaz, att ntre ei ct i fiecare
dintre ei cu rezultatul aditiv al tuturor itemilor (scala, scorul global).
Analiza de consisten intern, prin calcularea coeficientului Cronbach alfa, este
metoda statistic prin care se verific respectarea exigenelor enunate mai sus. n esena ea
este o aplicaie a corelaiei, ceea ce reprezint unul din motivele pentru care o tratm aici.
Al doilea motiv, poate nc i mai important, este acela c nc din primii ani de studiu
studenii la psihologie se afl n situaia de a utiliza instrumente psihologice sau de a le crea
ei nii (cel mai adesea chestionare). n acest scop, evaluarea consistenei interne este o
etap absolut obligatorie n elaborarea i finalizarea respectivului instrument.
ntrebrile unui chestionar sau itemii unui test de performan sunt concepui pentru
a msura un anumit atribut (atitudine, factor, comportament, cunotin). Consistena
intern se definete ca proprietatea itemilor de a corela cu scorul global al testului sau
scalei din care fac parte. Din moment ce toi itemii trebuie sa reflecte un anumit atribut, ei
trebuie s manifeste o varian comun, s coreleze unii cu alii i, n acelai timp, s
coreleze fiecare cu scorul care reflect atributul respectiv. Corelaia dintre un item i scorul
total, din care se omite acel item, ne ofer o indicaie cu privire la relevana itemului
respectiv pentru rezultatul global al testului. Atunci cnd fiecare item este relevant, putem
spune c testul respectiv este are consisten intern.
O alt faet a consistenei unui instrument este sigurana sa n aplicri repetate. Ea
poate fi descris ca stabilitate a scorului atunci cnd acel instrument, sau o form
alternativ echivalent, este aplicat acelorai subieci.
Fr a fi singura procedur statistic utilizabil n astfel de situaii, coeficientul
Cronbach alfa este de departe cel mai cunoscut dintre toate, fiind utilizat ca un indicator al
preciziei de msurare a unui test, al consistenei interne i fidelitii unui instrument
psihologic. n mod normal, valoarea indicelui Cronbach alfa tinde s creasc pe msur ce
numrul itemilor crete. Dar utilizarea unor teste cu muli itemi este neconvenabil din mai
multe motive. Unul dintre acestea este timpul consumat cu aplicarea lor, altul, poate fi
inutilitatea de a pstra itemi a cror contribuie la scorul global este nul, mic sau,
dimpotriv, merge n alt direcie dect acesta. Identificarea i eliminarea acestor itemi, ori
modificarea lor n spiritul atributului msurat, este unul dintre obiectivele analizei de itemi.
Ea are un caracter recursiv, cu evaluri succesive ale relaiilor dintre itemi i dintre itemi i
scorul global, i operarea seleciei itemilor n funcie de relaia lor cu acesta. Criteriul de
baz pentru aceast operaie este valoarea indicelui Cronbach alfa, care are o plaj de
variaie ntre 0 i 1. O scal, pentru a fi considerat consistent, trebuie s ating o valoare
ct mai aproape de 1, nivelul de 0.70 fiind acceptat de majoritatea cercettorilor ca prag
limit de validare a criteriului de consisten intern. Oricum, valoarea lui Cronbach alfa
nu poate fi mai mic de 0.60.

- 57 -

Coeficientul de consisten intern Cronbach alfa se calculeaz n urmtoarele


situaii:
atunci cnd realizm un instrument nou
atunci cnd se traduce un instrument vechi ntr-o alt limb
atunci cnd un instrument utilizat n anumite condiii, urmeaz a fi utilizat n cu
totul alte condiii (de exemplu, trecerea la utilizarea computerizat a unui test
aplicat pn atunci n regim creion hrtie).
Condiii
Crearea unor variabile distincte care conin rspunsurile la fiecare item (ntrebare).
Valorile nregistrate pentru rspunsuri vor fi valorizate n funcie de semnificaia lor
n raport cu rezultatul global (scala). Cu alte cuvinte, variabilele trebuie s conin valori
care exprim semnificaia rspunsului n raport cu scala global, i nu rspunsul efectiv al
subiectului. De exemplu, dac variantele de rspuns sunt codificate cu 1, respectiv 2, pot
exista ntrebri pentru care varianta 1 aduce un punct la scala iar varianta 2 aduce zero
puncte la scal. ntr-o asemenea situaie, pentru analiza de itemi valorile codificate de
rspuns vor fi transformate n valori corespunztoare (0 i 1). n acelai mod se va opera i
pentru itemii care au mai multe variante de rspuns, cum este cazul scalelor de tip Likert.
Codurile convenionale ale variantelor de rspuns vor fi transformate n valori, n funcie
de semnificaia contribuiei lor la construirea scorului global.
Aranjarea datelor
Baza de date va conine variabile pentru fiecare dintre itemii supui analizei
(aceasta nu nseamn c nu pot exista i alte variabile, desigur).

Imaginea red rezultatele primilor opt subieci la o scal cu 10 itemi, de tip Lickert,
pentru evaluarea atitudinii fa statistic. Toate prelucrrile care urmeaz sunt efectuate pe
datele complete.
Procedura: Statistics-Scale-Reliability Analysis...

- 58 -

n caseta principal, Reliability Analysis, variabilele itemilor vor fi trecui n lista


Items (imaginea surprinde momentul n care mai sunt de trecut itemii de la 6 la 10).
n lista Model se poate alege unul dintre urmtoarele modele de analiz:
Alfa. Calculeaz Cronbach alfa care pentru date dihotomice este echivalent cu
coeficientul Kuder-Richardson 20 (KR20)
Split-half. Pentru corelaia dintre forme paralele, coeficientul de fidelitate Guttman,
coeficientul Spearman-Brown, coeficientul alfa pentru fiecare jumtate.
Modele Gutman. Coeficienii lambda, de la 1 la 6
Modele paralele i strict paralele. Testele pentru gradul de coresponden
(goodness-of-fit), variana comun, i alte caracteristici ale raporturilor dintre itemi.
Pentru analiza de consisten intern se alege modelul Alfa.
n continuare, se fac setri de analiz prin deschiderea casetei Statistics:

n zona Descriptives se vor bifa opiunile:


Item (analiza fiecrui item separat);
Scale (analiza scorului global)
Scale if item deleted (analiza scorului fr contribuia unui anumit item)
n zona Inter-item se va bifa Corelations, pentru a obine matricea de corelaii
dintre itemi.
n zona Summaries se poate cere calcularea unor indicatori descriptivi pentru
fiecare dintre itemii analizai (media, variana, covariana, corelaii).
n practic, bifarea opiunilor marcate pe caseta din imaginea de mai sus ofer
informaiile cele mai importante pentru analiza itemilor unui test. Celelalte opiuni sunt
explicitate n Help-ul casetei i pot fi utilizate pentru o analiz mai rafinat a datelor.
- 59 -

Rezultate
n continuare vor fi analizai un cei 10 itemi ipotetici, alei doar n scop didactic.
Pentru o scal real acest numr ar fi cu totul insuficient. Ca regul general, numrul
itemilor din faza de dezvoltare a unui astfel de instrument ar trebui s aib cel puin dublul
numrului de itemi pe care l preconizm la final. i aceast pentru c analiza de itemi este
un proces selectiv care are drept scop alegerea itemilor adecvai pentru constituirea unei
scale cu cel mai ridicat nivel de consisten intern posibil.
Rularea procedurii, cu setrile de mai sus ne ofer urmtoarele categorii de
informaii:

Tabelul de mai sus cuprinde lista itemilor, media abaterea standard i numrul
cazurilor. . Analiza valorilor permite evidenierea tendinei centrale i a mprtierii
rspunsurilor pentru fiecare item. Eventuale anomalii pot fi sesizate nc din aceast faz.
De exemplu, se poate constata c media itemului I_02 este mai mic dect a celorlali, fapt
care sugereaz rspunsuri grupate spre valorile mici.

Tabelul Correlation Matrix ofer o imagine a gradului de asociere dintre itemi.


Valorile sunt utile, pe de o parte, pentru a sesiza itemii care tind s aib relaii negative cu
ceilali, fiind un semn al unei posibile probleme de construire respectivilor itemi. Din
tabelul alturat rezult c itemii i_02 i i_03 tind s se asocieze negativ cu majoritatea
celorlali itemi. Pe de alt parte, valori extrem de ridicate ale unor corelaii, aproape de 1,
ar putea sugera c itemii respectivi prezint un grad de similitudine care nu justific

- 60 -

utilizarea lor n aceeai scal (ar putea fi, de exemplu itemi formulai extrem de
asemntor).

Tabelul urmtor conine un set de indicatori statistici descriptivi la nivelul ntregii


scale, rezultat prin nsumarea rspunsurilor la fiecare item (medie, varian, ab.std, ) sau al
itemilor.

n fine, cea mai important dintre categoriile de informaii, este tabelul Item-total
Statistics, care include relaiile dintre itemi i scorul global. Dou dintre coloanele alturate
au o importan particular: Corected Item-Total Correlation (corelaia dintre fiecare item
i scorul global) i Alpha if Item Deleted (valoarea lui Cronbach alfa, dac respectivul item
ar fi eliminat).
Dac privim prima dintre aceste dou coloane, observm c doi dintre itemi (i_03 i
i_09) au corelaii negative cu scorul global. Aceasta nseamn c ei nu numai c nu aduc
informaie util n raport cu atributul msurat ci, dimpotriv, merg ntr-o direcie opus
acestuia. n acest caz trebuie s verificm dac valorile itemului respectiv au fost corect
codificate. Dac da, atunci singura soluie posibil este eliminarea itemilor n cauz.
Observm, de asemenea, c itemul i_02 are o corelaie extrem de mic cu scorul global
(0.015). Contribuia sa la construcia scalei este extrem de mic, nesemnificativ. Cu alte
cuvinte, nici nu stric dar nici nu ajut, n schimb, consum timpul subiectului pentru a
rspunde.

- 61 -

Pe ultima linie a imaginii gsim valoare lui Cronbach alfa, care este 0.457, o
valoare care este modest n raport cu nivelul minim necesar (0.702) dar care poate fi
crescut prin eliminarea itemilor nepotrivii, n primul rnd a celor care coreleaz negativ
cu scorul global.
Urmtoarea faz este reluarea prelucrrii, cu eliminarea itemilor negativi din lista
Items din caseta principal. n general, nu este recomandabil eliminarea mai multor itemi
simultan, dar itemii negativi pot fi scoi toi odat, fr reineri. Iat care este rezultatul
eliminrii itemilor 3 i 9 asupra consistenei interne:

Ca urmare a noii iteraii, se observ c itemul i_02, care anterior avea o corelaie
pozitiv dar extrem de mic, a dobndit o corelaie negativ cu scala. Ca urmare, va fi
eliminat. n orice caz, chiar i itemii pozitivi, care au corelaii cu scala mai mici de 0.1 nu
trebuie pstrai, pentru simplul motiv c nu contribuie la constructul psihologic vizat, fiind
doar consumatoare de timp n aplicarea instrumentului. De altfel, se i observ c prin
eliminarea acestui singur item, valoarea lui Cronbach alfa crete la 0.75.
Se reia prelucrarea eliminndu-se itemul i_02 din lista din caseta principal i se
obine urmtoarea configuraie de rezultate:

Datele indic o valoarea Cronbach alfa de 0.75. n plus, dac privim ultima coloan
de cifre, vedem c prin eliminarea oricrui item nu am obine o valoare mai ridicat dect

Dei programele computerizate l calculeaz cu un numr mai mare de zecimale, indicele Cronbach alfa se
raporteaz doar cu dou zecimale.

- 62 -

aceasta. Ca urmare, itemii rmai pot constitui o scal consistent de evaluare a


constructului psihologic pentru care au fost alei.
n concluzie, cu ocazia iteraiilor succesive se vor elimina, in ordine:
itemii care au o corelaie negativ cu scorul global
itemii cu corelaii mici, nerelevante
Cu ct avem mai muli itemi n aceast faz, cu att avem posibilitatea s pstrm
itemi care coreleaz mai intens cu scala i, deci, s atingem un nivel mai ridicat de
consisten intern. Este de la sine neles c, n cazul n care construim un instrument ale
crui ntrebri se adreseaz unor sub-scale diferite, consistena intern se va evalua separat
pentru setul de ntrebri corespunztor fiecrei sub-scale.
O scal consistent intern ne ofer garania c itemii instrumentului nostru merg
mpreun, msoar acelai construct psihologic. Atenie, ns, acest lucru nu ne permite
nc s afirmm c msoar exact ceea ce n-am propus s msoare. Aceast problem va fi
rezolvat ulterior, prin studii de validare.
Aa cum concluziile studiilor statistice sunt mai sigure atunci cnd sunt efectuate pe
eantioane mai mari, acelai principiu se aplic i n cazul construciilor scalelor: cu ct mai
muli itemi cu att mai bine pentru consistena scalei.
Numrul itemilor necesari pentru a completa o scal care nu a atins valoarea
acceptabil a indicelui Cronbach alfa poate fi estimat cu ajutorul formulei SpearmanBrown:
k=

k * (1 x )
x * (1 k )

unde:
x este valoarea curent a lui Cronbach alfa
k este nivelul dorit al lui Cronbach alfa
k este factorul de multiplicare a scalei pentru a se obine k
ntr-un mod similar, se poate estima valoarea lui Cronbach alfa (k) care ar fi atins
pornind de la un anumit nivel calculat al acestuia x i un anumit factor de multiplicare al
numrului de itemi (k):

k =

k * x
1 + (( k 1) * x )

Exemplu:
Avem o scal cu 20 de itemi i x=0.50
Ci itemi ar trebui adugai pentru a atinge un nivel de 0.70?
k=

k * (1 x ) .70 * (1 .50)
=
= 2.33
x * (1 k ) .50 * (1 .70)

Deci, pentru a atinge un de 0.70 va trebui s avem o scal de 20*2.3347 itemi,


ceea ce nseamn c ne vor mai trebui 27 de itemi pe lng cei 20 deja existeni (estimare

- 63 -

valabil pentru situaia n care noii itemi ar avea aceeai corelaie inter-itemi cu cei deja
existeni).
Pentru acelai caz, cu ct ar crete dac am aduga 30 de itemi:
k=(nr. itemi iniiali+nr. itemi noi)/nr. itemi noi=(20+30)/20=2.5

k =

k * x
2.5 * .50
=
= 0.71
1 + (( k 1) * x ) 1 + ((2.5 1) * .50)

Desigur, se presupune c noii itemi adugai vor fi la fel de buni ca i cei deja
utilizai. De aceea este posibil ca rezultatul formulei s fie o estimare uor optimist dar nu
mai puin util.
Utilizarea improprie a analizei de itemi
Atunci cnd o scal este utilizat pentru a msura cunotine asupra unui anumit
subiect, pentru alt scop dect cel de selecie sau evaluare comparativ ntre indivizi,
utilizarea indicelui Cronbach alfa nu este adecvat. O valoare redus a acestuia nu poate
nsemna c itemii nu msoar un anumit tip consistent de cunotine (fapt incontestabil din
moment ce fac parte dintr-un univers de cunoatere bine definit) ci mai degrab c subiecii
au rspuns la ntmplare. Mai departe, n cazul n care rspunsurile la o anumit ntrebare
sunt corecte pentru cea mai mare parte a subiecilor, sau pentru toi, dei am fi tentai s
apreciem acest fapt ca o expresie pozitiv a corelaiei itemului cu scorul global, avem de
a face mai degrab cu un item prea uor, care nu este suficient de discriminativ pentru a fi
pstrat.
Chiar i n acest tip de situaii, totui, analiza de itemi poate fi folositoare ca
modalitate de identificare a itemilor greit formulai, a celor nerelevani sau, pur i simplu,
pentru a scoate n eviden erorile tipice pe care le fac subiecii la anumite ntrebri.

- 64 -

Teste neparametrice nominale


Testul z al proporiei pentru un singur eantion
Utilizare
Testul z pentru proporii pentru un eantion, este utilizat n cazul variabilelor
dihotomice pentru a testa diferena dintre proporiile valorilor n eantion prin comparaie
cu proporia la nivelul populaiei.
Exemplu: La ntrebarea cine se uit la telenovele? rspund DA 7 subieci, dintre
care 5 femei i 2 brbai. ntrebarea cercetrii este dac femeile se uit ntr-o proporie mai
mare dect brbaii la telenovele.
Condiii
Cunoaterea proporiei la nivelul populaiei pentru valorile variabilei testate. n
cazul nostru, raportul femei/brbai este cunoscut din studiile demografice (51%/49%)
Aranjarea datelor
Se creeaz variabila dihotomic cu valori numerice. Variabilele de tip string nu
sunt acceptate de procedura SPSS. n cazul nostru, valorile sunt 1 pentru feminin i 2
pentru masculin.

Procedura: Statistics-Non Patametric Tests-Binomial...

Variabila testat este trecut n lista Test Variable List:

- 65 -

n zona Define Dichotomy se alege Get from data, dac variabila este
dihotomic, sau Cut point, dac variabila este continu, prin fixarea unei
valori care mparte distribuia n dou categorii.
n zona Test proportion se introduce proporia primei categorii.
Butonul Options permite solicitarea statisticii descriptive pentru variabila
testat.

Rezultate

Rezultatul n cazul exemplului dat cuprinde frecvena pe categorii, procentul i


semnificaia testului n raport cu proporia la nivelul populaiei (p=0.243). n acest caz, se
accept ipoteza de nul i se respinge ipoteza cercetrii. Proporia femeilor care se uit la
telenovele nu difer semnificativ de proporia brbailor, prin raportare la proporia lor n
populaie.

- 66 -

Testul semnelor
Utilizare
Testul semnelor este utilizat pentru a testa diferena dintre valori, utilizndu-se
semnul diferenei i nu valoarea acesteia, atunci cnd ambele valori sunt msurate pentru
aceiai subieci . Dac nu ar exista nici o diferen ntre valorile perechi, atunci numrul
diferenelor pozitive ar trebui s fie egal cu cel al diferenelor negative. Cu ct numrul
diferenelor de un anumit semn este mai mare comparativ cu cel al diferenelor de semn
opus, cu att crete posibilitatea ca diferena dintre variabile s fie statistic semnificativ.
Exemplu: ntr-un experiment cu privire la efectul motivrii asupra memorrii,
subiecilor li se cere s memoreze cuvinte dintr-o list, nainte si dup introducerea unui
factor motivant. Dat fiind faptul c numrul subiecilor este prea mic pentru asumarea
normalitii distribuiei de eantionare, se alege testul semnului, n locul testului t pentru
eantioane dependente.
Condiii
Variabilele vor fi de tip numeric, iar valorile exprimate n aceeai unitate de
msur, pentru a se putea face diferena lor.
Aranjarea datelor
Imaginea de mai jos conine variabilele inainte i dupa, care vor fi analizate.

Variabila dif conine rezultatul diferenei dupa-inainte.


Variabila semn, conine semnul diferenei. Ambele sunt prezentate numai pentru
a face mai evident baza de calcul a testului deoarece, n fapt, nu sunt relevante sub aspectul
procedurii SPSS.
2. Dac nu se dispune de valorile variabilelor ci numai de semnul diferenei,
testul semnului va fi calculat manual, pe baza formulei 4.7.
Procedura: Statisstics-Nonparametric Tests-2 Related Samples...
n prima faz, cele dou variabile sunt
selectate, pe rnd, prin clic de mouse pe
fiecare, constituindu-se n pereche. Acest
fapt se observ n partea de jos a casetei, n

Apoi, perechea de variabile este trecut n


lista Test Pair(s) List: prin acionarea
butonului .
Dac este necesar, se pot testa simultan mai
- 67 -

zona Current Selections.


Se bifeaz Sign n zona Test Type.

multe perechi de variabile.

Rezultate

Tabelul Sign Test cuprinde numrul diferenelor pozitive, respectiv negative, pentru
cazurile din baza de date. n cazul nostru, exist 7 diferene pozitive i nici o diferen
negativ.

Tabelul Test Statistics, prezint semnificaia testului (p=0.016). Ipoteza de nul se


respinge dac valoarea lui p este mai mic dect pragul fixat i care, implicit, este 0.05. n
exemplul dat, ipoteza de nul se respinge, acceptndu-se ipoteza cercetrii (motivarea
stimuleaz memorarea).

- 68 -

Testul Chi-ptrat al asocierii (independeei)


Utilizare
Testul chi-ptrat este utilizat pentru evidenierea gradului de asociere ntre dou
variabile categoriale.
Exemplu: S presupunem c am evaluat numrul femeilor i al brbailor
diagnosticai cu sindrom de stres postraumatic (PTSD) dintr-un mic ora, afectat de un
cutremur de pmnt, iar datele sunt cele din urmtorul tabel de coresponden:
PTSD
Non-PTSD

Femei
20
30

Brbai
10
40

Problema cercetrii este dac incidena PTSD este n legtur cu caracteristica de


sex.
Condiii
Cele dou variabile nu trebuie s se intersecteze (s nu existe subieci care s

fie inclui n mai mult de o celul de tabel).


Este recomandabil ca frecvena ateptat s nu ia valori mai mici de 5 (sau, cel
puin, n nu mai mult de 20% din celule).
Nici o celul nu trebuie s aib frecvena ateptat 0..

Aranjarea datelor
Datele pot fi incluse n Data Editor n dou moduri:
a. Sub forma unor nregistrri distincte pentru fiecare caz

Acest mod poate fi extrem de dezavantajos atunci cnd sunt multe cazuri sau cnd
exist deja o statistic global a fenomenului PTSD n raport cu sexul.
b. Sub forma unor nregistrri distincte pentru valorile caracteristicii de sex:

- 69 -

n aceast situaie, se introduc frecvenele PTSD pentru toate combinaiile valorilor


celor dou variabile analizate i frecvenele asociate fiecreia. Pentru a se realiza
corespondena dintre variabilele sex i PTSD cu variabila frecv, se apeleaz la procedura
Data-Wheight Cases...:

Facem precizarea c n tabelele de date din imaginile de mai sus variabilele au fost
codificate numeric cu 1 respectiv 2, att pentru sex ct i pentru PTSD, valorile fiind
etichetate. Faptul c n celule apar etichetele i nu valorile, se obine prin setarea DataValue Labels.
Procedura Chi-ptrat accept i variabile de tip caracter (string) dar reamintim
recomandarea de principiu ca toate variabilele s fie declarate de tip numeric.
Procedura: Statistics-Summarize-Crosstabs...
Casetele de configurare sunt urmtoarele:

n caseta principal Crosstabs se trec variabilele analizate n lista Row(s), respectiv


Columns(s). Pot fi analizate mai multe perechi de variabile simultan. Rezultatul
analizei nu depinde de modul de plasare a variabilelor pe linie sau pe coloan. Dac
de dorete crearea unui grafic al corespondenei dintre variabile, se va bifa i
Display clustered bar charts.
n caseta Statistics se bifeaz Chi-Square.
n caseta Cell Display se bifeaz Counts-Observed; Percentages-Row, Column,
Total i Residuals-Unstandardized (bifarea opiunilor este n funcie de informaiile
pe care le dorete analistul).
- 70 -

Rezultate

Imaginea prezint tabelul de coresponden, avnd pe linii valorile caracteristicii de


sex iar pe coloane valorile aferente variabilei PTSD. n celulele tabelului se afl valorile
solicitate prin configurarea casetelor. Vom exemplifica pentru celula feminin/da:
Count 20 indic numrul femeilor cu PTSD
%within Sex 40.0% indic procentul femeilor care au manifestat PTSD din totalul
femeilor
%within PTSD indic procentul femeilor cu PTSD din totalul celor care au
manifestat PTSD
% of Total indic procentul femeilor cu PTSD din totalul subiecilor
Residual indic diferena dintre numrul de femei cu PTSD (frecvena observat) i
frecvena ateptat (n cazul nostru, +10)

n tabelul Chi-Square Tests citim valoarea testului Pearson Chi-Square (16.66) i,


n special, pragul de semnificaie al acestuia (p=0.000 care va fi citit ca p<0.001). n cazul
particular al acestui exemplu, unde tabelul de coresponden este format din dou linii i
dou coloane, valoarea lui chi-ptrat poate fi luat de pe linia Continuitiy Correction
(15.04) cu valoarea aferent a pragului de semnificaie: p<0.001.
Valoarea testului chi-ptrat fiind mai mic dect nivelul alfa 0.05, se respinge
ipoteza de nul i se confirm ipoteza cercetrii: exist o inciden mai mare a reaciei de
stres postraumatic la femei dect la brbai.
n raportarea statisticii chi-ptrat va fi inclus valoarea gradelor de libertate (df) i
numrul cazurilor
Valoarea lui chi-ptrat se raporteaz cu dou zecimale

- 71 -

Graficul de tip bar permite vizualizarea relaiei dintre variabile.


Testul Chi-ptrat pentru coresponden (goodness of fit)
Utilizare
Testul chi-ptrat pentru gradul de coresponden se utilizeaz atunci cnd dorim s
comparm frecvenele observate unei singure variabile categoriale cu frecvenele ateptate,
dinainte cunoscute.
Exemplul 1: Avem evaluarea nivelului de inteligen pe cinci categorii valorice, de
la foarte slab, la foarte bun i dorim s tim dac distribuia acestor calificative se supune
curbei normale, procentele aferente pe curba normal fiind cunoscute (2.5%, 14%, 67%,
14%, 2.5%).
Exemplul 2: Am solicitat unui grup de tineri s i exprime genul muzical preferat
i am obinut frecvene diferite pentru mai multe genuri de muzic. Problema este dac
diferenele dintre aceste frecvene sunt semnificative, presupunnd c, dac nu ar fi
semnificative proporiile preferinelor pentru genurilor muzicale, ar trebui s fie identice
(adic, dac ar fi trei genuri, fiecare ar trebui s ntruneasc un procent de 33.33%).
Aranjarea datelor
Vom exemplifica pe o situaie corespunztoare celui de-al doilea exemplu. Baza de
date se poate constitui fie prin nregistrarea fiecrui caz n parte (avnd o variabil pentru
genul muzical i o alta pentru exprimarea preferinei fa de acesta), fie, ca n exemplul
anterior, prin nregistrarea rezultatelor sintetice i ponderarea variabilei gen_muz cu
variabila frecv prin operaia Data-Weight cases...:

- 72 -

Procedura: Statstics-NonParametric-Tests-Chi-Square...

n caseta Chi-Square Test se trece variabila analizat n zona Test Variable


List.
Se bifeaz All categories equal, acesta fiind modelul n raport cu care dorim
s testm frecvenele variabilei analizate
Dac am fi dorit s le testm n raport cu alte frecvene cunoscute, am fi
bifat Values i, apoi, am fi introdus pe rnd acele frecvene (scriindu-le n
dreptul lui Values i nregistrndu-le prin butonul Add)

Rezultate

Cele dou tabele cu rezultate din Viewer prezint:


Frecvenele observate, frecvenele ateptate i valorile reziduale (diferena
dintre frecvene) pentru cele trei genuri muzicale
Valoarea testului Chi-ptrat al corespondenei (12.17), df(2) i p=0.002
Acest rezultat justific respingerea ipotezei de nul i acceptarea concluziei c
subiecii diferenele dintre preferinele pentru cele trei genuri muzicale sunt semnificative i
nu se datoreaz variaiei ntmpltoare de eantionare.

- 73 -

Testul z al diferenei dintre dou proporii independente


Utilizare
Acest test se utilizeaz atunci cnd se dorete compararea a dou proporii obinute
pentru o variabil dihotomic.
Exemplu: n urma unui studiu comparativ cu privire la interesul fa de fenomenele
paranormale, efectuat n rndul studenilor de la Universitate comparativ cu studenii de la
Politehnic, se nregistreaz urmtoarele rezultate3:
La psihologie: 25 studeni nu cred n fenomenele paranormale iar 175
cred
La politehnic: 124 nu cred n fenomenele paranormale iar 32 cred
Problema cercetrii este dac diferena dintre cei cred n fenomenele paranormale
din cele dou categorii de studeni este semnificativ.
Aranjarea datelor
Datele pot fi introduse fie caz cu caz, existnd o variabil pentru opinia fa de
fenomenele paranormale i una pentru tipul de instituie de nvmnt, fie ca n imaginea
de mai jos, care presupune o prealabil sintetizare a datelor:

o variabil (paranorm) pentru codificare credinei n fenomenele


paranormale;
o variabil (stud_la) pentru apartenena la una din cele dou instituii de
nvmnt superior;
o variabil (frecv) pentru frecvena cazurilor.

Este important de reinut c toate variabilele trebuie s fie numerice. n baza de date
de mai sus, variabila paranorm aia valoarea 1 pentru cred i valoarea 2 pentru
nu cred, iar variabila stud_la are valoare 1 pentru Universitate i 2 pentru
Politehnic.
Valorile variabilelor au fost etichetate corespunztor iar afiarea etichetelor n locul
valorilor, n celulele tabelului de date, a fost obinut cu setarea View-Value labels
din meniul SPSS Data Editor. De reinut c, dei afieaz etichetele, SPSS va opera
n calcule cu valorile, devenite invizibile.
Procedura: SPSS nu dispune de o procedur specific pentru calcularea direct a
diferenei dintre dou procente. n acest scop se utilizeaz o procedura Crosstabs i testul
chi-ptrat.

Datele nu sunt reale

- 74 -

n prealabil, se execut procedura Weight pentru variabilele categoriale


(paranorm i stud_la) n funcie de variabila frecv, care contorizeaz
numrul cazurilor.

Operaia asociaz valorile variabilelor categoriale (paranorm i stud_la) cu valorile


variabile frecv. Efectul ei este unul invizibil pe ecran dar se va vedea n analizele
statistice ulterioare.
Efectul de ponderare (wheight) a unei variabile rmne activ atta timp ct nu se
pondereaz o alt variabil sau nu se anuleaz ponderarea efectuat. La salvarea
fiierului se salveaz i variabila ponderat. Includerea variabilei ponderate n
diverse proceduri de analiz are efecte specifice.
Dac datele ar fi fost introduse n baza de date caz cu caz, operaia Wheight nu ar
mai fi fost necesar.
2. Se execut procedura Statistics-Summarize-Crosstabs... pentru variabilele
paranorm i stud_la, cu selectarea Chi-Square din caseta Statistics. (nu mai
prezentm imaginile, acestea fiind identice cu cele de la testul chi-ptrat).
Rezultate

SPSS Viewer prezint mai nti tabelul de coresponden dintre variabilele


categoriale, cu valorile variabilei ponderate prin procedura Wheight.

- 75 -

Din tabelul Chi-Square Tests citim valoarea Pearson Chi-Square (161.598).


Testul z pentru diferena proporiilor se calculeaz ca radical din valoarea lui chiptrat:
z = 161.598 = 12.71
Semnul lui z se afl din diferena proporiilor testate, astfel:
175 32
p a pb =

= 0.875 0.205 = 0.67


200 156
Decizia statistic se ia prin raportarea valorii calculate a lui z la valorile critice ale
acestuia de pe curba normal, pentru test unilateral sau bilateral.
n cazul nostru, pentru test bilateral cu alfa=0.05, z calculat (12.71) este mai mare
dect z critic (1.96), fapt care permite respingerea ipotezei de nul i confirmarea ipotezei c
studenii de la Universitate cred ntr-o msur semnificativ mai mare n fenomenele
paranormale dect studenii de la Politehnic.

- 76 -

Teste neparametrice pentru date ordinale


Testul Mann-Whitney (U) pentru dou eantioane independente
Utilizare
Testul Mann-Whitney este utilizat pentru testarea diferenei dintre grupuri
independente pentru care variabila dependent este exprimat n valori ordinale (de rang)
sau atunci cnd, chiar dac este de tip cantitativ, nu suport un test parametric (testul t).
Exemplu: La ieirea dintr-un club de noapte, un psiholog interesat de efectul
depresiv al drogurilor a efectuat interviuri n legtur cu acest aspect i a identificat un
numr de 10 tineri care au consumat cte o pastil de Ecstasy i un numr de 10 tineri care
au consumat doar alcool. Apoi i-a convins s ia parte la un experiment i le-a administrat
un chestionar de evaluare a depresiei. Acelai chestionar a fost aplicat din nou, peste trei
zile. Obiectivul studiului este, n prima faz, acela de a verifica ipoteza c cele dou tipuri
de drog (Ecsatsy i alcool) au efecte depresante diferite. n acest scop vor trebui comparate
valorile la depresie ale celor dou grupuri. Aceast analiz va fi efectuat att pentru
valorile depresiei de la prima msurare ct i pentru cele de la a doua evaluare a depresiei.
Aranjarea datelor

Variabilele din baza de date sunt urmtoarele:


cod_sub, un cod numeric de identificare a fiecrui subiect (dei exemplele
anterioare nu au cuprins aceast variabil, ea nu trebuie s lipseasc din nici o
baza de date)
drog, pentru tipul de drog utilizat (sunt afiate etichetele, iar valorile sunt
1=Ecstasy, 2=Alcool)
depr_1, scorul la depresie la prima evaluare
depr_2, scorul la depresie la a doua evaluare

Variabilele dependente din exemplul nostru au valori msurate pe scal


cantitativ. Testarea lor cu un test ordinal nu presupune o prealabil transformare de
- 77 -

rang, programul efectund automat aceast transformare. Procedura se aplic n


acelai mod i direct pe valori ordinale de rang.
Procedura: Statistics-Non Parametric Tests-2 Independent Samples...
Se cuvine s precizm c, n mod normal, datele de acest tip ar conduce la utilizarea
testului t pentru eantioane independente. Cu toate acestea, avnd n vedere volumul foarte
mic al eantionului, utilizarea unui test neparametric este de preferat.

n caseta Two-Independent Samples Tests variabilele analizate sunt trecute n lista


Test Variable List.
Rezultate

Tabelul Ranks ofer informaii sintetice despre cele dou variabile: volumul
grupurilor, media rangurilor i suma rangurilor.

Tabelul Test Statistics include valorile testului Mann-Whitney pentru cele dou
variabile testate simultan, depresia imediat i remanent. Valorile de interes din tabel sunt
cele ale lui Z i nivelul de ncredere p. n cazul nostru, se observ depresia imediat nu
difer semnificativ n funcie de tipul de drog utilizat, n timp ce depresia remanent este
semnificativ diferit, mai mare la utilizatorii de Ecstasy dect la utilizatorii de alcool
(conform datelor din tabelul anterior).

- 78 -

Testul Wilcoxon pentru dou eantioane perechi


Utilizare
n exemplul de mai sus, psihologul a testat ntr-o prim faz semnificaia diferenei
dintre cele dou grupuri definite prin tipul de drog diferit (eantioane independente). Una
dintre problemele cercetrii este i aceea dac exist o diferen ntre nivelul depresiei
imediate i cel al depresiei remanente. Acest tip de analiz nu se poate face dect pentru
subiecii aparinnd aceluiai tip de drog utilizat.
Aranjarea datelor
Este identic cu cea prezentat pentru testul Mann-Whitney.
n acest caz, deoarece analiza trebuie efectuat separat pe grupurile de consum
Ecstasy/Alcool, exist dou soluii. Prima ar fi selectarea (cu Data-Select Cases) a primului
grup i efectuarea testului, apoi selectarea celui de-al doilea grup i efectuarea testului. O
soluie mai elegant este, ns, aceea de a declara mprirea bazei de date n funcie de
grupurile definite prin tipul de drog. n acest scop se va utiliza procedura Data-Split
File...

n locul setrii implicite Analyze all cases, do not create groups, se bifeaz
opiunea Compare groups i se declar variabila ale crei valori vor servi drept criteriu de
mprire a bazei de date n grupuri de analiz separat (n cazul nostru, tipul de drog) prin
trecerea ei n zona Groups Based on:. Efectul acestei aciuni este acela c toate prelucrrile
care vor fi efectuate din acest moment se vor aplica, separat, pe fiecare grup identificat prin
valorile variabilei.
Operaiunea de mprire a bazei de date nu are semne vizibile, fapt care
poate face s fie uitat i, astfel, atunci cnd se revine la prelucrri care ar trebui s
implice toat baza de date rezultatele vor fi incorecte. De aceea, se va avea n
vedere revenirea la setarea Analyze all cases, do not create groups atunci
prelucrarea pe grupuri a bazei de date nu mai este becesar.

Procedura: Statistics-Non Parametric Tests-2 Related Samples...


Setarea procedurii n caseta Two-Related-Samples tests se face n doi timpi:
1. Se selecteaz prin clic de mouse fiecare
2. Se acioneaz butonul pentru a se
variabil, constituindu-se perechea supus
transfera perechea de variabile n zona Test
analizei
Pair(s) list.

- 79 -

Se bifeaz opiunea pentru testul Wilkoxon (care este, de fapt, cea implicit)
Rezultate

Tabelul Ranks ofer informaii sintetice despre rangurile pozitive i negative pentru
cele dou grupuri, numrul subiecilor, media rangurilor i suma lor.

Tabelul Test Statistics prezint valorile comparative ale depresiei pentru cele dou
grupuri. Aa cum se observ, diferena este semnificativ (p=0.007) n cazul
consumatorilor de Ecstasy i nesemnificativ (p=0.053), n cazul consumatorilor de alcool.
Concluzia general a studiului este aceea c Ecstasy, comparativ cu alcoolul, are un efect
depresant mai mare (testul Mann-Whitney) i mai accentuat cu trecerea timpului (testul
Wilcoxon).

- 80 -

Testul Kruskal-Wallis pentru mai mult de dou eantioane independente


Utilizare
Testul Kruskal-Wallis este utilizat atunci cnd avem o variabil dependent
ordinal, msurat pentru mai mult de dou grupuri independente (formate din subieci
diferii), i dorim s testm diferena dintre acestea. Acest test pentru date ordinale este
analog testului ANOVA pentru date cantitative.
Exemplu: A fost studiate relaia dintre condiiile familiale (familie armonioas,
mam singur, familie conflictual) i frecvena reaciilor emoionale pozitive la copiii de
vrst precolar, pe durata unei sptmni. Problema cercetrii este dac diferenele sunt
semnificative iar mediul familial are legtur conduita emoional a copiilor.
Aranjarea datelor

n baza de date, variabila familie a fost codificat i etichetate astfel:


1=familie armonioas, 2=mam singur, 3=familie conflictual. Etichetele sunt afiate ca
urmare a opiunii Data-Value Labels. Rezultatele vor fi identice dac variabila dependent
este exprimat i direct n valori de rang.
Procedura: Statistics-Non Parametric tests- k Independent Samples...
n caseta principal se trece
variabila testat n zona Test
Variable List: iar variabila
independent n zona
Gouping Variable. Se
activeaz comanda Define
Range...

Se definete domeniul
valorilor variabilei
independente, n cazul
nostru: minim 1, maxim 3.

Forma final a casetei este


aceasta.
Testul Kruskal-Wallis este
bifat implicit.

- 81 -

Rezultate

Primul tabel include informaii descriptive cu privire la variabila testat:


numrul subiecilor din fiecare grup i media rangurilor pentru fiecare grup. De precizat c
programul acord rangul 1valorii celei mai mici. Datele din tabel indic descreterea
mediei rangurilor (expresii emoionale pozitive numeroase) de la familia armonioas la cea
conflictual.

Rezultatul testului, afiat n tabelul Test Statistics, se exprim printr-o valoare chiptrat (6.33) cu dou grade de libertate i p=0.042. Ca urmare, ipoteza de nul poate fi
respins. Datele confirm ipoteza c mediul familial (exprimat prin cele trei tipuri de
familie) i pune amprenta asupra expresivitii emoionale a copiilor de vrst precolar.

- 82 -

Testul Friedman pentru msurri repetate


Utilizare
Testul Friedman se utilizeaz pentru testarea diferenei de rang n cazul unei
variabile msurate repetat, de mai mult de dou ori, pe acelai grup de subieci. El este
echivalentul testului ANOVA pentru msurri repetate, pentru date cantitative. Dac este
utilizat pentru doar dou msurri repetate, rezultatul su este echivalent cu al testului
Wilcoxon, prezentat mai sus.
Exemplu: Efectele altitudinii asupra memoriei sunt testate pe un grup de alpiniti.
Capacitatea de memorare de cuvinte este msurat la trei nlimi diferite: 1000m, 3000m
i 6000m. Problema cercetrii este dac diferena de performan de memorare
corespunztoare celor trei nlimi este semnificativ. Dat fiind volumul extrem de mic am
eantionului (N=5), efectuarea unui test parametric (ANOVA RM) ar fi nesigur iar apelul
le testul Friedman este pe deplin justificat.
Aranjarea datelor

Variabilele mem_1000, mem_3000 i mem_6000 conin numrul cuvintelor


memorate pentru fiecare dintre cei 5 alpiniti. Nu este necesar transformarea lor n valori
de rang, deoarece acest lucru va fi efectuat automat de program. Dac datele primare sunt
sub form de ranguri, ele vor fi introduse ca atare, rezultatul fiind identic.
Procedura: Statistics-Non Parametric Tests-K related Samples...

Se seteaz opiunea Friedman iar variabilele testate sunt trecute n lista Test
Variables:

- 83 -

Rezultate

Primul tabel prezint media rangurilor pe nlimi (rangul 1 este atribuit valorii
celei mai mici). n al doilea tabel gsim valoarea testului Friedman exprimat n valori chiptrat (8.40), avnd un nivel de semnificaie p=0.015. Acest rezultat permite respingerea
ipotezei de nul i confirm ipoteza c memoria cuvintelor este n legtur cu nlimea (pe
cele trei niveluri avute n vedere).
Coeficientul de corelaie pentru date ordinale (Spearman)
Utilizare
Testul de corelaie a rangurilor (Spearman) este echivalentul pentru date ordinale
testului de corelaie Pearson. Rezultatul su variaz pe aceeai plaj de valori (-1/+1) i se
interpreteaz n mod similar cu rezultatul testului Pearson.
Exemplu: S lum n considerare studiul aceluiai grup de alpiniti, care au
efectuat, la aceleai nlimi descrise mai sus, i un test de vitez de decizie (msurat n
zecimi de secund). Problema cercetrii este dac ntre performana de memorare i ce de
timp de decizie este o relaie (variaie concomitent) semnificativ.
Aranjarea datelor

]
Alturi de variabilele memorie pentru cele trei nlimi, avem acum i
variabilele pentru timpul de decizie.
Procedura: Statistics-Corelation-Bivariate

- 84 -

Variabilele supuse testului de corelaie se trec n lista Variables:


Se anuleaz setarea pentru testul Pearson i se bifeaz Spearman (aici am ales i
testul Kendal tau-b, care este echivalent lui Spearman, doar pentru a le putea compara. n
practic, se va utiliza doar unul dintre acestea dou).
Aceast configurare a casetei de dialog produce o matrice de corelaii cu ase linii
i ase coloane pentru fiecare dintre cele dou teste alese. n fiecare celul a matricii se vor
afla, aa cum vom vedea, mai multe numere. Din acest motiv citirea ei nu este tocmai
comod.
Pentru a obine un format mai convenabil de prezentare a rezultatelor,
recomandm o procedur suplimentar, prezentat anterior la corelaia Pearson: Se
acioneaz butonul Paste care deschide fereastra Syntax, unde gsim comenzile procedurii.
Aici se introduce clauza WITH ntre primul grup de variabile (memorie) i al doilea grup
de variabile (decizie):

Mai departe, procedura de corelaie se lanseaz cu butonul de pe bara de


comenzi a ferestrei Syntax.
Aceast variant de lucru nu este obligatorie. Se poate efectua corelaia i direct
din caseta principal, dar, aa cum am spus, rezultatele vor fi prezentate ntr-o form mai
puin ergonomic.
Rezultate

Tabelul cu rezultate cuprinde pe linii variabilele memorie i pe coloane,


variabilele decizie. Deoarece am cerut calcularea simultan a ambilor coeficieni de
corelaie, datele sunt dublate. Este de la sine neles c, n realitate nu vom utiliza dect
unul dintre aceti coeficieni de corelaie a rangurilor.
Din celulele tabelului de mai sus nu ne intereseaz dect cele care cuprind corelaia
dintre memorie i decizie la acelai palier de nlime. Pentru a fi mai vizibile, am ngroat

- 85 -

valorile utile analizei. n jumtatea de sus a tabelului, avem corelaiile pentru testul
Kendall iar n jumtatea de jos pe cele ale testului Spearman.
Testul Kendall al corelaiei dintre memorie i decizie la 1000 de metri are valoarea
-0.94, semnificativ la p=0.023. La interpretarea coeficienilor de corelaie este extrem de
important s se ia n considerare, simultan, semnul i semnificaia variaiei valorilor. n
cazul nostru, valori mari ale memoriei, nseamn o capacitate de memorare mai bun iar
valori mari ale timpului de decizie nseamn capacitate de decizie mai proast (sub aspectul
vitezei, desigur). n consecin, un coeficient de corelaie negativ ntre aceste variabile
indic, de fapt, o variaie concomitent pozitiv a memoriei i vitezei deciziei (cnd
capacitatea de memorare scade, i decizia este mai lent, timpul de decizie fiind mai mare).
Analiza coeficienilor din tabelul de mai sus arat existena unei corelaii de rang
semnificative (p<0.05) ntre memorie i decizie la toate palierele de nlime.
Dac facem comparaia dintre coeficienii Spearman i Kendal, vom vedea c, dei
ei difer valoric, semnificaiile se afl, n toate cazurile, de aceeai parte a deciziei statistice
(respingerea ipotezei de nul). Utilizarea unuia sau altuia dintre cei doi coeficieni rmne la
latitudinea cercettorului.

- 86 -

S-ar putea să vă placă și