Aplicatii SPSS

Aplicaii SPSS
Marian Popa
CUPRINS
SPSS prezentare general..............................................................................................................................3
Paii analizei statistice cu SPSS.....................................................................................................................6
Editarea datelor..............................................................................................................................................8
Exemplu practic de realizare a unei baze de date......................................................................................15
Operaii de transformare a variabilelor.....................................................................................................19
nsumarea valorilor variabilelor.................................................................................................................19
Calcularea mediei a dou sau mai multe variabile....................................................................................21
Extragerea anului dintr-o variabil de tip cronologic (date)......................................................................22
Recodificarea variabilelor..........................................................................................................................24
Ordonarea dup rang a valorilor unei variabile.........................................................................................26
Organizarea datelor pentru analiz............................................................................................................27
Sortarea bazei de date................................................................................................................................27
mprirea bazei de date n subgrupuri......................................................................................................28
Selectarea unor seturi de date....................................................................................................................28
Calcularea indicatorilor statistici descriptivi.............................................................................................31
Teste parametrice..........................................................................................................................................35
Testul z (t) pentru media unui singur eantion...........................................................................................35
Testul t pentru eantioane independente....................................................................................................37
Analiza de varian unifactorial (One Way ANOVA)..............................................................................40
Testul t pentru eantioane dependente (perechi)........................................................................................44
Coeficientul de corelaie liniar Pearson (r)..............................................................................................46
Regresia liniar simpl...............................................................................................................................51
Analiza de consisten intern (Cronbach alfa).........................................................................................57
Teste neparametrice nominale.....................................................................................................................65
Testul z al proporiei pentru un singur eantion.........................................................................................65
Testul semnelor..........................................................................................................................................67
Testul Chi-ptrat al asocierii (independeei)..............................................................................................69
Testul Chi-ptrat pentru coresponden (goodness of fit)..........................................................................72
Testul z al diferenei dintre dou proporii independente..........................................................................74
Teste neparametrice pentru date ordinale.................................................................................................77
Testul Mann-Whitney (U) pentru dou eantioane independente..............................................................77
Testul Wilcoxon pentru dou eantioane perechi.......................................................................................79
Testul Kruskal-Wallis pentru mai mult de dou eantioane independente................................................81
Testul Friedman pentru msurri repetate..................................................................................................83
Coeficientul de corelaie pentru date ordinale (Spearman).......................................................................84
-2-
SPSS prezentare general

SPSS for Windows este un pachet de programe destinat analizei statistice a
datelor. Dei exist o varietate de programe de acest gen (SAS, Statistica for Windows,
GraphPad, MS Excel, care are i el funcii statistice), SPSS se distinge prin structurarea
riguroas i uurina utilizrii, chiar i pentru nceptori.
Cea mai recent versiune disponibil la aceast dat este SPSS 12.0. Acest manual
nu acoper n mod special o anumit versiune, ci face referire n general la versiunile sub
Windows. n esen, toate versiunile sub Windows ofer acelai pachet de funcii
statistice iar diferenele, chiar dac sunt, nu sunt relevante la nivelul unui curs introductiv
de statistic.
Simbolul care precede aceast propoziie indic introducerea unei informaii
importante, care se impune a fi reinut.
Ne vom axa pe o prezentare sintetic, axat pe esenial, considernd cunoscute
elementele de baz de operare n mediul Windows.
Funcii de baz ale SPSS
editarea datelor (construirea bazelor de date, transformri ale variabilelor)

prelucrarea statistic a datelor (statistici descriptive, teste de semnificaie)
prezentarea rezultatelor, sub form numeric sau grafic
realizarea unor proceduri proprii de prelucrare sau de a modifica procedurile
standard SPSS. Aceast opiune este rezervat utilizatorilor avansai i nu va
face obiectul prezentrii n acest manual.
Domeniile de lucru n SPSS

Particularitatea principal a interfeei de lucru cu SPSS este aceea c rezerv
fiecreia dintre funciile de mai sus un domeniu special (ecran, sau fereastr). Astfel,
la lansarea programului, acesta deschide automat o fereastra rezervat editrii datelor
(Data Editor) i una afirii rezultatelor (Viewer). Putem numi aceste ferestre i domenii
de lucru, deoarece la nivelul fiecruia avem la dispoziie o varietate de funcii i opiuni
specifice. Ca s nelegem mai bine, trebuie s ne imaginm domeniile de lucru ca fiind
ferestre distincte, similare celor ale documentelor Word, cu deosebirea c, n acest caz,
fiecare fereastra acoper funcii specifice.
Trecerea de la o fereastr la alta se face ntr-unul din urmtoarele moduri:
Din meniul SPSS/Windows, prin alegerea ferestrei dorite;
Utiliznd butoanele din bara de comenzi directe a ferestrei SPSS;
Utiliznd butoanele de pe bara de sarcini a sistemului de operare (din
partea de jos a ecranului).
-3-
Domeniul bazei de date (Data Editor)

La lansarea programului SPSS se deschide fereastra domeniului de editare a
datelor (SPSS Data Editor). Ea se prezint ca n imaginea de mai jos, avnd
caracteristicile obinuite ale unei ferestre Windows, cu o structur de linii i coloane:
- pe coloane sunt variabilele (de ex., cod_sub, rezultat)
- pe linii sunt cazurile (n acest caz, cinci subieci)
O sesiune de lucru cu SPSS presupune, n mod necesar, existena unei

baze de date.
SPSS opereaz cu o singur baz de date la un moment dat.
Pentru a deschide o alt baz de date, sau a crea una nou, cea aflat n
lucru va fi nchis. Programul solicit salvarea ei prealabil, dac acest lucru nu a
fost deja efectuat.
Dac vrem s prelucrm date aflate n baze de date (fiiere) diferite, este
necesar aducerea lor n aceeai baz de date (procedura DATA-Merge files, care
va fi descris mai trziu).
Meniurile ferestrei Data Editor nu se vor activa integral dect atunci cnd
va exista cel puin o variabil definit i valori pentru cel puin un caz.
Baza de date SPSS poate fi creat direct, cu ajutorul structurii (ferestrei)
Data Editor, sau poate fi deschis cu ajutorul comenzii File-Open, aa cum vom
exemplifica mai trziu.
Domeniul afirii rezultatelor (Viwer)

SPSS depune rezultatele prelucrrilor ntr-o seciune aparte a domeniului de lucru.
Aceasta cuprinde toate tipurile de rezultate, att de tip numeric ct i de tip grafic.
Fereastra respectiv (Viewer) este organizat n dou zone distincte: una pentru navigare
(n partea stng) i alta pentru afiarea rezultatelor (n partea dreapt).
-4-
Fiierul rezultat prin salvarea acestei ferestre are extensia .SPO

Un fiier cu rezultate SPSS nu poate fi deschis dect din SPSS
Dac se dorete transmiterea rezultatelor n afar SPSS se va proceda fie la
exportul rezultatelor cu procedura corespunztoare din meniul File/Export, fie
la transferarea prin Select/Copy/Paste ntr-un editor grafic de tipul MS Word.
Domeniul de editare a procedurilor directe (Syntax)
SPSS permite, n afara operrii prin intermediul mediurilor, i lucrul direct cu
proceduri definite de utilizator. Aceasta se face n interiorul unei ferestre speciale, care
permite, pe de o parte, editarea procedurilor, iar pe de alt parte, lansare lor n execuie.
Imaginea de mai jos red comenzile SPSS pentru calcularea procedurii de calcul
indicatorilor statistici descriptivi, redai mai sus, n fereastra SPSS Viewer.
Utilizarea direct a procedurilor impune aprofundarea SPSS

Se poate seta afiarea procedurilor curente n SPSS Viewer, concomitent cu
rezultatele. (Edit/Options/Viewe/Display commands in the log)
-5-
Meniurile SPSS
Meniurile de tip list se aseamn cu meniurile altor programe sub Windows. Fr a intra n
amnunte, iat o prezentare succint a meniurilor pentru fereastra DATA EDITOR:
Meniul
File
Edit
View
Data
Funcii principale
Operaii de deschidere i salvare de fiiere
Operaii de Select/Copy/Cut/Paste, Find i,
cel mai important, setarea caracteristicilor de
lucru ale SPSS (Options-n versiunile pt. Win
9X)
n cazul ferestrei Data Editor, seteaz modul
de afiare: cu sau fr bara de butoane, cu sau
fr liniile despritoare ale celulelor.
Funcii de operare cu variabilele; definire,
inserare, tergere, selectare, sortare,
adiionare de fiiere, etc.
Transform
Funcii de modificare a datelor prin calculare,

recodificare.
Statistics
(Analyze)
Grupeaz procedurile de calcul statistic
Graph
Utilities
Window
Help
Observaii
Importante pentru
pregtirea datelor n
vederea prelucrrii
Importante pentru
pregtirea datelor n
vederea prelucrrii
Prin opiunile fiecrei
proceduri se pot obine i
reprezentri grafice
specifice
Grupeaz procedurile de reprezentare grafic

Informaii despre variabile, structurare pe
seturi de variabile
Lista ferestrelor deschise cu posibilitatea de
selecie
Informaii de ajutor
Aici se afl un tutorial

extrem de sugestiv de
operare cu SPSS, iar de la
versiunea 7.5 n sus, o
procedur de sprijin n
alegerea tipului de
prelucrare statistic
(Statistic Coach)
Paii analizei statistice cu SPSS

n principiu, prelucrarea datelor cu SPSS presupune urmtoarele etape:
1
Introducerea datelor
Opiuni:
(a) Introducerea direct a datelor n DATA EDITOR
(b) Deschiderea unui fiier de date SPSS (extensia .SAV)
(c) Importarea unui fiier de format diferit (se alege din
-6-
2
3
4
Pregtirea datelor
Selectarea procedurii
satistice
Selectarea variabilelor
ce urmeaz a fi supuse
prelucrrii
Rularea procedurii
Analiza rezultatelor
Editarea rezultatelor
Inserarea datelor ntrun document
caseta File open/File of type)

Corecia erorilor, selecii, recodificri, transformarea
variabilelor prin calcule, declararea valorilor lips,
combinarea datelor din dou fiiere diferite (meniurile
Data, Transform)
Meniurile Statistics (sau Analyze) i Graphs
n conformitate cu configuraia casetei de dialog care este
afiat la fiecare procedura
Se acioneaz butonul OK din caseta de dialog a procedurii
Butonul devine activ numai atunci cnd sunt ntrunite
condiiile presupuse de procedura respectiv
Rezultatele prelucrrilor sunt afiate ntr-o fereastr
specific (SPSS Viewer), cu funciuni de editare grafic sau
de tip text, n funcie de versiune.
Se editeaz rezultatele afiate n Viewer, aducndu-le la
forma dorit sub aspect grafic
Dublu clic pe un element din Viewer conduce la intrarea
elementului respectiv n regim de editare)
Rezultatele din SPSS Viewer se preiau cu Select/Copy i se
depun cu Paste n orice tip de editor de documente.
SPSS este un program puternic de analiz statistic a datelor. Utilizarea lui optim
presupune, n mod necesar, stpnirea de ctre operator a cunotinelor teoretice de
statistic.
Aa cum un program de editare grafic nu compenseaz lipsa de talent la desen, nici
SPSS nu poate fi cu adevrat exploatat de ctre cei care nu au cunotine de statistic.
n lipsa acestora, nici alegerea procedurilor i nici interpretarea rezultatelor nu va fi
cu adevrat posibil.
-7-
Editarea datelor
O baz de date n SPSS este o structur format din linii i coloane, la intersecia
crora se formeaz celulele care conin, fiecare, o anumit unitate de informaie.
Existena unei baze de date deschis n fereastra Data Editor este o condiie
obligatorie pentru operarea cu SPSS
SPSS opereaz numai cu o singur baz de date deschis la un moment dat
n principiu, o baz de date SPSS se obine pe una din urmtoarele ci:
a) Crearea ei prin operaiunea de definire a variabilelor i introducerea datelor de la
tastatur;
b) Deschiderea unei baze de date SPSS, existente pe un suport de memorie;
c) Importarea unei baze de date din alt format dect SPSS
n continuare, vom trata pe rnd, fiecare din cele trei situaii:
a) Crearea unei baze de date SPSS
n linii generale, pentru crearea unei baze de date proprii n SPSS, se procedeaz
astfel:
Se lanseaz SPSS
Se definesc variabilele bazei de date n domeniul Data Editor
Se introduc datele pentru fiecare caz (subiect) n parte
Se salveaz baza de date (extensia specific este *.sav)
Definirea variabilelor
se acioneaz Define variable din meniul Data
soluie mai direct este dublu clic pe capul de coloan
n versiunile de SPSS mai recente, editarea variabilelor se face ntr-o fereastr

special. Cu toate acestea, elementele de baz rmn aceleai ca al versiunile
anterioare.
-8-
Ca urmare a operaiei de mai sus, apare o caset de dialog ca n imaginea de mai

jos (forma ei nu difer substanial de la o versiune de SPSS la alta). Dac privim caseta,
vom observa urmtoarele elemente:
Variable Name: zona de declarare a numelui de variabil. VAR00001 este

numele implicit al primei variabile. Acesta se terge, pentru a fi nlocuit cu
numele pe care dorim s l dm variabilei.
Variable Description, este o zona informativ n care sunt afiate
caracteristicile predefinite ale noii variabile. Aceste caracteristici se pot seta n
Edit-Options (sau Preferences, la unele versiuni).
Change Settings, este o zon care cuprinde butoane de comenzi pentru
modificarea setrilor implicite:
n zona Measurement, se permite declararea tipului de msurare specific
variabilei: Scale (Interval/Raport); Ordinal; Nominal
Butoanele OK (pentru finalizarea definirii variabilei, Cancel (pentru
renunarea la definirea variabilei, Help (informaii legate de definirea
variabilelor)
n versiunile mai recente de SPSS editarea variabilei nu presupune acest tip de

caset, dar toatele elementele ei constitutive se regsesc.
Numele variabilei:
Orice variabil SPSS trebuie s aib un nume. Cele mai importante aspecte legate
de denumirea variabilelor sunt urmtoarele:
Trebuie sa fie format din minim 1, maxim 8 caractere,
Nu sunt suportate caractere speciale cum ar fi spaiu sau semne de punctuaie
-9-
n cazul utilizrii unor caractere improprii, apare un mesaj de eroare i se permite

corectarea numelui.
Alegerea numelui este la latitudinea operatorului. Respectarea anumitor convenii
poate fi, ns, extrem de util, mai ales dac avem de a face cu o baza de date cu
multe variabile. Iat cteva recomandri utile n acest sens (ele nu sunt
obligatorii):
Numele s exprime, pe ct posibil, coninutul variabilei
Pentru variabile nrudite, se va utiliza o schem de denumire care
s exprime acest lucru. De exemplu, dac avem variabile care
cuprind valori ale timpului de reacie msurat n mai multe
condiii, putem declara variabilele TR_1, TR_2, TR_3 .a.m.d.,
caracterul underscore este recomandabil ca separator n cadrul
numelui de variabil). Dac ntr-o situaie de acest gen am avea 10
sau mai multe momente, este de preferat s se declare nume de
genul TR_01, TR_02,...TR_10, etc., deoarece ulterior SPSS
aranjeaz alfabetic variabilele n listele de selecie i, astfel, se
pstreaz ordinea dorit.
ntr-o baz de date nu pot exista dou variabile cu acelai nume!
Exist o serie de cuvinte rezervate, a cror utilizare ca nume de variabile nu este
acceptat de program. Acestea sunt: ALL, AND, BY, EQ, GE, GT, LE, LT, NE,
NOT, OR, THRU, TO, WITH.
Definirea tipului de variabil
Tipul de variabil se refer la
Se acioneaz butonul Type de pe caseta Define Variable
Apare caseta Define Variable Type
, unde se marcheaz tipul variabilei i se declar caracteristicile

acesteia (Width, Decimal Places, n cazul variabilelor numerice)
Se acioneaz butonul Continue, pentru a se reveni la caseta Define

Variable.
Aa cum se observ n caseta Define Variable Type din imaginea de mai sus, SPSS poate
opera cu o varietate de tipuri de variabile. Fiecrui tip i corespund anumite proprieti
(caracteristici) care trebuie definite de operator. Cele mai uzuale sunt tipurile:
- 10 -
[Numeric], care cuprind valori de tip numeric cu sau fr zecimale.

Proprieti:
numrul de cifre necesare pentru exprimarea ntregilor
numrul de zecimale
EXEMPLE:
Pentru o variabil n care vom introduce vrsta n ani mplinii, vom defini Type
Numeric cu Width 2 (presupunnd c nu avem subieci cu vrsta peste 100 de ani)
i Decimal Places 0.
Pentru o variabil n care vom introduce rezultatul la un test exprimat n scoruri T
cu o zecimal, definim Type Numeric cu Width 2 i Decimal Places 1.
[Caracter] (String), care cuprind valori exprimate sub form de caractere alfanumerice
(litere sau chiar cifre).
Proprieti
numrul de caractere rezervat, care este fixat implicit la 8, dar poate fi
modificat dup dorin.
SPSS face distincie ntre variabile de tip caracter scurte (Short string) i lungi
(Long string). Primele au maxim 8 caractere i pot fi incluse n unele proceduri
statistice (semnificaia diferenei ntre medii, de exemplu), pe cnd celelalte nu pot fi
utilizate dect n operaii de listare (cazul variabilei de genul nume, de ex.).
Dei permis, utilizarea variabilelor string nu este de preferat. Toate variabilele
care suport codificri vor fi, de preferin, introduse cu valori numerice. Utilizarea
acestora n proceduri statistice nu este limitat de nici o restricie.
Uniti de timp calendaristic sau orar [Date], care pot include valori de timp ntr-un
format specificat, aa cum se vede n imagine.
Proprieti
formatul de ntroducere, care poate fi unul din cele evideniate n
caseta Define Variable Type/Date
Exemplu: dd-mmm-yyyy presupune introducerea unor valori de genul 21-FEB2001 (luna fiind scris obligatoriu dup prescurtarea ei n englez).
Exist o mare varietate de formate pentru acest tip de variabil, acoperind, practic,
orice cerin posibil din partea utilizatorului.
- 11 -
Variabilele de tip Date beneficiaz de funcii speciale de tratare i analiz n

SPSS.
Nu vom prezenta i celelalte tipuri de variabile, ele fiind mai puin folosite, dar
facem precizarea c semnificaia lor poate fi gsit n Help-ul casetei Define Variable
Type.
Tipul unei variabile poate fi schimbat ulterior prin simpla redefinire a acesteia.
Se va acorda atenie mesajelor care pot s apar i care avertizeaz asupra
eventualelor pierderi de informaie prin schimbarea tipului.
Opiunile din zona Measurement (Scale, Ordinal, Nominal), care se regsesc
doar la versiuni SPSS de la 7.0 n sus, nu au ntotdeauna o utilitate practic dar
marcarea lor corect este necesar pentru anumite proceduri statistice sau
grafice.
Etichetarea variabilelor i a valorilor
Etichetarea este o form de descriere explicit a coninutului variabilei (avnd n
vederea c numele variabilei nu poate fi mai mare de 8 caractere). Etichetarea se poate
practica att la nivelul variabilei dar i la valorile pe care le conine, n cazul variabilelor
de tip nominal sau ordinal.
Pentru etichetare se apas butonul Labels de pe caseta Define Variable. Se
deschide o nou caset (Define Labels), care conine spaii pentru eticheta variabilei
(Variable Label) i pentru etichetele valorilor (Value labels).
Eticheta variabilei nu se supune restriciilor pentru nume, putnd conine oricte
caractere (max. 255), dar i spaii sau alte semne grafice tipribile.
Etichetele pentru valori vor fi introduse una cte una, astfel:
se plaseaz valorea etichetatn zona Value
se introduce eticheta corespunztoare n zona Value label
se acioneaz butonul Add
Operaiunea se reia pentru toate valorile pe care dorim s le etichetm.
Imaginea prezint etichetarea valorilor unei variabile care se refer la calificativul
la un examen. Se observ c valoarea 1 are eticheta SLAB, valoarea 2, eticheta MEDIU
iar valoarea 3, eticheta BUN (nc nu a fost acionat butonul Add pentru a fi finalizat
declaraia etichetei acestei valori).
- 12 -
Dei nimic nu ne oblig s aplicm etichete variabilelor i valorilor, este foarte

recomandabil ca ele s fie atribuite.
Etichetele ajut la citirea mai uoar a rezultatelor (deoarece apar alturi de acestea).
n plus, etichetele sunt asociate prelucrrilor grafice (histograme, bare, etc.) fapt care
reduce necesitatea de a le introduce ulterior prin editarea respectivelor grafice.
Pentru a ti cum s declarm etichetele, este bine s ni le imaginm ca fiind nscrise
pe axele de referin ale unui grafic. Dac se potrivesc, atunci au fost bine definite.
Oricum, ele vor putea fi modificate ulterior sau editate direct n SPSS Viewer.
Declararea valorilor lips (missing values)
Valorile lips sunt de dou tipuri:
valori lips de sistem (system missing values) adic valori care lipsesc din baza de
date (nu au fost introduse). Forma lor de evideniere pe ecran este un punct plasat
n celula respectiv.
valori lips declarate de utilizator (user missing values) adic valori pe care
utilizatorul le declar ca atare. Acestea pot exista n baza de date dar utilizatorul,
din diverse motive, nu dorete s fie luate n calcul. Atenie, odat declarate,
aceste valori nu sunt terse i nici nu sunt marcate n mod evident pe ecran.
Pentru declararea valorilor lips se acioneaz butonul Missing Values din caseta
Define Variables, care genereaz apariia casetei de dialog alturate.
Se observ c exist mai multe opiuni:

declararea a trei valori distincte ca fiind lips (Discrete missing values)
declarea unui domeniu de valori lips (Range of missing values)
declararea unui domeniu la care se poate aduga i o valoare distinct (Range plus
one discrete missing value)
Dei nu pare foarte evident acum, utilitatea funciei de declarare a valorilor lips
nu trebuie subestimat. Foarte adesea suntem nevoii s scoatem din prelucrri
anumite valori (care nu pot fi totui, pur i simplu, terse). S ne gndim numai la
valorile extreme ale unei distribuii, a cror meninere n anumite prelucrri poate
determina modifcri semnificative a rezultatelor.
n concluzie, declararea variabilelor se compune din urmtoarele operaiuni:
- 13 -
Atribuirea numelui (maxim 8 caractere)

Definirea tipului (numeric, caracter, data)
Atribuirea etichetei variabilei
Atribuirea etichetei valorilor, n cazul variabilelor msurate pe scale
nominale sau ordinale
Declararea valorilor lips (care nu au fost recoltate n procesul de
msurare, din diferite motive)
tergerea i inserarea variabilelor

tergerea unei variabile se face prin selectarea acesteia (clic pe capul de variabil)
i acionarea tastei Delete (sau se comand din meniul Edit-Cut).
Inserarea unei variabile se face prin plasarea cursorului-celul pe coloana
variabilei n stnga creia dorim s inserm noua variabil (sau prin selectarea
variabilei respective), dup care se comand, din meniul Data-Insert variable.
Dup aceasta, se definete variabila inserat (nume, tip, etichete).
tergerea i inserarea cazurilor
tergerea cazurilor se face n mod similar variabilelor, prin selectarea acestora
(clic pe capul de linie) i tasta Delete (sau Edit-Cut). Se pot selecta mai multe
cazuri simultan (drag cu mouse-ul pe capul liniilor) dup care se terg ca mai sus.
Inserarea cazurilor se face dup plasarea cursorului pe linia deasupra creia dorim
s inserm un nou caz, dup care se acioneaz n meniul Data-Insert case.
Pentru versiunile de SPSS de la 7 n sus, clic dreapta pe capul de coloan sau de
linie, produce un meniu contextual care permite un acces mai rapid la funciile de
inserare/tergere.
SPSS nu permite Undo (n meniul Edit) dect limitat la ultima aciune. Din acest
motiv, tergerea variabilelor sau a cazurilor trebuie s se fac cu atenie, pentru c
datele pot fi definitiv pierdute. Se va reine, totui, c baza de date se actualizeaz
pe hard disk numai dup salvarea comandat de utilizator. Ca urmare...
Orice modificare efectuat nu produce efecte dect asupra datelor din memoria de
lucru, fiierul rmnnd nemodificat.
n cazul unei aciuni care produce efecte nedorite asupra bazei de date, exist
soluia nchiderii bazei de date, fr a se accepta salvarea cerut de program, dup
care se deschide fiierul respectiv din nou.
Erori frecvente
- Apariia unor cazuri inutile, (umplute cu system missing values) la sfritul unei
baze de date.
Explicaie: Introducerea inutil a unei valori ntr-o variabil, valoare care apoi este
tears. Cu toate acestea, SPSS a creat deja un caz nou, pe care l-a umplut cu system
missing values.
Soluie: Selectarea cazului prin apsarea pe capul de linie i acionarea tastei
Delete (sau Edit-Cut).
- 14 -
Apariia unor variabile inutile (nedorite).

Explicaie: La introducerea din greeal a unei valori ntr-o variabil nedefinit n
prealabil, SPSS creeaz automat o variabil implicit, pe care o denumete VAR00001.
Soluie: Se selecteaz variabil resectiv (clic de mouse pe capul de coloan) i se
acioneaz tasta Delete (sau Edit-Cut).
Exemplu practic de realizare a unei baze de date

S ne imaginm c am aplicat testul Eysenck Personality Inventory, care vizeaz
urmtoarele caracteristici de personalitate: extraversiunea, nevrozismul i atitudinea
defensiv (scala Lie). Pentru analiza datelor suntem interesai s raprtm rezultatele la o
serie de caracteristic demografice ale subiecilor, s zicem: sexul i vrsta. n plus, pentru
a avea controlul datelor dorim s inregistrm i identitatea subiecilor.
Pentru fiecare dintre informaiile pe care dorim s le introducem n baza de date vom crea
cte o variabil.
Variabila
Numele
Tipul variabilei
Eticheta
Etichetele
variabilei
variabilei
valorilor
Identitatea
COD (optm
numeric, Width 2,
Identitate
Nu se aplic
subiecielor
pentru un cod
Decimal Places 0
etichete
(esentiala pentru numeric dac
(presupunem c nu
dect la
a asigura
nu avem
avem mai mult de 99
valorile
identitatea
nevoie de
subieci)
variabilelor
fiecarei
numele
de tip
inregistrari
subiecilor)
categorial
inparte si pentru
(nominale
realizarea
sau
corespondentelor
ordinale)
cu alte baze de
date in care
avem informatii
cu privire la
aceiai subieci)
Sexul
SEX
Numeric, Width 1,
Sex
1=feminin
Decimal Places 0
2=masculin
Vrsta (n ani
VIRSTA
Numeric, Width 2,
Vrsta
mplinii; sau n
Decimal Places 0
luni dac dorim
(presupunem c nu
mai mult
avem subeici cu
precizie)
vrsta peste 99 de
ani)
Extraversiune
EXTRAV
Numeric, Width 2,
Extraversiune
Decimal Places 0
(nu se poate obine o
valoare mai mare de
100 i nu exist
zecimale)
- 15 -
Nevrozism
NEVRO
Lie
LIE
Numeric, Width 2,
Decimal Places 0
valoare mai mare de
100 i nu exist
zecimale)
Numeric, Width 1,
Decimal Places 0
valoare mai mare de
9 i nu exist
zecimale)
Nevrozism
Minciun
Se observ faptul c pentru variabile ale cror nume exprim exact coninutul
(SEX, VRSTA) se poate utiliza fr nici un inconvenient numele i ca etichet. Pentru a
fi mai explicii, s spunem c numele variablei este util n primul rnd SPSS-ului pentru a
manipula variabilele, n timp ce etichetele sunt necesare mai ales utilizatorului pentru a
nelege cu uurin la ce se refer o variabil al crui nume prea scurt
Avem alturat, imaginea DATA EDITOR pentru primii trei subieci introdui cu
variabilele de mai sus:
Insistm pe declararea, cu precdere, a variabilelor de tip numeric: SPSS este un

program de prelucrare statistic, fapt care implic date numerice. Dei el poate opera
i cu date de tip caracter, acestea nu sunt acceptate pentru toate tipurile de proceduri
statistice. Pentru a nu avea surprize, este recomandabil s fie utilizate variabile de tip
numeric n toate cazurile. De exemplu, variabila sex, poate fi declarat de tip caracter
(cu valorile M si F) dar, la fel de bine, de tip numeric (cu valorile convenionale 1 i,
respectiv, 2). n acest din urma caz, pentru explicitarea valorilor se vor folosi
etichetele de valoare (value label).
Introducerea unei variabile care s conin numele subiecilor poate fi necesar doar
dac ne propunem realizarea unor liste ale subiecilor din baza de date. Altfel,
identificarea numeric a fiecrei nregistrri este suficient (i absolut necesar),
scutind un mare volum de munc pe care l-ar implica introducerea numelor. Vom avea
- 16 -
grij ns, ca pe documentul original s scriem codul numeric aferent fiecrui subiect,
astfel nct, la nevoie, s se poat identifica numele (pentru corecii, de ex.)
Variabile multiple pentru ntrebri cu rspuns multiplu: De obicei, o ntrebare prezint
un singur rspuns, dar pot fi situaii n care o ntrebare prezint rspunsuri multiple
care pot fi alese n acelai timp. De exemplu: Ce activiti preferai pentru timpul
liber? 1. sport; 2. filme; 3. petreceri cu prieteni..., etc. ntr-un asemenea caz ne
putem atepta s avem mai multe rspunsuri la aceeai ntrebare. Soluia pentru
introducerea datelor este, de aceea, crearea mai multor variabile, cte una pentru
fiecare variant de rspuns. Astfel, vom avea variabila SPORT care poate primi
dou valori, sa zicem 1 dac este aleas i 0 dac nu este aleas, i aa mai
departe. n acest mod vom putea analiza frecvena alegerilor pentru fiecare variant
de rspuns n parte.
Evitarea variabilelor redundante: Dac la un test nu sunt posibile, de exemplu, dect
rspunsuri corecte sau greite, atunci nu este necesar s declarm o variabil pentru
corecte i una pentru greite dac suma lor d totalul rspunsurilor.
Salvarea bazei de date din Data Editor
O baz de date aflat n lucru nu are un corespondent ntr-un fiier dect dup ce
se execut o salvare a acesteia. Acest lucru nu trebuie niciodat uitat. Spre deosebire de
WORD de exemplu, SPSS nu are o funcie de salvare automat dup un interval de timp
prestabilit. Cu alte cuvinte, indiferent ce modificri facem n Data Editor pe ecran, datele
respective vor fi salvate numai la comanda explicit a operatorului.
Pentru o baz de date nou creat, salvarea se face n mod similar cu orice alt
program cunoscut: File-Save as, care deschide urmtoarea caset de dialog:
Se alege locaia de salvare (Save in)
Se d un nume fiierului (File name)
Se verific tipul de fiier (formatul implicit pentru baze de date SPSS are
extensia .sav)
Se acioneaz Save
SPSS poate salva i n alte formate, dintre cele mai importante fiind: Dbase
sau FoxPro, Lotus 1-2-3, Excel. Salvarea n aceste formate poate fi util
pentru transferul datelor pentru prelucrri ulterioare n alte programe.
- 17 -
Deschiderea unei baze de date SPSS

O baz de date creat cu SPSS se deschide cu comanda File-Open, care activeaz
urmtoarea caset de dialog:
Se alege locaia de citire (Look in)
Se indic fiierul dorit (selectarea cu mouse-ul) n fereastra de cutare
Se indic tipul de fiier ce urmeaz a fi deschis (implicit este de tip SPSS
cu extensia .sav)
Se acioneaz Open
n cazul deschiderii unui fiier de alt tip dect SPSS, se va alege tipul
respectiv din lista Files of type. n cazul n care SPSS nu recunoate tipul de
fiier n care se afl datele noastre, putem ncerca transformarea lor prealabil
din formatul original ntr-un format recunoscut de SPSS. Dei exist riscul
pierderii unor aspecte ce in de formatul de reprezentare a datelor, operaiunea
scutete totui un mare volum de munc.
- 18 -
Operaii de transformare a variabilelor

Dac privim variabilele SPSS din punctul de vedere al modului n care au fost
create, putem distinge dou categorii:
b) variabile primare care includ valori rezultate direct din cercetare si au fost
introduse, de regul, de la tastatur.
c) variabile secundare rezultate prin transformrile aplicate variabilelor primare.
Exemple de situaii n care se impune transformarea variabilelor:
Avem mai multe variabile primare care conin rspunsurile la
ntrebrile unei scale de tip Lickert i suntem interesai s calculm
(ntr-o variabil secundar) suma rspunsurilor.
Avem un numr de variabile primare n care se afl rezultatul parial
pentru fiecare minut din cele 10 cte dureaz un test de calcul aritmetic
i dorim s crem o nou variabil ( secundar) n care s avem
media performanei pe cele 10 minute sau abaterea standard a
performanei pe cele 10 minute, pentru fiecare subiect,
Avem o variabil care conine data naterii i dorim s crem pe baza
ei o alt variabil, care s conin vrsta.
Dorim s transformm variabila care conine vrsta, ntr-o alt
variabil care conine valori pentru categorii de vrst.
Pentru toate aceste situaii, care sunt unele dintre cele mai des ntlnite, dar i
pentru multe altele nc, SPSS ofer proceduri de transformare n meniul Transform.
n continuare, vom prezenta cteva dintre cele mai frecvent utilizate funcii de
transformare a variabilelor.
nsumarea valorilor variabilelor
Se utilizeaz atunci cnd dorim s obinem o variabil prin adunarea valorilor din
dou sau mai multe variabile.
Imaginea de mai jos prezint o tabel de date SPSS care cuprinde scorurile la trei
examene pariale (scor_1, scor_2 si scor_3). Dorim s realizm o variabil care s
cuprind un scor general, prin nsumarea celor trei variabile. Se poate observa c unii
dintre subieci nu au valori la toate cele trei scoruri (valori lips de sistem).
- 19 -
Deoarece prin calculare, o nou variabil este plasat dup toate variabilele
existente, am preferat s inserm o nou variabil imediat dup cele trei pe care dorim s
le nsumm. n acest fel avem i posibilitatea s controlm uor corectitudinea operaiei
de nsumare
Se apeleaz procedura Transform-Compute, care deschide caseta de mai jos:
Se efectueaz urmtoarea succesiune de operaii:

1. Se introduce numele noii variabile n zona Target Variable (total).
2. Se scrie expresia de nsumare n zona Numeric Expression.
Funcia este SUM (expresie numeric, expresie numeric, ...), aa cum se
vede i n zona listei Functions: Ea poate fi scris de la tastatur sau
selectat din lista de funcii i ridicat prin acionarea butonului .
Atenie, sintaxa fiecrei funcii trebuie respectat ntocmai. n cazul
nostru, variabilele numerice se vor scrie ntre paranteze, una cte una, cu
virgul ntre ele. Variabilele pot fi scrise de la tastatur sau mutate la
rndul lor din lista de variabile cu butonul .
- 20 -
Dac variabilele ce vor fi nsumate se afl n baza de date una dup alta, ca
n cazul exemplului nostru, atunci avem posibilitatea s scriem o expresie
de nsumare simplificat, astfel SUM (prima_variabil TO
ultima_variabil). n acest caz, clauza TO va fi cuprins ntre spaii, pentru
a nu fi confundat cu un nume de variabil. Aceast opiune ne sugereaz
ct de important poate fi s aranjm corespunztor variabilele n structura
unei tabele SPSS.
3. Se apas butonul OK
4. Deoarece variabila total exist, SPSS ne ntreab dac dorim s modificm
coninutul acesteia. Dac nu ar exista o variabil cu acest nume, rezultatul
operaiei de calcul ar fi depus ntr-o variabil creat automat i amplasat dup
ultima variabil din baza de date.
Rspundem OK, deoarece tim c am
creat aceast variabil tocmai pentru a
depune n ea suma.
Rezultatul operaiei se vede n imaginea de

mai jos:
Calcularea mediei a dou sau mai multe variabile

Presupunnd c n loc de sum, ne-ar interesa media valorilor de la mai multe
variabile, se procedeaz n mod similar. Expresia de calcul a mediei este MEAN
(expresie_numeric, expresie_numeric, ...), unde ... arat c putem pune oricte variabile
(sau valori) numerice, cu virgul ntre ele. Ca i n cazul sumei, se poate realiza o
expresie cu clauza TO, cu condiia ca variabilele pentru care se realizeaz media s se
afle una dup alta n tabela SPSS.
- 21 -
Reamintim c funcia MEAN poate fi scris de la tastatur sau poate fi adus din
lista de funcii, prin selectare i acionarea butonului .
Este de la sine neles c expresia de calcul poate fi realizat i ntr-o manier
simpl i direct, fr utilizarea funciilor (SUM sau MEAN), astfel:
Pentru sum: scor_1+scor_2+scor_3
Pentru medie: (scor_1+scor_2+scor_3)/3
Se va face o distincie clar ntre suma sau media astfel obinute, care se refer la
suma sau media valorilor de la mai multe variabile, pentru acelai subiect, i suma
sau media pe care am calcula-o pe vertical, la nivelul fiecrei variabile n parte,
pe ntreaga distribuie
Se pot realiza diverse alte funcii de transformare, utilizndu-se marea varietate de
funcii care se gsesc n lista Functions i a cror semnificaie se poate afl din
Help-ul casetei Compute.
Extragerea anului dintr-o variabil de tip cronologic (date)
SPSS ofer funcii de transformare cu variabilele de tip cronologic. Dintre
acestea, vom exemplifica cu realizarea unei variabile care s conin anul naterii, s
zicem, scos dintr-o variabil care conine data naterii. Imaginea de mai jos este extras
din baza de date Employee data.sav
Observm c variabila bdate, care conine data naterii. Pentru a avea vrsta,
trebuie s calculm diferena dintre anul curent (s zicem, 2000) i anul naterii: Pentru
- 22 -
aceasta trebuie s facem diferena dintre anul curent (2000) i anul naterii, care se afl n
cmpul bdate.
Pentru a avea variabila ce urmeaz a fi creat n apropierea variabilei bdate, vom
insera o variabil (denumind-o virsta, de tip numeric, cu doi ntregi). Apoi utilizm
procedura Compute din meniul Transform:
n cmpul Target variable introducem numele noii variabile (virsta).

n zona Numeric Expression vom scrie expresia de transformare, care se bazeaz
pe funcia XDATE.YEAR().
Aceast funcie are ca rezultat extragerea valorii care reprezint anul dintr-o
variabil de tip dat calendaristic. n cazul nostru, XDATE.YEAR(bdate)=anul naterii
Ca urmare, putem scrie expresia astfel: 2000-XDATE.YEAR(bdate)
Mai jos putem vedea rezultatul procedurii Compute:
Se observ n variabil virsta, valorile rezultate prin transformare

(corespunztoare anului 2000).Desigur, transformarea putea fi efectuat i n dou etape.
Mai nti prin extragerea anului naterii ntr-o variabil separat i, apoi, prin efectuarea
unei noi transformri realizarea diferenei dintre anul curent i anul naterii. Am preferat
o soluie ntr-o singur etap pentru c este mai operativ.
Posibilitile de transformare a variabilelor oferite de SPSS permit crearea unor
noi variabile pe baza celor existente, n funcie de necesitile de prelucrare pe
care le avem. n toate cazurile, ns, nu se va alege soluia modificrii valorilor
- 23 -
dintr-o variabil primar peste valorile deja existente. Cu alte cuvinte, este
recomandabil s crem prin transformare variabile noi, i nu s modificm
valorile existente din variabilele primare a cror pierdere ar necesita
reintroducerea lor, n caz de necesitate.
Recodificarea variabilelor
Recodificarea unei variabile nseamn convertirea valorilor acesteia, cu scopul
obinerii unei distribuii bazat pe frecvene cumulate. Procesul este similar cu crearea
unei tabele de frecvene grupate i ne reamintim c poate fi derulat n maniera descris
mai jos:
Pai pentru gruprii de frecvene:
Se face diferena dintre valoarea cea mai mare i valoarea cea mai mic a unei
distribuii
Se mparte valoarea obinut la mrimea posibil (estimat) a intervalului
Se selecteaz mrimea intervalului care conduce la un numr de clase cuprins
ntre 5 i 15
Se determin limita inferioar a primului interval (trebuie s fie un multiplu al
mrimii intervalului)
Se determin limita superioar a primului interval
Se construiesc intervalele de clas pentru fiecare interval, fiind ateni s avem
clase suprapuse sau intervale neacoperite
n principiu, dei este recomandabil obinerea unei grupri de frecvene pe 5-15
clase, se poate opta pentru un numr de clase care servete cel mai bine interesul de
cercetare. De exemplu, n cazul unei distribuii de vrst exprimat n ani, este preferabil
s se opteze pentru clase cincinale sau decade, acestea avnd i o anumit
semnificaie psihologic.
n urma transformrii de mai sus, am obinut variabila virsta. Utilizarea ei ca atare
n analize statistice este improprie, de aceea ar fi foarte util obinerea unei variabile care
s asocieze anumite valori convenionale pentru categorii de virsta. Pentru aceasta putem
efectua recodificarea variabilei virsta pentru a obine o distribuie grupat de frecvene,
astfel:
Se lanseaz procedura Recode - Into Defferent Variables din meniul Transform:
- 24 -
Atenie, se poate alege i opiune Into Same Variables, dar nu este recomandabil
deoarece, n cazul unei erori, nu mai avem la dispoziie variabila iniial pentru o nou
recodificare.
Pai de efectuat la apariia casetei Recode into Defferent Variable:

se trece variabila virsta n zona Numeric Variable Output Variable. Semnul
ntrebrii arat c se ateapt numele variabilei ce urmeaz s fie creat prin
recodificare.
Acest nume se scrie n zona: Name, dup care se apas butonul Change.
Am ales, absolut convenional, ca nume al variabilei recodificate, v_clase.
Urmeaz acum s descriem limitele claselor de recodificare. Pentru aceasta, se
acioneaz butonul Old and New Values
Dei relativ complicat, caseta de declarare a noilor valori n funcie de cele vechi este uor de neles.
n zona Old value, se alege una dintre variantele de definire a valorilor de la care se
pleac. S zicem c am ales soluia s recodificm anii pe intervale de zece ani, primul interval
fiind 29-39, al doilea 40-49, .a.m.d.
Pentru aceasta activm opiunea Range i scriem valorile limite al intervalului dorit.
Dup aceasta, n zona New value oValue, scriem care este valoarea pe care o asignm
acestei clase.
n fine, acionm butonul Add pentru a definitiva operaiunea i trecem la definirea
urmtoarei clase, pn terminm.
n zona OldNew se poate observa lista recodificrilor definite.
- 25 -
Se acioneaz butonul Continue i, la revenirea n caseta anterioar, butonul OK.

Rezultatul operaiuni se vede mai jos:
Se observ corespondena dintre valoarea din variabila virsta, cu valoarea din

variabila v_clase. Pentru valoarea 71, avem missing value n variabila v_clase, deoarece
nu am definit un interval care s cuprind aceast vrst. (De regul, aceast situaie este
determinat de o eroare de definire a intervalelor de clas. Pentru a o repara, ar trebui s
intrm din nou n procedura Recode i s redefinim clasele).
relua.
Transformarea operat pe variabila vrst nu este de loc inutil. Dac am fi dorit

s vedem n ce msur este o relaie ntre nivelul salariului i vrst, ar fi fost oarecum
impropriu (fr a fi propriu-zis o greeal ) s utilizm o statistic parametric (corelaia).
n analizele statistice pe vrste este recomandabil, totui, s operm cu grupe de vrst.
Ordonarea dup rang a valorilor unei variabile
Aa cum am spus n cuprinsul primei pri a acestui volum, este posibil s
ne confruntm cu o variabil cantitativ ale crei valori nu respect condiiile unei
statistici parametrice (vezi figura din stnga, unde valoarea 250 este excesiv). ntr-o
situaie de acest gen, una din soluiile posibile este transformarea de rang, cu procedura
Transform-Rank cases (caseta din dreapta):
- 26 -
Variabila vizat (scor) este trecut n lista Variable(s), se seteaz modul de

ordonare (am ales atribuirea rangului 1 valorii celei mai mari) iar apoi am acionat
butonul OK. Procedura permite fixarea unor parametri de transformare cu ajutorul
butoanelor Rank i Ties, asupra crora nu insistm aici.
Organizarea datelor pentru analiz

SPSS permite efectuarea unor operaii de organizare a datelor care prezint un
interes aparte pentru faza de analiz. Acestea sunt: sortarea, mprirea fiierului n
subgrupuri, selectarea unor seturi de date, combinarea fisierelor (adugarea de cazuri,
adugarea de variabile). Le vom trece n revist, pe rnd.
Sortarea bazei de date
Sortarea este operaia de aranjare a bazei de date n funcie de ordinea
cresctoare/descresctoare a valorilor unei variabile. Ea este util mai ales pentru
inspectarea direct a valorilor de la extrema unei distribuii sau pentru listarea ordonat a
bazei de date. Procedura utilizat este: Data-Sort.
Baza de date nesortat
Caseta Sort Cases
Imaginea din caset descrie sortarea bazei de date, cresctor (Ascending), dup
valorile variabilei scor (rezultatul se vede n imaginea de mai jos).
- 27 -
Se poate efectua sortarea simultan dup mai multe variabile, fiecare n sensul
dorit, de exemplu: grup(Ascending) i scor(Descending).
- 28 -
mprirea bazei de date n subgrupuri

Baza de date SPSS poate fi mprit n subgrupuri, pentru analiz distinct.
Atunci cnd datele sunt astfel organizate, orice procedur de analiz se va efectua distinct
pentru fiecare subgrup.
Procedura este: Data-Split File iar caseta de dialog este cea de mai jos:
Opiunile sunt:
Analyze all cases, do not create groups (pentru analiza integral a datelor)
Compare groups (rezultatele vor fi afiate astfel nct s poat fi uor comparate)
Organize output by groups (rezultatele vor fi afiate n Viewer, separat pe grupuri)
Operaia nu produce nici o modificare vizibil asupra bazei de date. Singurul efect
se vede n zona de afiare a rezultatelor, unde toate procedurile de analiz vor fi
afiate pentru fiecare subgrup n parte.
Pentru a se reveni la analiza intergral a datelor, se va reveni n procedura Split
File i se va seta opiunea Analyze all cases....
Selectarea unor seturi de date
Selectarea unui set de date permite aplicarea procedurilor de analiz numai pe
cazurile selectate. Dac nu se opteaz pentru tergerea datelor neselectate, ele vor fi
pstrate i vor putea fi reintroduse n analiz. Procedura este Data-Select Cases....
Pentru exemplificare, s ne propunem selectarea din baza de date din imaginea de
mai sus a cazurilor aparinnd grupului 1.
Imaginea prezint:
n partea stng, baza de date
La mijloc, caseta principal Select Cases care are:
o Zona listei de variabile
o Zona fixare a condiiilor de selectare Select, unde:
- 29 -
All cases este setarea implicit i nseamn c toate datele intr n

analiz
If condition is satisfied, se bifeaz atunci cnd se dorete declararea
unei condiii de selectare bazat pe o funcie
IF este butonul de deschidere a casetei pentru declararea condiiei,
care deschide caseta Select Cases: if. n cazul nostru, am trecut
variabila grup n zona de editare a functie i am declarat-o egal cu
1. Astfel, toate cazurile din baza de date care au grup=1 vor fi
analizate, celelalte fiind ignorate. Exemplul se bazeaz pe o
selecie simpl, dar sunt permise selecii bazate pe funcii mai
complicate sau care pot s includ combinaii de variabile.
Random sample of cases, permite selectarea unui set aleator de cayuri din
baya de date
Based on time por case range, permite selectarea cazurilor n funcie de
poziia din baza de date.
Use filter variable, selecteaz pe baza valorile unei variabile filtru
Unselected cases Are, permite opiunea de filtrare a cazurilor neselctate
(Filtered) sau de eliminare a lor (Deleted). n acest din urma caz, cazurile
neselectate vor fi terse, dar baza de date, dar actualizarea fiierului de pe
hard disk se va face numai dup prima comanda Save.
o
o
o
o
Dup finalizarea operaiei de selectare de mai sus, baza de date se prezint n felul
urmtor:
- 30 -
Se observ:
Marcarea cu o diagonal a capului de linie corespunztor cazurilor neselectate
Apariia unei variabile de sistem filter_$ care conine valoarea 0 pentru cazurile
neselectate i valoarea 1 pentru cazurile selectate. Aceast variabil poate fi
ulterior utilizat n procedurile de analiz, ca variabil independent (caz n care
se va anula situaia de selectare, prin bifarea opiunii All cases).
Selectarea este utilizat n mod obinuit, pentru alegerea temporar a unui set de
date. Adesea se uit anularea unei selectri existente, atunci cnd se dorete
revenirea al analiza tuturor cazurilor. Efectul este obinerea unor rezultate pe date
pariale.
Alte operaii de organizare a datelor pentru analiz
Opiunile SPSS pentru organizarea datelor sunt mult mai numeroase dect cele
descrise mai sus. Fr a le trata n amnunt, ne vom mulumi s le prezentm sumar:
Agregarea cazurilor, atunci cnd exist nregistrri multiple pentru fiecare subiect
i se dorete pstrarea uneia singure (Data-Agregate)
Adugarea unor cazuri din alt baz de date SPSS (Data-Merge Files-Add
cases...)
Adugarea unor variabile din alt baz de date SPSS (Data-Merge Files-Add
variables...)
Inversarea liniilor cu coloanele (Data-Transpose...)
- 31 -
Calcularea indicatorilor statistici descriptivi

Reamintim faptul c statistica descriptiv are ca obiectiv analiza caracteristicilor
variabilelor. Principalele elemente de statistic descriptiv sunt:
reprezentarea ntregii distribuii, pe cale:
o numeric (analiza de frecvene)
o grafic (bar, histogram, box-plot, stem and leaf)
valorile tendinei centrale
o mod
o medie
o median
valorile mprtierii
o amplitudine
o abatere standard
valorile formei distribuiei
o indice de simetrie (skewness)
o indice de boltire (kurtosis)
SPSS ofer posibiliti variate de reprezentare i de calcul a acestor indicatori. n
acest sens exist, pe de o parte, proceduri specializate i, pe de alt parte, opiuni care pot
fi accesate din interiorul altor proceduri. Fie i acest aspect numai, ar trebui s sugereze
c analiza statistic descriptiv, n ciuda caracterului ei elementar, este o component
indispensabil a analizei statistice.
n ceea ce privete procedurile specializate, ele se lanseaz din meniul StatisticsSummarize (sau Analyze-Descriptive statistics, pentru versiunile mai noi de SPSS) i sunt
grupate n trei proceduri: Frequencies, Descriptives i Explore.
Aceste proceduri ofer prelucrri distincte dar conin i rezultate comune.
Alegerea uneia sau alteia dintre ele depinde de necesitile de analiz.
Procedura Frequencies
Este singura care permite analiza de frecvene.
- 32 -
La apariia casetei Frequencies, variabila pe care dorim s o supunem analizei va

fi trecut n lista de calcul Variable(s), prin selectarea ei i acionarea butonului de
transfer (). Pot fi incluse mai multe variabile n aceast list, rezultatele fiind afiate
distinct, pentru fiecare n parte.
Se va observa pe caseta de mai sus bifarea opiunii pentru tabela de frecvene,

care este funcia specific a acestei proceduri. n plus, prin acionarea butoanelor din
partea de jos a casetei se pot seta alte analize, astfel:
Butonul Statistics
Butonul Chart
Butonul Format
Se aleg indicatorii statistici Se alege tipul de Se aleg diverse moduri de
descriptivi dorii
grafic dorit
prezentare a rezultatelor
Rezultatele sunt afiate n SPSS Viewer n forma de mai jos (dar unele sub altele,
nu alturat, aa cum sunt aranjai aici):
Indicatorii statistici
descriptivi
Tabelul de frecvene
Histograma
- 33 -
Procedura Descriptives
Aceast procedur vizeaz doar indicatorii statistici descriptivi. La lansare,
Satistics-Descriptives, se deschide caseta principal Descriptives.
Se trec variabilele vizate n lista Variable(s)
(dac dorim calcularea scorurilor z, se
Se aleg indicatorii dorii din Options
bifeaz opiunea din stnga-jos a casetei )
Rezultatul analizei, din Viewer
Imaginea bazei de date, n care se vede

apariia variabilei zscor (denumit automat
de progarm) cu valorile transformate n
scoruri z.
Procedura Explore
Procedura Explore este cea mai complex dintre toate procedurile statisticii
descriptive i se poate utiliza atunci cnd se dorete o analiz exhaustiv a variabilei (sau
variabilelor).
Caseta principal Explore
n Dependent List se includ variabilele de analizat
- 34 -
n Factor List se includ eventualele variabile categoriale, n funcie de care se

dorete analiza variabilei analizate
Label cases by, permite etichetarea cazurilor la afiare (rar utilizat)
Display, permite alegerea opiunilor de afiare a rezultatelor numerice (Statistics),
grafice (Plots) sau ambele categorii (Both)
Butonul Statistics deschide caseta pentru alegerea unor indicatori (dar procedura
analizeaz, implicit toi indicatorii statistici descriptivi, de baz)
Butonul Plots, permite alegerea reprezentrilor grafice dorite:
Butonul Options, permite setarea modului de tratare a valorilor lips
Rezultatele analizei Explore, definit mai sus, se prezint astfel:

Indicatorii statistici
Reprezentarea stem-andleaf
Reprezentarea Box plot
- 35 -
Teste parametrice
Testul z (t) pentru media unui singur eantion
Utilizare
Testul z pentru un singur eantion este utilizat pentru se testa diferena dintre
media unui eantion fa de media cunoscut a populaiei din care face parte. Atunci cnd
volumul eantionului este mic (N<30) este utilizat o variant denumit testul t pentru un
singur eantion.
Utilizarea acestui test statistic este condiionat de cunoaterea mediei populaiei.
Dac populaia are o extindere mare, acest lucru este dificil de realizat (n afara cazurilor
n care exist studii speciale, cum sunt cele antropometrice, de exemplu). Dintre
variabilele psihologice ale crei medii pentru populaie este cunoscut, este inteligena,
exprimat n uniti QI (=100). Testul poate fi utilizat, ns, atunci cnd populaia are o
extindere mai redus. De exemplu, dac a fost evaluat nivelul de satisfacie ntr-o
organizaie, se poate testa diferena dintre nivelul de satisfacie la nivelul unei secii fa
de media satisfaciei la nivelul ntregii organizaii (populaie).
Condiii de aplicare
Condiia teoretic de baz este normalitatea distribuiei de eantionare. n temeiul
teoremei limitei centrale, cu ct volumul eantionului este mai mare, cu att normalitatea
distribuiei de eantionare este mai sigur.
Aranjarea datelor
Datele supuse testrii trebuie s fie incluse ntr-o variabil SPSS de tip numeric.
Procedura: Statistics-Compare Means-One Sample T Test
Variabila
testat
Caseta principal
Variabila testat este trecut n lista
Test Variable(s)
n zona Test Value se nscrie media
populaiei (100 n cazul nostru)
Caseta Options permite

alegerea pragului de
semnificaie.
Confidence Interval 95% este
echivalent cu p=0.05 i este
implicit pentru toate testele
statistice
- 36 -
Rezultate
Primul tabel include statistica descriptiv a variabilei testate (N, media, ab.std,
eroarea standard a mediei)
Al doilea tabel include rezultatele testului statistic: t=6.254, df=4, p=0.03,
diferena fa de media populaiei (22.6) i limitele inferioar (12.57) i superioar
(32.63) ale intervalului de ncredere pentru media populaiei estimat de eantionul de
cercetare.
Concluzia testului: media eantionului de cercetare difer semnificativ de QI=100,
ca medie a populaiei.
- 37 -
Testul t pentru eantioane independente

Utilizare
Testul t pentru eantioane independente este utilizat pentru testarea diferenei
dintre mediile aceleiai variabile dependente msurate pe dou grupuri, formate din
subieci diferii. Exemplu: testarea diferenei dintre media scorului la o scal de
sociabilitate aplicat unor copii crescui n familie i unor copii crescui n instituii de
ocrotire. n acest caz, scorul la sociabilitate este variabila dependent, msurat pe scal
cantitativ (interval/raport) iar mediul de educare este variabila independent, exprimat
pe scal nominal dihotomic (familie/instituie de ocrotire)
Condiii
Teoretic, testul t poate fi utilizat pentru eantioane orict de mici, dac distribuia
de eantionare pentru cele dou grupuri este normal i dac variana valorilor n cele
dou grupuri nu difer semnificativ. n ce privete condiia egalitii varianei, ea este
testat cu un teste specifice. Unul dintre acestea este testul Levene, iar n funcie dac
rezultatul su programul calculeaz testul t pe dou ci, aa cum vom vedea mai jos.
Dac variabila dependent nu ntrunete condiiile pentru testul t, se poate apela la
teste neparametrice, astfel:
Testul z pentru proporii (compararea procentului de sociabili din cele dou
grupuri)
Testul Mann-Whitney U, dac se transform valorile variabilei sociabilitate
n valori de rang
Aranjarea datelor
Tabela de date SPSS va conine variabila dependent, de tip numeric, i variabila
independent, de tip nominal, cu dou valori, n funcie de apartenena la un grup sau
altul. Variabila independent poate fi de tip string (codificnd cele dou grupuri cu
valori de genul A i B) sau de tip numeric (cu codificarea convenional 1 i 2). Din
principiu, ns, recomandm cea de a doua variant.
Procedura: Statistics-Compare means-Indpendent Samples T Test
- 38 -
n caseta principal se trece variabila dependent (soc) n lista Test Variable(s)

(pot fi testate mai multe variabile simultan) iar variabila independent (grup), n zona
Grouping Variable. n acest moment, programul ataeaz variabilei dependente dou
semne de ntrebare, sugernd introducerea valorilor care definesc cele dou grupuri.
Concomitent, se activeaz butonul Define Groups a crui acionare deschide caseta
secundar Define Groups, unde se introduc valorile care definesc cele dou grupuri
comparate (ordinea lor nu este relevant). Dup acionarea butonului Continue, caseta
principal devine complet i se poate aciona OK pentru efectuarea testului.
Rezultate
- 39 -
n primul tabel (Group Statistics) avem statistica descriptiv a celor dou grupuri.
Se va observa c programul descrie grupurile prin intermediul etichetelor valorilor. Dac
acestea nu ar fi fost definite, n loc de institutie i familie ar fi aprut 1, respectiv, 2.
Al doilea tabel are dou linii:
Pe prima avem rezultatele testului t pentru cazul asumrii omogenitii varianei
(Levenes Test for Equality of Variances). n cazul nostru, ele sunt egale (Sig.=0.666, ceea
ce se traduce ca o valoare p=0.666, deci mai mare de 0.05 pentru distribuia F a testului
Levene, pe care nu o discutm aici). Ca urmare, vom citi pe aceast linie rezultatul
testului: t=-2.42, df=12, Sig.=0.045.
Pe a doua linie avem rezultatele testului t pentru cazul n care nu s-ar ntruni
condiia de omogenitate a varianei pentru cele dou grupuri. Dac semnificaia testului
Levene ar fi fost mai mic sau egal cu 0.05, rezultatului testului t s-ar fi citit pe aceast
linie.
Pentru exemplul nostru, rezultatul testului t permite acceptarea ipotezei cercetrii,
conform creia copiii crescui n mediu familial sunt mai sociabili (m=22.00) dect cei
crescui n mediu instituional (m=17.71).
- 40 -
Analiza de varian unifactorial (One Way ANOVA)

Utilizare
n mod obinuit, analiza de varian este utilizat pentru a testa semnificaia dintre
mediile msurate pe mai mult de dou grupuri independente (compuse din subieci
diferii). n acest caz valorile variabilei dependente sunt exprimate pe scal cantitativ
(I/R) iar valorile variabila independent este de tip categorial.
Dac se utilizeaz ANOVA pentru a testa diferena dintre dou medii obinute pe
grupuri independente, rezultatul ei este echivalent cu al testului t pentru grupuri
independente (menionm, ns, c aceast utilizare este neuzual).
Exemplu: Se compar media timpului de reacie pentru trei grupuri
experimentale, supuse fiecare, anterior evalurii vitezei de reacie, unui oc electric de
intensitate mic, medie sau mare. n acest caz s-ar putea obiecta c variabila
independent se exprim pe o scal ordinal dar, n esen, ea este de tip categorial, fapt
ce justific aplicarea testului ANOVA.
Condiii
Variabila dependent trebuie s fie de tip I/R i s respecte condiia de
normalitate a distribuiei de eantionare pentru fiecare dintre grupurile supuse
comparaiei. Din fericire, testul F este remarcabil de robust n cazul nclcrii
acestei condiii. ANOVA este mai vulnerabil n situaia cnd distribuia
variabilei dependente este prea aplatizat sau prea nalt (kurtosis0) dect n
cazul asimetriei (skewness0). Cu ct volumul grupurilor supuse comparaiei
este mai mare, cu att aspectele legate de normalitatea distribuiei au un efect
mai mic asupra ANOVA.
Variana valorilor variabilei dependente n interiorul grupurilor definite prin
valorile variabilei independente trebuie s fie egal. Aceast condiie se
numete omogenitatea varianei. nclcarea acestei condiii nu invalideaz
testul ANOVA, care este destul de robust i n acest caz. n orice caz, se vor
analiza cu atenie cazurile care prezint valori extreme, care au un efect
important asupra varianei. Egalitatea (omogenitatea varianei) poate fi testat
cu testul Levene.
Aranjarea datelor
Se construiete o variabil independent (definit ca factor n contextul
ANOVA) care conine codurile de apartenen a cazurilor la fiecare dintre grupurile
supuse analizei (n cazul nostru 1=oc mic, 2=oc mediu, 3=oc mare) i variabila
dependent, care conine valorile timpului de reacie.
- 41 -
Se va reine c procedura ANOVA nu suport variabila independent de tip

string. n imagine baza de date SPSS este ordonat dup variabila shoc dar acest
lucru nu este necesar pentru procedura de calcul.
Procedura: Statistics-Compare Means-One-Way ANOVA...
Caseta principal One-Way ANOVA:
Variabila dependent de trece n lista
Dependent List (pot fi testate mai multe
variabile simultan)
Variabila independent se trece n zona
Factor.
Caseta Post Hoc Multiple Comparison:

Se aleg testele de analiz post-hoc, pentru
testarea diferenei dintre medii luate dou
cte dou. Pentru c nu tim inc dac
variana este omogen, vom bifa cte un
test pentru fiecare caz (Bonferoni, pentru
varian neomogen i Tamhane T2, pentru
varian omogen).
n caseta Options, bifm Descriptives, Homogeneity-of-variance i Means Plot.
- 42 -
Dup finalizarea setrilor se apas OK pe caseta principal i se analizeaz

rezultatele.
Rezultate
Tabelul Descriptives prezint indicatorii descriptivi ai variabilei dependente

pentru grupurile analizate.
Tabelul Test of Homogeneity of Variance conine rezultatul testului Levene. O

valoare neseminificativ a acestuia (cum este cazul nostru p=0.988), conduce la concluzia
c dispersiile n interiorul celor trei grupuri sunt omogene).
Tabelul ANOVA conine rezultatului testului F a crui valoare este 35.264 pentru
un prag p=0.000. Atenie, p=0.000 nu se va nelege ca p=0 ci ca p<0.001. n raportul de
cercetare este chiar recomandabil s nu se utilizeze valoarea 0.000 care poate sugera
certitudinea rezultatului.
Tabelul Post Hoc Tests Multiple Comparisons prezint comparaiile mediilor

celor trei grupuri, luate dou cte dou. Reamintim c comparaiile repetate dintre
mediile a mai mult de dou grupuri conduc la acumularea de eroare de tip I. Testele post-
- 43 -
hoc sunt astfel n concepute nct s minimizeze acest neajuns. Totui, ele nu vor fi n nici
un caz luate n considerare dac testul F nu atinge pragul de semnificaie statistic
(p<0.05).
Avnd n vedere c testul Levene a confirmat omogenitatea varianei, se vor citi
valorile pentru testul Bonferoni (n caz contrar, s-ar fi citit cele pentru testul Tamhane).
Valorile aunt uor de analizat: n prima coloana avem definite grupurile analizate
(etichetarea valorilor variabilei independente ajut mult la inteligibilitatea tabelului). n
coloana a patra (Sig.) se afl semnificaiile pentru diferena dintre medii. Astfel, putem
constata faptul c timpul de reacie dintre grupul supus ocului de mica intensitate i cel
supus ocului de medie intensitate nu difer semnificativ (p=0.520). n acelai timp,
grupul supus unui oc mic difer de grupul supus unui oc mare (p<0.001), la fel ca
i n cazul comparaiei dintre grupul cu oc mediu i cel cu oc mare (p<0.001).
Cu alte cuvinte, variaia semnificativ a timpului de reacie n funcie de cele trei
categorii de intensitate a ocului electric, provine cu precdere de la efectul pe care l are
ocul mare, care provoac o ncetinire a timpului de reacie consistent fa celelalte
dou categorii de oc electric.
Aceasta concluzie este ntrit i de reprezentarea grafic a mediei timpului de
reacie ale celor trei grupuri.
Aa cum se poate observa, timpul de reacie crete mai accentuat la grupul cu oc

mare n timp ce mediile primelor dou niveluri de oc sunt relativ apropiate.
- 44 -
Testul t pentru eantioane dependente (perechi)

Utilizare
Testul t al diferenei mediilor a dou eantioane dependente permite evaluarea
semnificaiei variaiei unei anumite caracteristici la aceeai indivizi n dou situaii
diferite (de exemplu, nainte i dup aciunea unei anumite condiii, ori n dou
contexte diferite, indiferent de momentul manifestrii acestora). Avantajul major al
acestui model statistic este acela c surprinde variaia numit intrasubiect, prin faptul c
baza de calcul este diferena dintre cele dou valori ale fiecrui subiect n parte.
Exemplu: Un grup de subieci efectueaz operaii aritmetice n condiii de linite
i, ulterior, n condiii de zgomot puternic. Ipoteza cercetrii este c zgomotul determin o
reducere a capacitii de calcul numeric.
Condiii
Condiia teoretic a testului este normalitatea distribuiei de eantionare a
distribuiei de diferene. Ca i n celelalte cazuri, teorema limitei centrale determin
normalizarea distribuiei de eantionare pe msur ce volumul eantionului crete.
n situaia n care condiia nu se ndeplinete, se pot utiliza teste neparametrice
echivalente: testul semnului (pentru date nominale) sau testul Wilcoxon (pentru date
ordinale).
Aranjarea datelor
Vor fi create dou variabile distincte, ambele cantitative, msurate pe scal de tip
I/R, care primesc cte o valoare pentru fiecare subiect.
- 45 -
Procedura: Statistics-Compare Means-Paired Sample T Test...

Se selecteaz cu un clic de mouse, pe rnd,
fiecare dintre cele dou variabile. Astfel se
constituie perechea de variabile n zona
Curent selection.
O dat constituit, perechea de variabile se

trece n lista Paired Variables cu butonul de
transfer (). Pot fi create mai multe
perechi de variabile i prelucrate simultan.
Caseta Options permite alegerea pragului de semnificaie (implicit 0.05).

Rezultate
Primul tabel conine statistica descriptiv pentru cele dou variabile.

Al doilea tabel conine testul de corelaie Pearson (r) dintre cele dou variabile.
Evaluarea intensitatea asocierii liniare dintre cele dou variabile este legitim n acest
context, dar ofer o informaie diferit de testul diferenei dintre medii. Alegerea testului
de corelaie sau al testului t se decide n funcie de obiectivul cercetrii.
- 46 -
n fine, ultimul tabel prezint rezultatul testului: t=5.076, df=9, p=0.001. Acesta
permite respingerea ipotezei de nul i acceptarea ipotezei cercetrii, zgomotul afecteaz
capacitatea de calcul aritmetic.
Coeficientul de corelaie liniar Pearson (r)
Utilizare
Corelaia Pearson (r) msoar gradul de asociere dintre variabile. Aceasta se
refer la gradul i sensul de variaie concomitent a valorilor unei variabile n raport cu
cealalt, dup un model de tip liniar.
Domeniul de variaie a coeficientului de corelaie Pearson (r) este ntre r=-1
(corelaie perfect negativ) i r=+1 (corelaie perfect pozitiv). Absena oricrei legaturi
(corelaii) dintre variabile se traduce prin r=0.
Exemplu: Testul de corelaie implic dou variabile dar, adesea, ntr-o cercetare
psihologic numrul variabilelor supuse corelaiei este mai mare de dou. Acest fapt
conduce la ceea ce se numete o matrice de corelaii care este un tabel ale cror celule
cuprind corelaiile dintre perechile de variabile. Pentru exemplificare, s lum n
considerare situaia n care se urmrete evidenierea legturii (asocierii) dintre anxietate
i agresivitate, pe de o parte, i preferina pentru risc pe de alt parte.
Condiii
Condiia principal pentru calcularea coeficientului de corelaie liniar Pearson
este ca variabilele implicate s fie msurate pe scal de interval/raport (alturi de
existena unei forme a distribuiei care nu se abate sever de la curba normal).
Testele neparametrice alternative, pentru cazul n care condiiile pentru utilizarea
testului Pearson nu se ndeplinesc, sunt: testul chi-ptrat (pentru date nominale) sau
coeficienii de corelaie Spearman sau Kendall (pentru date ordinale).
Aranjarea datelor
Se creeaz variabile distincte pentru fiecare caracteristic supus testrii.
Procedura: Statistics-Corelate-Bivariate
Variabilele supuse corelaiei vor fi trecute n lista Variables:
- 47 -
Testul implicit, din zona Correlation Coefficients, este Pearson, dar se poate bifa
un altul (Kendall sau Spearman), dac datele sunt neparametrice.
Tipul implicit de testare a ipotezei este bilateral (Two-tailed), dar se poate alege
unilateral (dac exist o justificare solid).
Flag significant correlations, determin marcarea cu un asterisc a coeficienilor
semnificativi la p=0.05 i cu dou asteriscuri a celor semnificativi la p=0.01. Acest lucru
este util atunci cnd matricea de corelaie este mare, pentru a scoate n eviden valorile
semnificative ale lui r.
Rezultate
Tabelul rezultatelor cuprinde matricea de corelaii a variabilelor analizate. El este

redundant, deoarece prezint aceleai corelaii de dou ori, odat deasupra diagonalei,
odat sub diagonal. Corelaiile variabilelor cu ele nsele sunt perfect pozitive (r=1) i nu
prezint, desigur, nici un interes.
Fiecare celul include urmtoarele informaii:
valoarea lui r
nivelul p
numrul de subieci (N)
- 48 -
n cazul nostru, consemnm corelaii negative dar nesemnificative ntre anxietate

i agresivitate (r=-0.38, p=0.26), pe de o parte, i ntre anxietate i preferina pentru risc,
pe de alt parte (r=-0.40, p=0.24). n acelai timp, se constat o corelaie semnificativ
(r=0.96, p<0.001) ntre agresivitate i preferina pentru risc. Precizm faptul c raportarea
coeficienilor de corelaie se face cu dou zecimale, chiar dac programele i calculeaz
cu trei zecimale.
Dezavantajul acestui tip de tabel const n faptul c avem de fapt o dubl
prezentare a corelaiilor, deasupra diagonalei i sub diagonal. Pentru corelaii implicnd
multe variabile tabelul se va cit cu relativ dificultate.
S presupunem c suntem interesai de corelaiile dintre anxietate i agresivitate
cu variabila preferin pentru risc, nu i de corelaia dintre anxietate i agresivitate. n
acest caz, n caseta principala, Bivariate Correlations, prezentat mai sus, variabilele vor
fi introduse astfel nct variabila preferina pentru risc sa fie ultima din list. Apoi se
apas butonul Paste, al crui efect este deschiderea domeniului Syntax, ca o fereastr
distinct, n care se afl sintaxa procedurii de corelaie. Acolo, pe linia
/VARIABLES=anx agresiv risc, se insereaz cuvntul WITH, avnd grij s existe spaiu
att n sting ct i n dreapta sa.
inserai WITH
Mai departe, se selecteaz ntreaga procedur (cu ajutorul mouse-ului) i se apas

pe butonul Run () de pe bara de comenzi a ferestrei
Rezultatul din Viewer va arta ca mai jos:
Este evident c aceast modalitate se poate aplica pentru orict variabile, dac
avem grij s le aezm separat n list i s includem clauza WITH ntre cele dou
categorii de variabile. Nu pot fi incluse mai multe clauze WITH n aceeai procedur.
- 49 -
Ulterior, putem reveni n fereastra Syntax pentru a o nchide (cu File-Close),

salvnd sau nu procedura astfel modificat.
Expresia grafica a corelaiei (Scatterplot)
Caracterul i intensitatea corelaiei dintre dou variabile se evideniaz extrem de
sugestiv cu ajutorul unei proceduri grafice specifice, numit scatterplot.
Aceasta se lanseaz din meniul principal Graphs-Scatter... care deschide
urmtoarea caset de dialog:
n cazul nostru, s presupunem c dorim reprezentarea grafic a corelaiei dintre

agresivitate i preferina pentru risc, singura semnificativ. n acest scop, selectm pe
caseta Scatterplot opiunea Simple i apsm Define.
Trecem variabila Agresivitate pe axa Y i variabila Preferina pentru risc pe axa Z

(se poate la fel de bine i invers). Se apas OK i se obine graficul din imaginea
urmtoare, care sugereaz foarte clar existena unei asocieri de tip liniar ntre cele dou
variabile.
- 50 -
Reprezentarea grafic este surs de informaii cu privire la natura relaiei dintre

variabile, motiv pentru care este recomandabil utilizarea frecvent a acesteia. Mai mult,
ea este necesar n special atunci cnd valoarea corelaiei este redus, sau
nesemnificativ, deoarece graficul poate scoate n eviden o legtura de alt tip dect
liniar.
O corelaie r=0.92, ca cea obinut mai sus, ntre agresivitate i preferin
pentu risc, este improbabil s se ntlneasc ntr-un studiu real. De fapt, dac
s-ar ntmpla s apar, ar trebui s concluzionm mai degrab c cele dou
variabile se confund, dect c sunt distincte.
- 51 -
Regresia liniar simpl

Utilizare
Analiza de regresie este o aplicaie a corelaiei, utilizat n scopuri de predicie.
Dac evalum agrsesivitatea ca trstur de personalitate i preferina pentru risc ca
expresie a numrului de incidente n trafic, la conductorii auto, se poate estima pe baza
agresivitii riscul de accident nc nainte de dobndirea carnetului de ofer. Acest tip de
regresie, n care exist o singur variabil predictor (agresivitatea) i o variabil criteriu
(tendina spre risc) se numete regresie liniar simpl. Mai frecvent utilizat este regresia
multipl, care efectueaz predicii bazate pe mai multe variabile predictor asupra unei
variabile criteriu. Vom prezenta mai jos regresia liniar simpl, ca o form de introducere
n analiza de regresie, mai uor de neles.
Exemplu: Predicia rezultatului statistic pe baza cunotinelor de matematic,
evaluate anterior nceperii cursului de statistic.
Condiii
Din punct de vedere statistic, condiiile variabilelor care sunt supuse analizei de
regresie sunt aceleai ca n cazul corelaiei, deoarece regresia liniar este o aplicaie a
acesteia.
Din punct de vedere metodologic, predicia presupune, de regul, evaluarea
variabilei predictor anterior variabilei criteriu. Acest fapt poate sugera o relaie de tip
cauzal ntre variabile, dar numai dac sunt ntrunite i alte condiii (cum ar fi izolarea
efectelor altor variabile).
Aranjarea datelor
Structura de variabile este similar analizei de corelaie.
- 52 -
Procedura: n principiu, analiza de regresie ncepe cu coeficientul de corelaie

dintre variabile i vizualizarea imaginii scatterplot. n cazul nostru, urmnd procedura
prezentat mai sus, am obinut o corelaie r=0.74 (p=0.002). Aceste valori confirm
existena unei legturi pozitive semnificative, ntre cunotinele de matematic i
performana la statistic. O idee mai exact ne ofer coeficientul de determinare
r2=0,5476. Acesta ne spune c 54% din variaia performanei la statistic este explicat
de variaia valorilor la variabila cunotine de matematic. Deducem c restul de 46%
din performana la statistic este explicat de alte variabile, necunoscute n aceast faz1.
Pe baza acestor concluzii se poate trece la analiza de regresie a crei finalitate este
aceea de obinere a coeficienilor a (termenul liber, sau originea dreptei de regresie) i b
(panta dreptei de regresie), cu ajutorul crora se poate estima n viitor performana la
statistic pe baza rezultatului la un test de cunotine matematice aplicat n prima zi de
coal. Nendoielnic, o astfel de procedur s-ar justifica mai ales pentru identificarea
studenilor cu poteniale dificulti i care, tocmai fiind avertizai n legtur cu aceste
dificulti vor putea s acorde statisticii o atenie sporit, n vederea obinerii unui rezultat
peste nivelul celui prezis.
Lansarea procedurii: Statistics-Regression-Linear...
n caseta principal Linear Regression, se trece variabila criteriu n zona

Dependent iar variabila criteriu n zona Independent(s).
n caseta Regression Save, bifm Predicted
Values-Unstandardized i ResidualsUnstandardized, care vor avea ca efect
n caseta Statistics, bifm Estimates pentru
crearea de variabile distincte n baza de
obinerea coeficienilor de regresie (opiune
date.
implicit)
Prediction interval (individual) va calcula
limitele de ncredere pentru valorile
prezise.
1
Facem precizarea c valorile i aprecierile nu se bazeaz pe un studiu reale.
- 53 -
Valorile prezise sunt valorile rezultate pe baza modelului de predicie.

Valorile reziduale se calculeaz ca diferen ntre valorile variabilei criteriu si
cele prezise pe baza modelului de regresie.
Analiza rezultatelor
Tabelul Model Summary ofer valoarea coeficientului de regresie, notat cu R,

care este identic cu coeficientul de corelaie dintre cele dou variabile. Dac modelul de
regresie ar fi avut mai multe variabile predictor, R ar fi fost coeficientul de corelaie
multipl dintre predictori i criteriu. Interpretarea este similar coeficientului de corelaie
simpl, la fel ca i pentru R2, care este coeficientul de determinare al lui R. Valoarea lui
ne spune c 55% din variaia performanei la statistic este explicat de variaia variabilei
cunotine de matematic. Adjusted R Square este o corecie a lui R2 n funcie de
numrul de predictori i numrul de subieci.
Tabelul Coefficients conine coeficienii B (nestandardizai) i coeficientul beta

(standardizat), care pot fi utilizai, la alegere, n ecuaia de predicie.
Astfel, de exemplu, dac un student realizeaz un scor de 30 la testul de cunotine de
matematic, se poate estima performan final la statistic cu ajutorul relaiei:
- 54 -
stat _ fin a b * mat _ in 3.406 0.854 * 30 29.02

unde 3.406 este originea iar 0.854 este panta dreptei de regresie.
Sau, dac predicia se face pe baza unui scor standardizat z al variabilei mat_in (s zicem,
0.93), atunci:
stat _ fin beta * mat _ in 0.742 * 0.93 0.69
n acest caz termenul liber are valoarea 0, deoarece originea dreptei pentru scoruri
standardizate se afl n 0.
Desigur, scorurile astfel prezise sunt estimri, atta timp ct corelaia dintre variabile nu
este perfect. Iar estimrile conin cu att mai mult eroare cu ct corelaia dintre variabile este
mai mic (punctele graficului de corelaie fiind mai ndeprtate de dreapta de regresie).
La finalul procedurii analizei de regresie, cu setrile de mai sus, n baza de date apar
cteva variabile noi, aa cum se vede n imaginea de mai jos.
Variabila pre_1, conine valorile prezise pe baza modelului de regresie.
Variabila res_1, conine diferena dintre valoarea real i valoarea prezis

Variabilele lici_1 i lici_2, conin limitele inferioar i superioar ale intervalului
de ncredere pentru fiecare valoare n parte. Pentru a nelege mai bine problema
limitelor, s privim prima valoare prezis de pe coloana pre_1 (25.598). Cu un nivel de
ncredere de 95% (echivalent cu o probabilitate de eroare de 0.05), putem spune c
valoarea adevrat pentru stat_fin prezis pe baza valorii mat_in=26, s-ar afla n
intervalul 21.77 i 29.41.
n fine, rezultatele conin i imaginea scatterplot a relaiei dintre valorile mat_in i
scorurile z ale variabilei pre_1.
- 55 -
Imaginea este identic cu ceea ce am prezentat n cazul corelaiei. Singura

deosebire este dat de trasarea dreptei. Aceasta se face de ctre operator, n felul urmtor:
- se acioneaz dublu clic de mouse pe imaginea graficului din Viewer. prin care...
- graficul este trecut deschis ntr-o fereastr individual de editare, n care...
- se execut procedura Chart-Options-Fit Line- Fit Options. La captul acestei serii
de aciuni apare caseta de mai jos unde se marcheaz Linear regression.
Facem precizarea c acest procedeu de trasare a liniei n interiorul scatterplotului

este utilizabil i n cazul corelaiei. Dac se alege alt model dect cel liniar (de exemplu,
Quadratic regression) se va obine linia de regresie sub form curbilinie, punnd n
eviden abaterile de la modelul liniar. Acest lucru este cu deosebire util atunci cnd
corelaia este mic, fapt care se poate datora faptului c relaia dintre variabile nu
urmeaz un model liniar (vezi exemplul din prima seciune a manualului, bazat pe
corelaia dintre scorurile z i probabilitile de sub curba normal).
Ce utilizm, corelaia sau regresia?
Corelaia i regresia liniar sunt similare i, de aceea, uor de confundat. n unele
situaii pot fi utilizate ambele proceduri.
- 56 -
Se calculeaz corelaia liniar:

atunci cnd exist dou variabile msurate pe aceiai subieci i se dorete
evaluarea gradului de asociere ntre variabile
atunci cnd distribuiile de eantionare ale celor dou variabile sunt normale
(atunci cnd cel puin una dintre variabile este manipulat, nu se calculeaz
corelaia Pearson)
Se calculeaz regresia liniar:
atunci cnd una dintre variabile precede i poate fi cauza celeilalte variabile
atunci cnd una dintre variabile este manipulat, se calculeaz regresia
atenie, calculele regresiei nu sunt simetrice, ca urmare, inversnd variabilele n
ecuaia de regresie se va obine o linie de regresie diferit, n timp ce dac se
inverseaz ordinea variabilelor n calcularea corelaiei, se obine acelai coeficient
r.
- 57 -
Analiza de consisten intern (Cronbach alfa)

Utilizare
Una din condiiile fundamentale a unui instrument de evaluare psihologic este
aceea de a fi sigur i consistent. Exprimat cu alte cuvinte, aceasta nseamn ca itemii din
care este constituit (ntrebri sau sarcini de alt natur) s contribuie la constituirea
semnificaiei unui construct psihic anume: scala unui chestionar, scorul la o caracteristic
psihic de performan, etc. n mod practic i direct exprimat, un instrument este sigur i
consistent atunci cnd itemii din care este compus coreleaz, att ntre ei ct i fiecare
dintre ei cu rezultatul aditiv al tuturor itemilor (scala, scorul global).
Analiza de consisten intern, prin calcularea coeficientului Cronbach alfa, este
metoda statistic prin care se verific respectarea exigenelor enunate mai sus. n esena
ea este o aplicaie a corelaiei, ceea ce reprezint unul din motivele pentru care o tratm
aici. Al doilea motiv, poate nc i mai important, este acela c nc din primii ani de
studiu studenii la psihologie se afl n situaia de a utiliza instrumente psihologice sau de
a le crea ei nii (cel mai adesea chestionare). n acest scop, evaluarea consistenei
interne este o etap absolut obligatorie n elaborarea i finalizarea respectivului
instrument.
ntrebrile unui chestionar sau itemii unui test de performan sunt concepui
pentru a msura un anumit atribut (atitudine, factor, comportament, cunotin).
Consistena intern se definete ca proprietatea itemilor de a corela cu scorul global al
testului sau scalei din care fac parte. Din moment ce toi itemii trebuie sa reflecte un
anumit atribut, ei trebuie s manifeste o varian comun, s coreleze unii cu alii i, n
acelai timp, s coreleze fiecare cu scorul care reflect atributul respectiv. Corelaia dintre
un item i scorul total, din care se omite acel item, ne ofer o indicaie cu privire la
relevana itemului respectiv pentru rezultatul global al testului. Atunci cnd fiecare item
este relevant, putem spune c testul respectiv este are consisten intern.
O alt faet a consistenei unui instrument este sigurana sa n aplicri repetate.
Ea poate fi descris ca stabilitate a scorului atunci cnd acel instrument, sau o form
alternativ echivalent, este aplicat acelorai subieci.
Fr a fi singura procedur statistic utilizabil n astfel de situaii, coeficientul
Cronbach alfa este de departe cel mai cunoscut dintre toate, fiind utilizat ca un indicator
al preciziei de msurare a unui test, al consistenei interne i fidelitii unui instrument
psihologic. n mod normal, valoarea indicelui Cronbach alfa tinde s creasc pe msur
ce numrul itemilor crete. Dar utilizarea unor teste cu muli itemi este neconvenabil din
mai multe motive. Unul dintre acestea este timpul consumat cu aplicarea lor, altul, poate
fi inutilitatea de a pstra itemi a cror contribuie la scorul global este nul, mic sau,
dimpotriv, merge n alt direcie dect acesta. Identificarea i eliminarea acestor itemi,
ori modificarea lor n spiritul atributului msurat, este unul dintre obiectivele analizei de
itemi. Ea are un caracter recursiv, cu evaluri succesive ale relaiilor dintre itemi i dintre
itemi i scorul global, i operarea seleciei itemilor n funcie de relaia lor cu acesta.
Criteriul de baz pentru aceast operaie este valoarea indicelui Cronbach alfa, care are o
plaj de variaie ntre 0 i 1. O scal, pentru a fi considerat consistent, trebuie s ating
o valoare ct mai aproape de 1, nivelul de 0.70 fiind acceptat de majoritatea cercettorilor
ca prag limit de validare a criteriului de consisten intern. Oricum, valoarea lui
Cronbach alfa nu poate fi mai mic de 0.60.
- 58 -
Coeficientul de consisten intern Cronbach alfa se calculeaz n urmtoarele

situaii:
atunci cnd realizm un instrument nou
atunci cnd se traduce un instrument vechi ntr-o alt limb
atunci cnd un instrument utilizat n anumite condiii, urmeaz a fi utilizat n cu
totul alte condiii (de exemplu, trecerea la utilizarea computerizat a unui test
aplicat pn atunci n regim creion hrtie).
Condiii
Crearea unor variabile distincte care conin rspunsurile la fiecare item
(ntrebare).
Valorile nregistrate pentru rspunsuri vor fi valorizate n funcie de semnificaia
lor n raport cu rezultatul global (scala). Cu alte cuvinte, variabilele trebuie s conin
valori care exprim semnificaia rspunsului n raport cu scala global, i nu rspunsul
efectiv al subiectului. De exemplu, dac variantele de rspuns sunt codificate cu 1,
respectiv 2, pot exista ntrebri pentru care varianta 1 aduce un punct la scala iar
varianta 2 aduce zero puncte la scal. ntr-o asemenea situaie, pentru analiza de itemi
valorile codificate de rspuns vor fi transformate n valori corespunztoare (0 i 1). n
acelai mod se va opera i pentru itemii care au mai multe variante de rspuns, cum este
cazul scalelor de tip Likert. Codurile convenionale ale variantelor de rspuns vor fi
transformate n valori, n funcie de semnificaia contribuiei lor la construirea scorului
global.
Aranjarea datelor
Baza de date va conine variabile pentru fiecare dintre itemii supui analizei
(aceasta nu nseamn c nu pot exista i alte variabile, desigur).
Imaginea red rezultatele primilor opt subieci la o scal cu 10 itemi, de tip

Lickert, pentru evaluarea atitudinii fa statistic. Toate prelucrrile care urmeaz sunt
efectuate pe datele complete.
Procedura: Statistics-Scale-Reliability Analysis...
- 59 -
n caseta principal, Reliability Analysis, variabilele itemilor vor fi trecui n lista

Items (imaginea surprinde momentul n care mai sunt de trecut itemii de la 6 la 10).
n lista Model se poate alege unul dintre urmtoarele modele de analiz:
Alfa. Calculeaz Cronbach alfa care pentru date dihotomice este echivalent cu
coeficientul Kuder-Richardson 20 (KR20)
Split-half. Pentru corelaia dintre forme paralele, coeficientul de fidelitate
Guttman, coeficientul Spearman-Brown, coeficientul alfa pentru fiecare jumtate.
Modele Gutman. Coeficienii lambda, de la 1 la 6
Modele paralele i strict paralele. Testele pentru gradul de coresponden
(goodness-of-fit), variana comun, i alte caracteristici ale raporturilor dintre
itemi.
Pentru analiza de consisten intern se alege modelul Alfa.
n continuare, se fac setri de analiz prin deschiderea casetei Statistics:
n zona Descriptives se vor bifa opiunile:

Item (analiza fiecrui item separat);
Scale (analiza scorului global)
Scale if item deleted (analiza scorului fr contribuia unui anumit
item)
n zona Inter-item se va bifa Corelations, pentru a obine matricea de corelaii
dintre itemi.
n zona Summaries se poate cere calcularea unor indicatori descriptivi pentru
fiecare dintre itemii analizai (media, variana, covariana, corelaii).
- 60 -
n practic, bifarea opiunilor marcate pe caseta din imaginea de mai sus ofer
informaiile cele mai importante pentru analiza itemilor unui test. Celelalte opiuni sunt
explicitate n Help-ul casetei i pot fi utilizate pentru o analiz mai rafinat a datelor.
Rezultate
n continuare vor fi analizai un cei 10 itemi ipotetici, alei doar n scop didactic.
Pentru o scal real acest numr ar fi cu totul insuficient. Ca regul general, numrul
itemilor din faza de dezvoltare a unui astfel de instrument ar trebui s aib cel puin
dublul numrului de itemi pe care l preconizm la final. i aceast pentru c analiza de
itemi este un proces selectiv care are drept scop alegerea itemilor adecvai pentru
constituirea unei scale cu cel mai ridicat nivel de consisten intern posibil.
Rularea procedurii, cu setrile de mai sus ne ofer urmtoarele categorii de
informaii:
Tabelul de mai sus cuprinde lista itemilor, media abaterea standard i numrul
cazurilor. . Analiza valorilor permite evidenierea tendinei centrale i a mprtierii
rspunsurilor pentru fiecare item. Eventuale anomalii pot fi sesizate nc din aceast faz.
De exemplu, se poate constata c media itemului I_02 este mai mic dect a celorlali,
fapt care sugereaz rspunsuri grupate spre valorile mici.
Tabelul Correlation Matrix ofer o imagine a gradului de asociere dintre itemi.

Valorile sunt utile, pe de o parte, pentru a sesiza itemii care tind s aib relaii negative cu
ceilali, fiind un semn al unei posibile probleme de construire respectivilor itemi. Din
- 61 -
tabelul alturat rezult c itemii i_02 i i_03 tind s se asocieze negativ cu majoritatea
celorlali itemi. Pe de alt parte, valori extrem de ridicate ale unor corelaii, aproape de 1,
ar putea sugera c itemii respectivi prezint un grad de similitudine care nu justific
utilizarea lor n aceeai scal (ar putea fi, de exemplu itemi formulai extrem de
asemntor).
Tabelul urmtor conine un set de indicatori statistici descriptivi la nivelul ntregii

scale, rezultat prin nsumarea rspunsurilor la fiecare item (medie, varian, ab.std, ) sau
al itemilor.
n fine, cea mai important dintre categoriile de informaii, este tabelul Itemtotal Statistics, care include relaiile dintre itemi i scorul global. Dou dintre coloanele
alturate au o importan particular: Corected Item-Total Correlation (corelaia dintre
fiecare item i scorul global) i Alpha if Item Deleted (valoarea lui Cronbach alfa, dac
respectivul item ar fi eliminat).
Dac privim prima dintre aceste dou coloane, observm c doi dintre itemi (i_03
i i_09) au corelaii negative cu scorul global. Aceasta nseamn c ei nu numai c nu
aduc informaie util n raport cu atributul msurat ci, dimpotriv, merg ntr-o direcie
opus acestuia. n acest caz trebuie s verificm dac valorile itemului respectiv au fost
corect codificate. Dac da, atunci singura soluie posibil este eliminarea itemilor n
cauz. Observm, de asemenea, c itemul i_02 are o corelaie extrem de mic cu scorul
global (0.015). Contribuia sa la construcia scalei este extrem de mic, nesemnificativ.
Cu alte cuvinte, nici nu stric dar nici nu ajut, n schimb, consum timpul subiectului
pentru a rspunde.
- 62 -
Pe ultima linie a imaginii gsim valoare lui Cronbach alfa, care este 0.457, o
valoare care este modest n raport cu nivelul minim necesar (0.702) dar care poate fi
crescut prin eliminarea itemilor nepotrivii, n primul rnd a celor care coreleaz negativ
cu scorul global.
Urmtoarea faz este reluarea prelucrrii, cu eliminarea itemilor negativi din lista
Items din caseta principal. n general, nu este recomandabil eliminarea mai multor
itemi simultan, dar itemii negativi pot fi scoi toi odat, fr reineri. Iat care este
rezultatul eliminrii itemilor 3 i 9 asupra consistenei interne:
Ca urmare a noii iteraii, se observ c itemul i_02, care anterior avea o corelaie
pozitiv dar extrem de mic, a dobndit o corelaie negativ cu scala. Ca urmare, va fi
eliminat. n orice caz, chiar i itemii pozitivi, care au corelaii cu scala mai mici de 0.1 nu
trebuie pstrai, pentru simplul motiv c nu contribuie la constructul psihologic vizat,
fiind doar consumatoare de timp n aplicarea instrumentului. De altfel, se i observ c
prin eliminarea acestui singur item, valoarea lui Cronbach alfa crete la 0.75.
Se reia prelucrarea eliminndu-se itemul i_02 din lista din caseta principal i se
obine urmtoarea configuraie de rezultate:
Datele indic o valoarea Cronbach alfa de 0.75. n plus, dac privim ultima
coloan de cifre, vedem c prin eliminarea oricrui item nu am obine o valoare mai
Dei programele computerizate l calculeaz cu un numr mai mare de zecimale, indicele Cronbach alfa se
raporteaz doar cu dou zecimale.
- 63 -
ridicat dect aceasta. Ca urmare, itemii rmai pot constitui o scal consistent de
evaluare a constructului psihologic pentru care au fost alei.
n concluzie, cu ocazia iteraiilor succesive se vor elimina, in ordine:
itemii care au o corelaie negativ cu scorul global
itemii cu corelaii mici, nerelevante
Cu ct avem mai muli itemi n aceast faz, cu att avem posibilitatea s pstrm
itemi care coreleaz mai intens cu scala i, deci, s atingem un nivel mai ridicat de
consisten intern. Este de la sine neles c, n cazul n care construim un instrument ale
crui ntrebri se adreseaz unor sub-scale diferite, consistena intern se va evalua
separat pentru setul de ntrebri corespunztor fiecrei sub-scale.
O scal consistent intern ne ofer garania c itemii instrumentului nostru
merg mpreun, msoar acelai construct psihologic. Atenie, ns, acest lucru nu ne
permite nc s afirmm c msoar exact ceea ce n-am propus s msoare. Aceast
problem va fi rezolvat ulterior, prin studii de validare.
Aa cum concluziile studiilor statistice sunt mai sigure atunci cnd sunt efectuate
pe eantioane mai mari, acelai principiu se aplic i n cazul construciilor scalelor: cu ct
mai muli itemi cu att mai bine pentru consistena scalei.
Numrul itemilor necesari pentru a completa o scal care nu a atins valoarea
acceptabil a indicelui Cronbach alfa poate fi estimat cu ajutorul formulei SpearmanBrown:
k * (1 x )
x * (1 k )
unde:
x este valoarea curent a lui Cronbach alfa
k este nivelul dorit al lui Cronbach alfa
k este factorul de multiplicare a scalei pentru a se obine k
ntr-un mod similar, se poate estima valoarea lui Cronbach alfa (k) care ar fi
atins pornind de la un anumit nivel calculat al acestuia x i un anumit factor de
multiplicare al numrului de itemi (k):
k * x
1 ((k 1) * x )
Exemplu:
Avem o scal cu 20 de itemi i x=0.50
Ci itemi ar trebui adugai pentru a atinge un nivel de 0.70?
k * (1 x ) .70 * (1 .50)
2.33
x * (1 k ) .50 * (1 .70)
Deci, pentru a atinge un de 0.70 va trebui s avem o scal de 20*2.3347 itemi,

ceea ce nseamn c ne vor mai trebui 27 de itemi pe lng cei 20 deja existeni (estimare
- 64 -
valabil pentru situaia n care noii itemi ar avea aceeai corelaie inter-itemi cu cei deja
existeni).
Pentru acelai caz, cu ct ar crete dac am aduga 30 de itemi:
k=(nr. itemi iniiali+nr. itemi noi)/nr. itemi noi=(20+30)/20=2.5
k * x
2.5 * .50
0.71
1 ((k 1) * x ) 1 ((2.5 1) * .50)
Desigur, se presupune c noii itemi adugai vor fi la fel de buni ca i cei deja
utilizai. De aceea este posibil ca rezultatul formulei s fie o estimare uor optimist dar
nu mai puin util.
Utilizarea improprie a analizei de itemi
Atunci cnd o scal este utilizat pentru a msura cunotine asupra unui anumit
subiect, pentru alt scop dect cel de selecie sau evaluare comparativ ntre indivizi,
utilizarea indicelui Cronbach alfa nu este adecvat. O valoare redus a acestuia nu poate
nsemna c itemii nu msoar un anumit tip consistent de cunotine (fapt incontestabil
din moment ce fac parte dintr-un univers de cunoatere bine definit) ci mai degrab c
subiecii au rspuns la ntmplare. Mai departe, n cazul n care rspunsurile la o anumit
ntrebare sunt corecte pentru cea mai mare parte a subiecilor, sau pentru toi, dei am fi
tentai s apreciem acest fapt ca o expresie pozitiv a corelaiei itemului cu scorul
global, avem de a face mai degrab cu un item prea uor, care nu este suficient de
discriminativ pentru a fi pstrat.
Chiar i n acest tip de situaii, totui, analiza de itemi poate fi folositoare ca
modalitate de identificare a itemilor greit formulai, a celor nerelevani sau, pur i
simplu, pentru a scoate n eviden erorile tipice pe care le fac subiecii la anumite
ntrebri.
- 65 -
Teste neparametrice nominale

Testul z al proporiei pentru un singur eantion
Utilizare
Testul z pentru proporii pentru un eantion, este utilizat n cazul variabilelor
dihotomice pentru a testa diferena dintre proporiile valorilor n eantion prin comparaie
cu proporia la nivelul populaiei.
Exemplu: La ntrebarea cine se uit la telenovele? rspund DA 7 subieci, dintre
care 5 femei i 2 brbai. ntrebarea cercetrii este dac femeile se uit ntr-o proporie
mai mare dect brbaii la telenovele.
Condiii
Cunoaterea proporiei la nivelul populaiei pentru valorile variabilei testate. n
cazul nostru, raportul femei/brbai este cunoscut din studiile demografice (51%/49%)
Aranjarea datelor
Se creeaz variabila dihotomic cu valori numerice. Variabilele de tip string nu
sunt acceptate de procedura SPSS. n cazul nostru, valorile sunt 1 pentru feminin i 2
pentru masculin.
Procedura: Statistics-Non Patametric Tests-Binomial...
Variabila testat este trecut n lista Test Variable List:
- 66 -
n zona Define Dichotomy se alege Get from data, dac variabila este
dihotomic, sau Cut point, dac variabila este continu, prin fixarea unei
valori care mparte distribuia n dou categorii.
n zona Test proportion se introduce proporia primei categorii.
Butonul Options permite solicitarea statisticii descriptive pentru variabila
testat.
Rezultate
Rezultatul n cazul exemplului dat cuprinde frecvena pe categorii, procentul i

semnificaia testului n raport cu proporia la nivelul populaiei (p=0.243). n acest caz, se
accept ipoteza de nul i se respinge ipoteza cercetrii. Proporia femeilor care se uit la
telenovele nu difer semnificativ de proporia brbailor, prin raportare la proporia lor n
populaie.
- 67 -
Testul semnelor
Utilizare
Testul semnelor este utilizat pentru a testa diferena dintre valori, utilizndu-se
semnul diferenei i nu valoarea acesteia, atunci cnd ambele valori sunt msurate pentru
aceiai subieci . Dac nu ar exista nici o diferen ntre valorile perechi, atunci numrul
diferenelor pozitive ar trebui s fie egal cu cel al diferenelor negative. Cu ct numrul
diferenelor de un anumit semn este mai mare comparativ cu cel al diferenelor de semn
opus, cu att crete posibilitatea ca diferena dintre variabile s fie statistic semnificativ.
Exemplu: ntr-un experiment cu privire la efectul motivrii asupra memorrii,
subiecilor li se cere s memoreze cuvinte dintr-o list, nainte si dup introducerea unui
factor motivant. Dat fiind faptul c numrul subiecilor este prea mic pentru asumarea
normalitii distribuiei de eantionare, se alege testul semnului, n locul testului t pentru
eantioane dependente.
Condiii
Variabilele vor fi de tip numeric, iar valorile exprimate n aceeai unitate de
msur, pentru a se putea face diferena lor.
Aranjarea datelor
Imaginea de mai jos conine variabilele inainte i dupa, care vor fi analizate.
Variabila dif conine rezultatul diferenei dupa-inainte.

Variabila semn, conine semnul diferenei. Ambele sunt prezentate numai pentru
a face mai evident baza de calcul a testului deoarece, n fapt, nu sunt relevante sub
aspectul procedurii SPSS.
2. Dac nu se dispune de valorile variabilelor ci numai de semnul diferenei,
testul semnului va fi calculat manual, pe baza formulei 4.7.
Procedura: Statisstics-Nonparametric Tests-2 Related Samples...
n prima faz, cele dou variabile sunt
selectate, pe rnd, prin clic de mouse pe
fiecare, constituindu-se n pereche. Acest
fapt se observ n partea de jos a casetei, n
Apoi, perechea de variabile este trecut n

lista Test Pair(s) List: prin acionarea
butonului .
Dac este necesar, se pot testa simultan mai
- 68 -
zona Current Selections.

Se bifeaz Sign n zona Test Type.
multe perechi de variabile.
Rezultate
Tabelul Sign Test cuprinde numrul diferenelor pozitive, respectiv negative,

pentru cazurile din baza de date. n cazul nostru, exist 7 diferene pozitive i nici o
diferen negativ.
Tabelul Test Statistics, prezint semnificaia testului (p=0.016). Ipoteza de nul se

respinge dac valoarea lui p este mai mic dect pragul fixat i care, implicit, este 0.05. n
exemplul dat, ipoteza de nul se respinge, acceptndu-se ipoteza cercetrii (motivarea
stimuleaz memorarea).
- 69 -
Testul Chi-ptrat al asocierii (independeei)

Utilizare
Testul chi-ptrat este utilizat pentru evidenierea gradului de asociere ntre dou
variabile categoriale.
Exemplu: S presupunem c am evaluat numrul femeilor i al brbailor
diagnosticai cu sindrom de stres postraumatic (PTSD) dintr-un mic ora, afectat de un
cutremur de pmnt, iar datele sunt cele din urmtorul tabel de coresponden:
PTSD
Non-PTSD
Femei
20
30
Brbai
10
40
Problema cercetrii este dac incidena PTSD este n legtur cu caracteristica de

sex.
Condiii
Cele dou variabile nu trebuie s se intersecteze (s nu existe subieci care s

fie inclui n mai mult de o celul de tabel).
Este recomandabil ca frecvena ateptat s nu ia valori mai mici de 5 (sau, cel
puin, n nu mai mult de 20% din celule).
Nici o celul nu trebuie s aib frecvena ateptat 0..
Aranjarea datelor
Datele pot fi incluse n Data Editor n dou moduri:
a. Sub forma unor nregistrri distincte pentru fiecare caz
Acest mod poate fi extrem de dezavantajos atunci cnd sunt multe cazuri sau cnd
exist deja o statistic global a fenomenului PTSD n raport cu sexul.
b. Sub forma unor nregistrri distincte pentru valorile caracteristicii de sex:
- 70 -
n aceast situaie, se introduc frecvenele PTSD pentru toate combinaiile

valorilor celor dou variabile analizate i frecvenele asociate fiecreia. Pentru a se realiza
corespondena dintre variabilele sex i PTSD cu variabila frecv, se apeleaz la procedura
Data-Wheight Cases...:
Facem precizarea c n tabelele de date din imaginile de mai sus variabilele au

fost codificate numeric cu 1 respectiv 2, att pentru sex ct i pentru PTSD, valorile fiind
etichetate. Faptul c n celule apar etichetele i nu valorile, se obine prin setarea DataValue Labels.
Procedura Chi-ptrat accept i variabile de tip caracter (string) dar reamintim
recomandarea de principiu ca toate variabilele s fie declarate de tip numeric.
Procedura: Statistics-Summarize-Crosstabs...
Casetele de configurare sunt urmtoarele:
n caseta principal Crosstabs se trec variabilele analizate n lista Row(s),

respectiv Columns(s). Pot fi analizate mai multe perechi de variabile simultan.
Rezultatul analizei nu depinde de modul de plasare a variabilelor pe linie sau pe
coloan. Dac de dorete crearea unui grafic al corespondenei dintre variabile, se
va bifa i Display clustered bar charts.
n caseta Statistics se bifeaz Chi-Square.
- 71 -
n caseta Cell Display se bifeaz Counts-Observed; Percentages-Row, Column,

Total i Residuals-Unstandardized (bifarea opiunilor este n funcie de
informaiile pe care le dorete analistul).
Rezultate
Imaginea prezint tabelul de coresponden, avnd pe linii valorile caracteristicii

de sex iar pe coloane valorile aferente variabilei PTSD. n celulele tabelului se afl
valorile solicitate prin configurarea casetelor. Vom exemplifica pentru celula
feminin/da:
Count 20 indic numrul femeilor cu PTSD
%within Sex 40.0% indic procentul femeilor care au manifestat PTSD din totalul
femeilor
%within PTSD indic procentul femeilor cu PTSD din totalul celor care au
manifestat PTSD
% of Total indic procentul femeilor cu PTSD din totalul subiecilor
Residual indic diferena dintre numrul de femei cu PTSD (frecvena observat)
i frecvena ateptat (n cazul nostru, +10)
n tabelul Chi-Square Tests citim valoarea testului Pearson Chi-Square (16.66) i,

n special, pragul de semnificaie al acestuia (p=0.000 care va fi citit ca p<0.001). n
cazul particular al acestui exemplu, unde tabelul de coresponden este format din dou
linii i dou coloane, valoarea lui chi-ptrat poate fi luat de pe linia Continuitiy
Correction (15.04) cu valoarea aferent a pragului de semnificaie: p<0.001.
Valoarea testului chi-ptrat fiind mai mic dect nivelul alfa 0.05, se respinge
ipoteza de nul i se confirm ipoteza cercetrii: exist o inciden mai mare a reaciei de
stres postraumatic la femei dect la brbai.
- 72 -
n raportarea statisticii chi-ptrat va fi inclus valoarea gradelor de libertate (df) i

numrul cazurilor
Valoarea lui chi-ptrat se raporteaz cu dou zecimale
Graficul de tip bar permite vizualizarea relaiei dintre variabile.

Testul Chi-ptrat pentru coresponden (goodness of fit)
Utilizare
Testul chi-ptrat pentru gradul de coresponden se utilizeaz atunci cnd dorim
s comparm frecvenele observate unei singure variabile categoriale cu frecvenele
ateptate, dinainte cunoscute.
Exemplul 1: Avem evaluarea nivelului de inteligen pe cinci categorii valorice,
de la foarte slab, la foarte bun i dorim s tim dac distribuia acestor calificative se
supune curbei normale, procentele aferente pe curba normal fiind cunoscute (2.5%,
14%, 67%, 14%, 2.5%).
Exemplul 2: Am solicitat unui grup de tineri s i exprime genul muzical preferat
i am obinut frecvene diferite pentru mai multe genuri de muzic. Problema este dac
diferenele dintre aceste frecvene sunt semnificative, presupunnd c, dac nu ar fi
semnificative proporiile preferinelor pentru genurilor muzicale, ar trebui s fie identice
(adic, dac ar fi trei genuri, fiecare ar trebui s ntruneasc un procent de 33.33%).
Aranjarea datelor
Vom exemplifica pe o situaie corespunztoare celui de-al doilea exemplu. Baza
de date se poate constitui fie prin nregistrarea fiecrui caz n parte (avnd o variabil
pentru genul muzical i o alta pentru exprimarea preferinei fa de acesta), fie, ca n
exemplul anterior, prin nregistrarea rezultatelor sintetice i ponderarea variabilei
gen_muz cu variabila frecv prin operaia Data-Weight cases...:
- 73 -
Procedura: Statstics-NonParametric-Tests-Chi-Square...
n caseta Chi-Square Test se trece variabila analizat n zona Test Variable

List.
Se bifeaz All categories equal, acesta fiind modelul n raport cu care
dorim s testm frecvenele variabilei analizate
Dac am fi dorit s le testm n raport cu alte frecvene cunoscute, am fi
bifat Values i, apoi, am fi introdus pe rnd acele frecvene (scriindu-le n
dreptul lui Values i nregistrndu-le prin butonul Add)
Rezultate
Cele dou tabele cu rezultate din Viewer prezint:

Frecvenele observate, frecvenele ateptate i valorile reziduale (diferena
dintre frecvene) pentru cele trei genuri muzicale
Valoarea testului Chi-ptrat al corespondenei (12.17), df(2) i p=0.002
Acest rezultat justific respingerea ipotezei de nul i acceptarea concluziei c
subiecii diferenele dintre preferinele pentru cele trei genuri muzicale sunt semnificative
i nu se datoreaz variaiei ntmpltoare de eantionare.
- 74 -
Testul z al diferenei dintre dou proporii independente

Utilizare
Acest test se utilizeaz atunci cnd se dorete compararea a dou proporii
obinute pentru o variabil dihotomic.
Exemplu: n urma unui studiu comparativ cu privire la interesul fa de
fenomenele paranormale, efectuat n rndul studenilor de la Universitate comparativ cu
studenii de la Politehnic, se nregistreaz urmtoarele rezultate3:
La psihologie: 25 studeni nu cred n fenomenele paranormale iar 175
cred
La politehnic: 124 nu cred n fenomenele paranormale iar 32 cred
Problema cercetrii este dac diferena dintre cei cred n fenomenele
paranormale din cele dou categorii de studeni este semnificativ.
Aranjarea datelor
Datele pot fi introduse fie caz cu caz, existnd o variabil pentru opinia fa de
fenomenele paranormale i una pentru tipul de instituie de nvmnt, fie ca n imaginea
de mai jos, care presupune o prealabil sintetizare a datelor:
o variabil (paranorm) pentru codificare credinei n fenomenele

paranormale;
o variabil (stud_la) pentru apartenena la una din cele dou instituii de
nvmnt superior;
o variabil (frecv) pentru frecvena cazurilor.
Este important de reinut c toate variabilele trebuie s fie numerice. n baza de

date de mai sus, variabila paranorm aia valoarea 1 pentru cred i valoarea 2
pentru nu cred, iar variabila stud_la are valoare 1 pentru Universitate i 2 pentru
Politehnic.
Valorile variabilelor au fost etichetate corespunztor iar afiarea etichetelor n
locul valorilor, n celulele tabelului de date, a fost obinut cu setarea View-Value
labels din meniul SPSS Data Editor. De reinut c, dei afieaz etichetele, SPSS
va opera n calcule cu valorile, devenite invizibile.
Procedura: SPSS nu dispune de o procedur specific pentru calcularea direct a
diferenei dintre dou procente. n acest scop se utilizeaz o procedura Crosstabs i testul
chi-ptrat.
Datele nu sunt reale
- 75 -
n prealabil, se execut procedura Weight pentru variabilele categoriale

(paranorm i stud_la) n funcie de variabila frecv, care contorizeaz
numrul cazurilor.
Operaia asociaz valorile variabilelor categoriale (paranorm i stud_la) cu

valorile variabile frecv. Efectul ei este unul invizibil pe ecran dar se va vedea n
analizele statistice ulterioare.
Efectul de ponderare (wheight) a unei variabile rmne activ atta timp ct nu se
pondereaz o alt variabil sau nu se anuleaz ponderarea efectuat. La salvarea
fiierului se salveaz i variabila ponderat. Includerea variabilei ponderate n
diverse proceduri de analiz are efecte specifice.
Dac datele ar fi fost introduse n baza de date caz cu caz, operaia Wheight nu ar
mai fi fost necesar.
2. Se execut procedura Statistics-Summarize-Crosstabs... pentru variabilele
paranorm i stud_la, cu selectarea Chi-Square din caseta Statistics. (nu
mai prezentm imaginile, acestea fiind identice cu cele de la testul chiptrat).
Rezultate
SPSS Viewer prezint mai nti tabelul de coresponden dintre variabilele

categoriale, cu valorile variabilei ponderate prin procedura Wheight.
- 76 -
Din tabelul Chi-Square Tests citim valoarea Pearson Chi-Square (161.598).

Testul z pentru diferena proporiilor se calculeaz ca radical din valoarea lui
chi-ptrat:
z
161.598 12.71
Semnul lui z se afl din diferena proporiilor testate, astfel:

p a pb
175 32
0.875 0.205 0.67

200 156
Decizia statistic se ia prin raportarea valorii calculate a lui z la valorile critice ale
acestuia de pe curba normal, pentru test unilateral sau bilateral.
n cazul nostru, pentru test bilateral cu alfa=0.05, z calculat (12.71) este mai mare
dect z critic (1.96), fapt care permite respingerea ipotezei de nul i confirmarea ipotezei
c studenii de la Universitate cred ntr-o msur semnificativ mai mare n fenomenele
paranormale dect studenii de la Politehnic.
- 77 -
Teste neparametrice pentru date ordinale

Testul Mann-Whitney (U) pentru dou eantioane independente
Utilizare
Testul Mann-Whitney este utilizat pentru testarea diferenei dintre grupuri
independente pentru care variabila dependent este exprimat n valori ordinale (de rang)
sau atunci cnd, chiar dac este de tip cantitativ, nu suport un test parametric (testul t).
Exemplu: La ieirea dintr-un club de noapte, un psiholog interesat de efectul
depresiv al drogurilor a efectuat interviuri n legtur cu acest aspect i a identificat un
numr de 10 tineri care au consumat cte o pastil de Ecstasy i un numr de 10 tineri
care au consumat doar alcool. Apoi i-a convins s ia parte la un experiment i le-a
administrat un chestionar de evaluare a depresiei. Acelai chestionar a fost aplicat din
nou, peste trei zile. Obiectivul studiului este, n prima faz, acela de a verifica ipoteza c
cele dou tipuri de drog (Ecsatsy i alcool) au efecte depresante diferite. n acest scop vor
trebui comparate valorile la depresie ale celor dou grupuri. Aceast analiz va fi
efectuat att pentru valorile depresiei de la prima msurare ct i pentru cele de la a doua
evaluare a depresiei.
Aranjarea datelor
Variabilele din baza de date sunt urmtoarele:

cod_sub, un cod numeric de identificare a fiecrui subiect (dei exemplele
anterioare nu au cuprins aceast variabil, ea nu trebuie s lipseasc din nici o
baza de date)
drog, pentru tipul de drog utilizat (sunt afiate etichetele, iar valorile sunt
1=Ecstasy, 2=Alcool)
depr_1, scorul la depresie la prima evaluare
depr_2, scorul la depresie la a doua evaluare
- 78 -
Variabilele dependente din exemplul nostru au valori msurate pe scal

cantitativ. Testarea lor cu un test ordinal nu presupune o prealabil transformare
de rang, programul efectund automat aceast transformare. Procedura se aplic
n acelai mod i direct pe valori ordinale de rang.
Procedura: Statistics-Non Parametric Tests-2 Independent Samples...
Se cuvine s precizm c, n mod normal, datele de acest tip ar conduce la
utilizarea testului t pentru eantioane independente. Cu toate acestea, avnd n vedere
volumul foarte mic al eantionului, utilizarea unui test neparametric este de preferat.
n caseta Two-Independent Samples Tests variabilele analizate sunt trecute n lista

Test Variable List.
Rezultate
Tabelul Ranks ofer informaii sintetice despre cele dou variabile: volumul
grupurilor, media rangurilor i suma rangurilor.
Tabelul Test Statistics include valorile testului Mann-Whitney pentru cele dou
variabile testate simultan, depresia imediat i remanent. Valorile de interes din tabel
sunt cele ale lui Z i nivelul de ncredere p. n cazul nostru, se observ depresia imediat
nu difer semnificativ n funcie de tipul de drog utilizat, n timp ce depresia remanent
- 79 -
este semnificativ diferit, mai mare la utilizatorii de Ecstasy dect la utilizatorii de alcool
(conform datelor din tabelul anterior).
Testul Wilcoxon pentru dou eantioane perechi
Utilizare
n exemplul de mai sus, psihologul a testat ntr-o prim faz semnificaia
diferenei dintre cele dou grupuri definite prin tipul de drog diferit (eantioane
independente). Una dintre problemele cercetrii este i aceea dac exist o diferen ntre
nivelul depresiei imediate i cel al depresiei remanente. Acest tip de analiz nu se poate
face dect pentru subiecii aparinnd aceluiai tip de drog utilizat.
Aranjarea datelor
Este identic cu cea prezentat pentru testul Mann-Whitney.
n acest caz, deoarece analiza trebuie efectuat separat pe grupurile de consum
Ecstasy/Alcool, exist dou soluii. Prima ar fi selectarea (cu Data-Select Cases) a
primului grup i efectuarea testului, apoi selectarea celui de-al doilea grup i efectuarea
testului. O soluie mai elegant este, ns, aceea de a declara mprirea bazei de date n
funcie de grupurile definite prin tipul de drog.
n acest scop se va utiliza procedura
Data-Split File...
n locul setrii implicite Analyze all cases, do not create groups, se bifeaz
opiunea Compare groups i se declar variabila ale crei valori vor servi drept criteriu de
mprire a bazei de date n grupuri de analiz separat (n cazul nostru, tipul de drog)
prin trecerea ei n zona Groups Based on:. Efectul acestei aciuni este acela c toate
prelucrrile care vor fi efectuate din acest moment se vor aplica, separat, pe fiecare grup
identificat prin valorile variabilei.
Operaiunea de mprire a bazei de date nu are semne vizibile, fapt care poate
face s fie uitat i, astfel, atunci cnd se revine la prelucrri care ar trebui s
implice toat baza de date rezultatele vor fi incorecte. De aceea, se va avea n
vedere revenirea la setarea Analyze all cases, do not create groups atunci
prelucrarea pe grupuri a bazei de date nu mai este becesar.
Procedura: Statistics-Non Parametric Tests-2 Related Samples...
Setarea procedurii n caseta Two-Related-Samples tests se face n doi timpi:
- 80 -
1. Se selecteaz prin clic de mouse fiecare

variabil, constituindu-se perechea supus
analizei
2. Se acioneaz butonul pentru a se

transfera perechea de variabile n zona Test
Pair(s) list.
Se bifeaz opiunea pentru testul Wilkoxon (care este, de fapt, cea implicit)
Rezultate
Tabelul Ranks ofer informaii sintetice despre rangurile pozitive i negative

pentru cele dou grupuri, numrul subiecilor, media rangurilor i suma lor.
Tabelul Test Statistics prezint valorile comparative ale depresiei pentru cele dou
grupuri. Aa cum se observ, diferena este semnificativ (p=0.007) n cazul
consumatorilor de Ecstasy i nesemnificativ (p=0.053), n cazul consumatorilor de
alcool. Concluzia general a studiului este aceea c Ecstasy, comparativ cu alcoolul, are
un efect depresant mai mare (testul Mann-Whitney) i mai accentuat cu trecerea timpului
(testul Wilcoxon).
- 81 -
Testul Kruskal-Wallis pentru mai mult de dou eantioane independente

Utilizare
Testul Kruskal-Wallis este utilizat atunci cnd avem o variabil dependent
ordinal, msurat pentru mai mult de dou grupuri independente (formate din subieci
diferii), i dorim s testm diferena dintre acestea. Acest test pentru date ordinale este
analog testului ANOVA pentru date cantitative.
Exemplu: A fost studiate relaia dintre condiiile familiale (familie armonioas,
mam singur, familie conflictual) i frecvena reaciilor emoionale pozitive la copiii de
vrst precolar, pe durata unei sptmni. Problema cercetrii este dac diferenele sunt
semnificative iar mediul familial are legtur conduita emoional a copiilor.
Aranjarea datelor
n baza de date, variabila familie a fost codificat i etichetate astfel:

1=familie armonioas, 2=mam singur, 3=familie conflictual. Etichetele sunt afiate ca
urmare a opiunii Data-Value Labels. Rezultatele vor fi identice dac variabila
dependent este exprimat i direct n valori de rang.
Procedura: Statistics-Non Parametric tests- k Independent Samples...
n caseta principal se trece
variabila testat n zona Test
Variable List: iar variabila
independent n zona
Gouping Variable. Se
activeaz comanda Define
Range...
Se definete domeniul
valorilor variabilei
independente, n cazul
nostru: minim 1, maxim 3.
Forma final a casetei este

aceasta.
Testul Kruskal-Wallis este
bifat implicit.
- 82 -
Rezultate
Primul tabel include informaii descriptive cu privire la variabila testat:

numrul subiecilor din fiecare grup i media rangurilor pentru fiecare grup. De precizat
c programul acord rangul 1valorii celei mai mici. Datele din tabel indic descreterea
mediei rangurilor (expresii emoionale pozitive numeroase) de la familia armonioas la
cea conflictual.
Rezultatul testului, afiat n tabelul Test Statistics, se exprim printr-o valoare chiptrat (6.33) cu dou grade de libertate i p=0.042. Ca urmare, ipoteza de nul poate fi
respins. Datele confirm ipoteza c mediul familial (exprimat prin cele trei tipuri de
familie) i pune amprenta asupra expresivitii emoionale a copiilor de vrst
precolar.
- 83 -
Testul Friedman pentru msurri repetate

Utilizare
Testul Friedman se utilizeaz pentru testarea diferenei de rang n cazul unei
variabile msurate repetat, de mai mult de dou ori, pe acelai grup de subieci. El este
echivalentul testului ANOVA pentru msurri repetate, pentru date cantitative. Dac este
utilizat pentru doar dou msurri repetate, rezultatul su este echivalent cu al testului
Wilcoxon, prezentat mai sus.
Exemplu: Efectele altitudinii asupra memoriei sunt testate pe un grup de alpiniti.
Capacitatea de memorare de cuvinte este msurat la trei nlimi diferite: 1000m, 3000m
i 6000m. Problema cercetrii este dac diferena de performan de memorare
corespunztoare celor trei nlimi este semnificativ. Dat fiind volumul extrem de mic
am eantionului (N=5), efectuarea unui test parametric (ANOVA RM) ar fi nesigur iar
apelul le testul Friedman este pe deplin justificat.
Aranjarea datelor
Variabilele mem_1000, mem_3000 i mem_6000 conin numrul cuvintelor

memorate pentru fiecare dintre cei 5 alpiniti. Nu este necesar transformarea lor n valori
de rang, deoarece acest lucru va fi efectuat automat de program. Dac datele primare sunt
sub form de ranguri, ele vor fi introduse ca atare, rezultatul fiind identic.
Procedura: Statistics-Non Parametric Tests-K related Samples...
Se seteaz opiunea Friedman iar variabilele testate sunt trecute n lista Test
Variables:
- 84 -
Rezultate
Primul tabel prezint media rangurilor pe nlimi (rangul 1 este atribuit valorii
celei mai mici). n al doilea tabel gsim valoarea testului Friedman exprimat n valori
chi-ptrat (8.40), avnd un nivel de semnificaie p=0.015. Acest rezultat permite
respingerea ipotezei de nul i confirm ipoteza c memoria cuvintelor este n legtur cu
nlimea (pe cele trei niveluri avute n vedere).
Coeficientul de corelaie pentru date ordinale (Spearman)
Utilizare
Testul de corelaie a rangurilor (Spearman) este echivalentul pentru date
ordinale testului de corelaie Pearson. Rezultatul su variaz pe aceeai plaj de valori (1/+1) i se interpreteaz n mod similar cu rezultatul testului Pearson.
Exemplu: S lum n considerare studiul aceluiai grup de alpiniti, care au
efectuat, la aceleai nlimi descrise mai sus, i un test de vitez de decizie (msurat n
zecimi de secund). Problema cercetrii este dac ntre performana de memorare i ce de
timp de decizie este o relaie (variaie concomitent) semnificativ.
Aranjarea datelor
]
Alturi de variabilele memorie pentru cele trei nlimi, avem acum i
variabilele pentru timpul de decizie.
Procedura: Statistics-Corelation-Bivariate
- 85 -
Variabilele supuse testului de corelaie se trec n lista Variables:

Se anuleaz setarea pentru testul Pearson i se bifeaz Spearman (aici am ales i
testul Kendal tau-b, care este echivalent lui Spearman, doar pentru a le putea compara. n
practic, se va utiliza doar unul dintre acestea dou).
Aceast configurare a casetei de dialog produce o matrice de corelaii cu ase linii
i ase coloane pentru fiecare dintre cele dou teste alese. n fiecare celul a matricii se
vor afla, aa cum vom vedea, mai multe numere. Din acest motiv citirea ei nu este tocmai
comod.
Pentru a obine un format mai convenabil de prezentare a rezultatelor,
recomandm o procedur suplimentar, prezentat anterior la corelaia Pearson: Se
acioneaz butonul Paste care deschide fereastra Syntax, unde gsim comenzile
procedurii. Aici se introduce clauza WITH ntre primul grup de variabile (memorie) i al
doilea grup de variabile (decizie):
Mai departe, procedura de corelaie se lanseaz cu butonul de pe bara de

comenzi a ferestrei Syntax.
Aceast variant de lucru nu este obligatorie. Se poate efectua corelaia i
direct din caseta principal, dar, aa cum am spus, rezultatele vor fi prezentate ntr-o
form mai puin ergonomic.
Rezultate
Tabelul cu rezultate cuprinde pe linii variabilele memorie i pe coloane,

variabilele decizie. Deoarece am cerut calcularea simultan a ambilor coeficieni de
corelaie, datele sunt dublate. Este de la sine neles c, n realitate nu vom utiliza dect
unul dintre aceti coeficieni de corelaie a rangurilor.
Din celulele tabelului de mai sus nu ne intereseaz dect cele care cuprind
corelaia dintre memorie i decizie la acelai palier de nlime. Pentru a fi mai vizibile,
- 86 -
am ngroat valorile utile analizei. n jumtatea de sus a tabelului, avem corelaiile

pentru testul Kendall iar n jumtatea de jos pe cele ale testului Spearman.
Testul Kendall al corelaiei dintre memorie i decizie la 1000 de metri are
valoarea
-0.94, semnificativ la p=0.023. La interpretarea coeficienilor de corelaie este extrem de
important s se ia n considerare, simultan, semnul i semnificaia variaiei valorilor. n
cazul nostru, valori mari ale memoriei, nseamn o capacitate de memorare mai bun iar
valori mari ale timpului de decizie nseamn capacitate de decizie mai proast (sub
aspectul vitezei, desigur). n consecin, un coeficient de corelaie negativ ntre aceste
variabile indic, de fapt, o variaie concomitent pozitiv a memoriei i vitezei deciziei
(cnd capacitatea de memorare scade, i decizia este mai lent, timpul de decizie fiind
mai mare).
Analiza coeficienilor din tabelul de mai sus arat existena unei corelaii de rang
semnificative (p<0.05) ntre memorie i decizie la toate palierele de nlime.
Dac facem comparaia dintre coeficienii Spearman i Kendal, vom vedea c,
dei ei difer valoric, semnificaiile se afl, n toate cazurile, de aceeai parte a deciziei
statistice (respingerea ipotezei de nul). Utilizarea unuia sau altuia dintre cei doi
coeficieni rmne la latitudinea cercettorului.
- 87 -

Aplicatii SPSS

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Aplicatii SPSS

Încărcat de

Drepturi de autor:

Formate disponibile

Aplicaii SPSS

SPSS prezentare general

editarea datelor (construirea bazelor de date, transformri ale variabilelor)

Domeniile de lucru n SPSS

Domeniul bazei de date (Data Editor)

O sesiune de lucru cu SPSS presupune, n mod necesar, existena unei

Domeniul afirii rezultatelor (Viwer)

Fiierul rezultat prin salvarea acestei ferestre are extensia .SPO

Utilizarea direct a procedurilor impune aprofundarea SPSS

Funcii de modificare a datelor prin calculare,

Grupeaz procedurile de calcul statistic

Grupeaz procedurile de reprezentare grafic

Aici se afl un tutorial

Paii analizei statistice cu SPSS

Inserarea datelor ntrun document

caseta File open/File of type)

n versiunile de SPSS mai recente, editarea variabilelor se face ntr-o fereastr

Ca urmare a operaiei de mai sus, apare o caset de dialog ca n imaginea de mai

Variable Name: zona de declarare a numelui de variabil. VAR00001 este

n versiunile mai recente de SPSS editarea variabilei nu presupune acest tip de

n cazul utilizrii unor caractere improprii, apare un mesaj de eroare i se permite

Se acioneaz butonul Type de pe caseta Define Variable

Apare caseta Define Variable Type

, unde se marcheaz tipul variabilei i se declar caracteristicile

Se acioneaz butonul Continue, pentru a se reveni la caseta Define

[Numeric], care cuprind valori de tip numeric cu sau fr zecimale.

Variabilele de tip Date beneficiaz de funcii speciale de tratare i analiz n

Dei nimic nu ne oblig s aplicm etichete variabilelor i valorilor, este foarte

Se observ c exist mai multe opiuni:

Atribuirea numelui (maxim 8 caractere)

tergerea i inserarea variabilelor

Apariia unor variabile inutile (nedorite).

Exemplu practic de realizare a unei baze de date

Insistm pe declararea, cu precdere, a variabilelor de tip numeric: SPSS este un

Deschiderea unei baze de date SPSS

Operaii de transformare a variabilelor

Se efectueaz urmtoarea succesiune de operaii:

Rezultatul operaiei se vede n imaginea de

Calcularea mediei a dou sau mai multe variabile

n cmpul Target variable introducem numele noii variabile (virsta).

Se observ n variabil virsta, valorile rezultate prin transformare

Pai de efectuat la apariia casetei Recode into Defferent Variable:

Se acioneaz butonul Continue i, la revenirea n caseta anterioar, butonul OK.

Se observ corespondena dintre valoarea din variabila virsta, cu valoarea din

Transformarea operat pe variabila vrst nu este de loc inutil. Dac am fi dorit

Variabila vizat (scor) este trecut n lista Variable(s), se seteaz modul de

Organizarea datelor pentru analiz

Caseta Sort Cases

mprirea bazei de date n subgrupuri

All cases este setarea implicit i nseamn c toate datele intr n

Calcularea indicatorilor statistici descriptivi

La apariia casetei Frequencies, variabila pe care dorim s o supunem analizei va

Se va observa pe caseta de mai sus bifarea opiunii pentru tabela de frecvene,

Rezultatul analizei, din Viewer

Imaginea bazei de date, n care se vede

n Dependent List se includ variabilele de analizat

n Factor List se includ eventualele variabile categoriale, n funcie de care se

Butonul Options, permite setarea modului de tratare a valorilor lips

Rezultatele analizei Explore, definit mai sus, se prezint astfel:

Reprezentarea Box plot

Caseta Options permite

Testul t pentru eantioane independente

Procedura: Statistics-Compare means-Indpendent Samples T Test