Pdfslide - Tips 97271214 Aplicatii Spss

7/29/2019 97271214-Aplicatii-SPSS
Aplicaţii SPSS
Marian Popa
http://slidepdf.com/reader/full/97271214-aplicatii-spss 1/86
7/29/2019 97271214-Aplicatii-SPSS
MARIAN POPA...................................................................................................1
SPSS prezentare generală...................................................................................................................................3
................................................................................................................................................................................6
Paşii analizei statistice cu SPSS..........................................................................................................................6
Editarea datelor....................................................................................................................................................8
Exemplu practic de realizare a unei baze de date..........................................................................................15
Operaţii de transformare a variabilelor..........................................................................................................19

Însumarea valorilor variabilelor................................................................................................................19
.........................................................................................................................21
Calcularea mediei a două sau mai multe variabile....................................................................................21
Extragerea anului dintr-o variabilă de tip cronologic (date) ....................................................................22
Recodificarea variabilelor.........................................................................................................................24
Ordonarea după rang a valorilor unei variabile........................................................................................26
Organizarea datelor pentru analiză.................................................................................................................27

Sortarea bazei de date...............................................................................................................................27
Împărţirea bazei de date în subgrupuri......................................................................................................28
Selectarea unor seturi de date....................................................................................................................28
Calcularea indicatorilor statistici descriptivi..................................................................................................31
Teste parametrice...............................................................................................................................................35
Testul z (t) pentru media unui singur eşantion .........................................................................................35
Testul
Analizat pentru eşantioane
de varianţă independente...................................................................................................37
unifactorială (One Way ANOVA)............................................................................40
Testul t pentru eşantioane dependente (perechi).......................................................................................44
Coeficientul de corelaţie liniară Pearson (r).............................................................................................46
Regresia liniară simplă..............................................................................................................................51
Analiza de consistenţă internă (Cronbach alfa)........................................................................................57
Teste neparametrice nominale..........................................................................................................................65

Testul z al proporţiei pentru un singur eşantion........................................................................................65
Testul semnelor.........................................................................................................................................67
Testul Chi-pătrat al asocierii (independeţei).............................................................................................69
Testul Chi-pătrat pentru corespondenţă (goodness of fit).........................................................................72
Testul z al diferenţei dintre două proporţii independente.........................................................................74
Teste neparametrice pentru date ordinale......................................................................................................77

Testul Mann-Whitney (U) pentru două eşantioane independente............................................................77
Testul Wilcoxon pentru două eşantioane perechi.....................................................................................79
Testul Kruskal-Wallis pentru mai mult de două eşantioane independente...............................................81
Testul Friedman pentru măsurări repetate................................................................................................83
Coeficientul de corelaţie pentru date ordinale (Spearman).......................................................................84
-2-
7/29/2019 97271214-Aplicatii-SPSS
SPSS prezentare generală

„SPSS for Windows” este un pachet de programe destinat analizei statistice a
datelor.
GraphPad, Deşi
MSexistă
Excel,o varietate
care are şideelprograme de acest gen
funcţii statistice), (SAS,
SPSS Statistica
se distinge prinforstructurarea
Windows,
riguroasă şi uşurinţa utilizării, chiar şi pentru începători.
Cea mai recentă versiune disponibilă la această dată este SPSS 12.0. Acest manual
nu acoperă în mod special o anumită versiune, ci face referire în general la versiunile sub
Windows. În esenţă, toate versiunile sub Windows oferă acelaşi pachet de funcţii statistice
iar diferenţele, chiar dacă sunt, nu sunt relevante la nivelul unui curs introductiv de
statistică.
 Simbolul care precede această propoziţie indică introducerea unei informaţii

importante, care se impune a fi reţinută.
 Ne vom axadepebază
elementele o prezentare
de operaresintetică,
în mediulaxată pe esenţial, considerând cunoscute
Windows.
Funcţii de bază ale SPSS
 editarea datelor (construirea bazelor de date, transformări ale variabilelor)

 prelucrarea statistică a datelor (statistici descriptive, teste de semnificaţie)
 prezentarea rezultatelor, sub formă numerică sau grafică
 realizarea unor proceduri proprii de prelucrare sau de a modifica procedurile
standard SPSS. Această opţiune este rezervată utilizatorilor avansaţi şi nu va
face obiectul prezentării în acest manual.
Domeniile de lucru în SPSS
Particularitatea principală a interfeţei de lucru cu SPSS este aceea că rezervă

fiecăreia dintre funcţiile de mai sus un domeniu special („ecran”, sau „fereastră”). Astfel, la
lansarea programului, acesta deschide automat o fereastra rezervată editării datelor ( Data
Editor ) şi una afişării rezultatelor (Viewer ). Putem numi aceste ferestre şi domenii de lucru,
deoarece la nivelul fiecăruia avem la dispoziţie o varietate de funcţii şi opţiuni specifice.
Ca să înţelegem mai bine, trebuie să ne imaginăm „domeniile de lucru” ca fiind „ferestre”
distincte, similare celor ale documentelor Word, cu deosebirea că, în acest caz, fiecare
fereastraTrecerea
acoperăde
funcţii specifice.la alta se face într-unul din următoarele moduri:
la o fereastră
 Din meniul SPSS/Windows, prin alegerea ferestrei dorite;
 Utilizând butoanele din bara de comenzi directe a ferestrei SPSS;
 Utilizând butoanele de pe bara de sarcini a sistemului de operare (din partea
de jos a ecranului).
-3-
7/29/2019 97271214-Aplicatii-SPSS
Domeniul bazei de date (Data Editor)
La lansarea programului SPSS se deschide fereastra domeniului de editare a datelor

(SPSS Data Editor ). Ea se prezintă ca în imaginea de mai jos, având caracteristicile
obişnuite ale unei ferestre Windows, cu o structură de linii şi coloane:
-- pe
pe linii
coloane
suntsunt variabilele
cazurile (decaz,
(în acest ex.,cinci
cod_sub, rezultat)
subiecţi )
 O sesiune de lucru cu SPSS presupune, în mod necesar, existenţa unei baze

de date.
 SPSS operează cu o singură bază de date la un moment dat.
 Pentru a deschide o altă bază de date, sau a crea una nouă, cea aflată în
lucru va fi închisă. Programul solicită salvarea ei prealabilă, dacă acest lucru nu a
fost deja efectuat.
 Dacă vrem să prelucrăm date aflate în baze de date (fişiere) diferite, este
necesară aducerea lor în aceeaşi bază de date (procedura DATA-Merge files, care va
fi descrisă mai târziu).
 Meniurile ferestrei Data Editor nu se vor activa integral decât atunci când
va exista cel puţin o variabilă definită şi valori pentru cel puţin un caz.
 Baza de date SPSS poate fi creată direct, cu ajutorul structurii (ferestrei)
Data Editor , sau poate fi deschisă cu ajutorul comenzii File-Open, aşa cum vom
exemplifica mai târziu.
Domeniul afişării rezultatelor ( Viwer

)
SPSS depune rezultatele prelucrărilor într-o secţiune aparte a domeniului de lucru.

Aceasta cuprinde toate tipurile de rezultate, atât de tip numeric cât şi de tip grafic. Fereastra
respectivă (Viewer ) este organizată în două zone distincte: una pentru navigare (în partea
stângă) şi alta pentru afişarea rezultatelor (în partea dreaptă).
-4-
7/29/2019 97271214-Aplicatii-SPSS
 Fişierul
 Un fişierrezultat prin salvarea
cu rezultate SPSS nuacestei
poate fiferestre
deschisare extensia
decât .SPO
din SPSS
 Dacă se doreşte transmiterea rezultatelor în afară SPSS se va proceda fie la
„exportul” rezultatelor cu procedura corespunzătoare din meniul File/Export , fie la
transferarea prin Select/Copy/Paste într-un editor grafic de tipul MS Word.
Domeniul de editare a procedurilor directe (Syntax)
SPSS permite, în afara operării prin intermediul mediurilor, şi lucrul direct cu

proceduri definite de utilizator. Aceasta se face în interiorul unei ferestre speciale, care
permite, pe de o parte, editarea procedurilor, iar pe de altă parte, lansare lor în execuţie.
Imaginea
indicatorilor de mai
statistici jos redăredaţi
descriptivi, comenzile SPSS
mai sus, pentru calcularea
în fereastra procedurii
.
SPSS Viewer de calcul
 Utilizarea directă a procedurilor impune aprofundarea SPSS

 Se poate seta afişarea procedurilor curente în SPSS Viewer, concomitent cu
rezultatele. ( Edit/Options/Viewe/Display commands in the log )
-5-
7/29/2019 97271214-Aplicatii-SPSS
Meniurile SPSS
Meniurile de tip listă se aseamănă cu meniurile altor programe sub Windows. Fără a intra în
amănunte, iată o prezentare succintă a meniurilor pentru fereastra DATA EDITOR:
Meniul Funcţii principale Observaţii

File Operaţii de deschidere şi salvare de fişiere
Operaţii de Select/Copy/Cut/Paste, Find şi, cel
Edit mai important, setarea caracteristicilor de lucru
ale SPSS (Options-în versiunile pt. Win 9X)
În cazul ferestrei Data Editor , setează modul
View de afişare: cu sau fără bara de butoane, cu sau
fără liniile despărţitoare ale celulelor.
Funcţii de operare cu variabilele; definire, Importante pentru
Data inserare, ştergere, selectare, sortare, adiţionare pregătirea datelor în
de fişiere, etc. vederea prelucrării
Importante pentru
Funcţii de modificare a datelor prin calculare,
Transform recodificare. pregătirea datelor în
vederea prelucrării
Prin opţiunile fiecărei
Statistics proceduri se pot obţine şi
Grupează procedurile de calcul statistic
(Analyze) reprezentări grafice
specifice
Graph Grupează procedurile de reprezentare grafică
Informaţii despre variabile, structurare pe
Utilities
seturi de variabile
Lista ferestrelor deschise cu posibilitatea de
Window
selecţie
Aici se află un tutorial
extrem de sugestiv de
operare cu SPSS, iar de la
versiunea 7.5 în sus, o
Help Informaţii de ajutor
procedură de sprijin în
alegerea tipului de
prelucrare statistică
(Statistic Coach)
Paşii analizei statistice cu SPSS

În principiu, prelucrarea datelor cu SPSS presupune următoarele etape:
Opţiuni:
(a) Introducerea directă a datelor în DATA EDITOR
1 Introducerea datelor (b) Deschiderea unui fişier de date SPSS (extensia .SAV)
(c) Importarea unui fişier de format diferit (se alege din
caseta File open/File of type)
-6-
7/29/2019 97271214-Aplicatii-SPSS
Corecţia erorilor, selecţii, recodificări, transformarea

variabilelor prin calcule, declararea valorilor lipsă,
2 Pregătirea datelor
combinarea datelor din două fişiere diferite (meniurile Data,
Transform)
Selectarea procedurii
3 Meniurile Statistics (sau Analyze) şi Graphs
satistice
Selectarea variabilelor
În conformitate cu configuraţia casetei de dialog care este
4 ce urmează a fi supuse
afişată la fiecare procedura
prelucrării
Se acţionează butonul OK din caseta de dialog a procedurii
5 Rularea procedurii  Butonul devine activ numai atunci când sunt întrunite
condiţiile presupuse de procedura respectivă
Rezultatele prelucrărilor sunt afişate într-o fereastră
6 Analiza rezultatelor specifică (SPSS Viewer ), cu funcţiuni de editare grafică sau
de tip text, în funcţie de versiune.
Se editează rezultatele afişate în Viewer, aducându-le la
7 Editarea rezultatelor forma dorită
 Dublu clicsub
peaspect graficdin Viewer conduce la intrarea
un element
elementului respectiv în regim de editare)
Inserarea datelor într- Rezultatele din SPSS Viewer se preiau cu Select/Copy şi se
8
un document depun cu Paste în orice tip de editor de documente.

 SPSS este un program puternic de analiză statistică a datelor. Utilizarea lui optimă
presupune, în mod necesar, stăpânirea de către operator a cunoştinţelor teoretice de
statistică.
 Aşa cum un program de editare grafică nu compensează lipsa de talent la desen, nici
SPSS nu poate fi cu adevărat exploatat de către cei care nu au cunoştinţe de statistică.
În lipsa acestora,
adevărat posibilă. nici alegerea procedurilor şi nici interpretarea rezultatelor nu va fi cu
-7-
7/29/2019 97271214-Aplicatii-SPSS
Editarea datelor
O bază de date în SPSS este o structură formată din linii şi coloane, la intersecţia
cărora se formează celulele care conţin, fiecare, o anumită unitate de informaţie.
 Existenţa unei baze de date deschisă în fereastra Data Editor este o condiţie

obligatorie pentru
SPSS operează operarea
numai cu SPSSbază de date deschisă la un moment dat
cu o singură

În principiu, o bază de date SPSS se obţine pe una din următoarele căi:
a) Crearea ei prin operaţiunea de definire a variabilelor şi introducerea datelor de la
tastatură;
b) Deschiderea unei baze de date SPSS, existente pe un suport de memorie;
c) Importarea unei baze de date din alt format decât SPSS
În continuare, vom trata pe rând, fiecare din cele trei situaţii:
a) Crearea unei baze de date SPSS

În linii generale, pentru crearea unei baze de date proprii în SPSS, se procedează astfel:
 Se lansează SPSS
 Se definesc variabilele bazei de date în domeniul Data Editor
 Se introduc datele pentru fiecare caz (subiect) în parte
 Se salvează baza de date (extensia specifică este *.sav)
Definirea variabilelor
 se acţionează Define variable din meniul Data
 soluţie mai directă este dublu clic pe capul de coloană
 În versiunile de SPSS mai recente, editarea variabilelor se face într-o fereastră

specială. Cu toate acestea, elementele de bază rămân aceleaşi ca al versiunile
anterioare.
-8-
7/29/2019 97271214-Aplicatii-SPSS
Ca urmare a operaţiei de mai sus, apare o casetă de dialog ca în imaginea de mai jos
(forma ei nu diferă substanţial de la o versiune de SPSS la alta). Dacă privim caseta, vom
observa următoarele elemente:
• Variable Name: zona de declarare a numelui de variabilă. VAR00001 este

numele implicit al primei variabile. Acesta se şterge, pentru a fi înlocuit cu
numele pe care dorim să îl dăm variabilei.
• Variable Description, este o zona informativă în care sunt afişate caracteristicile
predefinite ale noii variabile. Aceste caracteristici se pot seta în Edit-Options
(sau Preferences, la unele versiuni).
• Change Settings, este o zonă care cuprinde butoane de comenzi pentru
modificarea setărilor implicite:
• În zona Measurement , se permite declararea tipului de măsurare specific
variabilei: Scale (Interval/Raport); Ordinal ; Nominal
• Butoanele OK (pentru finalizarea definirii variabilei, Cancel (pentru renunţarea
la definirea variabilei, Help (informaţii legate de definirea variabilelor)
 În versiunile mai recente de SPSS editarea variabilei nu presupune acest tip de

casetă, dar toatele elementele ei constitutive se regăsesc.
Numele variabilei:
Orice variabilă SPSS trebuie să aibă un nume. Cele mai importante aspecte legate
de denumirea variabilelor sunt următoarele:
 Trebuie sa fie format din minim 1, maxim 8 caractere,

 Nu sunt suportate caractere „speciale” cum ar fi spaţiu sau semne de
punctuaţie
-9-
7/29/2019 97271214-Aplicatii-SPSS
 În cazul utilizării unor caractere improprii, apare un mesaj de eroare şi se

permite corectarea numelui.
 Alegerea numelui este la latitudinea operatorului. Respectarea anumitor
convenţii poate fi, însă, extrem de utilă, mai ales dacă avem de a face cu o baza de
date cu multe variabile. Iată câteva recomandări utile în acest sens (ele nu sunt
obligatorii): • Numele să exprime, pe cât posibil, conţinutul variabilei
• Pentru variabile „înrudite”, se va utiliza o schemă de
denumire care să exprime acest lucru. De exemplu, dacă avem
variabile care cuprind valori ale timpului de reacţie măsurat în mai
multe condiţii, putem declara variabilele TR_1, TR_2, TR_3
ş.a.m.d.,
• caracterul underscore este recomandabil ca separator în
cadrul numelui de variabilă). Dacă într-o situaţie de acest gen am
avea 10 sau mai multe „momente”, este de preferat să se declare
nume de genul TR_01, TR_02,...TR_10, etc., deoarece ulterior
SPSS aranjează
păstrează ordineaalfabetic
dorită. variabilele în listele de selecţie şi, astfel, se
 Într-o bază de date nu pot exista două variabile cu acelaşi nume!
 Există o serie de cuvinte „rezervate”, a căror utilizare ca nume de variabile
nu este acceptată de program. Acestea sunt: ALL, AND, BY, EQ, GE, GT, LE, LT,
NE, NOT, OR, THRU, TO, WITH.
Definirea „tipului” de variabilă

Tipul de variabilă se referă la
• Se acţionează butonul Type de pe caseta Define Variable
•
Apare caseta Define Variable Type
(Width,, Decimal
unde se marchează
Places, în tipul
cazulvariabilei şi se declară caracteristicile acesteia
•
variabilelor numerice)
• Se acţionează butonul Continue, pentru a se reveni la caseta Define
Variable.
Aşa cum se observă în caseta Define Variable Type din imaginea de mai sus, SPSS poate
opera cu o varietate de tipuri de variabile. Fiecărui tip îi corespund anumite proprietăţi
(caracteristici) care trebuie definite de operator. Cele mai uzuale sunt tipurile:
- 10 -
7/29/2019 97271214-Aplicatii-SPSS
[ Numeric], care cuprind valori de tip numeric cu sau fără zecimale.

Proprietăţi:
• numărul de cifre necesare pentru exprimarea „întregilor”
• numărul de „zecimale”
EXEMPLE:
Pentru o variabilă în care vom introduce vârsta în ani împliniţi, vom defini Type
Numeric cu Width 2 (presupunând că nu avem subiecţi cu vârsta peste 100 de ani)
şi Decimal Places 0.
Pentru o variabilă în care vom introduce rezultatul la un test exprimat în scoruri T
cu o zecimală, definim Type Numeric cu Width 2 şi Decimal Places 1.
[Caracter ] (String ), care cuprind valori exprimate sub formă de caractere alfanumerice
(litere sau chiar cifre).
Proprietăţi
• numărul de caractere rezervat, care este fixat implicit la 8, dar poate fi

modificat
SPSS face distincţie întredupă dorinţă.
variabile de tip caracter „scurte” (Short string ) şi „lungi”
( Long string ). Primele au maxim 8 caractere şi pot fi incluse în unele proceduri
statistice (semnificaţia diferenţei între medii, de exemplu), pe când celelalte nu pot fi
utilizate decât în operaţii de listare (cazul variabilei de genul „nume”, de ex.).
 Deşi permisă, utilizarea variabilelor „string” nu este de preferat. Toate variabilele care
suportă codificări vor fi, de preferinţă, introduse cu valori numerice. Utilizarea acestora
în proceduri statistice nu este limitată de nici o restricţie.
Unităţi de timp calendaristic sau orar [ Date], care pot include valori de timp într-un
format specificat, aşa cum se vede în imagine.
Proprietăţi
• formatul de întroducere, care poate fi unul din cele evidenţiate în caseta
Define Variable Type/Date
Exemplu: dd-mmm-yyyy presupune introducerea unor valori de genul „21-FEB-
2001” (luna fiind scrisă obligatoriu după prescurtarea ei în engleză).
Există o mare varietate de formate pentru acest tip de variabilă, acoperind, practic,
orice cerinţă posibilă din partea utilizatorului.
- 11 -
7/29/2019 97271214-Aplicatii-SPSS
 Variabilele de tip Date beneficiază de funcţii speciale de tratare şi analiză în

SPSS.
Nu vom prezenta şi celelalte tipuri de variabile, ele fiind mai puţin folosite, dar
facem precizarea că semnificaţia lor poate fi găsită în Help-ul casetei Define Variable Type.
 Tipul
Se va unei variabile
acorda atenţiepoate fi schimbat
mesajelor ulterior
care pot prin simpla
să apară şi careredefinire a acesteia.
avertizează asupra
eventualelor pierderi de informaţie prin schimbarea tipului.
 Opţiunile din zona Measurement (Scale, Ordinal, Nominal ) , care se regăsesc
doar la versiuni SPSS de la 7.0 în sus, nu au întotdeauna o utilitate practică dar
marcarea lor corectă este necesară pentru anumite proceduri statistice sau
grafice.
Etichetarea variabilelor şi a valorilor
Etichetarea este o formă de descriere explicită a conţinutului variabilei (având în

vederea atât
practica că numele variabilei
la nivelul nudar
variabilei poate
şi lafivalorile
mai mare de 8lecaractere).
pe care conţine, înEtichetarea se poate
cazul variabilelor de
tip nominal sau ordinal.
Pentru etichetare se apasă butonul Labels de pe caseta Define Variable. Se
deschide o nouă casetă ( Define Labels), care conţine spaţii pentru eticheta variabilei
(Variable Label) şi pentru etichetele valorilor (Value labels).
 Eticheta variabilei nu se supune restricţiilor pentru nume, putând conţine oricâte
caractere (max. 255), dar şi spaţii sau alte semne grafice tipăribile.
 Etichetele pentru valori vor fi introduse una câte una, astfel:
 se plasează valorea etichetatăîn zona Value
 se introduce eticheta corespunzătoare în zona Value label
 se acţioneazăsebutonul Add
 Operaţiunea reia pentru toate valorile pe care dorim să le etichetăm.
Imaginea prezintă etichetarea valorilor unei variabile care se referă la calificativul
la un examen. Se observă că valoarea 1 are eticheta SLAB, valoarea 2, eticheta MEDIU iar
valoarea 3, eticheta BUN (încă nu a fost acţionat butonul Add pentru a fi finalizată
declaraţia etichetei acestei valori).
- 12 -
7/29/2019 97271214-Aplicatii-SPSS
 Deşi nimic nu ne obligă să aplicăm etichete variabilelor şi valorilor, este foarte

recomandabil ca ele să fie atribuite.
 Etichetele ajută la citirea mai uşoară a rezultatelor (deoarece apar alături de acestea). În
plus, etichetele sunt asociate prelucrărilor grafice (histograme, bare, etc.) fapt care
reduce necesitatea de a le introduce ulterior prin editarea respectivelor grafice.
 Pentrudea referinţă
axele şti cum săaledeclarăm etichetele,
unui grafic. este
Dacă „se bine să niatunci
potrivesc”, le imaginăm ca fiind
au fost bine înscrise pe
definite.
 Oricum, ele vor putea fi modificate ulterior sau editate direct în SPSS Viewer.
Declararea valorilor lipsă (missing values)
Valorile lipsă sunt de două tipuri:

 valori lipsă de sistem ( system missing values) adică valori care lipsesc din baza de
date (nu au fost introduse). Forma lor de evidenţiere pe ecran este un punct plasat în
celula respectivă.
 valori lipsă declarate de utilizator ( user missing values) adică valori pe care
utilizatorul
din diverse le declarănucadoreşte
motive, atare. Acestea potînexista
să fie luate în baza
calcul. de date
Atenţie, odatădar utilizatorul,
declarate, aceste
valori nu sunt şterse şi nici nu sunt marcate în mod evident pe ecran.
Pentru declararea valorilor lipsă se acţionează butonul Missing Values din caseta
Define Variables, care generează apariţia casetei de dialog alăturate.
Se observă că există mai multe opţiuni:

 declararea a trei valori distincte ca fiind lipsă ( Discrete missing values)
 declarea unui domeniu de valori lipsă ( Range of missing values)
 declararea unui domeniu la care se poate adăuga şi o valoare distinctă ( Range plus
one discrete missing value)
 Deşi nu pare foarte evidentă acum, utilitatea funcţiei de declarare a valorilor lipsă
nu trebuie subestimată. Foarte adesea suntem nevoiţi să scoatem din prelucrări
anumite valori (care nu pot fi totuşi, pur şi simplu, şterse). Să ne gândim numai la
valorile extreme ale unei distribuţii, a căror menţinere în anumite prelucrări poate
determina modifcări semnificative a rezultatelor.
În concluzie, declararea variabilelor se compune din următoarele operaţiuni:
- 13 -
7/29/2019 97271214-Aplicatii-SPSS
 Atribuirea numelui (maxim 8 caractere)

 Definirea tipului (numeric, caracter, data)
 Atribuirea etichetei variabilei
 Atribuirea etichetei valorilor, în cazul variabilelor măsurate pe scale
nominale sau ordinale
 Declararea valorilor lipsă (care nu au fost recoltate în procesul de măsurare,
din diferite motive)
Ştergerea şi inserarea variabilelor
 Ştergerea unei variabile se face prin selectarea acesteia (clic pe capul de variabilă)
şi acţionarea tastei Delete (sau se comandă din meniul Edit-Cut ).
 Inserarea unei variabile se face prin plasarea cursorului-celulă pe coloana variabilei
în stânga căreia dorim să inserăm noua variabilă (sau prin selectarea variabilei
respective), după care se comandă, din meniul Data-Insert variable. După aceasta,
se defineşte variabila inserată (nume, tip, etichete).
Ştergerea şi inserarea cazurilor
 Ştergerea cazurilor se face în mod similar variabilelor, prin selectarea acestora (clic
pe capul de linie) şi tasta Delete (sau Edit-Cut ). Se pot selecta mai multe cazuri
simultan (drag cu mouse-ul pe capul liniilor) după care se şterg ca mai sus.
 Inserarea cazurilor se face după plasarea cursorului pe linia deasupra căreia dorim
să inserăm un nou caz, după care se acţionează în meniul Data- Insert case.
 Pentru versiunile de SPSS de la 7 în sus, clic dreapta pe capul de coloană

sau de linie, produce un meniu contextual care permite un acces mai rapid la
funcţiile de inserare/ştergere.
 SPSS nu permite Undo (în meniul Edit) decât limitat la ultima acţiune. Din
acest motiv, ştergerea variabilelor sau a cazurilor trebuie să se facă cu atenţie,
pentru că datele pot fi definitiv pierdute. Se va reţine, totuşi, că baza de date se
actualizează pe hard disk numai după salvarea comandată de utilizator. Ca urmare...
 Orice modificare efectuată nu produce efecte decât asupra datelor din
memoria de lucru, fişierul rămânând nemodificat.
 În cazul unei acţiuni care produce efecte nedorite asupra bazei de date,
există soluţia închiderii bazei de date, fără a se accepta salvarea cerută de program,
după care se deschide fişierul respectiv din nou.
Erori frecvente
- Apariţia unor cazuri inutile, (umplute cu system missing values) la sfârşitul unei
baze de date.
Explicaţie: Introducerea inutilă a unei valori într-o variabilă, valoare care apoi este
ştearsă. Cu toate acestea, SPSS a creat deja un caz nou, pe care l-a umplut cu system
missing values.
Soluţie: Selectarea cazului prin apăsarea pe capul de linie şi acţionarea tastei Delete
(sau Edit-Cut ).
- 14 -
7/29/2019 97271214-Aplicatii-SPSS
- Apariţia unor variabile inutile (nedorite).

Explicaţie: La introducerea din greşeală a unei valori într-o variabilă nedefinită în
prealabil, SPSS creează automat o variabilă implicită, pe care o denumeşte VAR00001.
Soluţie: Se selectează variabilă resectivă (clic de mouse pe capul de coloană) şi se
acţionează tasta Delete (sau Edit-Cut ).
Exemplu practic de realizare a unei baze de date

Să ne imaginăm că am aplicat testul Eysenck Personality Inventory, care vizează
următoarele caracteristici de personalitate: extraversiunea, nevrozismul şi atitudinea
defensivă (scala Lie). Pentru analiza datelor suntem interesaţi să raprtăm rezultatele la o
serie de caracteristic demografice ale subiecţilor, să zicem: sexul şi vârsta. În plus, pentru a
avea controlul datelor dorim să inregistrăm şi identitatea subiecţilor.
Pentru fiecare dintre informaţiile pe care dorim să le introducem în baza de date vom crea
câte o variabilă.
Variabila Numele Tipul variabilei Eticheta Etichetele
Identitatea variabilei
COD (optăm numeric, Width 2, variabilei
Identitate valorilor
Nu se aplică
subiecţielor pentru un cod Decimal Places 0 etichete
(esentiala pentru numeric dacă (presupunem că nu decât la
a asigura nu avem avem mai mult de 99 valorile
identitatea nevoie de subiecţi) variabilelor
fiecarei numele de tip
inregistrari subiecţilor) categorial
inparte si pentru (nominale
realizarea sau
corespondentelor ordinale)
cu
datealte
in baze de
care avem
informatii cu
privire la aceiaşi
subiecţi)
Sexul SEX Numeric, Width 1, Sex 1=feminin
Decimal Places 0 2=masculin
Vârsta (în ani VIRSTA Numeric, Width 2, Vârsta
împliniţi; sau în Decimal Places 0
luni dacă dorim (presupunem că nu
mai multă avem subeicţi cu
precizie)
Extraversiune EXTRAV vârsta peste
Numeric, 99 de2,ani) Extraversiune
Width
Decimal Places 0
(nu se poate obţine o
valoare mai mare de
100 şi nu există
zecimale)
Nevrozism NEVRO Numeric, Width 2, Nevrozism
- 15 -
7/29/2019 97271214-Aplicatii-SPSS
Decimal Places 0
valoare mai mare de
100 şi nu există
zecimale)
Lie LIE Numeric, Width01,
Decimal Places „Minciună”
valoare mai mare de 9
şi nu există zecimale)

Se observă faptul că pentru variabile ale căror nume exprimă exact conţinutul
(SEX, VÂRSTA) se poate utiliza fără nici un inconvenient numele şi ca etichetă. Pentru a
fi mai expliciţi, să spunem că numele variablei este util în primul rând SPSS-ului pentru a
manipula variabilele, în timp ce etichetele sunt necesare mai ales utilizatorului pentru a
înţelege cu uşurinţă la ce se referă o variabilă al cărui nume prea scurt
Avem
variabilele alăturat,
de mai sus: imaginea DATA EDITOR pentru primii trei subiecţi introduşi cu
 Insistăm pe declararea, cu precădere, a

variabilelor de tip numeric: SPSS este un program de prelucrare statistică, fapt care
implică date numerice. Deşi el poate opera şi cu date de tip caracter, acestea nu sunt
acceptate pentru toate tipurile de proceduri statistice. Pentru a nu avea surprize, este
recomandabil să fie utilizate variabile de tip numeric în toate cazurile. De exemplu,
variabila sex, poate fi declarată de tip caracter (cu valorile M si F) dar, la fel de bine, de
tip numeric valorilor
explicitarea (cu valorile convenţionale
se vor 1 şi, respectiv,
folosi etichetele de valoare2). În acest
( value label din
). urma caz, pentru
 Introducerea unei variabile care să conţină
numele subiecţilor poate fi necesară doar dacă ne propunem realizarea unor liste ale
subiecţilor din baza de date. Altfel, identificarea numerică a fiecărei înregistrări este
suficientă (şi absolut necesară), scutind un mare volum de muncă pe care l-ar implica
introducerea numelor. Vom avea grijă însă, ca pe documentul original să scriem codul
- 16 -
7/29/2019 97271214-Aplicatii-SPSS
numeric aferent fiecărui subiect, astfel încât, la nevoie, să se poată identifica numele
(pentru corecţii, de ex.)
 Variabile multiple pentru întrebări cu răspuns
multiplu: De obicei, o întrebare prezintă un singur răspuns, dar pot fi situaţii în care o
întrebare prezintă răspunsuri multiple care pot fi alese în acelaşi timp. De exemplu: „ Ce
activităţi preferaţi
etc. Într-un pentru
asemenea caztimpul liber?
ne putem 1. sport;
aştepta 2. filme;
să avem 3. petreceri
mai multe cu prieteni...”,
răspunsuri la aceeaşi
întrebare. Soluţia pentru introducerea datelor este, de aceea, crearea mai multor
variabile, câte una pentru fiecare variantă de răspuns. Astfel, vom avea variabila
„SPORT” care poate primi două valori, sa zicem „1” dacă este aleasă şi „0” dacă nu
este aleasă, şi aşa mai departe. În acest mod vom putea analiza frecvenţa alegerilor
pentru fiecare variantă de răspuns în parte.
 Evitarea variabilelor redundante: Dacă la un test
nu sunt posibile, de exemplu, decât răspunsuri corecte sau greşite, atunci nu este
necesar să declarăm o variabilă pentru „corecte” şi una pentru „greşite” dacă suma lor
dă totalul răspunsurilor.
Salvarea bazei de date din Data Editor
O bază de date aflată în lucru nu are un corespondent într-un fişier decât după ce se
execută o salvare a acesteia. Acest lucru nu trebuie niciodată uitat. Spre deosebire de
WORD de exemplu, SPSS nu are o funcţie de salvare automată după un interval de timp
prestabilit. Cu alte cuvinte, indiferent ce modificări facem în Data Editor pe ecran, datele
respective vor fi salvate numai la comanda explicită a operatorului.
Pentru o bază de date nou creată, salvarea se face în mod similar cu orice alt
program cunoscut: File-Save as, care deschide următoarea casetă de dialog:
 Se alege locaţia de salvare (Save in)

 Se
Se dă un nume
verifică tipulfişierului
de fişier ((formatul
File name)
implicit pentru baze de date SPSS are extensia
.sav)
 Se acţionează Save
 SPSS poate salva şi în alte formate, dintre cele mai importante fiind: Dbase sau
FoxPro, Lotus 1-2-3, Excel. Salvarea în aceste formate poate fi utilă pentru
transferul datelor pentru prelucrări ulterioare în alte programe.
- 17 -
7/29/2019 97271214-Aplicatii-SPSS
Deschiderea unei baze de date SPSS
O bază de date creată cu SPSS se deschide cu comanda File-Open, care activează

următoarea casetă de dialog:
 Se alege locaţia
 Se indică fişieruldedorit
citire ( Look in)cu mouse-ul) în fereastra de căutare
(selectarea
 Se indică tipul de fişier ce urmează a fi deschis (implicit este de tip SPSS
cu extensia .sav)
 Se acţionează Open
 În cazul deschiderii unui fişier de alt tip decât SPSS, se va alege tipul respectiv
din lista Files of type. În cazul în care SPSS nu recunoaşte tipul de fişier în care
se află datele noastre, putem încerca transformarea lor prealabilă din formatul
original într-un
aspecte ce ţin deformat recunoscut
formatul de SPSS.
de reprezentare Deşi există
a datelor, riscul pierderii
operaţiunea unor
scuteşte totuşi
un mare volum de muncă.
- 18 -
7/29/2019 97271214-Aplicatii-SPSS
Operaţii de transformare a variabilelor

Dacă privim variabilele SPSS din punctul de vedere al modului în care au fost
create, putem distinge două categorii:
b) variabile „primare” care includ valori rezultate direct din cercetare si au fost
c) introduse, de regulă, derezultate

variabile „secundare” la tastatură.
prin transformările aplicate variabilelor primare.
Exemple de situaţii în care se impune transformarea variabilelor:

• Avem mai multe variabile „primare” care conţin răspunsurile la
întrebările unei scale de tip Lickert şi suntem interesaţi să calculăm
(într-o variabilă „secundară”) suma răspunsurilor.
• Avem un număr de variabile „primare” în care se află rezultatul parţial
pentru fiecare minut din cele 10 câte durează un test de calcul aritmetic
şi dorim să creăm o nouă variabilă ( „secundară”) în care să avem media
performanţei pe cele 10 minute sau abaterea standard a performanţei pe
cele 10 minute, pentru fiecare subiect,
•Avem o variabilă care conţine data naşterii şi dorim să creăm pe baza ei
o altă variabilă, care să conţină vârsta.
• Dorim să transformăm variabila care conţine vârsta, într-o altă variabilă
care conţine valori pentru categorii de vârstă.
Pentru toate aceste situaţii, care sunt unele dintre cele mai des întâlnite, dar şi
pentru multe altele încă, SPSS oferă proceduri de transformare în meniul Transform.
În continuare, vom prezenta câteva dintre cele mai frecvent utilizate funcţii de
transformare a variabilelor.
Însumarea valorilor variabilelor
Se utilizează atunci când dorim să obţinem o variabilă prin adunarea valorilor din
două sau mai multe variabile.
Imaginea de mai jos prezintă o tabelă de date SPSS care cuprinde scorurile la trei
examene parţiale (scor_1, scor_2 si scor_3). Dorim să realizăm o variabilă care să cuprindă
un scor general, prin însumarea celor trei variabile. Se poate observa că unii dintre subiecţi
nu au valori la toate cele trei scoruri (valori lipsă de sistem).
- 19 -
7/29/2019 97271214-Aplicatii-SPSS
Deoarece prin calculare, o nouă variabilă este plasată după toate variabilele
existente,
însumăm.am preferat
În acest felsăavem
inserăm o nouă variabilă
şi posibilitatea imediat după
să controlăm uşor cele trei pe careoperaţiei
corectitudinea dorim să de
le
însumare
Se apelează procedura Transform-Compute, care deschide caseta de mai jos:
Se efectuează următoarea succesiune de operaţii:

1. Se introduce numele noii variabile în zona Target Variable („total”).
2. Se scrie expresia de însumare în zona Numeric Expression.
Funcţia este SUM (expresie numerică, expresie numerică, ...), aşa cum se
vede şi în zona listei Functions: Ea poate fi scrisă de la tastatură sau
selectată din lista de funcţii şi „ridicată” prin acţionarea butonului ▲.
Atenţie, sintaxa fiecărei funcţii trebuie respectată întocmai. În cazul nostru,
variabilele numerice se vor scrie între paranteze, una câte una, cu virgulă
între ele. Variabilele pot fi scrise de la tastatură sau mutate la rândul lor din
lista de variabile cu butonul ►.
- 20 -
7/29/2019 97271214-Aplicatii-SPSS
Dacă variabilele ce vor fi însumate se află în baza de date una după alta, ca
în cazul exemplului nostru, atunci avem posibilitatea să scriem o expresie
de însumare simplificată, astfel SUM (prima_variabilă TO
ultima_variabilă). În acest caz, clauza TO va fi cuprinsă între spaţii, pentru
a nu fi confundată cu un nume de variabilă. Această opţiune ne sugerează
cât detabele
unei important
SPSS.poate fi să aranjăm corespunzător variabilele în structura
3. Se apasă butonul OK
4. Deoarece variabila total există, SPSS ne întreabă dacă dorim să modificăm
conţinutul acesteia. Dacă nu ar exista o variabilă cu acest nume, rezultatul operaţiei
de calcul ar fi depus într-o variabilă creată automat şi amplasată după ultima
variabilă din baza de date.
Răspundem OK, deoarece ştim că am Rezultatul operaţiei se vede în imaginea de

creat această variabilă tocmai pentru a mai jos:
depune în ea suma.
Calcularea mediei a două sau mai multe variabile
Presupunând că în loc de sumă, ne-ar interesa media valorilor de la mai multe

variabile, se procedează în mod similar. Expresia de calcul a mediei este MEAN
(expresie_numerică, expresie_numerică, ...), unde ... arată că putem pune oricâte variabile
(sau valori) numerice, cu virgulă între ele. Ca şi în cazul sumei, se poate realiza o expresie
cu clauza TO, cu condiţia ca variabilele pentru care se realizează media să se afle una după
alta în tabela SPSS.
- 21 -
7/29/2019 97271214-Aplicatii-SPSS
Reamintim că funcţia MEAN poate fi scrisă de la tastatură sau poate fi adusă din
lista de funcţii, prin selectare şi acţionarea butonului ▲.
Este de la sine înţeles că expresia de calcul poate fi realizată şi într-o manieră
simplă şi directă, fără utilizarea funcţiilor (SUM sau MEAN), astfel:
Pentru sumă: scor_1+scor_2+scor_3
Pentru medie: (scor_1+scor_2+scor_3)/3
 Se va face o distincţie clară între suma sau media astfel obţinute, care se referă la
suma sau media valorilor de la mai multe variabile, pentru acelaşi subiect, şi suma
sau media pe care am calcula-o pe verticală, la nivelul fiecărei variabile în parte, pe
întreaga distribuţie
 Se pot realiza diverse alte funcţii de transformare, utilizându-se marea varietate de
funcţii care se găsesc în lista Functions şi a căror semnificaţie se poate află din
Help-ul casetei Compute.
Extragerea anului dintr-o variabilă de tip cronologic ( date)

SPSS oferă funcţii de transformare cu variabilele de tip cronologic. Dintre acestea,
vom exemplifica cu realizarea unei variabile care să conţină anul naşterii, să zicem, scos
dintr-o variabilă care conţine data naşterii. Imaginea de mai jos este extrasă din baza de
date Employee data.sav
Observăm că variabila bdate, care conţine data naşterii. Pentru a avea vârsta,
trebuie să calculăm diferenţa dintre anul curent (să zicem, 2000) şi anul naşterii: Pentru
- 22 -
7/29/2019 97271214-Aplicatii-SPSS
aceasta trebuie să facem diferenţa dintre anul curent (2000) şi anul naşterii, care se află în
câmpul bdate.
Pentru a avea variabila ce urmează a fi creată în apropierea variabilei bdate, vom
insera o variabilă (denumind-o „virsta”, de tip numeric, cu doi întregi). Apoi utilizăm
procedura Compute din meniul Transform:
În câmpul Target variable introducem numele noii variabile (virsta).

În zona Numeric Expression vom scrie expresia de transformare, care se bazează pe
funcţia XDATE.YEAR().
Această funcţie are ca rezultat extragerea valorii care reprezintă anul dintr-o
variabilă de tip dată calendaristică. În cazul nostru, XDATE.YEAR(bdate)=anul naşterii
Ca urmare, putem scrie expresia astfel: 2000-XDATE.YEAR(bdate)
Mai jos putem vedea rezultatul procedurii Compute:
Se observă în variabilă virsta, valorile rezultate prin transformare (corespunzătoare

anului 2000).Desigur,
extragerea transformarea
anului naşterii putea fi
într-o variabilă efectuată
separată şi, şiapoi,
în două
prin etape. Mai întâi
efectuarea unei prin
noi
transformări realizarea diferenţei dintre anul curent şi anul naşterii. Am preferat o soluţie
într-o „singură etapă” pentru că este mai operativă.
 Posibilităţile de transformare a variabilelor oferite de SPSS permit crearea unor noi

variabile pe baza celor existente, în funcţie de necesităţile de prelucrare pe care le
avem. În toate cazurile, însă, nu se va alege soluţia modificării valorilor dintr-o
- 23 -
7/29/2019 97271214-Aplicatii-SPSS
variabilă „primară” peste valorile deja existente. Cu alte cuvinte, este recomandabil
să creăm prin transformare variabile noi, şi nu să modificăm valorile existente din
variabilele „primare” a căror pierdere ar necesita reintroducerea lor, în caz de
necesitate.
Recodificarea variabilelor
Recodificarea unei variabile înseamnă convertirea valorilor acesteia, cu scopul
obţinerii unei distribuţii bazată pe frecvenţe cumulate. Procesul este similar cu crearea unei
tabele de frecvenţe grupate şi ne reamintim că poate fi derulat în maniera descrisă mai jos:
Paşi pentru grupării de frecvenţe:
• Se face diferenţa dintre valoarea cea mai mare şi valoarea cea mai mică a unei
distribuţii
• Se împarte valoarea obţinută la mărimea posibilă (estimată) a intervalului
• Se selectează mărimea intervalului care conduce la un număr de clase cuprins între
5 şi 15
•
Se determină
mărimii limita inferioară a primului interval (trebuie să fie un multiplu al
intervalului)
• Se determină limita superioară a primului interval
• Se construiesc intervalele de clasă pentru fiecare interval, fiind atenţi să avem clase
„suprapuse” sau „intervale neacoperite”
În principiu, deşi este recomandabilă obţinerea unei grupări de frecvenţe pe 5-15

clase, se poate opta pentru un număr de clase care serveşte cel mai bine interesul de
cercetare. De exemplu, în cazul unei distribuţii de vârstă exprimată în ani, este preferabil să
se opteze pentru clase „cincinale” sau „decade”, acestea având şi o anumită semnificaţie
„psihologică”.
În statistice
în analize urma transformării de mai
este improprie, de sus,
aceeaam
ar obţinut
fi foartevariabila virsta. unei
utilă obţinerea Utilizarea ei ca
variabile atare
care să
asocieze anumite valori convenţionale pentru categorii de virsta. Pentru aceasta putem
efectua „recodificarea” variabilei virsta pentru a obţine o distribuţie grupată de frecvenţe,
astfel:
Se lansează procedura Recode - Into Defferent Variables din meniul Transform:
Atenţie, se poate alege şi opţiune Into Same Variables, dar nu este recomandabilă
deoarece, în cazul unei erori, nu mai avem la dispoziţie variabila iniţială pentru o nouă
recodificare.
- 24 -
7/29/2019 97271214-Aplicatii-SPSS
Paşi de efectuat la apariţia casetei Recode into Defferent Variable:

• se trece variabila virsta în zona Numeric Variable → Output Variable. Semnul
întrebării arată că se aşteaptă numele variabilei ce urmează să fie creată prin
recodificare.
• Acest nume se scrie în zona: Name, după care se apasă butonul Change.
Am ales, absolut convenţional, ca nume al variabilei recodificate, v_clase.

Urmează acum să descriem limitele claselor de recodificare. Pentru aceasta, se
acţionează butonul Old and New Values
Deşi relativ complicată, caseta de declarare a noilor valori în funcţie de cele vechi este uşor de înţeles.
În zona Old value, se alege una dintre variantele de definire a valorilor de la care se
pleacă. Să zicem că am ales soluţia să recodificăm anii pe intervale de zece ani, primul interval
fiind 29-39, al doilea 40-49, ş.a.m.d.
Pentru aceasta activăm opţiunea Range şi scriem valorile limite al intervalului dorit.
După aceasta, în zona New value oValue, scriem care este valoarea pe care o asignăm
acestei clase.
În fine, acţionăm butonul Add pentru a definitiva operaţiunea şi trecem la definirea
următoarei clase, până terminăm.
În zona Old → New se poate observa lista recodificărilor definite.
Se acţionează butonul Continue şi, la revenirea în caseta anterioară, butonul OK.
Rezultatul operaţiuni se vede mai jos:
- 25 -
7/29/2019 97271214-Aplicatii-SPSS
Se observă corespondenţa dintre valoarea din variabila virsta, cu valoarea din

variabila v_clase. Pentru valoarea 71, avem missing value în variabila v_clase, deoarece nu
am definit un interval care să cuprindă această vârstă. (De regulă, această situaţie este
determinată de o eroare de definire a intervalelor de clasă. Pentru a o repara, ar trebui să
intrăm din nou în procedura Recode şi să redefinim clasele).
relua.
Transformarea operată pe variabila vîrstă nu este de loc inutilă. Dacă am fi dorit să
vedem în ce măsură este o relaţie între nivelul salariului şi vârstă, ar fi fost oarecum
impropriu (fără a fi propriu-zis o greşeală ) să utilizăm o statistică parametrică (corelaţia).
În analizele statistice pe vârste este recomandabil, totuşi, să operăm cu grupe de vârstă.
Ordonarea după rang a valorilor unei variabile
Aşa cum am spus în cuprinsul primei părţi a acestui volum, este posibil să
ne confruntăm cu o variabilă cantitativă ale cărei valori nu respectă condiţiile unei statistici
parametrice (vezi figura din stânga, unde valoarea 250 este excesivă). Într-o situaţie de
acest gen, una din soluţiile posibile este transformarea de rang, cu procedura Transform-
Rank cases (caseta din dreapta):
- 26 -
7/29/2019 97271214-Aplicatii-SPSS
Variabila vizată (scor) este trecută în lista Variable(s), se setează modul de

ordonare (am ales atribuirea rangului 1 valorii celei mai mari) iar apoi am acţionat butonul
OK. Procedura permite fixarea unor parametri de transformare cu ajutorul butoanelor Rank
şi Ties, asupra cărora nu insistăm aici.
Organizarea datelor pentru analiză

SPSS permite efectuarea unor operaţii de organizare a datelor care prezintă un
interes aparte pentru faza de analiză. Acestea sunt: sortarea, împărţirea fişierului în
subgrupuri, selectarea unor seturi de date, combinarea fisierelor (adăugarea de cazuri,
adăugarea de variabile). Le vom trece în revistă, pe rând.
Sortarea bazei de date
Sortarea este operaţia de aranjare a bazei de date în funcţie de ordinea

crescătoare/descrescătoare a valorilor unei variabile. Ea este utilă mai ales pentru
inspectarea
bazei directă
de date. a valorilor
Procedura de este:
utilizată la extrema unei. distribuţii sau pentru listarea ordonată a
Data-Sort
Baza de date nesortată Caseta Sort Cases
Imaginea din casetă descrie sortarea bazei de date, crescător ( Ascending ), după
valorile variabilei scor (rezultatul se vede în imaginea de mai jos).
Se poate efectua sortarea simultană după mai multe variabile, fiecare în sensul
dorit, de exemplu: grup( Ascending ) şi scor( Descending ).
- 27 -
7/29/2019 97271214-Aplicatii-SPSS
Împărţirea bazei de date în subgrupuri
Baza de date SPSS poate fi împărţită în subgrupuri, pentru analiză distinctă. Atunci
când datele sunt astfel organizate, orice procedură de analiză se va efectua distinct pentru
fiecare subgrup.
Procedura este: Data-Split File iar caseta de dialog este cea de mai jos :
Opţiunile sunt:
• Analyze all cases, do not create groups (pentru analiza integrală a datelor)
• Compare groups (rezultatele vor fi afişate astfel încât să poată fi uşor comparate)
• Organize output by groups (rezultatele vor fi afişate în Viewer, separat pe grupuri)
 Operaţia nu produce nici o modificare vizibilă asupra bazei de date. Singurul efect
se vede în zona de afişare a rezultatelor, unde toate procedurile de analiză vor fi
afişate pentru fiecare subgrup în parte.
 Pentru a se reveni la analiza intergrală a datelor, se va reveni în procedura Split File
şi se va seta opţiunea Analyze all cases....
Selectarea unor seturi de date
Selectarea unui set de date permite aplicarea procedurilor de analiză numai pe

cazurile selectate. Dacă nu se optează pentru ştergerea datelor neselectate, ele vor fi
păstrate şi vor putea fi reintroduse în analiză. Procedura este Data-Select Cases....
Pentru exemplificare, să ne propunem selectarea din baza de date din imaginea de
mai sus a cazurilor aparţinând grupului 1.
Imaginea prezintă:
• În partea stângă, baza de date
• La mijloc, caseta principală Select Cases care are:
o Zona listei de variabile
o Zona fixare a condiţiilor de selectare Select , unde:
- 28 -
7/29/2019 97271214-Aplicatii-SPSS
 All cases este setarea implicită şi înseamnă că toate datele intră în

analiză
 If condition is satisfied ,
se bifează atunci când se doreşte declararea
unei condiţii de selectare bazată pe o funcţie
 IF este butonul de deschidere a casetei pentru declararea condiţiei,
care deschide
variabila caseta
grup în
Select Cases: if . În cazul nostru, am trecut
zona de editare a functie şi am declarat-o egală cu
1. Astfel, toate cazurile din baza de date care au grup=1 vor fi
analizate, celelalte fiind ignorate. Exemplul se bazează pe o selecţie
simplă, dar sunt permise selecţii bazate pe funcţii mai complicate
sau care pot să includă combinaţii de variabile.
o Random sample of cases, permite selectarea unui set aleator de cayuri din
baya de date
o Based on time por case range, permite selectarea cazurilor în funcţie de
poziţia din baza de date.
o Use filter variable, selectează pe baza valorile unei variabile filtru
o
Unselected cases Are, permite opţiunea de filtrare a cazurilor neselctate
( Filtered ) sau de eliminare a lor ( Deleted ). În acest din urmaă caz, cazurile
neselectate vor fi şterse, dar baza de date, dar actualizarea fişierului de pe
hard disk se va face numai după prima comanda Save.
După finalizarea operaţiei de selectare de mai sus, baza de date se prezintă în felul
următor:
- 29 -
7/29/2019 97271214-Aplicatii-SPSS
Se observă:
• Marcarea cu o diagonală a capului de linie corespunzător cazurilor neselectate
• Apariţia unei variabile de sistem filter_$ care conţine valoarea 0 pentru cazurile
neselectate şi valoarea 1 pentru cazurile selectate. Această variabilă poate fi ulterior
utilizată în procedurile de analiză, ca variabilă independentă (caz în care se va anula
situaţia de selectare, prin bifarea opţiunii All cases).
 Selectarea este utilizată în mod obişnuit, pentru alegerea temporară a unui set de
date. Adesea se uită anularea unei selectări existente, atunci când se doreşte
revenirea al analiza tuturor cazurilor. Efectul este obţinerea unor rezultate pe date
parţiale.
Alte operaţii de organizare a datelor pentru analiză
Opţiunile SPSS pentru organizarea datelor sunt mult mai numeroase decât cele
descrise mai sus. Fără a le trata în amănunt, ne vom mulţumi să le prezentăm sumar:
• Agregarea cazurilor, atunci când există înregistrări multiple pentru fiecare subiect şi
•
se doreşte păstrarea
Adăugarea uneia
unor cazuri dinsingure ( Data-Agregate
altă bază de date SPSS )( Data-Merge Files-Add cases...)
• Adăugarea unor variabile din altă bază de date SPSS ( Data-Merge Files-Add
variables... )
• Inversarea liniilor cu coloanele ( Data-Transpose...)
- 30 -
7/29/2019 97271214-Aplicatii-SPSS
Calcularea indicatorilor statistici descriptivi

Reamintim faptul că statistica descriptivă are ca obiectiv analiza caracteristicilor
variabilelor. Principalele elemente de statistică descriptivă sunt:
• reprezentarea întregii distribuţii, pe cale:
o
numerică (analiza de frecvenţe)
o grafică (bară, histogramă, box-plot , stem and leaf )
• valorile tendinţei centrale
o mod
o medie
o mediană
• valorile împrăştierii
o amplitudine
o abatere standard
• valorile formei distribuţiei
o
o
indice
indice de
de simetrie ( skewness
boltire (kurtosis ) )
SPSS oferă posibilităţi variate de reprezentare şi de calcul a acestor indicatori. În
acest sens există, pe de o parte, proceduri specializate şi, pe de altă parte, opţiuni care pot fi
accesate din interiorul altor proceduri. Fie şi acest aspect numai, ar trebui să sugereze că
analiza statistică descriptivă, în ciuda caracterului ei „elementar”, este o componentă
indispensabilă a analizei statistice.
În ceea ce priveşte procedurile specializate, ele se lansează din meniul Statistics-
Summarize (sau Analyze-Descriptive statistics, pentru versiunile mai noi de SPSS) şi sunt
grupate în trei proceduri: Frequencies, Descriptives şi Explore.
 Aceste proceduri oferă dintre

prelucrări distincte dar conţindeşianaliză.
rezultate comune.
Alegerea uneia sau alteia ele depinde de necesităţile
Procedura Frequencies
Este singura care permite analiza de frecvenţe.

La apariţia casetei Frequencies, variabila pe care dorim să o supunem analizei va fi
trecută în lista de calcul Variable(s), prin selectarea ei şi acţionarea butonului de transfer
- 31 -
7/29/2019 97271214-Aplicatii-SPSS
(►). Pot fi incluse mai multe variabile în această listă, rezultatele fiind afişate distinct,
pentru fiecare în parte.
Se va observa pe caseta de mai sus bifarea opţiunii pentru tabela de frecvenţe, care
este funcţia specifică a acestei proceduri. În plus, prin acţionarea butoanelor din partea de
jos a casetei se pot seta alte analize, astfel:
Butonul Statistics Butonul Chart Butonul Format

Se aleg doriţi
descriptivi indicatorii statistici Se
graficalege
dorit tipul de prezentare
Se aleg diverse moduri de
a rezultatelor
Rezultatele
nu alăturat, aşa cumsunt
suntafişate
aranjaţiînaici):
SPSS Viewer în forma de mai jos (dar unele sub altele,
Indicatorii statistici Tabelul de frecvenţe Histograma

descriptivi

Procedura Descriptives
- 32 -
7/29/2019 97271214-Aplicatii-SPSS
Această procedură vizează doar indicatorii statistici descriptivi. La lansare,

Satistics-Descriptives, se deschide caseta principală Descriptives.
Se trec variabilele vizate în lista Variable(s)
(dacă dorim calcularea scorurilor z, se Se aleg indicatorii doriţi din Options
bifează opţiunea din stânga-jos a casetei )

Imaginea bazei de date, în care se vede
apariţia variabilei zscor (denumită automat
Rezultatul analizei, din Viewer
de progarm)
scoruri z. cu valorile transformate în
Explore
Procedura
Procedura Explore este cea mai complexă dintre toate procedurile statisticii
descriptive şi se poate utiliza atunci când se doreşte o analiză exhaustivă a variabilei (sau
variabilelor).
Caseta principală Explore
• În Dependent List se includ variabilele de analizat

• În Factor List se includ eventualele variabile categoriale, în funcţie de care se
doreşte analiza variabilei analizate
- 33 -
7/29/2019 97271214-Aplicatii-SPSS
• Label cases by, permite etichetarea cazurilor la afişare (rar utilizat)

• Display, permite alegerea opţiunilor de afişare a rezultatelor numerice ( Statistics),
grafice ( Plots) sau ambele categorii ( Both)
• Butonul Statistics deschide caseta pentru alegerea unor indicatori (dar procedura
analizează, implicit toţi indicatorii statistici descriptivi, de bază)
•
Butonul Plots, permite alegerea reprezentărilor grafice dorite:
• Butonul Options, permite setarea modului de tratare a valorilor lipsă
Rezultatele analizei Explore, definită mai sus, se prezintă astfel:
Indicatorii statistici Reprezentarea stem-and-leaf Reprezentarea Box plot
- 34 -
7/29/2019 97271214-Aplicatii-SPSS
Teste parametrice
Testul z (t) pentru media unui singur eşantion
Utilizare
Testul z
unui eşantion pentru
faţă un singur
de media eşantion
cunoscută este utilizat
a populaţiei dinpentru se testa
care face parte.diferenţa dintre media
Atunci când
volumul eşantionului este mic (N<30) este utilizată o variantă denumită testul t pentru un
singur eşantion.
Utilizarea acestui test statistic este condiţionată de cunoaşterea mediei populaţiei.
Dacă populaţia are o extindere mare, acest lucru este dificil de realizat (în afara cazurilor în
care există studii speciale, cum sunt cele antropometrice, de exemplu). Dintre variabilele
psihologice ale cărei medii pentru populaţie este cunoscută, este inteligenţa, exprimată în
unităţi QI (μ=100). Testul poate fi utilizat, însă, atunci când populaţia are o extindere mai
redusă. De exemplu, dacă a fost evaluat nivelul de satisfacţie într-o organizaţie, se poate
testa diferenţa dintre nivelul de satisfacţie la nivelul unei secţii faţă de media satisfacţiei la
nivelul întregii organizaţii (populaţie).
Condiţii de aplicare
Condiţia teoretică de bază este normalitatea distribuţiei de eşantionare. În temeiul
teoremei limitei centrale, cu cât volumul eşantionului este mai mare, cu atât normalitatea
distribuţiei de eşantionare este mai sigură.
Aranjarea datelor
Datele supuse testării trebuie să fie incluse într-o variabilă SPSS de tip numeric.
Procedura: Statistics-Compare Means-One Sample T Test
Caseta Options permite alegerea

Caseta principală
pragului de semnificaţie.
Variabila testată este trecută în lista
Variabila Confidence Interval 95% este
Test Variable(s)
testată echivalent cu p=0.05 şi este
În zona Test Value se înscrie media
implicit pentru toate testele
populaţiei (100 în cazul nostru)
statistice
Rezultate
- 35 -
7/29/2019 97271214-Aplicatii-SPSS
Primul tabel include statistica descriptivă a variabilei testate (N, media, ab.std,
eroarea Al
standard
doileaatabel
mediei)
include rezultatele testului statistic: t=6.254, df=4, p=0.03, diferenţa
faţă de media populaţiei (22.6) şi limitele inferioară (12.57) şi superioară (32.63) ale
intervalului de încredere pentru media populaţiei estimată de eşantionul de cercetare.
Concluzia testului: media eşantionului de cercetare diferă semnificativ de QI=100,
ca medie a populaţiei.
- 36 -
7/29/2019 97271214-Aplicatii-SPSS
Testul t pentru eşantioane independente
Utilizare
Testul t pentru eşantioane independente este utilizat pentru testarea diferenţei dintre
mediile aceleiaşi variabile dependente măsurate pe două grupuri, formate din subiecţi
diferiţi. unor
aplicată Exemplu: testarea în
copii crescuţi diferenţei
familie şidintre mediacrescuţi
unor copii scorului la o scală
în instituţii de sociabilitate
de ocrotire. În acest
caz, scorul la sociabilitate este variabila dependentă, măsurată pe scală cantitativă
(interval/raport) iar mediul de educare este variabila independentă, exprimată pe scală
nominală dihotomică (familie/instituţie de ocrotire)
Condiţii
Teoretic, testul t poate fi utilizat pentru eşantioane oricât de mici, dacă distribuţia
de eşantionare pentru cele două grupuri este normală şi dacă varianţa valorilor în cele două
grupuri nu diferă semnificativ. În ce priveşte condiţia egalităţii varianţei, ea este testată cu
un teste specifice. Unul dintre acestea este testul Levene, iar în funcţie dacă rezultatul său
programul calculează testul t pe două căi, aşa cum vom vedea mai jos.
Dacă variabila dependentă nu întruneşte condiţiile pentru testul t , se poate apela la
teste neparametrice, astfel:
• Testul z pentru proporţii (compararea procentului de „sociabili” din cele două
grupuri)
• Testul Mann-Whitney U, dacă se transformă valorile variabilei „sociabilitate”
în valori de rang
Aranjarea datelor
Tabela de date SPSS va conţine variabila dependentă, de tip numeric, şi variabila
independentă, de tip nominal, cu două valori, în funcţie de apartenenţa la un grup sau altul.
Variabila independentă poate fi de tip „ string ” (codificând cele două grupuri cu valori de
genul „A” şi „B”) sau de tip numeric (cu codificarea convenţională 1 şi 2). Din principiu,
însă, recomandăm cea de a doua variantă.
Procedura: Statistics-Compare means-Indpendent Samples T Test
- 37 -
7/29/2019 97271214-Aplicatii-SPSS
În caseta principală se trece variabila dependentă ( soc) în lista Test Variable(s) (pot
fi testate mai multe variabile simultan) iar variabila independentă ( grup), în zona Grouping
Variable. În acest moment, programul ataşează variabilei dependente două semne de
întrebare, sugerând introducerea valorilor care definesc cele două grupuri. Concomitent, se
activează butonul Define Groups a cărui acţionare deschide caseta secundară Define
nu este ,relevantă).
Groups unde se introduc valorile care
După acţionarea definesc
butonului cele două
Continue grupuri
, caseta comparate
principală (ordinea
devine lor
completă
şi se poate acţiona OK pentru efectuarea testului.
Rezultate
- 38 -
7/29/2019 97271214-Aplicatii-SPSS
În primul tabel (Group Statistics) avem statistica descriptivă a celor două grupuri.
Se va observa că programul descrie grupurile prin intermediul etichetelor valorilor. Dacă
acestea nu ar fi fost definite, în loc de „institutie” şi „familie” ar fi apărut 1, respectiv, 2.
Al doilea tabel are două linii:
Pe prima avem rezultatele testului t pentru cazul asumării omogenităţii varianţei
( Levene’s
ce Testcafor
se traduce o Equality deci). mai
of Variances
valoare p=0.666, În cazul
marenostru,
de 0.05elepentru
sunt egale (Sig.=0.666,
distribuţia ceea
F a testului
Levene, pe care nu o discutăm aici). Ca urmare, vom citi pe această linie rezultatul testului:
t=-2.42, df=12, Sig.=0.045.
Pe a doua linie avem rezultatele testului t pentru cazul în care nu s-ar întruni
condiţia de omogenitate a varianţei pentru cele două grupuri. Dacă semnificaţia testului
Levene ar fi fost mai mică sau egală cu 0.05, rezultatului testului t s-ar fi citit pe această
linie.
Pentru exemplul nostru, rezultatul testului t permite acceptarea ipotezei cercetării,
conform căreia copiii crescuţi în mediu familial sunt mai sociabili (m=22.00) decât cei
crescuţi în mediu instituţional (m=17.71).
- 39 -
7/29/2019 97271214-Aplicatii-SPSS
Analiza de varianţă unifactorială (One Way ANOVA)
Utilizare
În mod obişnuit, analiza de varianţă este utilizată pentru a testa semnificaţia dintre
mediile măsurate pe mai mult de două grupuri independente (compuse din subiecţi diferiţi).
În acestvariabila
valorile caz valorile variabileieste
independentă dependente sunt exprimate pe scală cantitativă (I/R) iar
de tip categorial.
Dacă se utilizează ANOVA pentru a testa diferenţa dintre două medii obţinute pe
grupuri independente, rezultatul ei este echivalent cu al testului t pentru grupuri
independente (menţionăm, însă, că această utilizare este neuzuală).
Exemplu: Se compară media timpului de reacţie pentru trei grupuri experimentale,
supuse fiecare, anterior evaluării vitezei de reacţie, unui şoc electric de intensitate „mică”,
„medie” sau „mare”. În acest caz s-ar putea obiecta că variabila independentă se exprimă
pe o scală ordinală dar, în esenţă, ea este de tip categorial, fapt ce justifică aplicarea testului
ANOVA.
Condiţii
• Variabila dependentă trebuie să fie de tip I/R şi să respecte condiţia de
normalitate a distribuţiei de eşantionare pentru fiecare dintre grupurile supuse
comparaţiei. Din fericire, testul F este remarcabil de robust în cazul încălcării
acestei condiţii. ANOVA este mai vulnerabilă în situaţia când distribuţia
variabilei dependente este prea aplatizată sau prea înaltă (kurtosis≠0) decât în
cazul asimetriei (skewness≠0). Cu cât volumul grupurilor supuse comparaţiei
este mai mare, cu atât aspectele legate de normalitatea distribuţiei au un efect
mai mic asupra ANOVA.
• Varianţa valorilor variabilei dependente în interiorul grupurilor definite prin
valorile variabilei independente trebuie să fie egală. Această condiţie se
numeşte
ANOVA,omogenitatea varianţei.
care este destul Încălcarea
de robust acestei
şi în acest caz.condiţii
În oricenucaz,
invalidează testul
se vor analiza
cu atenţie cazurile care prezintă valori extreme, care au un efect important
asupra varianţei. Egalitatea (omogenitatea varianţei) poate fi testată cu testul
Levene.
Aranjarea datelor
Se construieşte o variabilă independentă (definită ca „factor” în contextul ANOVA)
care conţine codurile de apartenenţă a cazurilor la fiecare dintre grupurile supuse analizei
(în cazul nostru 1=şoc mic, 2=şoc mediu, 3=şoc mare) şi variabila dependentă, care conţine
valorile timpului de reacţie.
- 40 -
7/29/2019 97271214-Aplicatii-SPSS
Se va reţine că procedura ANOVA nu suportă variabila independentă de tip

„ string ”. În imagine baza de date SPSS este ordonată după variabila „shoc” dar acest lucru
nu este necesar pentru procedura de calcul.
Procedura: Statistics-Compare Means-One-Way ANOVA...
Caseta Post Hoc Multiple Comparison:

Caseta principală One-Way ANOVA: Se aleg testele de analiză post-hoc, pentru
Variabila dependentă de trece în lista testarea diferenţei dintre medii luate două
Dependent List (pot fi testate mai multe câte două. Pentru că nu ştim incî dacă
variabile simultan) varianţa este omogenă, vom bifa câte un test
Variabila independentă se trece în zona pentru fiecare caz (Bonferoni, pentru
Factor . varianţă neomogenă şi Tamhane T2, pentru
varianţă omogenă).
În caseta Options, bifăm Descriptives, Homogeneity-of-variance şi Means Plot .
- 41 -
7/29/2019 97271214-Aplicatii-SPSS
După finalizarea setărilor se apasă OK pe caseta principală şi se analizează

rezultatele.
Rezultate
Tabelul Descriptives prezintă indicatorii descriptivi ai variabilei dependente pentru

grupurile analizate.
Tabelul Test of Homogeneity of Variance conţine rezultatul testului Levene. O

valoare neseminificativă a acestuia (cum este cazul nostru p=0.988), conduce la concluzia
că dispersiile în interiorul celor trei grupuri sunt omogene).
un pragTabelul
p=0.000.ANOVA
Atenţie,conţine rezultatului
p=0.000 testului ca
nu se va înţelege F ap=0
cărui
ci valoare este 35.264
ca p<0.001. pentru
În raportul de
cercetare este chiar recomandabil să nu se utilizeze valoarea 0.000 care poate sugera
„certitudinea” rezultatului.
Tabelul Post Hoc Tests – Multiple Comparisons prezintă comparaţiile mediilor

celor trei grupuri, luate două câte două. Reamintim că comparaţiile repetate dintre mediile a
mai mult de două grupuri conduc la acumularea de eroare de tip I. Testele post-hoc sunt
- 42 -
7/29/2019 97271214-Aplicatii-SPSS
astfel în concepute încât să minimizeze acest neajuns. Totuşi, ele nu vor fi în nici un caz
luate în considerare dacă testul F nu atinge pragul de semnificaţie statistică (p<0.05).
Având în vedere că testul Levene a confirmat omogenitatea varianţei, se vor citi
valorile pentru testul Bonferoni (în caz contrar, s-ar fi citit cele pentru testul Tamhane).
Valorile aunt uşor de analizat: În prima coloana avem definite grupurile analizate
(etichetarea
coloana valorilor
a patra (Sig.)variabilei independentepentru
se află semnificaţiile ajută diferenţa
mult la inteligibilitatea tabelului).
dintre medii. Astfel, putemÎn
constata faptul că timpul de reacţie dintre grupul supus şocului de mica intensitate şi cel
supus şocului de medie intensitate nu diferă semnificativ (p=0.520). În acelaşi timp, grupul
supus unui şoc „mic” diferă de grupul supus unui şoc „mare” (p<0.001), la fel ca şi în cazul
comparaţiei dintre grupul cu şoc „mediu” şi cel cu şoc „mare” (p<0.001).
Cu alte cuvinte, variaţia semnificativă a timpului de reacţie în funcţie de cele trei
categorii de intensitate a şocului electric, provine cu precădere de la efectul pe care îl are
şocul „mare”, care provoacă o încetinire a timpului de reacţie consistentă faţă celelalte
două categorii de şoc electric.
Aceasta concluzie este întărită şi de reprezentarea grafică a mediei timpului de
reacţie ale celor trei grupuri.
Aşa cum se poate observa, timpul de reacţie creşte mai accentuat la grupul cu şoc
„mare” în timp ce mediile primelor două niveluri de şoc sunt relativ apropiate.
- 43 -
7/29/2019 97271214-Aplicatii-SPSS
Testul t pentru eşantioane dependente (perechi)
Utilizare
Testul t al diferenţei mediilor a două eşantioane dependente permite evaluarea
semnificaţiei variaţiei unei anumite caracteristici la aceeaşi indivizi în două situaţii diferite
(de exemplu,
diferite, „înainte”
indiferent şi „după”
de momentul acţiunea unei
manifestării anumite
acestora). condiţii,major
Avantajul ori înaldouă contexte
acestui model
statistic este acela că surprinde variaţia numită „intrasubiect”, prin faptul că baza de calcul
este diferenţa dintre cele două valori ale fiecărui subiect în parte.
Exemplu: Un grup de subiecţi efectuează operaţii aritmetice în condiţii de linişte şi,
ulterior, în condiţii de zgomot puternic. Ipoteza cercetării este că zgomotul determină o
reducere a capacităţii de calcul numeric.
Condiţii
Condiţia teoretică a testului este normalitatea distribuţiei de eşantionare a
distribuţiei de diferenţe. Ca şi în celelalte cazuri, teorema limitei centrale determină
normalizarea distribuţiei
În situaţia în caredecondiţia
eşantionare pe îndeplineşte,
nu se măsură ce volumul
se poteşantionului
utiliza testecreşte.
neparametrice
echivalente: testul semnului (pentru date nominale) sau testul Wilcoxon (pentru date
ordinale).
Aranjarea datelor
Vor fi create două variabile distincte, ambele cantitative, măsurate pe scală de tip
I/R, care primesc câte o valoare pentru fiecare subiect.
- 44 -
7/29/2019 97271214-Aplicatii-SPSS
Procedura: Statistics-Compare Means-Paired Sample T Test...
Se selectează cu un clic de mouse, pe rând, O dată constituită, perechea de variabile se

fiecare dintre cele două variabile. Astfel se trece în lista Paired Variables cu butonul de
constituie perechea de variabile în zona transfer (►). Pot fi create mai multe perechi
Curent selection. de variabile şi prelucrate simultan.
Caseta Options permite alegerea pragului de semnificaţie (implicit 0.05).
Rezultate
Primul tabel conţine statistica descriptivă pentru cele două variabile.

Al doilea tabel conţine testul de corelaţie Pearson (r) dintre cele două variabile.
Evaluarea intensitatea asocierii liniare dintre cele două variabile este legitimă în acest
context, dar oferă o informaţie diferită de testul diferenţei dintre medii. Alegerea testului de
corelaţie sau al testului t se decide în funcţie de obiectivul cercetării.
- 45 -
7/29/2019 97271214-Aplicatii-SPSS
În fine, ultimul tabel prezintă rezultatul testului: t=5.076, df=9, p=0.001. Acesta
permite respingerea ipotezei de nul şi acceptarea ipotezei cercetării, zgomotul afectează
capacitatea de calcul aritmetic.
Coeficientul de corelaţie liniară Pearson (r)
Utilizare
Corelaţia Pearson (r) măsoară gradul de asociere dintre variabile. Aceasta se referă
la gradul şi sensul de variaţie concomitentă a valorilor unei variabile în raport cu cealaltă,
după un model de tip liniar.
Domeniul de variaţie a coeficientului de corelaţie Pearson (r) este între r=-1
(corelaţie perfectă negativă) şi r=+1 (corelaţie perfectă pozitivă). Absenţa oricărei legaturi
(corelaţii) dintre variabile se traduce prin r=0.
Exemplu: Testul de corelaţie implică două variabile dar, adesea, într-o cercetare
psihologică numărul variabilelor supuse corelaţiei este mai mare de două. Acest fapt
conduce la ceea ce se numeşte o matrice de corelaţii care este un tabel ale căror celule
cuprind corelaţiile
considerare situaţia îndintre
care seperechile
urmăreştedeevidenţierea
variabile. legăturii
Pentru (asocierii)
exemplificare,
dintresăanxietate
luăm în şi
agresivitate, pe de o parte, şi preferinţa pentru risc pe de altă parte.
Condiţii
Condiţia principală pentru calcularea coeficientului de corelaţie liniară Pearson este
ca variabilele implicate să fie măsurate pe scală de interval/raport (alături de existenţa unei
forme a distribuţiei care nu se abate sever de la curba normală).
Testele neparametrice alternative, pentru cazul în care condiţiile pentru utilizarea
testului Pearson nu se îndeplinesc, sunt: testul chi-pătrat (pentru date nominale) sau
coeficienţii de corelaţie Spearman sau Kendall (pentru date ordinale).
Aranjarea datelor
Se creează variabile distincte pentru fiecare caracteristică supusă testării.
Procedura: Statistics-Corelate-Bivariate
Variabilele supuse corelaţiei vor fi trecute în lista Variables:
- 46 -
7/29/2019 97271214-Aplicatii-SPSS
Testul implicit, din zona Correlation Coefficients, este Pearson, dar se poate bifa un
altul (Kendall sau Spearman), dacă datele sunt neparametrice.
Tipul implicit de testare a ipotezei este bilateral (Two-tailed), dar se poate alege
unilateral (dacă există o justificare solidă).
Flag significant correlations, determină marcarea cu un asterisc a coeficienţilor
semnificativi
este util atuncilacând
p=0.05 şi cu două
matricea asteriscuri
de corelaţie estea mare,
celor semnificativi la p=0.01.
pentru a scoate Acest
în evidenţă lucru
valorile
semnificative ale lui r.
Rezultate
Tabelul rezultatelor cuprinde matricea de corelaţii a variabilelor analizate. El este

redundant, deoarece prezintă aceleaşi corelaţii de două ori, odată deasupra diagonalei,
odată sub diagonală. Corelaţiile variabilelor cu ele însele sunt perfect pozitive (r=1) şi nu
prezintă, desigur, nici un interes.
Fiecare celulă include următoarele informaţii:
• valoarea lui r
• nivelul p
• numărul de subiecţi (N)
- 47 -
7/29/2019 97271214-Aplicatii-SPSS
În cazul nostru, consemnăm corelaţii negative dar nesemnificative între anxietate şi

agresivitate (r=-0.38, p=0.26), pe de o parte, şi între anxietate şi preferinţa pentru risc, pe
de altă parte (r=-0.40, p=0.24). În acelaşi timp, se constată o corelaţie semnificativă
(r=0.96, p<0.001) între agresivitate şi preferinţa pentru risc. Precizăm faptul că raportarea
coeficienţilor de corelaţie se face cu două zecimale, chiar dacă programele îi calculează cu
trei zecimale.
Dezavantajul acestui tip de tabel constă în faptul că avem de fapt o dublă prezentare
a corelaţiilor, deasupra diagonalei şi sub diagonală. Pentru corelaţii implicând multe
variabile tabelul se va cit cu relativă dificultate.
Să presupunem că suntem interesaţi de corelaţiile dintre anxietate şi agresivitate cu
variabila preferinţă pentru risc, nu şi de corelaţia dintre anxietate şi agresivitate. În acest
caz, în caseta principala, Bivariate Correlations, prezentată mai sus, variabilele vor fi
introduse astfel încât variabila „preferinţa pentru risc” sa fie ultima din listă. Apoi se apasă
butonul Paste, al cărui efect este deschiderea domeniului Syntax, ca o fereastră distinctă, în
care se află sintaxa procedurii de corelaţie. Acolo, pe linia /VARIABLES=anx agresiv risc,
se inserează cuvântul WITH, având grijă să existe spaţiu atât în stingă cât şi în dreapta sa.
inseraţi WITH
Mai departe, se selectează întreaga procedură (cu ajutorul mouse-ului) şi se apasă

pe butonul Run (►) de pe bara de comenzi a ferestrei
Rezultatul din Viewer va arăta ca mai jos:
Este evident că această modalitate se poate aplica pentru oricât variabile, dacă avem
grijă să le aşezăm separat în listă şi să includem clauza WITH între cele două categorii de
variabile. Nu pot fi incluse mai multe clauze WITH în aceeaşi procedură.
- 48 -
7/29/2019 97271214-Aplicatii-SPSS
Ulterior, putem reveni în fereastra Syntax pentru a o închide (cu File-Close),

salvând sau nu procedura astfel modificată.
Expresia grafica a corelaţiei ( Scatterplot )

Caracterul şi intensitatea corelaţiei dintre două variabile se evidenţiază extrem de
sugestivAceasta
cu ajutorul
se unei proceduri
lansează dingrafice
meniulspecifice, numită
principal scatterplot .
Graphs-Scatter... care deschide
următoarea casetă de dialog:
În cazul
agresivitate nostru, săpentru
şi preferinţa presupunem că dorim
risc, singura reprezentareaÎngrafică
semnificativă. a corelaţiei
acest scop, dintre
selectăm pe
caseta Scatterplot opţiunea Simple şi apăsăm Define.
Trecem variabila Agresivitate pe axa Y şi variabila Preferinţa pentru risc pe axa Z

(se poate la fel de bine şi invers). Se apasă OK şi se obţine graficul din imaginea
următoare, care sugerează foarte clar existenţa unei asocieri de tip liniar între cele două
variabile.
- 49 -
7/29/2019 97271214-Aplicatii-SPSS
Reprezentarea grafică este sursă de informaţii cu privire la natura relaţiei dintre

variabile, motiv pentru care este recomandabilă utilizarea frecventă a acesteia. Mai mult, ea
este necesară în special atunci când valoarea corelaţiei este redusă, sau nesemnificativă,
deoarece graficul poate scoate în evidenţă o legătura de alt tip decât liniară.
 O corelaţie r=0.92, ca cea obţinută mai sus, între agresivitate şi preferinţă pentu
risc, este improbabil să se întâlnească într-un studiu real. De fapt, dacă s-ar
întâmpla să apară, ar trebui să concluzionăm mai degrabă că cele două variabile
se confundă, decât că sunt distincte.
- 50 -
7/29/2019 97271214-Aplicatii-SPSS
Regresia liniară simplă
Utilizare
Analiza de regresie este o aplicaţie a corelaţiei, utilizată în scopuri de predicţie.
Dacă evaluăm agrsesivitatea ca trăsătură de personalitate şi preferinţa pentru risc ca
expresie a numărului
agresivităţii de incidente
riscul de accident încăîn trafic,deladobândirea
înainte conducătorii auto, se de
carnetului poate estima
şofer. petip
Acest baza
de
regresie, în care există o singură variabilă predictor (agresivitatea) şi o variabilă criteriu
(tendinţa spre risc) se numeşte regresie liniară simplă. Mai frecvent utilizată este regresia
multiplă, care efectuează predicţii bazate pe mai multe variabile predictor asupra unei
variabile criteriu. Vom prezenta mai jos regresia liniară simplă, ca o formă de introducere
în analiza de regresie, mai uşor de înţeles.
Exemplu: Predicţia rezultatului statistică pe baza cunoştinţelor de matematică,
evaluate anterior începerii cursului de statistică.
Condiţii
regresieDin
suntpunct de vedere
aceleaşi statistic,
ca în cazul condiţiile
corelaţiei, variabilelor
deoarece careliniară
regresia sunt supuse
este o analizei
aplicaţiedea
acesteia.
Din punct de vedere metodologic, predicţia presupune, de regulă, evaluarea
variabilei predictor anterior variabilei criteriu. Acest fapt poate sugera o relaţie de tip
cauzal între variabile, dar numai dacă sunt întrunite şi alte condiţii (cum ar fi izolarea
efectelor altor variabile).
Aranjarea datelor
Structura de variabile este similară analizei de corelaţie.
- 51 -
7/29/2019 97271214-Aplicatii-SPSS
Procedura: În principiu, analiza de regresie începe cu coeficientul de corelaţie

dintre variabile şi vizualizarea imaginii scatterplot. În cazul nostru, urmând procedura
prezentată mai sus, am obţinut o corelaţie r=0.74 (p=0.002). Aceste valori confirmă
existenţa unei legături pozitive semnificative, între cunoştinţele de matematică şi
performanţa la statistică. O idee mai exactă ne oferă coeficientul de determinare r 2=0,5476.
Acesta ne la
valorilor spune că 54%„cunoştinţe
variabila din variaţiade
„performanţei
matematică”.la statistică”
Deducem estecă explicată
restul dede46%variaţia
din
1
performanţa la statistică este explicată de alte variabile, necunoscute în această fază .
Pe baza acestor concluzii se poate trece la analiza de regresie a cărei finalitate este
aceea de obţinere a coeficienţilor a (termenul liber, sau originea dreptei de regresie) şi b
(panta dreptei de regresie), cu ajutorul cărora se poate estima în viitor performanţa la
statistică pe baza rezultatului la un test de cunoştinţe matematice aplicat în prima zi de
şcoală. Neîndoielnic, o astfel de procedură s-ar justifica mai ales pentru identificarea
studenţilor cu potenţiale dificultăţi şi care, tocmai fiind avertizaţi în legătură cu aceste
dificultăţi vor putea să acorde statisticii o atenţie sporită, în vederea obţinerii unui rezultat
peste nivelul celui prezis.
Lansarea procedurii: Statistics-Regression-Linear...
În caseta principală Linear Regression, se trece variabila criteriu în zona Dependent

iar variabila criteriu în zona Independent(s).
În caseta Regression Save, bifăm Predicted

Values-Unstandardized şi Residuals-
În caseta Statistics, bifăm Estimates pentru
Unstandardized , care vor avea ca efect
obţinerea coeficienţilor de regresie (opţiune crearea de variabile distincte în baza de date.
implicită)
Prediction interval (individual) va calcula
limitele de încredere pentru valorile prezise.
1
Facem precizarea că valorile şi aprecierile nu se bazează pe un studiu reale.
- 52 -
7/29/2019 97271214-Aplicatii-SPSS
 Valorile prezise sunt valorile rezultate pe baza modelului de predicţie.

 Valorile reziduale se calculează ca diferenţă între valorile variabilei criteriu si
cele prezise pe baza modelului de regresie.
Analiza rezultatelor
Tabelul Model Summary oferă valoarea coeficientului de regresie, notat cu R, care

este identic cu coeficientul de corelaţie dintre cele două variabile. Dacă modelul de regresie
ar fi avut mai multe variabile predictor, R ar fi fost coeficientul de corelaţie multiplă dintre
predictori şi criteriu. Interpretarea este similară coeficientului de corelaţie simplă, la fel ca
şi pentru R 2, care este coeficientul de determinare al lui R. Valoarea lui ne spune că 55%
din variaţia performanţei la statistică este explicată de variaţia variabilei „cunoştinţe de
matematică”. „ Adjusted R Square” este o corecţie a lui R 2 în funcţie de numărul de
predictori şi numărul de subiecţi.
Tabelul Coefficients conţine coeficienţii B (nestandardizaţi) şi coeficientul beta

(standardizat), care pot fi utilizaţi, la alegere, în ecuaţia de predicţie.
Astfel, de exemplu, dacă un student realizează un scor de 30 la testul de cunoştinţe de
matematică, se poate estima performanţă finală la statistică cu ajutorul relaţiei:
stat _ fin = a + b * mat _ in = 3.406 + 0.854 * 30 = 29.02
unde 3.406 este originea iar 0.854 este panta dreptei de regresie.
- 53 -
7/29/2019 97271214-Aplicatii-SPSS
Sau, dacă predicţia se face pe baza unui scor standardizat z al variabilei mat_in (să zicem,
0.93), atunci:
stat _ fin = beta * mat _ in = 0.742 * 0.93 = 0.69
În acest caz termenul liber are valoarea 0, deoarece originea dreptei pentru scoruri
standardizate se află în 0.
Desigur, scorurile astfel prezise sunt estimări, atâta timp cât corelaţia dintre variabile nu
este perfectă. Iar estimările conţin cu atât mai multă eroare cu cât corelaţia dintre variabile este
mai mică (punctele graficului de corelaţie fiind mai îndepărtate de dreapta de regresie).
La finalul procedurii analizei de regresie, cu setările de mai sus, în baza de date apar
câteva variabile noi, aşa cum se vede în imaginea de mai jos.
Variabila pre_1, conţine valorile prezise pe baza modelului de regresie.

Variabila res_1, conţine diferenţa dintre valoarea reală şi valoarea prezisă
Variabilele lici_1 şi lici_2, conţin limitele inferioară şi superioară ale intervalului de
încredere pentru fiecare valoare în parte. Pentru a înţelege mai bine problema limitelor, să
privim prima valoare prezisă de pe coloana pre_1 (25.598). Cu un nivel de încredere de
95% (echivalent cu o probabilitate de eroare de 0.05), putem spune că valoarea adevărată
pentru stat_fin prezisă pe baza valorii mat_in=26, s-ar afla în intervalul 21.77 şi 29.41.
În fine, rezultatele conţin şi imaginea scatterplot a relaţiei dintre valorile mat_in şi
scorurile z ale variabilei pre_1.
- 54 -
7/29/2019 97271214-Aplicatii-SPSS
Imaginea este identică cu ceea ce am prezentat în cazul corelaţiei. Singura

deosebire
- se este dată dedublu
acţionează trasarea
clicdreptei.
de mouseAceasta se face de
pe imaginea către operator,
graficului în felul
din Viewer . prinurmător:
care...
- graficul este trecut deschis într-o fereastră individuală de editare, în care...
- se execută procedura Chart-Options-Fit Line- Fit Options. La capătul acestei serii
de acţiuni apare caseta de mai jos unde se marchează Linear regression.
Facem precizarea că acest procedeu de trasare a liniei în interiorul scatterplotului

este utilizabil şi în cazul corelaţiei. Dacă se alege alt model decât cel liniar (de exemplu,
Quadratic regression) se va obţine linia de regresie sub formă curbilinie, punând în
evidenţă abaterile de la modelul liniar. Acest lucru este cu deosebire util atunci când
corelaţia
un modeleste mică,
liniar fapt
(vezi care se poate
exemplul datora
din prima faptuluia că
secţiune relaţia dintre
manualului, variabile
bazat nu urmează
pe corelaţia dintre
scorurile z şi probabilităţile de sub curba normală).
Ce utilizăm, corelaţia sau regresia?
Corelaţia şi regresia liniară sunt similare şi, de aceea, uşor de confundat. În unele
situaţii pot fi utilizate ambele proceduri.
- 55 -
7/29/2019 97271214-Aplicatii-SPSS
Se calculează corelaţia liniară:

• atunci când există două variabile măsurate pe aceiaşi subiecţi şi se doreşte
evaluarea gradului de asociere între variabile
• atunci când distribuţiile de eşantionare ale celor două variabile sunt normale (atunci
când cel puţin una dintre variabile este manipulată, nu se calculează corelaţia
Pearson) regresia liniară:
Se calculează
• atunci când una dintre variabile precede şi poate fi cauza celeilalte variabile
• atunci când una dintre variabile este manipulată, se calculează regresia
• atenţie, calculele regresiei nu sunt simetrice, ca urmare, inversând variabilele în
ecuaţia de regresie se va obţine o linie de regresie diferită, în timp ce dacă se
inversează ordinea variabilelor în calcularea corelaţiei, se obţine acelaşi coeficient
r .
- 56 -
7/29/2019 97271214-Aplicatii-SPSS
Analiza de consistenţă internă (Cronbach alfa)
Utilizare
Una din condiţiile fundamentale a unui instrument de evaluare psihologică este
aceea de a fi sigur şi consistent. Exprimat cu alte cuvinte, aceasta înseamnă ca itemii din
care este constituit
semnificaţiei (întrebări
unui construct sau anume:
psihic sarcini scala
de altă
unuinatură) să contribuie
chestionar, scorul la olacaracteristică
constituirea
psihică de performanţă, etc. În mod practic şi direct exprimat, un instrument este sigur şi
consistent atunci când itemii din care este compus corelează, atât între ei cât şi fiecare
dintre ei cu rezultatul aditiv al tuturor itemilor (scala, scorul global).
Analiza de consistenţă internă, prin calcularea coeficientului Cronbach alfa, este
metoda statistică prin care se verifică respectarea exigenţelor enunţate mai sus. În esenţa ea
este o aplicaţie a corelaţiei, ceea ce reprezintă unul din motivele pentru care o tratăm aici.
Al doilea motiv, poate încă şi mai important, este acela că încă din primii ani de studiu
studenţii la psihologie se află în situaţia de a utiliza instrumente psihologice sau de a le crea
ei înşişi (cel mai adesea chestionare). În acest scop, evaluarea consistenţei interne este o
etapă absolut obligatorie
Întrebările în elaborarea
unui chestionar şi finalizarea
sau itemii respectivului
unui test instrument.
de performanţă sunt concepuţi pentru
a măsura un anumit atribut (atitudine, factor, comportament, cunoştinţă). Consistenţa
internă se defineşte ca proprietatea itemilor de a corela cu „scorul global” al testului sau
scalei din care fac parte. Din moment ce toţi itemii trebuie sa reflecte un anumit atribut, ei
trebuie să manifeste o varianţă comună, să coreleze unii cu alţii şi, în acelaşi timp, să
coreleze fiecare cu scorul care reflectă atributul respectiv. Corelaţia dintre un item şi scorul
total, din care se omite acel item, ne oferă o indicaţie cu privire la relevanţa itemului
respectiv pentru rezultatul global al testului. Atunci când fiecare item este relevant, putem
spune că testul respectiv este are „consistenţă internă”.
O altă faţetă a consistenţei unui instrument este siguranţa sa în aplicări repetate. Ea
poate fi descrisă
alternativă ca stabilitate
echivalentă, a aceloraşi
este aplicată scorului subiecţi.
atunci când acel instrument, sau o formă
Fără a fi singura procedură statistică utilizabilă în astfel de situaţii, coeficientul
Cronbach alfa este de departe cel mai cunoscut dintre toate, fiind utilizat ca un indicator al
preciziei de măsurare a unui test, al consistenţei interne şi fidelităţii unui instrument
psihologic. În mod normal, valoarea indicelui Cronbach alfa tinde să crească pe măsură ce
numărul itemilor creşte. Dar utilizarea unor teste cu mulţi itemi este neconvenabilă din mai
multe motive. Unul dintre acestea este timpul consumat cu aplicarea lor, altul, poate fi
inutilitatea de a păstra itemi a căror contribuţie la scorul global este nulă, mică sau,
dimpotrivă, merge în altă direcţie decât acesta. Identificarea şi eliminarea acestor itemi, ori
modificarea lor în spiritul atributului măsurat, este unul dintre obiectivele analizei de itemi.
Ea are un caracter recursiv, cu evaluări succesive ale relaţiilor dintre itemi şi dintre itemi şi
scorul global, şi operarea selecţiei itemilor în funcţie de relaţia lor cu acesta. Criteriul de
bază pentru această operaţie este valoarea indicelui Cronbach alfa, care are o plajă de
variaţie între 0 şi 1. O scală, pentru a fi considerată consistentă, trebuie să atingă o valoare
cât mai aproape de 1, nivelul de 0.70 fiind acceptat de majoritatea cercetătorilor ca prag
limită de validare a criteriului de consistenţă internă. Oricum, valoarea lui Cronbach alfa
nu poate fi mai mică de 0.60.
- 57 -
7/29/2019 97271214-Aplicatii-SPSS
Coeficientul de consistenţă internă Cronbach alfa se calculează în următoarele

situaţii:
• atunci când realizăm un instrument nou
• atunci când se traduce un instrument vechi într-o altă limbă
• atunci când un instrument utilizat în anumite condiţii, urmează a fi utilizat în cu
totul
aplicatalte
pânăcondiţii (deregim
atunci în exemplu,
creiontrecerea
hârtie). la utilizarea computerizată a unui test
Condiţii
Crearea unor variabile distincte care conţin răspunsurile la fiecare item (întrebare).
Valorile înregistrate pentru răspunsuri vor fi valorizate în funcţie de semnificaţia lor
în raport cu rezultatul global (scala). Cu alte cuvinte, variabilele trebuie să conţină valori
care exprimă semnificaţia răspunsului în raport cu scala globală, şi nu răspunsul efectiv al
subiectului. De exemplu, dacă variantele de răspuns sunt codificate cu 1, respectiv 2, pot
exista întrebări pentru care varianta „1” aduce un punct la scala iar varianta „2” aduce zero
puncte la scală. Într-o asemenea situaţie, pentru analiza de itemi valorile codificate de
răspunsitemii
pentru vor ficare
transformate în valori
au mai multe corespunzătoare
variante (0 şi este
de răspuns, cum 1). Încazul
acelaşi mod se
scalelor deva
tipopera şi
Likert.
Codurile convenţionale ale variantelor de răspuns vor fi transformate în valori, în funcţie
de semnificaţia contribuţiei lor la construirea scorului global.
Aranjarea datelor
Baza de date va conţine variabile pentru fiecare dintre itemii supuşi analizei
(aceasta nu înseamnă că nu pot exista şi alte variabile, desigur).
Imaginea redă rezultatele primilor opt subiecţi la o scală cu 10 itemi, de tip Lickert,
pentru evaluarea atitudinii faţă statistică. Toate prelucrările care urmează sunt efectuate pe
datele complete.
Procedura: Statistics-Scale-Reliability Analysis...
- 58 -
7/29/2019 97271214-Aplicatii-SPSS
În caseta principală, Reliability Analysis, variabilele itemilor vor fi trecuţi în lista

Items (imaginea surprinde momentul în care mai sunt de trecut itemii de la 6 la 10).
În lista Model se poate alege unul dintre următoarele modele de analiză:
• Alfa. Calculează Cronbach alfa care pentru date dihotomice este echivalent cu
coeficientul Kuder-Richardson 20 (KR20)

• Split-half . Pentru corelaţia dintre forme paralele, coeficientul de fidelitate Guttman,
coeficientul Spearman-Brown, coeficientul alfa pentru fiecare jumătate.
• Modele Gutman. Coeficienţii lambda, de la 1 la 6
• Modele paralele şi strict paralele. Testele pentru gradul de corespondenţă
( goodness-of-fit ), varianţa comună, şi alte caracteristici ale raporturilor dintre itemi.
Pentru analiza de consistenţă internă se alege modelul Alfa.
În continuare, se fac setări de analiză prin deschiderea casetei Statistics:
În zona Descriptives se vor bifa opţiunile:

• Item (analiza fiecărui item separat);
• Scale (analiza scorului global)

• Scale if item deleted (analiza scorului fără contribuţia unui anumit item)
În zona Inter-item se va bifa Corelations, pentru a obţine matricea de corelaţii
dintre itemi.
În zona Summaries se poate cere calcularea unor indicatori descriptivi pentru
fiecare dintre itemii analizaţi (media, varianţa, covarianţa, corelaţii).
În practică, bifarea opţiunilor marcate pe caseta din imaginea de mai sus oferă
informaţiile cele mai importante pentru analiza itemilor unui test. Celelalte opţiuni sunt
explicitate în Help-ul casetei şi pot fi utilizate pentru o analiză mai rafinată a datelor.
- 59 -
7/29/2019 97271214-Aplicatii-SPSS
Rezultate
În continuare vor fi analizaţi un cei 10 itemi ipotetici, aleşi doar în scop didactic.
Pentru o scală reală acest număr ar fi cu totul insuficient. Ca regulă generală, numărul
itemilor din faza de dezvoltare a unui astfel de instrument ar trebui să aibă cel puţin dublul
numărului
un de itemicare
proces selectiv pe care
are îldrept
preconizăm la final.itemilor
scop alegerea Şi această pentrupentru
adecvaţi că analiza de itemiunei
constituirea este
scale cu cel mai ridicat nivel de consistenţă internă posibilă.
Rularea procedurii, cu setările de mai sus ne oferă următoarele categorii de
informaţii:
Tabelul de mai sus cuprinde lista itemilor, media abaterea standard şi numărul
cazurilor. . Analiza valorilor permite evidenţierea tendinţei centrale şi a împrăştierii
răspunsurilor pentru fiecare item. Eventuale anomalii pot fi sesizate încă din această fază.
De exemplu, se poate constata că media itemului I_02 este mai mică decât a celorlalţi, fapt
care sugerează răspunsuri grupate spre valorile mici.
Tabelul Correlation Matrix oferă o imagine a gradului de asociere dintre itemi.

Valorile sunt utile, pe de o parte, pentru a sesiza itemii care tind să aibă relaţii negative cu
ceilalţi, fiind un semn al unei posibile probleme de construire respectivilor itemi. Din
tabelul alăturat rezultă că itemii i_02 şi i_03 tind să se asocieze negativ cu majoritatea
celorlalţi itemi. Pe de altă parte, valori extrem de ridicate ale unor corelaţii, aproape de 1,
ar putea sugera că itemii respectivi prezintă un grad de similitudine care nu justifică
- 60 -
7/29/2019 97271214-Aplicatii-SPSS
utilizarea lor în aceeaşi scală (ar putea fi, de exemplu itemi formulaţi extrem de
asemănător).
Tabelul următor conţine un set de indicatori statistici descriptivi la nivelul întregii

scale, rezultată prin însumarea răspunsurilor la fiecare item (medie, varianţă, ab.std, ) sau al
itemilor.
În fine, cea mai importantă dintre categoriile de informaţii, este tabelul Item-total
Statistics, care include relaţiile dintre itemi şi scorul global. Două dintre coloanele alăturate
au o importanţă particulară: Corected Item-Total Correlation (corelaţia dintre fiecare item
şi scorul global) şi Alpha if Item Deleted (valoarea lui Cronbach alfa, dacă respectivul item
ar fi eliminat).
Dacă privim prima dintre aceste două coloane, observăm că doi dintre itemi ( i_03 şi
i_09) au corelaţii negative cu scorul global. Aceasta înseamnă că ei nu numai că nu aduc
informaţie utilă în raport cu atributul măsurat ci, dimpotrivă, merg într-o direcţie opusă
acestuia. În acest caz trebuie să verificăm dacă valorile itemului respectiv au fost corect
codificate.
Observăm, deDacă da, atunci
asemenea, singurai_02
că itemul soluţie
are oposibilă este
corelaţie eliminarea
extrem de micăitemilor în cauză.
cu scorul global
(0.015). Contribuţia sa la construcţia scalei este extrem de mică, nesemnificativă. Cu alte
cuvinte, nici nu strică dar nici nu ajută, în schimb, consumă timpul subiectului pentru a
răspunde.
- 61 -
7/29/2019 97271214-Aplicatii-SPSS
Pe ultima linie a imaginii găsim valoare lui Cronbach alfa, care este 0.457, o
valoare care este modestă în raport cu nivelul minim necesar (0.702) dar care poate fi
crescută prin eliminarea itemilor nepotriviţi, în primul rând a celor care corelează negativ
cu scorul global.
Următoarea fază este reluarea prelucrării, cu eliminarea itemilor negativi din lista
Items din caseta
simultan, principală.
dar itemii negativiÎnpot
general, nu toţi
fi scoşi esteodată,
recomandabilă eliminarea
fără reţineri. maieste
Iată care multor itemi
rezultatul
eliminării itemilor 3 şi 9 asupra consistenţei interne:
Ca urmare a noii iteraţii, se observă că itemul i_02, care anterior avea o corelaţie
pozitivă dar extrem de mică, a dobândit o corelaţie negativă cu scala. Ca urmare, va fi
eliminat. În orice caz, chiar şi itemii pozitivi, care au corelaţii cu scala mai mici de 0.1 nu
trebuie păstraţi, pentru simplul motiv că nu contribuie la constructul psihologic vizat, fiind
doar consumatoare de timp în aplicarea instrumentului. De altfel, se şi observă că prin
eliminarea acestui
Se reia singur item,
prelucrarea valoarea lui itemul
eliminându-se Cronbach dincreşte
i_02alfa la 0.75.
lista din caseta principală şi se
obţine următoarea configuraţie de rezultate:
Datele indică o valoarea Cronbach alfa de 0.75. În plus, dacă privim ultima coloană
de cifre, vedem că prin eliminarea oricărui item nu am obţine o valoare mai ridicată decât
2
Deşi programele computerizate îl calculează cu un număr mai mare de zecimale, indicele Cronbach alfa se
raportează doar cu două zecimale.
- 62 -
7/29/2019 97271214-Aplicatii-SPSS
aceasta. Ca urmare, itemii rămaşi pot constitui o scală consistentă de evaluare a

constructului psihologic pentru care au fost aleşi.
În concluzie, cu ocazia iteraţiilor succesive se vor elimina, in ordine:
• itemii care au o corelaţie negativă cu scorul global
• itemii cu corelaţii mici, nerelevante
Cu cât
itemi care avem mai
corelează maimulţi itemi
intens cu înscala
această fază, cu
şi, deci, să atât avemun
atingem posibilitatea
nivel mai să păstrăm
ridicat de
consistenţă internă. Este de la sine înţeles că, în cazul în care construim un instrument ale
cărui întrebări se adresează unor sub-scale diferite, consistenţa internă se va evalua separat
pentru setul de întrebări corespunzător fiecărei sub-scale.
O scală „consistentă intern” ne oferă garanţia că itemii instrumentului nostru „merg
împreună”, măsoară acelaşi „construct” psihologic. Atenţie, însă, acest lucru nu ne permite
încă să afirmăm că măsoară exact ceea ce n-am propus să măsoare. Această problemă va fi
rezolvată ulterior, prin studii de validare.
Aşa cum concluziile studiilor statistice sunt mai sigure atunci când sunt efectuate pe
eşantioane mai mari, acelaşi principiu se aplică şi în cazul construcţiilor scalelor: cu cît mai
mulţi itemi cu atâtitemilor
Numărul mai binenecesari
pentru consistenţa scalei. o scală care nu a atins valoarea
pentru a completa
acceptabilă a indicelui Cronbach alfa poate fi estimat cu ajutorul formulei Spearman-
Brown:
α k * (1 − α x )
k =
α x * (1 − α k )
unde:
αx este valoarea curentă a lui Cronbach alfa
αk este nivelul dorit al lui Cronbach alfa
k este factorul de multiplicare a scalei pentru a se obţine α k
Într-un mod similar, se poate estima valoarea lui Cronbach alfa (αk ) care ar fi atinsă
pornind de la un anumit nivel calculat al acestuia α x şi un anumit factor de multiplicare al
numărului de itemi (k):
k * α x
α k =
1 + ((k − 1) * α x )
Exemplu:
Avem o scală cu 20 de itemi şi α x=0.50
Câţi itemi ar trebui adăugaţi pentru a atinge un nivel α de 0.70?
α k * (1 − α x ) .70 * (1 − .50)
k = = = 2.33
α x * (1 − α k ) .50 * (1 − .70)
Deci, pentru a atinge un α de 0.70 va trebui să avem o scală de 20*2.33≈47 itemi,

ceea ce înseamnă că ne vor mai trebui 27 de itemi pe lângă cei 20 deja existenţi (estimare
- 63 -
7/29/2019 97271214-Aplicatii-SPSS
valabilă pentru situaţia în care noii itemi ar avea aceeaşi corelaţie inter-itemi cu cei deja
existenţi).
Pentru acelaşi caz, cu cât ar creşte α dacă am adăuga 30 de itemi:
k=(nr. itemi iniţiali+nr. itemi noi)/nr. itemi noi=(20+30)/20=2.5

k * α x 2.5 * .50
α k = = = 0.71
1 + ((k − 1) * α x ) 1 + ((2.5 − 1) * .50)
Desigur, se presupune că noii itemi adăugaţi vor fi la fel de „buni” ca şi cei deja
utilizaţi. De aceea este posibil ca rezultatul formulei să fie o estimare uşor optimistă dar nu
mai puţin utilă.
Utilizarea improprie a analizei de itemi
subiect,Atunci
pentrucând o scală
alt scop estecel
decât utilizată pentrusau
de selecţie a măsura cunoştinţe
evaluare asupra
comparativă unuiindivizi,
între anumit
utilizarea indicelui Cronbach alfa nu este adecvată. O valoare redusă a acestuia nu poate
însemna că itemii nu măsoară un anumit tip consistent de cunoştinţe (fapt incontestabil din
moment ce fac parte dintr-un univers de cunoaştere bine definit) ci mai degrabă că subiecţii
au răspuns la întâmplare. Mai departe, în cazul în care răspunsurile la o anumită întrebare
sunt corecte pentru cea mai mare parte a subiecţilor, sau pentru toţi, deşi am fi tentaţi să
apreciem acest fapt ca o expresie pozitivă a „corelaţiei itemului cu scorul global”, avem de
a face mai degrabă cu un item prea uşor, care nu este suficient de discriminativ pentru a fi
păstrat.
Chiar şi în acest tip de situaţii, totuşi, analiza de itemi poate fi folositoare ca
modalitate
pentru de identificare
a scoate în evidenţăaerorile
itemilor greşit
tipice peformulaţi,
care le facasubiecţii
celor nerelevanţi
la anumitesau, pur şi simplu,
întrebări.
- 64 -
7/29/2019 97271214-Aplicatii-SPSS
Teste neparametrice nominale

Testul z al proporţiei pentru un singur eşantion
Utilizare
Testul
dihotomice pentrupentru
z
a testaproporţii
diferenţapentru
dintre un eşantion,
proporţiile este utilizat
valorilor în cazul
în eşantion prinvariabilelor
comparaţie
cu proporţia la nivelul populaţiei.
Exemplu: La întrebarea „cine se uită la telenovele?” răspund DA 7 subiecţi, dintre
care 5 femei şi 2 bărbaţi. Întrebarea cercetării este dacă femeile se uită într-o proporţie mai
mare decât bărbaţii la telenovele.
Condiţii
Cunoaşterea proporţiei la nivelul populaţiei pentru valorile variabilei testate. În
cazul nostru, raportul femei/bărbaţi este cunoscut din studiile demografice (51%/49%)
Aranjarea datelor
Se creează variabila dihotomică cu valori numerice. Variabilele de tip „string” nu
sunt acceptate de procedura SPSS. În cazul nostru, valorile sunt 1 pentru feminin şi 2
pentru masculin.
Procedura: Statistics-Non Patametric Tests-Binomial...
• Variabila testată este trecută în lista Test Variable List :
- 65 -
7/29/2019 97271214-Aplicatii-SPSS
• În zona Define Dichotomy se alege Get from data, dacă variabila este
dihotomică, sau Cut point , dacă variabila este continuă, prin fixarea unei
valori care împarte distribuţia în două categorii.
• În zona Test proportion se introduce proporţia primei categorii.
• Butonul Options permite solicitarea statisticii descriptive pentru variabila
testată.
Rezultate
Rezultatul în cazul exemplului dat cuprinde frecvenţa pe categorii, procentul şi

semnificaţia testului în raport cu proporţia la nivelul populaţiei (p=0.243). În acest caz, se
acceptă ipoteza de nul şi se respinge ipoteza cercetării. Proporţia femeilor care se uită la
telenovele nu diferă semnificativ de proporţia bărbaţilor, prin raportare la proporţia lor în
populaţie.
- 66 -
7/29/2019 97271214-Aplicatii-SPSS
Testul semnelor
Utilizare
Testul semnelor este utilizat pentru a testa diferenţa dintre valori, utilizându-se
semnul diferenţei şi nu valoarea acesteia, atunci când ambele valori sunt măsurate pentru
aceiaşi subiecţi
diferenţelor . Dacăarnu
pozitive ar exista
trebui să fienici
egalo cu
diferenţă între valorilenegative.
cel al diferenţelor perechi, Cu
atunci
cât numărul
diferenţelor de un anumit semn este mai mare comparativ cu cel al diferenţelor de semn
opus, cu atât creşte posibilitatea ca diferenţa dintre variabile să fie statistic semnificativă.
Exemplu: Într-un experiment cu privire la efectul motivării asupra memorării,
subiecţilor li se cere să memoreze cuvinte dintr-o listă, înainte si după introducerea unui
factor motivant. Dat fiind faptul că numărul subiecţilor este prea mic pentru asumarea
normalităţii distribuţiei de eşantionare, se alege testul semnului, în locul testului t pentru
eşantioane dependente.
Condiţii
măsură,Variabilele
pentru a sevor fi de
putea tipdiferenţa
face numeric,lor.
iar valorile exprimate în aceeaşi unitate de
Aranjarea datelor
Imaginea de mai jos conţine variabilele „inainte” şi „dupa”, care vor fi analizate.
Variabila „dif” conţine rezultatul diferenţei „dupa-inainte”.

Variabila „semn”, conţine semnul diferenţei. Ambele sunt prezentate numai pentru
a face mai evident baza de calcul a testului deoarece, în fapt, nu sunt relevante sub aspectul
procedurii SPSS.
2. Dacă nu se dispune de valorile variabilelor ci numai de semnul diferenţei,
testul semnului va fi calculat manual, pe baza formulei 4.7.
Procedura: Statisstics-Nonparametric Tests-2 Related Samples...
În prima fază, cele două variabile sunt Apoi, perechea de variabile este trecută în
selectate, pe rând, prin clic de mouse pe lista Test Pair(s) List: prin acţionarea
fiecare, constituindu-se în pereche. Acest butonului ►.
fapt se observă în partea de jos a casetei, în Dacă este necesar, se pot testa simultan mai
- 67 -
7/29/2019 97271214-Aplicatii-SPSS
zona Current Selections.

multe perechi de variabile.
Se bifează Sign în zona Test Type.
Rezultate
Tabelul Sign Test cuprinde numărul diferenţelor pozitive, respectiv negative, pentru

cazurile din baza de date. În cazul nostru, există 7 diferenţe pozitive şi nici o diferenţă
negativă.
Tabelul Test Statistics, prezintă semnificaţia testului (p=0.016). Ipoteza de nul se

respinge dacă valoarea lui p este mai mică decât pragul fixat şi care, implicit, este 0.05. În
exemplul dat, ipoteza de nul se respinge, acceptându-se ipoteza cercetării (motivarea
stimulează memorarea).
- 68 -
7/29/2019 97271214-Aplicatii-SPSS
Testul Chi-pătrat al asocierii (independeţei)
Utilizare
Testul chi-pătrat este utilizat pentru evidenţierea gradului de asociere între două
variabile categoriale.
Exemplu:
diagnosticaţi Să presupunem
cu sindrom că am evaluat
de stres postraumatic (PTSD)numărul femeilor
dintr-un şi afectat
mic oraş, al bărbaţilor
de un
cutremur de pământ, iar datele sunt cele din următorul tabel de corespondenţă:
Femei Bărbaţi
PTSD 20 10
Non-PTSD 30 40
Problema cercetării este dacă incidenţa PTSD este în legătură cu caracteristica de
sex.
Condiţii
• Cele două în
variabile
fie incluşi mai multnudetrebuie să de
o celulă se tabel).
„intersecteze” (să nu existe subiecţi care să
• Este recomandabil ca frecvenţa aşteptată să nu ia valori mai mici de 5 (sau, cel
puţin, în nu mai mult de 20% din celule).
• Nici o celulă nu trebuie să aibă frecvenţa aşteptată 0..
Aranjarea datelor
Datele pot fi incluse în Data Editor în două moduri:
a. Sub forma unor înregistrări distincte pentru fiecare caz
Acest
există deja mod poate
o statistică fi extrem
globală de dezavantajos
a fenomenului PTSDatunci când
în raport cusunt multe cazuri sau când
sexul.
b. Sub forma unor înregistrări distincte pentru valorile caracteristicii de sex:
- 69 -
7/29/2019 97271214-Aplicatii-SPSS
În această situaţie, se introduc frecvenţele PTSD pentru toate combinaţiile valorilor

celor două variabile analizate şi frecvenţele asociate fiecăreia. Pentru a se realiza
corespondenţa dintre variabilele sex şi PTSD cu variabila frecv, se apelează la procedura
Data-Wheight Cases...:
Facem precizarea că în tabelele de date din imaginile de mai sus variabilele au fost
codificate numeric cu 1 respectiv 2, atât pentru sex cât şi pentru PTSD, valorile fiind
etichetate. Faptul că în celule apar etichetele şi nu valorile, se obţine prin setarea Data-
Value Labels.
 Procedura Chi-pătrat acceptă şi variabile de tip caracter ( string ) dar reamintim

recomandarea de principiu ca toate variabilele să fie declarate de tip numeric.
Procedura: Statistics-Summarize-Crosstabs...
Casetele de configurare sunt următoarele:
• În caseta principală Crosstabs se trec variabilele analizate în lista Row(s), respectiv

Columns(s). Pot fi analizate mai multe perechi de variabile simultan. Rezultatul
analizei nu depinde de modul de plasare a variabilelor pe linie sau pe coloană. Dacă
de doreşte crearea unui grafic al corespondenţei dintre variabile, se va bifa şi
Display clustered bar charts.
• În caseta Statistics se bifează Chi-Square.
• În caseta Cell Display se bifează Counts-Observed ; Percentages-Row, Column,
Total şi Residuals-Unstandardized (bifarea opţiunilor este în funcţie de informaţiile
pe care le doreşte analistul).
- 70 -
7/29/2019 97271214-Aplicatii-SPSS
Rezultate
Imaginea prezintă tabelul de corespondenţă, având pe linii valorile caracteristicii de

sex iar pe coloane valorile aferente variabilei PTSD. În celulele tabelului se află valorile
solicitate
•
prin configurarea
Count casetelor.
20 indică numărul Vomcuexemplifica
femeilor PTSD pentru celula „feminin/da”:
• %within Sex 40.0% indică procentul femeilor care au manifestat PTSD din totalul
femeilor
• %within PTSD indică procentul femeilor cu PTSD din totalul celor care au
manifestat PTSD
• % of Total indică procentul femeilor cu PTSD din totalul subiecţilor
• Residual indică diferenţa dintre numărul de femei cu PTSD (frecvenţa observată) şi
frecvenţa aşteptată (în cazul nostru, +10)
În tabelul Chi-Square Tests citim valoarea testului Pearson Chi-Square (16.66) şi,
în special, pragul de semnificaţie al acestuia (p=0.000 care va fi citit ca p<0.001). În cazul
particular al acestui exemplu, unde tabelul de corespondenţă este format din două linii şi
două coloane, valoarea lui chi-pătrat poate fi luată de pe linia Continuitiy Correction
(15.04) Valoarea
cu valoarea aferentă
testului a praguluifiind
chi-pătrat de semnificaţie: p<0.001.
mai mică decât nivelul alfa 0.05, se respinge
ipoteza de nul şi se confirmă ipoteza cercetării: există o incidenţă mai mare a reacţiei de
stres postraumatic la femei decât la bărbaţi.
 În raportarea statisticii chi-pătrat va fi inclusă valoarea gradelor de libertate (df) şi

numărul cazurilor
 Valoarea lui chi-pătrat se raportează cu două zecimale
- 71 -
7/29/2019 97271214-Aplicatii-SPSS
Graficul de tip bară permite vizualizarea relaţiei dintre variabile.
Testul Chi-pătrat pentru corespondenţă ( goodness of fit )
Utilizare
Testul chi-pătrat pentru gradul de corespondenţă se utilizează atunci când dorim să
comparăm frecvenţele observate unei singure variabile categoriale cu frecvenţele aşteptate,
dinainte cunoscute.
Exemplul 1: Avem evaluarea nivelului de inteligenţă pe cinci categorii valorice, de
la foarte slab, la foarte bun şi dorim să ştim dacă distribuţia acestor calificative se supune
curbei normale, procentele aferente pe curba normală fiind cunoscute (2.5%, 14%, 67%,
14%, 2.5%).
Exemplul 2: Am solicitat unui grup de tineri să îşi exprime genul muzical preferat
şi am obţinut frecvenţe diferite pentru mai multe genuri de muzică. Problema este dacă
diferenţele dintre aceste frecvenţe sunt semnificative, presupunând că, dacă nu ar fi
semnificative
(adică, dacă ar proporţiile preferinţelor
fi trei genuri, pentrusăgenurilor
fiecare ar trebui muzicale,
întrunească ar trebui
un procent să fie identice
de 33.33%).
Aranjarea datelor
Vom exemplifica pe o situaţie corespunzătoare celui de-al doilea exemplu. Baza de
date se poate constitui fie prin înregistrarea fiecărui caz în parte (având o variabilă pentru
genul muzical şi o alta pentru exprimarea preferinţei faţă de acesta), fie, ca în exemplul
anterior, prin înregistrarea rezultatelor sintetice şi ponderarea variabilei gen_muz cu
variabila frecv prin operaţia Data-Weight cases...:
- 72 -
7/29/2019 97271214-Aplicatii-SPSS
Procedura: Statstics-NonParametric-Tests-Chi-Square...
• În caseta Chi-Square Test se trece variabila analizată în zona Test Variable

List .
• Se bifează All categories equal , acesta fiind modelul în raport cu care dorim
să testăm frecvenţele variabilei analizate
• Dacă am fi dorit să le testăm în raport cu alte frecvenţe cunoscute, am fi
bifat Values şi, apoi, am fi introdus pe rând acele frecvenţe (scriindu-le în
dreptul lui Values şi înregistrându-le prin butonul Add )
Rezultate
Cele două tabele cu rezultate din Viewer prezintă:

• Frecvenţele observate, frecvenţele aşteptate şi valorile reziduale (diferenţa
dintre frecvenţe) pentru cele trei genuri muzicale
• Valoarea testului Chi-pătrat al corespondenţei (12.17), df(2) şi p=0.002
Acest rezultat justifică respingerea ipotezei de nul şi acceptarea concluziei că
subiecţii diferenţele dintre preferinţele pentru cele trei genuri muzicale sunt semnificative şi
nu se datorează variaţiei întâmplătoare de eşantionare.
- 73 -
7/29/2019 97271214-Aplicatii-SPSS
Testul z al diferenţei dintre două proporţii independente
Utilizare
Acest test se utilizează atunci când se doreşte compararea a două proporţii obţinute
pentru o variabilă dihotomică.
Exemplu:
paranormale, În urma
efectuat unui studiu
în rândul comparativ
studenţilor cu privire lacomparativ
de la Universitate interesul faţă
cu de fenomenele
studenţii de la
3
Politehnică, se înregistrează următoarele rezultate :
• La psihologie: 25 studenţi „nu cred” în fenomenele paranormale iar 175
„cred”
• La politehnică: 124 „nu cred” în fenomenele paranormale iar 32 „cred”
Problema cercetării este dacă diferenţa dintre cei „cred” în fenomenele paranormale
din cele două categorii de studenţi este semnificativă.
Aranjarea datelor
Datele pot fi introduse fie caz cu caz, existând o variabilă pentru opinia faţă de
fenomenele paranormale
de mai jos, care presupuneşiouna pentru sintetizare
prealabilă tipul de instituţie de învăţământ, fie ca în imaginea
a datelor:
• o variabilă ( paranorm) pentru codificare „credinţei” în fenomenele

paranormale;
•
oînvăţământ
variabilă ( superior;
stud_la) pentru apartenenţa la una din cele două instituţii de
• o variabilă ( frecv) pentru frecvenţa cazurilor.
 Este important de reţinut că toate variabilele trebuie să fie numerice. În baza de date
de mai sus, variabila paranorm aia valoarea 1 pentru „cred” şi valoarea 2 pentru
„nu cred”, iar variabila stud_la are valoare 1 pentru Universitate şi 2 pentru
Politehnică.
 Valorile variabilelor au fost etichetate corespunzător iar afişarea etichetelor în locul
valorilor, în celulele tabelului de date, a fost obţinută cu setarea View-Value labels
din meniul SPSS Data Editor . De reţinut că, deşi afişează etichetele, SPSS va opera
în calcule cu valorile, devenite „invizibile”.
Procedura: SPSS nu dispune de o procedură specifică pentru calcularea directă a
diferenţei dintre două procente. În acest scop se utilizează o procedura Crosstabs şi testul
chi-pătrat.
3
Datele nu sunt reale
- 74 -
7/29/2019 97271214-Aplicatii-SPSS
 În prealabil, se execută procedura Weight pentru variabilele categoriale

( paranorm şi stud_la) în funcţie de variabila frecv, care contorizează
numărul cazurilor.
Operaţia asociază valorile variabilelor categoriale ( paranorm şi stud_la) cu valorile

variabile frecv. Efectul ei este unul „invizibil” pe ecran dar se va vedea în analizele
statistice ulterioare.
 Efectul de ponderare (wheight ) a unei variabile rămâne activ atâta timp cât nu se
ponderează o altă variabilă sau nu se anulează ponderarea efectuată. La salvarea
fişierului se salvează
diverse proceduri şi variabila
de analiză ponderată.
are efecte specifice.Includerea variabilei ponderate în
 Dacă datele ar fi fost introduse în baza de date caz cu caz, operaţia Wheight nu ar
mai fi fost necesară.
2. Se execută procedura Statistics-Summarize-Crosstabs... pentru variabilele

paranorm şi stud_la, cu selectarea Chi-Square din caseta Statistics. (nu mai
prezentăm imaginile, acestea fiind identice cu cele de la testul chi-pătrat).
Rezultate
SPSS Viewer prezintă mai întâi tabelul de corespondenţă dintre variabilele

categoriale, cu valorile variabilei ponderate prin procedura Wheight .
- 75 -
7/29/2019 97271214-Aplicatii-SPSS
Din tabelul Chi-Square Tests citim valoarea Pearson Chi-Square (161.598).

Testul z pentru diferenţa proporţiilor se calculează ca radical din valoarea lui chi-
pătrat:
z = 161.598 = 12.71
Semnul lui z se află din diferenţa proporţiilor testate, astfel:

175 32
p a − p b = − = 0.875 − 0.205 = 0.67
200 156
Decizia statistică se ia prin raportarea valorii calculate a lui z la valorile critice ale
acestuia de pe curba normală, pentru test unilateral sau bilateral.
În cazul nostru, pentru test bilateral cu alfa=0.05, z calculat (12.71) este mai mare
decât z critic (1.96), fapt care permite respingerea ipotezei de nul şi confirmarea ipotezei că
studenţii de la Universitate „cred” într-o măsură semnificativ mai mare în fenomenele
paranormale decât studenţii de la Politehnică.
- 76 -
7/29/2019 97271214-Aplicatii-SPSS
Teste neparametrice pentru date ordinale

Testul Mann-Whitney (U) pentru două eşantioane independente
Utilizare
Testul pentru
independente Mann-Whitney estedependentă
care variabila utilizat pentru testarea îndiferenţei
este exprimată dintre(degrupuri
valori ordinale rang)
sau atunci când, chiar dacă este de tip cantitativ, nu suportă un test parametric (testul t).
Exemplu: La ieşirea dintr-un club de noapte, un psiholog interesat de efectul
depresiv al drogurilor a efectuat interviuri în legătură cu acest aspect şi a identificat un
număr de 10 tineri care au consumat câte o pastilă de Ecstasy şi un număr de 10 tineri care
au consumat doar alcool. Apoi i-a convins să ia parte la un experiment şi le-a administrat
un chestionar de evaluare a depresiei. Acelaşi chestionar a fost aplicat din nou, peste trei
zile. Obiectivul studiului este, în prima fază, acela de a verifica ipoteza că cele două tipuri
de drog (Ecsatsy şi alcool) au efecte depresante diferite. În acest scop vor trebui comparate
valorile la depresie ale celor două grupuri. Această analiză va fi efectuată atât pentru
valorile depresiei de la prima măsurare cât şi pentru cele de la a doua evaluare a depresiei.
Aranjarea datelor
Variabilele din baza de date sunt următoarele:

• cod_sub, un cod numeric de identificare a fiecărui subiect (deşi exemplele
anterioare nu au cuprins această variabilă, ea nu trebuie să lipsească din nici o
baza de date)
• drog , pentru tipul de drog utilizat (sunt afişate etichetele, iar valorile sunt
1=Ecstasy, 2=Alcool)
• depr_1, scorul la depresie la prima evaluare
• depr_2, scorul la depresie la a doua evaluare
 Variabilele dependente din exemplul nostru au valori măsurate pe scală

cantitativă. Testarea lor cu un test ordinal nu presupune o prealabilă transformare de
- 77 -
7/29/2019 97271214-Aplicatii-SPSS
rang, programul efectuând automat această transformare. Procedura se aplică în

acelaşi mod şi direct pe valori ordinale de rang.
Procedura: Statistics-Non Parametric Tests-2 Independent Samples...
testului Se cuvineeşantioane
t pentru să precizăm că, în mod normal,
independente. Cu toatedatele de acest
acestea, avândtipînarvedere
conduce la utilizarea
volumul foarte
mic al eşantionului, utilizarea unui test neparametric este de preferat.
În caseta Two-Independent Samples Tests variabilele analizate sunt trecute în lista

Test Variable List .
Rezultate
Tabelul Ranks oferă informaţii sintetice despre cele două variabile: volumul
grupurilor, media rangurilor şi suma rangurilor.
Tabelul Test Statistics include valorile testului Mann-Whitney pentru cele două
variabile testate simultan, depresia imediată şi remanentă. Valorile de interes din tabel sunt
cele ale lui Z şi nivelul de încredere p. În cazul nostru, se observă depresia imediată nu
diferă semnificativ în funcţie de tipul de drog utilizat, în timp ce depresia remanentă este
semnificativ diferită, mai mare la utilizatorii de Ecstasy decât la utilizatorii de alcool
(conform datelor din tabelul anterior).
- 78 -
7/29/2019 97271214-Aplicatii-SPSS
Testul Wilcoxon pentru două eşantioane perechi
Utilizare
În exemplul de mai sus, psihologul a testat într-o primă fază semnificaţia diferenţei
dintre cele două grupuri definite prin tipul de drog diferit (eşantioane independente). Una
dintre problemele
imediate cercetăriiremanente.
şi cel al depresiei este şi aceea dacă
Acest tipexistă o diferenţă
de analiză între face
nu se poate nivelul depresiei
decât pentru
subiecţii aparţinând aceluiaşi tip de drog utilizat.
Aranjarea datelor
Este identică cu cea prezentată pentru testul Mann-Whitney.
În acest caz, deoarece analiza trebuie efectuată separat pe grupurile de consum
Ecstasy/Alcool, există două soluţii. Prima ar fi selectarea (cu Data-Select Cases) a primului
grup şi efectuarea testului, apoi selectarea celui de-al doilea grup şi efectuarea testului. O
soluţie mai elegantă este, însă, aceea de a declara împărţirea bazei de date în funcţie de
grupurile definite prin tipul de drog. În acest scop se va utiliza procedura Data-Split
File...
opţiuneaÎnCompare
locul setării
groupsimplicite Analyze
şi se declară all cases,
variabila do valori
ale cărei not create groups
vor servi , se
drept bifează
criteriu de
împărţire a bazei de date în grupuri de analiză separată (în cazul nostru, tipul de drog) prin
trecerea ei în zona Groups Based on:. Efectul acestei acţiuni este acela că toate prelucrările
care vor fi efectuate din acest moment se vor aplica, separat, pe fiecare grup identificat prin
valorile variabilei.
 Operaţiunea de împărţire a bazei de date nu are semne vizibile, fapt care

poate face să fie uitată şi, astfel, atunci când se revine la prelucrări care ar trebui să
implice toată baza de date rezultatele vor fi incorecte. De aceea, se va avea în
vedere revenirea la setarea Analyze all cases, do not create groups atunci
prelucrarea pe grupuri a bazei de date nu mai este becesară.

Procedura: Statistics-Non Parametric Tests-2 Related Samples...
Setarea procedurii în caseta Two-Related-Samples tests se face în doi timpi:

1. Se selectează prin clic de mouse fiecare 2. Se acţionează butonul ► pentru a se
variabilă, constituindu-se perechea supusă transfera perechea de variabile în zona Test
analizei Pair(s) list .
- 79 -
7/29/2019 97271214-Aplicatii-SPSS
Se bifează opţiunea pentru testul Wilkoxon (care este, de fapt, cea implicită)
Rezultate
Tabelul Ranks oferă informaţii sintetice despre rangurile pozitive şi negative pentru

cele două grupuri, numărul subiecţilor, media rangurilor şi suma lor.
Tabelul Test Statistics prezintă valorile comparative ale depresiei pentru cele două
grupuri. Aşa cum se observă, diferenţa este semnificativă (p=0.007) în cazul
consumatorilor de Ecstasy şi nesemnificativă (p=0.053), în cazul consumatorilor de alcool.
Concluzia generală a studiului este aceea că Ecstasy, comparativ cu alcoolul, are un efect
depresant mai mare (testul Mann-Whitney) şi mai accentuat cu trecerea timpului (testul
Wilcoxon).
- 80 -
7/29/2019 97271214-Aplicatii-SPSS
Testul Kruskal-Wallis pentru mai mult de două eşantioane independente
Utilizare
Testul Kruskal-Wallis este utilizat atunci când avem o variabilă dependentă
ordinală, măsurată pentru mai mult de două grupuri independente (formate din subiecţi
diferiţi),testului
analog şi dorim să testăm
ANOVA diferenţa
pentru dintre acestea. Acest test pentru date ordinale este
date cantitative.
Exemplu: A fost studiate relaţia dintre condiţiile familiale (familie armonioasă,
mamă singură, familie conflictuală) şi frecvenţa reacţiilor emoţionale pozitive la copiii de
vârstă preşcolară, pe durata unei săptămâni. Problema cercetării este dacă diferenţele sunt
semnificative iar mediul familial are legătură conduita emoţională a copiilor.
Aranjarea datelor
În baza de date, variabila familie a fost codificată şi etichetate astfel:

1=familie armonioasă, 2=mamă singură, 3=familie conflictuală. Etichetele sunt afişate ca
urmare a opţiunii Data-Value Labels. Rezultatele vor fi identice dacă variabila dependentă
este exprimată şi direct în valori de rang.
Procedura: Statistics-Non Parametric tests- k Independent Samples...
În caseta principală se trece

variabila testată în zona Test
Se defineşte domeniul Forma finală a casetei este
Variable List : iar variabila
independentă în zona valorilor variabilei
independente, în cazul aceasta.
Testul Kruskal-Wallis este
Gouping Variable. Se
nostru: minim 1, maxim 3. bifat implicit.
activează comanda Define
Range...
- 81 -
7/29/2019 97271214-Aplicatii-SPSS
Rezultate
Primul tabel include informaţii descriptive cu privire la variabila testată:

numărul subiecţilor din fiecare grup şi media rangurilor pentru fiecare grup. De precizat că
programul acordă rangul 1valorii celei mai mici. Datele din tabel indică descreşterea
mediei rangurilor (expresii emoţionale pozitive numeroase) de la familia armonioasă la cea
conflictuală.
Rezultatul testului, afişat în tabelul Test Statistics, se exprimă printr-o valoare chi-
pătrat (6.33) cu două grade de libertate şi p=0.042. Ca urmare, ipoteza de nul poate fi
respinsă. Datele confirmă ipoteza că mediul familial (exprimat prin cele trei tipuri de
familie) îşi pune amprenta asupra expresivităţii emoţionale a copiilor de vârstă preşcolară.
- 82 -
7/29/2019 97271214-Aplicatii-SPSS
Testul Friedman pentru măsurări repetate
Utilizare
Testul Friedman se utilizează pentru testarea diferenţei de rang în cazul unei
variabile măsurate repetat, de mai mult de două ori, pe acelaşi grup de subiecţi. El este
echivalentul
utilizat pentrutestului ANOVA
doar două pentrurepetate,
măsurări măsurărirezultatul
repetate, său
pentru
estedate cantitative.
echivalent cu alDacă este
testului
Wilcoxon, prezentat mai sus.
Exemplu: Efectele altitudinii asupra memoriei sunt testate pe un grup de alpinişti.
Capacitatea de memorare de cuvinte este măsurată la trei înălţimi diferite: 1000m, 3000m
şi 6000m. Problema cercetării este dacă diferenţa de performanţă de memorare
corespunzătoare celor trei înălţimi este semnificativă. Dat fiind volumul extrem de mic am
eşantionului (N=5), efectuarea unui test parametric (ANOVA RM) ar fi nesigură iar apelul
le testul Friedman este pe deplin justificat.
Aranjarea datelor
Variabilele mem_1000, mem_3000 şi mem_6000 conţin numărul cuvintelor

memorate pentru fiecare dintre cei 5 alpinişti. Nu este necesară transformarea lor în valori
de rang, deoarece acest lucru va fi efectuat automat de program. Dacă datele primare sunt
sub formă de ranguri, ele vor fi introduse ca atare, rezultatul fiind identic.
Procedura: Statistics-Non Parametric Tests-K related Samples...
Se setează opţiunea Friedman iar variabilele testate sunt trecute în lista Test
Variables:
- 83 -
7/29/2019 97271214-Aplicatii-SPSS
Rezultate
Primul tabel prezintă media rangurilor pe înălţimi (rangul 1 este atribuit valorii
celei mai mici). În al doilea tabel găsim valoarea testului Friedman exprimată în valori chi-
pătrat (8.40), având un nivel de semnificaţie p=0.015. Acest rezultat permite respingerea
ipotezei de nul şi confirmă ipoteza că memoria cuvintelor este în legătură cu înălţimea (pe
cele trei niveluri avute în vedere).
Coeficientul de corelaţie pentru date ordinale (Spearman)
Utilizare
Testul de corelaţie a rangurilor (Spearman) este echivalentul pentru date ordinale
testului de corelaţie Pearson. Rezultatul său variază pe aceeaşi plajă de valori (-1/+1) şi se
interpretează în mod similar cu rezultatul testului Pearson.
Exemplu: Să luăm în considerare studiul aceluiaşi grup de alpinişti, care au
efectuat, la aceleaşi înălţimi descrise mai sus, şi un test de viteză de decizie (măsurată în
zecimi de secundă). Problema cercetării este dacă între performanţa de memorare şi ce de
timp de decizie este o relaţie (variaţie concomitentă) semnificativă.
Aranjarea datelor
] Alături de variabilele „memorie” pentru cele trei înălţimi, avem acum şi

variabilele pentru timpul de decizie.
Procedura: Statistics-Corelation-Bivariate
- 84 -
7/29/2019 97271214-Aplicatii-SPSS
Variabilele supuse testului de corelaţie se trec în lista Variables:

Se anulează setarea pentru testul Pearson şi se bifează Spearman (aici am ales şi
testul Kendal tau-b, care este echivalent lui Spearman, doar pentru a le putea compara. În
practică, se va utiliza doar unul dintre acestea două).
Aceastăpentru
şi şase coloane configurare
fiecarea dintre
caseteicele
de două
dialogteste
produce
alese.oÎnmatrice
fiecarede corelaţii
celulă cu şase
a matricii se linii
vor
afla, aşa cum vom vedea, mai multe numere. Din acest motiv citirea ei nu este tocmai
comodă. Pentru a obţine un format mai convenabil de prezentare a rezultatelor,
recomandăm o procedură suplimentară, prezentată anterior la corelaţia Pearson: Se
acţionează butonul Paste care deschide fereastra Syntax, unde găsim comenzile procedurii.
Aici se introduce clauza WITH între primul grup de variabile (memorie) şi al doilea grup
de variabile (decizie):
Mai departe, procedura de corelaţie se lansează cu butonul ► de pe bara de

comenzi a ferestrei Syntax.
Această variantă de lucru nu este obligatorie. Se poate efectua corelaţia şi direct
din caseta principală, dar, aşa cum am spus, rezultatele vor fi prezentate într-o formă mai
puţin „ergonomică”.
Rezultate
Tabelul cu rezultate cuprinde pe linii variabilele „memorie” şi pe coloane,

variabilele „decizie”. Deoarece am cerut calcularea simultană a ambilor coeficienţi de
corelaţie, datele sunt dublate. Este de la sine înţeles că, în realitate nu vom utiliza decât
unul dintre aceşti coeficienţi de corelaţie a rangurilor.
Din celulele tabelului de mai sus nu ne interesează decât cele care cuprind corelaţia
dintre memorie şi decizie la acelaşi palier de înălţime. Pentru a fi mai vizibile, am îngroşat
- 85 -
7/29/2019 97271214-Aplicatii-SPSS
valorile utile analizei. În jumătatea de sus a tabelului, avem corelaţiile pentru testul
Kendall iar în jumătatea de jos pe cele ale testului Spearman.
Testul Kendall al corelaţiei dintre memorie şi decizie la 1000 de metri are valoarea
-0.94, semnificativ la p=0.023. La interpretarea coeficienţilor de corelaţie este extrem de
important să se ia în considerare, simultan, semnul şi semnificaţia variaţiei valorilor. În
cazul nostru,
valori mari alevalori marideale
timpului memoriei,
decizie înseamnă
înseamnă o capacitate
capacitate de deciziedemai
memorare mai bună
proastă (sub iar
aspectul
vitezei, desigur). În consecinţă, un coeficient de corelaţie negativ între aceste variabile
indică, de fapt, o variaţie concomitentă pozitivă a memoriei şi vitezei deciziei (când
capacitatea de memorare scade, şi decizia este mai lentă, timpul de decizie fiind mai mare).
Analiza coeficienţilor din tabelul de mai sus arată existenţa unei corelaţii de rang
semnificative (p<0.05) între memorie şi decizie la toate palierele de înălţime.
Dacă facem comparaţia dintre coeficienţii Spearman şi Kendal, vom vedea că, deşi
ei diferă valoric, semnificaţiile se află, în toate cazurile, de aceeaşi parte a deciziei statistice
(respingerea ipotezei de nul). Utilizarea unuia sau altuia dintre cei doi coeficienţi rămâne la
latitudinea cercetătorului.

Pdfslide - Tips 97271214 Aplicatii Spss

Încărcat de

Informații document

Titlu original

Drepturi de autor

Formate disponibile

Partajați acest document

Partajați sau inserați document

Opțiuni de partajare

Vi se pare util acest document?

Este necorespunzător acest conținut?

Drepturi de autor:

Formate disponibile

Pdfslide - Tips 97271214 Aplicatii Spss

Încărcat de

Drepturi de autor:

Formate disponibile

7/29/2019 97271214-Aplicatii-SPSS

SPSS prezentare generală...................................................................................................................................3

Paşii analizei statistice cu SPSS..........................................................................................................................6

Exemplu practic de realizare a unei baze de date..........................................................................................15

Operaţii de transformare a variabilelor..........................................................................................................19

Organizarea datelor pentru analiză.................................................................................................................27

Calcularea indicatorilor statistici descriptivi..................................................................................................31

Teste neparametrice nominale..........................................................................................................................65

Teste neparametrice pentru date ordinale......................................................................................................77

SPSS prezentare generală

 Simbolul care precede această propoziţie indică introducerea unei informaţii

 editarea datelor (construirea bazelor de date, transformări ale variabilelor)

Domeniile de lucru în SPSS

Particularitatea principală a interfeţei de lucru cu SPSS este aceea că rezervă

Domeniul bazei de date (Data Editor)

La lansarea programului SPSS se deschide fereastra domeniului de editare a datelor

 O sesiune de lucru cu SPSS presupune, în mod necesar, existenţa unei baze

Domeniul afişării rezultatelor ( Viwer

SPSS depune rezultatele prelucrărilor într-o secţiune aparte a domeniului de lucru.

Domeniul de editare a procedurilor directe (Syntax)

SPSS permite, în afara operării prin intermediul mediurilor, şi lucrul direct cu

 Utilizarea directă a procedurilor impune aprofundarea SPSS

Meniul Funcţii principale Observaţii

Paşii analizei statistice cu SPSS

Corecţia erorilor, selecţii, recodificări, transformarea

În continuare, vom trata pe rând, fiecare din cele trei situaţii:

a) Crearea unei baze de date SPSS

 În versiunile de SPSS mai recente, editarea variabilelor se face într-o fereastră

• Variable Name: zona de declarare a numelui de variabilă. VAR00001 este

 În versiunile mai recente de SPSS editarea variabilei nu presupune acest tip de

 Trebuie sa fie format din minim 1, maxim 8 caractere,

 În cazul utilizării unor caractere improprii, apare un mesaj de eroare şi se

Definirea „tipului” de variabilă

[ Numeric], care cuprind valori de tip numeric cu sau fără zecimale.

 Variabilele de tip Date beneficiază de funcţii speciale de tratare şi analiză în

Etichetarea variabilelor şi a valorilor

Etichetarea este o formă de descriere explicită a conţinutului variabilei (având în

 Deşi nimic nu ne obligă să aplicăm etichete variabilelor şi valorilor, este foarte

Declararea valorilor lipsă (missing values)

Valorile lipsă sunt de două tipuri:

Se observă că există mai multe opţiuni:

În concluzie, declararea variabilelor se compune din următoarele operaţiuni:

 Atribuirea numelui (maxim 8 caractere)

Ştergerea şi inserarea variabilelor

 Pentru versiunile de SPSS de la 7 în sus, clic dreapta pe capul de coloană

- Apariţia unor variabile inutile (nedorite).

Exemplu practic de realizare a unei baze de date

 Insistăm pe declararea, cu precădere, a

Salvarea bazei de date din Data Editor

Deschiderea unei baze de date SPSS

O bază de date creată cu SPSS se deschide cu comanda File-Open, care activează

Operaţii de transformare a variabilelor

c) introduse, de regulă, derezultate

Exemple de situaţii în care se impune transformarea variabilelor:

Însumarea valorilor variabilelor

Se efectuează următoarea succesiune de operaţii:

Răspundem OK, deoarece ştim că am Rezultatul operaţiei se vede în imaginea de

Calcularea mediei a două sau mai multe variabile

Presupunând că în loc de sumă, ne-ar interesa media valorilor de la mai multe

Extragerea anului dintr-o variabilă de tip cronologic ( date)

În câmpul Target variable introducem numele noii variabile (virsta).

Se observă în variabilă virsta, valorile rezultate prin transformare (corespunzătoare

 Posibilităţile de transformare a variabilelor oferite de SPSS permit crearea unor noi