Documente Academic
Documente Profesional
Documente Cultură
SPSS
SPSS
Marian Popa
MARIAN POPA...................................................................................................1
SPSS prezentare general...................................................................................................................................3
................................................................................................................................................................................6
Paii analizei statistice cu SPSS..........................................................................................................................6
Editarea datelor....................................................................................................................................................8
Exemplu practic de realizare a unei baze de date..........................................................................................15
Operaii de transformare a variabilelor..........................................................................................................19
nsumarea valorilor variabilelor................................................................................................................19
.........................................................................................................................21
Calcularea mediei a dou sau mai multe variabile....................................................................................21
Extragerea anului dintr-o variabil de tip cronologic (date) ....................................................................22
Recodificarea variabilelor.........................................................................................................................24
Ordonarea dup rang a valorilor unei variabile........................................................................................26
Organizarea datelor pentru analiz.................................................................................................................27
Sortarea bazei de date...............................................................................................................................27
mprirea bazei de date n subgrupuri......................................................................................................28
Selectarea unor seturi de date....................................................................................................................28
Calcularea indicatorilor statistici descriptivi..................................................................................................31
Teste parametrice...............................................................................................................................................35
Testul z (t) pentru media unui singur eantion .........................................................................................35
Testul t pentru eantioane independente...................................................................................................37
Analiza de varian unifactorial (One Way ANOVA)............................................................................40
Testul t pentru eantioane dependente (perechi).......................................................................................44
Coeficientul de corelaie liniar Pearson (r).............................................................................................46
Regresia liniar simpl..............................................................................................................................51
Analiza de consisten intern (Cronbach alfa)........................................................................................57
Teste neparametrice nominale..........................................................................................................................65
Testul z al proporiei pentru un singur eantion........................................................................................65
Testul semnelor.........................................................................................................................................67
Testul Chi-ptrat al asocierii (independeei).............................................................................................69
Testul Chi-ptrat pentru coresponden (goodness of fit).........................................................................72
Testul z al diferenei dintre dou proporii independente.........................................................................74
Teste neparametrice pentru date ordinale......................................................................................................77
Testul Mann-Whitney (U) pentru dou eantioane independente............................................................77
Testul Wilcoxon pentru dou eantioane perechi.....................................................................................79
Testul Kruskal-Wallis pentru mai mult de dou eantioane independente...............................................81
Testul Friedman pentru msurri repetate................................................................................................83
Coeficientul de corelaie pentru date ordinale (Spearman).......................................................................84
-2-
-3-
Pentru a deschide o alt baz de date, sau a crea una nou, cea aflat n
lucru va fi nchis. Programul solicit salvarea ei prealabil, dac acest lucru nu a
fost deja efectuat.
Dac vrem s prelucrm date aflate n baze de date (fiiere) diferite, este
necesar aducerea lor n aceeai baz de date (procedura DATA-Merge files, care va
fi descris mai trziu).
Meniurile ferestrei Data Editor nu se vor activa integral dect atunci cnd
va exista cel puin o variabil definit i valori pentru cel puin un caz.
-4-
-5-
Meniurile SPSS
Meniurile de tip list se aseamn cu meniurile altor programe sub Windows. Fr a intra n
amnunte, iat o prezentare succint a meniurilor pentru fereastra DATA EDITOR:
Meniul
File
Funcii principale
Observaii
Operaii de deschidere i salvare de fiiere
Operaii de Select/Copy/Cut/Paste, Find i, cel
Edit
mai important, setarea caracteristicilor de lucru
ale SPSS (Options-n versiunile pt. Win 9X)
n cazul ferestrei Data Editor, seteaz modul
View
de afiare: cu sau fr bara de butoane, cu sau
fr liniile despritoare ale celulelor.
Funcii de operare cu variabilele; definire,
Importante pentru
Data
inserare, tergere, selectare, sortare, adiionare pregtirea datelor n
de fiiere, etc.
vederea prelucrrii
Importante pentru
Funcii de modificare a datelor prin calculare,
Transform
pregtirea datelor n
recodificare.
vederea prelucrrii
Prin opiunile fiecrei
Statistics
proceduri se pot obine i
Grupeaz procedurile de calcul statistic
(Analyze)
reprezentri grafice
specifice
Graph
Grupeaz procedurile de reprezentare grafic
Informaii despre variabile, structurare pe
Utilities
seturi de variabile
Lista ferestrelor deschise cu posibilitatea de
Window
selecie
Aici se afl un tutorial
extrem de sugestiv de
operare cu SPSS, iar de la
versiunea 7.5 n sus, o
Help
Informaii de ajutor
procedur de sprijin n
alegerea tipului de
prelucrare statistic
(Statistic Coach)
Introducerea datelor
Opiuni:
(a) Introducerea direct a datelor n DATA EDITOR
(b) Deschiderea unui fiier de date SPSS (extensia .SAV)
(c) Importarea unui fiier de format diferit (se alege din
caseta File open/File of type)
-6-
2
3
4
Pregtirea datelor
Selectarea procedurii
satistice
Selectarea variabilelor
ce urmeaz a fi supuse
prelucrrii
Rularea procedurii
Analiza rezultatelor
Editarea rezultatelor
SPSS este un program puternic de analiz statistic a datelor. Utilizarea lui optim
presupune, n mod necesar, stpnirea de ctre operator a cunotinelor teoretice de
statistic.
Aa cum un program de editare grafic nu compenseaz lipsa de talent la desen, nici
SPSS nu poate fi cu adevrat exploatat de ctre cei care nu au cunotine de statistic.
n lipsa acestora, nici alegerea procedurilor i nici interpretarea rezultatelor nu va fi cu
adevrat posibil.
-7-
Editarea datelor
O baz de date n SPSS este o structur format din linii i coloane, la intersecia
crora se formeaz celulele care conin, fiecare, o anumit unitate de informaie.
Existena unei baze de date deschis n fereastra Data Editor este o condiie
obligatorie pentru operarea cu SPSS
SPSS opereaz numai cu o singur baz de date deschis la un moment dat
n principiu, o baz de date SPSS se obine pe una din urmtoarele ci:
a) Crearea ei prin operaiunea de definire a variabilelor i introducerea datelor de la
tastatur;
b) Deschiderea unei baze de date SPSS, existente pe un suport de memorie;
c) Importarea unei baze de date din alt format dect SPSS
n continuare, vom trata pe rnd, fiecare din cele trei situaii:
a) Crearea unei baze de date SPSS
n linii generale, pentru crearea unei baze de date proprii n SPSS, se procedeaz astfel:
Se lanseaz SPSS
Se definesc variabilele bazei de date n domeniul Data Editor
Se introduc datele pentru fiecare caz (subiect) n parte
Se salveaz baza de date (extensia specific este *.sav)
Definirea variabilelor
se acioneaz Define variable din meniul Data
soluie mai direct este dublu clic pe capul de coloan
-8-
Ca urmare a operaiei de mai sus, apare o caset de dialog ca n imaginea de mai jos
(forma ei nu difer substanial de la o versiune de SPSS la alta). Dac privim caseta, vom
observa urmtoarele elemente:
-9-
n cazul utilizrii unor caractere improprii, apare un mesaj de eroare i se
permite corectarea numelui.
Exist o mare varietate de formate pentru acest tip de variabil, acoperind, practic,
orice cerin posibil din partea utilizatorului.
- 11 -
- 12 -
SPSS nu permite Undo (n meniul Edit) dect limitat la ultima aciune. Din
acest motiv, tergerea variabilelor sau a cazurilor trebuie s se fac cu atenie,
pentru c datele pot fi definitiv pierdute. Se va reine, totui, c baza de date se
actualizeaz pe hard disk numai dup salvarea comandat de utilizator. Ca urmare...
n cazul unei aciuni care produce efecte nedorite asupra bazei de date,
exist soluia nchiderii bazei de date, fr a se accepta salvarea cerut de program,
dup care se deschide fiierul respectiv din nou.
Erori frecvente
- Apariia unor cazuri inutile, (umplute cu system missing values) la sfritul unei
baze de date.
Explicaie: Introducerea inutil a unei valori ntr-o variabil, valoare care apoi este
tears. Cu toate acestea, SPSS a creat deja un caz nou, pe care l-a umplut cu system
missing values.
Soluie: Selectarea cazului prin apsarea pe capul de linie i acionarea tastei Delete
(sau Edit-Cut).
- 14 -
- 15 -
Lie
LIE
Decimal Places 0
(nu se poate obine o
valoare mai mare de
100 i nu exist
zecimale)
Numeric, Width 1,
Decimal Places 0
(nu se poate obine o
valoare mai mare de 9
i nu exist zecimale)
Minciun
Se observ faptul c pentru variabile ale cror nume exprim exact coninutul
(SEX, VRSTA) se poate utiliza fr nici un inconvenient numele i ca etichet. Pentru a
fi mai explicii, s spunem c numele variablei este util n primul rnd SPSS-ului pentru a
manipula variabilele, n timp ce etichetele sunt necesare mai ales utilizatorului pentru a
nelege cu uurin la ce se refer o variabil al crui nume prea scurt
Avem alturat, imaginea DATA EDITOR pentru primii trei subieci introdui cu
variabilele de mai sus:
- 16 -
numeric aferent fiecrui subiect, astfel nct, la nevoie, s se poat identifica numele
(pentru corecii, de ex.)
SPSS poate salva i n alte formate, dintre cele mai importante fiind: Dbase sau
FoxPro, Lotus 1-2-3, Excel. Salvarea n aceste formate poate fi util pentru
transferul datelor pentru prelucrri ulterioare n alte programe.
- 17 -
n cazul deschiderii unui fiier de alt tip dect SPSS, se va alege tipul respectiv
din lista Files of type. n cazul n care SPSS nu recunoate tipul de fiier n care
se afl datele noastre, putem ncerca transformarea lor prealabil din formatul
original ntr-un format recunoscut de SPSS. Dei exist riscul pierderii unor
aspecte ce in de formatul de reprezentare a datelor, operaiunea scutete totui
un mare volum de munc.
- 18 -
- 19 -
Deoarece prin calculare, o nou variabil este plasat dup toate variabilele
existente, am preferat s inserm o nou variabil imediat dup cele trei pe care dorim s le
nsumm. n acest fel avem i posibilitatea s controlm uor corectitudinea operaiei de
nsumare
Se apeleaz procedura Transform-Compute, care deschide caseta de mai jos:
Dac variabilele ce vor fi nsumate se afl n baza de date una dup alta, ca
n cazul exemplului nostru, atunci avem posibilitatea s scriem o expresie
de nsumare simplificat, astfel SUM (prima_variabil TO
ultima_variabil). n acest caz, clauza TO va fi cuprins ntre spaii, pentru
a nu fi confundat cu un nume de variabil. Aceast opiune ne sugereaz
ct de important poate fi s aranjm corespunztor variabilele n structura
unei tabele SPSS.
3. Se apas butonul OK
4. Deoarece variabila total exist, SPSS ne ntreab dac dorim s modificm
coninutul acesteia. Dac nu ar exista o variabil cu acest nume, rezultatul operaiei
de calcul ar fi depus ntr-o variabil creat automat i amplasat dup ultima
variabil din baza de date.
Rspundem OK, deoarece tim c am
creat aceast variabil tocmai pentru a
depune n ea suma.
- 21 -
Reamintim c funcia MEAN poate fi scris de la tastatur sau poate fi adus din
lista de funcii, prin selectare i acionarea butonului .
Este de la sine neles c expresia de calcul poate fi realizat i ntr-o manier
simpl i direct, fr utilizarea funciilor (SUM sau MEAN), astfel:
Pentru sum: scor_1+scor_2+scor_3
Pentru medie: (scor_1+scor_2+scor_3)/3
Se va face o distincie clar ntre suma sau media astfel obinute, care se refer la
suma sau media valorilor de la mai multe variabile, pentru acelai subiect, i suma
sau media pe care am calcula-o pe vertical, la nivelul fiecrei variabile n parte, pe
ntreaga distribuie
Se pot realiza diverse alte funcii de transformare, utilizndu-se marea varietate de
funcii care se gsesc n lista Functions i a cror semnificaie se poate afl din
Help-ul casetei Compute.
Extragerea anului dintr-o variabil de tip cronologic (date)
SPSS ofer funcii de transformare cu variabilele de tip cronologic. Dintre acestea,
vom exemplifica cu realizarea unei variabile care s conin anul naterii, s zicem, scos
dintr-o variabil care conine data naterii. Imaginea de mai jos este extras din baza de
date Employee data.sav
Observm c variabila bdate, care conine data naterii. Pentru a avea vrsta,
trebuie s calculm diferena dintre anul curent (s zicem, 2000) i anul naterii: Pentru
- 22 -
aceasta trebuie s facem diferena dintre anul curent (2000) i anul naterii, care se afl n
cmpul bdate.
Pentru a avea variabila ce urmeaz a fi creat n apropierea variabilei bdate, vom
insera o variabil (denumind-o virsta, de tip numeric, cu doi ntregi). Apoi utilizm
procedura Compute din meniul Transform:
- 23 -
variabil primar peste valorile deja existente. Cu alte cuvinte, este recomandabil
s crem prin transformare variabile noi, i nu s modificm valorile existente din
variabilele primare a cror pierdere ar necesita reintroducerea lor, n caz de
necesitate.
Recodificarea variabilelor
Recodificarea unei variabile nseamn convertirea valorilor acesteia, cu scopul
obinerii unei distribuii bazat pe frecvene cumulate. Procesul este similar cu crearea unei
tabele de frecvene grupate i ne reamintim c poate fi derulat n maniera descris mai jos:
Pai pentru gruprii de frecvene:
Se face diferena dintre valoarea cea mai mare i valoarea cea mai mic a unei
distribuii
Se mparte valoarea obinut la mrimea posibil (estimat) a intervalului
Se selecteaz mrimea intervalului care conduce la un numr de clase cuprins ntre
5 i 15
Se determin limita inferioar a primului interval (trebuie s fie un multiplu al
mrimii intervalului)
Se determin limita superioar a primului interval
Se construiesc intervalele de clas pentru fiecare interval, fiind ateni s avem clase
suprapuse sau intervale neacoperite
n principiu, dei este recomandabil obinerea unei grupri de frecvene pe 5-15
clase, se poate opta pentru un numr de clase care servete cel mai bine interesul de
cercetare. De exemplu, n cazul unei distribuii de vrst exprimat n ani, este preferabil s
se opteze pentru clase cincinale sau decade, acestea avnd i o anumit semnificaie
psihologic.
n urma transformrii de mai sus, am obinut variabila virsta. Utilizarea ei ca atare
n analize statistice este improprie, de aceea ar fi foarte util obinerea unei variabile care s
asocieze anumite valori convenionale pentru categorii de virsta. Pentru aceasta putem
efectua recodificarea variabilei virsta pentru a obine o distribuie grupat de frecvene,
astfel:
Se lanseaz procedura Recode - Into Defferent Variables din meniul Transform:
Atenie, se poate alege i opiune Into Same Variables, dar nu este recomandabil
deoarece, n cazul unei erori, nu mai avem la dispoziie variabila iniial pentru o nou
recodificare.
- 24 -
Dei relativ complicat, caseta de declarare a noilor valori n funcie de cele vechi este uor de neles.
n zona Old value, se alege una dintre variantele de definire a valorilor de la care se
pleac. S zicem c am ales soluia s recodificm anii pe intervale de zece ani, primul interval
fiind 29-39, al doilea 40-49, .a.m.d.
Pentru aceasta activm opiunea Range i scriem valorile limite al intervalului dorit.
Dup aceasta, n zona New value oValue, scriem care este valoarea pe care o asignm
acestei clase.
n fine, acionm butonul Add pentru a definitiva operaiunea i trecem la definirea
urmtoarei clase, pn terminm.
n zona OldNew se poate observa lista recodificrilor definite.
Se acioneaz butonul Continue i, la revenirea n caseta anterioar, butonul OK.
Rezultatul operaiuni se vede mai jos:
- 25 -
- 26 -
Imaginea din caset descrie sortarea bazei de date, cresctor (Ascending), dup
valorile variabilei scor (rezultatul se vede n imaginea de mai jos).
Se poate efectua sortarea simultan dup mai multe variabile, fiecare n sensul
dorit, de exemplu: grup(Ascending) i scor(Descending).
- 27 -
Opiunile sunt:
Analyze all cases, do not create groups (pentru analiza integral a datelor)
Compare groups (rezultatele vor fi afiate astfel nct s poat fi uor comparate)
Organize output by groups (rezultatele vor fi afiate n Viewer, separat pe grupuri)
Operaia nu produce nici o modificare vizibil asupra bazei de date. Singurul efect
se vede n zona de afiare a rezultatelor, unde toate procedurile de analiz vor fi
afiate pentru fiecare subgrup n parte.
Pentru a se reveni la analiza intergral a datelor, se va reveni n procedura Split File
i se va seta opiunea Analyze all cases....
Selectarea unor seturi de date
Selectarea unui set de date permite aplicarea procedurilor de analiz numai pe
cazurile selectate. Dac nu se opteaz pentru tergerea datelor neselectate, ele vor fi
pstrate i vor putea fi reintroduse n analiz. Procedura este Data-Select Cases....
Pentru exemplificare, s ne propunem selectarea din baza de date din imaginea de
mai sus a cazurilor aparinnd grupului 1.
Imaginea prezint:
n partea stng, baza de date
La mijloc, caseta principal Select Cases care are:
o Zona listei de variabile
o Zona fixare a condiiilor de selectare Select, unde:
- 28 -
o
o
o
o
Dup finalizarea operaiei de selectare de mai sus, baza de date se prezint n felul
urmtor:
- 29 -
Se observ:
Marcarea cu o diagonal a capului de linie corespunztor cazurilor neselectate
Apariia unei variabile de sistem filter_$ care conine valoarea 0 pentru cazurile
neselectate i valoarea 1 pentru cazurile selectate. Aceast variabil poate fi ulterior
utilizat n procedurile de analiz, ca variabil independent (caz n care se va anula
situaia de selectare, prin bifarea opiunii All cases).
Selectarea este utilizat n mod obinuit, pentru alegerea temporar a unui set de
date. Adesea se uit anularea unei selectri existente, atunci cnd se dorete
revenirea al analiza tuturor cazurilor. Efectul este obinerea unor rezultate pe date
pariale.
Alte operaii de organizare a datelor pentru analiz
Opiunile SPSS pentru organizarea datelor sunt mult mai numeroase dect cele
descrise mai sus. Fr a le trata n amnunt, ne vom mulumi s le prezentm sumar:
Agregarea cazurilor, atunci cnd exist nregistrri multiple pentru fiecare subiect i
se dorete pstrarea uneia singure (Data-Agregate)
Adugarea unor cazuri din alt baz de date SPSS (Data-Merge Files-Add cases...)
Adugarea unor variabile din alt baz de date SPSS (Data-Merge Files-Add
variables...)
Inversarea liniilor cu coloanele (Data-Transpose...)
- 30 -
Procedura Frequencies
Este singura care permite analiza de frecvene.
La apariia casetei Frequencies, variabila pe care dorim s o supunem analizei va fi
trecut n lista de calcul Variable(s), prin selectarea ei i acionarea butonului de transfer
- 31 -
(). Pot fi incluse mai multe variabile n aceast list, rezultatele fiind afiate distinct,
pentru fiecare n parte.
Se va observa pe caseta de mai sus bifarea opiunii pentru tabela de frecvene, care
este funcia specific a acestei proceduri. n plus, prin acionarea butoanelor din partea de
jos a casetei se pot seta alte analize, astfel:
Butonul Statistics
Butonul Chart
Butonul Format
Se aleg indicatorii statistici Se alege tipul de Se aleg diverse moduri de
descriptivi dorii
grafic dorit
prezentare a rezultatelor
Rezultatele sunt afiate n SPSS Viewer n forma de mai jos (dar unele sub altele,
nu alturat, aa cum sunt aranjai aici):
Indicatorii statistici
descriptivi
Tabelul de frecvene
Histograma
Procedura Descriptives
- 32 -
Procedura Explore
Procedura Explore este cea mai complex dintre toate procedurile statisticii
descriptive i se poate utiliza atunci cnd se dorete o analiz exhaustiv a variabilei (sau
variabilelor).
Caseta principal Explore
- 33 -
Reprezentarea stem-and-leaf
- 34 -
Teste parametrice
Testul z (t) pentru media unui singur eantion
Utilizare
Testul z pentru un singur eantion este utilizat pentru se testa diferena dintre media
unui eantion fa de media cunoscut a populaiei din care face parte. Atunci cnd
volumul eantionului este mic (N<30) este utilizat o variant denumit testul t pentru un
singur eantion.
Utilizarea acestui test statistic este condiionat de cunoaterea mediei populaiei.
Dac populaia are o extindere mare, acest lucru este dificil de realizat (n afara cazurilor n
care exist studii speciale, cum sunt cele antropometrice, de exemplu). Dintre variabilele
psihologice ale crei medii pentru populaie este cunoscut, este inteligena, exprimat n
uniti QI (=100). Testul poate fi utilizat, ns, atunci cnd populaia are o extindere mai
redus. De exemplu, dac a fost evaluat nivelul de satisfacie ntr-o organizaie, se poate
testa diferena dintre nivelul de satisfacie la nivelul unei secii fa de media satisfaciei la
nivelul ntregii organizaii (populaie).
Condiii de aplicare
Condiia teoretic de baz este normalitatea distribuiei de eantionare. n temeiul
teoremei limitei centrale, cu ct volumul eantionului este mai mare, cu att normalitatea
distribuiei de eantionare este mai sigur.
Aranjarea datelor
Datele supuse testrii trebuie s fie incluse ntr-o variabil SPSS de tip numeric.
Procedura: Statistics-Compare Means-One Sample T Test
Variabila
testat
Caseta principal
Variabila testat este trecut n lista
Test Variable(s)
n zona Test Value se nscrie media
populaiei (100 n cazul nostru)
Rezultate
- 35 -
Primul tabel include statistica descriptiv a variabilei testate (N, media, ab.std,
eroarea standard a mediei)
Al doilea tabel include rezultatele testului statistic: t=6.254, df=4, p=0.03, diferena
fa de media populaiei (22.6) i limitele inferioar (12.57) i superioar (32.63) ale
intervalului de ncredere pentru media populaiei estimat de eantionul de cercetare.
Concluzia testului: media eantionului de cercetare difer semnificativ de QI=100,
ca medie a populaiei.
- 36 -
- 37 -
n caseta principal se trece variabila dependent (soc) n lista Test Variable(s) (pot
fi testate mai multe variabile simultan) iar variabila independent (grup), n zona Grouping
Variable. n acest moment, programul ataeaz variabilei dependente dou semne de
ntrebare, sugernd introducerea valorilor care definesc cele dou grupuri. Concomitent, se
activeaz butonul Define Groups a crui acionare deschide caseta secundar Define
Groups, unde se introduc valorile care definesc cele dou grupuri comparate (ordinea lor
nu este relevant). Dup acionarea butonului Continue, caseta principal devine complet
i se poate aciona OK pentru efectuarea testului.
Rezultate
- 38 -
n primul tabel (Group Statistics) avem statistica descriptiv a celor dou grupuri.
Se va observa c programul descrie grupurile prin intermediul etichetelor valorilor. Dac
acestea nu ar fi fost definite, n loc de institutie i familie ar fi aprut 1, respectiv, 2.
Al doilea tabel are dou linii:
Pe prima avem rezultatele testului t pentru cazul asumrii omogenitii varianei
(Levenes Test for Equality of Variances). n cazul nostru, ele sunt egale (Sig.=0.666, ceea
ce se traduce ca o valoare p=0.666, deci mai mare de 0.05 pentru distribuia F a testului
Levene, pe care nu o discutm aici). Ca urmare, vom citi pe aceast linie rezultatul testului:
t=-2.42, df=12, Sig.=0.045.
Pe a doua linie avem rezultatele testului t pentru cazul n care nu s-ar ntruni
condiia de omogenitate a varianei pentru cele dou grupuri. Dac semnificaia testului
Levene ar fi fost mai mic sau egal cu 0.05, rezultatului testului t s-ar fi citit pe aceast
linie.
Pentru exemplul nostru, rezultatul testului t permite acceptarea ipotezei cercetrii,
conform creia copiii crescui n mediu familial sunt mai sociabili (m=22.00) dect cei
crescui n mediu instituional (m=17.71).
- 39 -
- 40 -
- 41 -
Tabelul ANOVA conine rezultatului testului F a crui valoare este 35.264 pentru
un prag p=0.000. Atenie, p=0.000 nu se va nelege ca p=0 ci ca p<0.001. n raportul de
cercetare este chiar recomandabil s nu se utilizeze valoarea 0.000 care poate sugera
certitudinea rezultatului.
- 42 -
astfel n concepute nct s minimizeze acest neajuns. Totui, ele nu vor fi n nici un caz
luate n considerare dac testul F nu atinge pragul de semnificaie statistic (p<0.05).
Avnd n vedere c testul Levene a confirmat omogenitatea varianei, se vor citi
valorile pentru testul Bonferoni (n caz contrar, s-ar fi citit cele pentru testul Tamhane).
Valorile aunt uor de analizat: n prima coloana avem definite grupurile analizate
(etichetarea valorilor variabilei independente ajut mult la inteligibilitatea tabelului). n
coloana a patra (Sig.) se afl semnificaiile pentru diferena dintre medii. Astfel, putem
constata faptul c timpul de reacie dintre grupul supus ocului de mica intensitate i cel
supus ocului de medie intensitate nu difer semnificativ (p=0.520). n acelai timp, grupul
supus unui oc mic difer de grupul supus unui oc mare (p<0.001), la fel ca i n cazul
comparaiei dintre grupul cu oc mediu i cel cu oc mare (p<0.001).
Cu alte cuvinte, variaia semnificativ a timpului de reacie n funcie de cele trei
categorii de intensitate a ocului electric, provine cu precdere de la efectul pe care l are
ocul mare, care provoac o ncetinire a timpului de reacie consistent fa celelalte
dou categorii de oc electric.
Aceasta concluzie este ntrit i de reprezentarea grafic a mediei timpului de
reacie ale celor trei grupuri.
- 43 -
- 44 -
- 45 -
n fine, ultimul tabel prezint rezultatul testului: t=5.076, df=9, p=0.001. Acesta
permite respingerea ipotezei de nul i acceptarea ipotezei cercetrii, zgomotul afecteaz
capacitatea de calcul aritmetic.
Coeficientul de corelaie liniar Pearson (r)
Utilizare
Corelaia Pearson (r) msoar gradul de asociere dintre variabile. Aceasta se refer
la gradul i sensul de variaie concomitent a valorilor unei variabile n raport cu cealalt,
dup un model de tip liniar.
Domeniul de variaie a coeficientului de corelaie Pearson (r) este ntre r=-1
(corelaie perfect negativ) i r=+1 (corelaie perfect pozitiv). Absena oricrei legaturi
(corelaii) dintre variabile se traduce prin r=0.
Exemplu: Testul de corelaie implic dou variabile dar, adesea, ntr-o cercetare
psihologic numrul variabilelor supuse corelaiei este mai mare de dou. Acest fapt
conduce la ceea ce se numete o matrice de corelaii care este un tabel ale cror celule
cuprind corelaiile dintre perechile de variabile. Pentru exemplificare, s lum n
considerare situaia n care se urmrete evidenierea legturii (asocierii) dintre anxietate i
agresivitate, pe de o parte, i preferina pentru risc pe de alt parte.
Condiii
Condiia principal pentru calcularea coeficientului de corelaie liniar Pearson este
ca variabilele implicate s fie msurate pe scal de interval/raport (alturi de existena unei
forme a distribuiei care nu se abate sever de la curba normal).
Testele neparametrice alternative, pentru cazul n care condiiile pentru utilizarea
testului Pearson nu se ndeplinesc, sunt: testul chi-ptrat (pentru date nominale) sau
coeficienii de corelaie Spearman sau Kendall (pentru date ordinale).
Aranjarea datelor
Se creeaz variabile distincte pentru fiecare caracteristic supus testrii.
Procedura: Statistics-Corelate-Bivariate
Variabilele supuse corelaiei vor fi trecute n lista Variables:
- 46 -
Testul implicit, din zona Correlation Coefficients, este Pearson, dar se poate bifa un
altul (Kendall sau Spearman), dac datele sunt neparametrice.
Tipul implicit de testare a ipotezei este bilateral (Two-tailed), dar se poate alege
unilateral (dac exist o justificare solid).
Flag significant correlations, determin marcarea cu un asterisc a coeficienilor
semnificativi la p=0.05 i cu dou asteriscuri a celor semnificativi la p=0.01. Acest lucru
este util atunci cnd matricea de corelaie este mare, pentru a scoate n eviden valorile
semnificative ale lui r.
Rezultate
- 47 -
inserai WITH
Este evident c aceast modalitate se poate aplica pentru orict variabile, dac avem
grij s le aezm separat n list i s includem clauza WITH ntre cele dou categorii de
variabile. Nu pot fi incluse mai multe clauze WITH n aceeai procedur.
- 48 -
- 49 -
- 50 -
- 51 -
- 52 -
unde 3.406 este originea iar 0.854 este panta dreptei de regresie.
- 53 -
Sau, dac predicia se face pe baza unui scor standardizat z al variabilei mat_in (s zicem,
0.93), atunci:
n acest caz termenul liber are valoarea 0, deoarece originea dreptei pentru scoruri
standardizate se afl n 0.
Desigur, scorurile astfel prezise sunt estimri, atta timp ct corelaia dintre variabile nu
este perfect. Iar estimrile conin cu att mai mult eroare cu ct corelaia dintre variabile este
mai mic (punctele graficului de corelaie fiind mai ndeprtate de dreapta de regresie).
La finalul procedurii analizei de regresie, cu setrile de mai sus, n baza de date apar
cteva variabile noi, aa cum se vede n imaginea de mai jos.
- 54 -
- 55 -
- 56 -
- 57 -
Imaginea red rezultatele primilor opt subieci la o scal cu 10 itemi, de tip Lickert,
pentru evaluarea atitudinii fa statistic. Toate prelucrrile care urmeaz sunt efectuate pe
datele complete.
Procedura: Statistics-Scale-Reliability Analysis...
- 58 -
Rezultate
n continuare vor fi analizai un cei 10 itemi ipotetici, alei doar n scop didactic.
Pentru o scal real acest numr ar fi cu totul insuficient. Ca regul general, numrul
itemilor din faza de dezvoltare a unui astfel de instrument ar trebui s aib cel puin dublul
numrului de itemi pe care l preconizm la final. i aceast pentru c analiza de itemi este
un proces selectiv care are drept scop alegerea itemilor adecvai pentru constituirea unei
scale cu cel mai ridicat nivel de consisten intern posibil.
Rularea procedurii, cu setrile de mai sus ne ofer urmtoarele categorii de
informaii:
Tabelul de mai sus cuprinde lista itemilor, media abaterea standard i numrul
cazurilor. . Analiza valorilor permite evidenierea tendinei centrale i a mprtierii
rspunsurilor pentru fiecare item. Eventuale anomalii pot fi sesizate nc din aceast faz.
De exemplu, se poate constata c media itemului I_02 este mai mic dect a celorlali, fapt
care sugereaz rspunsuri grupate spre valorile mici.
- 60 -
utilizarea lor n aceeai scal (ar putea fi, de exemplu itemi formulai extrem de
asemntor).
n fine, cea mai important dintre categoriile de informaii, este tabelul Item-total
Statistics, care include relaiile dintre itemi i scorul global. Dou dintre coloanele alturate
au o importan particular: Corected Item-Total Correlation (corelaia dintre fiecare item
i scorul global) i Alpha if Item Deleted (valoarea lui Cronbach alfa, dac respectivul item
ar fi eliminat).
Dac privim prima dintre aceste dou coloane, observm c doi dintre itemi (i_03 i
i_09) au corelaii negative cu scorul global. Aceasta nseamn c ei nu numai c nu aduc
informaie util n raport cu atributul msurat ci, dimpotriv, merg ntr-o direcie opus
acestuia. n acest caz trebuie s verificm dac valorile itemului respectiv au fost corect
codificate. Dac da, atunci singura soluie posibil este eliminarea itemilor n cauz.
Observm, de asemenea, c itemul i_02 are o corelaie extrem de mic cu scorul global
(0.015). Contribuia sa la construcia scalei este extrem de mic, nesemnificativ. Cu alte
cuvinte, nici nu stric dar nici nu ajut, n schimb, consum timpul subiectului pentru a
rspunde.
- 61 -
Pe ultima linie a imaginii gsim valoare lui Cronbach alfa, care este 0.457, o
valoare care este modest n raport cu nivelul minim necesar (0.702) dar care poate fi
crescut prin eliminarea itemilor nepotrivii, n primul rnd a celor care coreleaz negativ
cu scorul global.
Urmtoarea faz este reluarea prelucrrii, cu eliminarea itemilor negativi din lista
Items din caseta principal. n general, nu este recomandabil eliminarea mai multor itemi
simultan, dar itemii negativi pot fi scoi toi odat, fr reineri. Iat care este rezultatul
eliminrii itemilor 3 i 9 asupra consistenei interne:
Ca urmare a noii iteraii, se observ c itemul i_02, care anterior avea o corelaie
pozitiv dar extrem de mic, a dobndit o corelaie negativ cu scala. Ca urmare, va fi
eliminat. n orice caz, chiar i itemii pozitivi, care au corelaii cu scala mai mici de 0.1 nu
trebuie pstrai, pentru simplul motiv c nu contribuie la constructul psihologic vizat, fiind
doar consumatoare de timp n aplicarea instrumentului. De altfel, se i observ c prin
eliminarea acestui singur item, valoarea lui Cronbach alfa crete la 0.75.
Se reia prelucrarea eliminndu-se itemul i_02 din lista din caseta principal i se
obine urmtoarea configuraie de rezultate:
Datele indic o valoarea Cronbach alfa de 0.75. n plus, dac privim ultima coloan
de cifre, vedem c prin eliminarea oricrui item nu am obine o valoare mai ridicat dect
Dei programele computerizate l calculeaz cu un numr mai mare de zecimale, indicele Cronbach alfa se
raporteaz doar cu dou zecimale.
- 62 -
k * (1 x )
x * (1 k )
unde:
x este valoarea curent a lui Cronbach alfa
k este nivelul dorit al lui Cronbach alfa
k este factorul de multiplicare a scalei pentru a se obine k
ntr-un mod similar, se poate estima valoarea lui Cronbach alfa (k) care ar fi atins
pornind de la un anumit nivel calculat al acestuia x i un anumit factor de multiplicare al
numrului de itemi (k):
k =
k * x
1 + (( k 1) * x )
Exemplu:
Avem o scal cu 20 de itemi i x=0.50
Ci itemi ar trebui adugai pentru a atinge un nivel de 0.70?
k=
k * (1 x ) .70 * (1 .50)
=
= 2.33
x * (1 k ) .50 * (1 .70)
- 63 -
valabil pentru situaia n care noii itemi ar avea aceeai corelaie inter-itemi cu cei deja
existeni).
Pentru acelai caz, cu ct ar crete dac am aduga 30 de itemi:
k=(nr. itemi iniiali+nr. itemi noi)/nr. itemi noi=(20+30)/20=2.5
k =
k * x
2.5 * .50
=
= 0.71
1 + (( k 1) * x ) 1 + ((2.5 1) * .50)
Desigur, se presupune c noii itemi adugai vor fi la fel de buni ca i cei deja
utilizai. De aceea este posibil ca rezultatul formulei s fie o estimare uor optimist dar nu
mai puin util.
Utilizarea improprie a analizei de itemi
Atunci cnd o scal este utilizat pentru a msura cunotine asupra unui anumit
subiect, pentru alt scop dect cel de selecie sau evaluare comparativ ntre indivizi,
utilizarea indicelui Cronbach alfa nu este adecvat. O valoare redus a acestuia nu poate
nsemna c itemii nu msoar un anumit tip consistent de cunotine (fapt incontestabil din
moment ce fac parte dintr-un univers de cunoatere bine definit) ci mai degrab c subiecii
au rspuns la ntmplare. Mai departe, n cazul n care rspunsurile la o anumit ntrebare
sunt corecte pentru cea mai mare parte a subiecilor, sau pentru toi, dei am fi tentai s
apreciem acest fapt ca o expresie pozitiv a corelaiei itemului cu scorul global, avem de
a face mai degrab cu un item prea uor, care nu este suficient de discriminativ pentru a fi
pstrat.
Chiar i n acest tip de situaii, totui, analiza de itemi poate fi folositoare ca
modalitate de identificare a itemilor greit formulai, a celor nerelevani sau, pur i simplu,
pentru a scoate n eviden erorile tipice pe care le fac subiecii la anumite ntrebri.
- 64 -
- 65 -
n zona Define Dichotomy se alege Get from data, dac variabila este
dihotomic, sau Cut point, dac variabila este continu, prin fixarea unei
valori care mparte distribuia n dou categorii.
n zona Test proportion se introduce proporia primei categorii.
Butonul Options permite solicitarea statisticii descriptive pentru variabila
testat.
Rezultate
- 66 -
Testul semnelor
Utilizare
Testul semnelor este utilizat pentru a testa diferena dintre valori, utilizndu-se
semnul diferenei i nu valoarea acesteia, atunci cnd ambele valori sunt msurate pentru
aceiai subieci . Dac nu ar exista nici o diferen ntre valorile perechi, atunci numrul
diferenelor pozitive ar trebui s fie egal cu cel al diferenelor negative. Cu ct numrul
diferenelor de un anumit semn este mai mare comparativ cu cel al diferenelor de semn
opus, cu att crete posibilitatea ca diferena dintre variabile s fie statistic semnificativ.
Exemplu: ntr-un experiment cu privire la efectul motivrii asupra memorrii,
subiecilor li se cere s memoreze cuvinte dintr-o list, nainte si dup introducerea unui
factor motivant. Dat fiind faptul c numrul subiecilor este prea mic pentru asumarea
normalitii distribuiei de eantionare, se alege testul semnului, n locul testului t pentru
eantioane dependente.
Condiii
Variabilele vor fi de tip numeric, iar valorile exprimate n aceeai unitate de
msur, pentru a se putea face diferena lor.
Aranjarea datelor
Imaginea de mai jos conine variabilele inainte i dupa, care vor fi analizate.
Rezultate
Tabelul Sign Test cuprinde numrul diferenelor pozitive, respectiv negative, pentru
cazurile din baza de date. n cazul nostru, exist 7 diferene pozitive i nici o diferen
negativ.
- 68 -
Femei
20
30
Brbai
10
40
Aranjarea datelor
Datele pot fi incluse n Data Editor n dou moduri:
a. Sub forma unor nregistrri distincte pentru fiecare caz
Acest mod poate fi extrem de dezavantajos atunci cnd sunt multe cazuri sau cnd
exist deja o statistic global a fenomenului PTSD n raport cu sexul.
b. Sub forma unor nregistrri distincte pentru valorile caracteristicii de sex:
- 69 -
Facem precizarea c n tabelele de date din imaginile de mai sus variabilele au fost
codificate numeric cu 1 respectiv 2, att pentru sex ct i pentru PTSD, valorile fiind
etichetate. Faptul c n celule apar etichetele i nu valorile, se obine prin setarea DataValue Labels.
Procedura Chi-ptrat accept i variabile de tip caracter (string) dar reamintim
recomandarea de principiu ca toate variabilele s fie declarate de tip numeric.
Procedura: Statistics-Summarize-Crosstabs...
Casetele de configurare sunt urmtoarele:
Rezultate
- 71 -
- 72 -
Procedura: Statstics-NonParametric-Tests-Chi-Square...
Rezultate
- 73 -
Este important de reinut c toate variabilele trebuie s fie numerice. n baza de date
de mai sus, variabila paranorm aia valoarea 1 pentru cred i valoarea 2 pentru
nu cred, iar variabila stud_la are valoare 1 pentru Universitate i 2 pentru
Politehnic.
Valorile variabilelor au fost etichetate corespunztor iar afiarea etichetelor n locul
valorilor, n celulele tabelului de date, a fost obinut cu setarea View-Value labels
din meniul SPSS Data Editor. De reinut c, dei afieaz etichetele, SPSS va opera
n calcule cu valorile, devenite invizibile.
Procedura: SPSS nu dispune de o procedur specific pentru calcularea direct a
diferenei dintre dou procente. n acest scop se utilizeaz o procedura Crosstabs i testul
chi-ptrat.
- 74 -
- 75 -
- 76 -
Tabelul Ranks ofer informaii sintetice despre cele dou variabile: volumul
grupurilor, media rangurilor i suma rangurilor.
Tabelul Test Statistics include valorile testului Mann-Whitney pentru cele dou
variabile testate simultan, depresia imediat i remanent. Valorile de interes din tabel sunt
cele ale lui Z i nivelul de ncredere p. n cazul nostru, se observ depresia imediat nu
difer semnificativ n funcie de tipul de drog utilizat, n timp ce depresia remanent este
semnificativ diferit, mai mare la utilizatorii de Ecstasy dect la utilizatorii de alcool
(conform datelor din tabelul anterior).
- 78 -
n locul setrii implicite Analyze all cases, do not create groups, se bifeaz
opiunea Compare groups i se declar variabila ale crei valori vor servi drept criteriu de
mprire a bazei de date n grupuri de analiz separat (n cazul nostru, tipul de drog) prin
trecerea ei n zona Groups Based on:. Efectul acestei aciuni este acela c toate prelucrrile
care vor fi efectuate din acest moment se vor aplica, separat, pe fiecare grup identificat prin
valorile variabilei.
Operaiunea de mprire a bazei de date nu are semne vizibile, fapt care
poate face s fie uitat i, astfel, atunci cnd se revine la prelucrri care ar trebui s
implice toat baza de date rezultatele vor fi incorecte. De aceea, se va avea n
vedere revenirea la setarea Analyze all cases, do not create groups atunci
prelucrarea pe grupuri a bazei de date nu mai este becesar.
- 79 -
Se bifeaz opiunea pentru testul Wilkoxon (care este, de fapt, cea implicit)
Rezultate
Tabelul Ranks ofer informaii sintetice despre rangurile pozitive i negative pentru
cele dou grupuri, numrul subiecilor, media rangurilor i suma lor.
Tabelul Test Statistics prezint valorile comparative ale depresiei pentru cele dou
grupuri. Aa cum se observ, diferena este semnificativ (p=0.007) n cazul
consumatorilor de Ecstasy i nesemnificativ (p=0.053), n cazul consumatorilor de alcool.
Concluzia general a studiului este aceea c Ecstasy, comparativ cu alcoolul, are un efect
depresant mai mare (testul Mann-Whitney) i mai accentuat cu trecerea timpului (testul
Wilcoxon).
- 80 -
Se definete domeniul
valorilor variabilei
independente, n cazul
nostru: minim 1, maxim 3.
- 81 -
Rezultate
Rezultatul testului, afiat n tabelul Test Statistics, se exprim printr-o valoare chiptrat (6.33) cu dou grade de libertate i p=0.042. Ca urmare, ipoteza de nul poate fi
respins. Datele confirm ipoteza c mediul familial (exprimat prin cele trei tipuri de
familie) i pune amprenta asupra expresivitii emoionale a copiilor de vrst precolar.
- 82 -
Se seteaz opiunea Friedman iar variabilele testate sunt trecute n lista Test
Variables:
- 83 -
Rezultate
Primul tabel prezint media rangurilor pe nlimi (rangul 1 este atribuit valorii
celei mai mici). n al doilea tabel gsim valoarea testului Friedman exprimat n valori chiptrat (8.40), avnd un nivel de semnificaie p=0.015. Acest rezultat permite respingerea
ipotezei de nul i confirm ipoteza c memoria cuvintelor este n legtur cu nlimea (pe
cele trei niveluri avute n vedere).
Coeficientul de corelaie pentru date ordinale (Spearman)
Utilizare
Testul de corelaie a rangurilor (Spearman) este echivalentul pentru date ordinale
testului de corelaie Pearson. Rezultatul su variaz pe aceeai plaj de valori (-1/+1) i se
interpreteaz n mod similar cu rezultatul testului Pearson.
Exemplu: S lum n considerare studiul aceluiai grup de alpiniti, care au
efectuat, la aceleai nlimi descrise mai sus, i un test de vitez de decizie (msurat n
zecimi de secund). Problema cercetrii este dac ntre performana de memorare i ce de
timp de decizie este o relaie (variaie concomitent) semnificativ.
Aranjarea datelor
]
Alturi de variabilele memorie pentru cele trei nlimi, avem acum i
variabilele pentru timpul de decizie.
Procedura: Statistics-Corelation-Bivariate
- 84 -
- 85 -
valorile utile analizei. n jumtatea de sus a tabelului, avem corelaiile pentru testul
Kendall iar n jumtatea de jos pe cele ale testului Spearman.
Testul Kendall al corelaiei dintre memorie i decizie la 1000 de metri are valoarea
-0.94, semnificativ la p=0.023. La interpretarea coeficienilor de corelaie este extrem de
important s se ia n considerare, simultan, semnul i semnificaia variaiei valorilor. n
cazul nostru, valori mari ale memoriei, nseamn o capacitate de memorare mai bun iar
valori mari ale timpului de decizie nseamn capacitate de decizie mai proast (sub aspectul
vitezei, desigur). n consecin, un coeficient de corelaie negativ ntre aceste variabile
indic, de fapt, o variaie concomitent pozitiv a memoriei i vitezei deciziei (cnd
capacitatea de memorare scade, i decizia este mai lent, timpul de decizie fiind mai mare).
Analiza coeficienilor din tabelul de mai sus arat existena unei corelaii de rang
semnificative (p<0.05) ntre memorie i decizie la toate palierele de nlime.
Dac facem comparaia dintre coeficienii Spearman i Kendal, vom vedea c, dei
ei difer valoric, semnificaiile se afl, n toate cazurile, de aceeai parte a deciziei statistice
(respingerea ipotezei de nul). Utilizarea unuia sau altuia dintre cei doi coeficieni rmne la
latitudinea cercettorului.
- 86 -