Documente Academic
Documente Profesional
Documente Cultură
Aplicatii SPSS
Aplicatii SPSS
Marian Popa
CUPRINS
SPSS prezentare general..............................................................................................................................3
Paii analizei statistice cu SPSS.....................................................................................................................6
Editarea datelor..............................................................................................................................................8
Exemplu practic de realizare a unei baze de date......................................................................................15
Operaii de transformare a variabilelor.....................................................................................................19
nsumarea valorilor variabilelor.................................................................................................................19
Calcularea mediei a dou sau mai multe variabile....................................................................................21
Extragerea anului dintr-o variabil de tip cronologic (date)......................................................................22
Recodificarea variabilelor..........................................................................................................................24
Ordonarea dup rang a valorilor unei variabile.........................................................................................26
Organizarea datelor pentru analiz............................................................................................................27
Sortarea bazei de date................................................................................................................................27
mprirea bazei de date n subgrupuri......................................................................................................28
Selectarea unor seturi de date....................................................................................................................28
Calcularea indicatorilor statistici descriptivi.............................................................................................31
Teste parametrice..........................................................................................................................................35
Testul z (t) pentru media unui singur eantion...........................................................................................35
Testul t pentru eantioane independente....................................................................................................37
Analiza de varian unifactorial (One Way ANOVA)..............................................................................40
Testul t pentru eantioane dependente (perechi)........................................................................................44
Coeficientul de corelaie liniar Pearson (r)..............................................................................................46
Regresia liniar simpl...............................................................................................................................51
Analiza de consisten intern (Cronbach alfa).........................................................................................57
Teste neparametrice nominale.....................................................................................................................65
Testul z al proporiei pentru un singur eantion.........................................................................................65
Testul semnelor..........................................................................................................................................67
Testul Chi-ptrat al asocierii (independeei)..............................................................................................69
Testul Chi-ptrat pentru coresponden (goodness of fit)..........................................................................72
Testul z al diferenei dintre dou proporii independente..........................................................................74
Teste neparametrice pentru date ordinale.................................................................................................77
Testul Mann-Whitney (U) pentru dou eantioane independente..............................................................77
Testul Wilcoxon pentru dou eantioane perechi.......................................................................................79
Testul Kruskal-Wallis pentru mai mult de dou eantioane independente................................................81
Testul Friedman pentru msurri repetate..................................................................................................83
Coeficientul de corelaie pentru date ordinale (Spearman).......................................................................84
-2-
-3-
-4-
-5-
Meniurile SPSS
Meniurile de tip list se aseamn cu meniurile altor programe sub Windows. Fr a intra n
amnunte, iat o prezentare succint a meniurilor pentru fereastra DATA EDITOR:
Meniul
File
Edit
View
Data
Funcii principale
Operaii de deschidere i salvare de fiiere
Operaii de Select/Copy/Cut/Paste, Find i,
cel mai important, setarea caracteristicilor de
lucru ale SPSS (Options-n versiunile pt. Win
9X)
n cazul ferestrei Data Editor, seteaz modul
de afiare: cu sau fr bara de butoane, cu sau
fr liniile despritoare ale celulelor.
Funcii de operare cu variabilele; definire,
inserare, tergere, selectare, sortare,
adiionare de fiiere, etc.
Transform
Statistics
(Analyze)
Graph
Utilities
Window
Help
Observaii
Importante pentru
pregtirea datelor n
vederea prelucrrii
Importante pentru
pregtirea datelor n
vederea prelucrrii
Prin opiunile fiecrei
proceduri se pot obine i
reprezentri grafice
specifice
Informaii de ajutor
Introducerea datelor
Opiuni:
(a) Introducerea direct a datelor n DATA EDITOR
(b) Deschiderea unui fiier de date SPSS (extensia .SAV)
(c) Importarea unui fiier de format diferit (se alege din
-6-
2
3
4
Pregtirea datelor
Selectarea procedurii
satistice
Selectarea variabilelor
ce urmeaz a fi supuse
prelucrrii
Rularea procedurii
Analiza rezultatelor
Editarea rezultatelor
SPSS este un program puternic de analiz statistic a datelor. Utilizarea lui optim
presupune, n mod necesar, stpnirea de ctre operator a cunotinelor teoretice de
statistic.
Aa cum un program de editare grafic nu compenseaz lipsa de talent la desen, nici
SPSS nu poate fi cu adevrat exploatat de ctre cei care nu au cunotine de statistic.
n lipsa acestora, nici alegerea procedurilor i nici interpretarea rezultatelor nu va fi
cu adevrat posibil.
-7-
Editarea datelor
O baz de date n SPSS este o structur format din linii i coloane, la intersecia
crora se formeaz celulele care conin, fiecare, o anumit unitate de informaie.
Existena unei baze de date deschis n fereastra Data Editor este o condiie
obligatorie pentru operarea cu SPSS
SPSS opereaz numai cu o singur baz de date deschis la un moment dat
n principiu, o baz de date SPSS se obine pe una din urmtoarele ci:
a) Crearea ei prin operaiunea de definire a variabilelor i introducerea datelor de la
tastatur;
b) Deschiderea unei baze de date SPSS, existente pe un suport de memorie;
c) Importarea unei baze de date din alt format dect SPSS
n continuare, vom trata pe rnd, fiecare din cele trei situaii:
a) Crearea unei baze de date SPSS
n linii generale, pentru crearea unei baze de date proprii n SPSS, se procedeaz
astfel:
Se lanseaz SPSS
Se definesc variabilele bazei de date n domeniul Data Editor
Se introduc datele pentru fiecare caz (subiect) n parte
Se salveaz baza de date (extensia specific este *.sav)
Definirea variabilelor
se acioneaz Define variable din meniul Data
soluie mai direct este dublu clic pe capul de coloan
-9-
- 10 -
Exist o mare varietate de formate pentru acest tip de variabil, acoperind, practic,
orice cerin posibil din partea utilizatorului.
- 11 -
- 12 -
- 15 -
Nevrozism
NEVRO
Lie
LIE
Numeric, Width 2,
Decimal Places 0
(nu se poate obine o
valoare mai mare de
100 i nu exist
zecimale)
Numeric, Width 1,
Decimal Places 0
(nu se poate obine o
valoare mai mare de
9 i nu exist
zecimale)
Nevrozism
Minciun
Se observ faptul c pentru variabile ale cror nume exprim exact coninutul
(SEX, VRSTA) se poate utiliza fr nici un inconvenient numele i ca etichet. Pentru a
fi mai explicii, s spunem c numele variablei este util n primul rnd SPSS-ului pentru a
manipula variabilele, n timp ce etichetele sunt necesare mai ales utilizatorului pentru a
nelege cu uurin la ce se refer o variabil al crui nume prea scurt
Avem alturat, imaginea DATA EDITOR pentru primii trei subieci introdui cu
variabilele de mai sus:
- 16 -
grij ns, ca pe documentul original s scriem codul numeric aferent fiecrui subiect,
astfel nct, la nevoie, s se poat identifica numele (pentru corecii, de ex.)
Variabile multiple pentru ntrebri cu rspuns multiplu: De obicei, o ntrebare prezint
un singur rspuns, dar pot fi situaii n care o ntrebare prezint rspunsuri multiple
care pot fi alese n acelai timp. De exemplu: Ce activiti preferai pentru timpul
liber? 1. sport; 2. filme; 3. petreceri cu prieteni..., etc. ntr-un asemenea caz ne
putem atepta s avem mai multe rspunsuri la aceeai ntrebare. Soluia pentru
introducerea datelor este, de aceea, crearea mai multor variabile, cte una pentru
fiecare variant de rspuns. Astfel, vom avea variabila SPORT care poate primi
dou valori, sa zicem 1 dac este aleas i 0 dac nu este aleas, i aa mai
departe. n acest mod vom putea analiza frecvena alegerilor pentru fiecare variant
de rspuns n parte.
Evitarea variabilelor redundante: Dac la un test nu sunt posibile, de exemplu, dect
rspunsuri corecte sau greite, atunci nu este necesar s declarm o variabil pentru
corecte i una pentru greite dac suma lor d totalul rspunsurilor.
Salvarea bazei de date din Data Editor
O baz de date aflat n lucru nu are un corespondent ntr-un fiier dect dup ce
se execut o salvare a acesteia. Acest lucru nu trebuie niciodat uitat. Spre deosebire de
WORD de exemplu, SPSS nu are o funcie de salvare automat dup un interval de timp
prestabilit. Cu alte cuvinte, indiferent ce modificri facem n Data Editor pe ecran, datele
respective vor fi salvate numai la comanda explicit a operatorului.
Pentru o baz de date nou creat, salvarea se face n mod similar cu orice alt
program cunoscut: File-Save as, care deschide urmtoarea caset de dialog:
Se alege locaia de salvare (Save in)
Se d un nume fiierului (File name)
Se verific tipul de fiier (formatul implicit pentru baze de date SPSS are
extensia .sav)
Se acioneaz Save
SPSS poate salva i n alte formate, dintre cele mai importante fiind: Dbase
sau FoxPro, Lotus 1-2-3, Excel. Salvarea n aceste formate poate fi util
pentru transferul datelor pentru prelucrri ulterioare n alte programe.
- 17 -
n cazul deschiderii unui fiier de alt tip dect SPSS, se va alege tipul
respectiv din lista Files of type. n cazul n care SPSS nu recunoate tipul de
fiier n care se afl datele noastre, putem ncerca transformarea lor prealabil
din formatul original ntr-un format recunoscut de SPSS. Dei exist riscul
pierderii unor aspecte ce in de formatul de reprezentare a datelor, operaiunea
scutete totui un mare volum de munc.
- 18 -
- 19 -
Deoarece prin calculare, o nou variabil este plasat dup toate variabilele
existente, am preferat s inserm o nou variabil imediat dup cele trei pe care dorim s
le nsumm. n acest fel avem i posibilitatea s controlm uor corectitudinea operaiei
de nsumare
Se apeleaz procedura Transform-Compute, care deschide caseta de mai jos:
Dac variabilele ce vor fi nsumate se afl n baza de date una dup alta, ca
n cazul exemplului nostru, atunci avem posibilitatea s scriem o expresie
de nsumare simplificat, astfel SUM (prima_variabil TO
ultima_variabil). n acest caz, clauza TO va fi cuprins ntre spaii, pentru
a nu fi confundat cu un nume de variabil. Aceast opiune ne sugereaz
ct de important poate fi s aranjm corespunztor variabilele n structura
unei tabele SPSS.
3. Se apas butonul OK
4. Deoarece variabila total exist, SPSS ne ntreab dac dorim s modificm
coninutul acesteia. Dac nu ar exista o variabil cu acest nume, rezultatul
operaiei de calcul ar fi depus ntr-o variabil creat automat i amplasat dup
ultima variabil din baza de date.
Rspundem OK, deoarece tim c am
creat aceast variabil tocmai pentru a
depune n ea suma.
- 21 -
Reamintim c funcia MEAN poate fi scris de la tastatur sau poate fi adus din
lista de funcii, prin selectare i acionarea butonului .
Este de la sine neles c expresia de calcul poate fi realizat i ntr-o manier
simpl i direct, fr utilizarea funciilor (SUM sau MEAN), astfel:
Pentru sum: scor_1+scor_2+scor_3
Pentru medie: (scor_1+scor_2+scor_3)/3
Se va face o distincie clar ntre suma sau media astfel obinute, care se refer la
suma sau media valorilor de la mai multe variabile, pentru acelai subiect, i suma
sau media pe care am calcula-o pe vertical, la nivelul fiecrei variabile n parte,
pe ntreaga distribuie
Se pot realiza diverse alte funcii de transformare, utilizndu-se marea varietate de
funcii care se gsesc n lista Functions i a cror semnificaie se poate afl din
Help-ul casetei Compute.
Extragerea anului dintr-o variabil de tip cronologic (date)
SPSS ofer funcii de transformare cu variabilele de tip cronologic. Dintre
acestea, vom exemplifica cu realizarea unei variabile care s conin anul naterii, s
zicem, scos dintr-o variabil care conine data naterii. Imaginea de mai jos este extras
din baza de date Employee data.sav
Observm c variabila bdate, care conine data naterii. Pentru a avea vrsta,
trebuie s calculm diferena dintre anul curent (s zicem, 2000) i anul naterii: Pentru
- 22 -
aceasta trebuie s facem diferena dintre anul curent (2000) i anul naterii, care se afl n
cmpul bdate.
Pentru a avea variabila ce urmeaz a fi creat n apropierea variabilei bdate, vom
insera o variabil (denumind-o virsta, de tip numeric, cu doi ntregi). Apoi utilizm
procedura Compute din meniul Transform:
- 23 -
dintr-o variabil primar peste valorile deja existente. Cu alte cuvinte, este
recomandabil s crem prin transformare variabile noi, i nu s modificm
valorile existente din variabilele primare a cror pierdere ar necesita
reintroducerea lor, n caz de necesitate.
Recodificarea variabilelor
Recodificarea unei variabile nseamn convertirea valorilor acesteia, cu scopul
obinerii unei distribuii bazat pe frecvene cumulate. Procesul este similar cu crearea
unei tabele de frecvene grupate i ne reamintim c poate fi derulat n maniera descris
mai jos:
Pai pentru gruprii de frecvene:
Se face diferena dintre valoarea cea mai mare i valoarea cea mai mic a unei
distribuii
Se mparte valoarea obinut la mrimea posibil (estimat) a intervalului
Se selecteaz mrimea intervalului care conduce la un numr de clase cuprins
ntre 5 i 15
Se determin limita inferioar a primului interval (trebuie s fie un multiplu al
mrimii intervalului)
Se determin limita superioar a primului interval
Se construiesc intervalele de clas pentru fiecare interval, fiind ateni s avem
clase suprapuse sau intervale neacoperite
n principiu, dei este recomandabil obinerea unei grupri de frecvene pe 5-15
clase, se poate opta pentru un numr de clase care servete cel mai bine interesul de
cercetare. De exemplu, n cazul unei distribuii de vrst exprimat n ani, este preferabil
s se opteze pentru clase cincinale sau decade, acestea avnd i o anumit
semnificaie psihologic.
n urma transformrii de mai sus, am obinut variabila virsta. Utilizarea ei ca atare
n analize statistice este improprie, de aceea ar fi foarte util obinerea unei variabile care
s asocieze anumite valori convenionale pentru categorii de virsta. Pentru aceasta putem
efectua recodificarea variabilei virsta pentru a obine o distribuie grupat de frecvene,
astfel:
Se lanseaz procedura Recode - Into Defferent Variables din meniul Transform:
- 24 -
Atenie, se poate alege i opiune Into Same Variables, dar nu este recomandabil
deoarece, n cazul unei erori, nu mai avem la dispoziie variabila iniial pentru o nou
recodificare.
Dei relativ complicat, caseta de declarare a noilor valori n funcie de cele vechi este uor de neles.
n zona Old value, se alege una dintre variantele de definire a valorilor de la care se
pleac. S zicem c am ales soluia s recodificm anii pe intervale de zece ani, primul interval
fiind 29-39, al doilea 40-49, .a.m.d.
Pentru aceasta activm opiunea Range i scriem valorile limite al intervalului dorit.
Dup aceasta, n zona New value oValue, scriem care este valoarea pe care o asignm
acestei clase.
n fine, acionm butonul Add pentru a definitiva operaiunea i trecem la definirea
urmtoarei clase, pn terminm.
n zona OldNew se poate observa lista recodificrilor definite.
- 25 -
- 26 -
Imaginea din caset descrie sortarea bazei de date, cresctor (Ascending), dup
valorile variabilei scor (rezultatul se vede n imaginea de mai jos).
- 27 -
Se poate efectua sortarea simultan dup mai multe variabile, fiecare n sensul
dorit, de exemplu: grup(Ascending) i scor(Descending).
- 28 -
Opiunile sunt:
Analyze all cases, do not create groups (pentru analiza integral a datelor)
Compare groups (rezultatele vor fi afiate astfel nct s poat fi uor comparate)
Organize output by groups (rezultatele vor fi afiate n Viewer, separat pe grupuri)
Operaia nu produce nici o modificare vizibil asupra bazei de date. Singurul efect
se vede n zona de afiare a rezultatelor, unde toate procedurile de analiz vor fi
afiate pentru fiecare subgrup n parte.
Pentru a se reveni la analiza intergral a datelor, se va reveni n procedura Split
File i se va seta opiunea Analyze all cases....
Selectarea unor seturi de date
Selectarea unui set de date permite aplicarea procedurilor de analiz numai pe
cazurile selectate. Dac nu se opteaz pentru tergerea datelor neselectate, ele vor fi
pstrate i vor putea fi reintroduse n analiz. Procedura este Data-Select Cases....
Pentru exemplificare, s ne propunem selectarea din baza de date din imaginea de
mai sus a cazurilor aparinnd grupului 1.
Imaginea prezint:
n partea stng, baza de date
La mijloc, caseta principal Select Cases care are:
o Zona listei de variabile
o Zona fixare a condiiilor de selectare Select, unde:
- 29 -
o
o
o
o
Dup finalizarea operaiei de selectare de mai sus, baza de date se prezint n felul
urmtor:
- 30 -
Se observ:
Marcarea cu o diagonal a capului de linie corespunztor cazurilor neselectate
Apariia unei variabile de sistem filter_$ care conine valoarea 0 pentru cazurile
neselectate i valoarea 1 pentru cazurile selectate. Aceast variabil poate fi
ulterior utilizat n procedurile de analiz, ca variabil independent (caz n care
se va anula situaia de selectare, prin bifarea opiunii All cases).
Selectarea este utilizat n mod obinuit, pentru alegerea temporar a unui set de
date. Adesea se uit anularea unei selectri existente, atunci cnd se dorete
revenirea al analiza tuturor cazurilor. Efectul este obinerea unor rezultate pe date
pariale.
Alte operaii de organizare a datelor pentru analiz
Opiunile SPSS pentru organizarea datelor sunt mult mai numeroase dect cele
descrise mai sus. Fr a le trata n amnunt, ne vom mulumi s le prezentm sumar:
Agregarea cazurilor, atunci cnd exist nregistrri multiple pentru fiecare subiect
i se dorete pstrarea uneia singure (Data-Agregate)
Adugarea unor cazuri din alt baz de date SPSS (Data-Merge Files-Add
cases...)
Adugarea unor variabile din alt baz de date SPSS (Data-Merge Files-Add
variables...)
Inversarea liniilor cu coloanele (Data-Transpose...)
- 31 -
Procedura Frequencies
Este singura care permite analiza de frecvene.
- 32 -
Rezultatele sunt afiate n SPSS Viewer n forma de mai jos (dar unele sub altele,
nu alturat, aa cum sunt aranjai aici):
Indicatorii statistici
descriptivi
Tabelul de frecvene
Histograma
- 33 -
Procedura Descriptives
Aceast procedur vizeaz doar indicatorii statistici descriptivi. La lansare,
Satistics-Descriptives, se deschide caseta principal Descriptives.
Se trec variabilele vizate n lista Variable(s)
(dac dorim calcularea scorurilor z, se
Se aleg indicatorii dorii din Options
bifeaz opiunea din stnga-jos a casetei )
Procedura Explore
Procedura Explore este cea mai complex dintre toate procedurile statisticii
descriptive i se poate utiliza atunci cnd se dorete o analiz exhaustiv a variabilei (sau
variabilelor).
Caseta principal Explore
- 34 -
Reprezentarea stem-andleaf
- 35 -
Teste parametrice
Testul z (t) pentru media unui singur eantion
Utilizare
Testul z pentru un singur eantion este utilizat pentru se testa diferena dintre
media unui eantion fa de media cunoscut a populaiei din care face parte. Atunci cnd
volumul eantionului este mic (N<30) este utilizat o variant denumit testul t pentru un
singur eantion.
Utilizarea acestui test statistic este condiionat de cunoaterea mediei populaiei.
Dac populaia are o extindere mare, acest lucru este dificil de realizat (n afara cazurilor
n care exist studii speciale, cum sunt cele antropometrice, de exemplu). Dintre
variabilele psihologice ale crei medii pentru populaie este cunoscut, este inteligena,
exprimat n uniti QI (=100). Testul poate fi utilizat, ns, atunci cnd populaia are o
extindere mai redus. De exemplu, dac a fost evaluat nivelul de satisfacie ntr-o
organizaie, se poate testa diferena dintre nivelul de satisfacie la nivelul unei secii fa
de media satisfaciei la nivelul ntregii organizaii (populaie).
Condiii de aplicare
Condiia teoretic de baz este normalitatea distribuiei de eantionare. n temeiul
teoremei limitei centrale, cu ct volumul eantionului este mai mare, cu att normalitatea
distribuiei de eantionare este mai sigur.
Aranjarea datelor
Datele supuse testrii trebuie s fie incluse ntr-o variabil SPSS de tip numeric.
Procedura: Statistics-Compare Means-One Sample T Test
Variabila
testat
Caseta principal
Variabila testat este trecut n lista
Test Variable(s)
n zona Test Value se nscrie media
populaiei (100 n cazul nostru)
- 36 -
Rezultate
Primul tabel include statistica descriptiv a variabilei testate (N, media, ab.std,
eroarea standard a mediei)
Al doilea tabel include rezultatele testului statistic: t=6.254, df=4, p=0.03,
diferena fa de media populaiei (22.6) i limitele inferioar (12.57) i superioar
(32.63) ale intervalului de ncredere pentru media populaiei estimat de eantionul de
cercetare.
Concluzia testului: media eantionului de cercetare difer semnificativ de QI=100,
ca medie a populaiei.
- 37 -
- 38 -
Rezultate
- 39 -
n primul tabel (Group Statistics) avem statistica descriptiv a celor dou grupuri.
Se va observa c programul descrie grupurile prin intermediul etichetelor valorilor. Dac
acestea nu ar fi fost definite, n loc de institutie i familie ar fi aprut 1, respectiv, 2.
Al doilea tabel are dou linii:
Pe prima avem rezultatele testului t pentru cazul asumrii omogenitii varianei
(Levenes Test for Equality of Variances). n cazul nostru, ele sunt egale (Sig.=0.666, ceea
ce se traduce ca o valoare p=0.666, deci mai mare de 0.05 pentru distribuia F a testului
Levene, pe care nu o discutm aici). Ca urmare, vom citi pe aceast linie rezultatul
testului: t=-2.42, df=12, Sig.=0.045.
Pe a doua linie avem rezultatele testului t pentru cazul n care nu s-ar ntruni
condiia de omogenitate a varianei pentru cele dou grupuri. Dac semnificaia testului
Levene ar fi fost mai mic sau egal cu 0.05, rezultatului testului t s-ar fi citit pe aceast
linie.
Pentru exemplul nostru, rezultatul testului t permite acceptarea ipotezei cercetrii,
conform creia copiii crescui n mediu familial sunt mai sociabili (m=22.00) dect cei
crescui n mediu instituional (m=17.71).
- 40 -
- 41 -
- 42 -
Tabelul ANOVA conine rezultatului testului F a crui valoare este 35.264 pentru
un prag p=0.000. Atenie, p=0.000 nu se va nelege ca p=0 ci ca p<0.001. n raportul de
cercetare este chiar recomandabil s nu se utilizeze valoarea 0.000 care poate sugera
certitudinea rezultatului.
- 43 -
hoc sunt astfel n concepute nct s minimizeze acest neajuns. Totui, ele nu vor fi n nici
un caz luate n considerare dac testul F nu atinge pragul de semnificaie statistic
(p<0.05).
Avnd n vedere c testul Levene a confirmat omogenitatea varianei, se vor citi
valorile pentru testul Bonferoni (n caz contrar, s-ar fi citit cele pentru testul Tamhane).
Valorile aunt uor de analizat: n prima coloana avem definite grupurile analizate
(etichetarea valorilor variabilei independente ajut mult la inteligibilitatea tabelului). n
coloana a patra (Sig.) se afl semnificaiile pentru diferena dintre medii. Astfel, putem
constata faptul c timpul de reacie dintre grupul supus ocului de mica intensitate i cel
supus ocului de medie intensitate nu difer semnificativ (p=0.520). n acelai timp,
grupul supus unui oc mic difer de grupul supus unui oc mare (p<0.001), la fel ca
i n cazul comparaiei dintre grupul cu oc mediu i cel cu oc mare (p<0.001).
Cu alte cuvinte, variaia semnificativ a timpului de reacie n funcie de cele trei
categorii de intensitate a ocului electric, provine cu precdere de la efectul pe care l are
ocul mare, care provoac o ncetinire a timpului de reacie consistent fa celelalte
dou categorii de oc electric.
Aceasta concluzie este ntrit i de reprezentarea grafic a mediei timpului de
reacie ale celor trei grupuri.
- 44 -
- 45 -
- 46 -
n fine, ultimul tabel prezint rezultatul testului: t=5.076, df=9, p=0.001. Acesta
permite respingerea ipotezei de nul i acceptarea ipotezei cercetrii, zgomotul afecteaz
capacitatea de calcul aritmetic.
Coeficientul de corelaie liniar Pearson (r)
Utilizare
Corelaia Pearson (r) msoar gradul de asociere dintre variabile. Aceasta se
refer la gradul i sensul de variaie concomitent a valorilor unei variabile n raport cu
cealalt, dup un model de tip liniar.
Domeniul de variaie a coeficientului de corelaie Pearson (r) este ntre r=-1
(corelaie perfect negativ) i r=+1 (corelaie perfect pozitiv). Absena oricrei legaturi
(corelaii) dintre variabile se traduce prin r=0.
Exemplu: Testul de corelaie implic dou variabile dar, adesea, ntr-o cercetare
psihologic numrul variabilelor supuse corelaiei este mai mare de dou. Acest fapt
conduce la ceea ce se numete o matrice de corelaii care este un tabel ale cror celule
cuprind corelaiile dintre perechile de variabile. Pentru exemplificare, s lum n
considerare situaia n care se urmrete evidenierea legturii (asocierii) dintre anxietate
i agresivitate, pe de o parte, i preferina pentru risc pe de alt parte.
Condiii
Condiia principal pentru calcularea coeficientului de corelaie liniar Pearson
este ca variabilele implicate s fie msurate pe scal de interval/raport (alturi de
existena unei forme a distribuiei care nu se abate sever de la curba normal).
Testele neparametrice alternative, pentru cazul n care condiiile pentru utilizarea
testului Pearson nu se ndeplinesc, sunt: testul chi-ptrat (pentru date nominale) sau
coeficienii de corelaie Spearman sau Kendall (pentru date ordinale).
Aranjarea datelor
Se creeaz variabile distincte pentru fiecare caracteristic supus testrii.
Procedura: Statistics-Corelate-Bivariate
Variabilele supuse corelaiei vor fi trecute n lista Variables:
- 47 -
Testul implicit, din zona Correlation Coefficients, este Pearson, dar se poate bifa
un altul (Kendall sau Spearman), dac datele sunt neparametrice.
Tipul implicit de testare a ipotezei este bilateral (Two-tailed), dar se poate alege
unilateral (dac exist o justificare solid).
Flag significant correlations, determin marcarea cu un asterisc a coeficienilor
semnificativi la p=0.05 i cu dou asteriscuri a celor semnificativi la p=0.01. Acest lucru
este util atunci cnd matricea de corelaie este mare, pentru a scoate n eviden valorile
semnificative ale lui r.
Rezultate
- 48 -
inserai WITH
Este evident c aceast modalitate se poate aplica pentru orict variabile, dac
avem grij s le aezm separat n list i s includem clauza WITH ntre cele dou
categorii de variabile. Nu pot fi incluse mai multe clauze WITH n aceeai procedur.
- 49 -
- 50 -
- 51 -
- 52 -
- 53 -
- 54 -
- 55 -
- 56 -
- 57 -
- 58 -
- 59 -
- 60 -
n practic, bifarea opiunilor marcate pe caseta din imaginea de mai sus ofer
informaiile cele mai importante pentru analiza itemilor unui test. Celelalte opiuni sunt
explicitate n Help-ul casetei i pot fi utilizate pentru o analiz mai rafinat a datelor.
Rezultate
n continuare vor fi analizai un cei 10 itemi ipotetici, alei doar n scop didactic.
Pentru o scal real acest numr ar fi cu totul insuficient. Ca regul general, numrul
itemilor din faza de dezvoltare a unui astfel de instrument ar trebui s aib cel puin
dublul numrului de itemi pe care l preconizm la final. i aceast pentru c analiza de
itemi este un proces selectiv care are drept scop alegerea itemilor adecvai pentru
constituirea unei scale cu cel mai ridicat nivel de consisten intern posibil.
Rularea procedurii, cu setrile de mai sus ne ofer urmtoarele categorii de
informaii:
Tabelul de mai sus cuprinde lista itemilor, media abaterea standard i numrul
cazurilor. . Analiza valorilor permite evidenierea tendinei centrale i a mprtierii
rspunsurilor pentru fiecare item. Eventuale anomalii pot fi sesizate nc din aceast faz.
De exemplu, se poate constata c media itemului I_02 este mai mic dect a celorlali,
fapt care sugereaz rspunsuri grupate spre valorile mici.
- 61 -
tabelul alturat rezult c itemii i_02 i i_03 tind s se asocieze negativ cu majoritatea
celorlali itemi. Pe de alt parte, valori extrem de ridicate ale unor corelaii, aproape de 1,
ar putea sugera c itemii respectivi prezint un grad de similitudine care nu justific
utilizarea lor n aceeai scal (ar putea fi, de exemplu itemi formulai extrem de
asemntor).
n fine, cea mai important dintre categoriile de informaii, este tabelul Itemtotal Statistics, care include relaiile dintre itemi i scorul global. Dou dintre coloanele
alturate au o importan particular: Corected Item-Total Correlation (corelaia dintre
fiecare item i scorul global) i Alpha if Item Deleted (valoarea lui Cronbach alfa, dac
respectivul item ar fi eliminat).
Dac privim prima dintre aceste dou coloane, observm c doi dintre itemi (i_03
i i_09) au corelaii negative cu scorul global. Aceasta nseamn c ei nu numai c nu
aduc informaie util n raport cu atributul msurat ci, dimpotriv, merg ntr-o direcie
opus acestuia. n acest caz trebuie s verificm dac valorile itemului respectiv au fost
corect codificate. Dac da, atunci singura soluie posibil este eliminarea itemilor n
cauz. Observm, de asemenea, c itemul i_02 are o corelaie extrem de mic cu scorul
global (0.015). Contribuia sa la construcia scalei este extrem de mic, nesemnificativ.
Cu alte cuvinte, nici nu stric dar nici nu ajut, n schimb, consum timpul subiectului
pentru a rspunde.
- 62 -
Pe ultima linie a imaginii gsim valoare lui Cronbach alfa, care este 0.457, o
valoare care este modest n raport cu nivelul minim necesar (0.702) dar care poate fi
crescut prin eliminarea itemilor nepotrivii, n primul rnd a celor care coreleaz negativ
cu scorul global.
Urmtoarea faz este reluarea prelucrrii, cu eliminarea itemilor negativi din lista
Items din caseta principal. n general, nu este recomandabil eliminarea mai multor
itemi simultan, dar itemii negativi pot fi scoi toi odat, fr reineri. Iat care este
rezultatul eliminrii itemilor 3 i 9 asupra consistenei interne:
Ca urmare a noii iteraii, se observ c itemul i_02, care anterior avea o corelaie
pozitiv dar extrem de mic, a dobndit o corelaie negativ cu scala. Ca urmare, va fi
eliminat. n orice caz, chiar i itemii pozitivi, care au corelaii cu scala mai mici de 0.1 nu
trebuie pstrai, pentru simplul motiv c nu contribuie la constructul psihologic vizat,
fiind doar consumatoare de timp n aplicarea instrumentului. De altfel, se i observ c
prin eliminarea acestui singur item, valoarea lui Cronbach alfa crete la 0.75.
Se reia prelucrarea eliminndu-se itemul i_02 din lista din caseta principal i se
obine urmtoarea configuraie de rezultate:
Datele indic o valoarea Cronbach alfa de 0.75. n plus, dac privim ultima
coloan de cifre, vedem c prin eliminarea oricrui item nu am obine o valoare mai
Dei programele computerizate l calculeaz cu un numr mai mare de zecimale, indicele Cronbach alfa se
raporteaz doar cu dou zecimale.
- 63 -
ridicat dect aceasta. Ca urmare, itemii rmai pot constitui o scal consistent de
evaluare a constructului psihologic pentru care au fost alei.
n concluzie, cu ocazia iteraiilor succesive se vor elimina, in ordine:
itemii care au o corelaie negativ cu scorul global
itemii cu corelaii mici, nerelevante
Cu ct avem mai muli itemi n aceast faz, cu att avem posibilitatea s pstrm
itemi care coreleaz mai intens cu scala i, deci, s atingem un nivel mai ridicat de
consisten intern. Este de la sine neles c, n cazul n care construim un instrument ale
crui ntrebri se adreseaz unor sub-scale diferite, consistena intern se va evalua
separat pentru setul de ntrebri corespunztor fiecrei sub-scale.
O scal consistent intern ne ofer garania c itemii instrumentului nostru
merg mpreun, msoar acelai construct psihologic. Atenie, ns, acest lucru nu ne
permite nc s afirmm c msoar exact ceea ce n-am propus s msoare. Aceast
problem va fi rezolvat ulterior, prin studii de validare.
Aa cum concluziile studiilor statistice sunt mai sigure atunci cnd sunt efectuate
pe eantioane mai mari, acelai principiu se aplic i n cazul construciilor scalelor: cu ct
mai muli itemi cu att mai bine pentru consistena scalei.
Numrul itemilor necesari pentru a completa o scal care nu a atins valoarea
acceptabil a indicelui Cronbach alfa poate fi estimat cu ajutorul formulei SpearmanBrown:
k * (1 x )
x * (1 k )
unde:
x este valoarea curent a lui Cronbach alfa
k este nivelul dorit al lui Cronbach alfa
k este factorul de multiplicare a scalei pentru a se obine k
ntr-un mod similar, se poate estima valoarea lui Cronbach alfa (k) care ar fi
atins pornind de la un anumit nivel calculat al acestuia x i un anumit factor de
multiplicare al numrului de itemi (k):
k * x
1 ((k 1) * x )
Exemplu:
Avem o scal cu 20 de itemi i x=0.50
Ci itemi ar trebui adugai pentru a atinge un nivel de 0.70?
k * (1 x ) .70 * (1 .50)
2.33
x * (1 k ) .50 * (1 .70)
- 64 -
valabil pentru situaia n care noii itemi ar avea aceeai corelaie inter-itemi cu cei deja
existeni).
Pentru acelai caz, cu ct ar crete dac am aduga 30 de itemi:
k=(nr. itemi iniiali+nr. itemi noi)/nr. itemi noi=(20+30)/20=2.5
k * x
2.5 * .50
0.71
1 ((k 1) * x ) 1 ((2.5 1) * .50)
Desigur, se presupune c noii itemi adugai vor fi la fel de buni ca i cei deja
utilizai. De aceea este posibil ca rezultatul formulei s fie o estimare uor optimist dar
nu mai puin util.
Utilizarea improprie a analizei de itemi
Atunci cnd o scal este utilizat pentru a msura cunotine asupra unui anumit
subiect, pentru alt scop dect cel de selecie sau evaluare comparativ ntre indivizi,
utilizarea indicelui Cronbach alfa nu este adecvat. O valoare redus a acestuia nu poate
nsemna c itemii nu msoar un anumit tip consistent de cunotine (fapt incontestabil
din moment ce fac parte dintr-un univers de cunoatere bine definit) ci mai degrab c
subiecii au rspuns la ntmplare. Mai departe, n cazul n care rspunsurile la o anumit
ntrebare sunt corecte pentru cea mai mare parte a subiecilor, sau pentru toi, dei am fi
tentai s apreciem acest fapt ca o expresie pozitiv a corelaiei itemului cu scorul
global, avem de a face mai degrab cu un item prea uor, care nu este suficient de
discriminativ pentru a fi pstrat.
Chiar i n acest tip de situaii, totui, analiza de itemi poate fi folositoare ca
modalitate de identificare a itemilor greit formulai, a celor nerelevani sau, pur i
simplu, pentru a scoate n eviden erorile tipice pe care le fac subiecii la anumite
ntrebri.
- 65 -
- 66 -
n zona Define Dichotomy se alege Get from data, dac variabila este
dihotomic, sau Cut point, dac variabila este continu, prin fixarea unei
valori care mparte distribuia n dou categorii.
n zona Test proportion se introduce proporia primei categorii.
Butonul Options permite solicitarea statisticii descriptive pentru variabila
testat.
Rezultate
- 67 -
Testul semnelor
Utilizare
Testul semnelor este utilizat pentru a testa diferena dintre valori, utilizndu-se
semnul diferenei i nu valoarea acesteia, atunci cnd ambele valori sunt msurate pentru
aceiai subieci . Dac nu ar exista nici o diferen ntre valorile perechi, atunci numrul
diferenelor pozitive ar trebui s fie egal cu cel al diferenelor negative. Cu ct numrul
diferenelor de un anumit semn este mai mare comparativ cu cel al diferenelor de semn
opus, cu att crete posibilitatea ca diferena dintre variabile s fie statistic semnificativ.
Exemplu: ntr-un experiment cu privire la efectul motivrii asupra memorrii,
subiecilor li se cere s memoreze cuvinte dintr-o list, nainte si dup introducerea unui
factor motivant. Dat fiind faptul c numrul subiecilor este prea mic pentru asumarea
normalitii distribuiei de eantionare, se alege testul semnului, n locul testului t pentru
eantioane dependente.
Condiii
Variabilele vor fi de tip numeric, iar valorile exprimate n aceeai unitate de
msur, pentru a se putea face diferena lor.
Aranjarea datelor
Imaginea de mai jos conine variabilele inainte i dupa, care vor fi analizate.
Rezultate
- 69 -
Femei
20
30
Brbai
10
40
Aranjarea datelor
Datele pot fi incluse n Data Editor n dou moduri:
a. Sub forma unor nregistrri distincte pentru fiecare caz
Acest mod poate fi extrem de dezavantajos atunci cnd sunt multe cazuri sau cnd
exist deja o statistic global a fenomenului PTSD n raport cu sexul.
b. Sub forma unor nregistrri distincte pentru valorile caracteristicii de sex:
- 70 -
- 71 -
- 73 -
Procedura: Statstics-NonParametric-Tests-Chi-Square...
Rezultate
- 74 -
- 75 -
- 76 -
161.598 12.71
175 32
Decizia statistic se ia prin raportarea valorii calculate a lui z la valorile critice ale
acestuia de pe curba normal, pentru test unilateral sau bilateral.
n cazul nostru, pentru test bilateral cu alfa=0.05, z calculat (12.71) este mai mare
dect z critic (1.96), fapt care permite respingerea ipotezei de nul i confirmarea ipotezei
c studenii de la Universitate cred ntr-o msur semnificativ mai mare n fenomenele
paranormale dect studenii de la Politehnic.
- 77 -
- 78 -
Tabelul Ranks ofer informaii sintetice despre cele dou variabile: volumul
grupurilor, media rangurilor i suma rangurilor.
Tabelul Test Statistics include valorile testului Mann-Whitney pentru cele dou
variabile testate simultan, depresia imediat i remanent. Valorile de interes din tabel
sunt cele ale lui Z i nivelul de ncredere p. n cazul nostru, se observ depresia imediat
nu difer semnificativ n funcie de tipul de drog utilizat, n timp ce depresia remanent
- 79 -
este semnificativ diferit, mai mare la utilizatorii de Ecstasy dect la utilizatorii de alcool
(conform datelor din tabelul anterior).
Testul Wilcoxon pentru dou eantioane perechi
Utilizare
n exemplul de mai sus, psihologul a testat ntr-o prim faz semnificaia
diferenei dintre cele dou grupuri definite prin tipul de drog diferit (eantioane
independente). Una dintre problemele cercetrii este i aceea dac exist o diferen ntre
nivelul depresiei imediate i cel al depresiei remanente. Acest tip de analiz nu se poate
face dect pentru subiecii aparinnd aceluiai tip de drog utilizat.
Aranjarea datelor
Este identic cu cea prezentat pentru testul Mann-Whitney.
n acest caz, deoarece analiza trebuie efectuat separat pe grupurile de consum
Ecstasy/Alcool, exist dou soluii. Prima ar fi selectarea (cu Data-Select Cases) a
primului grup i efectuarea testului, apoi selectarea celui de-al doilea grup i efectuarea
testului. O soluie mai elegant este, ns, aceea de a declara mprirea bazei de date n
funcie de grupurile definite prin tipul de drog.
n acest scop se va utiliza procedura
Data-Split File...
n locul setrii implicite Analyze all cases, do not create groups, se bifeaz
opiunea Compare groups i se declar variabila ale crei valori vor servi drept criteriu de
mprire a bazei de date n grupuri de analiz separat (n cazul nostru, tipul de drog)
prin trecerea ei n zona Groups Based on:. Efectul acestei aciuni este acela c toate
prelucrrile care vor fi efectuate din acest moment se vor aplica, separat, pe fiecare grup
identificat prin valorile variabilei.
Operaiunea de mprire a bazei de date nu are semne vizibile, fapt care poate
face s fie uitat i, astfel, atunci cnd se revine la prelucrri care ar trebui s
implice toat baza de date rezultatele vor fi incorecte. De aceea, se va avea n
vedere revenirea la setarea Analyze all cases, do not create groups atunci
prelucrarea pe grupuri a bazei de date nu mai este becesar.
Procedura: Statistics-Non Parametric Tests-2 Related Samples...
Setarea procedurii n caseta Two-Related-Samples tests se face n doi timpi:
- 80 -
Se bifeaz opiunea pentru testul Wilkoxon (care este, de fapt, cea implicit)
Rezultate
Tabelul Test Statistics prezint valorile comparative ale depresiei pentru cele dou
grupuri. Aa cum se observ, diferena este semnificativ (p=0.007) n cazul
consumatorilor de Ecstasy i nesemnificativ (p=0.053), n cazul consumatorilor de
alcool. Concluzia general a studiului este aceea c Ecstasy, comparativ cu alcoolul, are
un efect depresant mai mare (testul Mann-Whitney) i mai accentuat cu trecerea timpului
(testul Wilcoxon).
- 81 -
Se definete domeniul
valorilor variabilei
independente, n cazul
nostru: minim 1, maxim 3.
- 82 -
Rezultate
Rezultatul testului, afiat n tabelul Test Statistics, se exprim printr-o valoare chiptrat (6.33) cu dou grade de libertate i p=0.042. Ca urmare, ipoteza de nul poate fi
respins. Datele confirm ipoteza c mediul familial (exprimat prin cele trei tipuri de
familie) i pune amprenta asupra expresivitii emoionale a copiilor de vrst
precolar.
- 83 -
Se seteaz opiunea Friedman iar variabilele testate sunt trecute n lista Test
Variables:
- 84 -
Rezultate
Primul tabel prezint media rangurilor pe nlimi (rangul 1 este atribuit valorii
celei mai mici). n al doilea tabel gsim valoarea testului Friedman exprimat n valori
chi-ptrat (8.40), avnd un nivel de semnificaie p=0.015. Acest rezultat permite
respingerea ipotezei de nul i confirm ipoteza c memoria cuvintelor este n legtur cu
nlimea (pe cele trei niveluri avute n vedere).
Coeficientul de corelaie pentru date ordinale (Spearman)
Utilizare
Testul de corelaie a rangurilor (Spearman) este echivalentul pentru date
ordinale testului de corelaie Pearson. Rezultatul su variaz pe aceeai plaj de valori (1/+1) i se interpreteaz n mod similar cu rezultatul testului Pearson.
Exemplu: S lum n considerare studiul aceluiai grup de alpiniti, care au
efectuat, la aceleai nlimi descrise mai sus, i un test de vitez de decizie (msurat n
zecimi de secund). Problema cercetrii este dac ntre performana de memorare i ce de
timp de decizie este o relaie (variaie concomitent) semnificativ.
Aranjarea datelor
]
Alturi de variabilele memorie pentru cele trei nlimi, avem acum i
variabilele pentru timpul de decizie.
Procedura: Statistics-Corelation-Bivariate
- 85 -
- 86 -
- 87 -