Sunteți pe pagina 1din 79

SCOPUL UNITII DE CURS

ofer noiuni, explicaii i aplicaii pentru a nelege i opera eficient cu programul SPSS 10.0 n
scopul prelucrrii statistice a datelor.


OBIECTIVE OPERAIONALE
n urma studierii acestei uniti de curs, studenii:
vor putea s defineasc variabilele i s conceap o baz de date adecvat;
vor redefini i transforma variabile;
vor prelucra datele statistice la nivel descriptiv;
vor realiza analiza corelaional a datelor i vor interpreta rezultatele obinute;
vor folosi testul t pentru compararea unui eantion cu o populaie i a dou eantioane (perechi sau
independente) i vor interpreta rezultatele obinute;
vor utiliza analiza de varian pentru analiza efectului unui singur factor i vor interpreta rezultatele
obinute;
vor utiliza analiza de varian pentru analiza efectelor de interaciune;
vor utiliza metode non-parametrice de analiz a datelor.


EVALUARE
40% din nota final examen practic care presupune prelucrarea i interpretarea datelor;
60% din nota final evalurile de pe parcursul seminariilor, care vor presupune prelucrri i analize
statistice ale datelor.





OBSERVAIE !!!
Cursul nu epuizeaz opiunile programului SPSS i nu suplinete lipsa informaiilor statistice teoretice.
ANALIZA COMPUTERIZAT A DATELOR


251




I. FAMILIARIZAREA CU PROGRAMUL SPSS 10.0

I.1. TIPURI DE VARIABILE. DIFERENA DINTRE VARIABILE, VALORI I SCORURI

Variabile sunt definite ca proprieti ale fenomenelor, obiectelor sau proceselor, care pot lua
diferite valori. Exist mai multe criterii n funcie de care se pot clasifica variabilele: dup natura msurii
variabilele pot fi: cantitative (variaz cantitativ, cum ar fi de exemplu greutatea sau vrsta subiecilor)
sau calitative (sunt cele care variaz calitativ, cum ar fi genul sau etnia subiecilor); dup felul variaiei,
variabilele pot fi: continui (teoretic pot lua orice valoarea, ntre dou valori ale variabilei putnd s apar
o a treia valoare; vrsta subiecilor este un exemplu de variabil continu) sau discrete (pot avea numai
anumite valori, ntre care nu mai apar altele; religia, tipurile temperamentale sunt exemple de variabile
discontinui); dup scopul folosirii lor n studii experimentale: independente (sunt variabilele manipulate
de experimentator i care se presupune c influeneaz variabila dependent) sau dependente
(reprezint rspunsurile subiecilor).
O variabil poate lua diferite valori. Valoarea reprezint o msur calitativ sau cantitativ a
unui fenomen. Spre exemplu, pentru variabila nota colar valorile acesteia sunt toate notele de la 1 la
10. Pentru variabila zilele sptmnii valorile sunt toate cele apte zile ale sptmnii. n psihologie se
face distincia ntre valori i scoruri. Scorul este valoarea obinut de o persoan, fenomen sau obiect
atunci cnd ne referim la o anume variabil. Spre exemplu, nota pe care o obine un elev la o materie
(s zicem 7) reprezint scorul subiectului la variabila nota colar.


I.2. PREZENTAREA APLICAIEI SPSS

SPSS (n traducere Pachet statistic pentru tiinele sociale) este numele unui pachet de
programe care ajut la analiza datelor obinute n cercetrile din domeniul tiinelor sociale.
Deschiderea programului se poate face cu ajutorul mouse-ului, cu dublu-click asupra
pictogramei programului de pe desktop. Aplicaia mai poate fi deschis de la butonul
START/PROGRAME, opiunea SPSS FOR WINDOWS, ca n imaginea de mai jos:


Oricare ar fi metoda de deschidere a programului, pe ecran va aprea urmtoarea fereastr:
LOREDANA GHERASIM

252

Prima bar din partea de sus a ferestrei ofer informaii despre denumirea aplicaiei i numele
fiierului cu care se lucreaz. Urmeaz bara de meniuri a programului i cea cu butoane.
Foia cu date este organizat tabelar. ntotdeauna coloanele tabelului reprezint variabilele
studiului, n timp ce liniile, rndurile numerotate ale tabelului reprezint subiecii cercetrii. n partea de
jos a ferestrei sunt dou opiuni: DATA VIEW i VARIABLE VIEW. Putem vizualiza datele brute ale
subiecilor, dac este activ opiunea DATA VIEW sau putem vizualiza descrierea variabilelor introduse
n baza de date, dac este
activat opiunea
VARIABLE VIEW. De obicei,
atunci cnd deschidem
programul, este activ
opiunea DATA VIEW, cum se
poate observa i n imaginea
de mai sus. Printr-un simplu
click stnga pe opiunea
VARIABLE VIEW, pe ecran
apare un alt tabel care permite
definirea variabilelor din baza
de date:

Din meniul FILE putem alege comanda deschidere a unei
noi baze de date (opiunea NEW DATA) sau a unei noi foi de
rezultate (NEW OUTPUT):
Acest program prezint rezultatele prelucrrilor
statistice ntr-o pagin separat, numit OUTPUT. Comenzile
care sunt colorate n gri sunt comenzi inactive pentru c baza de
date nu conine, deocamdat, nici o informaie.
Din acest meniu putem deschide, folosind opiunea
OPEN, o baz de date care a fost creat anterior (DATA) sau un
fiier cu rezultatele prelucrrilor statistice anteriore (OUTPUT).

ANALIZA COMPUTERIZAT A DATELOR


253
Comanda SAVE permite salvarea obinuit a fiierului cu
date sau cu rezultate, comanda SAVE AS permite salvarea unui
fiier modificndu-i numele. Opiunile RECENTLY USED DATA i
RECENTLY USED FILES deschid bazele de date i foile cu
rezultate recent create sau utilizate n programul SPSS.
Din meniul EDIT, comenzile COPY, CUT i PASTE sunt
folosite pentru copierea sau mutarea datelor din celule, rnduri sau
coloane. Copierea sau mutarea datelor presupune selectarea
datelor, activarea comenzii COPY/CUT din meniul EDIT, plasarea
cursorului n noua locaie i apoi activarea comenzii PASTE.

I.3. DESCHIDEREA UNEI BAZE DE DATE

Pentru deschiderea unei baze de date create anterior se activeaz meniul FILE/OPEN opiunea
DATA. Dup activarea comenzii
pe ecran apare o caset de
dialog care permite selectarea
directorului i respectiv fiierului
care conine baza de date. Vom
deschide fiierul opinii.sav (n
aplicaia SPSS, fiierele cu
baze de date au ntotdeauna
extensia sav) care se gsete la
adresa C:\MY DOCUMENTS\EXEMPLE
SPSS. n momentul ncrcrii
bazei de date pe ecran va
aprea urmtoarea imagine:
Valorile din baza de
date reprezint rspunsurile brute ale subiecilor. Pe coloane sunt definite variabilele. n aceast baz
de date avem pe coloan variabile
(ca de exemplu, gr_mult, prezent,
viitor, directie, guv, parlam), valorile
numerice din fiecare coloan
reprezentnd scorurile subiecilor la
aceste variabile. Rndurile conin
rspunsurile subiecilor la diferii
itemi. De exemplu, subiectul de pe
rndul 9 are valoare 3 la variabila
gr_mult, valoarea 3 la variabila
prezent, 4 la variabila viitor etc.
Pentru a vedea ce nseamn
fiecare dintre aceste variabile trebuie
activat opiunea VARIABLE VIEW:

LOREDANA GHERASIM

254
Variabilele sunt aezate pe rnduri, coloanele reprezentnd diferite caracteristici ale
variabilelor. De exemplu, variabila gr_mult este o variabil de tip numeric, cu 20 de caractere la partea
ntreaga i 0 zecimale, reprezentnd itemul Ct de mulumit suntei n general de felul n care trii?.

I.4. CREAREA UNEI NOI BAZE DE DATE

Pentru a crea o nou baz de date trebuie activat opiunea DATA VIEW. Vom crea o baza de
date care s conin rezultatele la anxietate obinute de un numr de subieci, nainte i dup intervenia
terapeutic (anxietatea a fost msurat cu ajutorul unei scale de anxietate). La studiu au participat
subieci de gen feminin i masculin. Baza de date va conine patru variabile: numrul subiecilor (nrsub),
nivelul anxietii subiecilor naintea terapiei (ANX1) i nivelul
anxietii subiecilor dup terapie (ANX2) i genul subiecilor
(1-subieci de gen masculin i 2-subieci de gen feminin).
Pentru introducerea datelor se plaseaz cursorul n
celul i se introduce valoarea cu ajutorul tastelor. Spre
exemplificare, vom introduce prima valoare (1) a primei
variabile. Dup introducerea primei valori automat programul
a denumit prima variabil (var0001), iar indicativul primei linii
devine activ.

La fel se vor introduce i celelalte valori ale primei variabile. Pentru a utiliza cu uurin datele
este indicat definirea sau redenumirea variabilelor cu care lucrm.
Definirea variabilelor presupune activarea cmpului VARIABLE VIEW, prin executarea unui
dublu click pe numele variabilei (n cazul nostru var0001) sau prin activarea butonului VARIABLE VIEW
din partea de jos a cmpului. Rezultatul va fi urmtorul:


Numele variabilei poate s cuprind maxim opt caractere, fr spaiu sau semne de
punctuaie. Pentru a defini o variabil, trebuie plasat cursorul n celula n care este trecut numele
(NAME) generic al variabilei (var0001), apoi se introduce numele variabilei NRSUB folosind tastatura.
Opiunea TYPE permite specificarea tipului de date. Aceast opiune poate fi activat cu
ajutorul mouse-ului cu un click stnga pe butonul gri din celula corespunztoare variabilei.
ANALIZA COMPUTERIZAT A DATELOR


255

Tipul NUMERIC permite introducerea valorilor cu sau fr zecimale. Tipurile COMMA i DOT
permit introducerea valorilor cu orice numr de zecimale (mai mare de 16), reinnd ntreaga valoare.
Tipul SCIENTIFIC NOTATION transform logaritmic valorile introduse, DATE permite folosirea spaiilor,
punctelor, virgulelor, a barelor de separarea pentru a delimita zilele, lunile i anii, respectiv orele i
minutele. Tipul DOLLAR insereaz n faa valorilor simbolul dolarului, iar CUSTOM CURRENCY permite
introducerea de valorilor pozitive dar i a celor negative, cu sau fr separator pentru mii. Ultima opiune
STRING permite introducerea variabilelor alfanumerice.
Este posibil alegerea numrului de cifre pentru partea ntreag (WIDTH) i a numrului de
zecimale (DECIMAL PLACES). Dei sunt mai multe tipuri de variabile, n psihologie se utilizeaz dou
tipuri de variabile, NUMERIC i STRING (foarte rar). Automat la crearea unei noi baze de date, apare
selectat tipul NUMERIC, presupunndu-se c noile variabile vor fi numerice. Opiunea TYPE este de
obicei folosit pentru modifica acest tip de date.
Caracteristica LABELS permite definirea detaliat a variabilei (pot fi folosite pn la maxim 256
caractere, inclusiv spaiul). Definirea detaliat a variabilei apare n pagina de rezultate.
VALUE LABEL permite descrierea valorile pe care le poate lua o variabil. Opiunea este
folosit pentru variabile care folosesc coduri numerice pentru a reprezenta categorii (de exemplu, se pot
folosi valorile 1 i 2 pentru a codifica genul feminin i masculin).
MISSING VALUES permite stabilirea valorilor care nu vor fi luate n seam la prelucrarea
datelor.
COLUMN permite specificarea numrului de caractere pentru o coloan, afectnd vizualizarea
datelor.
ALIGNMENT permite modificarea modului n care sunt prezentate datele pe ecran, aliniate la
stnga, dreapta sau central.
n exemplu nostru, vom defini numele variabilei NRSUB i vom detalia eticheta la opiunea
LABEL ca n imaginea de mai jos:


Vom introduce valorile i vom defini i urmtoarele variabile, ANX1, ANX2 i Gen. Variabila Gen
este de tip categorial, n funcie de aceast caracteristic subiecii fiind mprii n dou categorii
distincte, femei i brbai. Din acest motiv trebuie precizat semnificaia valorilor variabilei. Acest lucru
presupune atribuirea de valori i etichete celor dou grupuri de subieci. Astfel, subiecii de sex masculin
i vom codifica cu valoarea 1, iar pe cei de gen feminin cu valoarea 2. n acest scop vom activa opiunea
VALUE:
LOREDANA GHERASIM

256

Se trece valoarea n cmpul VALUE i numele grupului sau categoriei n cmpul VALUE
LABEL, dup care se apas butonul ADD. Astfel, vom scrie 1 n cmpul VALUE i subieci de gen
masculin n cmpul VALUE LABEL i activm butonul ADD, apoi vom scrie 2 n cmpul VALUE i
subieci de gen feminin n cmpul VALUE LABEL i activm butonul ADD.


Se activeaz butonul OK pentru a salva modificrile i nchide caseta de dialog.

Aceast opiune se folosete numai pentru variabilele categoriale, care mpart subiecii n
grupuri distincte.

Salvarea fiierelor se face fie acionnd butonul SAVE care se gsete n bara de instrumente,
fie din meniul FILE se alege opiunea SAVE. Reamintim c trebuie ales mai nti directorul n care
vream s salvm fiierul si apoi scriem numele fiierului. Vom salva fiierul cu numele Baza1.sav n
subdirectorul EXEMPLE SPSS care se gsete n directorul MY DOCUMENTS.
ANALIZA COMPUTERIZAT A DATELOR


257




II. ELEMENTE DE STATISTIC DESCRIPTIV

II.1. ANALIZA FRECVENELOR

Tabelele de frecven ajut la descrierea unui grup de scoruri, fiind cele mai simple procedee
ale statisticii descriptive, care permit nelegerea tendinei unui grup de scoruri. Tabelele de frecvena
grupeaz scorurile subiecilor, informaia devenind, astfel, mai comprehensibil. Histogramele,
reprezentri grafice ale tabelelor de frecven permit o mai bun nelegere a tendinei grupului de
rezultate. Acestea presupun transformarea intervalelor de frecven n bare, nlimea barelor
corespunznd frecvenei fiecrui interval de frecven din tabelul de frecven. Poligoanele de frecven
sunt o alt modalitate de reprezentare grafic a datelor din tabelele de frecven. Acestea se obin, prin
unirea mijloacelor prilor superioare ale barelor histogramelor.
Tabelul de frecven, histograma i poligonul de frecven descriu o distribuie de frecven,
prezentnd modul n care se distribuie sau se mprtie cazurile sau frecvenele. Modalitatea, nclinarea
i turtirea sunt indicatori care descriu forma distribuie scorurilor. Modalitatea indic cte vrfuri are o
distribuie, cu alte cuvinte, arat valorile n jurul crora se grupeaz rezultatele subiecilor. Din aceast
perspectiv, distribuiile pot fi unimodale (au un singur vrf), bimodale (au dou vrfuri) sau multimodale
(au mai multe vrfuri). nclinarea arat dac n distribuie apar mai multe valori mari sau mai multe valori
mici. Cele mai multe aspecte msurate n psihologie prezint un numr aproximativ egal de cazuri de o
parte i de alta a mijlocului, distribuiile fiind aproximativ simetrice (nu prezint tendin de nclinare). O
distribuie este nclinat atunci cnd are o extrem (o parte) mai mprtiat i mai lung. Atunci cnd
curba este nclinat spre dreapta, distribuia este nclinat pozitiv, iar cnd curba este nclinat spre
stnga, distribuia este nclinat negativ. Spre exemplu, notele colare au o distribuie nclinat spre
dreapta, adic elevii au tendina de a obine mai multe note mari. Turtirea unei distribuii se raporteaz
la curba normal. Fa de curba normal o distribuie poate fi mai turtit (scorurile din cadrul ei variaz
foarte mult de la medie) sau mai ascuit (scorurile variaz foarte puin de la medie).

Analiza de frecven cu ajutorul programului SPSS
Opiunea FREQUENCIES permite realizarea tabelului de frecven i a distribuiei de frecven
a rezultatelor. Aceasta se gsete la meniul ANALYZE
DESCRIPTIVE STATIASTICS:


LOREDANA GHERASIM

258
Dup activarea opiunii pe ecran apare urmtoarea caset de dialog:
n cmpul din stnga al casetei
FREQUENCIES sunt afiate toate variabilele
din baza de date, n ordinea introducerii lor n
baza de date, mpreun cu denumirea extins
a variabilei. Cmpul din dreapta reprezint
cmpul de analiz. Astfel, analiza statistic se
realizeaz doar pentru variabilele trecute n
acest cmp. Trecerea variabilelor n cmpul de
analiz se realizeaz cu ajutorul butonului cu
sgeat care se gsete ntre cmpuri. Se
selecteaz din cmpul din stnga variabila pe care vrem s analizm apoi se activeaz butonul de
trecere. Acest mod de organizare n dou cmpuri apare la aproape toate opiunile de prelucrare a
datelor.
Bifarea opiunii DISPLAY FREQUECY TABLES are ca efect afiarea n foaia de rezultate a
tabelul de frecven. Opiunea STATISTICS deschide o fereastr cu opiuni de prelucrare statistic,
butonul CHARTS permite afiarea histogramei de frecven. Opiunea FORMAT permite modificarea
formei de prezentare a datelor n foia cu
rezultate (OUTPUT).
Pentru exemplul nostru, dorim
realizarea tabelului de frecven i
histogramei pentru variabila nivelul
anxietii nainte de terapie (ANX1). Se
selecteaz variabila ANX1 din cmpul din
stnga i se activeaz butonul de trecere:
Pentru ca n foaia de rezultate s
apar tabelul de frecven se selecteaz
opiunea DISPLAY FREQUECY TABLES. Pentru afiarea histogramei de frecven se activeaz
butonul CHARTS:

Opiunea CHART TYPE permite alegerea unui tip de grafic (cu bare, plcint sau histogram).
CHART VALUES permite alegerea tipului de valori afiate n grafic (Frecvene sau Procentaje).
Pentru exemplul nostru se selecteaz opiunea HISTOGRAMS, se bifeaz afiarea curbei
normale (WITH NORMAL CURVE), apoi se activeaz butonul CONTINUE.
Opiunea FORMAT permite modificarea formei OUTPUT-ului. Activarea acestui buton are ca
efect apariia urmtoarei casete de dialog:
ANALIZA COMPUTERIZAT A DATELOR


259

Cmpul din stnga al ferestrei conine opiuni de aranjare a rezultatelor (n ordine
descresctoare sau cresctoare a valorilor sau cantitilor), iar cel din dreapta conine opiuni de
prezentare comparativ a rezultatelor i de organizare separat a foii de rezultate, pentru fiecare
variabil. Pentru exemplu nostru, vom pstra opiunile selectate automat.
Dup selectarea opiunilor de realizare a tabelului de frecven i histogramei, se activeaz
butonul OK al casetei FREQUENCIES. Pe ecran apare o fereastra cu rezultate, numit OUTPUT:

Fereastra OUPUT este organizat n dou cmpuri, cel din stnga, afieaz structura sau
cuprinsul OUPUT-ului, iar cel din dreapta arat coninutul foii cu rezultate. Rezultatele sunt organizate n
dou tabele. n primul tabel se precizeaz numrul de subieci i numrul de rspunsuri. Pentru
exemplul nostru, avem 20 de subieci care au rspuns la chestionar (nu lipsete nici o valoare).
Al doilea tabel este organizat n cinci coloane. Coloana VALID prezint valorile variabilei,
prezentate n ordine cresctoare (fr a ine seama de cazurile lips). Coloana FREQUENCY prezint
frecvena, adic numrul de subieci care obin o anumit valoare.
Coloana PERCENT transform frecvena obinut pentru fiecare valoare n procentaj innd
cont de numrul total de subieci luai n calcul, indiferent dac acetia au sau nu scoruri la aceast
variabil. Spre exemplu, doi subieci au obinut scorul 103, ceea ce reprezint 10% din totalul numrului
de rspunsuri obinute. VALID PERCENT prezint procentajul lund n calcul doar subiecii care au
rspuns la aceast variabil. n cazul nostru coloanele PERCENT i VALID PERCENT sunt identice
deoarece toi subiecii au scoruri la aceast variabil. Dac unii subieci nu ar fi rspuns la chestionarul
de anxietate, atunci cele dou coloane ar fi coninut valori diferite.
Coloana CUMULATIVE PERCENT prezint procentajul cumulat, de la cel mai mic scor la pn
la cel mai mare. De exemplu, 60% dintre subieci au note mai mici sau egale cu 106.
Derulnd pagina cu rezultate sau selectnd HISTOGRAM n cmpul din stnga, putem
vizualiza reprezentarea grafic a frecvenei scorurilor:
LOREDANA GHERASIM

260


Histograma de frecven se mai poate obine folosind meniul GRAPHS HISTOGRAM.
Activarea opiunii duce la apariia urmtoarei casete de dialog:

Elementele principale ale ferestrei sunt:
1. cmpul n care sunt prezentate toate variabilele din baza de date
2. cmpul n care se introduce variabila pentru care dorim s realizm histograma de frecven
3. selectarea acestei opiuni va duce la afiarea curbei normal de distribuie a rezultatelor.
Pentru exemplificare introducem variabila ANX1, cu ajutorul butonului cu sgeat, n cmpul
VARIABLE i bifm opiunea DISPLAY NORMAL CURVE. Se obine aceeai reprezentare grafic ca i
n cazul folosirii butonului CHART al ferestrei FREQUENCIES.
Vizualizarea ferestrei OUTPUT sau DATE (baza1.sav) se poate face
folosind meniul WINDOW, marcnd opiunea dorit (baza de date sau foaia
de rezultate):


II.2. IDENTIFICAREA TENDINEI CENTRALE I A VARIABILITII SCORURILOR

Metodele descriptive pentru identificarea tendinei centrale i de mprtiere indic tendina
central a unui grup de scoruri, folosind ca indicatori media, mediana i modul i tendina de mprtiere
a grupului de scoruri, folosind ca indicatori variana i abaterea standard.
Media aritmetic descrie tendina central ntr-un grup de rezultate, arat valoarea tipic,
reprezentativ a unui grup de scoruri. Media este punctul fa de care scorurile sunt egal deprtate,
deoarece abaterile de la medie ntr-o direcie (abaterile scorurilor mici de la medie) sunt egale cu
1
2
3
ANALIZA COMPUTERIZAT A DATELOR


261
abaterile n cealalt direcie (abaterile scorurilor mari de la medie). Mediana mparte distribuia n dou
pri egale, jumtate dintre scorurile distribuie avnd valori mai mici ca mediana, iar cealalt jumtate
valori mai mari. Modul reprezint valoarea cu frecvena cea mai mare. Este indicatorul care este cel mai
puin afectat de schimbrile structurii (modificri ale numrului de scoruri sau mrimii scorurilor
distribuiei). Mediana este i ea destul de puin afectat de modificrile structurii distribuiei. Media, ns,
este cea mai sensibil la modificarea numrului de scoruri sau mrimii scorurilor, fiind indicatorul cel
mai descriptiv (deoarece indic orice modificare survenit n distribuie). Se recomand utilizarea mediei
n distribuiile simetrice i unimodale. Mediana i modulul, care sunt mai stabile sunt recomandate
pentru descrierea distribuiilor asimetrice i multimodale. Cu toate acestea, media aritmetic rmne
metoda cel mai des utilizat pentru descrierea tendinei grupului de scoruri, acest indicator intrnd n
componena multor metodele statistice. Exist ns metode statistice (cum a fi testele neparametrice) n
care se utilizeaz doar mediana i modul.
Cunoaterea acestor indicatori nu este suficient pentru a descrie complet o distribuie. Trebuie
s cunoatem gradul de variabilitate a scorurilor noastre. Mai precis, trebuie s tim ct de mult (sau cu
ct) se mprtie scorurile n jurul valorii medii.
Variana (SD
2
=( (X-M)
2
/N) unei distribuii arat ct de mprtiate sunt scorurile n jurul
valorii centrale, indic gradul de variabilitate a unui grup de rezultate. Este o msur a gradului de
variabilitate a scorurilor i arat ct de mult se abat scorurile de la tendina central. Cu ct este mai
mare aceast valoare, cu att mai mult se mprtie scorurile n jurul valorii centrale. Pentru a cunoate
exact cu ct variaz scorurile n medie este nevoie s calculm deviaia standard. Abaterea standard ne
arat cu ct se mprtie scorurile n jurul valorii centrale i se msoar n aceleai uniti de msur ca
i scorurile iniial. Abaterea standard este rdcina ptrat a varianei (SD =
2
SD ).
n intervalul cuprins ntre medie i o abatere standard la stnga i dreapta mediei gsim
aproximativ 2/3 din totalul scorurilor. Aceste rezultate sunt considerate tipice sau normale pentru o
distribuie. Ilustrm grafic acest lucru:





Scorurile care sunt mai mari dect media cu o abatere standard sunt considerare scoruri mari
iar cele mai mici dect media cu mai mult de o abatere standard sunt considerate ca fiind scoruri slabe.

Calculul tendinei centrale i a variabilitii folosind SPSS
Meniul din SPSS care permite calculul indicatorilor tendinei centrale i ai mprtierii se
gsete la ANALYZE DESCRIPTIVE STATISTICS FREQUENCIES. Pentru analiz vom folosi baza
de date realizat anterior, Baza1.sav.
Vom calcula parametrii tendinei centrale i ai variabilitii pentru variabila ANX1 (nivelul
anxietii naintea terapiei). Se trece variabila n cmpul din dreapta apoi se activeaz butonul
STATISTICS. Dup cum se poate vede i n imaginea de mai jos, caset de dialog care se deschide
cuprinde patru cmpuri cu opiuni:
m m-SD m+SD
scoruri medii, tipice, normale
scoruri mici scoruri mari
LOREDANA GHERASIM

262

Cmpul PERCENTILE VALUES conine opiuni care permit calculul valorilor corespunztoare
mpririi subiecilor n grupuri egale, prin afiarea valorilor care delimiteaz aceste grupuri. Aceast
opiune permite calculul cuartilelor (QUARTILES) sau altor cuartile (de exemplu CUT POINTS FOR 10
EQUAL GROUPS) sau centile (PERCENTILE).
Opiunile din cmpul DISPERSION permit calcularea diferiilor parametri referitori la dispersia
(mprtierea) scorurilor n jurul valorii centrale: abatere standard (STD. DEVIATION), varian
(VARIANCE), amplitudine (RANGE), valori minime (MINIMUM) i maxime (MAXIMUM) i eroare
standard (S.E. MEAN care reprezint abaterea standard a distribuii tuturor mediilor posibile calculate
pentru eantioane aleatoare repetate).
CENTRAL TENDENCY conine opiunile folosite pentru calculul indicatorilor tendinei centrale
ale distribuiei: media (MEAN), mediana (MEDIAN), mod (MODE) i suma valorilor seriei (SUM).
Cmpul DISTRIBUTION ofer posibilitatea aflrii indicatorilor de turtire (KURTOSIS)i nclinare
ai unei distribuii n comparaie cu cea normal (SKEWNESS).
Pentru exemplu nostru ne intereseaz calculul parametrilor tendinei centrale ai distribuiei i de
mprtiere. n consecin se bifeaz (cu un simplu click stnga al mouse-ului) opiunile MEAN,
MEDIAN, MODE din cmpul CENTRAL TENDENCY i opiunile STD DEVIATION i VARIANCE din
cmpul DISPERSION:

Activm butonul CONTINUE i apoi cel OK al casetei FREQUENCIES. Valorile indicatorilor
sunt grupate n tabelul Statistics:
ANALIZA COMPUTERIZAT A DATELOR


263

Astfel, M=107,90, Med=105,5, Mod=104, ceea ce nsemn c distribuia este unimodal (apare
o singur valoare la mod) i uor nclinat spre dreapta spre valorile mai mari ale variabilei (valoarea
mediei este mai mare dect a medianei). Reprezentarea grafic indic apariia unui singur vrf
(distribuie unimodal) i o alungire i mprtiere a extremei drepte a distribuiei (distribuie nclinat
spre dreapta).

La fel se calculeaz indicatorii tendinei centrale i de mprtiere pentru variabila ANX2 (nivelul
anxietii subiecilor dup terapie). Rezultatele obinute sunt urmtoarele:

Astfel, M=107,95, Med=109,5, Mod=102, Mod=110 (a doua valoare a modul se extrage din
tabelul de frecven). Distribuia scorurilor este bimodal (apar dou valori cu frecvena cea mai mare)
i nclinat spre valorile mici ale variabilei (media este mai mic dect mediana). Distribuia scorurilor
subiecilor la aceast variabil indic aceeai form.
LOREDANA GHERASIM

264

Comparnd reprezentrile histogramele de frecven pentru variabilele ANX1 i ANX2, putem
analiza variabilitatea rezultatelor la cele dou variabile. Astfel, distribuia scorurilor pentru prima
variabil este mai ascuit, valorile fiind mai grupate n jurul medie (i variana i abaterea standard au
valori mai mici). La variabila ANX2 se constat o mai mare variabilitate a rezultatelor, distribuia fiind
mai turtit (n acest caz variana i abaterea standard au valori mai mari).

II.3. SCORURILE Z
Nota Z indic deviaia unui scor (x) de la medie (m) exprimat n deviaii standard. Nota
standard Z arat cu cte deviaii standard se abate un scor de la medie (Z=(X-M)/SD). Distribuia n
note Z este o distribuie ideal n care media are ntotdeauna valoarea 0, iar abaterea standard valoarea
1.
Schema de mai jos prezint notele standard Z corespunztoare mediei i limitelor de variaie
maxim i minim. Mediei i corespunde ntotdeauna mereu scorul standard 0, limitei minime de variaie
tipic i corespunde scorul standard -1, iar limitei maxime de variaie normal i corespunde nota
standard +1.




Aceasta distribuie ne permite s stabilim cum este scorul x n raport cu media (care este 0) i
abaterea standard (care are valoarea 1). Trebuie inut seama de o serie de reguli. Astfel, un scor x
raportat la distribuia Z este considerat mic, dac scorul su Z are valoare mai mic dect 1; un scor
x este considerat mediu dac scorul su Z este cuprins n intervalul [1, +1]; un scor x este considerat
mare raportat la distribuia Z, dac scorul su Z va fi mai mare dect +1.
Scorurile Z ndeplinesc o serie de funcii. Permit compararea unui scor cu o distribuie la care
cunoatem parametrii (media i deviaia standard), astfel, ne ajut s precizm dac un scor este mic,
mediu sau mare. De asemenea, notele Z arat de cte ori acel scor este mai mare sau mai mic dect
media (innd cont de variabilitate). Spre exemplu, dac scorurile la un test de inteligen ntr-o
populaia sunt descrise de media m=100 i deviaia standard SD=15, o persoan cu scorul brut 130
este de dou ori mai detept ca media celorlali, deoarece acestui scor i corespunde un scor Z de +2
(ceea ce nseamn c scorul este mai mare ca media cu dou deviaii standard). O alt funcie a notelor
z este aceea c permit compararea scorurilor obinute de aceeai persoan la probe diferite, ntruct
notele Z arat raporturi i sunt adimensionale (nu depind de ceea ce msurm).
m m-SD m+SD
scoruri medii, tipice normale
x
Z
0 +1
-1
scorurimari scorurimici
ANALIZA COMPUTERIZAT A DATELOR


265
Calculul notelor Z folosind SPSS
Comanda DESCRIPTIVES care se gsete n meniul ANALYZE DESCRIPTIVE
STATISTICS, permite calculul notelor Z cu ajutorul SPSS. Vom folosi baza de date creat anterior
(Baza1.sav).

Activarea comenzii duce la apariia pe ecran a casetei de dialog urmtoare:

Prezentm principalele elemente ale ferestrei DESCRIPTIVES:
1. cmpul n care sunt prezentate variabilele din baza de date
2. cmpul n care se introduc variabilele care vor fi analizate
3. opiunea SAVE STANDARDIZED VALUES AS VARIABLES permite salvarea n baza de date
a scorurilor standard sub forma unei noi variabile.
4. cuprinde opiuni de calcul ai parametrilor distribuiei.
Pentru exemplificare, vom calcula notele Z pentru variabila ANX1. Se bifeaz opiunea SAVE
STANDARDIZED VALUES AS VARIABLES. Se activeaz butonul OPTIONS, care deschide
urmtoarea fereastr:

Automat sunt selectate de computer opiunile de calcul al mediei, abaterii standard i al valorii
minime i maxime. Vom activa butonul CONTINUE i apoi butonul OK al ferestrei pentru a putea face
1
3
2
4
LOREDANA GHERASIM

266
analiza statistic. Rezultatele obinute n urma comenzii DESCRIPTIVES sunt mai sumare i prezentate
ntr-un singur tabel.

Vom vizualiza baza de date pentru a vedea dac apare noua variabil care conine rezultatele
subiecilor transformate n note Z.

Se observ apariia unei noi variabile, pe ultima coloan, cu numele ZANX1.
Putem analiza rezultatele obinute. Se constat c cel mai mare scor z este 2,6 care
corespunde unui scor standard 124 obinut de subiectul 15, iar cea mai mic valoare la anxietate a
obinut-o subiectul 8, care are un scor z0,98 pentru o valoare brut de 102. Scorul primului subiect
este atipic, nivelul anxietii acestuia fiind de 2 ori i jumtate mai mare dect media, ceea ce semnific
faptul c subiectul are un nivel ridicat al anxietii raportat la ceilali subieci. Subiectul al doilea are un
nivel normal al anxietii, rezultatul fiind aproape cu o unitate mai mic dect media, dar plasndu-se n
limita (1 - +1).


II.4. COEFICIENTUL DE CORELAIE PEARSON

Notele Z fac posibil analiza legturii dintre dou variabile. De exemplu, putem analiza legtura
dintre nivelul stresului unui manager i numrul de subordonai. Prin transformarea notelor brute
obinute de subieci la cele dou variabile putem s identificm dac exista sau nu o legtur ntre
aceste dou variabile.
Corelaia este o metod statistic descriptiv, ntruct ea descrie ce se petrece ntr-un grup de
rezultate (r=( N Z Z / ) 2 * 1 ( ). Corelaia indic existena unei legturi ntre variabile, legtur care
poate fi pozitiv (cnd scorurile slabe la prima variabil se asociaz cu scoruri slabe la a doua variabil,
scorurile medii la prima variabil se asociaz cu scoruri medii la a doua variabil i scorurile mari la
ANALIZA COMPUTERIZAT A DATELOR


267
prima variabil se asociaz cu scoruri mari la a doua variabil), negativ (cnd scorurile slabe la prima
variabil se asociaz cu scoruri mari la a doua variabil, scorurile medii la prima variabil se asociaz
cu scoruri medii la a doua variabil i scorurile mari la prima variabil se asociaz cu scoruri mici la a
doua variabil). Bineneles c ntre variabile poate s nu apar nici o legtur.
Coeficientul de corelaie (r) indic gradul n care apare paternul unei relaii ntre cele dou
variabile. Acest coeficient poate lua valori de la -1 la +1, corelaia pozitiv poate lua valori de la 0 la 1,
iar corelaia negativ poate lua valori la de -1 la 0.
Analiza corelaiei dintre dou variabile nu permite stabilirea relaiei de cauzalitate ntre aceste
variabile. Exist trei modaliti de interpretare a unui coeficient de corelaie obinut ntre dou variabile
(x i y): fie x poate fi cauz pentru y, fie y poate fi cauz pentru x, fie a aprut a o treia variabil care a
determinat apariia simultan a celor doua variabile.

Pragul de semnificaie (p)
n psihologie este necesar generalizarea concluziile studiilor. Astfel, dup analiza rezultatelor
corelaiei ne intereseaz s vedem dac legtura gsit (la un grup de oameni) poate fi extins la
ntreaga populaie. Mai precis, ne intereseaz s tim n ce msur rezultatele se datoreaz ntmplrii.
Pragul de semnificaie, p, indic n ce msur ne nelm atunci cnd afirmm ceva. n cazul corelaiei,
pragul de semnificaie, indic dac exist o legtur ntre dou sau mai multe variabile.
n cercetarea tiinific se lucreaz de obicei cu dou praguri de semnificaie, corespunztoare
procentajului de eroare: pragul de 0,01 (1% eroare) i pragul de 0,05 (5% eroare). n general, cnd se
fac predicii pot s apar patru situaii, prezentate n tabelul de mai jos:
Evenimentul
Apare Nu apare
Apare Corect Eroarea I Predicia
Evenimentului Nu apare Eroarea II Corect

Sunt dou situaii n care se poate grei: cnd afirmm c un eveniment se va produce i n
realitate acesta nu va aprea (eroare de tip I) sau cnd afirmm c un eveniment nu se va produce i
aceste va apare (Eroare de tip II). Situaia I corespunde minciunii, iar situaia II corespunde ignoranei.
Dac vrem s evitm primul tip de greeal care are consecine mai grave (de a demonstra ceva ce nu
exist n realitate), alegem pragul de semnificaie de 0,010 (prag de eroare de 1%). Dac dorim ns s
avem mai multe anse n a demonstra ceva i consecinele nu sunt grave n caz de greeal, atunci se
prefer pragul de eroare de 5% (deci un p=0,050). n concluzie, vom considera un test statistic ca fiind
semnificativ dac pragul de semnificaie este mai mic sau cel mult egal cu valoarea 0,050.
n psihologie se lucreaz cu dou modaliti de formulare a ipotezelor (non-direcionale sau
direcional). Ipotezele non-direcionale sunt cele n care nu se precizeaz tipul de relaie dintre variabile.
n testarea acestor ipoteze probabilitatea de eroare de 1% sau 5% se mparte la cele extremiti (cozi)
ale distribuiei scorurilor. Testul de semnificaie pentru verificarea acestui tip de ipotez este
TWO-TAILED. n cazul nostru ipoteza ar putea fi formulat non-direcional astfel: exist o legtur ntre
salariul iniial i final al subiecilor. Ipotezele direcionale sunt cele n care se precizeaz tipul de
modificare, cercettorul se ateapt la un anumit rezultat. Pentru aceste ipoteze probabilitatea de
eroare se stabilete la una dintre extremitile distribuiei. Testul de semnificaie pentru verificarea
acestui tip de ipotez este ONE-TAILED. Ipoteza din exemplul nostru ar putea fi formulat direcional,
LOREDANA GHERASIM

268
astfel: legtura dintre salariul iniial i final este pozitiv, cu ct salariul iniial este mai mare cu att i
salariul final va fi mai mare.

Calcularea corelaiei Pearson cu ajutorul SPSS
Pentru a calcula acest coeficient de corelaie cu ajutorul aplicaiei SPSS vom crea o nou baz
de date Baza2.sav, care va cuprinde 3 variabile: STUDII (nivelul de studii al subiecilor) cu trei valori 1
(studii generale), 2 (studii medii) i 3 (studii superioare), Sal_in (salariul iniial al subiecilor) i sal_fin
(salariul final al subiecilor). aceste variabile au urmtoarele valori:
studii:1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 3, 3, 3, 3, 3, 3, 3, 3
sal_in: 189, 198, 197, 168, 201, 185, 156, 175, 201, 220, 210, 214, 205, 301, 332, 341, 221,
206, 298, 301, 654, 214, 258, 245
sal_fin: 201, 220, 205, 203, 185, 168, 178, 260, 280, 274, 298, 305, 582, 542, 392, 445, 401,
502, 403, 954, 425, 725, 625, 199
Pentru calculul corelaiei se activeaz opiunea BIVARIATE din meniul ANALIZE-
CORRELATE:

Activarea comenzii va deschide urmtoarea fereastr:

Elementele principale ale ferestrei sunt:
1. cmpul care prezint lista variabilelor din baza de date;
2. cmpul de analiz, unde se introduc variabilele ce vor fi analizate; se pot introduce mai multe
variabile, calculatorul afind corelaiile ntre variabilele luate dou cte dou;
3. n cmpul CORRELATION COEFFICIENTS se alege tipul de corelaie: coeficientul Pearson
se folosete pentru date parametrice (variabile cantitative i continui), coeficienii KENDALL i
SPEARMAN se folosesc pentru date categoriale i ordinale.
1
2
3
4
5
5
ANALIZA COMPUTERIZAT A DATELOR


269
4. cmpul TEST OF SEGNIFICANCE permite selectarea modului de testate a ipotezei (TWO-
TAILED sau ONE-TAILED); de obicei se folosete pragul TWO-TAILED n testarea ipotezelor de
cercetare cu ajutorul SPSS.
5. opiunea FLAG SIGNIFICANCE CORRELATIONS are ca efect apariia unui asterisc (*) n
dreptul corelaiilor semnificative;
6. butonul OPTIONS este urmat de apariia unei casete de dialog.

Aceasta permite realizarea unei analize descriptive a datelor (STATISTICS) i precizarea
modalitii de tratament a datelor lips MISSING VALUES, prin excluderea din analiz a perechilor de
rezultate n care avem doar una dintre valori (EXCLUDE CASES PAIRWISE) sau de a exclude din
analiz un rnd ntreg dac doar una dintre valori lipsete (EXCLUDE CASES LISTWISE). Se
recomand utilizarea primei variante selectat implicit.
Pentru baza de date creat vom analiza legtura dintre variabilele salariu iniial i final al
subiecilor. Vom introduce variabilele SAL_INI i SAL_FIN n cmpul din dreapta.

Coeficientul de corelaie Pearson este selectat implicit de ctre calculator, la fel ca i celelalte
opiuni test de semnificaie TWO-TAILED i marcarea cu asterisc a corelaiilor semnificative FLAG
SIGNIFICANCE CORRELATIONS. Dup activarea butonului OK, n foaia OUTPUT sunt afiate
urmtoarele rezultate:
LOREDANA GHERASIM

270


Se observ c cele dou variabile apar pe coloane da i pe linii.
Pe rndul 1 - PEARSON CORRELATION se gsesc valorile coeficienilor de corelaie dintre
dou variabile
Pe rndul 2 - SIG. (2-TAILED) apare probabilitatea de eroare la respingerea ipotezei de nul i
acceptare a ipotezei de cercetare
Rndul 3 - N conine numrul de subieci care au scoruri la ambele variabile
n tabel apare legtura dintre fiecare variabil i ea nsi (ANX1 i ANX1 i respectiv ntre
ANX2 i ANX2) dar i legtura dintre cele dou variabile (ntre ANX1 i ANX2 dar i ntre ANX2 i
ANX1).
Prima celul din stnga (notat cu 4) prezint coeficientul de corelaie ntre variabila salariul
iniial i salariul iniial (ANX1 i ANX1). ntre o variabil i ea nsi apare o corelaie perfect pozitiv
(r=1,0), dar lipsit de semnificaie (nu apare nici un prag de semnificaie). Acest coeficient de corelaie
nu aduce nici un fel de informaie i n consecin nu se analizeaz. La fel nu se analizeaz corelaia
dintre variabila salariul final i salariul final (ANX2 i ANX2).
n celula din dreapta sus apare coeficientul de corelaie dintre salariul iniial i salariul final
(ANX1 i ANX2), semnificaia acestuia i numrul de perechi de scoruri. Acelai rezultate apar i n
celula din stnga jos care prezint coeficientul de corelaie dintre salariul final i salariul iniial (ANX2 i
ANX1). Rezultatele sunt identice deoarece corelaie este bidirecional (corelaia dintre variabilele A i B
este acelai lucru cu cea dintre variabilele B i A). n consecin rezultatul poate fi extras din oricare din
cele dou celule.
Vom extrage datele pentru legtura dintre salariul iniial i salariul final al subiecilor:
Interpretarea corelaiei: r=0,81 (coeficientul de corelaie), p<0,001 (pragul de semnificaie), N=24
(numrul de subieci).
Sunt mai multe elemente de care trebuie s se in seama n interpretarea corelaiei:
semnul corelaiei: arat natura legturii care exist pozitive (dac semnul este pozitiv) sau
negative (dac semnul este negativ). n cazul nostru, semnul este pozitiv, ceea ce nseamn c un salar
iniial mic se asociaz, dup cinci ani, cu un salariu tot mic, un salar iniial mediu se asociaz cu un
salar final mediu i un salar mare iniial se asociaz cu salariu mare final.
mrimea absolut a coeficientului: descrie tria legturii care apare ntre variabile. Se
consider, astfel, c legtura este slab dac valoarea absolut a lui r nu depete 0,30, legtura este
medie la o valoare a lui r cuprins ntre 0,30-0,50, legturile puternice avnd o mrime absolut mai
1
2
3
4
5
ANALIZA COMPUTERIZAT A DATELOR


271
mare de 0,50. n exemplul nostru, tria legturii este ridicat (r=0,81) coeficientul avnd valoare mi
mare de 0,50
pragul de semnificaie dac este mai mic de 0,05, atunci putem considera c exist o relaie
ntre variabilele studiate. n exemplu nostru, valoarea este 0,000. n aceste situaii se raporteaz un
p<0,001, pentru a arta c probabilitatea de a grei este mai mic dect 0,1% (calculatorul ne afieaz
doar primele trei zecimale). Putem spune c exist o legtur semnificativ ntre nivelul iniial i final al
salariului subiecilor, pragul de semnificaie fiind mai mic de 0,05.
proporia de varian. Coeficientul de corelaie ridicat la ptrat ne indic proporia de varian
explicat de relaia gsit. Proporia de varian indic la ce procent din populaia general apare
relaia. Pentru exemplu nostru proporia de varian are valoarea 0,65 (r=0,81, deci r
2
=0,65). Se
observ c abia 65% din variaia observat se ntlnete n realitate, deci relaia gsit este prezent la
65% dintre subieci.
Toate aceste elemente trebuie s apar n interpretare, pentru ca ea s fie complet.

Comanda SELECT CASES
Uneori este necesar selectarea anumitor cazuri din populaie pentru a face o prelucrare
statistic. Spre exemplu, vrem s vedem dac legtura dintre salariul iniial i salariul final are aceeai
valoare la subiecii care au studii generale. Subiecii sunt mprii n grupe n funcie de nivelul de studii
(studii), fiind codificai cu 1 n baza de date.
Pentru a selecta numai subiecii care au studii generale, se folosete comanda SELECT
CASES din meniul DATA. Activarea meniului este urmat de apariia urmtoarei ferestre:

n cmpul din stnga al ferestrei sunt prezentate toate variabilele din baza de date. n dreapta
ferestrei apar mai multe opiuni. Pe noi ne intereseaz opiunea IF CONDITION IS SATISFIED,
deoarece vrem s selectm numai cazurile care ndeplinesc o anumit condiie (s aib valoarea 1 la
variabila studii adic s fie numai subieci cu studii generale).
Aceast opiune se alege cu un simplu click stnga al mouse-ului:

Se activeaz butonul IF, care deschide urmtoarea caset de dialog:
LOREDANA GHERASIM

272

Se selecteaz variabila n funcie de cre se face selecia i se trece n cmpul dintre dreapta
sus. n cazul nostru se selecteaz variabila STUDII i se trece n cmpul din dreapta:

Se adug condiia. Pentru exemplul nostru, variabila Studii trebuie s aib numai valoarea 1
(STUDII=1). Se poate folosi tastatura sau se pot activa butoanele cu cifre i semne ce se gsesc sub
acest cmp. Condiia va arta astfel:

Se apas apoi butonul CONTINUE pentru a salva condiia:

Se activeaz butonul OK, baza de date modificndu-se, cum se poate observa i n imaginea
de mai jos:
ANALIZA COMPUTERIZAT A DATELOR


273

La sfritul bazei de date apare o nou variabil, intitulat FILTER_$, care indic rezultatul
seleciei. Cazurile neselectate sunt tiate, adic ele vor fi ignorate de la analiz. n partea din dreapta-
jos a ecranului apare anunul FILTER ON, care avertizeaz utilizatorul cu privire la activarea unei
comanzi de selecie
Atenie! Selectarea datelor nu implic i efectuarea analizei statistice. Dup selecie
trebuie fcut prelucrarea statistic a datelor. n cazul nostru trebuie utilizat comanda de analiz a
corelaiei dintre salariul iniial i cel final. Se obine urmtorul tabel n fereastra cu rezultate:

Rezultatul obinut este urmtorul: r=0,69, p=0,056. n continuare vom interpreta aceste
rezultate:
semnul corelaiei: corelaie pozitiv, legtura este direct proporional. n cazul subiecilor cu studii
generale se constat c nivelul mic al salariului iniial se asociaz cu un nivel mic al salariului final,
salariul iniial mediu se asociaz cu un salar final mediu, salariul iniial mare se asociaz cu un salar
final mare.
mrimea absolut a coeficientului: puterea legturii dintre cele dou variabile este ridicat, valoarea
lui r depete valoarea de 0,50.
pragul de semnificaie: valoarea pragului de semnificaie este mai mare de 0,050, deci nu exist o
legtur semnificativ ntre salariul iniial i final al subiecilor care au studii generale.
proporia de varian explicat de relaia este r
2
=0,47, deci relaia gsit apare la 47% dintre
subiecii cu studii generale. Explicaia lipsei de semnificaie a corelaiei dintre cele dou variabile (n
condiiile n care coeficientul de corelaie are valoare ridicat) este numrul mic de subieci. Numrul
de subieci din analiz influeneaz valoarea pragului de semnificaie al corelaiei dar nu i puterea
legturii dintre variabile.
LOREDANA GHERASIM

274
Dup folosirea acestui filtru este indicat dezactivarea. Pentru dezactivarea seleciei, se
deschide din nou n meniul iniial DATA - SELECT CASES. n partea de jos a ferestrei se gsete buton
RESET. Se activeaz apoi butonul OK, astfel, comanda de filtrare a datelor dispare.

Comanda SPLIT FILE
Uneori ns dorim s vedem ce se ntmpl pentru fiecare subgrup de subieci n parte. Pentru
baza de date BAZA2.sav, vom analiza legtura dintre variabilele salariul iniial i salariul final pentru
toate categoriile de subieci n funcie de variabila STUDII (nu numai pentru subiecii cu studii generale
dar i pentru cei cu studii medii i superioare). Pentru a nu repeta comanda SELECT CASES de multe
ori se poate utiliza o alt comand din meniul DATA, i anume comanda SPLIT FILE. Activarea
comenzii SPLIT FILE deschide urmtoarea fereastr:

Dintre opiunile din dreapta alegem ORGANIZE OUTPUT BY GROUPS i apoi, cu ajutorul
sgeii, introducem variabila de grupare (STUDII) n cmpul care se activeaz sub aceast opiune:

Dup apsarea butonului OK, n partea dreapt-jos a bazei de date apare anunul SPLIT FILE
ON, care avertizeaz utilizatorii c baza de date este mprit n funcie de condiiile (nivelurile)
variabilei de grupare . La fel ca i n cazul comenzii SELECT CASES, simpla mprire a bazei de
date nu asigur prelucrarea statistic. De aceea, trebuie folosit comanda CORRELATIOS pentru a
analiza legtura dintre variabilele salariu iniial i final al subiecilor.
Rezultatele analizei statistice sunt prezentate separat, n fiierul OUTPUT, pentru fiecare
condiie a variabilei independente: studii generale, medii i superioare:



ANALIZA COMPUTERIZAT A DATELOR


275
nivelul de studii al subiecilor = studii generale

nivelul de studii al subiecilor = studii medii

nivelul de studii al subiecilor = studii superioare

Graficul corelaiei
Relaia dintre dou variabile poate fi reprezentat grafic sub forma unui nor de puncte. Practic,
graficul l alegem din meniul GRAPHS, comanda SCATTER, care deschide fereastra:

Vom alege un grafic simplu, care s ilustreze relaia dintre dou variabile, deci vom selecta
opiunea SIMPLE. Se activeaz apoi butonul DEFINE, care deschide urmtoarea fereastr:
LOREDANA GHERASIM

276

Se introduc cele dou variabile n cmpurile axei X i axei Y (nu conteaz ordinea n care se
introduc variabilele deoarece corelaia este bidirecional) i apoi se apas butonul OK.

Reprezentarea grafic a corelaiei este urmtoarea:

Reprezentarea grafic a corelaiei apare sub forma unui nor de puncte. Pentru exemplul nostru
norul de puncte este ascendent cresctor (din stnga-jos spre dreapta-sus) deoarece relaia dintre
variabile este pozitiv, iar punctele sunt apropiate, grupate deoarece coeficientul de corelaie are
valoare ridicat (r=0,81). Dac relaia ar fi fost invers proporional, norul de puncte ar fi fost orientat
ANALIZA COMPUTERIZAT A DATELOR


277
descresctor (din stnga-sus spre dreapta-jos). n cazul n care nu ar fi nici o relaie, punctele ar fi fost
distribuite uniform pe grafic.


II.5. COEFICIENTUL DE CORELAIE KENDALL'S TAU-B

Reprezint o msur non-parametric a asocierii variabilelor ordinale sau rangate care
presupun cantiti. La fel ca i n cazul corelaiei Pearson, semnul coeficientului de corelaie Kendall's
tau-b indic direcia relaiei, iar valoarea absolut a coeficientului indic puterea relaiei. Cu ct valoarea
coeficientului este mai mare cu att relaia dintre variabile este mai mare. Acest coeficient de corelaie
poate lua valori doar intre -1 i 1.

Calcularea corelaiei Kendall cu ajutorul SPSS
Pentru a calcula acest coeficient de corelaie cu ajutorul aplicaiei SPSS vom crea o nou baz
de date Baza3.sav, care va cuprinde 3 variabile: elevi (codul de identificare al elevilor), Prof_1
(evaluarea interesului elevilor fa de coal de ctre primul profesorul) i Prof_2 (evaluarea interesului
elevilor fa de coal realizat de al doilea profesor). n tabelul urmtor prezentm valorile acestor
variabile.

Pentru a analiza legtura dintre evaluarea fcut de primul profesorul i evaluarea realizat de
al doilea profesor (prof_1 i prof_2), trebuie s folosim coeficientul de corelaie Kendall's.
Pentru calculul acestei corelaii se activeaz opiunea BIVARIATE din meniul ANALIZE-
CORRELATE, apoi se introduc variabilele prof_1 i prof_2 n cmpul din dreapta. Din cmpul
CORRELATION COEFFICIENTS se bifeaz coeficientul de corelaie Kendall's:

Dup confirmarea comenzii n foaia cu rezultate apare urmtorul tabel:
LOREDANA GHERASIM

278

Se constat c apare o asociere pozitiv ntre variabile (r=0,60), elevii clasai pe primele locuri
de ctre primul profesor ocup tot o poziie frunta din perspectiva celui de al doilea profesor.
Asocierea nu este ns semnificativ, p=0,091 posibila explicaie fiind numrul mic de subieci din baza
de date.
Dac ar fi aprut o asociere negativ dintre variabile (coeficientul de corelaie ar fi fost negativ)
s-ar fi interpretat astfel: elevii plasai pe primele locuri de ctre primul profesor s-ar fi plasat n coada
clasamentului din perspectiva celui de al doilea profesor.

II.6. COEFICIENTUL DE CORELAIE SPEARMAN

Este o msurare non-parametric a corelaiei dintre dou variabile ordinale. Pentru toate
cazurile, valorile fiecrui tip de variabil sunt rangate, de la cele mai mici la cele mai mari. Se folosete
atunci cnd nu este posibil msurarea caracteristicilor analizate ci doar evaluarea lor, n asemenea
manier nct indivizii statistici s fie ordonai n funcie de dou criterii X i Y. Aceast evaluare
presupune atribuirea de valori care indic ierarhia subiecilor (cum ar fi primul, al doilea, al treilea).
Modalitatea de calcul a corelaiei Spearman este similar coeficientului Pearson (de fapt de aplic
formula coeficientului Pearson). Acest coeficient de corelaie mai este denumit i coeficient de corelaie
a rangurilor.

Calcularea corelaiei Spearman cu ajutorul SPSS
Pentru a calcula acest coeficient de corelaie cu ajutorul aplicaiei SPSS vom crea o nou baz
de date Baza4.sav, care va cuprinde 3 variabile: elevi (codul de identificare al elevilor), eval_i
(evaluarea de ctre profesori a interesul pentru coal) i eval_re (evaluarea de ctre profesori a
relaiilor cu ceilali elevi).

Pentru a analiza legtura dintre evaluarea interesului fa de coal al elevilor i evaluarea
relaiilor cu ceilali colegi (eval_i i eval_re) se folosete coeficientul de corelaie Spearman.
Pentru calculul acestei corelaii se activeaz opiunea BIVARIATE din meniul ANALIZE-
CORRELATE. Se introduc variabilele eval_i i eval_re n cmpul din dreapta. Din cmpul
CORRELATION COEFFICIENTS se bifeaz coeficientul de corelaie Spearman:
ANALIZA COMPUTERIZAT A DATELOR


279

Dup confirmarea comenzii n foaia cu rezultate apare urmtorul tabel:

Se constat c apare o inversare a clasamentului, corelaia avnd semn negativ, ceea ce
semnific faptul c elevii plasai pe primele locuri ale variabilei interes pentru coal ocup ultimele
locuri dup cel de al doilea criteriu, relaii bune cu ceilali elevi. Inversarea clasamentului nu este
semnificativ, pragul de semnificaie fiind mai mare de 0,050 (p=0,260).

II.7. RECODIFICAREA I TRANSFORMAREA VARIABILELOR

Uneori este necesar ca scorurile brute obinute de subiecii unui studiu s fie transformate
pentru a putea verifica ipoteza studiului. Aplicaia SPSS are o serie de comenzi care permit
transformarea sau recodificarea unei variabile cantitative ntr-o variabil calitativ, prin crearea unei noi
variabile n baza de date sau modificarea valorilor unei variabile existente n baza de date.
Pentru a exemplifica utilizarea comenzilor de recodificare vom crea o nou baz de date
(baza5.sav) care conine mediile obinute de elevi la sfritul anului colar. Valorile variabilei sunt:
Media: 8,03, 8,73, 9,19, 8,81, 7,88, 9,06, 9,04, 6,86, 7,69, 7,80, 8,06, 9,06, 7,71, 7,16, 8,88,
8,49, 7,78, 9,76, 8,10, 7,49, 7,79, 6,91, 6,81, 7,54
Vom mpri elevii n dou grupe (grupul elevilor cu performane bune i grupul elevilor cu
performane slabe). mprirea elevilor n dou grupe se realizeaz n funcie de median, acest
indicator statistic mprind irul de scoruri n dou pari egale (proba medianei). Deci vom calcula mai
nti valoarea medianei i apoi vom mpri subiecii n grupe n funcie de valoarea acestui indicator.
Pentru calculul medianei vom folosi comanda DESCRIPTIV STATISTICS FREQUENCIES:

LOREDANA GHERASIM

280
Pentru exemplul nostru mediana are valoare 7,95. Subiecii care au valori mai mici ca mediana
(7,95) vor forma grupul celor cu performane sczute, iar subiecii care au valori mai mari dect
mediana vor forma grupul celor cu performane ridicate. Pentru recodificarea variabilei MEDIA se
utilizeaz opiunea RECODE care se gsete la meniul TRANSFORM:

Comanda RECODE are dou opiuni de recodificare. Se poate pstra variabila ce urmeaz s
fie recodificat (INTO SAME VARIABLES) sau se poate crea o nou variabil (INTO DIFFERENT
VARIABLES).

Comanda RECODE INTO DIFFERENT VARIABLES
Selectm opiunea de creare a unei noi variabile care s cuprind grupele obinute n urma
recodificrii. Se selecteaz opiunea INTO DIFFERENT VARIABLES, ceea ce are ca urmare apariia
urmtoarei casete de dialog:

1. cmpul care conine variabilele din baza de date;
2. n cmpul NAME de la OUT VARIABLE se introduce numele variabilei create;
3 n cmpul INPUT VARIABLE OUTPUT VARIABLE se introduce att variabila ce urmeaz
s fie recodificat ct i numele noii variabile;
4. butonul OLD AND NEW VALUE permite recodificarea variabilei iniiale
5 butonul IF permite crearea unei noi variabile doar prin selecia anumitor valori ale variabilei
iniiale
Pentru exemplul nostru vom trece
variabila pe care dorim s o recodificm,
MEDIA, n cmpul din mijloc al ferestrei cu
ajutorul butonului de trecere. Vom denumi
noua variabil NIVPERF. Noul nume se
tasteaz n cmpul NAME al cmpului
OUTPUT VARIABLE:

1
2
3
4
5
ANALIZA COMPUTERIZAT A DATELOR


281
Pentru ca noul nume al variabilei s apar n cmpul din mijloc INPUT VARIABLE OUTPUT
VARIABLE i astfel s aib loc recodificarea, se activeaz butonul CHANGE din cmpul OUTPUT
VARIABLE:

Se activeaz butonul OLD AND NEW VALUE pentru a defini valorile noii variabile. Activarea
acestui buton deschide urmtoarea caset de dialog:

Aceast fereastr prezint mai multe cmpuri:
1. cmpul OLD VALUE se refer valorile variabilei iniiale
2. cmpul NEW VALUE face referire la valorile noii variabile
3. n cmpul OLDNEW se reunesc opiunile de recodificarea a variabilelor
n exemplul nostru, trebuie ca valorile variabilei MEDIA (variabila iniial) s le redefinim,
formnd o nou variabil. Astfel, subiecii care au obinut scoruri mai mici dect mediana (7,95) vor
forma grupul subiecilor cu performana sczut, care va reprezenta valoarea 1 a variabilei NIVPERF
(ce va fi creat). n consecin, vom activa opiunea RANGE, LOWEST THROUGH din cmpul OLD
VALUE i vom trece n cmpul
activat valoarea medianei
(7,95). Cu alte cuvinte aceast
opiune va nsemna c toate
valorile variabilei MEDIA mai
mici de 7,95 vor fi recodificate,
prind valoarea n cadrul noii
variabile NIVPERF. n cmpul
NEW VALUE, n cmpul de
lng opiunea VALUE, vom
tasta valoarea 1:

1
2
3
LOREDANA GHERASIM

282
Se apas apoi butonul ADD al cmpului OLDNEW, pentru a putea recodifica urmtoarele
valori. Apoi se activeaz opiunea RANGE, THROUGH HIGHEST din cmpul OLD VALUE i se trece n
cmpul activat valoarea medianei
(7,95). Aceast opiune va nsemna
c valorile mai mari de 7,95 ale
variabilei MEDIA vor fi recodificate n
variabila NIVPERF primind valoarea
2. n consecin, n cmpul NEW
VALUE, n cmpul de lng opiunea
VALUE, vom tasta valoarea 2, dup
cum se poate observa i n imaginea
din dreapta.
Pentru a fi reinut i aceast a doua condiie de recodificare, se acioneaz din nou butonul
ADD din cmpul OLDNEW. n concluzie, scorurile mai mici de 7,95 ale variabilei MEDIA vor primi
valoarea 1 n cadrul variabilei NIVPERF, iar valorile mai mari de 7,95 ale variabilei MEDIA vor
reprezenta valoarea 2 al variabilei
NIVPERF, imaginea din stnga.
Se activeaz apoi butonul
CONTINUE i butonul OK al
ferestrei RECODE INTO A
DIFFERENT VARIABLES, ceea
ce duce la modificarea bazei de
date, cum se poate observa i n
imaginea din mai jos.
Se observ c n baza de
date apare noua variabil NIVPERF, cu dou valori. Putei verifica dac
recodificarea a fost corect realizat.
Exist posibilitatea de a mpri valorile unei variabile n mai mult de
dou grupe. Pentru exemplificare vom mpri scorurile la variabila MEDIA n
trei pari egale. Prima treime va alctui grupul subiecilor cu performan
sczut, a doua treime grupul subiecilor cu performan medie, iar ultima
treime grupul subiecilor cu performan ridicat. Pentru a putea face
mprirea, mai nti trebuie s calculm valorile corespunztoare percentilelor
care mpart irul de scoruri n 3 pari egale (fiecare parte reprezentnd 33,33%
din total). Se folosete comanda
DESCRIPTIV STATISTICS
FREQUENCIES. Din cmpul
PERCENTILE VALUES se bifeaz
opiunea PERCENTILE i se introduc
centilele care mpart irul de scoruri n 3
pari egale (adic 33,33% i 66,66%).
Subiecii cu valori mai mici de 7,73 vor forma grupul celor cu performana sczut (grupul 1), cei
cu valori cuprinse ntre 7,73 i 8,64 vor forma grupul subiecilor cu performan de nivel mediu (grupul
2), iar cei cu medii mai mari de 8,64 vor reprezenta grupului cu performana ridicat (grupul 3).
ANALIZA COMPUTERIZAT A DATELOR


283
Pentru a crea aceast nou variabil se activeaz meniul TRANSFORM RECODE - INTO
DIFFERENT VARIABLES. Vom denumi noua variabila NIVPERF2, tastnd noul nume n cmpul NAME
al cmpului OUT VARIABLE i
apoi activnd butonul CHANGE.
n acest exemplu, scorurile
mai mici de 7,73 ale variabilei
MEDIA vor forma primul grupului 1,
adic nivelul 1 al noii variabile
NIVPERF2. Vom activa opiunea
RANGE, LOWEST THROUGH din
cmpul OLD VALUE i vom trece
n cmpul activat valoarea 7,73, iar
n cmpul NEW VALUE vom trece
valoarea 1. Se activeaz apoi butonul ADD al cmpului OLDNEW, pentru a putea introduce
urmtoarea condiie.
Valorile variabilei MEDIE
cuprinse ntre 7,73 i 8,64 vor
reprezenta nivelul 2 al
variabilei NIVPERF2. Se
activeaz prima opiune
RANGE THROUGH i se
tasteaz valorile minime i
maxime. n cmpul NEW
VALUE se trece valoarea 2,
cum se poate observa i n
imaginea alturat.

Activm apoi butonul ADD al cmpului OLDNEW. Pentru
crearea ultimului grup, care cuprinde valori mai mari de 8,64 se activeaz
opiunea RANGE, THROUGH HIGHEST din cmpul OLD VALUE. n
cmpul NEW VALUE se trece valoarea 3, apoi se activeaz butonul ADD.
Se activeaz apoi butonul CONTINUE i butonul OK al ferestrei
RECODE INTO A DIFFERENT VARIABLES, ceea ce duce la modificarea
bazei de date, cum se poate observa i n imaginea alturat:
Se observ c n baza de date apare noua variabil NIVPERF2,
cu trei valori.

Comanda RECODE INTO SAME VARIABLES
Rezultate similare se obin dac se utilizeaz comanda RECODE
opiunea INTO SAME VARIABLES, cu excepia faptului c se pstreaz
numele iniial al variabilei recodificate. Pentru exemplificare vom utiliza
aceeai baz de date (baza5.sav) i vom mpri n dou scorurile
subiecilor. Activarea comenzii duce la apariia casete de dialog:
LOREDANA GHERASIM

284

n cmpul din stnga apar toate variabilele din baza de date, n cmpul din dreapta se introduc
variabilele pe care dorim s le recodificm. n exemplu nostru vrem s recodificm variabil Media.
Trecem variabila n cmpul din dreapta:

Se activeaz butonul OLD AND NEW VALUES, care are aceleai opiuni ca n cazul opiunii
anteriore de transformare ntr-o variabil diferit:

Recodificare se realiz la fel ca n exemplu anterior, cnd am utilizat opiunea de recodificare
ntr-o alt variabil:
ANALIZA COMPUTERIZAT A DATELOR


285

Dup confirmarea recodificrii s vedem modificrile din baza de date. Se constat c s-au
modificat valorile variabilei MEDIA, aceasta avnd acum aceleai valori ca i variabila NIVPERF. Acest
lucru demonstreaz c cele dou opiuni duc la acelai rezultat.

Inversarea valorilor variabilelor
Comanda de recodificare poate fi utilizat i pentru recodificarea valorilor scorurilor obinute la
diferii itemi.
Pentru a exemplifica utilizarea acestor comenzi de
recodificare vom crea o nou baz de date (baza6.sav)
care conine patru variabile: NRCHEST (codul de
identificare), PRES (Ct ncredere avei n preedinte?),
GUV (Ct ncredere avei n guvern?), PARLAM (Ct
ncredere avei n parlament?). Prezentm scorurile
obinute de 16 dintre subieci.
Pentru itemii 1 i 3 subiecii au rspuns pe o scal
de la 1 (foarte puin) la 4 (foarte mult). La itemul 2, ns,
subiecii au rspuns pe o scal de la 1 (foarte mult) la 4
(foarte puin). Pentru a vedea atitudinea subiecilor fa de
instituiile statului ar trebui s nsumm rspunsurile subiecilor de la cei 3 itemi. Pentru a putea face
LOREDANA GHERASIM

286
acest lucru ar trebui ca rspunsurile de la itemul 2 s fie transformate, pentru ca scala de evaluare s
aib aceeai semnificaie cu a ceilali doi itemi (valoarea 1 s nsemne foarte puin iar valoare 4 s
nsemne foarte mult).
Recodificarea n acest caz presupune inversarea scalei de evaluare pentru itemul 2, adic
valoarea 1 a itemului s devin 4 (ceea ce nseamn foarte mult), valoarea 2 s devin 3, valoarea 3 s
devin 2, iar valoarea 4 a itemului s devin 1 (ceea ce nseamn foarte puin).
Pentru recodificare ar putea fi utilizat oricare dintre cele dou opiuni prezentate anterior
RECODE INTO SAME
VARIABLES sau INTO
DIFFERENT VARIABLES. Vom
folosi comanda RECODE INTO
DIFFERENT VARIABLES pentru a
putea verifica dac recodificarea a
fost realizat. Vom redenumi
variabila recodificat GUV_R:

Vom activa butonul OLD AND NEW VARIABLES. Pentru inversarea scalei de evaluare a
itemului vom folosi numai
opiunile VALUE din cmpul
OLD VALUE i NEW VALUE.
Astfel, valoarea 1 a vechii
variabile devine 4 pentru noua
variabil, deci se tasteaz 1 n
dreptul opiunii VALUE din
cmpul OLD VALUE i cifra 4 n
dreptul opiunii VALUE din
cmpul NEW VALUE.
Se activeaz butonul
ADD din cmpul OLDNEW. Apoi se tasteaz 2 n cmpul de la opiunea VALUE din cmpul OLD
VALUE i cifra 3 n cmpul de la opiunea VALUE din cmpul NEW VALUE:









La fel se procedeaz i pentru celelalte valori care trebuie recodificate. n final trebuie s avem
urmtoarele transformri n cmpul OLDNEW:
ANALIZA COMPUTERIZAT A DATELOR


287

Dup activarea butonului CONTINUE i butonului OK al ferestrei principale, baza de date va
conine o nou variabil (GUV_R) care conine valorile inversate ale itemului 2:


Comanda TRANSFORM COMPUTE
Pentru a calcula scorul total la atitudinea fa de instituiile statului, trebuie s nsumm
scorurile subiecilor obinute la cei trei itemi. Pentru a putea face acest lucru se folosete meniul
TRANSFORM, opiunea COMPUTE:

Prezentm caracteristicile principale ale acestei ferestre:
1. n cmpul TARGET VARIABLE se tasteaz numele noii variabile
2. n acest cmp sunt prezentate variabilele din baza de date
1
2
3
LOREDANA GHERASIM

288
3. n cmpul NUMERIC EXPRESSION se introduce formula de calcul a noii variabile; sub acest
cmp se gsesc butoane cu cifre i semne, dar i un cmp cu funcii complexe care pot fi utilizate
pentru calculul noilor variabile.
Pentru exemplu nostru vom numi noua variabila ATIT, deci vom tasta numele noii variabile n
cmpul TARGET VARIABLE:

Apoi vom scrie formula de calcul care va consta n nsumarea scorurilor obinute la cele trei
variabile: PRES, GUV_R i PARLAM. Variabile sunt trecute n cmpul NUMERIC EXPRESSION
folosind butonul de trecere. Semnul plus se introduce de la tastatur sau folosind butoanele care se
gsesc sub cmpul NUMERIC EXPRESSION:

Dup activarea butonului OK n baza de date apare o nou variabila, cu numele ATIT.

Aceast nou variabil reprezint atitudinea subiecilor fa de instituiile statului i reprezint
suma rspunsurilor la cei trei itemi.


ANALIZA COMPUTERIZAT A DATELOR


289


III. ELEMENTE DE STATISTIC INFERENIAL


III.1. DISTRIBUIA NORMAL

Variabilitatea rezultatelor urmeaz reguli care pot fi modelate matematic. Dac un fenomen
social observat este urmrit o perioad de timp mai ndelungat, distribuia rezultatelor se va face dup
o curb normal, iar acest lucru poate fi demonstrat matematic.
Exist trei parametri ai unei distribuii: modalitatea (indic valorile n jurul crora se grupeaz
scorurile subiecilor), nclinarea (indic tendina scorurilor de a fi mai mari sau mai mici) i turtirea (arat
ct de mult variaz scorurile distribuiei). Din perspectiva celor trei parametri, curba normal este
unimodal, simetric i mediu turtit. n plus, curba normal mai posed anumite proprieti speciale.
Astfel, matematicienii au pus la punct formule care permit calcularea diferitelor suprafee ale curbei.
Pentru a nelege mai uor despre ce este vorba, s lum drept exemplu distribuia rezultatelor
la un test de inteligen. La acest test media rezultatelor este 100, iar deviaia standard este 16. n
imaginea de mai jos ilustrm grafic aceast distribuie:



Dac urmrii cu atenie forma curbei normale vei constata prezena unor puncte de
inflexiune, puncte n care linia curb i modific forma. Aceste puncte corespund deviaiilor standard.
ntruct distribuia normal este simetric, exact 50% din cazuri vor avea scoruri sub valoarea medie.
Aproximativ 34% din cazuri se vor afla ntre medie i o abatere standard la stnga sau la dreapta
mediei. Astfel, vom ti c 34% dintre subieci au scoruri cuprinse ntre medie (100) i o deviaie
standard. Avnd o deviaie standard de 16, vom ti c 34% dintre indivizi vor avea scorul cuprins ntre
100 i 116 (cei cu IQ situat deasupra mediei) sau ntre 84 i 100 (cei cu IQ situat dedesubtul mediei).
Observai, de asemenea, c i mai puine cazuri sunt mai deprtate de medie. Abia 16% din populaie
vor avea scoruri mai mici sau mai mari de o deviaie standard. Cu alte cuvinte, numai 16% dintre
oameni au coeficientul de inteligen mai sczut de 84 sau mai ridicat de 116. Mai mult, doar
aproximativ 2% dintre indivizi vor avea scoruri i mai extreme, mai mici sau mai mari dect dou deviaii
standard fa de medie (adic sub valoarea 68 sau peste valoarea 132).
Exist o strns legtur ntre scorurile standard (notele z) i diferite procentaje sau frecvene
relative. Cunoscnd nota Z a unui subiect putem ti cu precizie ci indivizi din populaie au scoruri mai
100 116 84 132 68
34%
14%
2%
34%
14%
2%
-2 0 -1 +2 +1
Scoruri brute
Scoruri z
LOREDANA GHERASIM

290
mici sau mai mari dect al subiectului investigat. Orice manual de statistic are la sfrit un tabel care
permite calcularea acestor procentaje cu precizie. n acel tabel, pentru fiecare not Z, este precizat un
procent, care arat ci subieci au scorurile cuprinse ntre medie i nota Z. S presupunem c o
persoan obine la testul de inteligen scorul 125, putem calcula nota Z a acestui subiect, care are
valoarea 1,56 (dup formula: (125-100)/16). Dac vom consulta unul din tabelele de care aminteam
anterior, vom vedea n dreptul lui 1,56 valoarea 44,06%. Aceasta nseamn c de la medie (100) i
pn la scorul nostru (125) sunt 44,06% dintre subieci. Aceasta arat c doar 5,94% dintre indivizi vor
avea scoruri mai mari (50%-44,06%) i 94,06% (50%+44,06%) vor avea scoruri mai mici dect
subiectul ales de noi.


III.2. ETAPELE TESTRII UNEI IPOTEZE. TESTUL Z

Pentru a vedea cum se realizeaz inferena statistic, vom analiza cel mai simplu test, testul z,
n care se compar un eantion format dintr-un singur caz cu o populaie a crei parametri sunt
cunoscui. Ca exemplu vom folosi un studiu (Aron & Aron, 1995), n care un grup de farmaciti a
sintetizat o vitamin care accelereaz procesele de asimilaie la copii nou-nscui, acetia
dezvoltndu-se mai rapid. Unul dintre efecte este scderea vrstei la care copii ncep s mearg.
Farmacitii au dorit s omologheze vitamina, dar pentru aceasta ei trebuie s demonstreze c
ntr-adevr vitamina accelereaz mersul copiilor. Farmacitii au primit dreptul s administreze vitamina
unui singur copil nou-nscut, ales aleatoriu din populaie. Copilul respectiv, dup administrarea
vitaminei, a nceput s mearg de la vrsta de 8 luni. Pot farmacitii s susin c vrsta precoce la
care a mers copilul se datoreaz vitaminei, tiind c vrsta la care merg copii prima dat, n populaia
normal este de 14 luni, cu o abatere standard de 3 luni?
Pentru a rspunde cu dovezi statistice la o astfel de ntrebare, trebuie s facem apel la
distribuia normal a variabilei alese n cadrul populaiei i s respectm anumite etape pentru
verificarea raionamentului. Prezentm n continuare curba normal corespunztoare vrstei de debut
de la care copiii ncep s mearg:


Pentru testarea ipotezei trebuie s parcurgem mai multe etape:
Etapa I: Reformularea problemei n termenii populaiilor de comparaie. Dei avem doar un singur caz
pe care trebuie s l comparm cu o populaie ai crei parametri sunt cunoscui, ipotezele trebuie
reformulate n termenii generali ai populaiilor de comparat pentru a putea face generalizarea
ulterioar. Astfel, n exemplul nostru avem de comparat dou populaii: P
0
populaia copiilor
14 luni 17 luni 11 luni 20 luni 8 luni
34%
14%
2%
34%
14%
2%
ANALIZA COMPUTERIZAT A DATELOR


291
normali care nu iau vitaminele i P
1
- populaia copiilor normali care iau vitaminele. Vom formula
dou ipoteze:
Ipoteza de lucru (experimental): afirm c noii nscui care iau vitamina vor merge mai repede
dect cei care nu iau vitamina (H1: P
0
< P
1
)
Ipoteza de nul: Este ipoteza care descrie situaia n care intervenia noastr (vitamina) nu are nici
un efect. Dac vitamina nu ar avea nici un efect, cele dou populaii de copii ar merge la aceeai
vrst. H0: P
0
= P
1

ntr-o cercetare se testeaz de fapt ipoteza de nul pentru c ea descrie situaia deja existent
nainte interveniei sau situaia n care nu am obine nici un efect. Dac ipoteza de nul este
respins, atunci putem accepta ipoteza de lucru.
Etapa II: Stabilirea parametrilor populaiei de comparaie i a distribuiei de comparaie. Aceast etap
presupune cunoaterea parametrilor (media i abaterea standard) populaiei la care ne raportm (n
cazul nostru distribuia copiilor care nu iau vitamina). n mod obinuit, fr nici o alt intervenie,
copiii din populaia normal merg la vrsta de 14 luni, cu o abatere standard de 3 luni. Distribuia
acestei variabile este normal.
Etapa III: Stabilirea pragului de semnificaie i a notei z a punctului de tiere. Orice ipotez, mai ales n
domeniul tiinelor sociale, este testat la un anumit prag de semnificaie. Acest prag de
semnificaie arat probabilitatea de eroare cu care noi testm ipoteza. Pragul de semnificaie poate
fi de 1% (cnd dorim s fim mai precii) sau de 5% (atunci cnd putem fi mai puin exaci).
Pentru aceast cercetare vom stabili un prag de semnificaie de 1% ntruct efectele ei sunt
importante. Dup stabilirea pragului, trebuie s vedem care este nota Z corespunztoare acestuia. Am
precizat anterior c fiecrui punct de pe curba de distribuie normal i corespunde o anumit not
standard i o anume distribuie a cazurilor din populaie fa de acel punct. De exemplu, la o valoare Z
de 1 (adic 17 luni) se constat c 84% dintre copii merg la vrste mai mici de 17 luni, abia 16%
mergnd mai trziu de aceast vrst.
Exist dou de valori Z de corespunztoare pragului 1%, una referitoare la scorurile mici (n
partea stng a distribuiei), care arat cei 1% dintre copii care merg cel mai timpuriu i o alt valoare
referitoare la scorurile mari (n partea dreapt a distribuiei) care arat acei 1% dintre copii care merg
cel mai trziu. Pe noi ne intereseaz prima dintre aceste valori.



n tabelele statistice gsim valoarea scorului z (z=2,33) corespunztoare probabilitii de 1%
(numit i punct de tiere). n cazul nostru ea va fi 2,33 pentru c ne referim la scorurile mai mici dect
media, aflate n partea stng a curbei de distribuie.
Etapa IV: Colectarea datelor i transformarea lor n scoruri z. n cazul nostru colectarea datelor
nseamn a observa vrsta la care va merge copilul pentru prima dat (8 luni). Vom transforma scorul
14 luni 17 luni 11 luni 20 luni 8 luni
34%
14%
2%
34%
14%
2%
0 +1 +2 -1 -2
Note z
-2,33
LOREDANA GHERASIM

292
subiectului la variabila vrst n scor Z, prin raportare la distribuia populaiei normale de comparat
folosind formula notei Z (X-M)/SD), adic pentru exemplu nostru: Z=(8-14)/3)=-2
Etapa V: Compararea notei z astfel obinut cu nota z a punctului de tiere. Dup obinerea
scorul Z corespunztor datelor colectate, acesta trebuie comparat cu scorul Z corespunztor punctului
de tiere. n cazul nostru, nota Z (-2) corespunztoare scorului brut este mai mare dect a notei Z a
punctului de tiere (2,33). n ipoteza noastr experimental ne ateptam ca nota Z corespunztoare
scorului brut s fie mai mic dect valoare Z a punctului de tiere. n consecin, acceptm ipoteza de
nul, ipoteza experimental neconfirmndu-se. Cu alte cuvinte, farmacitii nu au reuit s dovedeasc, la
un prag de probabilitate de 1% c vitamina lor are efectul scontat.
Am prezentat testul Z pentru a nelege logica testrii ipotezelor i nelesul pragului de
semnificaie. Vom prezenta n continuare, succint testele de comparaie cele mai frecvent folosite.


III.3. TESTUL T PENTRU COMPARAREA UNUI EANTION CU MEDIA POPULAIEI

Acest test se aplic atunci cnd dorim s comparm rezultatele unui eantion cu media
populaiei (fr s avem informaii despre variana rezultatelor populaiei).
Pentru a vedea cum anume se folosete programul SPSS n aceast situaie vom crea o nou
baz de date (baza7.sav), care conine trei variabile: regiune (zona geografic, cu valorile: 1-
european, 2-asiatic i 3-african), ind_d (procentul anual de cretere a populaiei) i dens (densitatea
populaiei pe km
2
). Prezentm n continuare valorile acestor variabile:
dens: 94, 800, 87, 79, 36, 216, 55, 27, 2,8, 5, 124, 36, 47, 39, 105, 4,2, 86, 81, 227, 80, 54, 94, 111, 2,5,
283, 102, 51, 188, 330, 49, 40, 29, 58, 63, 189, 102, 143, 221,
ind_d: 0,2, 2,4, 0,7, -0,2, 2,8, 2,3, 2,9, 2,9, 0,7, 2,4, 1,1, 0,5, 3,1, 0,3, 0,5, 1,5, 3,1, 0,8, 0,4, 0,8, -0,1, -
0,3, 1,1, 1,9, 1,6, 0,3, 0,2, 0,3, 3,1, 0,5, 3,3, 2,3, 2,1, 1,8, 3,1, 2,8, 1,9
reg: 1, 2, 1, 1, 3, 3, 2, 3, 1, 3, 2, 1, 3, 1, 1, 3, 3, 1, 1, 1, 2, 1, 1, 2, 2, 1, 1, 2, 3, 1, 3, 2, 3, 2, 3, 2, 2
Dorim s comparm scorurile eantionului la variabila indice demografic cu media populaiei,
care are valoarea 2,3. Media eantionului nostru este mai mare sau mai mic comparativ cu cea a
populaiei cu valoarea 2,3? Deoarece nu avem acces la ali parametri ai populaiei, n afar de medie
va trebui s estimm variabilitatea sa. Vom aplica testul t pentru a compara un eantion cu o populaie
la care cunoatem media.
Ipoteza de cercetare: Indicele demografic al eantionul nostru va avea o avea o valoare diferit
de indicele demografic al populaiei
Ipoteza de nul: indicele demografic al eantionului va avea aceeai valoare cu cel al populaiei
Folosirea SPSS pentru compararea unui eantion cu media unei populaii
Aplicarea testului t se face activnd din meniul ANALYZE-COMPARE MERANS opiunea ONE
SIMPLE T TESTS:
ANALIZA COMPUTERIZAT A DATELOR


293

Dup activarea acestei comenzi pe ecran apare urmtoarea fereastr:

Aceast fereastr are trei elementele importante:
1. cmpul cu toate variabilele din baza de date;
2. cmpul unde vom introduce variabilele pe care vrem s le analizm
3. cmpul n care se introduce valoarea medie a populaiei cu care comparm eantionul (cu
valoarea 2,3 pentru exemplul nostru).
Activare butonului OPTIONS duce la deschiderea urmtoarei ferestre:

Se observ c automat calculatorul a ales un interval de ncredere (CONFIDENCE INTERVAL)
de 95%, ceea ce implic un prag de semnificaie de 5%. Nu vom modifica pragul de semnificaie. Dup
activarea butonului CONTINUE i apoi a butonului OK al ferestrei principale, pe ecran va apare
fereastra de OUTPUT:

One-Sample Statistics
37 1,489 1,149 ,189
procentul de crestere
anuala a populatiei
N Mean Std. Deviation
Std. Error
Mean

1
2
3
1
2
3
LOREDANA GHERASIM

294
One-Sample Test
-4,294 36 ,000 -,811 -1,195 -,428
procentul de crestere
anuala a populatiei
t df Sig. (2-tailed)
Mean
Difference Lower Upper
95% Confidence
Interval of the
Difference
Test Value =2.3




Rezultatele sunt grupate n dou tabele. Primul tabel, ONE SAMPLE STATISTICS, conine
elemente de statistic descriptiv. Al doilea tabel, ONE SAMPLE TEST, conine date despre testul t
propriu-zis. n continuare vom analiza elementele OUTPUT-ului:
1. n aceast celul este afiat media eantionului, n cazul nostru m=1,49
2. n aceast celul este afiat abaterea standard a eantionului, SD=1,1
3. celula cuprinde eroarea standard a mediei, mai precis deviaia standard a populaiei de eantioane
de aceeai mrime cu al nostru (37), populaie din care provine eantionul nostru,
m
=0,19
4. nota t a eantionului nostru comparat la populaia de eantioane care are media (
m
) 2,3 i abaterea
standard (
m
) de 0,19. Valoarea lui t este obinut dup formula t=(m-
m
)/
m
=(1,49-2,3)/0,19-
4,26. Valoarea nu este identic cu cea din tabel datorit aproximrilor fcute.
5. cuprinde gradele de liberate pentru care a fost calculat valoarea lui t i probabilitatea de respingere
a ipotezei de nul; n cazul nostru df=36
6. prezint pragul de semnificaie real, care ne spune care este probabilitatea cu care greim dac
respingem ipoteza de nul i acceptm ipoteza de cercetare. n exemplu nostru valoarea pragului de
semnificaie este 0,000, dar se raporteaz ca un p<0,001, pentru a arta c probabilitatea de a
grei este mai mic de 0,1% (calculatorul ne afieaz doar primele trei zecimale).
7. celula conine diferena dintre media eantionului i cea a populaie la care ne raportm.
8. prezint intervalul de ncredere al diferenei dintre cele dou medii (-1,1 i -0,4) corespunztor
pragului de semnificaie de 5%.
n interpretarea statistic a notei t, oricare ar fi tipul de test ales, sunt cte elemente pe care de
acre trebuie s inem seama:
pragul de semnificaie: care ne indic probabilitatea de eroare atunci cnd respingem ipoteza de
nul. Pentru a confirma ipoteze de cercetare, pragul de semnificaie trebuie s fie mai mic sau cel
mult egal cu 0,05 (adic eroarea nu trebuie s fie mai mare de 5%).
gradul de libertate: arat care este mrimea eantionului pe care s-a fcut testarea ipotezei. Cu ct
eantionul este mai mare, cu att putem avea mai mult ncredere n rezultatele obinute, indiferent
dac ele confirm sau nu ipoteza;
sensul diferenei: este dat de valoarea mediilor comparate sau de semnul notei t i arat n ce sens
apare diferena (care medie este mai mare).
Rezultatele pentru exemplul anterior sunt: Mediile: Me=1,4, Mpop=2,3,
Valoarea lui t i pragul de semnificaie: t(36)=-4,29, p<0,001.
Aceste rezultate indic faptul c diferena dintre medii este semnificativ, n sensul c media
eantionului nostru este semnificativ mai mic comparativ cu cea a populaie. Putem afirm c
4 5 6 7
8
Etape de
analiza
ANALIZA COMPUTERIZAT A DATELOR


295
procentul de cretere a populaie eantionului nostru este mai mic semnificativ n comparaie cu cel al
populaiei.
S analizm acum dac scorurile la variabila densitate din eantionul nostru difer de cea a
populaiei cu valoarea de 0,9. Rezultatele testului ONE SIMPLE T TEST indic urmtoarele rezultate:
One-Sample Statistics
37 261,797 895,096 147,153
Numar de oameni/
kilometru patrat
N Mean Std. Deviation
Std. Error
Mean
One-Sample Test
1,167 36 ,251 171,797 -126,643 470,237
Numar de oameni/
kilometru patrat
t df Sig. (2-tailed)
Mean
Difference Lower Upper
95% Confidence
Interval of the
Difference
Test Value =90


Mediile: Me=261,7, Mpop=90
Valoarea lui t i pragul de semnificaie: t(36)=1,16, p=0,251.
Rezultatele indic faptul c nu exist diferene semnificative ntre densitatea medie a
eantionului i cea a populaie, cu valoarea 90 (dac am accepta ipoteza de cercetare am grei n
25,1% din cazuri). Putem spune c avem densitatea eantionului studiat de noi este aceeai cu cea a
populaiei.


III.4. TESTUL T PENTRU COMPARAREA A DOU EANTIOANE PERECHI

n psihologia experimental se face distincie ntre grupele independente i dependente de
subieci. Atunci cnd cercettorul mparte subiecii n grupe n funcie de variabila independent, fiecrui
grup prezentndu-i un grad de intensitate al variabilei independente, avem de a face cu grupe
independente de subieci. Pentru fiecare nivel al variabilei independente vom avea cte un grup de
subieci. Astfel, dac variabila independent are dou grade de intensitate, subiecii vor fi mprii n
dou grupe, n final comparndu-se rezultatele subiecilor. Fiecare subiect va face parte dintr-un singur
grup experimental. S presupunem c variabila independent este tipul de feed-back, cu dou grade de
intensitate, pozitiv i negativ. Subiecii vor fi mprii n dou grupe, condiia de feed-back pozitiv i
respectiv condiia de feed-back pozitiv.
Exist posibilitatea ca toate nivelurile variabilei independente s fie prezentate aceluiai
eantion de subieci. Aceeai subieci vor trece prin toate condiiile experimentale. n aceast situaie
vom avea grupe perechi sau dependente de subieci. Subiecii crora le msurm anxietatea nainte i
dup intervenia terapeutic formeaz eantioane perechi. Cea mai simpl situaie de comparare a
eantioanelor este n situaia de test-retest. De exemplu, msurm nivelul anxietii subiecilor nainte i
dup terapie, pentru a vedea schimbrile care apar ca urmare a interveniei terapeutice.
Nu cunoatem nivelul mediu anxietii populaie de subieci anxioi nainte de a veni la terapie
i nici nivelul mediu al anxietii dup terapie. Ceea ce tim este nivelul anxietii subiecilor care au
LOREDANA GHERASIM

296
venit la terapie, nainte i dup intervenia terapeutic. Ceea ce ne intereseaz pe noi este de fapt
diferena dintre cele dou msurtori ale anxietii, nainte i dup terapie.
Ipoteza de cercetare: susine c vor fi diferene ntre cele dou msurtori; ne ateptm ca
nivelul anxietii dup terapie s fie mai mic dect cel iniial.
Ipoteza de nul: diferenele dintre cele dou msurtori sunt nule, nu exist nici o diferen ntre
nivelul iniial i cel final al anxietii.
Diferenele dintre mediile celor dou eantioane vor forma un eantion de comparaie. Acest
eantion al diferenelor se compar cu o populaie la care cunoatem media (media are valoarea 0
conform ipotezei de nul).
Folosirea SPSS pentru compararea a dou eantioane perechi
Pentru a demonstra modul de utilizare a testului t pentru eantioane perechi, vom folosi baza
de date Baza1.sav. Se utilizeaz testul t pentru eantioane perechi, pentru c avem rezultatele
acelorai subieci nainte i dup terapie.
Aplicarea testului t se face activnd din meniul ANALYZE COMPARE MEANS opiunea
PAIRED-SAMPLES T TEST:

Odat activat comanda va apare fereastra de mai jos:

Prezentm principalele opiuni ale ferestrei:
1. cmpul din stnga cuprinde variabilele din baza de date
2. indic selecia curent, variabilele selectate pentru analiz; pentru acest tip de test se
selecteaz o pereche de variabile;
3. cmpul n care se introduc cele dou variabile pereche
Dup introducerea variabilelor n cmpul de analiz fereastra ar trebui s arate astfel:
1
3
2
ANALIZA COMPUTERIZAT A DATELOR


297

Butonul OPTIONS este identic cu cel de la testul t care permite compararea unui eantion cu o
populaie. Vom pstra intervalul de ncredere de 95%.
Dup apsarea butonului OK fereastra OUTPUT ne va prezenta urmtoarele rezultate:

Paired Samples Statistics
107,9000 20 6,0166 1,3454
107,9500 20 5,3062 1,1865
nivelul anxietatii
inainte de terapie
nivelul anxietatii
dupa terapie
Pair
1
Mean N Std. Deviation
Std. Error
Mean


Paired Samples Correlations
20 -,259 ,270
nivelul anxietatii inainte
de terapie & nivelul
anxietatii dupa terapie
Pair
1
N Correlation Sig.


Paired Samples Test
-0.05 8,9940 2,0111 -4,2593 4,1593 -,025 19 ,980
nivelul anxietatii ina
de terapie - nivelul
anxietatii dupa tera
Pair
1
Mean Std. Deviation
Std. Error
Mean Lower Upper
95% Confidence
Interval of the
Difference
Paired Differences
t df Sig. (2-tailed)


Rezultatele sunt organizate n trei tabele, pentru fiecare dintre acestea vom analiza celulele.
Tabelul PAIRED SAMPLES STATISTICS:
1. conine perechea de variabile analizat; variabilele trebuie s fie perechi, adic s provin de la
aceeai subieci i fie cuantificate cu aceeai unitate de msur
2. conine mediile celor dou grupe analizate: M
ini
=107,9, M
fin
=107,95
3. prezint numrul de subieci din fiecare eantion, N=20
4. conine deviaiile standard a scorurilor fiecrui eantion: S
ini
=60,1, S
fin
=5,3
1
2
3 4
5
6
7
8
9
10 11
12
13
14 15
LOREDANA GHERASIM

298
5. conine abaterile standard ale populaiilor de eantioane de N subieci din care provin
eantioanele noastre
Tabelul PAIRED SAMPLES CORRELATIONS
6. coeficientul de corelaie dintre cele dou variabile pereche
7. pragul de semnificaie al corelaiei, adic probabilitatea de eroare dac am afirma c exist o
legtur ntre cele dou variabile
Tabelul PAIRED SAMPLES TESTS
8. conine numele perechii de variabile i precizeaz diferena dintre variabile, n cazul nostru
anx1-anx2
9. cuprinde diferena medie dintre cele dou grupe de subieci. Valoarea negativ indic faptul c
anxietatea iniial este mai mic comparativ cu cea final
10. cuprinde abaterea standard a eantionului rezultat din diferenele celor dou eantioane
11. indic abaterea standard a populaiei de eantioane care cuprinde toate eantioanele de
aceeai mrime
12. indic intervalul de ncredere de 95%al diferenei dintre mediile celor dou grupe
13. valoarea lui t, adic nota t a eantionului de diferene n cadrul populaiei de eantioane:
t(19)=-0,02
14. gradele de libertate pentru care este calculat nota t, df=19
15. pragul de semnificaie sau probabilitatea de eroare atunci cnd respingem ipoteza de nul:
p=0,980

n continuare prezentm rezultatele obinute n urma analizei realizat anterior:
Mediile iniiale i finale ale subiecilor: M
ini
=107,9, M
fin
=107,95
Valoarea lui t i a pragului de semnificaie: t(19)=-0,02, p=0,980.
Interpretarea se face n funcie de valoarea lui t i pragul de semnificaie. Reamintim c pentru
a respinge ipoteza de nul trebuie s avem cel mult 5% erori (p0,05). n cazul nostru se constat c nu
apare o diferen semnificativ ntre nivelul iniial i cel final al anxietii (dac am respinge ipoteza de
nul am grei n 98% din cazuri sau cu alte cuvinte valoarea lui t se plaseaz n zona de ncredere a
ipotezei de nul). Subiecii au acelai nivel al anxietii dup intervenia terapeutic, astfel c putem
spune c terapia nu a avut efect, nu a mbuntit starea subiecilor.
Corelaia ne arat dac subiecii i schimb ierarhia unii fa de alii, nu numai nivelul variabilei
dependente. Avem trei situaii posibile:
lipsa corelaiei semnificative: n acest caz nu exist o legtur ntre ierarhia subiecilor la prima cu
cea de al dou msurare. Putem afirma c diferenele ntre msurtori nu sunt sistematice,
intervenia acionnd oarecum haotic.
corelaie pozitiv semnificativ: indic faptul c ierarhia subiecilor se pstreaz de la o msurare la
alta. Cei care aveau rezultate mici la prima msurare au rezultate mici i la a doua, iar cei care aveau
rezultate mari la prima msurare au rezultate mari i la a doua msurare.
corelaie negativ, semnificativ: indic faptul c ierarhia subiecilor se inverseaz de la o msurare
la alta. Cei care aveau rezultate mici la prima msurare au rezultate mari la a doua, iar cei care
aveau rezultate mari la prima msurare au rezultate mici la a doua msurare.
n exemplu nostru avem prima situaie corelaie nesemnificativ, r=-0,25, p=0,270, ceea ce
indic faptul c cele dou variabile sunt independente una de cealalt, deoarece diferenele nu sunt
sistematice.
Analiza de
interpretare
statistica a
rezultatelor
ANALIZA COMPUTERIZAT A DATELOR


299
III.5. TESTUL T PENTRU COMPARAREA A DOU EANTIOANE INDEPENDENTE

Acest test se folosete cnd dorim s analizm influena unei variabile independente, care
presupune eantioane independente de subieci. Pentru a demonstrat modul de utilizare a testului vom
folosi datele din baza de date baza1.sav. Vom analiza dac genul subiecilor influeneaz nivelul iniial
al anxietii pacienilor. n acest caz variabila independent este genul subiecilor (cu dou grade de
intensitate, 1 - subieci de sex masculin i 2 subieci de gen feminin), variabila dependent fiind nivelul
iniial al anxietii. n funcie de variabila independent se creeaz dou grupe de subieci independeni
sau diferii (grupul 1 va fi format numai din subiecii de gen masculin, iar grupul 2 numai din subieci de
gen feminin). Fiecare subiect va putea face parte doar dintr-un singur grup.
Ipoteza de cercetare: subiecii de sex masculin vor avea un nivel al anxietii iniiale diferit de
cel al subiecilor de gen feminin
Ipoteza de nul: subiecii de gen masculin i feminin vor avea acelai nivel al anxietii iniiale.

Folosirea SPSS pentru compararea a dou eantioane independente
Aplicarea testului t pentru eantioane independente se face activnd meniul ANALYZE
COMPARE MEANS, opiunea INDEPENDENT SAMPLES T TEST:

Vom introduce variabila dependent (nivelul anxietii nainte terapiei) n cmpul TEST
VARIABLE i variabila independent n cmpul GROUPING VARIABLE:


Sunt trei cmpurile importante pe care trebuie s le avem n vedere:
1. cmpul cu variabilele din baza de date
2. cmpul n care vom introduce variabila dependent, adic variabila asupra creia dorim s
analizm influena variabilei independente.
1
2
3
4
LOREDANA GHERASIM

300
3. cmpul unde introducem variabila independent sau variabila de grupare (cea dup care
grupm subiecii).
4. butonul care permite precizarea celor dou niveluri ale variabilei independente; chiar dac
variabila independent are mai multe grade de intensitate, se pot preciza doar dou dintre acestea.
Activarea butonului DEFINE GROUPS deschide o fereastr unde vom trece valorile
corespunztoare celor dou grupuri alese pentru comparaie (n acest caz variabila independent are
doar dou niveluri 1 i 2):

n fereastra OUTPUT sunt prezentate urmtoarele rezultate:

Group Statistics
9 104,8889 2,5712 ,8571
11 110,3636 6,9753 2,1031
sexul subiectilor
subiecti de gen masculin
subiecti de gen feminin
nivelul anxietatii
inainte de terapie
N Mean Std. Deviation
Std. Error
Mean

Independent Samples Test
6,683 ,019 -2,225 18 ,039 -5,4747 2,4605 -10,6442 -,3053
-2,411 13,144 ,031 -5,4747 2,2711 -10,3756 -,5739
Equal variance
assumed
Equal variance
not assumed
nivelul anxietati
inainte de terap
F Sig.
Levene's Test for
Equality of Variances
t df Sig. (2-tailed)
Mean
Difference
Std. Error
Difference Lower Upper
5% Confidence Interv
of the Difference
t-test for Equality of Means



Vom prezenta succint semnificaia datelor din tabele:
1. celula indic variabila dependent (nivelul anxietii nainte de terapie) care este analizat n
funcie de nivelurile variabilei independente (sexul subiecilor)
2. indic numrul de subieci din fiecare grup independent; n cazul nostru avem 9 subieci de
sex masculin i 11 de gen feminin
3. conine media fiecrui grup independent, se observ c media grupului de subieci de gen
feminin este mai mare: Mgr1=104,8, Mgr2=110,3
4. conine deviaia standard pentru fiecare grup n parte: Sgr1=2,5, Sgr2=6,9
1 2 3 4
5
6
7
8 9 10 11
ANALIZA COMPUTERIZAT A DATELOR


301
5. precizeaz deviaia standard pentru populaiile de eantioane de N subieci din care provin
grupele noastre
6. precizeaz cele dou situaii posibile n urma testrii varianei populaiilor: variane egale
(primul rnd) sau variane inegale (al doilea rnd)
7. arat valoarea testului F, Levene. nainte de a analiza al doilea tabel, vom preciza faptul c
testul LEVENE testeaz egalitatea varianelor populaiilor din care provin eantioanele noastre. Testul,
notat cu F, testeaz ipoteza de nul care afirm c varianele populaiilor din care provin eantioanele
sunt egale
8. probabilitatea de eroare pentru respingerea ipotezei de nul n cazul testului Levene
9. celula conine valorile lui t pentru variane egale sau inegale ale populaiilor; semnul lui t ne
indic sensul diferenei dintre medii, fapt de care ne putem da seama uitndu-ne la valorile mediilor
10. arat gradele de libertate pentru care a fost calculat semnificaia notei t; indiferent de
rndul pe care l citim, n funcie de testul Levene, convenia este ca s raportm gradele de libertate de
pe primul rnd (n cazul nostru df=18)
11. conine pragul de semnificaie sau probabilitatea de eroare care apare atunci cnd
respingem ipoteza de nul i acceptm ipoteza de cercetare. Pentru a respinge ipoteza de nul pragul de
semnificaie trebuie s fie cel mult egal cu 0,05.
Interpretarea rezultatelor obinute:
Mediile: subiecii de gen masculin - Mgr1=104,8, subieci de gen feminin - Mgr2=110,3
Testul Levene are valoarea F=6,6, p=0,019, ceea ce indic faptul c putem respinge ipoteza de
nul (care afirm c varianele sunt egale). Greim doar n 1,9% din cazuri dac respingem ipoteza de
nul. Concluzia este c variantele celor dou populaii sunt diferite, vom extrage nota t i semnificaia de
pe rndul EQUAL VARIANCES NOT ASSUMED.
Valoarea lui t i semnificaia: t(18)=-2,4, p=0,031. Putem respinge ipoteza de nul, pentru c
greim doar n 3,1% din cazuri i s acceptm ipoteza de cercetare. Deci, apar diferene semnificative
ntre nivelul anxietii iniiale a subiecilor de gen masculin i feminin. Subiecii de sex masculin au un
nivel al anxietii semnificativ mai mic comparativ cu a celor de gen feminin.
Vom analiza efectul variabilei gen asupra nivelului anxietii subiecilor dup terapie.
Rezultatele obinute sunt:
Group Statistics
9 106,1111 4,0449 1,3483
11 109,4545 5,9053 1,7805
sexul subiectilor
subiecti de gen masculin
subiecti de gen feminin
nivelul anxietatii
dupa terapie
N Mean Std. Deviation
Std. Error
Mean

Independent Samples Test
1,326 ,265 -1,441 18 ,167 -3,3434 2,3201 -8,2178 1,5309
-1,497 17,545 ,152 -3,3434 2,2334 -8,0444 1,3575
Equal varian
assumed
Equal varian
not assumed
nivelul anxie
dupa terapie
F Sig.
Levene's Test for
quality of Variance
t df ig. (2-tailed
Mean
Difference
Std. Error
Difference Lower Upper
95% Confidence
Interval of the
Difference
t-test for Equality of Means

LOREDANA GHERASIM

302
Mediile celor dou grupe: Mgr1=106,1, Mgr2=109,4
Testul LEVENE (F=1,3, p=0,256) este nesemnificativ (am grei n 26,5% din cazuri dac am
respinge ipoteza de nul care afirm varianele sunt egale). Deci varianele celor dou populaii sunt
egale i vom extrage rezultatele din primul rnd.
t(18)=1,44, p=0,167. Valoarea lui t este nesemnificativ (am grei n 16,7% din cazuri dac am
respinge ipoteza de nul i am accepta ipoteza de cercetare). Deci nu apar diferene semnificative ntre
nivelul anxietii brbailor i femeilor dup terapie.


III.6. ANALIZA DE VARIAN - ANOVA UNIFACTORIAL

Se folosete atunci cnd vrem s analizm efectul unei variabile independente, care are mai
mult de dou grade de intensitate (sau nivele), asupra variabilei dependente. Pentru a nelege logica
acestei metode s lum un exemplu. S presupunem c suntem interesai dac salariul romnilor
depinde de nivelul de studii (nivel general, mediu i superior). Mai precis ne ateptm ca subiecii cu
studii medii s aib un salar mai mic comparativ cu cei cu studii, dar s aib un salariu mai mare
comparativ cu cei cu studii generale.
Reprezentarea grafic a situaiei descris anterior este prezentat n imaginea de mai jos:














Cele trei linii curbe mici descriu distribuia salariilor pentru cele trei categorii de studii, iar linia
curb mai mare descrie distribuia salariului pentru toate cele trei niveluri de studii luate la un loc. M1,
M2 i M3 reprezint salariul mediu pentru fiecare nivel de studii, iar MG este salariul mediu total al
tuturor salariailor. Distana a reprezint poziia scorului x fa de media grupului din care aparine, iar
distana b exprim poziia scorului x fa de valoarea medie a populaiei totale (format din cele trei
niveluri de studii la un loc).
Variaia total a salariului populaiei poate fi descompus n dou pri: o parte din variaie se
datoreaz abaterilor fiecrui scor de la media grupului din care face parte (distana a), iar cealalt parte
din variaie este produs de abaterile fiecrui scor de la media total a populaiei. Pentru a distinge ntre
grupuri ar trebui ca prima component a variaiei s fie mai mic dect cea de a doua, adic persoanele
aflate n acelai grup s difere mai puin ntre ele i mai mult de subiecii din celelalte grupe. Atunci cnd
variaia intragrup este mai mic dect variaia intergrup nseamn grupele sunt diferite.
M1 M2
MG
M3
x
a
b
ANALIZA COMPUTERIZAT A DATELOR


303
Analiza de varian (simbolul este F, coeficientul Fisher), calculeaz raportul ntre variaia
provocat de diferenele ntergrupuri, MS
B,
i variaia cauzat de diferenele intragrup, MS
W,
(formula de
calcul este F=MS
B
/MS
W
) i stabilete dac acest raport este suficient de mare pentru a putea distinge
ntre grupe. Semnificaia coeficientului F se stabilete n funcie de dou grade de libertate: gradele de
libertate intergrup (valoare dat de numrul de grupuri minus 1) i gradele de liberate intragrup (valoare
dat de suma gradelor de libertate a grupurilor sau de numrul total de subieci mai puin numrul
grupurilor).

Folosirea SPSS - ANOVA unifactorial
Vom folosi baza de date Baza7.sav i vom analiza efectul variabilei regiune (care are trei grade
de intensitate: 1-european, 2-asiatic i 3-african) asupra indicelui de cretere al populaie.
Ipoteza de cercetare: variabila regiune influeneaz valoarea densitii populaie sau indicele de
cretere va varia n funcie de regiune.
Ipoteza de nul: indicele de cretere (densitatea) va avea aceeai valoare, indiferent de zona
geografic.
Pentru realizarea acestei analize se deschide meniul ANALYZE COMPARE MEANS,
opiunea ONE WAY ANOVA:

Vom introduce variabila dependent (procentul de cretere al populaie) n cmpul
DEPENDENT LIST i variabila independent n cmpul FACTOR:



S analizm fereastra:
1. cmpul n care sunt afiate variabilele din baza de date;
2. cmpul n care sunt introduse variabilele dependente (n cazul nostru densitatea);
3. este cmpul n care se introduce variabila independent sau factor (n exemplul nostru
factorul este regiunea);
1
2
3
4
5
6
LOREDANA GHERASIM

304
4. butonul CONTRAST permite realizarea unor comparaii ntre grupe n funcie de variabila
independent;
5. butonul POST HOC permite alegerea unui anumit tip de contrast post-hoc;
6. butonul OPTIONS conine elemente de statistic descriptiv.
Vom descrie pe scurt opiunile butonului POST-HOC:

Toate testele de la aceast opiune indic dac diferenele obinute pe ansamblu prin analiza
testului F se regsesc i la nivelul comparaiilor dintre grupuri luate dou cte dou. Pragurile de
semnificaie a acestor teste sunt ajustate n funcie de numrul de grupe. Testele sunt prezentate n
ordinea descresctoare a puterii lor. Pentru a analiza efectul variabilei independente asupra celei
dependente se folosete testul BONFERRONI.
Activarea butonului descriptiv deschide urmtoarea caset:

Opiunile pe care le vom bifa sunt DESCRIPTIV pentru a vedea mediile celor trei grupe i
reprezentarea grafic a efectului MEANS PLOT.
Dup activarea butonului OK al ferestrei principale n foia cu rezultate apr urmtoarele tabele:
Descriptives
procentul de crestere anuala a populatiei
15 ,433 ,376
11 1,724 ,956
11 2,693 ,564
37 1,489 1,149
europa
asia
africa
Total
N Mean Std. Deviation

ANALIZA COMPUTERIZAT A DATELOR


305
ANOVA
procentul de crestere anuala a populatiei
33,261 2 16,630 39,532 ,000
14,303 34 ,421
47,564 36
Between Groups
Within Groups
Total
Sum of
Squares df Mean Square F Sig.


Multiple Comparisons
Dependent Variable: procentul de crestere anuala a populatiei
Bonferroni
-1,290* ,257 ,000 -1,939 -,642
-2,259* ,257 ,000 -2,908 -1,611
1,290* ,257 ,000 ,642 1,939
-,969* ,277 ,004 -1,666 -,273
2,259* ,257 ,000 1,611 2,908
,969* ,277 ,004 ,273 1,666
(J ) regiunea geografic
asia
africa
europa
africa
europa
asia
(I) regiunea geografic
europa
asia
africa
Mean
Difference
(I-J ) Std. Error Sig. Lower Bound Upper Bound
95% Confidence Interval
The mean difference is significant at the .05 level.
*.

Vom prezenta succint semnificaia datelor din tabele:
1. n prima coloan sunt trecute cele dou componente ale variaiei totale: cea intergrup i
intragrup;
2. n a doua coloan sunt trecute deviaiile ptratice care intr n componena fiecrui tip de
varian (intergrup i intragrup);
3. n aceast coloan sunt prezentate gradele de libertate pentru care se calculeaz valoarea
prag a lui F, gradul de libertate intergrup (sau between) este 2 (3 grupe-1), iar cel intragrup este 34
(numrul total de subieci este 37 minus 3 numrul de grupe);
4. n aceast coloan sunt prezentate componente ale testului F;
5. conine valoarea testului F obinut prin mprirea mediei varianei intragrup la media
varianei intergrup (n exemplul nostru: 16,6/0,4=39,5);
6. conine semnificaia testului F sau probabilitatea de eroare cnd respingem ipoteza de nul.
Din datele pe care le avem pn acum, F(2,34)=39,5, p<0,001, putem concluziona c pe
ansamblu, regiunea influeneaz valoarea indicelui demografic. Putem spune c doar pe ansamblu se
ntmpl acest lucru pentru c rezultatele analizei ANOVA se refer doar la existena diferenelor globale
dintre grupe, fr a preciza care sunt grupele ntre care apar diferene semnificative.
Pentru a vedea diferenele dintre grupuri trebuie s analizm rezultatele prezentate n tabelul
POST HOC TESTS:
7. prima coloan indic nivelul de referin al variabilei independente, fa de care se face
comparaia. Coloana este notat cu I.
8. coloana a doua indic nivele variabilei independente care sunt comparate cu nivelurile de
referin. Coloana este notat cu J.
9. coloana afieaz valorile diferenelor dintre coloana I i J.
1
2
3 4 5 6
7 8
9
11
10
LOREDANA GHERASIM

306
10. stelua care apare n dreptul diferenelor dintre medii indic existena unor diferene
semnificative ntre acestea.
11. coloana conine valoarea exact a pragului de semnificaie pentru fiecare diferen.
Astfel, n exemplul nostru observm urmtoarele rezultate:
Mgr1(Europa)-Mgr2(Asia)=-1,2, p<0,001
Mgr1(Europa)-Mgr3(Africa)=-2,2, p<0,001
Mgr2(Asia)-Mgr3(Africa)=-0,96, p=0,004
ntre toate grupele apa diferene semnificative, cea mai mare valoarea a indicelui demografic l
are regiunea african (indicele este semnificativ mai mare comparativ cu celelalte dou regiuni),
urmeaz apoi regiunea asiatic (indicele este semnificativ mai mare dect cel al regiunii europene, dar
mai mici dect cel al regiunii africane). Pe ultimul loc se plaseaz Europa cu cel mai mic (semnificativ
mai mic comparativ cu zona asiatic i african) indice demografic.
n imaginea de mai jos apare grafic a efectului:


n continuare vom analiza efectul variabilei regiune asupra densitii. Rezultatele obinute sunt
urmtoarele:

ANOVA
Numar de oameni/ kilometru patrat
3133461 2 1566730,638 2,072 ,142
25709646 34 756166,057
28843107 36
Between Groups
Within Groups
Total
Sum of
Squares df Mean Square F Sig.

ANALIZA COMPUTERIZAT A DATELOR


307
Multiple Comparisons
Dependent Variable: Numar de oameni/ kilometru patrat
Bonferroni
-627,447 345,186 ,234
21,172 345,186 1,000
627,447 345,186 ,234
648,618 370,789 ,268
-21,172 345,186 1,000
-648,618 370,789 ,268
(J ) regiunea geografica
asia
africa
europa
africa
europa
asia
(I) regiunea geografica
europa
asia
africa
Mean
Difference
(I-J ) Std. Error Sig.

Din tabelul ANOVA extragem valoarea i semnificaia lui F: F(2,34)=2,07, p=0,142. Constm nu
exist un efect al variabilei regiune asupra densitii populaiei (nu putem respinge ipoteza de nul pentru
c am grei n 14,2% din cazuri). Deci, densitatea populaiei este aproximativ aceeai indiferent de
regiune: european, asiatic sau african.
Testul POST HOC Bonferroni nu semnaleaz diferene semnificative ntre cele trei grupe care
se formeaz n funcie de intensitile variabilei independente.


III.7. ANOVA UNIVARIATE

Cele mai multe studii realizate n domeniul psihologiei studiaz efectul mai multor factori
(variabile independente) asupra uneia sau mai multor variabile dependente. Metodele prezentate pn
acum (testele t i ANOVA unifactorial) permit doar evidenierea influenei separate a fiecrui factor.
Pentru a analiza efectelor mai multor variabile independente se poate folosi analiza de varian
factorial. Logica acestei metode este identic cu a modelului ANOVA unifactorial, la fel coeficientul F
msoar raportul dintre variaia cauzat de mprirea pe grupuri i variaia intrinsec a grupurilor.
Acest tip de analiz prezint dou tipuri de note F corespunztoare celor dou tipuri de efecte
pe care le msoar. Efectele principale msoar influena unei variabile independente asupra variabilei
dependente, indiferent de aciunea celorlalte variabile independente. Efectele de interaciune msoar
influena combinat a dou sau mai multor variabile independente asupra variabilei dependente.

Folosirea SPSS - GENERAL LINEAR MODEL - UNIVARIATE
Pentru a prezenta modul de folosire al programului SPSS pentru aplicarea acestei metode vom
crea o nou baz de date (baza8.sav) care conine trei variabile: nota (notele obinute de studeni la
examen), niv_stim (nivelul stimei de sine, cu dou valori: 1 - nivel sczut al stimei de sine i 2 nivel
ridicat al stimei de sine), niv_anx (nivelul de anxietate cu dou valori: 1 - nivel sczut de anxietate
sczut i 2 nivel ridicat de anxietate). Prezentm mai jos datele care trebuie introduse n programul
SPSS:
Nota: 9, 9, 8, 10, 9, 10, 6, 8, 7, 7, 6, 5, 6, 7, 8, 8, 8, 7, 10, 7, 8, 7, 8, 9, 6, 5, 7, 5, 6, 5, 8
Niv_stim: 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2, 2
Niv_anx: 1, 1, 1, 1, 1, 1, 1, 1, 2, 2, 2, 2, 2, 2, 2, 2, 1, 1, 1, 1, 1,1, 1, 1, 2, 2, 2, 2, 2, 2, 2
LOREDANA GHERASIM

308
n acest exemplu avem dou variabile independente niv_stim (nivelul stimei de sine) i niv_anx
(nivelul de anxietate), fiecare din ele avnd dou grade de intensitate. Variabila dependent este nota
obinut la examen.
Vom analiza efectul de interaciune (sau combinat) al nivelului de anxietate i al stimei de sine
asupra notei obinute la examen.
Pentru analiza efectului combinat voma activa meniul ANALYZE - GENERAL LINEAR MODEL
opiunea UNIVARIATE. Odat activat comanda pe ecran apare urmtoarea fereastr:

Vom explica aceast fereastr:
1. conine variabilele din baza de date
2. n cmpul DEPENDENT VARIABLE se introduce variabila dependent; se poate introduce o
singur variabil dependent
3. n cmpul FIXED RACTOR se introduc variabilele independente (sau factorii) a cror efect
este controlat (nu este cauzat de ntmplare)
4. n cmpul RANDOM FACTOR pot si trecute variabilele independente, care nu ne intereseaz
n mod direct sau a cror aciune nu o putem controla
5. n cmpul COVARIATE pot fi trecute variabile independente sau variabile dependente care
ar putea avea o legtur sau un efect asupra variabilei dependente; astfel vom vedea dac variabilele
noastre independente (trecute n cmpul FIXED FACTORS) influeneaz variabila dependent
indiferent de aciunea factorilor covariani.
6. aici se trec valorile pe care le putem folosi atunci cnd bnuim c unele variabile
independente (factori) ar corela ntre ele; este o opiune pentru utilizatorii avansai i nu recomandm
folosirea metodei fr cunoaterea precis a semnificaiei sale.
Pentru exemplul nostru, variabilele independente sunt nivelul stimei de sine (NIV_STIM) i
nivelul anxietii (NIV_ANX), deci vom trece aceste variabile n cmpul FIXED FACTORS. Variabila
dependent este NOTA (vom trece aceast variabil n cmpul DEPENDENT VARIABLE:
1
5
4
3
2
6
ANALIZA COMPUTERIZAT A DATELOR


309

n partea dreapt fereastra principal exist o serie de butoane care conin opiuni complexe de
analiz. Precizm nu vom folosi n analiz toate opiunile, acestea putnd fi folosite pentru design-uri
experimentale mult mai complexe.
Butonul MODEL activeaz urmtoarea fereastr:

Opiunile din aceast fereastr folosesc la construirea unor modele de analiz n condiiile n
care situaia investigat este complicat (conine multe variabile independente). S analizm fereastra:
1. opiunea FULL FACTORIAL este marcat implicit, ceea ce nseamn c se vor lua n calcul
toate efectele principale i combinaiile posibile de factori. Pentru modelele simple se recomandat
utilizarea acestei opiuni
2. opiunea CUSTOM se folosete dac se dorete simplificarea modelul cu care se lucreaz,
bifarea acestei opiune activeaz automat cmpurile i butoanele care se gsesc dedesubt, permind
calculul anumitor efecte pentru anumii factori
3. folosind opiunile care se deschid din cmpul INTERACTION, putem alege efectele pe care
vrem s le analizm; cu ajutorul butonului cu sgeat se pot selecta factorii pentru care dorim s se
calculeze efectele.
1
2
4
3
LOREDANA GHERASIM

310
4. permite alegerea tipului de interaciune dintre variabilele independente (ct de complex s
fie interaciunea) i calculul unor coeficieni de regresie ai modelului (exist o legtur strns ntre
Regresia liniar i analiza de varian).
Pentru exemplul nostru, vom pstra opiunea marcat implicit FULL FACTORIAL. Se apas
butonul CONTINUE pentru a reveni la fereastra principal.
Butonul CONTRAST deschide urmtoarea fereastr:

Opiunile acestei ferestre permit compararea diferitelor grupuri rezultate din mprirea
subiecilor n funcie de valorile sau categoriile variabilelor independente. Aici sunt trecute doar
variabilele independente. Se alege variabila independent pentru care se dorete calculul contrastul
(diferena dintre nivelele sale de variaie). Apoi, se alege tipul de contrast din cmpul CONTRAST. Se
recomand tipul de contrast DIFFERENCE.
Pentru exemplificare, am ales variabila NIV_STIM (nivelul stimei de sine).

Prin tipul de contrast DIFFERENCE, se cere programului s analizeze dac ntre cele dou
nivele ale variabilei nivel al stimei de sine vor aprea diferene n ceea ce privete notele obinute. Cu
alte cuvinte vom vedea dac cei cu stim de sine ridicat obin note diferite de cei cu stim de sine
sczut). Dup alegerea tipului de contrast trebuie activat butonul CHANGE.

La fel se procedeaz i pentru variabila independent nivelul anxietii.
ANALIZA COMPUTERIZAT A DATELOR


311

Butonul PLOTS activeaz o fereastr dedicat reprezentrilor grafice:

Pe axa HORIZONTAL AXIS se introduce variabila independent ale crei categorii dorim s le
reprezentm pe axa X.
Pe axa SEPARATE LINES se introduce variabila pentru care se vor trasa linii ce vor reprezenta
categorii diferite ale factorului.
SEPARATE PLOTS se folosete introducerea celui de al treilea factor, ceea ce permite
obinerea mai multor grafice, care indic relaia dintre variabilele introduse anterior pentru fiecare nivel
al factorului trei.
n exemplul nostru avem doar doi factori. n consecin vom reprezenta notele la examen n
funcie de nivelul stimei de sine, NIV_STIM (pe care o vom trece pe axa X) i nivelul anxietii,
NIV_ANX (reprezentat prin linii separate), ca n imaginea de mai jos:

LOREDANA GHERASIM

312
Se activeaz butonul ADD. Acest buton permite realizarea mai multor grafice, deoarece n urma
activrii acestuia cmpurile ferestrei se golesc.

Revenim din nou n fereastra principal pentru a activa butonul POST HOC care va deschide
fereastra:

Acest buton are opiuni similare cu butonul POST HOC din fereastra ANOVA ONE-WAY.
Aceast opiune se folosete doar cnd variabile independente au mai mult de dou nivele de variaie.
Pentru a analiza diferenele dintre grupe se folosete testul Bonferroni.
Pentru exemplul nostru nu avem nevoie de comparaii POST HOC, deoarece ambele variabile
independente au doar dou nivel. Vom reveni la fereastra principal fr a activa vreo opiune.
Butonul SAVE activeaz urmtoarea fereastr:
Opiunile la care face referire acest buton se refer la o
alt metod statistic numit Regresia liniar. Nu vom mai
comenta aceste opiuni, dar menionm c ele faciliteaz
tratarea analizei de variant ca un model particular de regresie.
Recomandm folosirea acestor opiuni doar celor care cunosc
regresia.
Butonul OPTIONS activeaz o fereastr specific
acestei analize de varian:
ANALIZA COMPUTERIZAT A DATELOR


313

Prezentm elementele principale ale ferestrei:
1. prezint toate combinaiile de factori pentru care avem grupuri diferite de subieci, permind
calcularea mediei pentru fiecare grup de subieci n parte. Opiunea OVERALL se refer la media
calculat pentru toi subiecii, nemprii n grupuri
2. este cmpul n care se trec factorii pentru care dorim s calculm mediile grupurilor de
subieci
3. prezint opiuni ce permit calcularea mai multor parametri. Dintre toate, ne intereseaz
calculul parametrilor descriptivi (media, deviaia standard, minimul i maximul), precum i testele de
omogenitate (care trebuie s nu fie semnificative pentru a putea aplica acest model ANOVA).
Dup selecia opiunilor fereastr arat astfel:


n continuare vom prezenta foaia cu rezultate. Primele elemente ale output-ului se refer la
parametrii descriptivi ai modelului. Primul tabel precizeaz numrul de subieci pentru fiecare grup
obinut n funcie de nivelurile fiecrei variabile independente. De exemplu, sunt 16 subieci n grupul
celor cu nivel sczut al stimei de sine.
1
3
2
LOREDANA GHERASIM

314

Al doilea tabel precizeaz mediile totale precum i cele corespunztoare fiecrui subgrup de
subieci, subgrup determinat de categoriile factorilor din model. Aceste date sunt rezultatul opiunilor
marcate de noi din fereastra butonului OPTIONS.

Mai departe, n foaia de rezultate sunt prezentate elementele cele mai importante ale
outputului, rezultatele testului F.

Tabelul cu testul lui Levene reprezint tocmai testul de omogenitate, care trebuie s fie
nesemnificativ pentru a utiliza aceast metod.

Cele mai importante elemente ale tabelului se refer la testul F. Ne intereseaz numai liniile
marcate prin acolade.
1. arat variabilele ale cror efecte le lum n calcul:
1
2
3
4
ANALIZA COMPUTERIZAT A DATELOR


315
linia cu NIV_STIM arat efectul principal al factorului nivelul stimei de sine, indiferent de
aciunea celuilalt factor;
NIV_ANX arat efectul principal al factorului nivel de anxietate, indiferent de aciunea
celuilalt factor;
linia NIV_STIM*NIV_ANX se refer la efectul de interaciune al celor dou variabile
asupra variabilei dependente;
2. conine notele F corespunztoare efectelor principale i de interaciune;
3. conine pragurile de semnificaie ale testelor F.
4. conine gradele de libertate between subjects i within subjects
Pentru exemplu nostru s-a obinut doar un singur F semnificativ (p<0,05) i anume cel
corespunztor liniei NIV_STIM (F(1,30)=22,13, p<0,001). Deci apare un efect principal al variabilei
nivelul stimei de sine asupra notelor la examen. Restul efectelor sunt nesemnificative. Nu apare un
efect principal al variabilei nivelul anxietii (F(1,30)=2,7, p=0,107), deci notele subiecilor nu depinde de
ct de anxioi sunt acetia. De asemenea, nu apare un efect de interaciune al variabilelor
independente nivelul stimei de sine i nivelul anxietii (F(1,30)=0,02, p=0,881), deci nota la examen nu
este influenat de efectul
combinat al nivelului de
anxietate i al stimei de sine.
Pentru a vedea modul
n care nivelul stimei de sine
(NIV_STIM) influeneaz nota la
examen, trebuie s ne uitm n
tabelul de contrast:
Testul de contrast
calculeaz diferena ntre media
notelor obinute de subiecii cu
nivel ridicat al stimei de sine i a celor cu nivel sczut al stimei de sine (LEVEL 2 vs. LEVEL l). Aceast
diferen a fost comparat cu situaia n care cele dou grupuri ar fi obinut valoarea zero
(HYPOTHESIZED VALUE). Pragul de semnificaie (notat cu SIG) indic apariia unei diferene
semnificative. Sensul diferenei
(-1,93) indic faptul c cei cu
nivel ridicat al stimei de sine
(LEVEL 2) au obinut note mai
semnificativ mai mici
comparativ cu cei cu nivel
ridicat al stimei de sine (LEVEL
1).
Tabelul alturat reia
analiza contrastelor pentru
factorul nivelul anxietii:
Aici nu mai apar diferene semnificative (fapt confirmat i de lipsa unui efect principal pentru
aceast variabil), deci nivelul anxietii nu afecteaz nota la examen (Mdif=-0,68, p=0,107).
Urmtoarele tabelele prezint media obinut pe ansamblu (tabelul l), mediile obinute pentru
fiecare factor n parte (tabelele 2 i 3) i cele pentru grupurile de subieci rezultat al combinrii nivelurilor
celor dou variabile independente. Aceste tabele ajut la interpretarea sensului diferenelor la testele de
LOREDANA GHERASIM

316
contrast i interaciunii variabilelor. Tabelele prezint i deviaiile standard i limitele valorii medii pentru
un interval de ncredere de 95%.




La finalul foii de rezultate apare reprezentarea grafic a interaciunii dintre variabilele
independente:

Liniile graficului reprezint nivelurile diferite de anxietate. Efectul principal al variabilei
NIV_STIM poate fi observat grafic cu uurin: notele obinute de subiecii cu stim de sine ridicat au
valoare mai mic comparativ cu cei care au stim de sine sczut. Putem concluziona, pentru exemplul
nostru, c nota la examen este influenat de nivelul stimei de sine dar nu i de nivelul anxietii. Mai
mult, nivelul stimei de sine acioneaz asupra notei la examen n acelai mod indiferent de nivelul
anxietii.

ANALIZA COMPUTERIZAT A DATELOR


317
III.8. ANOVA REPETED MEASURES

Modelul ANOVA UNIVARIATE prezentat anterior permite analiza efectului de interaciune a
dou variabile independente care presupun grupe independente de subieci. Atunci cnd una dintre
variabilele independente presupune eantioane perechi sau msurri repetate, trebuie s utilizm un alt
model de analiz de varian, i anume modelul ANOVA cu msurri repetate. Acest model de analiz de
varian se utilizeaz atunci cnd se dorete analiza efectului de interaciune a dou variabile
independente, una presupunnd eantioane independente, iar cealalt msurri repetate. La fel ca i
modelul de varian prezentat anterior i acest tip de analiz prezint dou tipuri de note F
corespunztoare tipurilor de efect msurate. Efectele principale msoar influena fiecrei variabile
independente asupra variabilei dependente, indiferent de aciunea altei variabile independente. Efectele
de interaciune msoar influena combinat a dou sau mai multor variabile independente asupra
variabilei dependente.

Folosirea SPSS - GENERAL LINEAR MODEL REPETED MEASURES
Pentru a prezenta modul de utilizare a programului SPSS pentru aplicarea acestei metode vom
crea o nou baz de date (baza 8.sav) care conine trei variabile: ANX1 (scorurile pacienilor la scala de
anxietate naintea terapiei, ANX2 (scorurile pacienilor la scala de anxietate dup terapie), i TERAPIE
(tipul de terapie utilizat, cu dou valori care corespund celor dou tipuri de intervenii terapeutice 1- tip 1
de terapie i 2 - tip 2 terapie). Prezentm mai jos datele, care trebuie introduse n programul SPSS:
ANX1: 109, 110, 104, 106, 112, 105, 121, 102, 103, 104, 106, 104, 105, 108, 124, 115, 109,
103, 104, 104,
ANX2: 110, 102, 103, 105, 115, 116, 110, 110, 112, 103, 102, 104, 110, 110, 102, 102, 102,
109, 115, 117,
TERAPIE: 1, 2, 1, 2, 2, 2, 2, 1, 1, 1, 1, 1, 2, 2, 2, 2, 1, 1, 2, 2
Variabila dependent este reprezentat de scorurile obinute la scala de msurare a anxietii
nainte i dup terapie. Variabila independent tip de terapie (TERAPIE) are dou nivele (tip 1 de
terapie i tip 2 terapie) i presupune eantioane independente. Pentru a analiza efectul terapiei asupra
strii pacienilor trebuie s comparm nivelul iniial i cel final al anxietii pacienilor. Astfel, se
formeaz o nou variabil independent, cu msurri repetate, pe care o vom denumit TRT. Aceast
variabil independente se refer la momentul msurrii anxietii pacienilor i are dou niveluri, 1
pretest (nainte terapiei) i 2 posttest (dup terapie).
Scopul cercetrii ar putea fi analiza eficienei interveniilor
terapeutice asupra nivelului anxietii.
Activarea comenzilor pentru acest model ANOVA
se face din meniul ANALYZE - GENERAL LINEAR
MODEL opiunea REPETED MEASURES. Dup activarea
comenzii, pe ecran apare fereastra alturat:

Pentru a putea face analiza trebuie definit variabila care presupune msurri repetate, n cazul
nostru aceast variabil este msurarea repetat a anxietii nainte i dup terapie (sau test-retest). Cu
alte cuvinte trebuie denumit variabila independent care presupune msurri repetate i trebuie
precizate nivelurile acesteia. n locul denumirii generice a variabilei care presupune msurri repetate,
care apare n cmpul WITHIN-SUBJECTS FACTOR NAME (factor 1) vom trece numele noii variabile
LOREDANA GHERASIM

318
TRT. n cmpul NUMBER OF LEVEL trebuie trecut
numrul de msurtori repetate. Pentru exemplul nostru
vom trece valoarea 2 pentru c anxietatea este msurat
nainte i dup terapie (vezi imaginea din dreapta):




Se activeaz butonul ADD, pentru a putea
utiliza metoda i defini variabilele independente (vezi
imaginea din stnga):

Dup salvarea definirii factorului cu msurri repetate se activeaz butonul DEFINE, care
activat deschide o nou fereastr:

Vom prezenta cmpurile acestei ferestre:
1. este cmpul ce conine variabilele din baza de date;
2. aici se introduc variabilele care reprezint niveluri ale variabilei independente cu msurri
repetate;
3. n acest cmp introducem variabilele independente care presupun eantioane independente;
4. se introduc variabile independente sau dependente care ar putea avea legtur sau ar
influena variabila dependent.
n cazul nostru variabilele ANX1 i ANX2 reprezint nivelurile variabilei TRT, n consecin
aceste variabile se introduc n cmpul WITHIN-SUBJECTS VARIABLES (TRT).
Variabila tip de terapie (TERAPIE) se introduce n cmpul BETWEEN-SUBJECTS FACTOR,
aceast variabil presupunnd grupe independente de subieci i reprezentnd variabila factor.
1
2
3
4
ANALIZA COMPUTERIZAT A DATELOR


319

n partea de jos a ferestrei principale apar o serie de butoane care conin opiuni complexe de
analiz. Opiunile sunt similare celor care au aprut n modelul de analiz de varian prezentat anterior
ANOVA UNIVARIATE.
Butonul MODEL activeaz urmtoarea fereastr:

Opiunile din aceast fereastr folosesc la construirea unor modele n condiiile n care situaia
investigat este prea complicat. Pentru exemplul nostru, vom
pstra opiunea selectat implicit FULL FACTORIAL, ceea ce
va nsemna c n foia cu rezultate vor aprea att efectele
principale ale celor dou variabile independente ct i efectul
de interaciune al acestora.
Butonul CONTRAST activeaz urmtoarea caset de
dialog:

LOREDANA GHERASIM

320
Se observ c deja este selectat tipul de contrast pentru variabila independent care presupune
msurri repetate (TRT Polynomial). Trebuie s alegem tipul de
contrast pentru variabila TERAPIE, care presupune dou
niveluri. Vom selecta tipul de contrast Difference.
Butonul PLOTS activeaz o fereastr dedicat
reprezentrilor grafice. Vom reprezenta nivelul anxietii
pacienilor n funcie de tipul terapiei (pe care o vom trece pe
axa X) i momentul evalurii anxietii TRT (reprezentat prin
linii separate):
Se activeaz apoi butonul ADD pentru ca aplicaia SPSS s rein reprezentarea grafic a
interaciunii dintre variabilele independente:











Butonul POST HOC deschide urmtoarea fereastr:


Acest buton are opiuni similare butonului POST HOC din fereastra ANOVA ONE-WAY i
UNIVARIATE. Opiunea se folosete atunci cnd variabile independente au mai mult de dou nivele de
variaie. De asemenea, pentru a analiza diferenele dintre grupe se folosete testul Bonferroni.
Pentru exemplul nostru nu avem nevoie de comparaii POST-HOC, pentru c variabilele
independente au dor dou niveluri. n consecin, vom reveni la fereastra principal fr a activa vreo
opiune.
ANALIZA COMPUTERIZAT A DATELOR


321
Butonul SAVE activeaz urmtoarea fereastr:













La fel ca la ANOVA UNIVARIATE, butonul
se refer la o alt metod statistic numit Regresia
liniar, facilitnd tratarea analizei de variant ca un
model particular de regresie. Recomandm
folosirea acestor opiuni doar celor care cunosc
regresia.
Butonul OPTIONS activeaz o fereastr
specific analizei de variant:
La OPTIONS avem posibilitatea de a cere
calculatorului s ne afieze mediile grupelor de
subieci n funcie de fiecare variabil independent,
precum i n funcie ambele variabile, deci pentru
fiecare grup experimental.
n continuare vom prezenta foaia cu rezultate. Primele elemente ale output-ului se refer la
parametrii descriptivi ai modelului. Primul tabel precizeaz nivelurile (ANX1 i ANX2) variabilei cu
msurri repetate (TRT).

Al doilea tabel precizeaz numrul de subieci pentru fiecare grup obinut n funcie de nivelurile
factorului care presupune eantioane independente:

Urmtorul tabel precizeaz mediile pentru fiecare subgrup de subieci format n funcie de toate
categoriile factorilor din model.
LOREDANA GHERASIM

322

Urmtoarele dou tabele prezint efectele principale i de interaciune ale variabilelor
independente. La fel ca i la modelul de analiz de varian anterior se extrag valorile coeficienilor F,
pragul de semnificaie i gradele de libertate.





n primul tabel se constat c nu apare un efect al variabilei TRT (p>0,050), ceea ce indic
faptul c nivelului iniial al anxietii pacienilor nu difer de nivelul final al anxietii pacienilor dup
terapie (F(1,18)=0,006, p=0,940). Faptul c subiecii au acelai nivel al anxietii dup intervenia
terapeutic indic faptul c terapia utilizat nu a avut efect.
De asemenea, nu apare un efect combinat al variabilelor independente, TRT*TERAPIE
(F(1,18)=0,267, p=0,661). Deci subiecii au acelai nivel al anxietii nainte i dup terapie, indiferent
de tipul de terapie utilizat.
Urmtorul tabel indic efectul variabilei independente tip de terapie, fr a ine seama de
momentul msurrii F(1,18)=13,23, p=0,002. Se constat c apare un efect principal al acestei
variabilei independente asupra nivelului anxietii pacienilor dup terapie.
Pentru a vedea cum
influeneaz tipul de terapie nivelul
anxietii pacienilor vom analiza
tabelul Custom Hypothesis.
Astfel, pacienii care au primit
tipul 2 de terapie au un nivel al
anxietii semnificativ mai ridicat
comparativ cu pacienii care au primit
terapia de tip 1 (Mdif=4,40, p=0,002).
ANALIZA COMPUTERIZAT A DATELOR


323
Urmtoarele tabelele prezint media obinut pe ansamblu (tabelul l), mediile obinute pentru
fiecare factor n parte (tabelele 2 i 3) i pentru grupele de subieci obinute n urma combinrii
nivelurilor celor dou variabile independente (tabelul 4). Aceste tabele ajut la interpretarea sensului
diferenelor la testele de contrast i interaciunii variabilelor. Tabelele prezint i deviaiile standard i
limitele valorii medii pentru un interval de ncredere de 95%.




La finalul foii de rezultate apare reprezentarea grafic a interaciunii dintre variabilele
independente:

Liniile graficului reprezint momentele msurrii anxietii. Efectul principal al variabilei
TERAPIE poate fi observat grafic cu uurin.
LOREDANA GHERASIM

324




IV. DATELE NEPARAMETRICE


Datele non-parametrice sunt mai frecvent utilizate n sociologie dect n psihologie, Deoarece
avem de a face cu scale nominale sau ordinale, parametrii obinuii pe care i-am folosit pn acum n
analiz, precum media sau abaterea standard, nu mai pot fi utilizai. n consecin, datele pe care le
obinem folosind aceste scale de msur nu mai pot fi analizate folosind metodele prezentate anterior.
Aceste date se analizeaz pornind de la frecvenele de apariie ale diferitelor categorii sau de la
probabilitile de apariie ale acestor categorii. Metodele statistice utilizate pentru analiza acestor date
sunt numite teste neparametrice.
Aplicarea acestor teste este mai facil dect folosirea testelor parametrice, deoarece nu exist
restricii cu privire la distribuirea normal a rezultatelor. Totui, aceste metode pot eua mai uor n
demonstrarea diferenele, acolo unde acestea exist n realitate. Din acest motiv, recomandm
conceperea instrumentelor utiliznd scalele de interval n locul celor nominale sau ordinale. De
exemplu, n locul msurrii preferinei pentru un anume tip de muzic folosind o scal ordinal de tipul
1-deloc, 2-puin, 3-mediu, 4-mult, 5-foarte mult", este mai indicat msurarea pe o scal de interval de
tipul 1-deloc -2-3-4-5 - foarte mult". n acest fel, pot fi uor detectate diferenele folosind metodele
parametrice.
Vom prezenta cteva dintre metodele neparametrice, fr a intra n detaliile teoretice privind
aceste teste.


IV.1. TESTUL CHI PTRAT

Testul chi-ptrat permite compararea distribuiei frecvenelor unei variabile pe mai multe
categorii, prin raportare la o distribuie teoretic stabilit de cercettor. Testul compar abaterile de la
aceast distribuie teoretic obinute n realitate i estimeaz probabilitatea ca ele s apar aleatoriu.

Folosirea SPSS
Pentru a demonstrat modul de aplicare a acestei metode vom crea o nou baz de date
(baza9.sav) care cuprinde urmtoarele variabile: VRST (vrsta subiecilor), GEN (genul subiecilor, cu
dou valori: 1 semnific subieci de gen masculin i 2 subieci de gen feminin) i VOT (cuprinde
rspunsurile subiecilor la ntrebarea Cu cine ai votat la ultimele alegeri prezideniale?, cu dou valori:
1 indicnd persoanele care au votat pe Geoan, iar 2 indicnd pe cei care au votat Bsescu) i variabila
GR_MULT (conine rspunsurile subiecilor la ntrebarea Ct de mulumii suntei de situaia actual a
rii?, cu dou valori: 1 - deloc mulumit, 2 - puin mulumit i 3 - foarte mulumit). Prezentm scorurile
subiecilor la cele patru variabile:

ANALIZA COMPUTERIZAT A DATELOR


325
VRST: 45, 23, 54, 19, 22, 34, 37, 62, 36, 41, 47, 51, 38, 27, 35, 43, 32, 29
GEN: 1, 1, 2, 2, 1, 2, 1, 1, 2, 2, 2, 2, 1, 1, 1, 1, 2, 2
VOT: 2, 2, 1, 2, 2, 2, 2, 1, 2, 2, 2, 2, 1, 21, 2, 2, 2
GR_MULT: 1, 2, 3, 1, 1, 1, 3, 3, 3, 2, 2, 2, 1, 3, 2, 2, 2, 1
n exemplul nostru, dorim s vedem cu cine au votat alegtorii din lotul nostru la ultimele alegeri
prezideniale. Deci, vom compara frecvena cu care oamenii au votat cei doi candidai, folosind testul chi
ptrat.
Vom activa fereastra specific testului din meniul ANALYZE - NONPARAMETRIC TESTS
opiunea CHI-SQUARE:

Vom introduce variabila VOT n cmpul pentru analiz (TEST VARIABLES LIST).
Se observ faptul c n cmpul EXPECTED VALUES este bifat opiunea ALL CATEGORIES
EQUAL, ceea ce semnific faptul c se va compara situaia real a votului cu situaia n care candidaii
ar obine acelai numr de voturi.
Dac ns doream s comparm distribuia cu o alta, n care categoriile nu s-ar mai fi distribuit
egal, atunci foloseam opiunea VALUES i butonul ADD.
Rezultatele testului apar n foaia cu rezultate sub forma a dou tabele:

n primul tabel sunt trecute elementele descriptive ale testului, categoriile sale, frecvena
observat, cea teoretic la care se face raportarea i abaterile frecvenei observate de la frecvena
teoretic (coloana RESIDUALS).
LOREDANA GHERASIM

326
Valoarea statistic a testului, prezentat n tabelul al doilea ( 55 , 5
2
= ), este semnificativ
(p=0,018) la un grad de libertate. Deci oamenii au votat n mod semnificativ diferit cei doi candidai la
preedinie. Semnificativ mai muli oameni au votat pe Bsescu ca preedinte comparativ cu cei care l-
au votat pe Geoan.


IV.2. TWO INDEPENDENT SAMPLES

Aceste teste sunt echivalentul testului t pentru eantioane independente, doar c n acest caz
variabila dependent msurat nu este cantitativ, ci calitativ i ordinal. Toate testele neparametrice
ce compar dou eantioane independente au la baz comparaii ale rangurilor diferitelor intervale
observate.

Folosirea SPSS
Pentru a ilustra aplicarea testului vom utiliza baza de date creat anterior (baza9.sav). Vom
analiza dac apr diferene ntre subiecii de gen masculin i cei de gen feminin n ceea ce privete
gradul de mulumire fa de situaia actual a rii.
Testul se activeaz din meniul ANALYZE - NON-PARAMETRIC TESTS opiunea TWO
INDEPENDENT SAMPLES:

Fereastra care apare pe ecran semn foarte mult cu cea care apare la activarea testului t
pentru eantioane independente. Dintre cele patru tipuri de teste, vom folosi MANN-WHITNEY U, care
se bazeaz pe ierarhia rangurilor observaiilor din cele dou grupuri.
Vom trece variabila dependent (GR_MULT) n cmpul TEST VARIABLE LIST, iar variabila
independent (GEN) n cmpul GROUPING VARIABLE. Grupurile variabilei independente se definesc
folosind butonul DEFINE GROUPS, la fel ca i n cazul testului t.
n foaia cu rezultate apar urmtoarele tabele:

ANALIZA COMPUTERIZAT A DATELOR


327


Observai c stilul de prezentare al rezultatelor este similar cu cel de la testul chi-ptrat. n
primul tabel este prezentat situaia descriptiv" (media rangurilor), iar valoarea pragului de
semnificaie a testului este dat n tabelul al doilea (linia denumit ASYMP. SIG).
Astfel, rangul mediu pentru subiecii de gen masculin are valoare 9,83, pentru cei de gen
feminin are valoarea 9,17. Valoarea pragului de semnificaie (p=0,778) este mai mare de 0,050, deci
putem trage concluzia c femeile i brbaii din studiul nostru nu difer semnificativ n ceea ce privete
gradul de mulumire cu privire la situaia actual a rii.
Dac diferenele ar fi fost semnificative (p<0,05), sensul diferenei ar fi fost dat de semnul notei
Z, scris imediat deasupra valorii pragului de semnificaie.


IV.3. TWO RELATED SAMPLES

Metodele care compar dou eantioane perechi sunt similare aplicrii testului t pentru
eantioane perechi. Pentru a ilustra aplicarea acestui test vom folosi o nou baz de date (baza10.sav)
care cuprinde dou variabile: ALINATA (cuprinde rspunsurile subiecilor la itemul Evaluai contribuia
alianei n integrarea european; variabila are trei valori 1 - importanta, 2 - medie i 3 - slab) i PSD
(cuprinde rspunsurile subiecilor la itemul Evaluai contribuia alianei n integrarea european,
variabila are trei valori 1 - importanta, 2 - medie i 3 - slab). Prezentm rezultatele subiecilor:
Alinata: 1, 1, 2, 3, 1, 1, 3, 2, 2, 2, 1, 1, 2, 2, 3, 3, 1, 3, 1, 1, 3, 2, 2, 2, 2, 2
PSD: 2, 3, 1, 1, 3, 2, 2, 1, 1, 1, 2, 2, 3, 1, 1, 1, 2, 1, 2, 2, 1, 2, 1, 1, 1, 2
Dorim s vedem dac subiecii au o prere mai bun despre unul dintre cele dou partide
politice. Deoarece subiecii rspund la ambele ntrebri trebuie aplicat o metod care s permit
compararea eantioanelor perechi.
Se folosete din meniul NON PARAMETRIC TESTS opiunea TWO RELATED SAMPLES.
Fereastra seamn cu cea a testului t pentru eantioane perechi. Ca i la acest test, trebuie
selectat o pereche de variabile pentru analiz, pentru a se activa opiunile ferestrei.
Pentru exemplul nostru vom selecta variabile ALIANTA i PSD i le vom trece n cmpul din
stnga:
LOREDANA GHERASIM

328


Vom utiliza testul WILCOXON, care se bazeaz pe rangul valorilor absolute al diferenelor
dintre dou variabile, comparnd separat diferenele pozitive i negative.
Prezentarea rezultatelor testului, n foaia cu rezultate, se face n dou tabele, unul pentru
valorile descriptive i altul pentru semnificaia testului, ca mai jos:



n primul tabel apare media i suma rangurilor diferenelor pozitive i negative, precum i
cazurile n care scorurile sunt la egalitate. Indicii de sub acest tabel arat sensul diferenelor.
Din al doilea tabel observm c testul este nesemnificativ (p=0,281). Aceste rezultat indic
faptul c oamenii consider ca ambele partide contribuie la fel de mult la integrarea Romniei n
Uniunea European.

S-ar putea să vă placă și