Sunteți pe pagina 1din 86

Aplicaii SPSS

Marian Popa

MARIAN POPA...................................................................................................1
SPSS prezentare general...................................................................................................................................3 ................................................................................................................................................................................6 Paii analizei statistice cu SPSS..........................................................................................................................6 Editarea datelor....................................................................................................................................................8 Exemplu practic de realizare a unei baze de date..........................................................................................15 Operaii de transformare a variabilelor..........................................................................................................19 nsumarea valorilor variabilelor................................................................................................................19

.........................................................................................................................21
Calcularea mediei a dou sau mai multe variabile....................................................................................21 Extragerea anului dintr-o variabil de tip cronologic (date) ....................................................................22 Recodificarea variabilelor.........................................................................................................................24 Ordonarea dup rang a valorilor unei variabile........................................................................................26 Organizarea datelor pentru analiz.................................................................................................................27 Sortarea bazei de date...............................................................................................................................27 mprirea bazei de date n subgrupuri......................................................................................................28 Selectarea unor seturi de date....................................................................................................................28 Calcularea indicatorilor statistici descriptivi..................................................................................................31 Teste parametrice...............................................................................................................................................35 Testul z (t) pentru media unui singur eantion .........................................................................................35 Testul t pentru eantioane independente...................................................................................................37 Analiza de varian unifactorial (One Way ANOVA)............................................................................40 Testul t pentru eantioane dependente (perechi).......................................................................................44 Coeficientul de corelaie liniar Pearson (r).............................................................................................46 Regresia liniar simpl..............................................................................................................................51 Analiza de consisten intern (Cronbach alfa)........................................................................................57 Teste neparametrice nominale..........................................................................................................................65 Testul z al proporiei pentru un singur eantion........................................................................................65 Testul semnelor.........................................................................................................................................67 Testul Chi-ptrat al asocierii (independeei).............................................................................................69 Testul Chi-ptrat pentru coresponden (goodness of fit).........................................................................72 Testul z al diferenei dintre dou proporii independente.........................................................................74 Teste neparametrice pentru date ordinale......................................................................................................77 Testul Mann-Whitney (U) pentru dou eantioane independente............................................................77 Testul Wilcoxon pentru dou eantioane perechi.....................................................................................79 Testul Kruskal-Wallis pentru mai mult de dou eantioane independente...............................................81 Testul Friedman pentru msurri repetate................................................................................................83 Coeficientul de corelaie pentru date ordinale (Spearman).......................................................................84

-2-

SPSS prezentare general


SPSS for Windows este un pachet de programe destinat analizei statistice a datelor. Dei exist o varietate de programe de acest gen (SAS, Statistica for Windows, GraphPad, MS Excel, care are i el funcii statistice), SPSS se distinge prin structurarea riguroas i uurina utilizrii, chiar i pentru nceptori. Cea mai recent versiune disponibil la aceast dat este SPSS 12.0. Acest manual nu acoper n mod special o anumit versiune, ci face referire n general la versiunile sub Windows. n esen, toate versiunile sub Windows ofer acelai pachet de funcii statistice iar diferenele, chiar dac sunt, nu sunt relevante la nivelul unui curs introductiv de statistic. Simbolul care precede aceast propoziie indic introducerea unei informaii importante, care se impune a fi reinut. Ne vom axa pe o prezentare sintetic, axat pe esenial, considernd cunoscute elementele de baz de operare n mediul Windows.
Funcii de baz ale SPSS

editarea datelor (construirea bazelor de date, transformri ale variabilelor) prelucrarea statistic a datelor (statistici descriptive, teste de semnificaie) prezentarea rezultatelor, sub form numeric sau grafic realizarea unor proceduri proprii de prelucrare sau de a modifica procedurile standard SPSS. Aceast opiune este rezervat utilizatorilor avansai i nu va face obiectul prezentrii n acest manual.

Domeniile de lucru n SPSS Particularitatea principal a interfeei de lucru cu SPSS este aceea c rezerv fiecreia dintre funciile de mai sus un domeniu special (ecran, sau fereastr). Astfel, la lansarea programului, acesta deschide automat o fereastra rezervat editrii datelor (Data Editor) i una afirii rezultatelor (Viewer). Putem numi aceste ferestre i domenii de lucru, deoarece la nivelul fiecruia avem la dispoziie o varietate de funcii i opiuni specifice. Ca s nelegem mai bine, trebuie s ne imaginm domeniile de lucru ca fiind ferestre distincte, similare celor ale documentelor Word, cu deosebirea c, n acest caz, fiecare fereastra acoper funcii specifice. Trecerea de la o fereastr la alta se face ntr-unul din urmtoarele moduri: Din meniul SPSS/Windows, prin alegerea ferestrei dorite; Utiliznd butoanele din bara de comenzi directe a ferestrei SPSS; Utiliznd butoanele de pe bara de sarcini a sistemului de operare (din partea de jos a ecranului).

-3-

Domeniul bazei de date (Data Editor) La lansarea programului SPSS se deschide fereastra domeniului de editare a datelor (SPSS Data Editor). Ea se prezint ca n imaginea de mai jos, avnd caracteristicile obinuite ale unei ferestre Windows, cu o structur de linii i coloane: - pe coloane sunt variabilele (de ex., cod_sub, rezultat) - pe linii sunt cazurile (n acest caz, cinci subieci)

O sesiune de lucru cu SPSS presupune, n mod necesar, existena unei baze de date. SPSS opereaz cu o singur baz de date la un moment dat. Pentru a deschide o alt baz de date, sau a crea una nou, cea aflat n lucru va fi nchis. Programul solicit salvarea ei prealabil, dac acest lucru nu a fost deja efectuat. Dac vrem s prelucrm date aflate n baze de date (fiiere) diferite, este necesar aducerea lor n aceeai baz de date (procedura DATA-Merge files, care va fi descris mai trziu). Meniurile ferestrei Data Editor nu se vor activa integral dect atunci cnd va exista cel puin o variabil definit i valori pentru cel puin un caz. Baza de date SPSS poate fi creat direct, cu ajutorul structurii (ferestrei) Data Editor, sau poate fi deschis cu ajutorul comenzii File-Open, aa cum vom exemplifica mai trziu. Domeniul afirii rezultatelor (Viwer) SPSS depune rezultatele prelucrrilor ntr-o seciune aparte a domeniului de lucru. Aceasta cuprinde toate tipurile de rezultate, att de tip numeric ct i de tip grafic. Fereastra respectiv (Viewer) este organizat n dou zone distincte: una pentru navigare (n partea stng) i alta pentru afiarea rezultatelor (n partea dreapt).

-4-

Fiierul rezultat prin salvarea acestei ferestre are extensia .SPO Un fiier cu rezultate SPSS nu poate fi deschis dect din SPSS Dac se dorete transmiterea rezultatelor n afar SPSS se va proceda fie la exportul rezultatelor cu procedura corespunztoare din meniul File/Export, fie la transferarea prin Select/Copy/Paste ntr-un editor grafic de tipul MS Word. Domeniul de editare a procedurilor directe (Syntax) SPSS permite, n afara operrii prin intermediul mediurilor, i lucrul direct cu proceduri definite de utilizator. Aceasta se face n interiorul unei ferestre speciale, care permite, pe de o parte, editarea procedurilor, iar pe de alt parte, lansare lor n execuie. Imaginea de mai jos red comenzile SPSS pentru calcularea procedurii de calcul indicatorilor statistici descriptivi, redai mai sus, n fereastra SPSS Viewer.

Utilizarea direct a procedurilor impune aprofundarea SPSS Se poate seta afiarea procedurilor curente n SPSS Viewer, concomitent cu rezultatele. (Edit/Options/Viewe/Display commands in the log)

-5-

Meniurile SPSS Meniurile de tip list se aseamn cu meniurile altor programe sub Windows. Fr a intra n amnunte, iat o prezentare succint a meniurilor pentru fereastra DATA EDITOR:

Meniul File

Funcii principale Observaii Operaii de deschidere i salvare de fiiere Operaii de Select/Copy/Cut/Paste, Find i, cel Edit mai important, setarea caracteristicilor de lucru ale SPSS (Options-n versiunile pt. Win 9X) n cazul ferestrei Data Editor, seteaz modul View de afiare: cu sau fr bara de butoane, cu sau fr liniile despritoare ale celulelor. Funcii de operare cu variabilele; definire, Importante pentru Data inserare, tergere, selectare, sortare, adiionare pregtirea datelor n de fiiere, etc. vederea prelucrrii Importante pentru Funcii de modificare a datelor prin calculare, Transform pregtirea datelor n recodificare. vederea prelucrrii Prin opiunile fiecrei Statistics proceduri se pot obine i Grupeaz procedurile de calcul statistic (Analyze) reprezentri grafice specifice Graph Grupeaz procedurile de reprezentare grafic Informaii despre variabile, structurare pe Utilities seturi de variabile Lista ferestrelor deschise cu posibilitatea de Window selecie Aici se afl un tutorial extrem de sugestiv de operare cu SPSS, iar de la versiunea 7.5 n sus, o Help Informaii de ajutor procedur de sprijin n alegerea tipului de prelucrare statistic (Statistic Coach)

Paii analizei statistice cu SPSS


n principiu, prelucrarea datelor cu SPSS presupune urmtoarele etape: Opiuni: (a) Introducerea direct a datelor n DATA EDITOR (b) Deschiderea unui fiier de date SPSS (extensia .SAV) (c) Importarea unui fiier de format diferit (se alege din caseta File open/File of type)

Introducerea datelor

-6-

2 3 4 5 6

Pregtirea datelor Selectarea procedurii satistice Selectarea variabilelor ce urmeaz a fi supuse prelucrrii Rularea procedurii Analiza rezultatelor

Corecia erorilor, selecii, recodificri, transformarea variabilelor prin calcule, declararea valorilor lips, combinarea datelor din dou fiiere diferite (meniurile Data, Transform) Meniurile Statistics (sau Analyze) i Graphs n conformitate cu configuraia casetei de dialog care este afiat la fiecare procedura Se acioneaz butonul OK din caseta de dialog a procedurii Butonul devine activ numai atunci cnd sunt ntrunite condiiile presupuse de procedura respectiv Rezultatele prelucrrilor sunt afiate ntr-o fereastr specific (SPSS Viewer), cu funciuni de editare grafic sau de tip text, n funcie de versiune. Se editeaz rezultatele afiate n Viewer, aducndu-le la forma dorit sub aspect grafic Dublu clic pe un element din Viewer conduce la intrarea elementului respectiv n regim de editare) Rezultatele din SPSS Viewer se preiau cu Select/Copy i se depun cu Paste n orice tip de editor de documente.

7 8

Editarea rezultatelor Inserarea datelor ntrun document

SPSS este un program puternic de analiz statistic a datelor. Utilizarea lui optim presupune, n mod necesar, stpnirea de ctre operator a cunotinelor teoretice de statistic. Aa cum un program de editare grafic nu compenseaz lipsa de talent la desen, nici SPSS nu poate fi cu adevrat exploatat de ctre cei care nu au cunotine de statistic. n lipsa acestora, nici alegerea procedurilor i nici interpretarea rezultatelor nu va fi cu adevrat posibil.

-7-

Editarea datelor
O baz de date n SPSS este o structur format din linii i coloane, la intersecia crora se formeaz celulele care conin, fiecare, o anumit unitate de informaie. Existena unei baze de date deschis n fereastra Data Editor este o condiie obligatorie pentru operarea cu SPSS SPSS opereaz numai cu o singur baz de date deschis la un moment dat n principiu, o baz de date SPSS se obine pe una din urmtoarele ci: a) Crearea ei prin operaiunea de definire a variabilelor i introducerea datelor de la tastatur; b) Deschiderea unei baze de date SPSS, existente pe un suport de memorie; c) Importarea unei baze de date din alt format dect SPSS n continuare, vom trata pe rnd, fiecare din cele trei situaii: a) Crearea unei baze de date SPSS n linii generale, pentru crearea unei baze de date proprii n SPSS, se procedeaz astfel: Se lanseaz SPSS Se definesc variabilele bazei de date n domeniul Data Editor Se introduc datele pentru fiecare caz (subiect) n parte Se salveaz baza de date (extensia specific este *.sav) Definirea variabilelor se acioneaz Define variable din meniul Data soluie mai direct este dublu clic pe capul de coloan

n versiunile de SPSS mai recente, editarea variabilelor se face ntr-o fereastr special. Cu toate acestea, elementele de baz rmn aceleai ca al versiunile anterioare.

-8-

Ca urmare a operaiei de mai sus, apare o caset de dialog ca n imaginea de mai jos (forma ei nu difer substanial de la o versiune de SPSS la alta). Dac privim caseta, vom observa urmtoarele elemente:

Variable Name: zona de declarare a numelui de variabil. VAR00001 este numele implicit al primei variabile. Acesta se terge, pentru a fi nlocuit cu numele pe care dorim s l dm variabilei. Variable Description, este o zona informativ n care sunt afiate caracteristicile predefinite ale noii variabile. Aceste caracteristici se pot seta n Edit-Options (sau Preferences, la unele versiuni). Change Settings, este o zon care cuprinde butoane de comenzi pentru modificarea setrilor implicite: n zona Measurement, se permite declararea tipului de msurare specific variabilei: Scale (Interval/Raport); Ordinal; Nominal Butoanele OK (pentru finalizarea definirii variabilei, Cancel (pentru renunarea la definirea variabilei, Help (informaii legate de definirea variabilelor)

n versiunile mai recente de SPSS editarea variabilei nu presupune acest tip de caset, dar toatele elementele ei constitutive se regsesc. Numele variabilei: Orice variabil SPSS trebuie s aib un nume. Cele mai importante aspecte legate de denumirea variabilelor sunt urmtoarele: Trebuie sa fie format din minim 1, maxim 8 caractere, Nu sunt suportate caractere speciale cum ar fi spaiu sau semne de punctuaie

-9-

n cazul utilizrii unor caractere improprii, apare un mesaj de eroare i se permite corectarea numelui. Alegerea numelui este la latitudinea operatorului. Respectarea anumitor convenii poate fi, ns, extrem de util, mai ales dac avem de a face cu o baza de date cu multe variabile. Iat cteva recomandri utile n acest sens (ele nu sunt obligatorii): Numele s exprime, pe ct posibil, coninutul variabilei Pentru variabile nrudite, se va utiliza o schem de denumire care s exprime acest lucru. De exemplu, dac avem variabile care cuprind valori ale timpului de reacie msurat n mai multe condiii, putem declara variabilele TR_1, TR_2, TR_3 .a.m.d., caracterul underscore este recomandabil ca separator n cadrul numelui de variabil). Dac ntr-o situaie de acest gen am avea 10 sau mai multe momente, este de preferat s se declare nume de genul TR_01, TR_02,...TR_10, etc., deoarece ulterior SPSS aranjeaz alfabetic variabilele n listele de selecie i, astfel, se pstreaz ordinea dorit. ntr-o baz de date nu pot exista dou variabile cu acelai nume! Exist o serie de cuvinte rezervate, a cror utilizare ca nume de variabile nu este acceptat de program. Acestea sunt: ALL, AND, BY, EQ, GE, GT, LE, LT, NE, NOT, OR, THRU, TO, WITH. Definirea tipului de variabil Tipul de variabil se refer la Se acioneaz butonul Type de pe caseta Define Variable Apare caseta Define Variable Type

, unde se marcheaz tipul variabilei i se declar caracteristicile acesteia (Width, Decimal Places, n cazul variabilelor numerice) Se acioneaz butonul Continue, pentru a se reveni la caseta Define Variable. Aa cum se observ n caseta Define Variable Type din imaginea de mai sus, SPSS poate opera cu o varietate de tipuri de variabile. Fiecrui tip i corespund anumite proprieti (caracteristici) care trebuie definite de operator. Cele mai uzuale sunt tipurile: - 10 -

[Numeric], care cuprind valori de tip numeric cu sau fr zecimale. Proprieti: numrul de cifre necesare pentru exprimarea ntregilor numrul de zecimale EXEMPLE: Pentru o variabil n care vom introduce vrsta n ani mplinii, vom defini Type Numeric cu Width 2 (presupunnd c nu avem subieci cu vrsta peste 100 de ani) i Decimal Places 0. Pentru o variabil n care vom introduce rezultatul la un test exprimat n scoruri T cu o zecimal, definim Type Numeric cu Width 2 i Decimal Places 1. [Caracter] (String), care cuprind valori exprimate sub form de caractere alfanumerice (litere sau chiar cifre). Proprieti numrul de caractere rezervat, care este fixat implicit la 8, dar poate fi modificat dup dorin. SPSS face distincie ntre variabile de tip caracter scurte (Short string) i lungi (Long string). Primele au maxim 8 caractere i pot fi incluse n unele proceduri statistice (semnificaia diferenei ntre medii, de exemplu), pe cnd celelalte nu pot fi utilizate dect n operaii de listare (cazul variabilei de genul nume, de ex.). Dei permis, utilizarea variabilelor string nu este de preferat. Toate variabilele care suport codificri vor fi, de preferin, introduse cu valori numerice. Utilizarea acestora n proceduri statistice nu este limitat de nici o restricie. Uniti de timp calendaristic sau orar [Date], care pot include valori de timp ntr-un format specificat, aa cum se vede n imagine. Proprieti formatul de ntroducere, care poate fi unul din cele evideniate n caseta Define Variable Type/Date Exemplu: dd-mmm-yyyy presupune introducerea unor valori de genul 21-FEB2001 (luna fiind scris obligatoriu dup prescurtarea ei n englez).

Exist o mare varietate de formate pentru acest tip de variabil, acoperind, practic, orice cerin posibil din partea utilizatorului.

- 11 -

Variabilele de tip Date beneficiaz de funcii speciale de tratare i analiz n SPSS. Nu vom prezenta i celelalte tipuri de variabile, ele fiind mai puin folosite, dar facem precizarea c semnificaia lor poate fi gsit n Help-ul casetei Define Variable Type. Tipul unei variabile poate fi schimbat ulterior prin simpla redefinire a acesteia. Se va acorda atenie mesajelor care pot s apar i care avertizeaz asupra eventualelor pierderi de informaie prin schimbarea tipului. Opiunile din zona Measurement (Scale, Ordinal, Nominal), care se regsesc doar la versiuni SPSS de la 7.0 n sus, nu au ntotdeauna o utilitate practic dar marcarea lor corect este necesar pentru anumite proceduri statistice sau grafice. Etichetarea variabilelor i a valorilor Etichetarea este o form de descriere explicit a coninutului variabilei (avnd n vederea c numele variabilei nu poate fi mai mare de 8 caractere). Etichetarea se poate practica att la nivelul variabilei dar i la valorile pe care le conine, n cazul variabilelor de tip nominal sau ordinal. Pentru etichetare se apas butonul Labels de pe caseta Define Variable. Se deschide o nou caset (Define Labels), care conine spaii pentru eticheta variabilei (Variable Label) i pentru etichetele valorilor (Value labels). Eticheta variabilei nu se supune restriciilor pentru nume, putnd conine oricte caractere (max. 255), dar i spaii sau alte semne grafice tipribile. Etichetele pentru valori vor fi introduse una cte una, astfel: se plaseaz valorea etichetatn zona Value se introduce eticheta corespunztoare n zona Value label se acioneaz butonul Add Operaiunea se reia pentru toate valorile pe care dorim s le etichetm. Imaginea prezint etichetarea valorilor unei variabile care se refer la calificativul la un examen. Se observ c valoarea 1 are eticheta SLAB, valoarea 2, eticheta MEDIU iar valoarea 3, eticheta BUN (nc nu a fost acionat butonul Add pentru a fi finalizat declaraia etichetei acestei valori).

- 12 -

Dei nimic nu ne oblig s aplicm etichete variabilelor i valorilor, este foarte recomandabil ca ele s fie atribuite. Etichetele ajut la citirea mai uoar a rezultatelor (deoarece apar alturi de acestea). n plus, etichetele sunt asociate prelucrrilor grafice (histograme, bare, etc.) fapt care reduce necesitatea de a le introduce ulterior prin editarea respectivelor grafice. Pentru a ti cum s declarm etichetele, este bine s ni le imaginm ca fiind nscrise pe axele de referin ale unui grafic. Dac se potrivesc, atunci au fost bine definite. Oricum, ele vor putea fi modificate ulterior sau editate direct n SPSS Viewer. Declararea valorilor lips (missing values) Valorile lips sunt de dou tipuri: valori lips de sistem (system missing values) adic valori care lipsesc din baza de date (nu au fost introduse). Forma lor de evideniere pe ecran este un punct plasat n celula respectiv. valori lips declarate de utilizator (user missing values) adic valori pe care utilizatorul le declar ca atare. Acestea pot exista n baza de date dar utilizatorul, din diverse motive, nu dorete s fie luate n calcul. Atenie, odat declarate, aceste valori nu sunt terse i nici nu sunt marcate n mod evident pe ecran. Pentru declararea valorilor lips se acioneaz butonul Missing Values din caseta Define Variables, care genereaz apariia casetei de dialog alturate.

Se observ c exist mai multe opiuni: declararea a trei valori distincte ca fiind lips (Discrete missing values) declarea unui domeniu de valori lips (Range of missing values) declararea unui domeniu la care se poate aduga i o valoare distinct (Range plus one discrete missing value) Dei nu pare foarte evident acum, utilitatea funciei de declarare a valorilor lips nu trebuie subestimat. Foarte adesea suntem nevoii s scoatem din prelucrri anumite valori (care nu pot fi totui, pur i simplu, terse). S ne gndim numai la valorile extreme ale unei distribuii, a cror meninere n anumite prelucrri poate determina modifcri semnificative a rezultatelor. n concluzie, declararea variabilelor se compune din urmtoarele operaiuni: - 13 -

Atribuirea numelui (maxim 8 caractere) Definirea tipului (numeric, caracter, data) Atribuirea etichetei variabilei Atribuirea etichetei valorilor, n cazul variabilelor msurate pe scale nominale sau ordinale Declararea valorilor lips (care nu au fost recoltate n procesul de msurare, din diferite motive) tergerea i inserarea variabilelor tergerea unei variabile se face prin selectarea acesteia (clic pe capul de variabil) i acionarea tastei Delete (sau se comand din meniul Edit-Cut). Inserarea unei variabile se face prin plasarea cursorului-celul pe coloana variabilei n stnga creia dorim s inserm noua variabil (sau prin selectarea variabilei respective), dup care se comand, din meniul Data-Insert variable. Dup aceasta, se definete variabila inserat (nume, tip, etichete). tergerea i inserarea cazurilor tergerea cazurilor se face n mod similar variabilelor, prin selectarea acestora (clic pe capul de linie) i tasta Delete (sau Edit-Cut). Se pot selecta mai multe cazuri simultan (drag cu mouse-ul pe capul liniilor) dup care se terg ca mai sus. Inserarea cazurilor se face dup plasarea cursorului pe linia deasupra creia dorim s inserm un nou caz, dup care se acioneaz n meniul Data-Insert case. Pentru versiunile de SPSS de la 7 n sus, clic dreapta pe capul de coloan sau de linie, produce un meniu contextual care permite un acces mai rapid la funciile de inserare/tergere. SPSS nu permite Undo (n meniul Edit) dect limitat la ultima aciune. Din acest motiv, tergerea variabilelor sau a cazurilor trebuie s se fac cu atenie, pentru c datele pot fi definitiv pierdute. Se va reine, totui, c baza de date se actualizeaz pe hard disk numai dup salvarea comandat de utilizator. Ca urmare... Orice modificare efectuat nu produce efecte dect asupra datelor din memoria de lucru, fiierul rmnnd nemodificat. n cazul unei aciuni care produce efecte nedorite asupra bazei de date, exist soluia nchiderii bazei de date, fr a se accepta salvarea cerut de program, dup care se deschide fiierul respectiv din nou. Erori frecvente - Apariia unor cazuri inutile, (umplute cu system missing values) la sfritul unei baze de date. Explicaie: Introducerea inutil a unei valori ntr-o variabil, valoare care apoi este tears. Cu toate acestea, SPSS a creat deja un caz nou, pe care l-a umplut cu system missing values. Soluie: Selectarea cazului prin apsarea pe capul de linie i acionarea tastei Delete (sau Edit-Cut). - 14 -

Apariia unor variabile inutile (nedorite). Explicaie: La introducerea din greeal a unei valori ntr-o variabil nedefinit n prealabil, SPSS creeaz automat o variabil implicit, pe care o denumete VAR00001. Soluie: Se selecteaz variabil resectiv (clic de mouse pe capul de coloan) i se acioneaz tasta Delete (sau Edit-Cut).

Exemplu practic de realizare a unei baze de date


S ne imaginm c am aplicat testul Eysenck Personality Inventory, care vizeaz urmtoarele caracteristici de personalitate: extraversiunea, nevrozismul i atitudinea defensiv (scala Lie). Pentru analiza datelor suntem interesai s raprtm rezultatele la o serie de caracteristic demografice ale subiecilor, s zicem: sexul i vrsta. n plus, pentru a avea controlul datelor dorim s inregistrm i identitatea subiecilor. Pentru fiecare dintre informaiile pe care dorim s le introducem n baza de date vom crea cte o variabil. Variabila Numele Tipul variabilei Eticheta Etichetele variabilei variabilei valorilor Identitatea COD (optm numeric, Width 2, Identitate Nu se aplic subiecielor pentru un cod Decimal Places 0 etichete (esentiala pentru numeric dac (presupunem c nu dect la a asigura nu avem avem mai mult de 99 valorile identitatea nevoie de subieci) variabilelor fiecarei numele de tip inregistrari subiecilor) categorial inparte si pentru (nominale realizarea sau corespondentelor ordinale) cu alte baze de date in care avem informatii cu privire la aceiai subieci) Sexul SEX Numeric, Width 1, Sex 1=feminin Decimal Places 0 2=masculin Vrsta (n ani VIRSTA Numeric, Width 2, Vrsta mplinii; sau n Decimal Places 0 luni dac dorim (presupunem c nu mai mult avem subeici cu precizie) vrsta peste 99 de ani) Extraversiune EXTRAV Numeric, Width 2, Extraversiune Decimal Places 0 (nu se poate obine o valoare mai mare de 100 i nu exist zecimale) Nevrozism NEVRO Numeric, Width 2, Nevrozism

- 15 -

Lie

LIE

Decimal Places 0 (nu se poate obine o valoare mai mare de 100 i nu exist zecimale) Numeric, Width 1, Decimal Places 0 (nu se poate obine o valoare mai mare de 9 i nu exist zecimale)

Minciun

Se observ faptul c pentru variabile ale cror nume exprim exact coninutul (SEX, VRSTA) se poate utiliza fr nici un inconvenient numele i ca etichet. Pentru a fi mai explicii, s spunem c numele variablei este util n primul rnd SPSS-ului pentru a manipula variabilele, n timp ce etichetele sunt necesare mai ales utilizatorului pentru a nelege cu uurin la ce se refer o variabil al crui nume prea scurt Avem alturat, imaginea DATA EDITOR pentru primii trei subieci introdui cu variabilele de mai sus:

Insistm pe declararea, cu precdere, a variabilelor de tip numeric: SPSS este un program de prelucrare statistic, fapt care implic date numerice. Dei el poate opera i cu date de tip caracter, acestea nu sunt acceptate pentru toate tipurile de proceduri statistice. Pentru a nu avea surprize, este recomandabil s fie utilizate variabile de tip numeric n toate cazurile. De exemplu, variabila sex, poate fi declarat de tip caracter (cu valorile M si F) dar, la fel de bine, de tip numeric (cu valorile convenionale 1 i, respectiv, 2). n acest din urma caz, pentru explicitarea valorilor se vor folosi etichetele de valoare (value label). Introducerea unei variabile care s conin numele subiecilor poate fi necesar doar dac ne propunem realizarea unor liste ale subiecilor din baza de date. Altfel, identificarea numeric a fiecrei nregistrri este suficient (i absolut necesar), scutind un mare volum de munc pe care l-ar implica introducerea numelor. Vom avea grij ns, ca pe documentul original s scriem codul

- 16 -

numeric aferent fiecrui subiect, astfel nct, la nevoie, s se poat identifica numele (pentru corecii, de ex.) Variabile multiple pentru ntrebri cu rspuns multiplu: De obicei, o ntrebare prezint un singur rspuns, dar pot fi situaii n care o ntrebare prezint rspunsuri multiple care pot fi alese n acelai timp. De exemplu: Ce activiti preferai pentru timpul liber? 1. sport; 2. filme; 3. petreceri cu prieteni..., etc. ntr-un asemenea caz ne putem atepta s avem mai multe rspunsuri la aceeai ntrebare. Soluia pentru introducerea datelor este, de aceea, crearea mai multor variabile, cte una pentru fiecare variant de rspuns. Astfel, vom avea variabila SPORT care poate primi dou valori, sa zicem 1 dac este aleas i 0 dac nu este aleas, i aa mai departe. n acest mod vom putea analiza frecvena alegerilor pentru fiecare variant de rspuns n parte. Evitarea variabilelor redundante: Dac la un test nu sunt posibile, de exemplu, dect rspunsuri corecte sau greite, atunci nu este necesar s declarm o variabil pentru corecte i una pentru greite dac suma lor d totalul rspunsurilor. Salvarea bazei de date din Data Editor O baz de date aflat n lucru nu are un corespondent ntr-un fiier dect dup ce se execut o salvare a acesteia. Acest lucru nu trebuie niciodat uitat. Spre deosebire de WORD de exemplu, SPSS nu are o funcie de salvare automat dup un interval de timp prestabilit. Cu alte cuvinte, indiferent ce modificri facem n Data Editor pe ecran, datele respective vor fi salvate numai la comanda explicit a operatorului. Pentru o baz de date nou creat, salvarea se face n mod similar cu orice alt program cunoscut: File-Save as, care deschide urmtoarea caset de dialog: Se alege locaia de salvare (Save in) Se d un nume fiierului (File name) Se verific tipul de fiier (formatul implicit pentru baze de date SPSS are extensia .sav) Se acioneaz Save

SPSS poate salva i n alte formate, dintre cele mai importante fiind: Dbase sau FoxPro, Lotus 1-2-3, Excel. Salvarea n aceste formate poate fi util pentru transferul datelor pentru prelucrri ulterioare n alte programe.

- 17 -

Deschiderea unei baze de date SPSS O baz de date creat cu SPSS se deschide cu comanda File-Open, care activeaz urmtoarea caset de dialog: Se alege locaia de citire (Look in) Se indic fiierul dorit (selectarea cu mouse-ul) n fereastra de cutare Se indic tipul de fiier ce urmeaz a fi deschis (implicit este de tip SPSS cu extensia .sav) Se acioneaz Open

n cazul deschiderii unui fiier de alt tip dect SPSS, se va alege tipul respectiv din lista Files of type. n cazul n care SPSS nu recunoate tipul de fiier n care se afl datele noastre, putem ncerca transformarea lor prealabil din formatul original ntr-un format recunoscut de SPSS. Dei exist riscul pierderii unor aspecte ce in de formatul de reprezentare a datelor, operaiunea scutete totui un mare volum de munc.

- 18 -

Operaii de transformare a variabilelor


Dac privim variabilele SPSS din punctul de vedere al modului n care au fost create, putem distinge dou categorii: b) variabile primare care includ valori rezultate direct din cercetare si au fost introduse, de regul, de la tastatur. c) variabile secundare rezultate prin transformrile aplicate variabilelor primare. Exemple de situaii n care se impune transformarea variabilelor: Avem mai multe variabile primare care conin rspunsurile la ntrebrile unei scale de tip Lickert i suntem interesai s calculm (ntr-o variabil secundar) suma rspunsurilor. Avem un numr de variabile primare n care se afl rezultatul parial pentru fiecare minut din cele 10 cte dureaz un test de calcul aritmetic i dorim s crem o nou variabil ( secundar) n care s avem media performanei pe cele 10 minute sau abaterea standard a performanei pe cele 10 minute, pentru fiecare subiect, Avem o variabil care conine data naterii i dorim s crem pe baza ei o alt variabil, care s conin vrsta. Dorim s transformm variabila care conine vrsta, ntr-o alt variabil care conine valori pentru categorii de vrst. Pentru toate aceste situaii, care sunt unele dintre cele mai des ntlnite, dar i pentru multe altele nc, SPSS ofer proceduri de transformare n meniul Transform. n continuare, vom prezenta cteva dintre cele mai frecvent utilizate funcii de transformare a variabilelor. nsumarea valorilor variabilelor Se utilizeaz atunci cnd dorim s obinem o variabil prin adunarea valorilor din dou sau mai multe variabile. Imaginea de mai jos prezint o tabel de date SPSS care cuprinde scorurile la trei examene pariale (scor_1, scor_2 si scor_3). Dorim s realizm o variabil care s cuprind un scor general, prin nsumarea celor trei variabile. Se poate observa c unii dintre subieci nu au valori la toate cele trei scoruri (valori lips de sistem).

- 19 -

Deoarece prin calculare, o nou variabil este plasat dup toate variabilele existente, am preferat s inserm o nou variabil imediat dup cele trei pe care dorim s le nsumm. n acest fel avem i posibilitatea s controlm uor corectitudinea operaiei de nsumare Se apeleaz procedura Transform-Compute, care deschide caseta de mai jos:

Se efectueaz urmtoarea succesiune de operaii: 1. Se introduce numele noii variabile n zona Target Variable (total). 2. Se scrie expresia de nsumare n zona Numeric Expression. Funcia este SUM (expresie numeric, expresie numeric, ...), aa cum se vede i n zona listei Functions: Ea poate fi scris de la tastatur sau selectat din lista de funcii i ridicat prin acionarea butonului . Atenie, sintaxa fiecrei funcii trebuie respectat ntocmai. n cazul nostru, variabilele numerice se vor scrie ntre paranteze, una cte una, cu virgul ntre ele. Variabilele pot fi scrise de la tastatur sau mutate la rndul lor din lista de variabile cu butonul . - 20 -

Dac variabilele ce vor fi nsumate se afl n baza de date una dup alta, ca n cazul exemplului nostru, atunci avem posibilitatea s scriem o expresie de nsumare simplificat, astfel SUM (prima_variabil TO ultima_variabil). n acest caz, clauza TO va fi cuprins ntre spaii, pentru a nu fi confundat cu un nume de variabil. Aceast opiune ne sugereaz ct de important poate fi s aranjm corespunztor variabilele n structura unei tabele SPSS. 3. Se apas butonul OK 4. Deoarece variabila total exist, SPSS ne ntreab dac dorim s modificm coninutul acesteia. Dac nu ar exista o variabil cu acest nume, rezultatul operaiei de calcul ar fi depus ntr-o variabil creat automat i amplasat dup ultima variabil din baza de date. Rspundem OK, deoarece tim c am creat aceast variabil tocmai pentru a depune n ea suma. Rezultatul operaiei se vede n imaginea de mai jos:

Calcularea mediei a dou sau mai multe variabile Presupunnd c n loc de sum, ne-ar interesa media valorilor de la mai multe variabile, se procedeaz n mod similar. Expresia de calcul a mediei este MEAN (expresie_numeric, expresie_numeric, ...), unde ... arat c putem pune oricte variabile (sau valori) numerice, cu virgul ntre ele. Ca i n cazul sumei, se poate realiza o expresie cu clauza TO, cu condiia ca variabilele pentru care se realizeaz media s se afle una dup alta n tabela SPSS.

- 21 -

Reamintim c funcia MEAN poate fi scris de la tastatur sau poate fi adus din lista de funcii, prin selectare i acionarea butonului . Este de la sine neles c expresia de calcul poate fi realizat i ntr-o manier simpl i direct, fr utilizarea funciilor (SUM sau MEAN), astfel: Pentru sum: scor_1+scor_2+scor_3 Pentru medie: (scor_1+scor_2+scor_3)/3 Se va face o distincie clar ntre suma sau media astfel obinute, care se refer la suma sau media valorilor de la mai multe variabile, pentru acelai subiect, i suma sau media pe care am calcula-o pe vertical, la nivelul fiecrei variabile n parte, pe ntreaga distribuie Se pot realiza diverse alte funcii de transformare, utilizndu-se marea varietate de funcii care se gsesc n lista Functions i a cror semnificaie se poate afl din Help-ul casetei Compute. Extragerea anului dintr-o variabil de tip cronologic (date) SPSS ofer funcii de transformare cu variabilele de tip cronologic. Dintre acestea, vom exemplifica cu realizarea unei variabile care s conin anul naterii, s zicem, scos dintr-o variabil care conine data naterii. Imaginea de mai jos este extras din baza de date Employee data.sav

Observm c variabila bdate, care conine data naterii. Pentru a avea vrsta, trebuie s calculm diferena dintre anul curent (s zicem, 2000) i anul naterii: Pentru

- 22 -

aceasta trebuie s facem diferena dintre anul curent (2000) i anul naterii, care se afl n cmpul bdate. Pentru a avea variabila ce urmeaz a fi creat n apropierea variabilei bdate, vom insera o variabil (denumind-o virsta, de tip numeric, cu doi ntregi). Apoi utilizm procedura Compute din meniul Transform:

n cmpul Target variable introducem numele noii variabile (virsta). n zona Numeric Expression vom scrie expresia de transformare, care se bazeaz pe funcia XDATE.YEAR(). Aceast funcie are ca rezultat extragerea valorii care reprezint anul dintr-o variabil de tip dat calendaristic. n cazul nostru, XDATE.YEAR(bdate)=anul naterii Ca urmare, putem scrie expresia astfel: 2000-XDATE.YEAR(bdate) Mai jos putem vedea rezultatul procedurii Compute:

Se observ n variabil virsta, valorile rezultate prin transformare (corespunztoare anului 2000).Desigur, transformarea putea fi efectuat i n dou etape. Mai nti prin extragerea anului naterii ntr-o variabil separat i, apoi, prin efectuarea unei noi transformri realizarea diferenei dintre anul curent i anul naterii. Am preferat o soluie ntr-o singur etap pentru c este mai operativ. Posibilitile de transformare a variabilelor oferite de SPSS permit crearea unor noi variabile pe baza celor existente, n funcie de necesitile de prelucrare pe care le avem. n toate cazurile, ns, nu se va alege soluia modificrii valorilor dintr-o

- 23 -

variabil primar peste valorile deja existente. Cu alte cuvinte, este recomandabil s crem prin transformare variabile noi, i nu s modificm valorile existente din variabilele primare a cror pierdere ar necesita reintroducerea lor, n caz de necesitate. Recodificarea variabilelor Recodificarea unei variabile nseamn convertirea valorilor acesteia, cu scopul obinerii unei distribuii bazat pe frecvene cumulate. Procesul este similar cu crearea unei tabele de frecvene grupate i ne reamintim c poate fi derulat n maniera descris mai jos: Pai pentru gruprii de frecvene: Se face diferena dintre valoarea cea mai mare i valoarea cea mai mic a unei distribuii Se mparte valoarea obinut la mrimea posibil (estimat) a intervalului Se selecteaz mrimea intervalului care conduce la un numr de clase cuprins ntre 5 i 15 Se determin limita inferioar a primului interval (trebuie s fie un multiplu al mrimii intervalului) Se determin limita superioar a primului interval Se construiesc intervalele de clas pentru fiecare interval, fiind ateni s avem clase suprapuse sau intervale neacoperite n principiu, dei este recomandabil obinerea unei grupri de frecvene pe 5-15 clase, se poate opta pentru un numr de clase care servete cel mai bine interesul de cercetare. De exemplu, n cazul unei distribuii de vrst exprimat n ani, este preferabil s se opteze pentru clase cincinale sau decade, acestea avnd i o anumit semnificaie psihologic. n urma transformrii de mai sus, am obinut variabila virsta. Utilizarea ei ca atare n analize statistice este improprie, de aceea ar fi foarte util obinerea unei variabile care s asocieze anumite valori convenionale pentru categorii de virsta. Pentru aceasta putem efectua recodificarea variabilei virsta pentru a obine o distribuie grupat de frecvene, astfel: Se lanseaz procedura Recode - Into Defferent Variables din meniul Transform:

Atenie, se poate alege i opiune Into Same Variables, dar nu este recomandabil deoarece, n cazul unei erori, nu mai avem la dispoziie variabila iniial pentru o nou recodificare.

- 24 -

Pai de efectuat la apariia casetei Recode into Defferent Variable: se trece variabila virsta n zona Numeric Variable Output Variable. Semnul ntrebrii arat c se ateapt numele variabilei ce urmeaz s fie creat prin recodificare. Acest nume se scrie n zona: Name, dup care se apas butonul Change. Am ales, absolut convenional, ca nume al variabilei recodificate, v_clase. Urmeaz acum s descriem limitele claselor de recodificare. Pentru aceasta, se acioneaz butonul Old and New Values

Dei relativ complicat, caseta de declarare a noilor valori n funcie de cele vechi este uor de neles.

n zona Old value, se alege una dintre variantele de definire a valorilor de la care se pleac. S zicem c am ales soluia s recodificm anii pe intervale de zece ani, primul interval fiind 29-39, al doilea 40-49, .a.m.d. Pentru aceasta activm opiunea Range i scriem valorile limite al intervalului dorit. Dup aceasta, n zona New value oValue, scriem care este valoarea pe care o asignm acestei clase. n fine, acionm butonul Add pentru a definitiva operaiunea i trecem la definirea urmtoarei clase, pn terminm. n zona OldNew se poate observa lista recodificrilor definite. Se acioneaz butonul Continue i, la revenirea n caseta anterioar, butonul OK. Rezultatul operaiuni se vede mai jos:

- 25 -

Se observ corespondena dintre valoarea din variabila virsta, cu valoarea din variabila v_clase. Pentru valoarea 71, avem missing value n variabila v_clase, deoarece nu am definit un interval care s cuprind aceast vrst. (De regul, aceast situaie este determinat de o eroare de definire a intervalelor de clas. Pentru a o repara, ar trebui s intrm din nou n procedura Recode i s redefinim clasele).
relua.

Transformarea operat pe variabila vrst nu este de loc inutil. Dac am fi dorit s vedem n ce msur este o relaie ntre nivelul salariului i vrst, ar fi fost oarecum impropriu (fr a fi propriu-zis o greeal ) s utilizm o statistic parametric (corelaia). n analizele statistice pe vrste este recomandabil, totui, s operm cu grupe de vrst. Ordonarea dup rang a valorilor unei variabile Aa cum am spus n cuprinsul primei pri a acestui volum, este posibil s ne confruntm cu o variabil cantitativ ale crei valori nu respect condiiile unei statistici parametrice (vezi figura din stnga, unde valoarea 250 este excesiv). ntr-o situaie de acest gen, una din soluiile posibile este transformarea de rang, cu procedura TransformRank cases (caseta din dreapta):

- 26 -

Variabila vizat (scor) este trecut n lista Variable(s), se seteaz modul de ordonare (am ales atribuirea rangului 1 valorii celei mai mari) iar apoi am acionat butonul OK. Procedura permite fixarea unor parametri de transformare cu ajutorul butoanelor Rank i Ties, asupra crora nu insistm aici.

Organizarea datelor pentru analiz


SPSS permite efectuarea unor operaii de organizare a datelor care prezint un interes aparte pentru faza de analiz. Acestea sunt: sortarea, mprirea fiierului n subgrupuri, selectarea unor seturi de date, combinarea fisierelor (adugarea de cazuri, adugarea de variabile). Le vom trece n revist, pe rnd. Sortarea bazei de date Sortarea este operaia de aranjare a bazei de date n funcie de ordinea cresctoare/descresctoare a valorilor unei variabile. Ea este util mai ales pentru inspectarea direct a valorilor de la extrema unei distribuii sau pentru listarea ordonat a bazei de date. Procedura utilizat este: Data-Sort. Baza de date nesortat Caseta Sort Cases

Imaginea din caset descrie sortarea bazei de date, cresctor (Ascending), dup valorile variabilei scor (rezultatul se vede n imaginea de mai jos).

Se poate efectua sortarea simultan dup mai multe variabile, fiecare n sensul dorit, de exemplu: grup(Ascending) i scor(Descending). - 27 -

mprirea bazei de date n subgrupuri Baza de date SPSS poate fi mprit n subgrupuri, pentru analiz distinct. Atunci cnd datele sunt astfel organizate, orice procedur de analiz se va efectua distinct pentru fiecare subgrup. Procedura este: Data-Split File iar caseta de dialog este cea de mai jos:

Opiunile sunt: Analyze all cases, do not create groups (pentru analiza integral a datelor) Compare groups (rezultatele vor fi afiate astfel nct s poat fi uor comparate) Organize output by groups (rezultatele vor fi afiate n Viewer, separat pe grupuri)

Operaia nu produce nici o modificare vizibil asupra bazei de date. Singurul efect se vede n zona de afiare a rezultatelor, unde toate procedurile de analiz vor fi afiate pentru fiecare subgrup n parte. Pentru a se reveni la analiza intergral a datelor, se va reveni n procedura Split File i se va seta opiunea Analyze all cases.... Selectarea unor seturi de date Selectarea unui set de date permite aplicarea procedurilor de analiz numai pe cazurile selectate. Dac nu se opteaz pentru tergerea datelor neselectate, ele vor fi pstrate i vor putea fi reintroduse n analiz. Procedura este Data-Select Cases.... Pentru exemplificare, s ne propunem selectarea din baza de date din imaginea de mai sus a cazurilor aparinnd grupului 1. Imaginea prezint: n partea stng, baza de date La mijloc, caseta principal Select Cases care are: o Zona listei de variabile o Zona fixare a condiiilor de selectare Select, unde:

- 28 -

o o o o

All cases este setarea implicit i nseamn c toate datele intr n analiz If condition is satisfied, se bifeaz atunci cnd se dorete declararea unei condiii de selectare bazat pe o funcie IF este butonul de deschidere a casetei pentru declararea condiiei, care deschide caseta Select Cases: if. n cazul nostru, am trecut variabila grup n zona de editare a functie i am declarat-o egal cu 1. Astfel, toate cazurile din baza de date care au grup=1 vor fi analizate, celelalte fiind ignorate. Exemplul se bazeaz pe o selecie simpl, dar sunt permise selecii bazate pe funcii mai complicate sau care pot s includ combinaii de variabile. Random sample of cases, permite selectarea unui set aleator de cayuri din baya de date Based on time por case range, permite selectarea cazurilor n funcie de poziia din baza de date. Use filter variable, selecteaz pe baza valorile unei variabile filtru Unselected cases Are, permite opiunea de filtrare a cazurilor neselctate (Filtered) sau de eliminare a lor (Deleted). n acest din urma caz, cazurile neselectate vor fi terse, dar baza de date, dar actualizarea fiierului de pe hard disk se va face numai dup prima comanda Save.

Dup finalizarea operaiei de selectare de mai sus, baza de date se prezint n felul urmtor:

- 29 -

Se observ: Marcarea cu o diagonal a capului de linie corespunztor cazurilor neselectate Apariia unei variabile de sistem filter_$ care conine valoarea 0 pentru cazurile neselectate i valoarea 1 pentru cazurile selectate. Aceast variabil poate fi ulterior utilizat n procedurile de analiz, ca variabil independent (caz n care se va anula situaia de selectare, prin bifarea opiunii All cases).

Selectarea este utilizat n mod obinuit, pentru alegerea temporar a unui set de date. Adesea se uit anularea unei selectri existente, atunci cnd se dorete revenirea al analiza tuturor cazurilor. Efectul este obinerea unor rezultate pe date pariale. Alte operaii de organizare a datelor pentru analiz Opiunile SPSS pentru organizarea datelor sunt mult mai numeroase dect cele descrise mai sus. Fr a le trata n amnunt, ne vom mulumi s le prezentm sumar: Agregarea cazurilor, atunci cnd exist nregistrri multiple pentru fiecare subiect i se dorete pstrarea uneia singure (Data-Agregate) Adugarea unor cazuri din alt baz de date SPSS (Data-Merge Files-Add cases...) Adugarea unor variabile din alt baz de date SPSS (Data-Merge Files-Add variables...) Inversarea liniilor cu coloanele (Data-Transpose...)

- 30 -

Calcularea indicatorilor statistici descriptivi


Reamintim faptul c statistica descriptiv are ca obiectiv analiza caracteristicilor variabilelor. Principalele elemente de statistic descriptiv sunt: reprezentarea ntregii distribuii, pe cale: o numeric (analiza de frecvene) o grafic (bar, histogram, box-plot, stem and leaf) valorile tendinei centrale o mod o medie o median valorile mprtierii o amplitudine o abatere standard valorile formei distribuiei o indice de simetrie (skewness) o indice de boltire (kurtosis) SPSS ofer posibiliti variate de reprezentare i de calcul a acestor indicatori. n acest sens exist, pe de o parte, proceduri specializate i, pe de alt parte, opiuni care pot fi accesate din interiorul altor proceduri. Fie i acest aspect numai, ar trebui s sugereze c analiza statistic descriptiv, n ciuda caracterului ei elementar, este o component indispensabil a analizei statistice. n ceea ce privete procedurile specializate, ele se lanseaz din meniul StatisticsSummarize (sau Analyze-Descriptive statistics, pentru versiunile mai noi de SPSS) i sunt grupate n trei proceduri: Frequencies, Descriptives i Explore. Aceste proceduri ofer prelucrri distincte dar conin i rezultate comune. Alegerea uneia sau alteia dintre ele depinde de necesitile de analiz.

Procedura Frequencies Este singura care permite analiza de frecvene. La apariia casetei Frequencies, variabila pe care dorim s o supunem analizei va fi trecut n lista de calcul Variable(s), prin selectarea ei i acionarea butonului de transfer - 31 -

(). Pot fi incluse mai multe variabile n aceast list, rezultatele fiind afiate distinct, pentru fiecare n parte.

Se va observa pe caseta de mai sus bifarea opiunii pentru tabela de frecvene, care este funcia specific a acestei proceduri. n plus, prin acionarea butoanelor din partea de jos a casetei se pot seta alte analize, astfel: Butonul Statistics Butonul Chart Butonul Format Se aleg indicatorii statistici Se alege tipul de Se aleg diverse moduri de descriptivi dorii grafic dorit prezentare a rezultatelor

Rezultatele sunt afiate n SPSS Viewer n forma de mai jos (dar unele sub altele, nu alturat, aa cum sunt aranjai aici): Indicatorii statistici descriptivi Tabelul de frecvene Histograma

Procedura Descriptives

- 32 -

Aceast procedur vizeaz doar indicatorii statistici descriptivi. La lansare, Satistics-Descriptives, se deschide caseta principal Descriptives. Se trec variabilele vizate n lista Variable(s) (dac dorim calcularea scorurilor z, se Se aleg indicatorii dorii din Options bifeaz opiunea din stnga-jos a casetei )

Rezultatul analizei, din Viewer

Imaginea bazei de date, n care se vede apariia variabilei zscor (denumit automat de progarm) cu valorile transformate n scoruri z.

Procedura Explore Procedura Explore este cea mai complex dintre toate procedurile statisticii descriptive i se poate utiliza atunci cnd se dorete o analiz exhaustiv a variabilei (sau variabilelor). Caseta principal Explore

n Dependent List se includ variabilele de analizat n Factor List se includ eventualele variabile categoriale, n funcie de care se dorete analiza variabilei analizate

- 33 -

Label cases by, permite etichetarea cazurilor la afiare (rar utilizat) Display, permite alegerea opiunilor de afiare a rezultatelor numerice (Statistics), grafice (Plots) sau ambele categorii (Both) Butonul Statistics deschide caseta pentru alegerea unor indicatori (dar procedura analizeaz, implicit toi indicatorii statistici descriptivi, de baz) Butonul Plots, permite alegerea reprezentrilor grafice dorite:

Butonul Options, permite setarea modului de tratare a valorilor lips

Rezultatele analizei Explore, definit mai sus, se prezint astfel: Indicatorii statistici Reprezentarea stem-and-leaf Reprezentarea Box plot

- 34 -

Teste parametrice
Testul z (t) pentru media unui singur eantion Utilizare Testul z pentru un singur eantion este utilizat pentru se testa diferena dintre media unui eantion fa de media cunoscut a populaiei din care face parte. Atunci cnd volumul eantionului este mic (N<30) este utilizat o variant denumit testul t pentru un singur eantion. Utilizarea acestui test statistic este condiionat de cunoaterea mediei populaiei. Dac populaia are o extindere mare, acest lucru este dificil de realizat (n afara cazurilor n care exist studii speciale, cum sunt cele antropometrice, de exemplu). Dintre variabilele psihologice ale crei medii pentru populaie este cunoscut, este inteligena, exprimat n uniti QI (=100). Testul poate fi utilizat, ns, atunci cnd populaia are o extindere mai redus. De exemplu, dac a fost evaluat nivelul de satisfacie ntr-o organizaie, se poate testa diferena dintre nivelul de satisfacie la nivelul unei secii fa de media satisfaciei la nivelul ntregii organizaii (populaie). Condiii de aplicare Condiia teoretic de baz este normalitatea distribuiei de eantionare. n temeiul teoremei limitei centrale, cu ct volumul eantionului este mai mare, cu att normalitatea distribuiei de eantionare este mai sigur. Aranjarea datelor Datele supuse testrii trebuie s fie incluse ntr-o variabil SPSS de tip numeric. Procedura: Statistics-Compare Means-One Sample T Test Caseta principal Variabila testat este trecut n lista Test Variable(s) n zona Test Value se nscrie media populaiei (100 n cazul nostru) Caseta Options permite alegerea pragului de semnificaie. Confidence Interval 95% este echivalent cu p=0.05 i este implicit pentru toate testele statistice

Variabila testat

Rezultate

- 35 -

Primul tabel include statistica descriptiv a variabilei testate (N, media, ab.std, eroarea standard a mediei) Al doilea tabel include rezultatele testului statistic: t=6.254, df=4, p=0.03, diferena fa de media populaiei (22.6) i limitele inferioar (12.57) i superioar (32.63) ale intervalului de ncredere pentru media populaiei estimat de eantionul de cercetare. Concluzia testului: media eantionului de cercetare difer semnificativ de QI=100, ca medie a populaiei.

- 36 -

Testul t pentru eantioane independente Utilizare Testul t pentru eantioane independente este utilizat pentru testarea diferenei dintre mediile aceleiai variabile dependente msurate pe dou grupuri, formate din subieci diferii. Exemplu: testarea diferenei dintre media scorului la o scal de sociabilitate aplicat unor copii crescui n familie i unor copii crescui n instituii de ocrotire. n acest caz, scorul la sociabilitate este variabila dependent, msurat pe scal cantitativ (interval/raport) iar mediul de educare este variabila independent, exprimat pe scal nominal dihotomic (familie/instituie de ocrotire) Condiii Teoretic, testul t poate fi utilizat pentru eantioane orict de mici, dac distribuia de eantionare pentru cele dou grupuri este normal i dac variana valorilor n cele dou grupuri nu difer semnificativ. n ce privete condiia egalitii varianei, ea este testat cu un teste specifice. Unul dintre acestea este testul Levene, iar n funcie dac rezultatul su programul calculeaz testul t pe dou ci, aa cum vom vedea mai jos. Dac variabila dependent nu ntrunete condiiile pentru testul t, se poate apela la teste neparametrice, astfel: Testul z pentru proporii (compararea procentului de sociabili din cele dou grupuri) Testul Mann-Whitney U, dac se transform valorile variabilei sociabilitate n valori de rang Aranjarea datelor Tabela de date SPSS va conine variabila dependent, de tip numeric, i variabila independent, de tip nominal, cu dou valori, n funcie de apartenena la un grup sau altul. Variabila independent poate fi de tip string (codificnd cele dou grupuri cu valori de genul A i B) sau de tip numeric (cu codificarea convenional 1 i 2). Din principiu, ns, recomandm cea de a doua variant.

Procedura: Statistics-Compare means-Indpendent Samples T Test

- 37 -

n caseta principal se trece variabila dependent (soc) n lista Test Variable(s) (pot fi testate mai multe variabile simultan) iar variabila independent (grup), n zona Grouping Variable. n acest moment, programul ataeaz variabilei dependente dou semne de ntrebare, sugernd introducerea valorilor care definesc cele dou grupuri. Concomitent, se activeaz butonul Define Groups a crui acionare deschide caseta secundar Define Groups, unde se introduc valorile care definesc cele dou grupuri comparate (ordinea lor nu este relevant). Dup acionarea butonului Continue, caseta principal devine complet i se poate aciona OK pentru efectuarea testului.

Rezultate

- 38 -

n primul tabel (Group Statistics) avem statistica descriptiv a celor dou grupuri. Se va observa c programul descrie grupurile prin intermediul etichetelor valorilor. Dac acestea nu ar fi fost definite, n loc de institutie i familie ar fi aprut 1, respectiv, 2. Al doilea tabel are dou linii: Pe prima avem rezultatele testului t pentru cazul asumrii omogenitii varianei (Levenes Test for Equality of Variances). n cazul nostru, ele sunt egale (Sig.=0.666, ceea ce se traduce ca o valoare p=0.666, deci mai mare de 0.05 pentru distribuia F a testului Levene, pe care nu o discutm aici). Ca urmare, vom citi pe aceast linie rezultatul testului: t=-2.42, df=12, Sig.=0.045. Pe a doua linie avem rezultatele testului t pentru cazul n care nu s-ar ntruni condiia de omogenitate a varianei pentru cele dou grupuri. Dac semnificaia testului Levene ar fi fost mai mic sau egal cu 0.05, rezultatului testului t s-ar fi citit pe aceast linie. Pentru exemplul nostru, rezultatul testului t permite acceptarea ipotezei cercetrii, conform creia copiii crescui n mediu familial sunt mai sociabili (m=22.00) dect cei crescui n mediu instituional (m=17.71).

- 39 -

Analiza de varian unifactorial (One Way ANOVA) Utilizare n mod obinuit, analiza de varian este utilizat pentru a testa semnificaia dintre mediile msurate pe mai mult de dou grupuri independente (compuse din subieci diferii). n acest caz valorile variabilei dependente sunt exprimate pe scal cantitativ (I/R) iar valorile variabila independent este de tip categorial. Dac se utilizeaz ANOVA pentru a testa diferena dintre dou medii obinute pe grupuri independente, rezultatul ei este echivalent cu al testului t pentru grupuri independente (menionm, ns, c aceast utilizare este neuzual). Exemplu: Se compar media timpului de reacie pentru trei grupuri experimentale, supuse fiecare, anterior evalurii vitezei de reacie, unui oc electric de intensitate mic, medie sau mare. n acest caz s-ar putea obiecta c variabila independent se exprim pe o scal ordinal dar, n esen, ea este de tip categorial, fapt ce justific aplicarea testului ANOVA. Condiii Variabila dependent trebuie s fie de tip I/R i s respecte condiia de normalitate a distribuiei de eantionare pentru fiecare dintre grupurile supuse comparaiei. Din fericire, testul F este remarcabil de robust n cazul nclcrii acestei condiii. ANOVA este mai vulnerabil n situaia cnd distribuia variabilei dependente este prea aplatizat sau prea nalt (kurtosis0) dect n cazul asimetriei (skewness0). Cu ct volumul grupurilor supuse comparaiei este mai mare, cu att aspectele legate de normalitatea distribuiei au un efect mai mic asupra ANOVA. Variana valorilor variabilei dependente n interiorul grupurilor definite prin valorile variabilei independente trebuie s fie egal. Aceast condiie se numete omogenitatea varianei. nclcarea acestei condiii nu invalideaz testul ANOVA, care este destul de robust i n acest caz. n orice caz, se vor analiza cu atenie cazurile care prezint valori extreme, care au un efect important asupra varianei. Egalitatea (omogenitatea varianei) poate fi testat cu testul Levene. Aranjarea datelor Se construiete o variabil independent (definit ca factor n contextul ANOVA) care conine codurile de apartenen a cazurilor la fiecare dintre grupurile supuse analizei (n cazul nostru 1=oc mic, 2=oc mediu, 3=oc mare) i variabila dependent, care conine valorile timpului de reacie.

- 40 -

Se va reine c procedura ANOVA nu suport variabila independent de tip string. n imagine baza de date SPSS este ordonat dup variabila shoc dar acest lucru nu este necesar pentru procedura de calcul. Procedura: Statistics-Compare Means-One-Way ANOVA... Caseta principal One-Way ANOVA: Variabila dependent de trece n lista Dependent List (pot fi testate mai multe variabile simultan) Variabila independent se trece n zona Factor. Caseta Post Hoc Multiple Comparison: Se aleg testele de analiz post-hoc, pentru testarea diferenei dintre medii luate dou cte dou. Pentru c nu tim inc dac variana este omogen, vom bifa cte un test pentru fiecare caz (Bonferoni, pentru varian neomogen i Tamhane T2, pentru varian omogen).

n caseta Options, bifm Descriptives, Homogeneity-of-variance i Means Plot.

- 41 -

Dup finalizarea setrilor se apas OK pe caseta principal i se analizeaz rezultatele. Rezultate

Tabelul Descriptives prezint indicatorii descriptivi ai variabilei dependente pentru grupurile analizate.

Tabelul Test of Homogeneity of Variance conine rezultatul testului Levene. O valoare neseminificativ a acestuia (cum este cazul nostru p=0.988), conduce la concluzia c dispersiile n interiorul celor trei grupuri sunt omogene).

Tabelul ANOVA conine rezultatului testului F a crui valoare este 35.264 pentru un prag p=0.000. Atenie, p=0.000 nu se va nelege ca p=0 ci ca p<0.001. n raportul de cercetare este chiar recomandabil s nu se utilizeze valoarea 0.000 care poate sugera certitudinea rezultatului.

Tabelul Post Hoc Tests Multiple Comparisons prezint comparaiile mediilor celor trei grupuri, luate dou cte dou. Reamintim c comparaiile repetate dintre mediile a mai mult de dou grupuri conduc la acumularea de eroare de tip I. Testele post-hoc sunt

- 42 -

astfel n concepute nct s minimizeze acest neajuns. Totui, ele nu vor fi n nici un caz luate n considerare dac testul F nu atinge pragul de semnificaie statistic (p<0.05). Avnd n vedere c testul Levene a confirmat omogenitatea varianei, se vor citi valorile pentru testul Bonferoni (n caz contrar, s-ar fi citit cele pentru testul Tamhane). Valorile aunt uor de analizat: n prima coloana avem definite grupurile analizate (etichetarea valorilor variabilei independente ajut mult la inteligibilitatea tabelului). n coloana a patra (Sig.) se afl semnificaiile pentru diferena dintre medii. Astfel, putem constata faptul c timpul de reacie dintre grupul supus ocului de mica intensitate i cel supus ocului de medie intensitate nu difer semnificativ (p=0.520). n acelai timp, grupul supus unui oc mic difer de grupul supus unui oc mare (p<0.001), la fel ca i n cazul comparaiei dintre grupul cu oc mediu i cel cu oc mare (p<0.001). Cu alte cuvinte, variaia semnificativ a timpului de reacie n funcie de cele trei categorii de intensitate a ocului electric, provine cu precdere de la efectul pe care l are ocul mare, care provoac o ncetinire a timpului de reacie consistent fa celelalte dou categorii de oc electric. Aceasta concluzie este ntrit i de reprezentarea grafic a mediei timpului de reacie ale celor trei grupuri.

Aa cum se poate observa, timpul de reacie crete mai accentuat la grupul cu oc mare n timp ce mediile primelor dou niveluri de oc sunt relativ apropiate.

- 43 -

Testul t pentru eantioane dependente (perechi) Utilizare Testul t al diferenei mediilor a dou eantioane dependente permite evaluarea semnificaiei variaiei unei anumite caracteristici la aceeai indivizi n dou situaii diferite (de exemplu, nainte i dup aciunea unei anumite condiii, ori n dou contexte diferite, indiferent de momentul manifestrii acestora). Avantajul major al acestui model statistic este acela c surprinde variaia numit intrasubiect, prin faptul c baza de calcul este diferena dintre cele dou valori ale fiecrui subiect n parte. Exemplu: Un grup de subieci efectueaz operaii aritmetice n condiii de linite i, ulterior, n condiii de zgomot puternic. Ipoteza cercetrii este c zgomotul determin o reducere a capacitii de calcul numeric. Condiii Condiia teoretic a testului este normalitatea distribuiei de eantionare a distribuiei de diferene. Ca i n celelalte cazuri, teorema limitei centrale determin normalizarea distribuiei de eantionare pe msur ce volumul eantionului crete. n situaia n care condiia nu se ndeplinete, se pot utiliza teste neparametrice echivalente: testul semnului (pentru date nominale) sau testul Wilcoxon (pentru date ordinale). Aranjarea datelor Vor fi create dou variabile distincte, ambele cantitative, msurate pe scal de tip I/R, care primesc cte o valoare pentru fiecare subiect.

- 44 -

Procedura: Statistics-Compare Means-Paired Sample T Test... Se selecteaz cu un clic de mouse, pe rnd, fiecare dintre cele dou variabile. Astfel se constituie perechea de variabile n zona Curent selection. O dat constituit, perechea de variabile se trece n lista Paired Variables cu butonul de transfer (). Pot fi create mai multe perechi de variabile i prelucrate simultan.

Caseta Options permite alegerea pragului de semnificaie (implicit 0.05). Rezultate

Primul tabel conine statistica descriptiv pentru cele dou variabile. Al doilea tabel conine testul de corelaie Pearson (r) dintre cele dou variabile. Evaluarea intensitatea asocierii liniare dintre cele dou variabile este legitim n acest context, dar ofer o informaie diferit de testul diferenei dintre medii. Alegerea testului de corelaie sau al testului t se decide n funcie de obiectivul cercetrii.

- 45 -

n fine, ultimul tabel prezint rezultatul testului: t=5.076, df=9, p=0.001. Acesta permite respingerea ipotezei de nul i acceptarea ipotezei cercetrii, zgomotul afecteaz capacitatea de calcul aritmetic. Coeficientul de corelaie liniar Pearson (r) Utilizare Corelaia Pearson (r) msoar gradul de asociere dintre variabile. Aceasta se refer la gradul i sensul de variaie concomitent a valorilor unei variabile n raport cu cealalt, dup un model de tip liniar. Domeniul de variaie a coeficientului de corelaie Pearson (r) este ntre r=-1 (corelaie perfect negativ) i r=+1 (corelaie perfect pozitiv). Absena oricrei legaturi (corelaii) dintre variabile se traduce prin r=0. Exemplu: Testul de corelaie implic dou variabile dar, adesea, ntr-o cercetare psihologic numrul variabilelor supuse corelaiei este mai mare de dou. Acest fapt conduce la ceea ce se numete o matrice de corelaii care este un tabel ale cror celule cuprind corelaiile dintre perechile de variabile. Pentru exemplificare, s lum n considerare situaia n care se urmrete evidenierea legturii (asocierii) dintre anxietate i agresivitate, pe de o parte, i preferina pentru risc pe de alt parte. Condiii Condiia principal pentru calcularea coeficientului de corelaie liniar Pearson este ca variabilele implicate s fie msurate pe scal de interval/raport (alturi de existena unei forme a distribuiei care nu se abate sever de la curba normal). Testele neparametrice alternative, pentru cazul n care condiiile pentru utilizarea testului Pearson nu se ndeplinesc, sunt: testul chi-ptrat (pentru date nominale) sau coeficienii de corelaie Spearman sau Kendall (pentru date ordinale). Aranjarea datelor Se creeaz variabile distincte pentru fiecare caracteristic supus testrii.

Procedura: Statistics-Corelate-Bivariate Variabilele supuse corelaiei vor fi trecute n lista Variables: - 46 -

Testul implicit, din zona Correlation Coefficients, este Pearson, dar se poate bifa un altul (Kendall sau Spearman), dac datele sunt neparametrice. Tipul implicit de testare a ipotezei este bilateral (Two-tailed), dar se poate alege unilateral (dac exist o justificare solid). Flag significant correlations, determin marcarea cu un asterisc a coeficienilor semnificativi la p=0.05 i cu dou asteriscuri a celor semnificativi la p=0.01. Acest lucru este util atunci cnd matricea de corelaie este mare, pentru a scoate n eviden valorile semnificative ale lui r.

Rezultate

Tabelul rezultatelor cuprinde matricea de corelaii a variabilelor analizate. El este redundant, deoarece prezint aceleai corelaii de dou ori, odat deasupra diagonalei, odat sub diagonal. Corelaiile variabilelor cu ele nsele sunt perfect pozitive (r=1) i nu prezint, desigur, nici un interes. Fiecare celul include urmtoarele informaii: valoarea lui r nivelul p numrul de subieci (N)

- 47 -

n cazul nostru, consemnm corelaii negative dar nesemnificative ntre anxietate i agresivitate (r=-0.38, p=0.26), pe de o parte, i ntre anxietate i preferina pentru risc, pe de alt parte (r=-0.40, p=0.24). n acelai timp, se constat o corelaie semnificativ (r=0.96, p<0.001) ntre agresivitate i preferina pentru risc. Precizm faptul c raportarea coeficienilor de corelaie se face cu dou zecimale, chiar dac programele i calculeaz cu trei zecimale. Dezavantajul acestui tip de tabel const n faptul c avem de fapt o dubl prezentare a corelaiilor, deasupra diagonalei i sub diagonal. Pentru corelaii implicnd multe variabile tabelul se va cit cu relativ dificultate. S presupunem c suntem interesai de corelaiile dintre anxietate i agresivitate cu variabila preferin pentru risc, nu i de corelaia dintre anxietate i agresivitate. n acest caz, n caseta principala, Bivariate Correlations, prezentat mai sus, variabilele vor fi introduse astfel nct variabila preferina pentru risc sa fie ultima din list. Apoi se apas butonul Paste, al crui efect este deschiderea domeniului Syntax, ca o fereastr distinct, n care se afl sintaxa procedurii de corelaie. Acolo, pe linia /VARIABLES=anx agresiv risc, se insereaz cuvntul WITH, avnd grij s existe spaiu att n sting ct i n dreapta sa.

inserai WITH

Mai departe, se selecteaz ntreaga procedur (cu ajutorul mouse-ului) i se apas pe butonul Run () de pe bara de comenzi a ferestrei Rezultatul din Viewer va arta ca mai jos:

Este evident c aceast modalitate se poate aplica pentru orict variabile, dac avem grij s le aezm separat n list i s includem clauza WITH ntre cele dou categorii de variabile. Nu pot fi incluse mai multe clauze WITH n aceeai procedur.

- 48 -

Ulterior, putem reveni n fereastra Syntax pentru a o nchide (cu File-Close), salvnd sau nu procedura astfel modificat. Expresia grafica a corelaiei (Scatterplot) Caracterul i intensitatea corelaiei dintre dou variabile se evideniaz extrem de sugestiv cu ajutorul unei proceduri grafice specifice, numit scatterplot. Aceasta se lanseaz din meniul principal Graphs-Scatter... care deschide urmtoarea caset de dialog:

n cazul nostru, s presupunem c dorim reprezentarea grafic a corelaiei dintre agresivitate i preferina pentru risc, singura semnificativ. n acest scop, selectm pe caseta Scatterplot opiunea Simple i apsm Define.

Trecem variabila Agresivitate pe axa Y i variabila Preferina pentru risc pe axa Z (se poate la fel de bine i invers). Se apas OK i se obine graficul din imaginea urmtoare, care sugereaz foarte clar existena unei asocieri de tip liniar ntre cele dou variabile.

- 49 -

Reprezentarea grafic este surs de informaii cu privire la natura relaiei dintre variabile, motiv pentru care este recomandabil utilizarea frecvent a acesteia. Mai mult, ea este necesar n special atunci cnd valoarea corelaiei este redus, sau nesemnificativ, deoarece graficul poate scoate n eviden o legtura de alt tip dect liniar. O corelaie r=0.92, ca cea obinut mai sus, ntre agresivitate i preferin pentu risc, este improbabil s se ntlneasc ntr-un studiu real. De fapt, dac s-ar ntmpla s apar, ar trebui s concluzionm mai degrab c cele dou variabile se confund, dect c sunt distincte.

- 50 -

Regresia liniar simpl Utilizare Analiza de regresie este o aplicaie a corelaiei, utilizat n scopuri de predicie. Dac evalum agrsesivitatea ca trstur de personalitate i preferina pentru risc ca expresie a numrului de incidente n trafic, la conductorii auto, se poate estima pe baza agresivitii riscul de accident nc nainte de dobndirea carnetului de ofer. Acest tip de regresie, n care exist o singur variabil predictor (agresivitatea) i o variabil criteriu (tendina spre risc) se numete regresie liniar simpl. Mai frecvent utilizat este regresia multipl, care efectueaz predicii bazate pe mai multe variabile predictor asupra unei variabile criteriu. Vom prezenta mai jos regresia liniar simpl, ca o form de introducere n analiza de regresie, mai uor de neles. Exemplu: Predicia rezultatului statistic pe baza cunotinelor de matematic, evaluate anterior nceperii cursului de statistic. Condiii Din punct de vedere statistic, condiiile variabilelor care sunt supuse analizei de regresie sunt aceleai ca n cazul corelaiei, deoarece regresia liniar este o aplicaie a acesteia. Din punct de vedere metodologic, predicia presupune, de regul, evaluarea variabilei predictor anterior variabilei criteriu. Acest fapt poate sugera o relaie de tip cauzal ntre variabile, dar numai dac sunt ntrunite i alte condiii (cum ar fi izolarea efectelor altor variabile). Aranjarea datelor Structura de variabile este similar analizei de corelaie.

- 51 -

Procedura: n principiu, analiza de regresie ncepe cu coeficientul de corelaie dintre variabile i vizualizarea imaginii scatterplot. n cazul nostru, urmnd procedura prezentat mai sus, am obinut o corelaie r=0.74 (p=0.002). Aceste valori confirm existena unei legturi pozitive semnificative, ntre cunotinele de matematic i performana la statistic. O idee mai exact ne ofer coeficientul de determinare r2=0,5476. Acesta ne spune c 54% din variaia performanei la statistic este explicat de variaia valorilor la variabila cunotine de matematic. Deducem c restul de 46% din performana la statistic este explicat de alte variabile, necunoscute n aceast faz1. Pe baza acestor concluzii se poate trece la analiza de regresie a crei finalitate este aceea de obinere a coeficienilor a (termenul liber, sau originea dreptei de regresie) i b (panta dreptei de regresie), cu ajutorul crora se poate estima n viitor performana la statistic pe baza rezultatului la un test de cunotine matematice aplicat n prima zi de coal. Nendoielnic, o astfel de procedur s-ar justifica mai ales pentru identificarea studenilor cu poteniale dificulti i care, tocmai fiind avertizai n legtur cu aceste dificulti vor putea s acorde statisticii o atenie sporit, n vederea obinerii unui rezultat peste nivelul celui prezis. Lansarea procedurii: Statistics-Regression-Linear...

n caseta principal Linear Regression, se trece variabila criteriu n zona Dependent iar variabila criteriu n zona Independent(s). n caseta Regression Save, bifm Predicted Values-Unstandardized i ResidualsUnstandardized, care vor avea ca efect crearea de variabile distincte n baza de date. Prediction interval (individual) va calcula limitele de ncredere pentru valorile prezise.

n caseta Statistics, bifm Estimates pentru obinerea coeficienilor de regresie (opiune implicit)

Facem precizarea c valorile i aprecierile nu se bazeaz pe un studiu reale.

- 52 -

Valorile prezise sunt valorile rezultate pe baza modelului de predicie. Valorile reziduale se calculeaz ca diferen ntre valorile variabilei criteriu si cele prezise pe baza modelului de regresie. Analiza rezultatelor

Tabelul Model Summary ofer valoarea coeficientului de regresie, notat cu R, care este identic cu coeficientul de corelaie dintre cele dou variabile. Dac modelul de regresie ar fi avut mai multe variabile predictor, R ar fi fost coeficientul de corelaie multipl dintre predictori i criteriu. Interpretarea este similar coeficientului de corelaie simpl, la fel ca i pentru R2, care este coeficientul de determinare al lui R. Valoarea lui ne spune c 55% din variaia performanei la statistic este explicat de variaia variabilei cunotine de matematic. Adjusted R Square este o corecie a lui R2 n funcie de numrul de predictori i numrul de subieci.

Tabelul Coefficients conine coeficienii B (nestandardizai) i coeficientul beta (standardizat), care pot fi utilizai, la alegere, n ecuaia de predicie. Astfel, de exemplu, dac un student realizeaz un scor de 30 la testul de cunotine de matematic, se poate estima performan final la statistic cu ajutorul relaiei:

stat _ fin = a + b * mat _ in = 3.406 + 0.854 * 30 = 29.02

unde 3.406 este originea iar 0.854 este panta dreptei de regresie.

- 53 -

Sau, dac predicia se face pe baza unui scor standardizat z al variabilei mat_in (s zicem, 0.93), atunci:

stat _ fin = beta * mat _ in = 0.742 * 0.93 = 0.69

n acest caz termenul liber are valoarea 0, deoarece originea dreptei pentru scoruri standardizate se afl n 0. Desigur, scorurile astfel prezise sunt estimri, atta timp ct corelaia dintre variabile nu este perfect. Iar estimrile conin cu att mai mult eroare cu ct corelaia dintre variabile este mai mic (punctele graficului de corelaie fiind mai ndeprtate de dreapta de regresie). La finalul procedurii analizei de regresie, cu setrile de mai sus, n baza de date apar cteva variabile noi, aa cum se vede n imaginea de mai jos.

Variabila pre_1, conine valorile prezise pe baza modelului de regresie.

Variabila res_1, conine diferena dintre valoarea real i valoarea prezis Variabilele lici_1 i lici_2, conin limitele inferioar i superioar ale intervalului de ncredere pentru fiecare valoare n parte. Pentru a nelege mai bine problema limitelor, s privim prima valoare prezis de pe coloana pre_1 (25.598). Cu un nivel de ncredere de 95% (echivalent cu o probabilitate de eroare de 0.05), putem spune c valoarea adevrat pentru stat_fin prezis pe baza valorii mat_in=26, s-ar afla n intervalul 21.77 i 29.41. n fine, rezultatele conin i imaginea scatterplot a relaiei dintre valorile mat_in i scorurile z ale variabilei pre_1.

- 54 -

Imaginea este identic cu ceea ce am prezentat n cazul corelaiei. Singura deosebire este dat de trasarea dreptei. Aceasta se face de ctre operator, n felul urmtor: - se acioneaz dublu clic de mouse pe imaginea graficului din Viewer. prin care... - graficul este trecut deschis ntr-o fereastr individual de editare, n care... - se execut procedura Chart-Options-Fit Line- Fit Options. La captul acestei serii de aciuni apare caseta de mai jos unde se marcheaz Linear regression.

Facem precizarea c acest procedeu de trasare a liniei n interiorul scatterplotului este utilizabil i n cazul corelaiei. Dac se alege alt model dect cel liniar (de exemplu, Quadratic regression) se va obine linia de regresie sub form curbilinie, punnd n eviden abaterile de la modelul liniar. Acest lucru este cu deosebire util atunci cnd corelaia este mic, fapt care se poate datora faptului c relaia dintre variabile nu urmeaz un model liniar (vezi exemplul din prima seciune a manualului, bazat pe corelaia dintre scorurile z i probabilitile de sub curba normal). Ce utilizm, corelaia sau regresia? Corelaia i regresia liniar sunt similare i, de aceea, uor de confundat. n unele situaii pot fi utilizate ambele proceduri.

- 55 -

Se calculeaz corelaia liniar: atunci cnd exist dou variabile msurate pe aceiai subieci i se dorete evaluarea gradului de asociere ntre variabile atunci cnd distribuiile de eantionare ale celor dou variabile sunt normale (atunci cnd cel puin una dintre variabile este manipulat, nu se calculeaz corelaia Pearson) Se calculeaz regresia liniar: atunci cnd una dintre variabile precede i poate fi cauza celeilalte variabile atunci cnd una dintre variabile este manipulat, se calculeaz regresia atenie, calculele regresiei nu sunt simetrice, ca urmare, inversnd variabilele n ecuaia de regresie se va obine o linie de regresie diferit, n timp ce dac se inverseaz ordinea variabilelor n calcularea corelaiei, se obine acelai coeficient r.

- 56 -

Analiza de consisten intern (Cronbach alfa) Utilizare Una din condiiile fundamentale a unui instrument de evaluare psihologic este aceea de a fi sigur i consistent. Exprimat cu alte cuvinte, aceasta nseamn ca itemii din care este constituit (ntrebri sau sarcini de alt natur) s contribuie la constituirea semnificaiei unui construct psihic anume: scala unui chestionar, scorul la o caracteristic psihic de performan, etc. n mod practic i direct exprimat, un instrument este sigur i consistent atunci cnd itemii din care este compus coreleaz, att ntre ei ct i fiecare dintre ei cu rezultatul aditiv al tuturor itemilor (scala, scorul global). Analiza de consisten intern, prin calcularea coeficientului Cronbach alfa, este metoda statistic prin care se verific respectarea exigenelor enunate mai sus. n esena ea este o aplicaie a corelaiei, ceea ce reprezint unul din motivele pentru care o tratm aici. Al doilea motiv, poate nc i mai important, este acela c nc din primii ani de studiu studenii la psihologie se afl n situaia de a utiliza instrumente psihologice sau de a le crea ei nii (cel mai adesea chestionare). n acest scop, evaluarea consistenei interne este o etap absolut obligatorie n elaborarea i finalizarea respectivului instrument. ntrebrile unui chestionar sau itemii unui test de performan sunt concepui pentru a msura un anumit atribut (atitudine, factor, comportament, cunotin). Consistena intern se definete ca proprietatea itemilor de a corela cu scorul global al testului sau scalei din care fac parte. Din moment ce toi itemii trebuie sa reflecte un anumit atribut, ei trebuie s manifeste o varian comun, s coreleze unii cu alii i, n acelai timp, s coreleze fiecare cu scorul care reflect atributul respectiv. Corelaia dintre un item i scorul total, din care se omite acel item, ne ofer o indicaie cu privire la relevana itemului respectiv pentru rezultatul global al testului. Atunci cnd fiecare item este relevant, putem spune c testul respectiv este are consisten intern. O alt faet a consistenei unui instrument este sigurana sa n aplicri repetate. Ea poate fi descris ca stabilitate a scorului atunci cnd acel instrument, sau o form alternativ echivalent, este aplicat acelorai subieci. Fr a fi singura procedur statistic utilizabil n astfel de situaii, coeficientul Cronbach alfa este de departe cel mai cunoscut dintre toate, fiind utilizat ca un indicator al preciziei de msurare a unui test, al consistenei interne i fidelitii unui instrument psihologic. n mod normal, valoarea indicelui Cronbach alfa tinde s creasc pe msur ce numrul itemilor crete. Dar utilizarea unor teste cu muli itemi este neconvenabil din mai multe motive. Unul dintre acestea este timpul consumat cu aplicarea lor, altul, poate fi inutilitatea de a pstra itemi a cror contribuie la scorul global este nul, mic sau, dimpotriv, merge n alt direcie dect acesta. Identificarea i eliminarea acestor itemi, ori modificarea lor n spiritul atributului msurat, este unul dintre obiectivele analizei de itemi. Ea are un caracter recursiv, cu evaluri succesive ale relaiilor dintre itemi i dintre itemi i scorul global, i operarea seleciei itemilor n funcie de relaia lor cu acesta. Criteriul de baz pentru aceast operaie este valoarea indicelui Cronbach alfa, care are o plaj de variaie ntre 0 i 1. O scal, pentru a fi considerat consistent, trebuie s ating o valoare ct mai aproape de 1, nivelul de 0.70 fiind acceptat de majoritatea cercettorilor ca prag limit de validare a criteriului de consisten intern. Oricum, valoarea lui Cronbach alfa nu poate fi mai mic de 0.60.

- 57 -

Coeficientul de consisten intern Cronbach alfa se calculeaz n urmtoarele situaii: atunci cnd realizm un instrument nou atunci cnd se traduce un instrument vechi ntr-o alt limb atunci cnd un instrument utilizat n anumite condiii, urmeaz a fi utilizat n cu totul alte condiii (de exemplu, trecerea la utilizarea computerizat a unui test aplicat pn atunci n regim creion hrtie). Condiii Crearea unor variabile distincte care conin rspunsurile la fiecare item (ntrebare). Valorile nregistrate pentru rspunsuri vor fi valorizate n funcie de semnificaia lor n raport cu rezultatul global (scala). Cu alte cuvinte, variabilele trebuie s conin valori care exprim semnificaia rspunsului n raport cu scala global, i nu rspunsul efectiv al subiectului. De exemplu, dac variantele de rspuns sunt codificate cu 1, respectiv 2, pot exista ntrebri pentru care varianta 1 aduce un punct la scala iar varianta 2 aduce zero puncte la scal. ntr-o asemenea situaie, pentru analiza de itemi valorile codificate de rspuns vor fi transformate n valori corespunztoare (0 i 1). n acelai mod se va opera i pentru itemii care au mai multe variante de rspuns, cum este cazul scalelor de tip Likert. Codurile convenionale ale variantelor de rspuns vor fi transformate n valori, n funcie de semnificaia contribuiei lor la construirea scorului global. Aranjarea datelor Baza de date va conine variabile pentru fiecare dintre itemii supui analizei (aceasta nu nseamn c nu pot exista i alte variabile, desigur).

Imaginea red rezultatele primilor opt subieci la o scal cu 10 itemi, de tip Lickert, pentru evaluarea atitudinii fa statistic. Toate prelucrrile care urmeaz sunt efectuate pe datele complete. Procedura: Statistics-Scale-Reliability Analysis...

- 58 -

n caseta principal, Reliability Analysis, variabilele itemilor vor fi trecui n lista Items (imaginea surprinde momentul n care mai sunt de trecut itemii de la 6 la 10). n lista Model se poate alege unul dintre urmtoarele modele de analiz: Alfa. Calculeaz Cronbach alfa care pentru date dihotomice este echivalent cu coeficientul Kuder-Richardson 20 (KR20) Split-half. Pentru corelaia dintre forme paralele, coeficientul de fidelitate Guttman, coeficientul Spearman-Brown, coeficientul alfa pentru fiecare jumtate. Modele Gutman. Coeficienii lambda, de la 1 la 6 Modele paralele i strict paralele. Testele pentru gradul de coresponden (goodness-of-fit), variana comun, i alte caracteristici ale raporturilor dintre itemi. Pentru analiza de consisten intern se alege modelul Alfa. n continuare, se fac setri de analiz prin deschiderea casetei Statistics:

n zona Descriptives se vor bifa opiunile: Item (analiza fiecrui item separat); Scale (analiza scorului global) Scale if item deleted (analiza scorului fr contribuia unui anumit item) n zona Inter-item se va bifa Corelations, pentru a obine matricea de corelaii dintre itemi. n zona Summaries se poate cere calcularea unor indicatori descriptivi pentru fiecare dintre itemii analizai (media, variana, covariana, corelaii). n practic, bifarea opiunilor marcate pe caseta din imaginea de mai sus ofer informaiile cele mai importante pentru analiza itemilor unui test. Celelalte opiuni sunt explicitate n Help-ul casetei i pot fi utilizate pentru o analiz mai rafinat a datelor. - 59 -

Rezultate n continuare vor fi analizai un cei 10 itemi ipotetici, alei doar n scop didactic. Pentru o scal real acest numr ar fi cu totul insuficient. Ca regul general, numrul itemilor din faza de dezvoltare a unui astfel de instrument ar trebui s aib cel puin dublul numrului de itemi pe care l preconizm la final. i aceast pentru c analiza de itemi este un proces selectiv care are drept scop alegerea itemilor adecvai pentru constituirea unei scale cu cel mai ridicat nivel de consisten intern posibil. Rularea procedurii, cu setrile de mai sus ne ofer urmtoarele categorii de informaii:

Tabelul de mai sus cuprinde lista itemilor, media abaterea standard i numrul cazurilor. . Analiza valorilor permite evidenierea tendinei centrale i a mprtierii rspunsurilor pentru fiecare item. Eventuale anomalii pot fi sesizate nc din aceast faz. De exemplu, se poate constata c media itemului I_02 este mai mic dect a celorlali, fapt care sugereaz rspunsuri grupate spre valorile mici.

Tabelul Correlation Matrix ofer o imagine a gradului de asociere dintre itemi. Valorile sunt utile, pe de o parte, pentru a sesiza itemii care tind s aib relaii negative cu ceilali, fiind un semn al unei posibile probleme de construire respectivilor itemi. Din tabelul alturat rezult c itemii i_02 i i_03 tind s se asocieze negativ cu majoritatea celorlali itemi. Pe de alt parte, valori extrem de ridicate ale unor corelaii, aproape de 1, ar putea sugera c itemii respectivi prezint un grad de similitudine care nu justific

- 60 -

utilizarea lor n aceeai scal (ar putea fi, de exemplu itemi formulai extrem de asemntor).

Tabelul urmtor conine un set de indicatori statistici descriptivi la nivelul ntregii scale, rezultat prin nsumarea rspunsurilor la fiecare item (medie, varian, ab.std, ) sau al itemilor.

n fine, cea mai important dintre categoriile de informaii, este tabelul Item-total Statistics, care include relaiile dintre itemi i scorul global. Dou dintre coloanele alturate au o importan particular: Corected Item-Total Correlation (corelaia dintre fiecare item i scorul global) i Alpha if Item Deleted (valoarea lui Cronbach alfa, dac respectivul item ar fi eliminat). Dac privim prima dintre aceste dou coloane, observm c doi dintre itemi (i_03 i i_09) au corelaii negative cu scorul global. Aceasta nseamn c ei nu numai c nu aduc informaie util n raport cu atributul msurat ci, dimpotriv, merg ntr-o direcie opus acestuia. n acest caz trebuie s verificm dac valorile itemului respectiv au fost corect codificate. Dac da, atunci singura soluie posibil este eliminarea itemilor n cauz. Observm, de asemenea, c itemul i_02 are o corelaie extrem de mic cu scorul global (0.015). Contribuia sa la construcia scalei este extrem de mic, nesemnificativ. Cu alte cuvinte, nici nu stric dar nici nu ajut, n schimb, consum timpul subiectului pentru a rspunde.

- 61 -

Pe ultima linie a imaginii gsim valoare lui Cronbach alfa, care este 0.457, o valoare care este modest n raport cu nivelul minim necesar (0.702) dar care poate fi crescut prin eliminarea itemilor nepotrivii, n primul rnd a celor care coreleaz negativ cu scorul global. Urmtoarea faz este reluarea prelucrrii, cu eliminarea itemilor negativi din lista Items din caseta principal. n general, nu este recomandabil eliminarea mai multor itemi simultan, dar itemii negativi pot fi scoi toi odat, fr reineri. Iat care este rezultatul eliminrii itemilor 3 i 9 asupra consistenei interne:

Ca urmare a noii iteraii, se observ c itemul i_02, care anterior avea o corelaie pozitiv dar extrem de mic, a dobndit o corelaie negativ cu scala. Ca urmare, va fi eliminat. n orice caz, chiar i itemii pozitivi, care au corelaii cu scala mai mici de 0.1 nu trebuie pstrai, pentru simplul motiv c nu contribuie la constructul psihologic vizat, fiind doar consumatoare de timp n aplicarea instrumentului. De altfel, se i observ c prin eliminarea acestui singur item, valoarea lui Cronbach alfa crete la 0.75. Se reia prelucrarea eliminndu-se itemul i_02 din lista din caseta principal i se obine urmtoarea configuraie de rezultate:

Datele indic o valoarea Cronbach alfa de 0.75. n plus, dac privim ultima coloan de cifre, vedem c prin eliminarea oricrui item nu am obine o valoare mai ridicat dect

Dei programele computerizate l calculeaz cu un numr mai mare de zecimale, indicele Cronbach alfa se raporteaz doar cu dou zecimale.

- 62 -

aceasta. Ca urmare, itemii rmai pot constitui o scal consistent de evaluare a constructului psihologic pentru care au fost alei. n concluzie, cu ocazia iteraiilor succesive se vor elimina, in ordine: itemii care au o corelaie negativ cu scorul global itemii cu corelaii mici, nerelevante Cu ct avem mai muli itemi n aceast faz, cu att avem posibilitatea s pstrm itemi care coreleaz mai intens cu scala i, deci, s atingem un nivel mai ridicat de consisten intern. Este de la sine neles c, n cazul n care construim un instrument ale crui ntrebri se adreseaz unor sub-scale diferite, consistena intern se va evalua separat pentru setul de ntrebri corespunztor fiecrei sub-scale. O scal consistent intern ne ofer garania c itemii instrumentului nostru merg mpreun, msoar acelai construct psihologic. Atenie, ns, acest lucru nu ne permite nc s afirmm c msoar exact ceea ce n-am propus s msoare. Aceast problem va fi rezolvat ulterior, prin studii de validare. Aa cum concluziile studiilor statistice sunt mai sigure atunci cnd sunt efectuate pe eantioane mai mari, acelai principiu se aplic i n cazul construciilor scalelor: cu ct mai muli itemi cu att mai bine pentru consistena scalei. Numrul itemilor necesari pentru a completa o scal care nu a atins valoarea acceptabil a indicelui Cronbach alfa poate fi estimat cu ajutorul formulei SpearmanBrown: k= unde: x este valoarea curent a lui Cronbach alfa k este nivelul dorit al lui Cronbach alfa k este factorul de multiplicare a scalei pentru a se obine k ntr-un mod similar, se poate estima valoarea lui Cronbach alfa (k) care ar fi atins pornind de la un anumit nivel calculat al acestuia x i un anumit factor de multiplicare al numrului de itemi (k):

k * (1 x ) x * (1 k )

k =

k * x 1 + (( k 1) * x )

Exemplu: Avem o scal cu 20 de itemi i x=0.50 Ci itemi ar trebui adugai pentru a atinge un nivel de 0.70? k=

k * (1 x ) .70 * (1 .50) = = 2.33 x * (1 k ) .50 * (1 .70)

Deci, pentru a atinge un de 0.70 va trebui s avem o scal de 20*2.3347 itemi, ceea ce nseamn c ne vor mai trebui 27 de itemi pe lng cei 20 deja existeni (estimare

- 63 -

valabil pentru situaia n care noii itemi ar avea aceeai corelaie inter-itemi cu cei deja existeni). Pentru acelai caz, cu ct ar crete dac am aduga 30 de itemi: k=(nr. itemi iniiali+nr. itemi noi)/nr. itemi noi=(20+30)/20=2.5

k =

k * x 2.5 * .50 = = 0.71 1 + (( k 1) * x ) 1 + ((2.5 1) * .50)

Desigur, se presupune c noii itemi adugai vor fi la fel de buni ca i cei deja utilizai. De aceea este posibil ca rezultatul formulei s fie o estimare uor optimist dar nu mai puin util. Utilizarea improprie a analizei de itemi Atunci cnd o scal este utilizat pentru a msura cunotine asupra unui anumit subiect, pentru alt scop dect cel de selecie sau evaluare comparativ ntre indivizi, utilizarea indicelui Cronbach alfa nu este adecvat. O valoare redus a acestuia nu poate nsemna c itemii nu msoar un anumit tip consistent de cunotine (fapt incontestabil din moment ce fac parte dintr-un univers de cunoatere bine definit) ci mai degrab c subiecii au rspuns la ntmplare. Mai departe, n cazul n care rspunsurile la o anumit ntrebare sunt corecte pentru cea mai mare parte a subiecilor, sau pentru toi, dei am fi tentai s apreciem acest fapt ca o expresie pozitiv a corelaiei itemului cu scorul global, avem de a face mai degrab cu un item prea uor, care nu este suficient de discriminativ pentru a fi pstrat. Chiar i n acest tip de situaii, totui, analiza de itemi poate fi folositoare ca modalitate de identificare a itemilor greit formulai, a celor nerelevani sau, pur i simplu, pentru a scoate n eviden erorile tipice pe care le fac subiecii la anumite ntrebri.

- 64 -

Teste neparametrice nominale


Testul z al proporiei pentru un singur eantion Utilizare Testul z pentru proporii pentru un eantion, este utilizat n cazul variabilelor dihotomice pentru a testa diferena dintre proporiile valorilor n eantion prin comparaie cu proporia la nivelul populaiei. Exemplu: La ntrebarea cine se uit la telenovele? rspund DA 7 subieci, dintre care 5 femei i 2 brbai. ntrebarea cercetrii este dac femeile se uit ntr-o proporie mai mare dect brbaii la telenovele. Condiii Cunoaterea proporiei la nivelul populaiei pentru valorile variabilei testate. n cazul nostru, raportul femei/brbai este cunoscut din studiile demografice (51%/49%) Aranjarea datelor Se creeaz variabila dihotomic cu valori numerice. Variabilele de tip string nu sunt acceptate de procedura SPSS. n cazul nostru, valorile sunt 1 pentru feminin i 2 pentru masculin.

Procedura: Statistics-Non Patametric Tests-Binomial...

Variabila testat este trecut n lista Test Variable List:

- 65 -

n zona Define Dichotomy se alege Get from data, dac variabila este dihotomic, sau Cut point, dac variabila este continu, prin fixarea unei valori care mparte distribuia n dou categorii. n zona Test proportion se introduce proporia primei categorii. Butonul Options permite solicitarea statisticii descriptive pentru variabila testat.

Rezultate

Rezultatul n cazul exemplului dat cuprinde frecvena pe categorii, procentul i semnificaia testului n raport cu proporia la nivelul populaiei (p=0.243). n acest caz, se accept ipoteza de nul i se respinge ipoteza cercetrii. Proporia femeilor care se uit la telenovele nu difer semnificativ de proporia brbailor, prin raportare la proporia lor n populaie.

- 66 -

Testul semnelor Utilizare Testul semnelor este utilizat pentru a testa diferena dintre valori, utilizndu-se semnul diferenei i nu valoarea acesteia, atunci cnd ambele valori sunt msurate pentru aceiai subieci . Dac nu ar exista nici o diferen ntre valorile perechi, atunci numrul diferenelor pozitive ar trebui s fie egal cu cel al diferenelor negative. Cu ct numrul diferenelor de un anumit semn este mai mare comparativ cu cel al diferenelor de semn opus, cu att crete posibilitatea ca diferena dintre variabile s fie statistic semnificativ. Exemplu: ntr-un experiment cu privire la efectul motivrii asupra memorrii, subiecilor li se cere s memoreze cuvinte dintr-o list, nainte si dup introducerea unui factor motivant. Dat fiind faptul c numrul subiecilor este prea mic pentru asumarea normalitii distribuiei de eantionare, se alege testul semnului, n locul testului t pentru eantioane dependente. Condiii Variabilele vor fi de tip numeric, iar valorile exprimate n aceeai unitate de msur, pentru a se putea face diferena lor. Aranjarea datelor Imaginea de mai jos conine variabilele inainte i dupa, care vor fi analizate.

Variabila dif conine rezultatul diferenei dupa-inainte. Variabila semn, conine semnul diferenei. Ambele sunt prezentate numai pentru a face mai evident baza de calcul a testului deoarece, n fapt, nu sunt relevante sub aspectul procedurii SPSS. 2. Dac nu se dispune de valorile variabilelor ci numai de semnul diferenei, testul semnului va fi calculat manual, pe baza formulei 4.7. Procedura: Statisstics-Nonparametric Tests-2 Related Samples... n prima faz, cele dou variabile sunt selectate, pe rnd, prin clic de mouse pe fiecare, constituindu-se n pereche. Acest fapt se observ n partea de jos a casetei, n Apoi, perechea de variabile este trecut n lista Test Pair(s) List: prin acionarea butonului . Dac este necesar, se pot testa simultan mai - 67 -

zona Current Selections. Se bifeaz Sign n zona Test Type.

multe perechi de variabile.

Rezultate

Tabelul Sign Test cuprinde numrul diferenelor pozitive, respectiv negative, pentru cazurile din baza de date. n cazul nostru, exist 7 diferene pozitive i nici o diferen negativ.

Tabelul Test Statistics, prezint semnificaia testului (p=0.016). Ipoteza de nul se respinge dac valoarea lui p este mai mic dect pragul fixat i care, implicit, este 0.05. n exemplul dat, ipoteza de nul se respinge, acceptndu-se ipoteza cercetrii (motivarea stimuleaz memorarea).

- 68 -

Testul Chi-ptrat al asocierii (independeei) Utilizare Testul chi-ptrat este utilizat pentru evidenierea gradului de asociere ntre dou variabile categoriale. Exemplu: S presupunem c am evaluat numrul femeilor i al brbailor diagnosticai cu sindrom de stres postraumatic (PTSD) dintr-un mic ora, afectat de un cutremur de pmnt, iar datele sunt cele din urmtorul tabel de coresponden: PTSD Non-PTSD sex. Condiii Cele dou variabile nu trebuie s se intersecteze (s nu existe subieci care s
fie inclui n mai mult de o celul de tabel). Este recomandabil ca frecvena ateptat s nu ia valori mai mici de 5 (sau, cel puin, n nu mai mult de 20% din celule). Nici o celul nu trebuie s aib frecvena ateptat 0..

Femei 20 30

Brbai 10 40

Problema cercetrii este dac incidena PTSD este n legtur cu caracteristica de

Aranjarea datelor Datele pot fi incluse n Data Editor n dou moduri: a. Sub forma unor nregistrri distincte pentru fiecare caz

Acest mod poate fi extrem de dezavantajos atunci cnd sunt multe cazuri sau cnd exist deja o statistic global a fenomenului PTSD n raport cu sexul. b. Sub forma unor nregistrri distincte pentru valorile caracteristicii de sex:

- 69 -

n aceast situaie, se introduc frecvenele PTSD pentru toate combinaiile valorilor celor dou variabile analizate i frecvenele asociate fiecreia. Pentru a se realiza corespondena dintre variabilele sex i PTSD cu variabila frecv, se apeleaz la procedura Data-Wheight Cases...:

Facem precizarea c n tabelele de date din imaginile de mai sus variabilele au fost codificate numeric cu 1 respectiv 2, att pentru sex ct i pentru PTSD, valorile fiind etichetate. Faptul c n celule apar etichetele i nu valorile, se obine prin setarea DataValue Labels. Procedura Chi-ptrat accept i variabile de tip caracter (string) dar reamintim recomandarea de principiu ca toate variabilele s fie declarate de tip numeric. Procedura: Statistics-Summarize-Crosstabs... Casetele de configurare sunt urmtoarele:

n caseta principal Crosstabs se trec variabilele analizate n lista Row(s), respectiv Columns(s). Pot fi analizate mai multe perechi de variabile simultan. Rezultatul analizei nu depinde de modul de plasare a variabilelor pe linie sau pe coloan. Dac de dorete crearea unui grafic al corespondenei dintre variabile, se va bifa i Display clustered bar charts. n caseta Statistics se bifeaz Chi-Square. n caseta Cell Display se bifeaz Counts-Observed; Percentages-Row, Column, Total i Residuals-Unstandardized (bifarea opiunilor este n funcie de informaiile pe care le dorete analistul). - 70 -

Rezultate

Imaginea prezint tabelul de coresponden, avnd pe linii valorile caracteristicii de sex iar pe coloane valorile aferente variabilei PTSD. n celulele tabelului se afl valorile solicitate prin configurarea casetelor. Vom exemplifica pentru celula feminin/da: Count 20 indic numrul femeilor cu PTSD %within Sex 40.0% indic procentul femeilor care au manifestat PTSD din totalul femeilor %within PTSD indic procentul femeilor cu PTSD din totalul celor care au manifestat PTSD % of Total indic procentul femeilor cu PTSD din totalul subiecilor Residual indic diferena dintre numrul de femei cu PTSD (frecvena observat) i frecvena ateptat (n cazul nostru, +10)

n tabelul Chi-Square Tests citim valoarea testului Pearson Chi-Square (16.66) i, n special, pragul de semnificaie al acestuia (p=0.000 care va fi citit ca p<0.001). n cazul particular al acestui exemplu, unde tabelul de coresponden este format din dou linii i dou coloane, valoarea lui chi-ptrat poate fi luat de pe linia Continuitiy Correction (15.04) cu valoarea aferent a pragului de semnificaie: p<0.001. Valoarea testului chi-ptrat fiind mai mic dect nivelul alfa 0.05, se respinge ipoteza de nul i se confirm ipoteza cercetrii: exist o inciden mai mare a reaciei de stres postraumatic la femei dect la brbai. n raportarea statisticii chi-ptrat va fi inclus valoarea gradelor de libertate (df) i numrul cazurilor Valoarea lui chi-ptrat se raporteaz cu dou zecimale

- 71 -

Graficul de tip bar permite vizualizarea relaiei dintre variabile. Testul Chi-ptrat pentru coresponden (goodness of fit) Utilizare Testul chi-ptrat pentru gradul de coresponden se utilizeaz atunci cnd dorim s comparm frecvenele observate unei singure variabile categoriale cu frecvenele ateptate, dinainte cunoscute. Exemplul 1: Avem evaluarea nivelului de inteligen pe cinci categorii valorice, de la foarte slab, la foarte bun i dorim s tim dac distribuia acestor calificative se supune curbei normale, procentele aferente pe curba normal fiind cunoscute (2.5%, 14%, 67%, 14%, 2.5%). Exemplul 2: Am solicitat unui grup de tineri s i exprime genul muzical preferat i am obinut frecvene diferite pentru mai multe genuri de muzic. Problema este dac diferenele dintre aceste frecvene sunt semnificative, presupunnd c, dac nu ar fi semnificative proporiile preferinelor pentru genurilor muzicale, ar trebui s fie identice (adic, dac ar fi trei genuri, fiecare ar trebui s ntruneasc un procent de 33.33%). Aranjarea datelor Vom exemplifica pe o situaie corespunztoare celui de-al doilea exemplu. Baza de date se poate constitui fie prin nregistrarea fiecrui caz n parte (avnd o variabil pentru genul muzical i o alta pentru exprimarea preferinei fa de acesta), fie, ca n exemplul anterior, prin nregistrarea rezultatelor sintetice i ponderarea variabilei gen_muz cu variabila frecv prin operaia Data-Weight cases...:

- 72 -

Procedura: Statstics-NonParametric-Tests-Chi-Square...

n caseta Chi-Square Test se trece variabila analizat n zona Test Variable List. Se bifeaz All categories equal, acesta fiind modelul n raport cu care dorim s testm frecvenele variabilei analizate Dac am fi dorit s le testm n raport cu alte frecvene cunoscute, am fi bifat Values i, apoi, am fi introdus pe rnd acele frecvene (scriindu-le n dreptul lui Values i nregistrndu-le prin butonul Add)

Rezultate

Cele dou tabele cu rezultate din Viewer prezint: Frecvenele observate, frecvenele ateptate i valorile reziduale (diferena dintre frecvene) pentru cele trei genuri muzicale Valoarea testului Chi-ptrat al corespondenei (12.17), df(2) i p=0.002 Acest rezultat justific respingerea ipotezei de nul i acceptarea concluziei c subiecii diferenele dintre preferinele pentru cele trei genuri muzicale sunt semnificative i nu se datoreaz variaiei ntmpltoare de eantionare.

- 73 -

Testul z al diferenei dintre dou proporii independente Utilizare Acest test se utilizeaz atunci cnd se dorete compararea a dou proporii obinute pentru o variabil dihotomic. Exemplu: n urma unui studiu comparativ cu privire la interesul fa de fenomenele paranormale, efectuat n rndul studenilor de la Universitate comparativ cu studenii de la Politehnic, se nregistreaz urmtoarele rezultate3: La psihologie: 25 studeni nu cred n fenomenele paranormale iar 175 cred La politehnic: 124 nu cred n fenomenele paranormale iar 32 cred Problema cercetrii este dac diferena dintre cei cred n fenomenele paranormale din cele dou categorii de studeni este semnificativ. Aranjarea datelor Datele pot fi introduse fie caz cu caz, existnd o variabil pentru opinia fa de fenomenele paranormale i una pentru tipul de instituie de nvmnt, fie ca n imaginea de mai jos, care presupune o prealabil sintetizare a datelor:

o variabil (paranorm) pentru codificare credinei n fenomenele paranormale; o variabil (stud_la) pentru apartenena la una din cele dou instituii de nvmnt superior; o variabil (frecv) pentru frecvena cazurilor.

Este important de reinut c toate variabilele trebuie s fie numerice. n baza de date de mai sus, variabila paranorm aia valoarea 1 pentru cred i valoarea 2 pentru nu cred, iar variabila stud_la are valoare 1 pentru Universitate i 2 pentru Politehnic. Valorile variabilelor au fost etichetate corespunztor iar afiarea etichetelor n locul valorilor, n celulele tabelului de date, a fost obinut cu setarea View-Value labels din meniul SPSS Data Editor. De reinut c, dei afieaz etichetele, SPSS va opera n calcule cu valorile, devenite invizibile. Procedura: SPSS nu dispune de o procedur specific pentru calcularea direct a diferenei dintre dou procente. n acest scop se utilizeaz o procedura Crosstabs i testul chi-ptrat.

Datele nu sunt reale

- 74 -

n prealabil, se execut procedura Weight pentru variabilele categoriale (paranorm i stud_la) n funcie de variabila frecv, care contorizeaz numrul cazurilor.

Operaia asociaz valorile variabilelor categoriale (paranorm i stud_la) cu valorile variabile frecv. Efectul ei este unul invizibil pe ecran dar se va vedea n analizele statistice ulterioare. Efectul de ponderare (wheight) a unei variabile rmne activ atta timp ct nu se pondereaz o alt variabil sau nu se anuleaz ponderarea efectuat. La salvarea fiierului se salveaz i variabila ponderat. Includerea variabilei ponderate n diverse proceduri de analiz are efecte specifice. Dac datele ar fi fost introduse n baza de date caz cu caz, operaia Wheight nu ar mai fi fost necesar. 2. Se execut procedura Statistics-Summarize-Crosstabs... pentru variabilele paranorm i stud_la, cu selectarea Chi-Square din caseta Statistics. (nu mai prezentm imaginile, acestea fiind identice cu cele de la testul chi-ptrat). Rezultate

SPSS Viewer prezint mai nti tabelul de coresponden dintre variabilele categoriale, cu valorile variabilei ponderate prin procedura Wheight.

- 75 -

Din tabelul Chi-Square Tests citim valoarea Pearson Chi-Square (161.598). Testul z pentru diferena proporiilor se calculeaz ca radical din valoarea lui chiptrat: z = 161.598 = 12.71 Semnul lui z se afl din diferena proporiilor testate, astfel: 175 32 p a pb = = 0.875 0.205 = 0.67 200 156 Decizia statistic se ia prin raportarea valorii calculate a lui z la valorile critice ale acestuia de pe curba normal, pentru test unilateral sau bilateral. n cazul nostru, pentru test bilateral cu alfa=0.05, z calculat (12.71) este mai mare dect z critic (1.96), fapt care permite respingerea ipotezei de nul i confirmarea ipotezei c studenii de la Universitate cred ntr-o msur semnificativ mai mare n fenomenele paranormale dect studenii de la Politehnic.

- 76 -

Teste neparametrice pentru date ordinale


Testul Mann-Whitney (U) pentru dou eantioane independente Utilizare Testul Mann-Whitney este utilizat pentru testarea diferenei dintre grupuri independente pentru care variabila dependent este exprimat n valori ordinale (de rang) sau atunci cnd, chiar dac este de tip cantitativ, nu suport un test parametric (testul t). Exemplu: La ieirea dintr-un club de noapte, un psiholog interesat de efectul depresiv al drogurilor a efectuat interviuri n legtur cu acest aspect i a identificat un numr de 10 tineri care au consumat cte o pastil de Ecstasy i un numr de 10 tineri care au consumat doar alcool. Apoi i-a convins s ia parte la un experiment i le-a administrat un chestionar de evaluare a depresiei. Acelai chestionar a fost aplicat din nou, peste trei zile. Obiectivul studiului este, n prima faz, acela de a verifica ipoteza c cele dou tipuri de drog (Ecsatsy i alcool) au efecte depresante diferite. n acest scop vor trebui comparate valorile la depresie ale celor dou grupuri. Aceast analiz va fi efectuat att pentru valorile depresiei de la prima msurare ct i pentru cele de la a doua evaluare a depresiei. Aranjarea datelor

Variabilele din baza de date sunt urmtoarele: cod_sub, un cod numeric de identificare a fiecrui subiect (dei exemplele anterioare nu au cuprins aceast variabil, ea nu trebuie s lipseasc din nici o baza de date) drog, pentru tipul de drog utilizat (sunt afiate etichetele, iar valorile sunt 1=Ecstasy, 2=Alcool) depr_1, scorul la depresie la prima evaluare depr_2, scorul la depresie la a doua evaluare Variabilele dependente din exemplul nostru au valori msurate pe scal cantitativ. Testarea lor cu un test ordinal nu presupune o prealabil transformare de - 77 -

rang, programul efectund automat aceast transformare. Procedura se aplic n acelai mod i direct pe valori ordinale de rang. Procedura: Statistics-Non Parametric Tests-2 Independent Samples... Se cuvine s precizm c, n mod normal, datele de acest tip ar conduce la utilizarea testului t pentru eantioane independente. Cu toate acestea, avnd n vedere volumul foarte mic al eantionului, utilizarea unui test neparametric este de preferat.

n caseta Two-Independent Samples Tests variabilele analizate sunt trecute n lista Test Variable List. Rezultate

Tabelul Ranks ofer informaii sintetice despre cele dou variabile: volumul grupurilor, media rangurilor i suma rangurilor.

Tabelul Test Statistics include valorile testului Mann-Whitney pentru cele dou variabile testate simultan, depresia imediat i remanent. Valorile de interes din tabel sunt cele ale lui Z i nivelul de ncredere p. n cazul nostru, se observ depresia imediat nu difer semnificativ n funcie de tipul de drog utilizat, n timp ce depresia remanent este semnificativ diferit, mai mare la utilizatorii de Ecstasy dect la utilizatorii de alcool (conform datelor din tabelul anterior).

- 78 -

Testul Wilcoxon pentru dou eantioane perechi Utilizare n exemplul de mai sus, psihologul a testat ntr-o prim faz semnificaia diferenei dintre cele dou grupuri definite prin tipul de drog diferit (eantioane independente). Una dintre problemele cercetrii este i aceea dac exist o diferen ntre nivelul depresiei imediate i cel al depresiei remanente. Acest tip de analiz nu se poate face dect pentru subiecii aparinnd aceluiai tip de drog utilizat. Aranjarea datelor Este identic cu cea prezentat pentru testul Mann-Whitney. n acest caz, deoarece analiza trebuie efectuat separat pe grupurile de consum Ecstasy/Alcool, exist dou soluii. Prima ar fi selectarea (cu Data-Select Cases) a primului grup i efectuarea testului, apoi selectarea celui de-al doilea grup i efectuarea testului. O soluie mai elegant este, ns, aceea de a declara mprirea bazei de date n funcie de grupurile definite prin tipul de drog. n acest scop se va utiliza procedura Data-Split File...

n locul setrii implicite Analyze all cases, do not create groups, se bifeaz opiunea Compare groups i se declar variabila ale crei valori vor servi drept criteriu de mprire a bazei de date n grupuri de analiz separat (n cazul nostru, tipul de drog) prin trecerea ei n zona Groups Based on:. Efectul acestei aciuni este acela c toate prelucrrile care vor fi efectuate din acest moment se vor aplica, separat, pe fiecare grup identificat prin valorile variabilei. Operaiunea de mprire a bazei de date nu are semne vizibile, fapt care poate face s fie uitat i, astfel, atunci cnd se revine la prelucrri care ar trebui s implice toat baza de date rezultatele vor fi incorecte. De aceea, se va avea n vedere revenirea la setarea Analyze all cases, do not create groups atunci prelucrarea pe grupuri a bazei de date nu mai este becesar.

Procedura: Statistics-Non Parametric Tests-2 Related Samples... Setarea procedurii n caseta Two-Related-Samples tests se face n doi timpi: 1. Se selecteaz prin clic de mouse fiecare 2. Se acioneaz butonul pentru a se variabil, constituindu-se perechea supus transfera perechea de variabile n zona Test analizei Pair(s) list.

- 79 -

Se bifeaz opiunea pentru testul Wilkoxon (care este, de fapt, cea implicit) Rezultate

Tabelul Ranks ofer informaii sintetice despre rangurile pozitive i negative pentru cele dou grupuri, numrul subiecilor, media rangurilor i suma lor.

Tabelul Test Statistics prezint valorile comparative ale depresiei pentru cele dou grupuri. Aa cum se observ, diferena este semnificativ (p=0.007) n cazul consumatorilor de Ecstasy i nesemnificativ (p=0.053), n cazul consumatorilor de alcool. Concluzia general a studiului este aceea c Ecstasy, comparativ cu alcoolul, are un efect depresant mai mare (testul Mann-Whitney) i mai accentuat cu trecerea timpului (testul Wilcoxon).

- 80 -

Testul Kruskal-Wallis pentru mai mult de dou eantioane independente Utilizare Testul Kruskal-Wallis este utilizat atunci cnd avem o variabil dependent ordinal, msurat pentru mai mult de dou grupuri independente (formate din subieci diferii), i dorim s testm diferena dintre acestea. Acest test pentru date ordinale este analog testului ANOVA pentru date cantitative. Exemplu: A fost studiate relaia dintre condiiile familiale (familie armonioas, mam singur, familie conflictual) i frecvena reaciilor emoionale pozitive la copiii de vrst precolar, pe durata unei sptmni. Problema cercetrii este dac diferenele sunt semnificative iar mediul familial are legtur conduita emoional a copiilor. Aranjarea datelor

n baza de date, variabila familie a fost codificat i etichetate astfel: 1=familie armonioas, 2=mam singur, 3=familie conflictual. Etichetele sunt afiate ca urmare a opiunii Data-Value Labels. Rezultatele vor fi identice dac variabila dependent este exprimat i direct n valori de rang. Procedura: Statistics-Non Parametric tests- k Independent Samples... n caseta principal se trece variabila testat n zona Test Variable List: iar variabila independent n zona Gouping Variable. Se activeaz comanda Define Range...

Se definete domeniul valorilor variabilei independente, n cazul nostru: minim 1, maxim 3.

Forma final a casetei este aceasta. Testul Kruskal-Wallis este bifat implicit.

- 81 -

Rezultate

Primul tabel include informaii descriptive cu privire la variabila testat: numrul subiecilor din fiecare grup i media rangurilor pentru fiecare grup. De precizat c programul acord rangul 1valorii celei mai mici. Datele din tabel indic descreterea mediei rangurilor (expresii emoionale pozitive numeroase) de la familia armonioas la cea conflictual.

Rezultatul testului, afiat n tabelul Test Statistics, se exprim printr-o valoare chiptrat (6.33) cu dou grade de libertate i p=0.042. Ca urmare, ipoteza de nul poate fi respins. Datele confirm ipoteza c mediul familial (exprimat prin cele trei tipuri de familie) i pune amprenta asupra expresivitii emoionale a copiilor de vrst precolar.

- 82 -

Testul Friedman pentru msurri repetate Utilizare Testul Friedman se utilizeaz pentru testarea diferenei de rang n cazul unei variabile msurate repetat, de mai mult de dou ori, pe acelai grup de subieci. El este echivalentul testului ANOVA pentru msurri repetate, pentru date cantitative. Dac este utilizat pentru doar dou msurri repetate, rezultatul su este echivalent cu al testului Wilcoxon, prezentat mai sus. Exemplu: Efectele altitudinii asupra memoriei sunt testate pe un grup de alpiniti. Capacitatea de memorare de cuvinte este msurat la trei nlimi diferite: 1000m, 3000m i 6000m. Problema cercetrii este dac diferena de performan de memorare corespunztoare celor trei nlimi este semnificativ. Dat fiind volumul extrem de mic am eantionului (N=5), efectuarea unui test parametric (ANOVA RM) ar fi nesigur iar apelul le testul Friedman este pe deplin justificat. Aranjarea datelor

Variabilele mem_1000, mem_3000 i mem_6000 conin numrul cuvintelor memorate pentru fiecare dintre cei 5 alpiniti. Nu este necesar transformarea lor n valori de rang, deoarece acest lucru va fi efectuat automat de program. Dac datele primare sunt sub form de ranguri, ele vor fi introduse ca atare, rezultatul fiind identic. Procedura: Statistics-Non Parametric Tests-K related Samples...

Se seteaz opiunea Friedman iar variabilele testate sunt trecute n lista Test Variables:

- 83 -

Rezultate

Primul tabel prezint media rangurilor pe nlimi (rangul 1 este atribuit valorii celei mai mici). n al doilea tabel gsim valoarea testului Friedman exprimat n valori chiptrat (8.40), avnd un nivel de semnificaie p=0.015. Acest rezultat permite respingerea ipotezei de nul i confirm ipoteza c memoria cuvintelor este n legtur cu nlimea (pe cele trei niveluri avute n vedere). Coeficientul de corelaie pentru date ordinale (Spearman) Utilizare Testul de corelaie a rangurilor (Spearman) este echivalentul pentru date ordinale testului de corelaie Pearson. Rezultatul su variaz pe aceeai plaj de valori (-1/+1) i se interpreteaz n mod similar cu rezultatul testului Pearson. Exemplu: S lum n considerare studiul aceluiai grup de alpiniti, care au efectuat, la aceleai nlimi descrise mai sus, i un test de vitez de decizie (msurat n zecimi de secund). Problema cercetrii este dac ntre performana de memorare i ce de timp de decizie este o relaie (variaie concomitent) semnificativ. Aranjarea datelor

] Alturi de variabilele memorie pentru cele trei nlimi, avem acum i variabilele pentru timpul de decizie. Procedura: Statistics-Corelation-Bivariate

- 84 -

Variabilele supuse testului de corelaie se trec n lista Variables: Se anuleaz setarea pentru testul Pearson i se bifeaz Spearman (aici am ales i testul Kendal tau-b, care este echivalent lui Spearman, doar pentru a le putea compara. n practic, se va utiliza doar unul dintre acestea dou). Aceast configurare a casetei de dialog produce o matrice de corelaii cu ase linii i ase coloane pentru fiecare dintre cele dou teste alese. n fiecare celul a matricii se vor afla, aa cum vom vedea, mai multe numere. Din acest motiv citirea ei nu este tocmai comod. Pentru a obine un format mai convenabil de prezentare a rezultatelor, recomandm o procedur suplimentar, prezentat anterior la corelaia Pearson: Se acioneaz butonul Paste care deschide fereastra Syntax, unde gsim comenzile procedurii. Aici se introduce clauza WITH ntre primul grup de variabile (memorie) i al doilea grup de variabile (decizie):

Mai departe, procedura de corelaie se lanseaz cu butonul de pe bara de comenzi a ferestrei Syntax. Aceast variant de lucru nu este obligatorie. Se poate efectua corelaia i direct din caseta principal, dar, aa cum am spus, rezultatele vor fi prezentate ntr-o form mai puin ergonomic. Rezultate

Tabelul cu rezultate cuprinde pe linii variabilele memorie i pe coloane, variabilele decizie. Deoarece am cerut calcularea simultan a ambilor coeficieni de corelaie, datele sunt dublate. Este de la sine neles c, n realitate nu vom utiliza dect unul dintre aceti coeficieni de corelaie a rangurilor. Din celulele tabelului de mai sus nu ne intereseaz dect cele care cuprind corelaia dintre memorie i decizie la acelai palier de nlime. Pentru a fi mai vizibile, am ngroat

- 85 -

valorile utile analizei. n jumtatea de sus a tabelului, avem corelaiile pentru testul Kendall iar n jumtatea de jos pe cele ale testului Spearman. Testul Kendall al corelaiei dintre memorie i decizie la 1000 de metri are valoarea -0.94, semnificativ la p=0.023. La interpretarea coeficienilor de corelaie este extrem de important s se ia n considerare, simultan, semnul i semnificaia variaiei valorilor. n cazul nostru, valori mari ale memoriei, nseamn o capacitate de memorare mai bun iar valori mari ale timpului de decizie nseamn capacitate de decizie mai proast (sub aspectul vitezei, desigur). n consecin, un coeficient de corelaie negativ ntre aceste variabile indic, de fapt, o variaie concomitent pozitiv a memoriei i vitezei deciziei (cnd capacitatea de memorare scade, i decizia este mai lent, timpul de decizie fiind mai mare). Analiza coeficienilor din tabelul de mai sus arat existena unei corelaii de rang semnificative (p<0.05) ntre memorie i decizie la toate palierele de nlime. Dac facem comparaia dintre coeficienii Spearman i Kendal, vom vedea c, dei ei difer valoric, semnificaiile se afl, n toate cazurile, de aceeai parte a deciziei statistice (respingerea ipotezei de nul). Utilizarea unuia sau altuia dintre cei doi coeficieni rmne la latitudinea cercettorului.

- 86 -