Sunteți pe pagina 1din 18

Modul 2

Aplicarea softurilor statistice n cercetare: programul SPSS i elaborarea unei baze de date Obiective operaionale: Dup lectura acestui capitol, studenii ar trebui s reueasc s: lanseze n execuie programul SPSS, s creeze i s salveze un fiier n format *.saw diferenieze principale ferestre ale programului SPSS identifice n bara de comenzi principalele categorii de comenzi i funciile acestora defineasc n editorul de date variabilele relevante ale studiului Chiar dac a fost cndva, actual statistica aplicat nu mai este o lume strin i exotic pentru cercettorii din diferitele domenii ale tiinei. Un rol hotrtor n penetrarea practicii de cercetare de ctre statistic a avut-o informatizarea demersului statistic i apariia softurilor statistice. Utilizarea softurilor a permis ca cercettorii din diferite domenii ale tiinei s opereze cu modele matematice complexe fr a avea n prealabil o formare n matematica aplicat. Actual pe piaa softurilor statistice exist multe aplicaii de analiz statistic, SPSS fiind doar unul dintre acestea. Prima versiune a fost elaborat n 1968, variantele actuale (SPSS 14, SPSS 15) fiind considerate cele mai frecvent utilizate softuri statistice n cercetare (studii de marketing, anchete sociale, studii experimentale, etc.). Exist diferite verisuni ale programului, att pentru sistemul de operare Windows ct i pentru sisteme Mac OS X i Unix. Lansarea n execuie a programului SPSS 10.0 Dup instalarea programului SPSS 10.0 n meniul de Start al sistemului de operare identificai pictograma SPSS. 10.0 for Windows. Un click de mouse pe aceasta va avea ca i efect lansarea n execuie a programului SPSS 10.0 i va deschide fereastra de Editare a Datelor. Aceasta reprezint una din cele patru ferestre eseniale ale programului (fereastra de: Sintax, Output i Macros). Orice modificare efectuat n fereastra de Editare a Datelor (ex. definirea unei variabile, introducerea datelor unui subiect, etc) poate fi salvat prin accesarea n bara de comenzi a instruciunii FileSave... urmnd a se specifica denumirea sub care fiierul nou creat va fi salvat (cu extensia *.saw) i locaia acestuia. Structura programului SPSS 10.0 Principalele ferestre ale programului sunt cele ale: Editorului de Date, Sintaxei, Outputurilor i Macrosurilor. Fereastra de Sintax permite editarea i salvarea unor iruri de comenzi utilizate n mod frecvent. n fereastra Outputurilor sunt afiate rezultatele procesrilor statistice precum i eventualele mesaje de eroare. Fereastra Macrosurilor permite editarea unor scripturi ce permit facilitarea prelucrrii datelor. Fereastra Editorului de Date reprezint locul unde sunt introduse datele obinute n urma cercetrii. Aceast fereastr are dou componente: Editorul de Date i Editorul de Variabile. n Editorul de Date pe vertical (linii) avem subiecii. SPSS. 10.0 asigneaz n mod automat un numr fiecrui subiect introdus, vezi prima coloan numerotat a Editorului de Date (dar acest numr de identificare nu este unul stabil, la o sortare a datelor, n funcie de criteriul utilizat subiecii pot avea alt numr). Pe orizontal (coloane) avem nirate variabilele. Nu exist o setare implicit a variabilelor n ceea ce privete caracterul: continuu sau discret, independent sau dependent, calitativ sau cantitativ. Aceste caracteristici urmeaz a fi definite n mometul construciei bazei de date. n Editorul de Variabile pe orizontal avem variabilele i pe vertical avem caracteriticile acestora. Bara de meniuri a Editorului de Date

Bara de meniuri a Editorului de Date cuprinde o serie de comenzi grupate sub diferite denumiri. Dintre acestea le vom prezenta doar pe cele mai importante: - File: comenzi care permit operaii asupra fiierelor ce pot fi accesate de program (crearea, deschiderea, salvarea unui fiier, etc). - Edit: comenzi ce permit editarea bazei de date (ex. tergerea unor variabile, copierea unui set de date i reinserarea acestuia n alt parte a bazei de date, etc); - View: comenzi ce permit stabilirea elementelor de interfa a ferestrei de Editare a Datelor i trecerea de la Editorul de Date la Editorul de Variabile; - Data: comenzi ce permit efectuarea unor operaii asupra bazei de date (ex. restructurarea acesteia, eliminarea din prelucrarea statistic a unei pri a datelor, identificarea unui subiect cutat sau a unei valori cutate, etc); - Transform: permite modificarea iniial a datelor introduse n csuele Editorului de Date (ex. recodare, recalculare pe baza unei funcii prestabilite, ordonarea valorilor, etc); - Analyze: reprezint grupul de comenzi care permit efectuarea analizelor statistice; - Graph: comenzile care permit realizarea unor reprezentri grafice ale setului de date. Unele dintre aceste comenzi pot fi accesate direct din opiunile unor analizei statistice. Construcia unei baze de date n Editorul de Date al programului SPSS 10.0 Pentru a oferii informaiile legate de procedura de elaborare a unei baze de date, o s prezentm un studiu experimental. ntr-un studiu experimental Hyde & Jenkins (1973) au prezentat subiecilor o serie de liste de cuvinte. O parte a listelor conineau cuvinte relaionate semantic n timp ce altele conineau cuvinte nerelaionate semantic. Listele de cuvinte au fost nsoite de diferite tipuri de instruiuni: 1) evaluarea conotaiei afective a cuvintelor, 2) estimarea frecvenei n limbaj a cuvintelor, 3) detectarea literelor e i g n cuvintele din list, 4) identificarea categoriei gramaticale a cuvintelor i 5) decizia asupra compatibilitii cuvintelor cu un context propoziional prezentat n prealabil. Designul prezentat este unul bifactorial, cercettorii manipulnd dou variabile independente: gradul de asociere a cuvintelor (relaionate semantic sau nerelaionate) i strategia de parcurgere a listei (strategie definit prin tipul de instruciune oferit). Variabila msurat a fost numrul de cuvinte reactualizate. Prin comenzile deja cunoscute lansm n execuie programul SPSS 10.0. Selectm fereastra Editorului de Variabile pentru definirea acestora. n aceast fereastr vom definii att variabilele independente ct i cele dependente. De altfel programul nu face distincie ntre acestea, cercettorul prin caracteristicile definite difereniaz variabilele manipulate de cele msurate. n editorul variabilelor n prima linie vom trece denumirea primei variabile independente: gradul de asociere a cuvintelor. Aceast casu nu permite depirea a 8 caractere, ca urmare vom recurge la o prescurtare a denumirii, ex. gdaac. Dup stabilirea denumirii vom stabilii alte detalii ale acestei variabile: tipul variabilei (se refer la modul de codare a valorilor acestei variabile, n cazul nostru vom accepta setarea iniial numeric). Astfel cele dou modaliti ale variabilei gdaac vor fi codate cu 1 (pentru liste de cuvinte relaionate semantic) i 2 (pentru liste de cuvinte nerelaionate semantic). Setarea Width se refer la numrul caracterelor ce pot fi introduse n coloana variabilei definite. Specificarea Decimals ne permite setarea numrului de zecimale afiate n baza de date. Din moment ce avem o variabil independent codat numeric (subiecii sunt sau n grupul 1 sau n grupul 2) vom seta numrul zecimalelor la zero (nu exist posibilitatea ca unul din subieci s aib 1,5 ceea ce ar nsemna s nu fie inclus n niciuna din grupele definite pe baza modalitilor variabilei independente). Label reprezint eticheta variabilei prescurtate. Este foarte probabil ca o persoan care analizeaz datele introduse fr a avea infomaii despre denumirea variabilelor implicate n studiu, cu greu s i dea seama ce nseamn exact gdaac. Ca urmare aceast setare permite cercettorului nregistrarea n baza de date a denumirii in extenso a variabilei codate. Setarea Values este important n cazul variabilelor discrete, dac dorim s etichetm diferitele nivele ale acesteia. Variabila independent este una discret, avnd modaliti codate numeric, ns acestor numere le putem asigna etichete lingvistice. Accesnd aceast csu se va deschide o
2

fereatr care permite asocierea unei etichete lingvistice fiecrui cod numeric. Stabilirea unei legturi se face prin comanda Add, dup ce am trecut n csuele potrivite valoarea numeric i eticheta lingvistic asociat (ex. 1 liste de cuvinte relaionate i 2 - liste de cuvinte nerelaionate). Pe coloana Missing vom specifica modalitatea de codare datelor lips. La aceast comand vom opta pentru a asocia valorile discrete lips cu 99. De obicei se alege o valoare care este n afara plajei de valori ale variabilei codate. Setarea Columns se refer la limea coloanei n care vor fi introduse valorile variabilei definite (specificarea unei valori este opional, din moment ce acest parametru poate fi modificat n fereastra Editorului de Date cu ajutorul mouse-ului). Setarea Align se refer la poziionarea n csu a valorii introduse, implicit fiind stabilit alinierea la dreapta. Ultima specificare se refer la scala de msur a variabilei. n cazul nostru variabila independent este una nominal, din moment ce toi subiecii sunt inclui ntr-o grup fr ca doi subieci s fie inclui n aceeai grup. Diferenele ntre grupe sunt de ordin calitativ, nici una din grupe nu parcurge mai multe liste sau liste cu mai multe cuvinte. Ceea ce se modific este caracterul relaionat sau nerelaionat al cuvintelor de pe list. n mod similar se procedeaz pentru a doua variabil independent denumind-o sdpal (la Label vom trece - Strategia de parcurgere a listei). n cazul variabilei dependente (numrul de cuvinte reactualizate - ndcr) la setarea Values nu vom eticheta fiecare valoare a variabilei, deoarece variabila msurat este una cantitativ (numeric prin excelen). n momentul n care se trece la Editorul de Date, denumirile variabilelor vor apare pe orizontal (fiecrei variabile i va corespunde o coloan). Ceea ce urmeaz este introducerea datelor n baza de date dup urmtorul algoritm: primul subiect aparine grupului care a citit lista de cuvinte relaionate semantic, n coloana gdaac va avea 1, n coloana sdpal vom trece 1 (face parte din grupul cruia i s-a cerut evaluarea conotaiei afective a cuvintelor) i la coloana ndcr vom trece numrul de cuvinte reactualizate de acest subiect.

Modul 3
Utilizarea softurilor statistice n cercetare: modaliti de reprezentare grafic, calculul indicatorilor tendinei centrale, ai dispersiei i ai distribuiei. Obiective operaionale: Dup lectura acestui capitol, studenii ar trebui s reueasc s: reprezinte grafic distribuia valorilor unei variabile (histograma) calculeze indicatorii ce descriu o distribuie: nclinarea i gradul de aplatizare calculeze indicatorii tendinei centrale: medie, median i mod calculeze indicatorii de dispersiei ai unei distribuii: abaterea standard, variana, eroarea standard a mediei, amplitudinea, minimul i maximul n modulul anterior am parcurs paii necesari configurrii unei baze de date (am definit variabilele independente i dependente) precum i cei necesari pentru introducerea datelor n aceasta. n continuare vom parcurge paii pentru a obine primele informaii de natur descriptiv despre eantionul nostru de date. Modaliti de reprezentare grafic SPSS-ul ne ofer mai multe variante pentru a reprezenta grafic valorile din baza de date. Precum am menionat in modulul anterior acestea se regsesc n meniul Graphs. Nu vom descrie toate modalitile de reprezentare grafic deoarece majoritatea nu se preteaz domeniului specific al cercetrii n psihologie. Vom prezenta succint modalitatea de realizare a unei Histograme. Histograma este o form de reprezentare grafic a distribuiei unei variabile numerice care ne permite s determinm intuitiv dac aceasta are o form simetric sau asimetric. n msura n care distribuia este simetric, apropiat de distribuia normal, putem utiliza teste statistice parametrice, iar n cazul unei distribuii asimetrice vom utiliza teste statistice neparametrice. Pentru mai multe detalii vezi suportul de curs An I al disciplinei Psihologie experimental i metode de analiz a datelor. S presupunem c am realizat o replicare n scop didactic a studiul anterior elaborat de Hyde & Jenkins (1973) i am obinut pe un lot de 20 de subieci ce au utilizat liste relaionate semantic, cu instruciune de estimare a frecvenei cuvintelor n limbaj, urmtoarele date:
Subiect ndcr 1 20 2 12 3 28 4 18 5 20 6 22 7 24 8 18 9 19 10 25 11 27 12 26 13 23 14 20 15 22 16 23 17 15 18 18 19 15 20 22

Pentru a realiza o histogram n SPSS vom accesa meniul Graphs de unde vom alege opiunea Histogram . n fereastra astfel deschis vom alege din lista de variabile aflat n stnga numele variabilei pe care dorim s o reprezentm (n cazul de fa ndcr) i o vom aduga n cmpul Variable. De asemenea vom bifa i opiunea Display normal curve (Afieaz curba normal).

Precum se vede i din figura de mai sus pe axa X avem reprezentate valorile variabile, iar pe axa Y avem frecvena de apariie a acestora n eantionul nostru de date. n partea dreapt a histogramei avem trecute valorile: abaterii standard ( Std. Dev), a mediei (Mean) i numrul de subieci / msurtori (N). De asemenea se poate observa c SPSS-ul afieaz etichetele variabilelor i nu acele nume de maxim 8 caractere, tocmai pentru a uura identificarea acestora. Indicatori ce descriu forma unei distribuii Precum am precizat anterior histograma ne permite s evalum la modul intuitiv dac o anumit distribuie de date este simetric (cvasinormal) sau nu. Pentru o evaluare mai acurat avem la dispoziie doi indicatori statistici de descriu forma unei distribuii: nclinarea (skewness) i gradul de aplatizare (kurtosis). nclinarea este un indicator al simetriei unei distribuii. Distribuia normal este perfect simetric i are un indicator de nclinare egal cu zero. Gradul de aplatizare este un indicator al gradului de grupare a valorilor n jurul tendinei centrale. n cazul distribuiei normale valoarea acestuia este egal cu zero. Pentru a calcula aceti indicatori vom accesa meniul Analyze din care vom alege opiunea Descriptive statistics i mai apoi opiunea Frequencies... . n fereastra activat alegem din lista de variabile, numele variabilei pentru care dorim s calculm nclinarea i gradul de aplatizare i o adugm n lista Variable(s):. Tot n aceast fereastr accesm opiunea Statistics i bifm opiunile: Skewness i Kurtosis. Dnd click pe butonul Continue i mai apoi pe butonul Ok, n fereastra de Output vom obine urmtorul rezultat:

n tabelul de output pe lng valorile celor trei indicatori vom avea: numrul de subieci inclui n calcul i numrul de date lips (subieci ce nu au valori introduse n baza de date pentru variabila n cauz). O valoare a indicelui de nclinare sau a gradului de aplatizare
5

care este peste de dou ori valoarea erorii standard a acestuia ne indic o distribuie asimetric. Indicatori ai tendinei centrale Urmtorul pas n a obine mai multe informaii legat de eantionul nostru de date este calcularea indicatorilor tendinei centrale. Cei trei indicatori ai tendinei centrale sunt: media, mediana i modul. Media este rezultatul mpririi sumei tuturor valorilor din eantionul de date la numrul de cazuri. n exemplul nostru acesta este totalul cuvintelor reactualizate de ctre toi cei 20 de subieci mprit la 20. Mediana este acea valoarea din eantionul de date, care se situeaz la jumtatea distanei dintre cea mai mic si cea mai mare valoare ntr-o list ordonat a acestora. Modul este acea valoare care are cea mai mare frecven de apariie n eantionul de date. Vom utiliza media ca i estimator al tendinei centrale n cazul n care distribuia datelor este cvasinormal. n cazul n care avem o distribuie asimetric mediana i modul vor estima mai acurat tendina central. Pentru a calcula aceti indicatori vom accesa meniul Analyze din care vom alege opiunea Descriptive statistics i mai apoi opiunea Frequencies... . n fereastra activat alegem din lista de variabile, numele variabilei pentru care dorim s calculm indicatorii tendinei centrale i o adugm n lista Variable(s):. Accesm opiunea Statistics i bifm opiunile: Mean, Median, Mod i Sum. Dm click pe butonul Continue i mai apoi pe butonul Ok. n fereastra de Output vom obine urmtorul rezultat:

n cazul unei distribuii cvasinormale valorile medie, medianei i modului vor fi apropiate. n tabelul de output pe lng valorile celor trei indicatori vom avea: numrul de subieci inclui n calcul i numrul de date lips (subieci ce nu au valori introduse n baza de date pentru variabila n cauz). n cazul n care exist mai multe valori cu cea mai mare frecven de apariie n eantionul de date i ca atare nu avem un mod unic, SPSS-ul va trece n tabel valoarea cea mai mic dintre acestea. Indicatori ai dispersiei n afara tendinei centrale care ne spune unde se situeaz majoritatea datelor din eantion este foarte important s tim i cum sunt distribuite aceste valori n cadrul eantionului. SPSS ne ofer posibilitatea s calculm urmtorii indicatori ai dispersiei: eroarea standard a mediei, abaterea standard, variana, amplitudinea, minimul i maximul. Pentru a calcula aceti indicatori vom accesa meniul Analyze din care vom alege opiunea Descriptive statistics i mai apoi opiunea Frequencies... . n fereastra activat alegem din lista de variabile, numele variabilei pentru care dorim s calculm indicatorii dispersiei i o adugm n lista Variable(s):. Accesm opiunea Statistics i bifm opiunile: Std. Deviation, Variance, Range, Minumum, Maximum i S.E. mean. Dm click pe butonul Continue i mai apoi pe butonul Ok. n fereastra de Output vom obine urmtorul rezultat:

Tabelul de output este similar cu cel obinut pentru indicatorii ce descriu forma distribuiei sau cel al tendinei centrale.

Modul 4
Utilizarea SPSS n statistica inferenial: estimarea parametrilor populaiei. Obiective operaionale: Dup lectura acestui capitol, studenii ar trebui s reueasc s: efectueze calculul de estimare a mediei n populaie utiliznd softul SPSS 10.0 interpreteze statistic rezultatele procesrii efectuate salveze fereastra rezultatelor obinute ntr-un fiier *.spo Una dintre aplicaiile eseniale ale inferenei statistice o reprezint problema estimrii parametrilor populaiei. Fr a intra n detaliile acestei probleme discutate n cadrul cursului de Psihologie experimental i metode de analiz a datelor (vezi suportul de curs Anul I), vom oferii un exemplu concret de cercetare, cteva date (doar n scop didactic) i ulterior vom descrie procedura de calcul a intervalului de ncredere prin utilizarea softului SPSS 10.0. Activitatea fizic reprezint o problem esenial a vieii cotidiene, lipsa acesteia crescnd riscul apariiei obezitii i a unor afeciuni cardio-vasculare. Pentru a estima gradul de risc al elevilor, cercettorii de la OMS au aplicat unui eantion de elevi un chestionar n care una din ntrebri se referea la numrul de ore/sptmn petrecute cu exerciii fizice. Scopul cercettorilor a fost de a estima, pe baza datelor eantionului, media n populaia int a numrului de ore de exerciiu fizic. ntrebarea care se pune este, cte ore pe sptmn aloc elevii n medie exerciiilor fizice? Aceast medie pe populaie nu poate fi calculat din moment ce nu avem posibilitatea de a chestiona ntreaga populaie. Ca urmare am recurs la aplicarea chestionarului doar la un eantion extras din populaia int. Doar n scop didactic, s presupunem c volumul eantionului este de n=20. Datele obinute sunt trecute n form tabelar mai jos:
Subiect Ore/sptmn 1 5 2 5 3 2 4 3 5 7 6 5 7 4 8 3 9 6 10 2 11 8 12 4 13 5 14 6 15 4 16 5 17 6 18 2 19 3 20 4

Variabila msurat: numrul de ore/sptmn alocate exerciiului fizic a fost codat sub denumirea de oefs. n Editorul de Date vom avea o singur coloan i datele subiecilor implicai n studiu vor fi introduse n aceast coloan. Pentru a calcula intervalul de ncredere n care se situeaz, cu o anumit probabilitate, media populaiei vom utiliza programul SPSS 10.0. n meniul Analyze vom selecta comanda Descriptive Statistics Explore unde vom trece n csua Dependent List variabila msurat n studiu. La opiunea Statistics vom seta valoarea pragului , care implicit este setat la 5% (adic la un interval de ncredere de 95%) la 1% (adic vom opta pentru un interval de ncredere de 99%). Opiunea Statistics ne ofer posibilitatea de a alege prin bifare: calculul indicatorilor statistici i indicatorilor formei distribuiei (Descriptives), estimarea medianei n populaie (Mestimator), identificare valorilor extreme ( Outliers) i distribuia n centile a datelor obinute (Percentile). n aces caz vom bifa doar opiunea Descriptives i vom trece la pasul urmtor cu ajutorul butonuli Continue. Opiunea Plots permite realizarea unor reprezentri grafice (ex. histogram), iar la Options putem seta criterii de management al datelor lips. La opiunea Display vom bifa Statistics pentru a rezuma procesarea doar la calcul statistic fr a cere efectuarea unor reprezentri grafice. Terminnd specificarea procesrilor se apas pe butonul OK. Outputul rezultat este prezentat mai jos:

Descriptives oefs Mean 99% Confidence Interval for Mean 5% Trimmed Mean Median Variance Std. Deviation Minimum Maximum Range Interquartile Range Skewness Kurtosis Statistic 4.4500 3.3821 5.5179 4.3889 4.5000 2.787 1.66938 2.00 8.00 6.00 2.75 .248 -.373 Std. Error .37329

Lower Bound Upper Bound

.512 .992

Ceea ce ne intereseaz este valoarea mediei calculat pentru eantion (4.45), valoarea erorii standard (0.37) i limitele intervalului de ncredere, Limita inferioar = 3.38 i Limita superioar = 5.51. n rest procesarea ne mai ofer o serie de date descriptive: ale tendinei centrale n eantion (media ajustat (trimmed), mediana) ale dispersiei (varian, abatere standard, minim, maxim, amplitudinea intervalului de valori, diferena interquartil) i indicatori ai formei distribuiei (nclinarea i Gradul de aplatizare). n concluzie putem afirma (cu o anumit marj de eroare asumat) c media numrului de ore alocat exerciiului fizic n populaia elevilor este situat n intervalul 3.38 - 5.51. n condiiile n care rezultatele urmeaz a fi utilizate ulterior (ex. elaborarea ulterioar a unui raport de cercetare) dar nu se dorete reluarea pailor descrii anterior, fereastra Outputurilor poate fi salvat n format *.spo urmnd comenzile FileSave... i specificnd denumirea fiierului.

Modul 5
Utilizarea SPSS n statistica inferenial: probleme de comparaii inter- i intra-grup. Obiective operaionale: Dup lectura acestui capitol, studenii ar trebui s reueasc s: elaboreze baza de date pentru un experiment inter-grup elaboreze baza de date pentru un experiment intra-grup s efectueze calculul coeficienilor statistici utiliznd programul SPSS 10.0 s interpreteze rezultatele analizelor statistice A. Calculul statistic inferenial al datelor rezultate dintr-un design cu eantioane independente S lum ca exemplu adaptata dup experimentul efectuat de Bower i colegii (1981) n scopul verificrii dependenei proceselor mnezice de contextul emoional. Un cercettor a mprit n mod aleator eantionul n dou grupe. n trans hipnotic subiecilor dintr-un grup (experimental) li s-a indus o stare de tristee i altora (grupul control), nu li s-a indus nici o stare emoional. n urma modificrii strii emoionale subiecii au citit un text despre o persoan, urmnd ca apoi s reactualizeze caracteristicile personajului prezentat n text. S-a evaluat numrul de trsturi negative reactualizate. Un set de date (doar n scop didactic) este prezentat n tabelul de mai jos:
Grup Subiect Nr. trsturi negative 1 5 2 5 3 2 Grup control 4 3 5 7 6 5 7 4 8 3 9 6 10 2 11 8 12 4 13 5 Grup experimental 14 6 15 4 16 5 17 6 18 2 19 3 20 4

Mediile calculate pe cele dou grupuri sunt m1=4.2 i m2=4.7. Se pare c subiecii crora li s-a indus o stare emoional negativ au reactualizat mai multe trsturi negative. ntrebarea este n ce msur putem considera c aceast diferen poate fi atribuit interveniei sau reprezint doar un rezultat al randomizrii aleatoare a subiecilor n cele dou grupe? Pentru alte detalii ale raionamentului inferenial vezi suportul de curs An I al disciplinei Psihologie experimental i metode de analiz a datelor. Fiind vorba de un design de baz cu grupuri independente n baza de date vom defini dou variabile, variabila independent stare emoional indus (cu dou modaliti neutr, codat cu 1 i de tristee codat cu 2) i variabila dependent (numrul de trsturi negative reactualizate). Ca i exemplu subiectul 1 n prima coloan a Editorului de Date va avea 1 i n a dou coloan va avea 5; subiectul 16 va avea 2 n prima coloan (fiind din grupul experimental) i 6 n a doua coloan. Pentru a efectua compararea mediilor vom urma linia de comenzi AnalyzeCompare meansIndependet Sample t Test. n cmpul Grouping Variable vom introduce variabila independent i vom defini grupele prin Define Groups, Grupa 1 fiind 2 i Grupa 2 fiind 1. Codarea grupelor nu presupune ntotdeauna utilizarea cifrelor 1 i 2, la fel de bine am fi putut coda grupele cu 1001 i 48. Ceea ce ntreab programul este, care dintre grupe s fie grupa de referin, acesta fiind introdus ulterior (vezi numrtorul formulei de calcul al coeficientului t). n cazul nostru grupa de referin este 1, adic grupul a crei stare emoional nu a fost modificat. Dup definirea grupelor comparate n cmpul Test Variable vom introduce variabila dependent i apsm pe butonul OK. Rezultatele relevante ale procesrii apar n tabelul de mai jos:

10

Independent Samples Test Levene's Test for Equality of Variances t-test for Equality of Means 95% Confidence Interval of the Difference Lower Upper -1.09233 -1.09234 2.09233 2.09234

F cr Equal variances assumed Equal variances not assumed .059

Sig. .810

t .660 .660

df 18 17.998

Sig. (2-tailed) .518 .518

Mean Difference .50000 .50000

Std. Error Difference .75792 .75792

Primele calcule se refer la asumpia omogenitii varianelor n populaie. Dac testul Levene este semnificativ atunci nseamn c varianele populaiilor din care provin cele dou grupuri nu sunt omogene, i vom interpreta al doilea rand al tabelului. n cazul de fa testul Levene este nesemnificativ, valoarea calculat a lui p este mult mai mare dect 0.05 (p=0.81) ca urmare vom interpreta datele primului rnd. Valoarea calculat a coeficientului t este 0.66, grad de libertate 18 (n1+n2-2 adic 10+10-2) i valoarea calculat a lui p pentru coeficientul t este 0.51, mult deasupra pragului de 0.05. n continuare n table mai apar: diferena dintre mediile grupelor, eroarea standard a distribuiei diferenelor de medii testat n baza ipotezei nule i limitele intervalului de ncredere a medie distribuiei diferenelor de medii aleatoare. Dac acest interval l include pe 0 atunci diferena este nesemnificativ. n consecin, nu am reuit s infirmm ipoteza nul suntem nevoii s suspendm decizia. Altfel formulat, diferena pe care am obinut-o n urma interveniei, valoric nu depete acele diferene pe care le-am fi putut obine prin simpla selecie aleatoare a dou grupe i efectuarea diferenei ntre mediile lor. B. Calculul statistic inferenial al datelor rezultate dintr-un design cu eantioane dependente ntr-un studiu experimental ipotetic, un cercettor i propune s investigheze ipactul pe care l are prezena unor distractori asupra gradului de nelegere a textului la vrstnici. n acest scop selecteaz un grup de subieci vrstnici i prezint acestora cte o prob de nelegere a textului. n prima situaie, cea de control, subiecii citesc un pasaj i ulterior rspund din memorie la ntrebrile formulate. n situaia experimental subiecii citesc un draft al unui text (altul dect cel din pre-test, dar de acelai grad de dificultate) din care ns nu au fost terse corecturile (exist idei, informaii care nu sunt relevante din punct de vedere al formei finale a textului). ntrebrile formulate i de aceast dat vizeaz textul, dar nu i pasajele tiate. Variabila msurat n ambele situaii este gradul de acuratee a rspunsurilor. Numrul de rspunsuri corecte nregistrate n celel dou situaii sunt prezentate n tabelul de mai jos.
Grup Subiect Nr. Rspunsuri corecte 1 6 Situaie de control (pre-test) 2 3 3 2 4 3 5 4 6 5 7 6 8 3 9 4 10 2 1 6 2 4 Situaie experimental (post-test) 3 3 4 6 5 4 6 6 7 7 8 5 9 4 10 4

n cazul unui design intra-grup baza de date va conine dou variabile, ambele reprezentnd variabila msurat n cele dou contexte ale variabilei independente (situaia control i situaia experimental). n baza de date fiecare subiect va avea dou valori, una msurat n situaia de control i una msurat n situaia experimental. De exemplu, subiectul nr. 1 n situaia de control a nregistrat 6 rspunsuri corecte i n situaia de control tot 6. irul de comenzi care permite calcularea coeficientului t este urmtorul: AnalyzeCompare meansPaired Sample t Test. n cmpul Paired variables vom
11

introduce perechea de valori ce urmeaz a fi comparat. Rezultatul afiat n fereastra outputurilor este cel prezentat mai jos. Paired Samples Test
Paired Differences Std. Error 95% Confidence Interval Std. Deviation Mean of the Difference Lower -1.81137 Upper -.38863 t df Sig. (2-tailed)

Mean

-1.10000

.99443

.31447

-3.498

.007

Mean n acest caz reprezint media diferenelor, deoarece demersul inferenial se bazeaz pe diferene de scoruri i media acestor diferene (vezi suportul de curs anul I). Pentru aceste diferene se calculeaz o abatere standard ( Std. Deviation) i o eroare standard (Std. Error Mean), pe baza formulelor de calcul deja cunoscute. Cunoaterea valorii erorii standard i setarea unui grad de toleran (prag alfa) permite calcularea unui interval de ncredere a mediei diferenelor. Dac acest interval include valoarea zero atunci diferenele ntre pre-test i post-test nu sunt semnificative. n cazul nostru intervalul nu include valoarea 0, valoarea calculat a testului t este -3,498 i valoarea lui p este de 0.007. p calculat este mai mic dect valoarea prag, de 0.05, ceea ce confirm nc odat semnificativitatea statistic a diferene ntre cele dou situaii experimentale.

12

Modul 6
Utilizarea SPSS n studiile corelaionale Obiective operaionale: Dup lectura acestui capitol, studenii ar trebui s reueasc s: elaboreze baza de date corespunztoare studiului corelaional calculeze coeficientul de corelaie potrivit naturii variabilelor msurate soluioneze problemele datelor lips interpreteze rezultatele obinute Efectuarea unor studii experimentale nu este soluia potrivit pentru orice context de cercetare. n anumite situaii trebuie s ne limitm la a stabilii relaii de covarian existente ntre dou sau mai multe variabile msurate. Rentorcndu-ne la exemplul de la modulul 4, s presupunem c ceea ce intereseaz echipa de cercetare este identificarea tulburrilor asociate lipsei activitii fizice, concentrndu-se mai ales asupra obezitii. Obezitatea a fost exprimat n numrul de kilograme deasupra celui prevzut conform vrstei, genului i nlimii. S presupunem (doar n scop didactic) c datele obinute ntrun studiu (n=20) sunt cele redate n tabelul de mai jos:
Subieci Nr. Ore/Sptmn Kg peste normal 1 5 4 2 5 6 3 2 7 4 3 6 5 7 3 6 5 4 7 4 5 8 3 6 9 6 3 10 2 7 11 8 2 12 4 5 13 5 4 14 6 3 15 4 5 16 5 4 17 6 3 18 2 8 19 3 4 20 4 5

n baza de date vom definii dou variabile pentru cele dou variabile msurate (ore de activitate fizic pe sptmn i kg peste normal), ambele fiind de tip numeric. Pentru a calcula gradul de asociere al acestora vom recurge la calculul coeficientului de corelaie Pearson urmnd irul de comenzi AnalyzeCorrelateBivariate. n cmpul Variables vom introduce variabilele ce urmeaz a fi corelate, n cazul nostru cele dou variabile msurate. n continuare vom bifa coeficientul de corelaie ce urmeaz a fi calculat, n cazul de fa dat fiind c ambele variabile sunt numerice vom opta pentru coeficientul Pearson. Semnificaia coeficientului de corelaie calculat o vom verifica printr-un test two-tailed. La Options se poate seta calculul unor componente pariale ale coeficientului standardizat de corelaia Pearson (covariana, suma produselor) i date descriptive. Tot n aceast seciune putem seta strategia de management al datelor lips (discuia este relevant doar n cazul a trei sau mai multe variabile). n urma setrilor se apas butonul OK i se obine outputul prezentat mai jos.
Correlations oefs oefs Pearson Correlation Sig. (2-tailed) N Pearson Correlation Sig. (2-tailed) N 1 20 -.897** .000 20 kpn -.897** .000 20 1 20

kpn

**. Correlation is significant at the 0.01 level (2-tailed).

n fereastra Outputurilor este afiat matricea de corelaie. Din moment ce este o matrice simetric, coeficienii prezentai de o parte i de alta a diagonalei principale sunt identici. Pe linii i pe coloane sunt prezentate aceleai variabile. Se observ c valoarea corelaiei ntre oefs (ore exerciiu fizic sptmnal) i kpn (kilograme peste normal) este de
13

r =-.897. Valoarea calculat a lui p este mai mic dect 0.01 (n table apare 0.000, ceea ce nu nseamn c este 0). Probabilitatea ca s se obin doar datorit aleatorului o astfel de corelaie este mic, chiar foarte mic dar nu este zero. Pentru a evita o astfel de interpretare eronat, de obicei n prezentarea rezultatelor se trece 0.001.

14

Modul 7
Utilizarea SPSS n analiza designurilor factoriale Obiective operaionale: Dup lectura acestui capitol, studenii ar trebui s reueasc s: elaboreze baza de date corespunztoare unui studiu unifactorial i bifactorial calculeze indicatorii statistici ai principalelor efecte vizate n designurile factoriale sa efectueze comparaiile post-hoc interpreteze rezultatele obinute A. Calculul statistic inferenial al datelor rezultate dintr-un design unifactorial cu eantioane independente O practic impus n cercetarea efectului medicamentelor este de a implica n studiu un grup de placebo. Conform acestui plan, autorii unui studiu ipotetic i propun s verifice eficiena unui nou medicament n tratamentul depresiei. n acest scop selecteaz 30 de voluntari cu diagnostic clinic depresie, i i randomizeaz n trei grupe: control, placebo i experimental. Pacienii grupului experimental primesc medicaie antidepresiv; pacienii din grupul placebo primesc un medicament care nu conine substan activ; i pacienii grupul de control nu primesc nici o medicaie. Variabila dependent o reprezint intensitatea simptomatologiei nregistrat pe o scal de la 1-20 (1=depresie redus i 20=depresie accentuat). Rezultatele obinute sunt prezentate n tabelul de mai jos.
Grup Control Placebo Experimental 16 13 10 13 14 12 Scor Scal de Depresie 12 16 12 13 12 10 14 15 9 15 13 14 16 12 12 13 12 10 14 13 11 12 15 14

n baza de date vom defini dou variabile, una pentru variabila independent (denumit grup) cu trei valori (1=grup control, 2=grup placebo i 3=grup experimental) i o variabil (denumit scor) pentru a nregistra scorurile msurate. Pentru a verifica semnificativitatea statistic a diferenelor vom recurge la analiz de varian pentru design unifactorial cu eantioane independente. Pentru a calcula valoarea testului F vom urma calea AnalyzeCompare meansOne-Way Anova. n rubrica Dependent list vom introduce variabila msurat (denumit scor) i n ribrica Factor vom introduce variabila care definete grupele variabile independente. La seciunea Options vom bifa Descriptives pentru a obine datele descriptive i Homogeneity of variance test pentru a verifica asumpia omogenitii varianelor n populaie. La opiunea Post-Hoc vom bifa una din opiunile de comparaie post-hoc, de obicei se utilizeaz Tukey sau Scheffe, n acest caz vom apela la cel de-al doilea. Rezultatele ferestrei output sunt cele prezentate mai jos. Descriptives
95% Confidence Interval for Mean N 1.00 2.00 3.00 Total 10 10 10 30 Mean 13.8000 13.5000 11.4000 12.9000 Std. Deviation 1.47573 1.43372 1.71270 1.84484 Std. Error .46667 .45338 .54160 .33682 Lower Bound 12.7443 12.4744 10.1748 12.2111 Upper Bound 14.8557 14.5256 12.6252 13.5889 Minimum 12.00 12.00 9.00 9.00 Maximum 16.00 16.00 14.00 16.00

n acest tabel avem datele descriptive ale celor trei eantioane ( N, Mean, Std. Deviation i Std. Error), precum i intervalele de ncredere ( Lower Bound i Upper
15

Bound) i intervalul de variabilitate a datelor ( Minimum i Maximum). Se observ c exist diferene ntre mediile celor trei eantioane, cel mai amre scor l are grupul de control i cel mai mic aparine grupului experimental. Rezultatul oferit de testul de omogenitate al varianelor este nesemnificativ, p=0.8 (mai mare dect 0.05), ceea ce nseamn c datele satisfac criteriul omogenitii varianei n populaie. Pentru a verifica dac cel puin una din diferenele posibile (ntre grupele 1-2, 1-3, 2-3) este semnificativ vom citi tabelul umtor. ANOVA
Sum of Squares 34.200 64.500 98.700 df 2 27 29 Mean Square 17.100 2.389 F 7.158 Sig. .003

Between Groups Within Groups Total

Raportul dintre variana inter- i variana intra-grup rezult un F(2,27)=7,158. Probabilitatea acestei valori pe baza ipotezei nule, adic probabilitatea de a obine o asemenea valoare prin selecia aleatoare a trei eantioane dintr-o populaie este p=0.003, mult mai mic dect valoarea prag (0.05). n baza acestui rezultata putem afirma cel puin una din comparaiile posibile este semnificativ statistic. Pentru a verifica, care dintre aceste comparaii este aceea vom citi tabelul comparaiilor post-hoc.
Multiple Comparisons Dependent Variable: VAR00002 Scheffe Mean Difference (I-J) Std. Error .30000 .69121 2.40000* .69121 -.30000 .69121 2.10000* .69121 -2.40000* .69121 -2.10000* .69121

(I) VAR00001 (J) VAR00001 1.00 2.00 3.00 2.00 1.00 3.00 3.00 1.00 2.00

Sig. .910 .007 .910 .019 .007 .019

95% Confidence Interval Lower Bound Upper Bound -1.4903 2.0903 .6097 4.1903 -2.0903 1.4903 .3097 3.8903 -4.1903 -.6097 -3.8903 -.3097

*. The mean difference is significant at the .05 level.

Tabelul oferit de SPSS este unul redundant, din moment ce ne ofer toate comparaiile posibile (ex. Intre grupele 1 i 2, respectiv ntre grupele 2 i 1). n tabel vom urmri Mean Difference (diferenele de medii), Std. Error (eroarea standard), Sig. (valoarea calculat a lui p) i Confidence interval (intervalul de ncredere). Se observ c numai diferena dintre grupele 1-3 i 2-3 este semnificativ, valoarea calculat a lui p pentru prima comparaie este 0,007 i 0.019 pentru a doua, ambele fiind mai mici dect valoarea prag (0,05). Acest fapt este confirmat i de intervalul de ncredere afiat, numai n cazul acestor comparaii intervalul nu include valoarea 0, restul diferenelor fiind nesemnificativ. Datele obinute susin eficiena unui efect al interveniei medicamentoase, rezultatele obinute de acest difer semnificativ att de grupul de control ct i de grupul placebo. Nu s-a constatat nici o diferen ntre grupul de control i grupul placebo, ceea ce indic o absen a efectului placebo n acest studiu. B. Calculul statistic inferenial al datelor rezultate dintr-un design bifactorial cu eantioane independente Pentru a exemplifica modul de prelucrare a datelor obinute ntr-un design bifactorial, vom analiza un alt studiu ipotetic. Un grup de cercettori a ncercat s investigheze
16

diferenele existente n memoria verbal a subiecilor tineri i vrstnici. n acest scop a selectat aleator un grup de subieci tineri (20) i un grup de subieci vrstnici (20). Dar pentru c exist diferene de gen n ceea ce privete abilitatea verbal general, cercettorii au hotrt s includ n studiu i variabila gen (femei i brbai). Variabila msurat a acestui cvasi-experiment este numrul de cuvinte reactualizate n proba de memorie. Rezultatele obinute sunt prezentate n tabelul de mai jos.
Grup Tineri Vrstnici Femei Brbai Femei Brbai 16 13 10 9 13 14 12 10 Numr de cuvinte reactualizate 12 16 12 12 13 12 10 10 14 15 9 9 15 13 14 10 16 12 12 13 13 12 10 9 14 13 11 8 12 15 14 10

n baza de date vom defini trei variabile, dou pentru variabilele independente ale cercetrii. Prima variabil denumit vrst va avea dou modaliti, 1=tineri i 2=vrstnici, a doua variabil gen tot cu dou modaliti 1=femei i 2=brbai. n a treia variabil (denumit scor) vom introduce valorile variabilei msurate. Datele colectate vor fi analizate prin ANOVA bifactorial 2x2. Pentru a efectuat aceast analiz vom urma irul de comenzi AnalyzeGeneral Linear ModelUnivariate ... . n rubrica Dependent list vom introduce variabila dependent Scor, i n rubrica Fixed factors vom introduce variabilele independente ale modelului, Vrst i Gen. La Options ... vom cere afiarea mediilor pentru toate efectele (vrst, gen i vrst*gen). Pentru a derula procesare vom apsa OK. Rezultatele obinute sunt prezentate mai jos. n primul tabel este reprezentat structura designului utilizat i efectivul fiecrei csue. Between-Subjects Factors
varsta gen 1.00 2.00 1.00 2.00 N 20 20 20 20

Pe aceeai structur, tabelul urmtor afieaz datele statistice descriptive (medie i abatere standard pentru fiecare csu a designului). Descriptive Statistics
varsta 1.00 gen 1.00 2.00 Total 2.00 1.00 2.00 Total Total 1.00 2.00 Total Mean 13.8000 13.5000 13.6500 11.4000 10.0000 10.7000 12.6000 11.7500 12.1750 Std. Deviation 1.47573 1.43372 1.42441 1.71270 1.49071 1.71985 1.98415 2.29129 2.15891 N 10 10 20 10 10 20 20 20 40

Tabelul testului de omogenitate a varianelor n populaie i de aceast dat arat c setul de date respect asumpia omogenitii egalitii varianei n populaie, valoarea calculat a lui p este 0.777, mai mic e dect valoarea prag (0.05). Pentru a verifica semnificativitatea efectelor variabilelor implicate n studiu vom analiza tabelul urmtor.

17

Tests of Between-Subjects Effects


Source Corrected Model Intercept varsta gen varsta * gen Error Total Corrected Total Type III Sum of Squares 97.275(a) 5929.225 87.025 7.225 3.025 84.500 6111.000 181.775 df 3 1 1 1 1 36 40 39 Mean Square 32.425 5929.225 87.025 7.225 3.025 2.347 F 13.814 2526.060 37.076 3.078 1.289 Sig. .000 .000 .000 .088 .264

Primele dou linii se refer la abordarea ANOVA din punct de vedere a regresiei (n acest caz vom face abstracie de aceste date). n linia Vrst, Gen i Varsta*Gen observm c exist un efect al vrstei (p calculate este de 0.000 < 0.05), efectul genului nu este semnificativ (p calculat este 0.088 > 0.05) i nu exist efect semnificativ al interaciunii (p calculat este 0.264 > 0.05). Tabele descriptive reiau pentru fiecare variabil informaiile deja prezentate n tabelul general, oferind pentru fiecare i un calcul al intervalului de ncredere (vezi exemplul pentru variabila vrst). 1. varsta
95% Confidence Interval varsta 1.00 2.00 Mean 13.650 10.700 Std. Error .343 .343 Lower Bound 12.955 10.005 Upper Bound 14.345 11.395

Pe baza rezultatelor statistice obinute putem afirma c n acest studiu exist un efect principal semnificativ statistic al vrstei, ns nu exist diferen semnificativ de gen i nici efect al interaciunii celor dou variabile.

18