P. 1
K-Gherasim

K-Gherasim

|Views: 2,849|Likes:
Published by Oana Zigman

More info:

Published by: Oana Zigman on Jun 14, 2011
Copyright:Attribution Non-commercial

Availability:

Read on Scribd mobile: iPhone, iPad and Android.
download as PDF, TXT or read online from Scribd
See more
See less

06/27/2013

pdf

text

original

Sections

  • I.1. TIPURI DE VARIABILE. DIFERENŢA DINTRE VARIABILE, VALORI ŞI SCORURI
  • I.2. PREZENTAREA APLICAŢIEI SPSS
  • I.3. DESCHIDEREA UNEI BAZE DE DATE
  • I.4. CREAREA UNEI NOI BAZE DE DATE
  • II.1. ANALIZA FRECVENŢELOR
  • II.2. IDENTIFICAREA TENDINŢEI CENTRALE ŞI A VARIABILITĂŢII SCORURILOR
  • II.3. SCORURILE Z
  • II.4. COEFICIENTUL DE CORELAŢIE PEARSON
  • II.5. COEFICIENTUL DE CORELAŢIE KENDALL'S TAU-B
  • II.6. COEFICIENTUL DE CORELAŢIE SPEARMAN
  • II.7. RECODIFICAREA ŞI TRANSFORMAREA VARIABILELOR
  • III.1. DISTRIBUŢIA NORMALĂ
  • III.2. ETAPELE TESTĂRII UNEI IPOTEZE. TESTUL Z
  • III.3. TESTUL T PENTRU COMPARAREA UNUI EŞANTION CU MEDIA POPULAŢIEI
  • III.4. TESTUL T PENTRU COMPARAREA A DOUĂ EŞANTIOANE PERECHI
  • III.5. TESTUL T PENTRU COMPARAREA A DOUĂ EŞANTIOANE INDEPENDENTE
  • III.6. ANALIZA DE VARIANŢĂ - ANOVA UNIFACTORIAL
  • III.7. ANOVA UNIVARIATE
  • III.8. ANOVA REPETED MEASURES
  • IV.1. TESTUL CHI PĂTRAT
  • IV.2. TWO INDEPENDENT SAMPLES
  • IV.3. TWO RELATED SAMPLES

SCOPUL UNITĂŢII DE CURS ▪ oferă noţiuni, explicaţii şi aplicaţii pentru a înţelege şi opera eficient cu programul SPSS 10.

0 în scopul prelucrării statistice a datelor. OBIECTIVE OPERAŢIONALE În urma studierii acestei unităţi de curs, studenţii: ▪ vor putea să definească variabilele şi să conceapă o bază de date adecvată; ▪ vor redefini şi transforma variabile; ▪ vor prelucra datele statistice la nivel descriptiv; ▪ vor realiza analiza corelaţională a datelor şi vor interpreta rezultatele obţinute; ▪ vor folosi testul t pentru compararea unui eşantion cu o populaţie şi a două eşantioane (perechi sau independente) şi vor interpreta rezultatele obţinute; ▪ vor utiliza analiza de varianţă pentru analiza efectului unui singur factor şi vor interpreta rezultatele obţinute; ▪ vor utiliza analiza de varianţă pentru analiza efectelor de interacţiune; ▪ vor utiliza metode non-parametrice de analiză a datelor. EVALUARE ▪ 40% din nota finală examen practic care presupune prelucrarea şi interpretarea datelor; ▪ 60% din nota finală evaluările de pe parcursul seminariilor, care vor presupune prelucrări şi analize statistice ale datelor.

OBSERVAŢIE !!! Cursul nu epuizează opţiunile programului SPSS şi nu suplineşte lipsa informaţiilor statistice teoretice.

ANALIZA COMPUTERIZATĂ A DATELOR

I. FAMILIARIZAREA CU PROGRAMUL SPSS 10.0
I.1. TIPURI DE VARIABILE. DIFERENŢA DINTRE VARIABILE, VALORI ŞI SCORURI Variabile sunt definite ca proprietăţi ale fenomenelor, obiectelor sau proceselor, care pot lua diferite valori. Există mai multe criterii în funcţie de care se pot clasifica variabilele: după natura măsurii variabilele pot fi: cantitative (variază cantitativ, cum ar fi de exemplu greutatea sau vârsta subiecţilor) sau calitative (sunt cele care variază calitativ, cum ar fi genul sau etnia subiecţilor); după felul variaţiei, variabilele pot fi: continui (teoretic pot lua orice valoarea, între două valori ale variabilei putând să apară o a treia valoare; vârsta subiecţilor este un exemplu de variabilă continuă) sau discrete (pot avea numai anumite valori, între care nu mai apar altele; religia, tipurile temperamentale sunt exemple de variabile discontinui); după scopul folosirii lor în studii experimentale: independente (sunt variabilele manipulate de experimentator şi care se presupune că influenţează variabila dependentă) sau dependente (reprezintă răspunsurile subiecţilor). O variabilă poate lua diferite valori. Valoarea reprezintă o măsură calitativă sau cantitativă a unui fenomen. Spre exemplu, pentru variabila “nota şcolară” valorile acesteia sunt toate notele de la 1 la 10. Pentru variabila “zilele săptămânii” valorile sunt toate cele şapte zile ale săptămânii. În psihologie se face distincţia între valori şi scoruri. Scorul este valoarea obţinută de o persoană, fenomen sau obiect atunci când ne referim la o anume variabilă. Spre exemplu, nota pe care o obţine un elev la o materie (să zicem 7) reprezintă scorul subiectului la variabila “nota şcolară”. I.2. PREZENTAREA APLICAŢIEI SPSS SPSS (în traducere Pachet statistic pentru ştiinţele sociale) este numele unui pachet de programe care ajută la analiza datelor obţinute în cercetările din domeniul ştiinţelor sociale. Deschiderea programului se poate face cu ajutorul mouse-ului, cu dublu-click asupra pictogramei programului de pe desktop. Aplicaţia mai poate fi deschisă de la butonul START/PROGRAME, opţiunea SPSS FOR WINDOWS, ca în imaginea de mai jos:

Oricare ar fi metoda de deschidere a programului, pe ecran va apărea următoarea fereastră:

251

LOREDANA GHERASIM

Prima bară din partea de sus a ferestrei oferă informaţii despre denumirea aplicaţiei şi numele fişierului cu care se lucrează. Urmează bara de meniuri a programului şi cea cu butoane. Foia cu date este organizată tabelar. Întotdeauna coloanele tabelului reprezintă variabilele studiului, în timp ce liniile, rândurile numerotate ale tabelului reprezintă subiecţii cercetării. În partea de jos a ferestrei sunt două opţiuni: DATA VIEW şi VARIABLE VIEW. Putem vizualiza datele brute ale subiecţilor, dacă este activă opţiunea DATA VIEW sau putem vizualiza descrierea variabilelor introduse în baza de date, dacă este activată opţiunea VARIABLE VIEW. De obicei, atunci când deschidem programul, este activă opţiunea DATA VIEW, cum se poate observa şi în imaginea de mai sus. Printr-un simplu click stânga pe opţiunea VARIABLE VIEW, pe ecran apare un alt tabel care permite definirea variabilelor din baza de date: Din meniul FILE putem alege comanda deschidere a unei noi baze de date (opţiunea NEW DATA) sau a unei noi foi de rezultate (NEW OUTPUT): Acest program prezintă rezultatele prelucrărilor statistice într-o pagină separată, numită OUTPUT. Comenzile care sunt colorate în gri sunt comenzi inactive pentru că baza de date nu conţine, deocamdată, nici o informaţie. Din acest meniu putem deschide, folosind opţiunea OPEN, o bază de date care a fost creată anterior (DATA) sau un fişier cu rezultatele prelucrărilor statistice anteriore (OUTPUT).

252

Rândurile conţin răspunsurile subiecţilor la diferiţi itemi. viitor. În momentul încărcării bazei de date pe ecran va apărea următoarea imagine: Valorile din baza de date reprezintă răspunsurile brute ale subiecţilor. subiectul de pe rândul 9 are valoare 3 la variabila gr_mult. valoarea 3 la variabila prezent. comanda SAVE AS permite salvarea unui fişier modificându-i numele. gr_mult. comenzile COPY. rânduri sau coloane.sav (în aplicaţia SPSS. parlam). Din meniul EDIT. fişierele cu baze de date au întotdeauna extensia sav) care se găseşte la adresa C:\MY DOCUMENTS\EXEMPLE SPSS. 4 la variabila viitor etc. directie. guv. plasarea cursorului în noua locaţie şi apoi activarea comenzii PASTE.ANALIZA COMPUTERIZATĂ A DATELOR Comanda SAVE permite salvarea obişnuită a fişierului cu date sau cu rezultate. activarea comenzii COPY/CUT din meniul EDIT. valorile numerice din fiecare coloană reprezentând scorurile subiecţilor la aceste variabile. DESCHIDEREA UNEI BAZE DE DATE Pentru deschiderea unei baze de date create anterior se activează meniul FILE/OPEN opţiunea DATA. În această bază de date avem pe coloană variabile (ca de exemplu. După activarea comenzii pe ecran apare o casetă de dialog care permite selectarea directorului şi respectiv fişierului care conţine baza de date. Opţiunile RECENTLY USED DATA şi RECENTLY USED FILES deschid bazele de date şi foile cu rezultate recent create sau utilizate în programul SPSS. Pentru a vedea ce înseamnă fiecare dintre aceste variabile trebuie activată opţiunea VARIABLE VIEW: 253 . I. Copierea sau mutarea datelor presupune selectarea datelor. Vom deschide fişierul opinii. CUT şi PASTE sunt folosite pentru copierea sau mutarea datelor din celule. Pe coloane sunt definite variabilele. prezent. De exemplu.3.

cu 20 de caractere la partea întreaga şi 0 zecimale. După introducerea primei valori automat programul a denumit prima variabilă (var0001). Această opţiune poate fi activată cu ajutorul mouse-ului cu un click stânga pe butonul gri din celula corespunzătoare variabilei. apoi se introduce numele variabilei NRSUB folosind tastatura. reprezentând itemul „Cât de mulţumit sunteţi în general de felul în care trăiţi?”. Baza de date va conţine patru variabile: numărul subiecţilor (nrsub). nivelul anxietăţii subiecţilor înaintea terapiei (ANX1) şi nivelul anxietăţii subiecţilor după terapie (ANX2) şi genul subiecţilor (1-subiecţi de gen masculin şi 2-subiecţi de gen feminin). La fel se vor introduce şi celelalte valori ale primei variabile. 254 . Spre exemplificare. vom introduce prima valoare (1) a primei variabile. fără spaţiu sau semne de punctuaţie. Pentru a defini o variabilă. CREAREA UNEI NOI BAZE DE DATE Pentru a crea o nouă bază de date trebuie activată opţiunea DATA VIEW. iar indicativul primei linii devine activ. La studiu au participat subiecţi de gen feminin şi masculin. prin executarea unui dublu click pe numele variabilei (în cazul nostru var0001) sau prin activarea butonului VARIABLE VIEW din partea de jos a câmpului. variabila gr_mult este o variabilă de tip numeric. De exemplu. Vom crea o baza de date care să conţină rezultatele la anxietate obţinute de un număr de subiecţi. Definirea variabilelor presupune activarea câmpului VARIABLE VIEW. Pentru introducerea datelor se plasează cursorul în celulă şi se introduce valoarea cu ajutorul tastelor.LOREDANA GHERASIM Variabilele sunt aşezate pe rânduri. Opţiunea TYPE permite specificarea tipului de date. coloanele reprezentând diferite caracteristici ale variabilelor. trebuie plasat cursorul în celula în care este trecut numele (NAME) generic al variabilei (var0001).4. Rezultatul va fi următorul: Numele variabilei poate să cuprindă maxim opt caractere. Pentru a utiliza cu uşurinţă datele este indicată definirea sau redenumirea variabilelor cu care lucrăm. înainte şi după intervenţia terapeutică (anxietatea a fost măsurată cu ajutorul unei scale de anxietate). I.

lunile şi anii. Opţiunea este folosită pentru variabile care folosesc coduri numerice pentru a reprezenta categorii (de exemplu. presupunându-se că noile variabile vor fi numerice. reţinând întreaga valoare. ANX2 şi Gen. Astfel. aliniate la stânga. dreapta sau central. femei şi bărbaţi. Este posibilă alegerea numărului de cifre pentru partea întreagă (WIDTH) şi a numărului de zecimale (DECIMAL PLACES). Automat la crearea unei noi baze de date. cu sau fără separator pentru mii. în psihologie se utilizează două tipuri de variabile. Tipul DOLLAR inserează în faţa valorilor simbolul dolarului. DATE permite folosirea spaţiilor. în funcţie de această caracteristică subiecţii fiind împărţiţi în două categorii distincte. ALIGNMENT permite modificarea modului în care sunt prezentate datele pe ecran. Tipul SCIENTIFIC NOTATION transformă logaritmic valorile introduse. NUMERIC şi STRING (foarte rar). VALUE LABEL permite descrierea valorile pe care le poate lua o variabilă. Tipurile COMMA şi DOT permit introducerea valorilor cu orice număr de zecimale (mai mare de 16). Variabila Gen este de tip categorial. Deşi sunt mai multe tipuri de variabile. punctelor. iar pe cei de gen feminin cu valoarea 2. vom defini numele variabilei NRSUB şi vom detalia eticheta la opţiunea LABEL ca în imaginea de mai jos: Vom introduce valorile şi vom defini şi următoarele variabile. Acest lucru presupune atribuirea de valori şi etichete celor două grupuri de subiecţi.ANALIZA COMPUTERIZATĂ A DATELOR Tipul NUMERIC permite introducerea valorilor cu sau fără zecimale. iar CUSTOM CURRENCY permite introducerea de valorilor pozitive dar şi a celor negative. se pot folosi valorile 1 şi 2 pentru a codifica genul feminin şi masculin). MISSING VALUES permite stabilirea valorilor care nu vor fi luate în seamă la prelucrarea datelor. ANX1. În exemplu nostru. Din acest motiv trebuie precizată semnificaţia valorilor variabilei. apare selectat tipul NUMERIC. afectând vizualizarea datelor. COLUMN permite specificarea numărului de caractere pentru o coloană. inclusiv spaţiul). subiecţii de sex masculin îi vom codifica cu valoarea 1. Opţiunea TYPE este de obicei folosită pentru modifica acest tip de date. virgulelor. Caracteristica LABELS permite definirea detaliată a variabilei (pot fi folosite până la maxim 256 caractere. a barelor de separarea pentru a delimita zilele. Ultima opţiune STRING permite introducerea variabilelor alfanumerice. respectiv orele şi minutele. Definirea detaliată a variabilei apare în pagina de rezultate. În acest scop vom activa opţiunea VALUE: 255 .

Astfel. după care se apasă butonul ADD. Reamintim că trebuie ales mai întâi directorul în care vream să salvăm fişierul si apoi scriem numele fişierului. Se activează butonul OK pentru a salva modificările şi închide caseta de dialog. care împart subiecţii în grupuri distincte. 256 . fie din meniul FILE se alege opţiunea SAVE. Salvarea fişierelor se face fie acţionând butonul SAVE care se găseşte în bara de instrumente. Vom salva fişierul cu numele Baza1.sav în subdirectorul EXEMPLE SPSS care se găseşte în directorul MY DOCUMENTS.LOREDANA GHERASIM Se trece valoarea în câmpul VALUE şi numele grupului sau categoriei în câmpul VALUE LABEL. vom scrie „1” în câmpul VALUE şi „subiecţi de gen masculin” în câmpul VALUE LABEL şi activăm butonul ADD. Această opţiune se foloseşte numai pentru variabilele categoriale. apoi vom scrie „2” în câmpul VALUE şi „subiecţi de gen feminin” în câmpul VALUE LABEL şi activăm butonul ADD.

înălţimea barelor corespunzând frecvenţei fiecărui interval de frecvenţă din tabelul de frecvenţă. Aceasta se găseşte la meniul ANALYZE – DESCRIPTIVE STATIASTICS: 257 . informaţia devenind.ANALIZA COMPUTERIZATĂ A DATELOR II. prin unirea mijloacelor părţilor superioare ale barelor histogramelor. Poligoanele de frecvenţă sunt o altă modalitate de reprezentare grafică a datelor din tabelele de frecvenţă. bimodale (au două vârfuri) sau multimodale (au mai multe vârfuri). reprezentări grafice ale tabelelor de frecvenţă permit o mai bună înţelegere a tendinţei grupului de rezultate. Atunci când curba este înclinată spre dreapta. prezentând modul în care se distribuie sau se împrăştie cazurile sau frecvenţele. cu alte cuvinte. adică elevii au tendinţa de a obţine mai multe note mari. Histogramele. Faţă de curba normală o distribuţie poate fi mai turtită (scorurile din cadrul ei variază foarte mult de la medie) sau mai ascuţită (scorurile variază foarte puţin de la medie). distribuţiile fiind aproximativ simetrice (nu prezintă tendinţă de înclinare). ELEMENTE DE STATISTICĂ DESCRIPTIVĂ II. Acestea se obţin. Modalitatea. Tabelul de frecvenţă. Turtirea unei distribuţii se raportează la curba normală. notele şcolare au o distribuţie înclinată spre dreapta. Analiza de frecvenţă cu ajutorul programului SPSS Opţiunea FREQUENCIES permite realizarea tabelului de frecvenţă şi a distribuţiei de frecvenţă a rezultatelor. mai comprehensibilă. distribuţia este înclinată negativ. Spre exemplu. Cele mai multe aspecte măsurate în psihologie prezintă un număr aproximativ egal de cazuri de o parte şi de alta a mijlocului. astfel. ANALIZA FRECVENŢELOR Tabelele de frecvenţă ajută la descrierea unui grup de scoruri. Din această perspectivă. Modalitatea indică câte “vârfuri” are o distribuţie. O distribuţie este înclinată atunci când are o extremă (o parte) mai împrăştiată şi mai lungă.1. arată valorile în jurul cărora se grupează rezultatele subiecţilor. Tabelele de frecvenţa grupează scorurile subiecţilor. Acestea presupun transformarea intervalelor de frecvenţă în bare. histograma şi poligonul de frecvenţă descriu o distribuţie de frecvenţă. înclinarea şi turtirea sunt indicatori care descriu forma distribuţie scorurilor. distribuţiile pot fi unimodale (au un singur vârf). fiind cele mai simple procedee ale statisticii descriptive. care permit înţelegerea tendinţei unui grup de scoruri. iar când curba este înclinată spre stânga. Înclinarea arată dacă în distribuţie apar mai multe valori mari sau mai multe valori mici. distribuţia este înclinată pozitiv.

Câmpul din dreapta reprezintă câmpul de analiză. CHART VALUES permite alegerea tipului de valori afişate în grafic (Frecvenţe sau Procentaje). apoi se activează butonul CONTINUE. butonul CHARTS permite afişarea histogramei de frecvenţă. se bifează afişarea curbei normale (WITH NORMAL CURVE). împreună cu denumirea extinsă a variabilei. Astfel. Opţiunea FORMAT permite modificarea formei OUTPUT-ului. Se selectează variabila ANX1 din câmpul din stânga şi se activează butonul de trecere: Pentru ca în foaia de rezultate să apară tabelul de frecvenţă se selectează opţiunea DISPLAY FREQUECY TABLES. Opţiunea STATISTICS deschide o fereastră cu opţiuni de prelucrare statistică. Opţiunea FORMAT permite modificarea formei de prezentare a datelor în foia cu rezultate (OUTPUT). Bifarea opţiunii DISPLAY FREQUECY TABLES are ca efect afişarea în foaia de rezultate a tabelul de frecvenţă. dorim realizarea tabelului de frecvenţă şi histogramei pentru variabila „nivelul anxietăţii înainte de terapie” (ANX1). Pentru exemplul nostru se selectează opţiunea HISTOGRAMS. Trecerea variabilelor în câmpul de analiză se realizează cu ajutorul butonului cu săgeată care se găseşte între câmpuri. în ordinea introducerii lor în baza de date. Pentru exemplul nostru. analiza statistică se realizează doar pentru variabilele trecute în acest câmp. Se selectează din câmpul din stânga variabila pe care vrem să analizăm apoi se activează butonul de trecere. Pentru afişarea histogramei de frecvenţă se activează butonul CHARTS: Opţiunea CHART TYPE permite alegerea unui tip de grafic (cu bare. Activarea acestui buton are ca efect apariţia următoarei casete de dialog: 258 .LOREDANA GHERASIM După activarea opţiunii pe ecran apare următoarea casetă de dialog: În câmpul din stânga al casetei FREQUENCIES sunt afişate toate variabilele din baza de date. plăcintă sau histogramă). Acest mod de organizare în două câmpuri apare la aproape toate opţiunile de prelucrare a datelor.

prezentate în ordine crescătoare (fără a ţine seama de cazurile lipsă). indiferent dacă aceştia au sau nu scoruri la această variabilă. pentru fiecare variabilă. cel din stânga. În cazul nostru coloanele PERCENT şi VALID PERCENT sunt identice deoarece toţi subiecţii au scoruri la această variabilă. Coloana FREQUENCY prezintă frecvenţa. Pentru exemplul nostru. Coloana CUMULATIVE PERCENT prezintă procentajul cumulat. Pentru exemplu nostru. Derulând pagina cu rezultate sau selectând HISTOGRAM în câmpul din stânga. În primul tabel se precizează numărul de subiecţi şi numărul de răspunsuri. doi subiecţi au obţinut scorul 103. de la cel mai mic scor la până la cel mai mare. adică numărul de subiecţi care obţin o anumită valoare. se activează butonul OK al casetei FREQUENCIES. De exemplu. afişează structura sau cuprinsul OUPUT-ului. iar cel din dreapta conţine opţiuni de prezentare comparativă a rezultatelor şi de organizare separată a foii de rezultate. putem vizualiza reprezentarea grafică a frecvenţei scorurilor: 259 . ceea ce reprezintă 10% din totalul numărului de răspunsuri obţinute. numită OUTPUT: Fereastra OUPUT este organizată în două câmpuri. Coloana PERCENT transformă frecvenţa obţinută pentru fiecare valoare în procentaj ţinând cont de numărul total de subiecţi luaţi în calcul. atunci cele două coloane ar fi conţinut valori diferite. Rezultatele sunt organizate în două tabele. iar cel din dreapta arată conţinutul foii cu rezultate. vom păstra opţiunile selectate automat. Coloana VALID prezintă valorile variabilei. Spre exemplu. 60% dintre subiecţi au note mai mici sau egale cu 106.ANALIZA COMPUTERIZATĂ A DATELOR Câmpul din stânga al ferestrei conţine opţiuni de aranjare a rezultatelor (în ordine descrescătoare sau crescătoare a valorilor sau cantităţilor). Dacă unii subiecţi nu ar fi răspuns la chestionarul de anxietate. VALID PERCENT prezintă procentajul luând în calcul doar subiecţii care au răspuns la această variabilă. Al doilea tabel este organizat în cinci coloane. După selectarea opţiunilor de realizare a tabelului de frecvenţă şi histogramei. avem 20 de subiecţi care au răspuns la chestionar (nu lipseşte nici o valoare). Pe ecran apare o fereastra cu rezultate.

Pentru exemplificare introducem variabila ANX1. IDENTIFICAREA TENDINŢEI CENTRALE ŞI A VARIABILITĂŢII SCORURILOR Metodele descriptive pentru identificarea tendinţei centrale şi de împrăştiere indică tendinţa centrală a unui grup de scoruri.sav) se poate face folosind meniul WINDOW.2. arată valoarea tipică. folosind ca indicatori varianţa şi abaterea standard. reprezentativă a unui grup de scoruri. câmpul în care sunt prezentate toate variabilele din baza de date 2. marcând opţiunea dorită (baza de date sau foaia de rezultate): II.LOREDANA GHERASIM Histograma de frecvenţă se mai poate obţine folosind meniul GRAPHS – HISTOGRAM. folosind ca indicatori media. Se obţine aceeaşi reprezentare grafică ca şi în cazul folosirii butonului CHART al ferestrei FREQUENCIES. cu ajutorul butonului cu săgeată. deoarece abaterile de la medie într-o direcţie (abaterile scorurilor mici de la medie) sunt egale cu 260 . mediana şi modul şi tendinţa de împrăştiere a grupului de scoruri. Media aritmetică descrie tendinţa centrală într-un grup de rezultate. câmpul în care se introduce variabila pentru care dorim să realizăm histograma de frecvenţă 3. Media este punctul faţă de care scorurile sunt egal depărtate. selectarea acestei opţiuni va duce la afişarea curbei normală de distribuţie a rezultatelor. în câmpul VARIABLE şi bifăm opţiunea DISPLAY NORMAL CURVE. Vizualizarea ferestrei OUTPUT sau DATE (baza1. Activarea opţiunii duce la apariţia următoarei casete de dialog: 2 1 3 Elementele principale ale ferestrei sunt: 1.

media aritmetică rămâne metoda cel mai des utilizată pentru descrierea tendinţei grupului de scoruri. fiind indicatorul cel mai descriptiv (deoarece indică orice modificare survenită în distribuţie). însă. Mediana şi modulul. După cum se poate vede şi în imaginea de mai jos. Vom calcula parametrii tendinţei centrale şi ai variabilităţii pentru variabila ANX1 (nivelul anxietăţii înaintea terapiei). Se trece variabila în câmpul din dreapta apoi se activează butonul STATISTICS. Pentru a cunoaşte exact cu cât variază scorurile în medie este nevoie să calculăm deviaţia standard. Modul reprezintă valoarea cu frecvenţa cea mai mare. indică gradul de variabilitate a unui grup de rezultate. Mediana împarte distribuţia în două părţi egale. casetă de dialog care se deschide cuprinde patru câmpuri cu opţiuni: 261 . Media. Abaterea standard ne arată cu cât se împrăştie scorurile în jurul valorii centrale şi se măsoară în aceleaşi unităţi de măsură ca şi scorurile iniţial. care sunt mai stabile sunt recomandate pentru descrierea distribuţiilor asimetrice şi multimodale. Trebuie să cunoaştem gradul de variabilitate a scorurilor noastre. Mai precis.ANALIZA COMPUTERIZATĂ A DATELOR abaterile în cealaltă direcţie (abaterile scorurilor mari de la medie). Varianţa (SD2=( ∑ (X-M)2/N) unei distribuţii arată cât de “împrăştiate” sunt scorurile în jurul valorii centrale. „Baza1. jumătate dintre scorurile distribuţie având valori mai mici ca mediana. normale m+SD scoruri mari Scorurile care sunt mai mari decât media cu o abatere standard sunt considerare scoruri mari iar cele mai mici decât media cu mai mult de o abatere standard sunt considerate ca fiind scoruri slabe. trebuie să ştim cât de mult (sau cu cât) se împrăştie scorurile în jurul valorii medii. Este indicatorul care este cel mai puţin afectat de schimbările structurii (modificări ale numărului de scoruri sau mărimii scorurilor distribuţiei). Cu cât este mai mare această valoare. Există însă metode statistice (cum a fi testele neparametrice) în care se utilizează doar mediana şi modul. Cu toate acestea. Pentru analiză vom folosi baza de date realizată anterior. Ilustrăm grafic acest lucru: m-SD scoruri mici m scoruri medii. Abaterea standard este rădăcina pătrată a varianţei (SD = SD 2 ). este cea mai “sensibilă” la modificarea numărului de scoruri sau mărimii scorurilor. Calculul tendinţei centrale şi a variabilităţii folosind SPSS Meniul din SPSS care permite calculul indicatorilor tendinţei centrale şi ai împrăştierii se găseşte la ANALYZE – DESCRIPTIVE STATISTICS – FREQUENCIES. Cunoaşterea acestor indicatori nu este suficientă pentru a descrie complet o distribuţie. Mediana este şi ea destul de puţin afectată de modificările structurii distribuţiei. iar cealaltă jumătate valori mai mari. Se recomandă utilizarea mediei în distribuţiile simetrice şi unimodale. Aceste rezultate sunt considerate tipice sau normale pentru o distribuţie. acest indicator intrând în componenţa multor metodele statistice. cu atât mai mult se împrăştie scorurile în jurul valorii centrale. tipice. În intervalul cuprins între medie şi o abatere standard la stânga şi dreapta mediei găsim aproximativ 2/3 din totalul scorurilor.sav”. Este o măsură a gradului de variabilitate a scorurilor şi arată cât de mult se abat scorurile de la tendinţa centrală.

În consecinţă se bifează (cu un simplu click stânga al mouse-ului) opţiunile MEAN. Câmpul DISTRIBUTION oferă posibilitatea aflării indicatorilor de turtire (KURTOSIS)şi înclinare ai unei distribuţii în comparaţie cu cea normală (SKEWNESS). amplitudine (RANGE). DEVIATION).E. MEDIAN. MODE din câmpul CENTRAL TENDENCY şi opţiunile STD DEVIATION şi VARIANCE din câmpul DISPERSION: Activăm butonul CONTINUE şi apoi cel OK al casetei FREQUENCIES.LOREDANA GHERASIM Câmpul PERCENTILE VALUES conţine opţiuni care permit calculul valorilor corespunzătoare împărţirii subiecţilor în grupuri egale. prin afişarea valorilor care delimitează aceste grupuri. varianţă (VARIANCE). valori minime (MINIMUM) şi maxime (MAXIMUM) şi eroare standard (S. mod (MODE) şi suma valorilor seriei (SUM). Pentru exemplu nostru ne interesează calculul parametrilor tendinţei centrale ai distribuţiei şi de împrăştiere. mediana (MEDIAN). Această opţiune permite calculul cuartilelor (QUARTILES) sau altor cuartile (de exemplu CUT POINTS FOR 10 EQUAL GROUPS) sau centile (PERCENTILE). CENTRAL TENDENCY conţine opţiunile folosite pentru calculul indicatorilor tendinţei centrale ale distribuţiei: media (MEAN). Valorile indicatorilor sunt grupate în tabelul Statistics: 262 . Opţiunile din câmpul DISPERSION permit calcularea diferiţilor parametri referitori la dispersia (împrăştierea) scorurilor în jurul valorii centrale: abatere standard (STD. MEAN care reprezintă abaterea standard a distribuţii tuturor mediilor posibile calculate pentru eşantioane aleatoare repetate).

Reprezentarea grafică indică apariţia unui singur vârf (distribuţie unimodală) şi o alungire şi împrăştiere a extremei drepte a distribuţiei (distribuţie înclinată spre dreapta).5.ANALIZA COMPUTERIZATĂ A DATELOR Astfel. Rezultatele obţinute sunt următoarele: Astfel. ceea ce însemnă că distribuţia este unimodală (apare o singură valoare la mod) şi uşor înclinată spre dreapta spre valorile mai mari ale variabilei (valoarea mediei este mai mare decât a medianei). Mod=104. Distribuţia scorurilor subiecţilor la această variabilă indică aceeaşi formă.90. Mod=102. Distribuţia scorurilor este bimodală (apar două valori cu frecvenţa cea mai mare) şi înclinată spre valorile mici ale variabilei (media este mai mică decât mediana). M=107.5. M=107.95. Mod=110 (a doua valoare a modul se extrage din tabelul de frecvenţă). Med=109. 263 . La fel se calculează indicatorii tendinţei centrale şi de împrăştiere pentru variabila ANX2 (nivelul anxietăţii subiecţilor după terapie). Med=105.

astfel. deoarece acestui scor îi corespunde un scor Z de +2 (ceea ce înseamnă că scorul este mai mare ca media cu două deviaţii standard). Schema de mai jos prezintă notele standard Z corespunzătoare mediei şi limitelor de variaţie maximă şi minimă. Spre exemplu. dacă scorul său Z va fi mai mare decât +1. notele Z arată de câte ori acel scor este mai mare sau mai mic decât media (ţinând cont de variabilitate). dacă scorul său Z are valoare mai mică decât –1. De asemenea. distribuţia scorurilor pentru prima variabilă este mai ascuţită. Scorurile Z îndeplinesc o serie de funcţii. Trebuie ţinut seama de o serie de reguli. limitei minime de variaţie tipică îi corespunde scorul standard -1.3. iar abaterea standard valoarea 1. ne ajută să precizăm dacă un scor este mic. valorile fiind mai grupate în jurul medie (şi varianţa şi abaterea standard au valori mai mici). Nota standard Z arată cu câte deviaţii standard se abate un scor de la medie (Z=(X-M)/SD). Permit compararea unui scor cu o distribuţie la care cunoaştem parametrii (media şi deviaţia standard). un scor x este considerat “mare” raportat la distribuţia Z. dacă scorurile la un test de inteligenţă într-o populaţia sunt descrise de media m=100 şi deviaţia standard SD=15.LOREDANA GHERASIM Comparând reprezentările histogramele de frecvenţă pentru variabilele ANX1 şi ANX2. întrucât notele Z arată raporturi şi sunt adimensionale (nu depind de ceea ce măsurăm). 264 . distribuţia fiind mai turtită (în acest caz varianţa şi abaterea standard au valori mai mari). m-SD scoruri”mici” m scoruri medii. o persoană cu scorul brut 130 este „de două ori mai deşteptă ca media celorlalţi”. iar limitei maxime de variaţie normală îi corespunde nota standard +1. mediu sau mare. SCORURILE Z Nota Z indică deviaţia unui scor (x) de la medie (m) exprimată în deviaţii standard. tipice normale m+SD scoruri”mari” x -1 0 +1 Z Aceasta distribuţie ne permite să stabilim cum este scorul x în raport cu media (care este 0) şi abaterea standard (care are valoarea 1). II. un scor x este considerat “mediu” dacă scorul său Z este cuprins în intervalul [–1. Astfel. putem analiza variabilitatea rezultatelor la cele două variabile. Mediei îi corespunde întotdeauna mereu scorul standard 0. O altă funcţie a notelor z este aceea că permit compararea scorurilor obţinute de aceeaşi persoană la probe diferite. un scor x raportat la distribuţia Z este considerat “mic”. La variabila ANX2 se constată o mai mare variabilitate a rezultatelor. +1]. Astfel. Distribuţia în note Z este o distribuţie ideală în care media are întotdeauna valoarea 0.

ANALIZA COMPUTERIZATĂ A DATELOR Calculul notelor Z folosind SPSS Comanda DESCRIPTIVES care se găseşte în meniul ANALYZE – DESCRIPTIVE STATISTICS.sav”). Se activează butonul OPTIONS. cuprinde opţiuni de calcul ai parametrilor distribuţiei. care deschide următoarea fereastră: Automat sunt selectate de computer opţiunile de calcul al mediei. câmpul în care sunt prezentate variabilele din baza de date 2. Vom folosi baza de date creată anterior („Baza1. câmpul în care se introduc variabilele care vor fi analizate 3. abaterii standard şi al valorii minime şi maxime. vom calcula notele Z pentru variabila ANX1. Pentru exemplificare. permite calculul notelor Z cu ajutorul SPSS. Activarea comenzii duce la apariţia pe ecran a casetei de dialog următoare: 1 2 3 4 Prezentăm principalele elemente ale ferestrei DESCRIPTIVES: 1. Vom activa butonul CONTINUE şi apoi butonul OK al ferestrei pentru a putea face 265 . opţiunea SAVE STANDARDIZED VALUES AS VARIABLES permite salvarea în baza de date a scorurilor standard sub forma unei noi variabile. 4. Se bifează opţiunea SAVE STANDARDIZED VALUES AS VARIABLES.

Subiectul al doilea are un nivel normal al anxietăţii. Rezultatele obţinute în urma comenzii DESCRIPTIVES sunt mai sumare şi prezentate într-un singur tabel.LOREDANA GHERASIM analiza statistică. Vom vizualiza baza de date pentru a vedea dacă apare noua variabilă care conţine rezultatele subiecţilor transformate în note Z. Corelaţia indică existenţa unei legături între variabile. Se observă apariţia unei noi variabile. putem analiza legătura dintre nivelul stresului unui manager şi numărul de subordonaţi. COEFICIENTUL DE CORELAŢIE PEARSON Notele Z fac posibilă analiza legăturii dintre două variabile. nivelul anxietăţii acestuia fiind de 2 ori şi jumătate mai mare decât media.6 care corespunde unui scor standard 124 obţinută de subiectul 15. care are un scor z–0.98 pentru o valoare brută de 102.+1).4. Scorul primului subiect este atipic. De exemplu. scorurile medii la prima variabilă se asociază cu scoruri medii la a doua variabilă şi scorurile mari la 266 . Prin transformarea notelor brute obţinute de subiecţi la cele două variabile putem să identificăm dacă exista sau nu o legătură între aceste două variabile. întrucât ea descrie ce se petrece într-un grup de rezultate (r=( ∑( Z1 * Z 2) / N ). iar cea mai mică valoare la anxietate a obţinut-o subiectul 8. Se constată că cel mai mare scor z este 2. cu numele ZANX1. Corelaţia este o metodă statistică descriptivă. rezultatul fiind aproape cu o unitate mai mic decât media. pe ultima coloană. ceea ce semnifică faptul că subiectul are un nivel ridicat al anxietăţii raportat la ceilalţi subiecţi. II. dar plasându-se în limita (–1 . Putem analiza rezultatele obţinute. legătură care poate fi pozitivă (când scorurile slabe la prima variabilă se asociază cu scoruri slabe la a doua variabilă.

fie y poate fi cauză pentru x. Ipotezele direcţionale sunt cele în care se precizează tipul de modificare. Situaţia I corespunde minciunii.050). cercetătorul se aşteaptă la un anumit rezultat. Dacă dorim însă să avem mai multe şanse în a demonstra ceva şi consecinţele nu sunt grave în caz de greşeală. În cercetarea ştiinţifică se lucrează de obicei cu două praguri de semnificaţie.ANALIZA COMPUTERIZATĂ A DATELOR prima variabilă se asociază cu scoruri mari la a doua variabilă). Testul de semnificaţie pentru verificarea acestui tip de ipoteză este ONE-TAILED. vom considera un test statistic ca fiind semnificativ dacă pragul de semnificaţie este mai mic sau cel mult egal cu valoarea 0. pragul de semnificaţie. Pragul de semnificaţie (p) În psihologie este necesară generalizarea concluziile studiilor. corelaţia pozitivă poate lua valori de la 0 la 1. după analiza rezultatelor corelaţiei ne interesează să vedem dacă legătura găsită (la un grup de oameni) poate fi extinsă la întreaga populaţie. Pragul de semnificaţie. În concluzie. Bineînţeles că între variabile poate să nu apară nici o legătură. p. Testul de semnificaţie pentru verificarea acestui tip de ipoteză este TWO-TAILED. Pentru aceste ipoteze probabilitatea de eroare se stabileşte la una dintre extremităţile distribuţiei. 267 . indică în ce măsură ne înşelăm atunci când afirmăm ceva. Coeficientul de corelaţie (r) indică gradul în care apare paternul unei relaţii între cele două variabile. Ipoteza din exemplul nostru ar putea fi formulată direcţional. În cazul corelaţiei. Acest coeficient poate lua valori de la -1 la +1. Analiza corelaţiei dintre două variabile nu permite stabilirea relaţiei de cauzalitate între aceste variabile. iar corelaţia negativă poate lua valori la de -1 la 0. indică dacă există o legătură între două sau mai multe variabile.010 (prag de eroare de 1%). iar situaţia II corespunde ignoranţei. Dacă vrem să evităm primul tip de greşeală care are consecinţe mai grave (de a demonstra ceva ce nu există în realitate). negativă (când scorurile slabe la prima variabilă se asociază cu scoruri mari la a doua variabilă. atunci se preferă pragul de eroare de 5% (deci un p=0. alegem pragul de semnificaţie de 0. Există trei modalităţi de interpretare a unui coeficient de corelaţie obţinut între două variabile (x şi y): fie x poate fi cauză pentru y. prezentate în tabelul de mai jos: Evenimentul Apare Nu apare Predicţia Apare Corect Eroarea I Evenimentului Nu apare Eroarea II Corect Sunt două situaţii în care se poate greşi: când afirmăm că un eveniment se va produce şi în realitate acesta nu va apărea (eroare de tip I) sau când afirmăm că un eveniment nu se va produce şi aceste va apare (Eroare de tip II).05 (5% eroare).050. În cazul nostru ipoteza ar putea fi formulată non-direcţional astfel: există o legătură între salariul iniţial şi final al subiecţilor. când se fac predicţii pot să apară patru situaţii. Mai precis. Astfel. scorurile medii la prima variabilă se asociază cu scoruri medii la a doua variabilă şi scorurile mari la prima variabilă se asociază cu scoruri mici la a doua variabilă). În general. fie a apărut a o treia variabilă care a determinat apariţia simultană a celor doua variabile. ne interesează să ştim în ce măsură rezultatele se datorează întâmplării.01 (1% eroare) şi pragul de 0. corespunzătoare procentajului de eroare: pragul de 0. Ipotezele non-direcţionale sunt cele în care nu se precizează tipul de relaţie dintre variabile. În psihologie se lucrează cu două modalităţi de formulare a ipotezelor (non-direcţionale sau direcţional). În testarea acestor ipoteze probabilitatea de eroare de 1% sau 5% se împarte la cele extremităţi (cozi) ale distribuţiei scorurilor.

654. 260. 198. 280. 205. 3. 199 Pentru calculul corelaţiei se activează opţiunea BIVARIATE din meniul ANALIZECORRELATE: Activarea comenzii va deschide următoarea fereastră: 1 2 3 4 5 5 Elementele principale ale ferestrei sunt: 1. 221. 298. Calcularea corelaţiei Pearson cu ajutorul SPSS Pentru a calcula acest coeficient de corelaţie cu ajutorul aplicaţiei SPSS vom crea o nou bază de date “Baza2. Sal_in (salariul iniţial al subiecţilor) şi sal_fin (salariul final al subiecţilor). 3. 175. 168. 2. 2. 332. 1. 168. 445. 502. 245 • sal_fin: 201. 341. 268 . 205. cu cât salariul iniţial este mai mare cu atât şi salariul final va fi mai mare. 2. 1. 203. 185. 582. 3 • sal_in: 189. 220. unde se introduc variabilele ce vor fi analizate. 258.LOREDANA GHERASIM astfel: legătura dintre salariul iniţial şi final este pozitivă. 178. 2. 2. 1. 3. 3. 3. 305. 1. 220. 298. se pot introduce mai multe variabile. aceste variabile au următoarele valori: • studii:1. 401. 542. 2. 392. 3. 1. 725. câmpul de analiză. 2. 274. coeficienţii KENDALL şi SPEARMAN se folosesc pentru date categoriale şi ordinale. 301. câmpul care prezintă lista variabilelor din baza de date. 3. 201. 197. în câmpul CORRELATION COEFFICIENTS se alege tipul de corelaţie: coeficientul Pearson se foloseşte pentru date parametrice (variabile cantitative şi continui). calculatorul afişând corelaţiile între variabilele luate două câte două. 954. 2 (studii medii) şi 3 (studii superioare). 1. 301. 156. 3. 425. 185.sav”. 206. 625. 2. 2. 1. 210. 214. 403. 201. 214. care va cuprinde 3 variabile: STUDII (nivelul de studii al subiecţilor) cu trei valori 1 (studii generale).

butonul OPTIONS este urmat de apariţia unei casete de dialog. prin excluderea din analiză a perechilor de rezultate în care avem doar una dintre valori (EXCLUDE CASES PAIRWISE) sau de a exclude din analiză un rând întreg dacă doar una dintre valori lipseşte (EXCLUDE CASES LISTWISE). Vom introduce variabilele SAL_INI şi SAL_FIN în câmpul din dreapta. Coeficientul de corelaţie Pearson este selectat implicit de către calculator. 5. Aceasta permite realizarea unei analize descriptive a datelor (STATISTICS) şi precizarea modalităţii de tratament a datelor lipsă MISSING VALUES. la fel ca şi celelalte opţiuni test de semnificaţie TWO-TAILED şi marcarea cu asterisc a corelaţiilor semnificative FLAG SIGNIFICANCE CORRELATIONS. Pentru baza de date creată vom analiza legătura dintre variabilele salariu iniţial şi final al subiecţilor. câmpul TEST OF SEGNIFICANCE permite selectarea modului de testate a ipotezei (TWOTAILED sau ONE-TAILED). 6. în foaia OUTPUT sunt afişate următoarele rezultate: 269 .ANALIZA COMPUTERIZATĂ A DATELOR 4. După activarea butonului OK. de obicei se foloseşte pragul TWO-TAILED în testarea ipotezelor de cercetare cu ajutorul SPSS. Se recomandă utilizarea primei variante selectată implicit. opţiunea FLAG SIGNIFICANCE CORRELATIONS are ca efect apariţia unui asterisc (*) în dreptul corelaţiilor semnificative.

50.30. dar lipsită de semnificaţie (nu apare nici un prag de semnificaţie). Prima celulă din stânga (notată cu 4) prezintă coeficientul de corelaţie între variabila salariul iniţial şi salariul iniţial (ANX1 şi ANX1). (2-TAILED) apare probabilitatea de eroare la respingerea ipotezei de nul şi acceptare a ipotezei de cercetare Rândul 3 . cu un salariu tot mic.PEARSON CORRELATION se găsesc valorile coeficienţilor de corelaţie dintre două variabile Pe rândul 2 . Se consideră. Între o variabilă şi ea însăşi apare o corelaţie perfect pozitivă (r=1. semnul este pozitiv. Vom extrage datele pentru legătura dintre salariul iniţial şi salariul final al subiecţilor: Interpretarea corelaţiei: r=0.N conţine numărul de subiecţi care au scoruri la ambele variabile În tabel apare legătura dintre fiecare variabilă şi ea însăşi (ANX1 şi ANX1 şi respectiv între ANX2 şi ANX2) dar şi legătura dintre cele două variabile (între ANX1 şi ANX2 dar şi între ANX2 şi ANX1). ceea ce înseamnă că un salar iniţial mic se asociază. N=24 (numărul de subiecţi). În celula din dreapta sus apare coeficientul de corelaţie dintre salariul iniţial şi salariul final (ANX1 şi ANX2). legătura este medie la o valoare a lui r cuprinsă între 0. Acest coeficient de corelaţie nu aduce nici un fel de informaţie şi în consecinţă nu se analizează.SIG.0). astfel. La fel nu se analizează corelaţia dintre variabila salariul final şi salariul final (ANX2 şi ANX2). Pe rândul 1 . Sunt mai multe elemente de care trebuie să se ţină seama în interpretarea corelaţiei: • semnul corelaţiei: arată natura legăturii care există pozitive (dacă semnul este pozitiv) sau negative (dacă semnul este negativ).30-0. Rezultatele sunt identice deoarece corelaţie este bidirecţională (corelaţia dintre variabilele A şi B este acelaşi lucru cu cea dintre variabilele B şi A). • mărimea absolută a coeficientului: descrie tăria legăturii care apare între variabile. Acelaşi rezultate apar şi în celula din stânga jos care prezintă coeficientul de corelaţie dintre salariul final şi salariul iniţial (ANX2 şi ANX1).LOREDANA GHERASIM 2 4 1 3 5 Se observă că cele două variabile apar pe coloane da şi pe linii. În consecinţă rezultatul poate fi extras din oricare din cele două celule. În cazul nostru. legăturile puternice având o mărime absolută mai 270 . un salar iniţial mediu se asociază cu un salar final mediu şi un salar mare iniţial se asociază cu salariu mare final. p<0.81 (coeficientul de corelaţie).001 (pragul de semnificaţie). că legătura este slabă dacă valoarea absolută a lui r nu depăşeşte 0. semnificaţia acestuia şi numărul de perechi de scoruri. după cinci ani.

Putem spune că există o legătură semnificativă între nivelul iniţial şi final al salariului subiecţilor. Coeficientul de corelaţie ridicat la pătrat ne indică proporţia de varianţă explicată de relaţia găsită. În exemplu nostru. În dreapta ferestrei apar mai multe opţiuni. pentru ca ea să fie completă. Această opţiune se alege cu un simplu click stânga al mouse-ului: Se activează butonul IF.ANALIZA COMPUTERIZATĂ A DATELOR mare de 0.50 • pragul de semnificaţie dacă este mai mic de 0. valoarea este 0. Pentru a selecta numai subiecţii care au studii generale.81. Proporţia de varianţă indică la ce procent din populaţia generală apare relaţia. pragul de semnificaţie fiind mai mic de 0. Spre exemplu.05. Activarea meniului este urmată de apariţia următoarei ferestre: În câmpul din stânga al ferestrei sunt prezentate toate variabilele din baza de date. care deschide următoarea casetă de dialog: 271 . Toate aceste elemente trebuie să apară în interpretare.50. deci r2=0. Pe noi ne interesează opţiunea IF CONDITION IS SATISFIED. • proporţia de varianţă.05.65 (r=0. deci relaţia găsită este prezentă la 65% dintre subiecţi.001. În exemplul nostru. pentru a arăta că probabilitatea de a greşi este mai mică decât 0. deoarece vrem să selectăm numai cazurile care îndeplinesc o anumită condiţie (să aibă valoarea 1 la variabila studii adică să fie numai subiecţi cu studii generale). Pentru exemplu nostru proporţia de varianţă are valoarea 0. atunci putem considera că există o relaţie între variabilele studiate.1% (calculatorul ne afişează doar primele trei zecimale). se foloseşte comanda SELECT CASES din meniul DATA. Subiecţii sunt împărţiţi în grupe în funcţie de nivelul de studii (studii).65). Se observă că abia 65% din variaţia observată se întâlneşte în realitate. tăria legăturii este ridicată (r=0. vrem să vedem dacă legătura dintre salariul iniţial şi salariul final are aceeaşi valoare la subiecţii care au studii generale. În aceste situaţii se raportează un p<0. fiind codificaţi cu 1 în baza de date.81) coeficientul având valoare mi mare de 0. Comanda SELECT CASES Uneori este necesară selectarea anumitor cazuri din populaţie pentru a face o prelucrare statistică.000.

baza de date modificându-se. Pentru exemplul nostru. Se poate folosi tastatura sau se pot activa butoanele cu cifre şi semne ce se găsesc sub acest câmp. Condiţia va arăta astfel: Se apasă apoi butonul CONTINUE pentru a salva condiţia: Se activează butonul OK. cum se poate observa şi în imaginea de mai jos: 272 .LOREDANA GHERASIM Se selectează variabila în funcţie de cre se face selecţia şi se trece în câmpul dintre dreapta sus. În cazul nostru se selectează variabila STUDII şi se trece în câmpul din dreapta: Se adăugă condiţia. variabila Studii trebuie să aibă numai valoarea 1 (STUDII=1).

salariul iniţial mediu se asociază cu un salar final mediu. Se obţine următorul tabel în fereastra cu rezultate: Rezultatul obţinut este următorul: r=0. care indică rezultatul selecţiei. intitulată FILTER_$. În continuare vom interpreta aceste rezultate: • semnul corelaţiei: corelaţie pozitivă. Explicaţia lipsei de semnificaţie a corelaţiei dintre cele două variabile (în condiţiile în care coeficientul de corelaţie are valoare ridicată) este numărul mic de subiecţi. salariul iniţial mare se asociază cu un salar final mare. p=0. Cazurile neselectate sunt “tăiate”. deci relaţia găsită apare la 47% dintre subiecţii cu studii generale. legătura este direct proporţională. adică ele vor fi ignorate de la analiză. Numărul de subiecţi din analiză influenţează valoarea pragului de semnificaţie al corelaţiei dar nu şi puterea legăturii dintre variabile. 273 . deci nu există o legătură semnificativă între salariul iniţial şi final al subiecţilor care au studii generale. După selecţie trebuie făcută prelucrarea statistică a datelor.ANALIZA COMPUTERIZATĂ A DATELOR La sfârşitul bazei de date apare o nouă variabilă.056. care avertizează utilizatorul cu privire la activarea unei comanzi de selecţie Atenţie! Selectarea datelor nu implică şi efectuarea analizei statistice. În cazul subiecţilor cu studii generale se constată că nivelul mic al salariului iniţial se asociază cu un nivel mic al salariului final. În partea din dreaptajos a ecranului apare anunţul FILTER ON.050. valoarea lui r depăşeşte valoarea de 0.47. • mărimea absolută a coeficientului: puterea legăturii dintre cele două variabile este ridicată.69.50. • pragul de semnificaţie: valoarea pragului de semnificaţie este mai mare de 0. • proporţia de varianţă explicată de relaţia este r2=0. În cazul nostru trebuie utilizată comanda de analiză a corelaţiei dintre salariul iniţial şi cel final.

care avertizează utilizatorii că baza de date este împărţită în funcţie de condiţiile (nivelurile) variabilei de grupare . trebuie folosită comanda CORRELATIOS pentru a analiza legătura dintre variabilele salariu iniţial şi final al subiecţilor. La fel ca şi în cazul comenzii SELECT CASES.sav. în fişierul OUTPUT. simpla împărţire a bazei de date nu asigură prelucrarea statistică. Rezultatele analizei statistice sunt prezentate separat. Pentru baza de date BAZA2. se deschide din nou în meniul iniţial DATA . introducem variabila de grupare (STUDII) în câmpul care se activează sub această opţiune: După apăsarea butonului OK. cu ajutorul săgeţii. Activarea comenzii SPLIT FILE deschide următoarea fereastră: Dintre opţiunile din dreapta alegem ORGANIZE OUTPUT BY GROUPS şi apoi. Comanda SPLIT FILE Uneori însă dorim să vedem ce se întâmplă pentru fiecare subgrup de subiecţi în parte. astfel. pentru fiecare condiţie a variabilei independente: studii generale. medii şi superioare: 274 . vom analiza legătura dintre variabilele salariul iniţial şi salariul final pentru toate categoriile de subiecţi în funcţie de variabila STUDII (nu numai pentru subiecţii cu studii generale dar şi pentru cei cu studii medii şi superioare). şi anume comanda SPLIT FILE. Se activează apoi butonul OK. Pentru dezactivarea selecţiei. în partea dreaptă-jos a bazei de date apare anunţul SPLIT FILE ON.SELECT CASES.LOREDANA GHERASIM După folosirea acestui “filtru” este indicată dezactivarea. comanda de filtrare a datelor dispare. În partea de jos a ferestrei se găseşte buton RESET. De aceea. Pentru a nu repeta comanda SELECT CASES de multe ori se poate utiliza o altă comandă din meniul DATA.

care deschide următoarea fereastră: 275 . comanda SCATTER. care deschide fereastra: Vom alege un grafic simplu. Se activează apoi butonul DEFINE. care să ilustreze relaţia dintre două variabile.ANALIZA COMPUTERIZATĂ A DATELOR nivelul de studii al subiecţilor = studii generale nivelul de studii al subiecţilor = studii medii nivelul de studii al subiecţilor = studii superioare Graficul corelaţiei Relaţia dintre două variabile poate fi reprezentată grafic sub forma unui nor de puncte. graficul îl alegem din meniul GRAPHS. Practic. deci vom selecta opţiunea SIMPLE.

Pentru exemplul nostru norul de puncte este ascendent crescător (din stânga-jos spre dreapta-sus) deoarece relaţia dintre variabile este pozitivă. Dacă relaţia ar fi fost invers proporţională. norul de puncte ar fi fost orientat 276 . grupate deoarece coeficientul de corelaţie are valoare ridicată (r=0. Reprezentarea grafică a corelaţiei este următoarea: Reprezentarea grafică a corelaţiei apare sub forma unui nor de puncte. iar punctele sunt apropiate.81).LOREDANA GHERASIM Se introduc cele două variabile în câmpurile axei X şi axei Y (nu contează ordinea în care se introduc variabilele deoarece corelaţia este bidirecţională) şi apoi se apasă butonul OK.

În cazul în care nu ar fi nici o relaţie. Din câmpul CORRELATION COEFFICIENTS se bifează coeficientul de corelaţie Kendall's: După confirmarea comenzii în foaia cu rezultate apare următorul tabel: 277 . COEFICIENTUL DE CORELAŢIE KENDALL'S TAU-B Reprezintă o măsură non-parametrică a asocierii variabilelor ordinale sau rangate care presupun cantităţi. Prof_1 (evaluarea interesului elevilor faţă de şcoală de către primul profesorul) şi Prof_2 (evaluarea interesului elevilor faţă de şcoală realizată de al doilea profesor). Pentru calculul acestei corelaţii se activează opţiunea BIVARIATE din meniul ANALIZECORRELATE.ANALIZA COMPUTERIZATĂ A DATELOR descrescător (din stânga-sus spre dreapta-jos). semnul coeficientului de corelaţie Kendall's tau-b indică direcţia relaţiei. Pentru a analiza legătura dintre evaluarea făcută de primul profesorul şi evaluarea realizată de al doilea profesor (prof_1 şi prof_2). Cu cât valoarea coeficientului este mai mare cu atât relaţia dintre variabile este mai mare.sav”. La fel ca şi în cazul corelaţiei Pearson. apoi se introduc variabilele prof_1 şi prof_2 în câmpul din dreapta.5. punctele ar fi fost distribuite uniform pe grafic. trebuie să folosim coeficientul de corelaţie Kendall's. care va cuprinde 3 variabile: elevi (codul de identificare al elevilor). II. iar valoarea absolută a coeficientului indică puterea relaţiei. Calcularea corelaţiei Kendall cu ajutorul SPSS Pentru a calcula acest coeficient de corelaţie cu ajutorul aplicaţiei SPSS vom crea o nou bază de date “Baza3. În tabelul următor prezentăm valorile acestor variabile. Acest coeficient de corelaţie poate lua valori doar intre -1 şi 1.

Acest coeficient de corelaţie mai este denumit şi coeficient de corelaţie a rangurilor.LOREDANA GHERASIM Se constată că apare o asociere pozitivă între variabile (r=0. Asocierea nu este însă semnificativă. elevii clasaţi pe primele locuri de către primul profesor ocupă tot o poziţie fruntaşă din perspectiva celui de al doilea profesor.60). al doilea. Din câmpul CORRELATION COEFFICIENTS se bifează coeficientul de corelaţie Spearman: 278 . valorile fiecărui tip de variabilă sunt rangate. Calcularea corelaţiei Spearman cu ajutorul SPSS Pentru a calcula acest coeficient de corelaţie cu ajutorul aplicaţiei SPSS vom crea o nou bază de date “Baza4. p=0. de la cele mai mici la cele mai mari. Pentru calculul acestei corelaţii se activează opţiunea BIVARIATE din meniul ANALIZECORRELATE.6. al treilea). Pentru a analiza legătura dintre evaluarea interesului faţă de şcoală al elevilor şi evaluarea relaţiilor cu ceilalţi colegi (eval_i şi eval_re) se foloseşte coeficientul de corelaţie Spearman. Această evaluare presupune atribuirea de valori care indică ierarhia subiecţilor (cum ar fi primul.sav”. Dacă ar fi apărut o asociere negativă dintre variabile (coeficientul de corelaţie ar fi fost negativ) s-ar fi interpretat astfel: elevii plasaţi pe primele locuri de către primul profesor s-ar fi plasat în coada clasamentului din perspectiva celui de al doilea profesor. Pentru toate cazurile. Modalitatea de calcul a corelaţiei Spearman este similară coeficientului Pearson (de fapt de aplică formula coeficientului Pearson). eval_i (evaluarea de către profesori a interesul pentru şcoală) şi eval_re (evaluarea de către profesori a relaţiilor cu ceilalţi elevi). COEFICIENTUL DE CORELAŢIE SPEARMAN Este o măsurare non-parametrică a corelaţiei dintre două variabile ordinale. Se introduc variabilele eval_i şi eval_re în câmpul din dreapta. II.091 posibila explicaţie fiind numărul mic de subiecţi din baza de date. Se foloseşte atunci când nu este posibilă măsurarea caracteristicilor analizate ci doar evaluarea lor. în asemenea manieră încât indivizii statistici să fie ordonaţi în funcţie de două criterii X şi Y. care va cuprinde 3 variabile: elevi (codul de identificare al elevilor).

relaţii bune cu ceilalţi elevi.78.81. corelaţia având semn negativ.49. Valorile variabilei sunt: Media: 8.260). 7. 8. 6. 9. 9. 7. 7. 6. 8.71.06.79. 9.88.050 (p=0.86.73.06. 9.69.19. ceea ce semnifică faptul că elevii plasaţi pe primele locuri ale variabilei interes pentru şcoală ocupă ultimele locuri după cel de al doilea criteriu.16.ANALIZA COMPUTERIZATĂ A DATELOR După confirmarea comenzii în foaia cu rezultate apare următorul tabel: Se constată că apare o inversare a clasamentului. acest indicator statistic împărţind şirul de scoruri în două parţi egale (proba medianei). Împărţirea elevilor în două grupe se realizează în funcţie de mediană. Pentru a exemplifica utilizarea comenzilor de recodificare vom crea o nouă bază de date (baza5. Deci vom calcula mai întâi valoarea medianei şi apoi vom împărţi subiecţii în grupe în funcţie de valoarea acestui indicator.91.54 Vom împărţi elevii în două grupe (grupul elevilor cu performanţe bune şi grupul elevilor cu performanţe slabe).81.88.7. II. 7.76.sav) care conţine mediile obţinute de elevi la sfârşitul anului şcolar.04.49. 7. 8. 6. 7.03. Inversarea clasamentului nu este semnificativă. pragul de semnificaţie fiind mai mare de 0.06. Aplicaţia SPSS are o serie de comenzi care permit transformarea sau recodificarea unei variabile cantitative într-o variabilă calitativă.10. 7. RECODIFICAREA ŞI TRANSFORMAREA VARIABILELOR Uneori este necesar ca scorurile brute obţinute de subiecţii unui studiu să fie transformate pentru a putea verifica ipoteza studiului. 7. prin crearea unei noi variabile în baza de date sau modificarea valorilor unei variabile existente în baza de date. Pentru calculul medianei vom folosi comanda DESCRIPTIV STATISTICS– FREQUENCIES: 279 . 8. 7. 8.80. 9. 8.

câmpul care conţine variabilele din baza de date. 2.95) vor forma grupul celor cu performanţe scăzute. 4. în câmpul NAME de la OUT VARIABLE se introduce numele variabilei create. Se selectează opţiunea INTO DIFFERENT VARIABLES. MEDIA. butonul OLD AND NEW VALUE permite recodificarea variabilei iniţiale 5 butonul IF permite crearea unei noi variabile doar prin selecţia anumitor valori ale variabilei iniţiale Pentru exemplul nostru vom trece variabila pe care dorim să o recodificăm. ceea ce are ca urmare apariţia următoarei casete de dialog: 3 1 2 5 4 1. în câmpul din mijloc al ferestrei cu ajutorul butonului de trecere. Noul nume se tastează în câmpul NAME al câmpului OUTPUT VARIABLE: 280 . iar subiecţii care au valori mai mari decât mediana vor forma grupul celor cu performanţe ridicate. Se poate păstra variabila ce urmează să fie recodificată (INTO SAME VARIABLES) sau se poate crea o nouă variabilă (INTO DIFFERENT VARIABLES).LOREDANA GHERASIM Pentru exemplul nostru mediana are valoare 7. Pentru recodificarea variabilei MEDIA se utilizează opţiunea RECODE care se găseşte la meniul TRANSFORM: Comanda RECODE are două opţiuni de recodificare. Subiecţii care au valori mai mici ca mediana (7. Vom denumi noua variabilă NIVPERF. 3 în câmpul INPUT VARIABLE →OUTPUT VARIABLE se introduce atât variabila ce urmează să fie recodificată cât şi numele noii variabile. Comanda RECODE INTO DIFFERENT VARIABLES Selectăm opţiunea de creare a unei noi variabile care să cuprindă grupele obţinute în urma recodificării.95.

vom activa opţiunea RANGE. vom tasta valoarea 1: 281 .95) vor forma grupul subiecţilor cu performanţa scăzută. formând o nouă variabilă. în câmpul OLD→NEW se reunesc opţiunile de recodificarea a variabilelor În exemplul nostru. câmpul NEW VALUE face referire la valorile noii variabile 3. prind valoarea în cadrul noii variabile NIVPERF. LOWEST THROUGH din câmpul OLD VALUE şi vom trece în câmpul activat valoarea medianei (7. care va reprezenta valoarea 1 a variabilei NIVPERF (ce va fi creată). trebuie ca valorile variabilei MEDIA (variabila iniţială) să le redefinim. Cu alte cuvinte această opţiune va însemna că toate valorile variabilei MEDIA mai mici de 7. Activarea acestui buton deschide următoarea casetă de dialog: 2 1 3 Această fereastră prezintă mai multe câmpuri: 1.95). subiecţii care au obţinut scoruri mai mici decât mediana (7.95 vor fi recodificate. În consecinţă.ANALIZA COMPUTERIZATĂ A DATELOR Pentru ca noul nume al variabilei să apară în câmpul din mijloc INPUT VARIABLE →OUTPUT VARIABLE şi astfel să aibă loc recodificarea. în câmpul de lângă opţiunea VALUE. se activează butonul CHANGE din câmpul OUTPUT VARIABLE: Se activează butonul OLD AND NEW VALUE pentru a defini valorile noii variabile. câmpul OLD VALUE se referă valorile variabilei iniţiale 2. Astfel. În câmpul NEW VALUE.

Prima treime va alcătui grupul subiecţilor cu performanţă scăzută. Din câmpul PERCENTILE VALUES se bifează opţiunea PERCENTILE şi se introduc centilele care împart şirul de scoruri în 3 parţi egale (adică 33.64 vor reprezenta grupului cu performanţa ridicată (grupul 3). vom tasta valoarea 2.66%). iar valorile mai mari de 7.73 şi 8. cum se poate observa şi în imaginea din mai jos. Pentru exemplificare vom împărţi scorurile la variabila MEDIA în trei parţi egale. În consecinţă. 282 .LOREDANA GHERASIM Se apasă apoi butonul ADD al câmpului OLD→NEW. Apoi se activează opţiunea RANGE. Această opţiune va însemna că valorile mai mari de 7.33% şi 66. se acţionează din nou butonul ADD din câmpul OLD→NEW. în câmpul de lângă opţiunea VALUE. Pentru a fi reţinută şi această a doua condiţie de recodificare. Există posibilitatea de a împărţi valorile unei variabile în mai mult de două grupe.33% din total). Subiecţii cu valori mai mici de 7. ceea ce duce la modificarea bazei de date.73 vor forma grupul celor cu performanţa scăzută (grupul 1). iar ultima treime grupul subiecţilor cu performanţă ridicată. iar cei cu medii mai mari de 8. după cum se poate observa şi în imaginea din dreapta.64 vor forma grupul subiecţilor cu performanţă de nivel mediu (grupul 2).95 ale variabilei MEDIA vor reprezenta valoarea 2 al variabilei NIVPERF. Se observă că în baza de date apare noua variabilă NIVPERF. cu două valori.95 ale variabilei MEDIA vor primi valoarea 1 în cadrul variabilei NIVPERF. în câmpul NEW VALUE. pentru a putea recodifica următoarele valori. scorurile mai mici de 7. mai întâi trebuie să calculăm valorile corespunzătoare percentilelor care împart şirul de scoruri în 3 parţi egale (fiecare parte reprezentând 33. THROUGH HIGHEST din câmpul OLD VALUE şi se trece în câmpul activat valoarea medianei (7.95). Pentru a putea face împărţirea. În concluzie. Puteţi verifica dacă recodificarea a fost corect realizată. Se foloseşte comanda DESCRIPTIV STATISTICS– FREQUENCIES. Se activează apoi butonul CONTINUE şi butonul OK al ferestrei RECODE INTO A DIFFERENT VARIABLES.95 ale variabilei MEDIA vor fi recodificate în variabila NIVPERF primind valoarea 2. a doua treime grupul subiecţilor cu performanţă medie. imaginea din stânga. cei cu valori cuprinse între 7.

Activăm apoi butonul ADD al câmpului OLD→NEW. care cuprinde valori mai mari de 8. pentru a putea introduce următoarea condiţie. cum se poate observa şi în imaginea alăturată.64 se activează opţiunea RANGE. Se activează apoi butonul CONTINUE şi butonul OK al ferestrei RECODE INTO A DIFFERENT VARIABLES. Pentru exemplificare vom utiliza aceeaşi bază de date (baza5. cu excepţia faptului că se păstrează numele iniţial al variabilei recodificate. apoi se activează butonul ADD. cu trei valori. În câmpul NEW VALUE se trece valoarea 3. Vom activa opţiunea RANGE. În acest exemplu.sav) şi vom împărţi în două scorurile subiecţilor. Vom denumi noua variabila NIVPERF2.73 ale variabilei MEDIA vor forma primul grupului 1. ceea ce duce la modificarea bazei de date.64 vor reprezenta nivelul 2 al variabilei NIVPERF2. Pentru crearea ultimului grup.73 şi 8. Valorile variabilei MEDIE cuprinse între 7. THROUGH HIGHEST din câmpul OLD VALUE. scorurile mai mici de 7. LOWEST THROUGH din câmpul OLD VALUE şi vom trece în câmpul activat valoarea 7.ANALIZA COMPUTERIZATĂ A DATELOR Pentru a crea această nouă variabilă se activează meniul TRANSFORM – RECODE .73. Activarea comenzii duce la apariţia casete de dialog: 283 . În câmpul NEW VALUE se trece valoarea 2. iar în câmpul NEW VALUE vom trece valoarea 1. cum se poate observa şi în imaginea alăturată: Se observă că în baza de date apare noua variabilă NIVPERF2. adică nivelul 1 al noii variabile NIVPERF2. tastând noul nume în câmpul NAME al câmpului OUT VARIABLE şi apoi activând butonul CHANGE. Se activează apoi butonul ADD al câmpului OLD→NEW. Se activează prima opţiune RANGE THROUGH şi se tastează valorile minime şi maxime.INTO DIFFERENT VARIABLES. Comanda RECODE INTO SAME VARIABLES Rezultate similare se obţin dacă se utilizează comanda RECODE opţiunea INTO SAME VARIABLES.

Trecem variabila în câmpul din dreapta: Se activează butonul OLD AND NEW VALUES. când am utilizat opţiunea de recodificare într-o altă variabilă: 284 . în câmpul din dreapta se introduc variabilele pe care dorim să le recodificăm. care are aceleaşi opţiuni ca în cazul opţiunii anteriore de transformare într-o variabilă diferită: Recodificare se realiză la fel ca în exemplu anterior. În exemplu nostru vrem să recodificăm variabil Media.LOREDANA GHERASIM În câmpul din stânga apar toate variabilele din baza de date.

Pentru a putea face 285 . Pentru a vedea atitudinea subiecţilor faţă de instituţiile statului ar trebui să însumăm răspunsurile subiecţilor de la cei 3 itemi. aceasta având acum aceleaşi valori ca şi variabila NIVPERF. Inversarea valorilor variabilelor Comanda de recodificare poate fi utilizată şi pentru recodificarea valorilor scorurilor obţinute la diferiţi itemi. Acest lucru demonstrează că cele două opţiuni duc la acelaşi rezultat. însă. subiecţii au răspuns pe o scală de la 1 (foarte mult) la 4 (foarte puţin).sav) care conţine patru variabile: NRCHEST (codul de identificare).ANALIZA COMPUTERIZATĂ A DATELOR După confirmarea recodificării să vedem modificările din baza de date. Pentru a exemplifica utilizarea acestor comenzi de recodificare vom crea o nouă bază de date (baza6. La itemul 2. GUV (Câtă încredere aveţi în guvern?). PARLAM (Câtă încredere aveţi în parlament?). Prezentăm scorurile obţinute de 16 dintre subiecţi. Pentru itemii 1 şi 3 subiecţii au răspuns pe o scală de la 1 (foarte puţin) la 4 (foarte mult). Se constată că s-au modificat valorile variabilei MEDIA. PRES (Câtă încredere aveţi în preşedinte?).

Se activează butonul ADD din câmpul OLD→NEW. deci se tastează 1 în dreptul opţiunii VALUE din câmpul OLD VALUE şi cifra 4 în dreptul opţiunii VALUE din câmpul NEW VALUE. Recodificarea în acest caz presupune inversarea scalei de evaluare pentru itemul 2. pentru ca scala de evaluare să aibă aceeaşi semnificaţie cu a ceilalţi doi itemi (valoarea 1 să însemne foarte puţin iar valoare 4 să însemne foarte mult). Pentru recodificare ar putea fi utilizată oricare dintre cele două opţiuni prezentate anterior RECODE INTO SAME VARIABLES sau INTO DIFFERENT VARIABLES. Vom redenumi variabila recodificată GUV_R: Vom activa butonul OLD AND NEW VARIABLES.LOREDANA GHERASIM acest lucru ar trebui ca răspunsurile de la itemul 2 să fie transformate. adică valoarea 1 a itemului să devină 4 (ceea ce înseamnă foarte mult). iar valoarea 4 a itemului să devină 1 (ceea ce înseamnă foarte puţin). Pentru inversarea scalei de evaluare a itemului vom folosi numai opţiunile VALUE din câmpul OLD VALUE şi NEW VALUE. valoarea 2 să devină 3. Apoi se tastează 2 în câmpul de la opţiunea VALUE din câmpul OLD VALUE şi cifra 3 în câmpul de la opţiunea VALUE din câmpul NEW VALUE: La fel se procedează şi pentru celelalte valori care trebuie recodificate. Vom folosi comanda RECODE INTO DIFFERENT VARIABLES pentru a putea verifica dacă recodificarea a fost realizată. În final trebuie să avem următoarele transformări în câmpul OLD→NEW: 286 . Astfel. valoarea 3 să devină 2. valoarea 1 a vechii variabile devine 4 pentru noua variabilă.

ANALIZA COMPUTERIZATĂ A DATELOR După activarea butonului CONTINUE şi butonului OK al ferestrei principale. în câmpul TARGET VARIABLE se tastează numele noii variabile 2. baza de date va conţine o nouă variabilă (GUV_R) care conţine valorile inversate ale itemului 2: Comanda TRANSFORM COMPUTE Pentru a calcula scorul total la atitudinea faţă de instituţiile statului. opţiunea COMPUTE: 3 1 2 Prezentăm caracteristicile principale ale acestei ferestre: 1. Pentru a putea face acest lucru se foloseşte meniul TRANSFORM. trebuie să însumăm scorurile subiecţilor obţinute la cei trei itemi. în acest câmp sunt prezentate variabilele din baza de date 287 .

Semnul plus se introduce de la tastatură sau folosind butoanele care se găsesc sub câmpul NUMERIC EXPRESSION: După activarea butonului OK în baza de date apare o nouă variabila. cu numele ATIT. sub acest câmp se găsesc butoane cu cifre şi semne. Pentru exemplu nostru vom numi noua variabila ATIT. Variabile sunt trecute în câmpul NUMERIC EXPRESSION folosind butonul de trecere. în câmpul NUMERIC EXPRESSION se introduce formula de calcul a noii variabile. GUV_R şi PARLAM. Această nouă variabilă reprezintă atitudinea subiecţilor faţă de instituţiile statului şi reprezintă suma răspunsurilor la cei trei itemi. dar şi un câmp cu funcţii complexe care pot fi utilizate pentru calculul noilor variabile. 288 .LOREDANA GHERASIM 3. deci vom tasta numele noii variabile în câmpul TARGET VARIABLE: Apoi vom scrie formula de calcul care va consta în însumarea scorurilor obţinute la cele trei variabile: PRES.

Observaţi. Întrucât distribuţia normală este simetrică. Astfel. să luăm drept exemplu distribuţia rezultatelor la un test de inteligenţă. Dacă un fenomen social observat este urmărit o perioadă de timp mai îndelungată. DISTRIBUŢIA NORMALĂ Variabilitatea rezultatelor urmează reguli care pot fi modelate matematic. Cunoscând nota Z a unui subiect putem şti cu precizie câţi indivizi din populaţie au scoruri mai 289 . Aceste puncte corespund deviaţiilor standard. Abia 16% din populaţie vor avea scoruri mai mici sau mai mari de o deviaţie standard.ANALIZA COMPUTERIZATĂ A DATELOR III. Există o strânsă legătură între scorurile standard (notele z) şi diferite procentaje sau frecvenţe relative. curba normală este unimodală. matematicienii au pus la punct formule care permit calcularea diferitelor suprafeţe ale curbei. Cu alte cuvinte. curba normală mai posedă anumite proprietăţi speciale. Pentru a înţelege mai uşor despre ce este vorba. Din perspectiva celor trei parametri. de asemenea. Având o deviaţie standard de 16. Aproximativ 34% din cazuri se vor afla între medie şi o abatere standard la stânga sau la dreapta mediei.1. vom şti că 34% dintre indivizi vor avea scorul cuprins între 100 şi 116 (cei cu IQ situat deasupra mediei) sau între 84 şi 100 (cei cu IQ situat dedesubtul mediei). mai mici sau mai mari decât două deviaţii standard faţă de medie (adică sub valoarea 68 sau peste valoarea 132). numai 16% dintre oameni au coeficientul de inteligenţă mai scăzut de 84 sau mai ridicat de 116. distribuţia rezultatelor se va face după o curbă normală. simetrică şi mediu turtită. înclinarea (indică tendinţa scorurilor de a fi mai mari sau mai mici) şi turtirea (arată cât de mult variază scorurile distribuţiei). că şi mai puţine cazuri sunt mai depărtate de medie. Există trei parametri ai unei distribuţii: modalitatea (indică valorile în jurul cărora se grupează scorurile subiecţilor). puncte în care linia curbă îşi modifică forma. Mai mult. La acest test media rezultatelor este 100. iar acest lucru poate fi demonstrat matematic. exact 50% din cazuri vor avea scoruri sub valoarea medie. vom şti că 34% dintre subiecţi au scoruri cuprinse între medie (100) şi o deviaţie standard. Astfel. În plus. ELEMENTE DE STATISTICĂ INFERENŢIALĂ III. iar deviaţia standard este 16. În imaginea de mai jos ilustrăm grafic această distribuţie: 34% 14% 2% Scoruri brute Scoruri z 68 -2 84 -1 100 0 34% 14% 2% 116 +1 132 +2 Dacă urmăriţi cu atenţie forma curbei normale veţi constata prezenţa unor „puncte de inflexiune”. doar aproximativ 2% dintre indivizi vor avea scoruri şi mai extreme.

aceştia dezvoltându-se mai rapid.06% (50%+44. în care se compară un eşantion format dintr-un singur caz cu o populaţie a cărei parametri sunt cunoscuţi. Să presupunem că o persoană obţine la testul de inteligenţă scorul 125. care arată câţi subiecţi au scorurile cuprinse între medie şi nota Z. Astfel. Pot farmaciştii să susţină că vârsta precoce la care a mers copilul se datorează vitaminei. Dacă vom consulta unul din tabelele de care aminteam anterior. În acel tabel. este precizat un procent. Prezentăm în continuare curba normală corespunzătoare vârstei de debut de la care copiii încep să meargă: 34% 14% 2% 8 luni 11 luni 34% 14% 2% 14 luni 17 luni 20 luni Pentru testarea ipotezei trebuie să parcurgem mai multe etape: Etapa I: Reformularea problemei în termenii populaţiilor de comparaţie. a început să meargă de la vârsta de 8 luni. ales aleatoriu din populaţie. vom vedea în dreptul lui 1.06%.56 valoarea 44. putem calcula nota Z a acestui subiect.2. care are valoarea 1. ipotezele trebuie reformulate în termenii generali ai populaţiilor de comparat pentru a putea face generalizarea ulterioară. în exemplul nostru avem de comparat două populaţii: P0 – populaţia copiilor 290 . 1995).06%) vor avea scoruri mai mici decât subiectul ales de noi.06% dintre subiecţi.LOREDANA GHERASIM mici sau mai mari decât al subiectului investigat. ştiind că vârsta la care merg copii prima dată. Ca exemplu vom folosi un studiu (Aron & Aron.94% dintre indivizi vor avea scoruri mai mari (50%-44. III. Aceasta înseamnă că de la medie (100) şi până la scorul nostru (125) sunt 44. Copilul respectiv. Unul dintre efecte este scăderea vârstei la care copii încep să meargă. vom analiza cel mai simplu test. după administrarea vitaminei. cu o abatere standard de 3 luni? Pentru a răspunde cu dovezi statistice la o astfel de întrebare. în populaţia normală este de 14 luni. în care un grup de farmacişti a sintetizat o vitamină care accelerează procesele de asimilaţie la copii nou-născuţi. testul z.56 (după formula: (125-100)/16). Aceasta arată că doar 5. Farmaciştii au dorit să omologheze vitamina. Farmaciştii au primit dreptul să administreze vitamina unui singur copil nou-născut.06%) şi 94. dar pentru aceasta ei trebuie să demonstreze că într-adevăr vitamina accelerează mersul copiilor. ETAPELE TESTĂRII UNEI IPOTEZE. pentru fiecare notă Z. TESTUL Z Pentru a vedea cum se realizează inferenţa statistică. trebuie să facem apel la distribuţia normală a variabilei alese în cadrul populaţiei şi să respectăm anumite etape pentru verificarea raţionamentului. Orice manual de statistică are la sfârşit un tabel care permite calcularea acestor procentaje cu precizie. Deşi avem doar un singur caz pe care trebuie să îl comparăm cu o populaţie ai cărei parametri sunt cunoscuţi.

Există două de valori Z de corespunzătoare pragului 1%.33 pentru că ne referim la scorurile mai mici decât media. Această etapă presupune cunoaşterea parametrilor (media şi abaterea standard) populaţiei la care ne raportăm (în cazul nostru distribuţia copiilor care nu iau vitamina). Pragul de semnificaţie poate fi de 1% (când dorim să fim mai precişi) sau de 5% (atunci când putem fi mai puţin exacţi). fără nici o altă intervenţie. După stabilirea pragului. Dacă ipoteza de nul este respinsă.33) corespunzătoare probabilităţii de 1% (numită şi punct de tăiere). În cazul nostru ea va fi –2. În mod obişnuit. 34% -2. Etapa III: Stabilirea pragului de semnificaţie şi a notei z a punctului de „tăiere”. mai ales în domeniul ştiinţelor sociale. În cazul nostru colectarea datelor înseamnă a observa vârsta la care va merge copilul pentru prima dată (8 luni). Etapa IV: Colectarea datelor şi transformarea lor în scoruri z. copiii din populaţia normală merg la vârsta de 14 luni. Etapa II: Stabilirea parametrilor populaţiei de comparaţie şi a distribuţiei de comparaţie. cu o abatere standard de 3 luni. Pentru această cercetare vom stabili un prag de semnificaţie de 1% întrucât efectele ei sunt importante. Vom formula două ipoteze: Ipoteza de lucru (experimentală): afirmă că noii născuţi care iau vitamina vor merge mai repede decât cei care nu iau vitamina (H1: P0 < P1) Ipoteza de nul: Este ipoteza care descrie situaţia în care intervenţia noastră (vitamina) nu are nici un efect. De exemplu.populaţia copiilor normali care iau vitaminele. Distribuţia acestei variabile este normală. Vom transforma scorul 291 . trebuie să vedem care este nota Z corespunzătoare acestuia. una referitoare la scorurile mici (în partea stângă a distribuţiei). Acest prag de semnificaţie arată probabilitatea de eroare cu care noi testăm ipoteza. aflate în partea stângă a curbei de distribuţie.ANALIZA COMPUTERIZATĂ A DATELOR normali care nu iau vitaminele şi P1 . atunci putem accepta ipoteza de lucru.33 2% 8 luni 11 luni 34% 14% 2% 14 luni 17 luni 20 luni 14% Note z -2 -1 0 +1 +2 În tabelele statistice găsim valoarea scorului z (z=2. este testată la un anumit prag de semnificaţie. Pe noi ne interesează prima dintre aceste valori. la o valoare Z de 1 (adică 17 luni) se constată că 84% dintre copii merg la vârste mai mici de 17 luni. Orice ipoteză. abia 16% mergând mai târziu de această vârstă. Dacă vitamina nu ar avea nici un efect. Am precizat anterior că fiecărui punct de pe curba de distribuţie normală îi corespunde o anumită notă standard şi o anume distribuţie a cazurilor din populaţie faţă de acel punct. care arată cei 1% dintre copii care merg cel mai timpuriu şi o altă valoare referitoare la scorurile mari (în partea dreaptă a distribuţiei) care arată acei 1% dintre copii care merg cel mai târziu. H0: P0 = P1 Într-o cercetare se testează de fapt ipoteza de nul pentru că ea descrie situaţia deja existentă înainte intervenţiei sau situaţia în care nu am obţine nici un efect. cele două populaţii de copii ar merge la aceeaşi vârstă.

3. 1.3. În cazul nostru. 81. Media eşantionului nostru este mai mare sau mai mică comparativ cu cea a populaţiei cu valoarea 2. 800. 1. 1. Vom aplica testul t pentru a compara un eşantion cu o populaţie la care cunoaştem media. -0.8. 3. Ipoteza de cercetare: Indicele demografic al eşantionul nostru va avea o avea o valoare diferită de indicele demografic al populaţiei Ipoteza de nul: indicele demografic al eşantionului va avea aceeaşi valoare cu cel al populaţiei Folosirea SPSS pentru compararea unui eşantion cu media unei populaţii Aplicarea testului t se face activând din meniul ANALYZE-COMPARE MERANS opţiunea ONE SIMPLE T TESTS: 292 . 2.4. 0. acceptăm ipoteza de nul. 63. 3. TESTUL T PENTRU COMPARAREA UNUI EŞANTION CU MEDIA POPULAŢIEI Acest test se aplică atunci când dorim să comparăm rezultatele unui eşantion cu media populaţiei (fără să avem informaţii despre varianţa rezultatelor populaţiei).5.3. 3. 1. cu valorile: 1europeană. care are valoarea 2. 1.9. 3. În ipoteza noastră experimentală ne aşteptam ca nota Z corespunzătoare scorului brut să fie mai mică decât valoare Z a punctului de tăiere. farmaciştii nu au reuşit să dovedească.8. nota Z (-2) corespunzătoare scorului brut este mai mare decât a notei Z a punctului de tăiere (–2. 143.sav). 1. 2. 54. 1. 1.8. 49.2.5. 79. 105. 2. După obţinerea scorul Z corespunzător datelor colectate.8. 0. 0. 0.5. 2. care conţine trei variabile: regiune (zona geografică. 2. 1.6. 2.3.3? Deoarece nu avem acces la alţi parametri ai populaţiei. 1. în afară de medie va trebui să estimăm variabilitatea sa. 2.9. 1. 86. ipoteza experimentală neconfirmându-se. 2. 1.3. 2.4.1. 5.3. 1. 0. 2. 2. 1. 2. 0. 40. Am prezentat testul Z pentru a înţelege logica testării ipotezelor şi înţelesul pragului de semnificaţie. 1. III. 2. 3. 2 Dorim să comparăm scorurile eşantionului la variabila indice demografic cu media populaţiei. 2. 189. ind_d (procentul anual de creştere a populaţiei) şi dens (densitatea populaţiei pe km2). 1.3. 188. 0. prin raportare la distribuţia populaţiei normale de comparat folosind formula notei Z (X-M)/SD).1. 94. 216.1. 124. 227.5. la un prag de probabilitate de 1% că vitamina lor are efectul scontat. 2. 0. 0.2. În consecinţă. 221. 51. 1. -0.4.2. 1.LOREDANA GHERASIM subiectului la variabila vârstă în scor Z. 1. 2. 87. 2. adică pentru exemplu nostru: Z=(8-14)/3)=-2 Etapa V: Compararea notei z astfel obţinută cu nota z a punctului de tăiere. 3.1. 2.3. Cu alte cuvinte. 111.5.1. Prezentăm în continuare valorile acestor variabile: dens: 94.9 reg: 1. 2.3. 0. 0. 3. 4. 3. Vom prezenta în continuare. Pentru a vedea cum anume se foloseşte programul SPSS în această situaţie vom crea o nouă bază de date (baza7.9. succint testele de comparaţie cele mai frecvent folosite. 1. 330.2. ind_d: 0.1. 27. 80.1. 3.33). 102. 47.1.3. 0. 55. 3. 3. 2. 2. 283.8. 102. 3. 58.7. 29. 3. acesta trebuie comparat cu scorul Z corespunzător punctului de tăiere. 0. 1. 3. 36. 2-asiatică şi 3-africană). 3.8. 39.7. 36.

Error Mean .3 pentru exemplul nostru). câmpul în care se introduce valoarea medie a populaţiei cu care comparăm eşantionul (cu valoarea 2. câmpul unde vom introduce variabilele pe care vrem să le analizăm 3. Deviation 1.489 Std.149 3 293 . pe ecran va apare fereastra de OUTPUT: 1 One-Sample Statistics 2 Std. Activare butonului OPTIONS duce la deschiderea următoarei ferestre: Se observă că automat calculatorul a ales un interval de încredere (CONFIDENCE INTERVAL) de 95%. 2. Nu vom modifica pragul de semnificaţie. ceea ce implică un prag de semnificaţie de 5%.ANALIZA COMPUTERIZATĂ A DATELOR După activarea acestei comenzi pe ecran apare următoarea fereastră: 1 3 2 Această fereastră are trei elementele importante: 1. câmpul cu toate variabilele din baza de date.189 N procentul de crestere anuala a populatiei 37 Mean 1. După activarea butonului CONTINUE şi apoi a butonului OK al ferestrei principale.

3)/0.294 df 36 Sig. în cazul nostru df=36 6. 5.1 3. Valoarea nu este identică cu cea din tabel datorită aproximărilor făcute. conţine elemente de statistică descriptivă.1% (calculatorul ne afişează doar primele trei zecimale). prezintă intervalul de încredere al diferenţei dintre cele două medii (-1.19 4. În exemplu nostru valoarea pragului de semnificaţie este 0.001.000.000 Mean Difference -. 8. Pentru a confirma ipoteze de cercetare. populaţie din care provine eşantionul nostru. prezintă pragul de semnificaţie real.428 t procentul de crestere anuala a populatiei -4. pragul de semnificaţie trebuie să fie mai mic sau cel mult egal cu 0. în sensul că media eşantionului nostru este semnificativ mai mică comparativ cu cea a populaţie.µ m )/ σ m =(1. dar se raportează ca un p<0. SD=1. • gradul de libertate: arată care este mărimea eşantionului pe care s-a făcut testarea ipotezei. Rezultatele pentru exemplul anterior sunt: Mediile: Meş=1. Valoarea lui t este obţinută după formula t=(m. În interpretarea statistică a notei t. p<0. Mpop=2.001. conţine date despre testul t propriu-zis.4.3 95% Confidence Interval of the Difference Lower Upper -1. În continuare vom analiza elementele OUTPUT-ului: 1. mai precis deviaţia standard a populaţiei de eşantioane de aceeaşi mărime cu al nostru (37). 7.05 (adică eroarea nu trebuie să fie mai mare de 5%).26. sunt câte elemente pe care de acre trebuie să ţinem seama: • pragul de semnificaţie: care ne indică probabilitatea de eroare atunci când respingem ipoteza de nul. ONE SAMPLE TEST.1 şi -0.29.3 şi abaterea standard (σm) de 0. în această celulă este afişată media eşantionului. Valoarea lui t şi pragul de semnificaţie: t(36)=-4. care ne spune care este probabilitatea cu care greşim dacă respingem ipoteza de nul şi acceptăm ipoteza de cercetare. ONE SAMPLE STATISTICS.49-2. Primul tabel. (2-tailed) . Cu cât eşantionul este mai mare.19≈4. Aceste rezultate indică faptul că diferenţa dintre medii este semnificativă. în cazul nostru m=1.3. celula cuprinde eroarea standard a mediei.LOREDANA GHERASIM One-Sample Test Test Value = 2. Putem afirmă că 294 .811 4 5 6 7 8 Rezultatele sunt grupate în două tabele.19. cuprinde gradele de liberate pentru care a fost calculată valoarea lui t şi probabilitatea de respingere a ipotezei de nul.195 -.49 2. nota t a eşantionului nostru comparat la populaţia de eşantioane care are media (µm) 2.4) corespunzător pragului de semnificaţie de 5%. Al doilea tabel. oricare ar fi tipul de test ales. • sensul diferenţei: este dat de valoarea mediilor comparate sau de semnul notei t şi arată în ce sens apare diferenţa (care medie este mai mare). în această celulă este afişată abaterea standard a eşantionului. celula conţine diferenţa dintre media eşantionului şi cea a populaţie la care ne raportăm. cu atât putem avea mai multă încredere în rezultatele obţinute. indiferent dacă ele confirmă sau nu ipoteza. σm=0. pentru a arăta că probabilitatea de a greşi este mai mică de 0.

Să analizăm acum dacă scorurile la variabila densitate din eşantionul nostru diferă de cea a populaţiei cu valoarea de 0. Rezultatele testului ONE SIMPLE T TEST indică următoarele rezultate: One-Sample Statistics Std. (2-tailed) .643 470.7. Pentru fiecare nivel al variabilei independente vom avea câte un grup de subiecţi. cu două grade de intensitate.797 Mediile: Meş=261. pozitiv şi negativ.9. subiecţii vor fi împărţiţi în două grupe. De exemplu. Există posibilitatea ca toate nivelurile variabilei independente să fie prezentate aceluiaşi eşantion de subiecţi. Subiecţii vor fi împărţiţi în două grupe. Error Mean 147. TESTUL T PENTRU COMPARAREA A DOUĂ EŞANTIOANE PERECHI În psihologia experimentală se face distincţie între grupele independente şi dependente de subiecţi. Să presupunem că variabila independentă este tipul de feed-back. avem de a face cu grupe independente de subiecţi.167 df 36 Sig. condiţia de feed-back pozitiv şi respectiv condiţia de feed-back pozitiv.4. Subiecţii cărora le măsurăm anxietatea înainte şi după intervenţia terapeutică formează eşantioane perechi. Putem spune că avem densitatea eşantionului studiat de noi este aceeaşi cu cea a populaţiei.237 t Numar de oameni/ kilometru patrat 1. Cea mai simplă situaţie de comparare a eşantioanelor este în situaţia de test-retest. Astfel. cu valoarea 90 (dacă am accepta ipoteza de cercetare am greşi în 25.153 N Numar de oameni/ kilometru patrat 37 Mean 261. Mpop=90 Valoarea lui t şi pragul de semnificaţie: t(36)=1. Aceeaşi subiecţi vor trece prin toate condiţiile experimentale. fiecărui grup prezentându-i un grad de intensitate al variabilei independente. III.ANALIZA COMPUTERIZATĂ A DATELOR procentul de creştere a populaţie eşantionului nostru este mai mic semnificativ în comparaţie cu cel al populaţiei. Nu cunoaştem nivelul mediu anxietăţii populaţie de subiecţi anxioşi înainte de a veni la terapie şi nici nivelul mediu al anxietăţii după terapie. p=0.096 One-Sample Test Test Value = 90 95% Confidence Interval of the Difference Lower Upper -126. în final comparându-se rezultatele subiecţilor. Deviation 895. măsurăm nivelul anxietăţii subiecţilor înainte şi după terapie.16. dacă variabila independentă are două grade de intensitate.251. Ceea ce ştim este nivelul anxietăţii subiecţilor care au 295 .251 Mean Difference 171. Rezultatele indică faptul că nu există diferenţe semnificative între densitatea medie a eşantionului şi cea a populaţie.1% din cazuri). În această situaţie vom avea grupe perechi sau dependente de subiecţi. Fiecare subiect va face parte dintr-un singur grup experimental. pentru a vedea schimbările care apar ca urmare a intervenţiei terapeutice. Atunci când cercetătorul împarte subiecţii în grupe în funcţie de variabila independentă.797 Std.

LOREDANA GHERASIM venit la terapie. ne aşteptăm ca nivelul anxietăţii după terapie să fie mai mic decât cel iniţial. indică selecţia curentă. variabilele selectate pentru analiză. înainte şi după intervenţia terapeutică. Ceea ce ne interesează pe noi este de fapt diferenţa dintre cele două măsurători ale anxietăţii. nu există nici o diferenţă între nivelul iniţial şi cel final al anxietăţii. înainte şi după terapie. Acest eşantion al diferenţelor se compară cu o populaţie la care cunoaştem media (media are valoarea 0 conform ipotezei de nul).sav. Aplicarea testului t se face activând din meniul ANALYZE – COMPARE MEANS opţiunea PAIRED-SAMPLES T TEST: Odată activată comanda va apare fereastra de mai jos: 1 2 3 Prezentăm principalele opţiuni ale ferestrei: 1. câmpul în care se introduc cele două variabile pereche După introducerea variabilelor în câmpul de analiză fereastra ar trebui să arate astfel: 296 . Se utilizează testul t pentru eşantioane perechi. pentru că avem rezultatele aceloraşi subiecţi înainte şi după terapie. vom folosi baza de date Baza1. Folosirea SPSS pentru compararea a două eşantioane perechi Pentru a demonstra modul de utilizare a testului t pentru eşantioane perechi. Diferenţele dintre mediile celor două eşantioane vor forma un eşantion de comparaţie. pentru acest tip de test se selectează o pereche de variabile. 3. Ipoteza de nul: diferenţele dintre cele două măsurători sunt nule. Ipoteza de cercetare: susţine că vor fi diferenţe între cele două măsurători. câmpul din stânga cuprinde variabilele din baza de date 2.

conţine perechea de variabile analizată.3454 1.9.1865 2 1 Mean Pair 1 nivelul anxietatii inainte de terapie nivelul anxietatii dupa terapie 107. . Vom păstra intervalul de încredere de 95%. Sfin=5. După apăsarea butonului OK fereastra OUTPUT ne va prezenta următoarele rezultate: 3 Paired Samples Statistics 4 Std. prezintă numărul de subiecţi din fiecare eşantion.3062 5 6 Paired Samples Correlations N Pair 1 nivelul anxietatii inainte de terapie & nivelul anxietatii dupa terapie 20 Correlation -.9940 2.0111 -4.3 297 . conţine mediile celor două grupe analizate: Mini=107.nivelul -0. conţine deviaţiile standard a scorurilor fiecărui eşantion: Sini=60.2593 4.259 Sig. Mfin=107. (2-tailed) .025 df 19 Sig. variabilele trebuie să fie perechi.270 7 10 9 8 Pair 1 Paired Samples Test 11 12 13 Paired Differences 95% Confidence Interval of the Difference Std.980 nivelul anxietatii ina de terapie .1.1593 t -. N=20 4.ANALIZA COMPUTERIZATĂ A DATELOR Butonul OPTIONS este identic cu cel de la testul t care permite compararea unui eşantion cu o populaţie. pentru fiecare dintre acestea vom analiza celulele.95 3. Deviation Mean Lower Upper 8. Error Mean 1. adică să provină de la aceeaşi subiecţi şi fie cuantificate cu aceeaşi unitate de măsură 2.05 anxietatii dupa tera 14 15 Rezultatele sunt organizate în trei tabele.9000 107.0166 5. Error Mean Std. Tabelul PAIRED SAMPLES STATISTICS: 1.9500 N 20 20 Std. Deviation 6.

conţine numele perechii de variabile şi precizează diferenţa dintre variabile. df=19 15. În exemplu nostru avem prima situaţie corelaţie nesemnificativă.270. valoarea lui t. r=-0. Putem afirma că diferenţele între măsurători nu sunt sistematice. cuprinde abaterea standard a eşantionului rezultat din diferenţele celor două eşantioane 11. indică intervalul de încredere de 95%al diferenţei dintre mediile celor două grupe 13. Interpretarea se face în funcţie de valoarea lui t şi pragul de semnificaţie.95 Valoarea lui t şi a pragului de semnificaţie: t(19)=-0. intervenţia acţionând oarecum haotic. conţine abaterile standard ale populaţiilor de eşantioane de N subiecţi din care provin eşantioanele noastre Tabelul PAIRED SAMPLES CORRELATIONS 6. Mfin=107. iar cei care aveau rezultate mari la prima măsurare au rezultate mici la a doua măsurare. În cazul nostru se constată că nu apare o diferenţă semnificativă între nivelul iniţial şi cel final al anxietăţii (dacă am respinge ipoteza de nul am greşi în 98% din cazuri sau cu alte cuvinte valoarea lui t se plasează în zona de încredere a ipotezei de nul). ceea ce indică faptul că cele două variabile sunt independente una de cealaltă. nu a îmbunătăţit starea subiecţilor.05). pragul de semnificaţie sau probabilitatea de eroare atunci când respingem ipoteza de nul: p=0. adică probabilitatea de eroare dacă am afirma că există o legătură între cele două variabile Tabelul PAIRED SAMPLES TESTS 8. astfel că putem spune că terapia nu a avut efect. deoarece diferenţele nu sunt sistematice.9. semnificativă: indică faptul că ierarhia subiecţilor se inversează de la o măsurare la alta. iar cei care aveau rezultate mari la prima măsurare au rezultate mari şi la a doua măsurare. 298 . gradele de libertate pentru care este calculată nota t. adică nota t a eşantionului de diferenţe în cadrul populaţiei de eşantioane: t(19)=-0. p=0. Cei care aveau rezultate mici la prima măsurare au rezultate mici şi la a doua. nu numai nivelul variabilei dependente. indică abaterea standard a populaţiei de eşantioane care cuprinde toate eşantioanele de aceeaşi mărime 12.25. Subiecţii au acelaşi nivel al anxietăţii după intervenţia terapeutică. Cei care aveau rezultate mici la prima măsurare au rezultate mari la a doua. cuprinde diferenţa medie dintre cele două grupe de subiecţi.02 14.980. pragul de semnificaţie al corelaţiei. Corelaţia ne arată dacă subiecţii îşi schimbă ierarhia unii faţă de alţii. Reamintim că pentru a respinge ipoteza de nul trebuie să avem cel mult 5% erori (p≤0.LOREDANA GHERASIM 5. p=0. coeficientul de corelaţie dintre cele două variabile pereche 7.980 În continuare prezentăm rezultatele obţinute în urma analizei realizată anterior: Mediile iniţiale şi finale ale subiecţilor: Mini=107. Avem trei situaţii posibile: • lipsa corelaţiei semnificative: în acest caz nu există o legătură între ierarhia subiecţilor la prima cu cea de al două măsurare. în cazul nostru anx1-anx2 9.02. • corelaţie negativă. • corelaţie pozitivă semnificativă: indică faptul că ierarhia subiecţilor se păstrează de la o măsurare la alta. Valoarea negativă indică faptul că anxietatea iniţială este mai mică comparativ cu cea finală 10.

câmpul în care vom introduce variabila dependentă. adică variabila asupra căreia dorim să analizăm influenţa variabilei independente. Ipoteza de cercetare: subiecţii de sex masculin vor avea un nivel al anxietăţii iniţiale diferit de cel al subiecţilor de gen feminin Ipoteza de nul: subiecţii de gen masculin şi feminin vor avea acelaşi nivel al anxietăţii iniţiale. variabila dependentă fiind nivelul iniţial al anxietăţii.sav. iar grupul 2 numai din subiecţi de gen feminin). În funcţie de variabila independentă se creează două grupe de subiecţi independenţi sau diferiţi (grupul 1 va fi format numai din subiecţii de gen masculin. care presupune eşantioane independente de subiecţi.5. În acest caz variabila independentă este genul subiecţilor (cu două grade de intensitate. Pentru a demonstrat modul de utilizare a testului vom folosi datele din baza de date baza1. 299 .subiecţi de sex masculin şi 2 – subiecţi de gen feminin). opţiunea INDEPENDENT SAMPLES T TEST: Vom introduce variabila dependentă (nivelul anxietăţii înainte terapiei) în câmpul TEST VARIABLE şi variabila independentă în câmpul GROUPING VARIABLE: 1 2 3 4 Sunt trei câmpurile importante pe care trebuie să le avem în vedere: 1. TESTUL T PENTRU COMPARAREA A DOUĂ EŞANTIOANE INDEPENDENTE Acest test se foloseşte când dorim să analizăm influenţa unei variabile independente. Fiecare subiect va putea face parte doar dintr-un singur grup. Vom analiza dacă genul subiecţilor influenţează nivelul iniţial al anxietăţii pacienţilor. Folosirea SPSS pentru compararea a două eşantioane independente Aplicarea testului t pentru eşantioane independente se face activând meniul ANALYZE – COMPARE MEANS. 1 .ANALIZA COMPUTERIZATĂ A DATELOR III. câmpul cu variabilele din baza de date 2.

8.LOREDANA GHERASIM 3.4747 -5.3636 6. Deviation 104. în cazul nostru avem 9 subiecţi de sex masculin şi 11 de gen feminin 3. butonul care permite precizarea celor două niveluri ale variabilei independente.1031 Independent Samples Test 6 7 Levene's Test for Equality of Variances t-test for Equality of Means Mean Std. 4.8571 110.9 300 . Error Sig. conţine deviaţia standard pentru fiecare grup în parte: Sgr1=2.3053 -.2711 -10.683 inainte de terap assumed Equal variance not assumed Sig.225 -2. (2-tailed) Difference Difference 18 13. celula indică variabila dependentă (nivelul anxietăţii înainte de terapie) care este analizată în funcţie de nivelurile variabilei independente (sexul subiecţilor) 2.5. conţine media fiecărui grup independent.5739 F nivelul anxietati Equal variance 6.8889 2. Sgr2=6.6442 2. câmpul unde introducem variabila independentă sau variabila de grupare (cea după care grupăm subiecţii). Activarea butonului DEFINE GROUPS deschide o fereastră unde vom trece valorile corespunzătoare celor două grupuri alese pentru comparaţie (în acest caz variabila independentă are doar două niveluri 1 şi 2): În fereastra OUTPUT sunt prezentate următoarele rezultate: 1 2 Group Statistics 3 4 5 sexul subiectilor nivelul anxietatii subiecti de gen masculin inainte de terapie subiecti de gen feminin N 9 11 Std.9753 2. .4747 5% Confidence Interv of the Difference Lower Upper -. se pot preciza doar două dintre acestea.4605 -10.3 4.019 t -2.3756 8 9 10 11 Vom prezenta succint semnificaţia datelor din tabele: 1.039 . Error Mean Mean Std.411 df 2.5712 . indică numărul de subiecţi din fiecare grup independent. Mgr2=110. se observă că media grupului de subiecţi de gen feminin este mai mare: Mgr1=104. chiar dacă variabila independentă are mai multe grade de intensitate.031 -5.144 .

5309 2. Error Mean 1. .9% din cazuri dacă respingem ipoteza de nul.3 Testul Levene are valoarea F=6. Subiecţii de sex masculin au un nivel al anxietăţii semnificativ mai mic comparativ cu a celor de gen feminin.326 dupa terapieassumed Equal varian not assumed Sig. vom extrage nota t şi semnificaţia de pe rândul EQUAL VARIANCES NOT ASSUMED. convenţia este ca să raportăm gradele de libertate de pe primul rând (în cazul nostru df=18) 11. Concluzia este că variantele celor două populaţii sunt diferite.2334 -8. Putem respinge ipoteza de nul.265 t -1.4.1% din cazuri şi s acceptăm ipoteza de cercetare. Deviation 4.441 df 18 -1.Mgr1=104. Error ig.7805 sexul subiectilor nivelul anxietatii subiecti de gen masculin dupa terapie subiecti de gen feminin N 9 11 Mean 106. ceea ce indică faptul că putem respinge ipoteza de nul (care afirmă că varianţele sunt egale).1111 109.545 301 .9053 Independent Samples Test Levene's Test for quality of Variance t-test for Equality of Means 95% Confidence Interval of the Difference Mean Std. notat cu F. p=0. vom preciza faptul că testul LEVENE testează egalitatea varianţelor populaţiilor din care provin eşantioanele noastre. precizează deviaţia standard pentru populaţiile de eşantioane de N subiecţi din care provin grupele noastre 6. Interpretarea rezultatelor obţinute: Mediile: subiecţii de gen masculin .152 -3. Vom analiza efectul variabilei gen asupra nivelului anxietăţii subiecţilor după terapie. indiferent de rândul pe care îl citim. apar diferenţe semnificative între nivelul anxietăţii iniţiale a subiecţilor de gen masculin şi feminin.3575 F nivelul anxie Equal varian 1.019. precizează cele două situaţii posibile în urma testării varianţei populaţiilor: varianţe egale (primul rând) sau varianţe inegale (al doilea rând) 7. arată valoarea testului F. p=0.05.3483 1. Deci. subiecţi de gen feminin . în funcţie de testul Levene. Greşim doar în 1.8.Mgr2=110.3201 -8. celula conţine valorile lui t pentru varianţe egale sau inegale ale populaţiilor. pentru că greşim doar în 3.6. probabilitatea de eroare pentru respingerea ipotezei de nul în cazul testului Levene 9. (2-tailed Difference Difference Lower Upper . testează ipoteza de nul care afirmă că varianţele populaţiilor din care provin eşantioanele sunt egale 8.167 -3.2178 1. semnul lui t ne indică sensul diferenţei dintre medii. Levene.3434 2.031. arată gradele de libertate pentru care a fost calculată semnificaţia notei t.ANALIZA COMPUTERIZATĂ A DATELOR 5. Testul. fapt de care ne putem da seama uitându-ne la valorile mediilor 10.3434 . Rezultatele obţinute sunt: Group Statistics Std.0444 1.4545 Std. Pentru a respinge ipoteza de nul pragul de semnificaţie trebuie să fie cel mult egal cu 0. conţine pragul de semnificaţie sau probabilitatea de eroare care apare atunci când respingem ipoteza de nul şi acceptăm ipoteza de cercetare. Valoarea lui t şi semnificaţia: t(18)=-2. Înainte de a analiza al doilea tabel.0449 5.497 17.

4 Testul LEVENE (F=1. Deci nu apar diferenţe semnificative între nivelul anxietăţii bărbaţilor şi femeilor după terapie. mediu şi superior). iar cealaltă parte din variaţie este produsă de abaterile fiecărui scor de la media totală a populaţiei.167.7% din cazuri dacă am respinge ipoteza de nul şi am accepta ipoteza de cercetare).1. Pentru a distinge între grupuri ar trebui ca prima componentă a variaţiei să fie mai mică decât cea de a doua. t(18)=1. 302 . iar MG este salariul mediu total al tuturor salariaţilor. Mgr2=109. Variaţia totală a salariului populaţiei poate fi descompusă în două părţi: o parte din variaţie se datorează abaterilor fiecărui scor de la media grupului din care face parte (distanţa a). Pentru a înţelege logica acestei metode să luăm un exemplu.256) este nesemnificativ (am greşi în 26. iar distanţa b exprimă poziţia scorului x faţă de valoarea medie a populaţiei totale (formată din cele trei niveluri de studii la un loc). Deci varianţele celor două populaţii sunt egale şi vom extrage rezultatele din primul rând. ANALIZA DE VARIANŢĂ . Valoarea lui t este nesemnificativă (am greşi în 16. dar să aibă un salariu mai mare comparativ cu cei cu studii generale.6. p=0. iar linia curbă mai mare descrie distribuţia salariului pentru toate cele trei niveluri de studii luate la un loc. adică persoanele aflate în acelaşi grup să difere mai puţin între ele şi mai mult de subiecţii din celelalte grupe. M1. Atunci când variaţia intragrup este mai mică decât variaţia intergrup înseamnă grupele sunt diferite. care are mai mult de două grade de intensitate (sau nivele). p=0. Să presupunem că suntem interesaţi dacă salariul românilor depinde de nivelul de studii (nivel general. M2 şi M3 reprezintă salariul mediu pentru fiecare nivel de studii. Mai precis ne aşteptăm ca subiecţii cu studii medii să aibă un salar mai mic comparativ cu cei cu studii. III.5% din cazuri dacă am respinge ipoteza de nul care afirmă ă varianţele sunt egale). Distanţa a reprezintă poziţia scorului x faţă de media grupului din care aparţine. asupra variabilei dependente. Reprezentarea grafică a situaţiei descrisă anterior este prezentată în imaginea de mai jos: a b x M1 M2 MG M3 Cele trei linii curbe mici descriu distribuţia salariilor pentru cele trei categorii de studii.3.LOREDANA GHERASIM Mediile celor două grupe: Mgr1=106.ANOVA UNIFACTORIAL Se foloseşte atunci când vrem să analizăm efectul unei variabile independente.44.

Folosirea SPSS . Ipoteza de nul: indicele de creştere (densitatea) va avea aceeaşi valoare. Pentru realizarea acestei analize se deschide meniul ANALYZE – COMPARE MEANS. MSW. opţiunea ONE WAY ANOVA: Vom introduce variabila dependentă (procentul de creştere al populaţie) în câmpul DEPENDENT LIST şi variabila independentă în câmpul FACTOR: 2 1 3 4 6 5 Să analizăm fereastra: 1. este câmpul în care se introduce variabila independentă sau factor (în exemplul nostru factorul este regiunea). 2-asiatică şi 3-africană) asupra indicelui de creştere al populaţie. Semnificaţia coeficientului F se stabileşte în funcţie de două grade de libertate: gradele de libertate intergrup (valoare dată de numărul de grupuri minus 1) şi gradele de liberate intragrup (valoare dată de suma gradelor de libertate a grupurilor sau de numărul total de subiecţi mai puţin numărul grupurilor). 303 . calculează raportul între variaţia provocată de diferenţele întergrupuri. Ipoteza de cercetare: variabila regiune influenţează valoarea densităţii populaţie sau indicele de creştere va varia în funcţie de regiune. indiferent de zona geografică.sav şi vom analiza efectul variabilei regiune (care are trei grade de intensitate: 1-europeană. (formula de calcul este F=MSB/MSW) şi stabileşte dacă acest raport este suficient de mare pentru a putea distinge între grupe. 3. 2. coeficientul Fisher).ANALIZA COMPUTERIZATĂ A DATELOR Analiza de varianţă (simbolul este F. MSB. câmpul în care sunt introduse variabilele dependente (în cazul nostru densitatea). câmpul în care sunt afişate variabilele din baza de date.ANOVA unifactorial Vom folosi baza de date Baza7. şi variaţia cauzată de diferenţele intragrup.

După activarea butonului OK al ferestrei principale în foia cu rezultate apr următoarele tabele: Descriptives procentul de crestere anuala a populatiei N europa asia africa Total 15 11 11 37 Mean . Vom descrie pe scurt opţiunile butonului POST-HOC: Toate testele de la această opţiune indică dacă diferenţele obţinute pe ansamblu prin analiza testului F se regăsesc şi la nivelul comparaţiilor dintre grupuri luate două câte două.LOREDANA GHERASIM 4. 5.724 2. 6.693 1. Testele sunt prezentate în ordinea descrescătoare a puterii lor. Activarea butonului descriptiv deschide următoarea casetă: Opţiunile pe care le vom bifa sunt DESCRIPTIV pentru a vedea mediile celor trei grupe şi reprezentarea grafică a efectului MEANS PLOT. Pragurile de semnificaţie a acestor teste sunt ajustate în funcţie de numărul de grupe. Pentru a analiza efectul variabilei independente asupra celei dependente se foloseşte testul BONFERRONI.376 .956 . butonul POST HOC permite alegerea unui anumit tip de contrast post-hoc.149 304 . butonul OPTIONS conţine elemente de statistică descriptivă. Deviation . butonul CONTRAST permite realizarea unor comparaţii între grupe în funcţie de variabila independentă.489 Std.433 1.564 1.

în această coloană sunt prezentate gradele de libertate pentru care se calculează valoarea prag a lui F.6/0. regiunea influenţează valoarea indicelui demografic.259* .05 level. The mean difference is significant at the . iar cel intragrup este 34 (numărul total de subiecţi este 37 minus 3 numărul de grupe).257 asia .ANALIZA COMPUTERIZATĂ A DATELOR 1 2 Sum of Squares 33. gradul de libertate intergrup (sau between) este 2 (3 grupe-1).564 ANOVA procentul de crestere anuala a populatiei df 2 34 36 Mean Square 16.4=39.000 -2. F(2. Coloana este notată cu I.277 *. Pentru a vedea diferenţele dintre grupuri trebuie să analizăm rezultatele prezentate în tabelul POST HOC TESTS: 7. 3.001.273 1.969* .939 -.666 10 Mean Difference (I) regiunea geografic (J) regiunea geografic (I-J) Std.000 1.630 . 9.666 -. Error europa asia -1.290* . conţine valoarea testului F obţinută prin împărţirea mediei varianţei intragrup la media varianţei intergrup (în exemplul nostru: 16. fără a preciza care sunt grupele între care apar diferenţe semnificative.259* . p<0. 305 .277 africa europa 2.257 africa -.969* .611 2. . 2. Din datele pe care le avem până acum.000 -1.642 . prima coloană indică nivelul de referinţă al variabilei independente.290* .004 -1.5). putem concluziona că pe ansamblu.273 . Vom prezenta succint semnificaţia datelor din tabele: 1. 4.257 africa -2. Lower Bound Upper Bound .611 . coloana afişează valorile diferenţelor dintre coloana I şi J. 8.303 47.004 .5. în a doua coloană sunt trecute deviaţiile pătratice care intră în componenţa fiecărui tip de varianţă (intergrup şi intragrup).532 Sig. 6.939 . coloana a doua indică nivele variabilei independente care sunt comparate cu nivelurile de referinţă.34)=39. 5.261 14.257 asia europa 1.908 -1.000 . Coloana este notată cu J. conţine semnificaţia testului F sau probabilitatea de eroare când respingem ipoteza de nul. Putem spune că doar pe ansamblu se întâmplă acest lucru pentru că rezultatele analizei ANOVA se referă doar la existenţa diferenţelor globale dintre grupe. în această coloană sunt prezentate componente ale testului F.642 1.421 F 39.000 Between Groups Within Groups Total 3 4 Multiple Comparisons 5 6 Dependent Variable: procentul de crestere anuala a populatiei Bonferroni 7 8 9 11 95% Confidence Interval Sig. în prima coloană sunt trecute cele două componente ale variaţiei totale: cea intergrup şi intragrup.908 . faţă de care se face comparaţia.

057 F 2. urmează apoi regiunea asiatică (indicele este semnificativ mai mare decât cel al regiunii europene. 11.001 Mgr1(Europa)-Mgr3(Africa)=-2. dar mai mici decât cel al regiunii africane).96.142 Between Groups Within Groups Total 306 .004 Între toate grupele apa diferenţe semnificative. p=0. cea mai mare valoarea a indicelui demografic îl are regiunea africană (indicele este semnificativ mai mare comparativ cu celelalte două regiuni). .638 756166.2. Rezultatele obţinute sunt următoarele: ANOVA Numar de oameni/ kilometru patrat Sum of Squares 3133461 25709646 28843107 df 2 34 36 Mean Square 1566730. p<0.2. În imaginea de mai jos apare grafică a efectului: În continuare vom analiza efectul variabilei regiune asupra densităţii. Pe ultimul loc se plasează Europa cu cel mai mic (semnificativ mai mic comparativ cu zona asiatică şi africană) indice demografic. Astfel. p<0. steluţa care apare în dreptul diferenţelor dintre medii indică existenţa unor diferenţe semnificative între acestea. coloana conţine valoarea exactă a pragului de semnificaţie pentru fiecare diferenţă.LOREDANA GHERASIM 10.072 Sig. în exemplul nostru observăm următoarele rezultate: Mgr1(Europa)-Mgr2(Asia)=-1.001 Mgr2(Asia)-Mgr3(Africa)=-0.

5. 1.234 1. cu două valori: 1 . . 1. 10.7. 5.447 648. 1. 7. 6.268 1. densitatea populaţiei este aproximativ aceeaşi indiferent de regiune: europeană. 2. 10.234 .07.789 345. 1. 7. 1. 1. 2. 2. 2 Niv_anx: 1. 1. 7. 6.142. 1. 5. 9. 1. 8. 2. 8. 1.GENERAL LINEAR MODEL . 1. ANOVA UNIVARIATE Cele mai multe studii realizate în domeniul psihologiei studiază efectul mai multor factori (variabile independente) asupra uneia sau mai multor variabile dependente. 1.186 370. 8. 1. 2.nivel scăzut de anxietate scăzut şi 2 nivel ridicat de anxietate). 2. 6. 2. 1. Folosirea SPSS .2% din cazuri). Pentru a analiza efectelor mai multor variabile independente se poate folosi analiza de varianţă factorială. Constăm nu există un efect al variabilei regiune asupra densităţii populaţiei (nu putem respinge ipoteza de nul pentru că am greşi în 14. 1. 2. Acest tip de analiză prezintă două tipuri de note F corespunzătoare celor două tipuri de efecte pe care le măsoară. 1. 2. Error 345. Prezentăm mai jos datele care trebuie introduse în programul SPSS: Nota: 9. 8. 1. 9. 7. 2.UNIVARIATE Pentru a prezenta modul de folosire al programului SPSS pentru aplicarea acestei metode vom crea o nouă bază de date (baza8.ANALIZA COMPUTERIZATĂ A DATELOR Multiple Comparisons Dependent Variable: Numar de oameni/ kilometru patrat Bonferroni Mean Difference (I-J) -627. 2. 1. 2.000 . 1. Efectele principale măsoară influenţa unei variabile independente asupra variabilei dependente. 2.186 345. 2. 2. Logica acestei metode este identică cu a modelului ANOVA unifactorial. 8.nivel scăzut al stimei de sine şi 2 – nivel ridicat al stimei de sine). 6. 1. asiatică sau africană. 1. 1. Deci. 2. 7.618 -21. 2. p=0.34)=2. 2.172 627.789 Sig. 7. 2. Efectele de interacţiune măsoară influenţa combinată a două sau mai multor variabile independente asupra variabilei dependente. 5.186 345.186 370. III. indiferent de acţiunea celorlalte variabile independente. 2.000 . 2.618 (I) regiunea geografica europa asia africa (J) regiunea geografica asia africa europa africa europa asia Std. 1. 2. 1. 2. 8. 2 307 . 9. 1. 1.sav) care conţine trei variabile: nota (notele obţinute de studenţi la examen). 1. 8. 1. 10.447 21. 8 Niv_stim: 1. 2. 7. Testul POST HOC Bonferroni nu semnalează diferenţe semnificative între cele trei grupe care se formează în funcţie de intensităţile variabilei independente. 1. la fel coeficientul F măsoară raportul dintre variaţia cauzată de împărţirea pe grupuri şi variaţia intrinsecă a grupurilor. 6. niv_anx (nivelul de anxietate cu două valori: 1 .1. 2. 2. niv_stim (nivelul stimei de sine. Metodele prezentate până acum (testele t şi ANOVA unifactorial) permit doar evidenţierea influenţei separate a fiecărui factor.268 Din tabelul ANOVA extragem valoarea şi semnificaţia lui F: F(2. 2.172 -648.

Odată activată comanda pe ecran apare următoarea fereastră: 2 3 1 4 5 6 Vom explica această fereastră: 1. în câmpul FIXED RACTOR se introduc variabilele independente (sau factorii) a căror efect este controlat (nu este cauzat de întâmplare) 4. se poate introduce o singură variabilă dependentă 3. Pentru analiza efectului combinat voma activa meniul ANALYZE .GENERAL LINEAR MODEL opţiunea UNIVARIATE. 6. fiecare din ele având două grade de intensitate.LOREDANA GHERASIM În acest exemplu avem două variabile independente niv_stim (nivelul stimei de sine) şi niv_anx (nivelul de anxietate). care nu ne interesează în mod direct sau a căror acţiune nu o putem controla 5. Variabila dependentă este NOTA (vom trece această variabilă în câmpul DEPENDENT VARIABLE: 308 . este o opţiune pentru utilizatorii avansaţi şi nu recomandăm folosirea metodei fără cunoaşterea precisă a semnificaţiei sale. Variabila dependentă este nota obţinută la examen. în câmpul DEPENDENT VARIABLE se introduce variabila dependentă. în câmpul COVARIATE pot fi trecute variabile independente sau variabile dependente care ar putea avea o legătură sau un efect asupra variabilei dependente. variabilele independente sunt nivelul stimei de sine (NIV_STIM) şi nivelul anxietăţii (NIV_ANX). Pentru exemplul nostru. aici se trec valorile pe care le putem folosi atunci când bănuim că unele variabile independente (factori) ar corela între ele. deci vom trece aceste variabile în câmpul FIXED FACTORS. astfel vom vedea dacă variabilele noastre independente (trecute în câmpul FIXED FACTORS) influenţează variabila dependentă indiferent de acţiunea factorilor covarianţi. în câmpul RANDOM FACTOR pot si trecute variabilele independente. conţine variabilele din baza de date 2. Vom analiza efectul de interacţiune (sau combinat) al nivelului de anxietate şi al stimei de sine asupra notei obţinute la examen.

ANALIZA COMPUTERIZATĂ A DATELOR În partea dreaptă fereastra principală există o serie de butoane care conţin opţiuni complexe de analiză. opţiunea CUSTOM se foloseşte dacă se doreşte simplificarea modelul cu care se lucrează. ceea ce înseamnă că se vor lua în calcul toate efectele principale şi combinaţiile posibile de factori. folosind opţiunile care se deschid din câmpul INTERACTION. putem alege efectele pe care vrem să le analizăm. Precizăm nu vom folosi în analiză toate opţiunile. Butonul MODEL activează următoarea fereastră: 2 1 3 4 Opţiunile din această fereastră folosesc la construirea unor modele de analiză în condiţiile în care situaţia investigată este complicată (conţine multe variabile independente). bifarea acestei opţiune activează automat câmpurile şi butoanele care se găsesc dedesubt. Pentru modelele simple se recomandată utilizarea acestei opţiuni 2. Să analizăm fereastra: 1. 309 . permiţând calculul anumitor efecte pentru anumiţi factori 3. cu ajutorul butonului cu săgeată se pot selecta factorii pentru care dorim să se calculeze efectele. opţiunea FULL FACTORIAL este marcată implicit. acestea putând fi folosite pentru design-uri experimentale mult mai complexe.

Pentru exemplul nostru. Butonul CONTRAST deschide următoarea fereastră: Opţiunile acestei ferestre permit compararea diferitelor grupuri rezultate din împărţirea subiecţilor în funcţie de valorile sau categoriile variabilelor independente. se alege tipul de contrast din câmpul CONTRAST. vom păstra opţiunea marcată implicită FULL FACTORIAL. Apoi. permite alegerea tipului de interacţiune dintre variabilele independente (cât de complexă să fie interacţiunea) şi calculul unor coeficienţi de regresie ai modelului (există o legătură strânsă între Regresia liniară şi analiza de varianţă). Aici sunt trecute doar variabilele independente. Pentru exemplificare. După alegerea tipului de contrast trebuie activat butonul CHANGE. Se recomandă tipul de contrast DIFFERENCE. Cu alte cuvinte vom vedea dacă cei cu stimă de sine ridicată obţin note diferite de cei cu stimă de sine scăzută). 310 . se cere programului să analizeze dacă între cele două nivele ale variabilei nivel al stimei de sine vor apărea diferenţe în ceea ce priveşte notele obţinute. La fel se procedează şi pentru variabila independentă nivelul anxietăţii. Se apasă butonul CONTINUE pentru a reveni la fereastra principală. am ales variabila NIV_STIM (nivelul stimei de sine). Prin tipul de contrast DIFFERENCE. Se alege variabila independentă pentru care se doreşte calculul contrastul (diferenţa dintre nivelele sale de variaţie).LOREDANA GHERASIM 4.

SEPARATE PLOTS se foloseşte introducerea celui de al treilea factor. În consecinţă vom reprezenta notele la examen în funcţie de nivelul stimei de sine.ANALIZA COMPUTERIZATĂ A DATELOR Butonul PLOTS activează o fereastră dedicată reprezentărilor grafice: Pe axa HORIZONTAL AXIS se introduce variabila independentă ale cărei categorii dorim să le reprezentăm pe axa X. Pe axa SEPARATE LINES se introduce variabila pentru care se vor trasa linii ce vor reprezenta categorii diferite ale factorului. NIV_ANX (reprezentată prin linii separate). ca în imaginea de mai jos: 311 . ceea ce permite obţinerea mai multor grafice. NIV_STIM (pe care o vom trece pe axa X) şi nivelul anxietăţii. care indică relaţia dintre variabilele introduse anterior pentru fiecare nivel al factorului trei. În exemplul nostru avem doar doi factori.

Nu vom mai comenta aceste opţiuni. Acest buton permite realizarea mai multor grafice. Vom reveni la fereastra principală fără a activa vreo opţiune. Revenim din nou în fereastra principală pentru a activa butonul POST HOC care va deschide fereastra: Acest buton are opţiuni similare cu butonul POST HOC din fereastra ANOVA ONE-WAY. dar menţionăm că ele facilitează tratarea analizei de variantă ca un model particular de regresie. deoarece în urma activării acestuia câmpurile ferestrei se golesc. deoarece ambele variabile independente au doar două nivel.LOREDANA GHERASIM Se activează butonul ADD. Butonul OPTIONS activează o fereastră specifică acestei analize de varianţă: 312 . Recomandăm folosirea acestor opţiuni doar celor care cunosc regresia. Pentru a analiza diferenţele dintre grupe se foloseşte testul Bonferroni. Butonul SAVE activează următoarea fereastră: Opţiunile la care face referire acest buton se referă la o altă metodă statistică numită Regresia liniară. Această opţiune se foloseşte doar când variabile independente au mai mult de două nivele de variaţie. Pentru exemplul nostru nu avem nevoie de comparaţii POST HOC.

După selecţia opţiunilor fereastră arată astfel: În continuare vom prezenta foaia cu rezultate. 313 . este câmpul în care se trec factorii pentru care dorim să calculăm mediile grupurilor de subiecţi 3. permiţând calcularea mediei pentru fiecare grup de subiecţi în parte. deviaţia standard. prezintă toate combinaţiile de factori pentru care avem grupuri diferite de subiecţi. Primul tabel precizează numărul de subiecţi pentru fiecare grup obţinut în funcţie de nivelurile fiecărei variabile independente. Opţiunea OVERALL se referă la media calculată pentru toţi subiecţii. prezintă opţiuni ce permit calcularea mai multor parametri. ne interesează calculul parametrilor descriptivi (media. neîmpărţiţi în grupuri 2. precum şi testele de omogenitate (care trebuie să nu fie semnificative pentru a putea aplica acest model ANOVA). Primele elemente ale output-ului se referă la parametrii descriptivi ai modelului.ANALIZA COMPUTERIZATĂ A DATELOR 2 1 3 Prezentăm elementele principale ale ferestrei: 1. minimul şi maximul). De exemplu. sunt 16 subiecţi în grupul celor cu nivel scăzut al stimei de sine. Dintre toate.

LOREDANA GHERASIM

Al doilea tabel precizează mediile totale precum şi cele corespunzătoare fiecărui subgrup de subiecţi, subgrup determinat de categoriile factorilor din model. Aceste date sunt rezultatul opţiunilor marcate de noi din fereastra butonului OPTIONS.

Mai departe, în foaia de rezultate sunt prezentate elementele cele mai importante ale outputului, rezultatele testului F.

Tabelul cu testul lui Levene reprezintă tocmai testul de omogenitate, care trebuie să fie nesemnificativ pentru a utiliza această metodă.
4 2 3

1

Cele mai importante elemente ale tabelului se referă la testul F. Ne interesează numai liniile marcate prin acolade. 1. arată variabilele ale căror efecte le luăm în calcul:

314

ANALIZA COMPUTERIZATĂ A DATELOR

linia cu NIV_STIM arată efectul principal al factorului nivelul stimei de sine, indiferent de acţiunea celuilalt factor; • NIV_ANX arată efectul principal al factorului nivel de anxietate, indiferent de acţiunea celuilalt factor; • linia NIV_STIM*NIV_ANX se referă la efectul de interacţiune al celor două variabile asupra variabilei dependente; 2. conţine notele F corespunzătoare efectelor principale şi de interacţiune; 3. conţine pragurile de semnificaţie ale testelor F. 4. conţine gradele de libertate between subjects şi within subjects Pentru exemplu nostru s-a obţinut doar un singur F semnificativ (p<0,05) şi anume cel corespunzător liniei NIV_STIM (F(1,30)=22,13, p<0,001). Deci apare un efect principal al variabilei nivelul stimei de sine asupra notelor la examen. Restul efectelor sunt nesemnificative. Nu apare un efect principal al variabilei nivelul anxietăţii (F(1,30)=2,7, p=0,107), deci notele subiecţilor nu depinde de cât de anxioşi sunt aceştia. De asemenea, nu apare un efect de interacţiune al variabilelor independente nivelul stimei de sine şi nivelul anxietăţii (F(1,30)=0,02, p=0,881), deci nota la examen nu este influenţată de efectul combinat al nivelului de anxietate şi al stimei de sine. Pentru a vedea modul în care nivelul stimei de sine (NIV_STIM) influenţează nota la examen, trebuie să ne uităm în tabelul de contrast: Testul de contrast calculează diferenţa între media notelor obţinute de subiecţii cu nivel ridicat al stimei de sine şi a celor cu nivel scăzut al stimei de sine (LEVEL 2 vs. LEVEL l). Această diferenţă a fost comparată cu situaţia în care cele două grupuri ar fi obţinut valoarea zero (HYPOTHESIZED VALUE). Pragul de semnificaţie (notat cu SIG) indică apariţia unei diferenţe semnificative. Sensul diferenţei (-1,93) indică faptul că cei cu nivel ridicat al stimei de sine (LEVEL 2) au obţinut note mai semnificativ mai mici comparativ cu cei cu nivel ridicat al stimei de sine (LEVEL 1). Tabelul alăturat reia analiza contrastelor pentru factorul nivelul anxietăţii: Aici nu mai apar diferenţe semnificative (fapt confirmat şi de lipsa unui efect principal pentru această variabilă), deci nivelul anxietăţii nu afectează nota la examen (Mdif=-0,68, p=0,107). Următoarele tabelele prezintă media obţinută pe ansamblu (tabelul l), mediile obţinute pentru fiecare factor în parte (tabelele 2 şi 3) şi cele pentru grupurile de subiecţi rezultat al combinării nivelurilor celor două variabile independente. Aceste tabele ajută la interpretarea sensului diferenţelor la testele de
315

LOREDANA GHERASIM

contrast şi interacţiunii variabilelor. Tabelele prezintă şi deviaţiile standard şi limitele valorii medii pentru un interval de încredere de 95%.

La finalul foii de rezultate apare reprezentarea grafică a interacţiunii dintre variabilele independente:

Liniile graficului reprezintă nivelurile diferite de anxietate. Efectul principal al variabilei NIV_STIM poate fi observat grafic cu uşurinţă: notele obţinute de subiecţii cu stimă de sine ridicată au valoare mai mică comparativ cu cei care au stimă de sine scăzută. Putem concluziona, pentru exemplul nostru, că nota la examen este influenţată de nivelul stimei de sine dar nu şi de nivelul anxietăţii. Mai mult, nivelul stimei de sine acţionează asupra notei la examen în acelaşi mod indiferent de nivelul anxietăţii.

316

1. 104. 116. 1. ANX2 (scorurile pacienţilor la scala de anxietate după terapie). în cazul nostru această variabilă este măsurarea repetată a anxietăţii înainte şi după terapie (sau test-retest). 109. trebuie să utilizăm un alt model de analiză de varianţă. 102. 103. 117. 105. şi TERAPIE (tipul de terapie utilizat. iar cealaltă măsurări repetate. Folosirea SPSS . care apare în câmpul WITHIN-SUBJECTS FACTOR NAME (factor 1) vom trece numele noii variabile 317 . 102. 102. 2.8. 1. ANX2: 110. 102. 102. 121. se formează o nouă variabilă independentă.GENERAL LINEAR MODEL opţiunea REPETED MEASURES. una presupunând eşantioane independente. 115. 110. 103. Efectele principale măsoară influenţa fiecărei variabile independente asupra variabilei dependente. 112. După activarea comenzii. 110. 110. cu măsurări repetate. cu două valori care corespund celor două tipuri de intervenţii terapeutice 1. Atunci când una dintre variabilele independente presupune eşantioane perechi sau măsurări repetate. Efectele de interacţiune măsoară influenţa combinată a două sau mai multor variabile independente asupra variabilei dependente. 105. 2. 1. 104. pe care o vom denumit TRT. 124. 2. Cu alte cuvinte trebuie denumită variabila independentă care presupune măsurări repetate şi trebuie precizate nivelurile acesteia. Activarea comenzilor pentru acest model ANOVA se face din meniul ANALYZE . 104. Pentru a analiza efectul terapiei asupra stării pacienţilor trebuie să comparăm nivelul iniţial şi cel final al anxietăţii pacienţilor. 104. La fel ca şi modelul de varianţă prezentat anterior şi acest tip de analiză prezintă două tipuri de note F corespunzătoare tipurilor de efect măsurate. care trebuie introduse în programul SPSS: ANX1: 109. 110. ANOVA REPETED MEASURES Modelul ANOVA UNIVARIATE prezentat anterior permite analiza efectului de interacţiune a două variabile independente care presupun grupe independente de subiecţi. 115.tip 1 de terapie şi 2 . Acest model de analiză de varianţă se utilizează atunci când se doreşte analiza efectului de interacţiune a două variabile independente. TERAPIE: 1.ANALIZA COMPUTERIZATĂ A DATELOR III. 110. 102. Această variabilă independente se referă la momentul măsurării anxietăţii pacienţilor şi are două niveluri. 104. 2. 1. 2 Variabila dependentă este reprezentat de scorurile obţinute la scala de măsurare a anxietăţii înainte şi după terapie. 115. În locul denumirii generice a variabilei care presupune măsurări repetate. 1. 108. 2. Variabila independentă tip de terapie (TERAPIE) are două nivele (tip 1 de terapie şi tip 2 terapie) şi presupune eşantioane independente. 2. 2. 109. 2. 1. 105. 2. pe ecran apare fereastra alăturată: Pentru a putea face analiza trebuie definită variabila care presupune măsurări repetate. 104.tip 2 terapie). 106. indiferent de acţiunea altei variabile independente. şi anume modelul ANOVA cu măsurări repetate. 106.GENERAL LINEAR MODEL – REPETED MEASURES Pentru a prezenta modul de utilizare a programului SPSS pentru aplicarea acestei metode vom crea o nouă bază de date (baza 8. 112. 1 – pretest (înainte terapiei) şi 2 posttest (după terapie). Scopul cercetării ar putea fi analiza eficienţei intervenţiilor terapeutice asupra nivelului anxietăţii. 1. Prezentăm mai jos datele.sav) care conţine trei variabile: ANX1 (scorurile pacienţilor la scala de anxietate înaintea terapiei. Astfel. 103. 2. 103.

4. pentru a putea utiliza metoda şi defini variabilele independente (vezi imaginea din stânga): După salvarea definirii factorului cu măsurări repetate se activează butonul DEFINE. în consecinţă aceste variabile se introduc în câmpul WITHIN-SUBJECTS VARIABLES (TRT). În cazul nostru variabilele ANX1 şi ANX2 reprezintă nivelurile variabilei TRT. care activat deschide o nouă fereastră: 2 1 3 4 Vom prezenta câmpurile acestei ferestre: 1.LOREDANA GHERASIM TRT. se introduc variabile independente sau dependente care ar putea avea legătură sau ar influenţa variabila dependentă. este câmpul ce conţine variabilele din baza de date. 3. Pentru exemplul nostru vom trece valoarea 2 pentru că anxietatea este măsurată înainte şi după terapie (vezi imaginea din dreapta): Se activează butonul ADD. În câmpul NUMBER OF LEVEL trebuie trecut numărul de măsurători repetate. 2. Variabila tip de terapie (TERAPIE) se introduce în câmpul BETWEEN-SUBJECTS FACTOR. aici se introduc variabilele care reprezintă niveluri ale variabilei independente cu măsurări repetate. această variabilă presupunând grupe independente de subiecţi şi reprezentând variabila factor. în acest câmp introducem variabilele independente care presupun eşantioane independente. 318 .

vom păstra opţiunea selectată implicit FULL FACTORIAL. Opţiunile sunt similare celor care au apărut în modelul de analiză de varianţă prezentat anterior ANOVA UNIVARIATE. Pentru exemplul nostru. Butonul CONTRAST activează următoarea casetă de dialog: 319 . Butonul MODEL activează următoarea fereastră: Opţiunile din această fereastră folosesc la construirea unor modele în condiţiile în care situaţia investigată este prea complicată.ANALIZA COMPUTERIZATĂ A DATELOR În partea de jos a ferestrei principale apar o serie de butoane care conţin opţiuni complexe de analiză. ceea ce va însemna că în foia cu rezultate vor apărea atât efectele principale ale celor două variabile independente cât şi efectul de interacţiune al acestora.

Butonul PLOTS activează o fereastră dedicată reprezentărilor grafice. De asemenea. pentru că variabilele independente au dor două niveluri.LOREDANA GHERASIM Se observă că deja este selectat tipul de contrast pentru variabila independentă care presupune măsurări repetate (TRT Polynomial). vom reveni la fereastra principală fără a activa vreo opţiune. care presupune două niveluri. Pentru exemplul nostru nu avem nevoie de comparaţii POST-HOC. Vom reprezenta nivelul anxietăţii pacienţilor în funcţie de tipul terapiei (pe care o vom trece pe axa X) şi momentul evaluării anxietăţii TRT (reprezentată prin linii separate): Se activează apoi butonul ADD pentru ca aplicaţia SPSS să reţină reprezentarea grafică a interacţiunii dintre variabilele independente: Butonul POST HOC deschide următoarea fereastră: Acest buton are opţiuni similare butonului POST HOC din fereastra ANOVA ONE-WAY şi UNIVARIATE. Trebuie să alegem tipul de contrast pentru variabila TERAPIE. Vom selecta tipul de contrast Difference. 320 . În consecinţă. pentru a analiza diferenţele dintre grupe se foloseşte testul Bonferroni. Opţiunea se foloseşte atunci când variabile independente au mai mult de două nivele de variaţie.

butonul se referă la o altă metodă statistică numită Regresia liniară. 321 .ANALIZA COMPUTERIZATĂ A DATELOR Butonul SAVE activează următoarea fereastră: La fel ca la ANOVA UNIVARIATE. Al doilea tabel precizează numărul de subiecţi pentru fiecare grup obţinut în funcţie de nivelurile factorului care presupune eşantioane independente: Următorul tabel precizează mediile pentru fiecare subgrup de subiecţi format în funcţie de toate categoriile factorilor din model. facilitând tratarea analizei de variantă ca un model particular de regresie. deci pentru fiecare grup experimental. Butonul OPTIONS activează o fereastră specifică analizei de variantă: La OPTIONS avem posibilitatea de a cere calculatorului să ne afişeze mediile grupelor de subiecţi în funcţie de fiecare variabilă independentă. Primul tabel precizează nivelurile (ANX1 şi ANX2) variabilei cu măsurări repetate (TRT). Recomandăm folosirea acestor opţiuni doar celor care cunosc regresia. Primele elemente ale output-ului se referă la parametrii descriptivi ai modelului. precum şi în funcţie ambele variabile. În continuare vom prezenta foaia cu rezultate.

p=0.LOREDANA GHERASIM Următoarele două tabele prezintă efectele principale şi de interacţiune ale variabilelor independente.002. Pentru a vedea cum influenţează tipul de terapie nivelul anxietăţii pacienţilor vom analiza tabelul Custom Hypothesis. pacienţii care au primit tipul 2 de terapie au un nivel al anxietăţii semnificativ mai ridicat comparativ cu pacienţii care au primit terapia de tip 1 (Mdif=4. La fel ca şi la modelul de analiză de varianţă anterior se extrag valorile coeficienţilor F.40. Următorul tabel indică efectul variabilei independente tip de terapie.002). Astfel. În primul tabel se constată că nu apare un efect al variabilei TRT (p>0. p=0. Se constată că apare un efect principal al acestei variabilei independente asupra nivelului anxietăţii pacienţilor după terapie. indiferent de tipul de terapie utilizat. pragul de semnificaţie şi gradele de libertate.050). Deci subiecţii au acelaşi nivel al anxietăţii înainte şi după terapie. De asemenea. TRT*TERAPIE (F(1. fără a ţine seama de momentul măsurării F(1.23.18)=0.18)=13. ceea ce indică faptul că nivelului iniţial al anxietăţii pacienţilor nu diferă de nivelul final al anxietăţii pacienţilor după terapie (F(1.661). p=0. p=0.18)=0. Faptul că subiecţii au acelaşi nivel al anxietăţii după intervenţia terapeutică indică faptul că terapia utilizată nu a avut efect.940).006.267. nu apare un efect combinat al variabilelor independente. 322 .

ANALIZA COMPUTERIZATĂ A DATELOR Următoarele tabelele prezintă media obţinută pe ansamblu (tabelul l). 323 . Aceste tabele ajută la interpretarea sensului diferenţelor la testele de contrast şi interacţiunii variabilelor. Tabelele prezintă şi deviaţiile standard şi limitele valorii medii pentru un interval de încredere de 95%. Efectul principal al variabilei TERAPIE poate fi observat grafic cu uşurinţă. mediile obţinute pentru fiecare factor în parte (tabelele 2 şi 3) şi pentru grupele de subiecţi obţinute în urma combinării nivelurilor celor două variabile independente (tabelul 4). La finalul foii de rezultate apare reprezentarea grafică a interacţiunii dintre variabilele independente: Liniile graficului reprezintă momentele măsurării anxietăţii.

1. deoarece nu există restricţii cu privire la distribuirea normală a rezultatelor. În consecinţă.sav) care cuprinde următoarele variabile: VRST (vârsta subiecţilor). TESTUL CHI PĂTRAT Testul chi-pătrat permite compararea distribuţiei frecvenţelor unei variabile pe mai multe categorii. în locul măsurării preferinţei pentru un anume tip de muzică folosind o scală ordinală de tipul „1-deloc.foarte mult". precum media sau abaterea standard. cu două valori: 1 . Testul compară abaterile de la această distribuţie teoretică obţinute în realitate şi estimează probabilitatea ca ele să apară aleatoriu. Deoarece avem de a face cu scale nominale sau ordinale. cu două valori: 1 semnifică subiecţi de gen masculin şi 2 subiecţi de gen feminin) şi VOT (cuprinde răspunsurile subiecţilor la întrebarea „Cu cine aţi votat la ultimele alegeri prezidenţiale?. pot fi uşor detectate diferenţele folosind metodele parametrice. În acest fel. este mai indicată măsurarea pe o scală de interval de tipul „1-deloc -2-3-4-5 . fără a intra în detaliile teoretice privind aceste teste. prin raportare la o distribuţie teoretică stabilită de cercetător. Aplicarea acestor teste este mai facilă decât folosirea testelor parametrice. 3-mediu. acolo unde acestea există în realitate. iar 2 indicând pe cei care au votat Băsescu) şi variabila GR_MULT (conţine răspunsurile subiecţilor la întrebarea „Cât de mulţumiţi sunteţi de situaţia actuală a ţării?”. Metodele statistice utilizate pentru analiza acestor date sunt numite teste neparametrice. Totuşi. datele pe care le obţinem folosind aceste scale de măsură nu mai pot fi analizate folosind metodele prezentate anterior. aceste metode pot eşua mai uşor în demonstrarea diferenţele.deloc mulţumit. Prezentăm scorurile subiecţilor la cele patru variabile: 324 . Aceste date se analizează pornind de la frecvenţele de apariţie ale diferitelor categorii sau de la probabilităţile de apariţie ale acestor categorii. GEN (genul subiecţilor. Folosirea SPSS Pentru a demonstrat modul de aplicare a acestei metode vom crea o nouă bază de date (baza9. 4-mult. cu două valori: 1 indicând persoanele care au votat pe Geoană. nu mai pot fi utilizaţi. Vom prezenta câteva dintre metodele neparametrice. 2-puţin. IV. Din acest motiv. DATELE NEPARAMETRICE Datele non-parametrice sunt mai frecvent utilizate în sociologie decât în psihologie. De exemplu. 5-foarte mult".LOREDANA GHERASIM IV. recomandăm conceperea instrumentelor utilizând scalele de interval în locul celor nominale sau ordinale. parametrii obişnuiţi pe care i-am folosit până acum în analiză.foarte mulţumit).puţin mulţumit şi 3 . 2 .

ceea ce semnifică faptul că se va compara situaţia reală a votului cu situaţia în care candidaţii ar obţine acelaşi număr de voturi. 1. 23. folosind testul chi pătrat. 1. 34. 2. 2. atunci foloseam opţiunea VALUES şi butonul ADD. 2. 1 În exemplul nostru. 3.ANALIZA COMPUTERIZATĂ A DATELOR VRST: 45. Dacă însă doream să comparăm distribuţia cu o alta. 1. 62. 1. Vom activa fereastra specifică testului din meniul ANALYZE . 2. 1. 1. 29 GEN: 1. 2. 2. 2. 22. Se observă faptul că în câmpul EXPECTED VALUES este bifată opţiunea ALL CATEGORIES EQUAL. 19. 43. 3. 2. 51. 2. 3. 2. 41. 2. 3. 1. 1. 2. 54.NONPARAMETRIC TESTS opţiunea CHI-SQUARE: Vom introduce variabila VOT în câmpul pentru analiză (TEST VARIABLES LIST). 2. 21. 2. Deci. 47. 2. 27. 2. 2. 2 GR_MULT: 1. categoriile sale. 3. 36. 32. 1. 38. 1. Rezultatele testului apar în foaia cu rezultate sub forma a două tabele: În primul tabel sunt trecute elementele descriptive ale testului. 2. 1. 2. 2. 2. 1. frecvenţa observată. 1. 325 . 35. vom compara frecvenţa cu care oamenii au votat cei doi candidaţi. 2. 37. dorim să vedem cu cine au votat alegătorii din lotul nostru la ultimele alegeri prezidenţiale. 2. cea teoretică la care se face raportarea şi abaterile frecvenţei observate de la frecvenţa teoretică (coloana RESIDUALS). 2 VOT: 2. 2. în care categoriile nu s-ar mai fi distribuit egal. 1. 2. 2. 1.

018) la un grad de libertate. În foaia cu rezultate apar următoarele tabele: 326 . Semnificativ mai mulţi oameni au votat pe Băsescu ca preşedinte comparativ cu cei care lau votat pe Geoană. Testul se activează din meniul ANALYZE . care se bazează pe ierarhia rangurilor observaţiilor din cele două grupuri. ci calitativă şi ordinală. Deci oamenii au votat în mod semnificativ diferit cei doi candidaţi la preşedinţie.NON-PARAMETRIC TESTS opţiunea TWO INDEPENDENT SAMPLES: Fereastra care apare pe ecran semănă foarte mult cu cea care apare la activarea testului t pentru eşantioane independente. vom folosi MANN-WHITNEY U. Grupurile variabilei independente se definesc folosind butonul DEFINE GROUPS. la fel ca şi în cazul testului t. doar că în acest caz variabila dependentă măsurată nu este cantitativă. Vom analiza dacă apr diferenţe între subiecţii de gen masculin şi cei de gen feminin în ceea ce priveşte gradul de mulţumire faţă de situaţia actuală a ţării. este semnificativă (p=0. Vom trece variabila dependentă (GR_MULT) în câmpul TEST VARIABLE LIST. Folosirea SPSS Pentru a ilustra aplicarea testului vom utiliza baza de date creată anterior (baza9. prezentată în tabelul al doilea ( χ 2 = 5.sav). IV.LOREDANA GHERASIM Valoarea statistică a testului. Dintre cele patru tipuri de teste.55 ).2. Toate testele neparametrice ce compară două eşantioane independente au la bază comparaţii ale rangurilor diferitelor intervale observate. TWO INDEPENDENT SAMPLES Aceste teste sunt echivalentul testului t pentru eşantioane independente. iar variabila independentă (GEN) în câmpul GROUPING VARIABLE.

Astfel. 1.medie şi 3 .83. 2. TWO RELATED SAMPLES Metodele care compară două eşantioane perechi sunt similare aplicării testului t pentru eşantioane perechi.importanta.medie şi 3 . Deoarece subiecţii răspund la ambele întrebări trebuie aplicată o metodă care să permită compararea eşantioanelor perechi.05). 2. 3. sensul diferenţei ar fi fost dat de semnul notei Z. 2. 2. 2.778) este mai mare de 0. 1. 3. 1. 1. 1. 2. 1. rangul mediu pentru subiecţii de gen masculin are valoare 9. 2. variabila are trei valori 1 . 3. 2. 2. Se foloseşte din meniul NON PARAMETRIC TESTS opţiunea TWO RELATED SAMPLES. 1. 2 Dorim să vedem dacă subiecţii au o părere mai bună despre unul dintre cele două partide politice. 2. 2 . 3.050. variabila are trei valori 1 . 2. 1.slabă). Ca şi la acest test. 1. 2. 3. scrisă imediat deasupra valorii pragului de semnificaţie. 1. 1. 2. 3. 1. 3. Fereastra seamănă cu cea a testului t pentru eşantioane perechi. 2. 3. Pentru a ilustra aplicarea acestui test vom folosi o nouă bază de date (baza10. în primul tabel este prezentată situaţia „descriptivă" (media rangurilor). 2 PSD: 2. IV. 1. 1. 1. 1.17. Dacă diferenţele ar fi fost semnificative (p<0. Prezentăm rezultatele subiecţilor: Alinata: 1. 1. pentru cei de gen feminin are valoarea 9. 1. 1.slabă) şi PSD (cuprinde răspunsurile subiecţilor la itemul „Evaluaţi contribuţia alianţei în integrarea europeană”. 3.sav) care cuprinde două variabile: ALINATA (cuprinde răspunsurile subiecţilor la itemul „Evaluaţi contribuţia alianţei în integrarea europeană”. 2. trebuie selectată o pereche de variabile pentru analiză. deci putem trage concluzia că femeile şi bărbaţii din studiul nostru nu diferă semnificativ în ceea ce priveşte gradul de mulţumire cu privire la situaţia actuală a ţării.3. pentru a se activa opţiunile ferestrei. Pentru exemplul nostru vom selecta variabile ALIANTA şi PSD şi le vom trece în câmpul din stânga: 327 . 2. Valoarea pragului de semnificaţie (p=0. 2. iar valoarea pragului de semnificaţie a testului este dată în tabelul al doilea (linia denumită ASYMP. 1. SIG).importanta. 2.ANALIZA COMPUTERIZATĂ A DATELOR Observaţi că stilul de prezentare al rezultatelor este similar cu cel de la testul chi-pătrat. 2 . 1.

Indicii de sub acest tabel arată sensul diferenţelor. unul pentru valorile descriptive şi altul pentru semnificaţia testului. comparând separat diferenţele pozitive şi negative. 328 .LOREDANA GHERASIM Vom utiliza testul WILCOXON. precum şi cazurile în care scorurile sunt la egalitate. Din al doilea tabel observăm că testul este nesemnificativ (p=0. Aceste rezultat indică faptul că oamenii consideră ca ambele partide contribuie la fel de mult la integrarea României în Uniunea Europeană. care se bazează pe rangul valorilor absolute al diferenţelor dintre două variabile. Prezentarea rezultatelor testului. ca mai jos: În primul tabel apare media şi suma rangurilor diferenţelor pozitive şi negative. se face în două tabele.281). în foaia cu rezultate.

You're Reading a Free Preview

Download
scribd
/*********** DO NOT ALTER ANYTHING BELOW THIS LINE ! ************/ var s_code=s.t();if(s_code)document.write(s_code)//-->