Sunteți pe pagina 1din 116

Aspect teoretice

şi practice ale
programului SPSS

MIHAELA SANDU
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

CUPRINS
INTRODUCERE ........................................................................................................................ 4
I. Noţiuni de bază despre introducerea şi analiza statistică folosind SPSS .............................. 6
I.1. Accesarea SPSS-ului. ....................................................................................................... 7
I.2. Introducerea datelor.......................................................................................................... 8
I.3. Salvarea datelor. ............................................................................................................... 9
I.4. Folosirea „Variabilei View” pentru crearea şi etichetarea variabilelor.......................... 10
I.5. Exemplu de calcul statistic. ............................................................................................ 12
II. Descrierea variabilelor. Tabele şi diagrame. ........................................................................ 17
II.1. Frecvenţa procentuală. .................................................................................................. 17
II.2. Diagrama circulară pentru date categoriale. ................................................................. 18
II.3. Adăugarea etichetelor unei diagrame circulare............................................................. 20
II.4. Diagrama cu bare pentru date categoriale..................................................................... 21
II.5. Histograme. ................................................................................................................... 23
III. Descrierea numerică a variabilelor. Medie, mod, mediană, variaţie şi dispersie .............. 25
III.1. Introducerea datelor şi efectuarea analizei .................................................................. 25
III.2. Interpretarea output-ului. ............................................................................................. 26
III.3. Alte caracteristici. ........................................................................................................ 28
IV. Forme ale distribuţiei scorurilor ......................................................................................... 30
IV.1. Introducerea datelor..................................................................................................... 31
IV.2. Interpretarea Output-ului ............................................................................................. 32
IV.3. Histograme. ................................................................................................................. 32
IV.4. Interpretarea output-ului .............................................................................................. 33
IV.5. Modalitatea. ................................................................................................................. 33
IV.6. Simetria. ...................................................................................................................... 34
IV.7. Boltirea (excesul). ....................................................................................................... 36
V. Abaterea standard. ............................................................................................................... 38
V.1. Introducerea datelor. ..................................................................................................... 38
V. 2. Interpretarea output-ului. ............................................................................................. 40
V.3. Scorurile Z .................................................................................................................... 40
V.4. Raportarea output-ului. ................................................................................................. 41
V.5. Alte caracteristici. ......................................................................................................... 42
VI. Relaţiile dintre două sau mai multe variabile.Diagrame şi tabele. ..................................... 43
VI.1. Introducerea datelor..................................................................................................... 43
VI.2. Ponderea datelor .......................................................................................................... 44
VII. Coeficienţi de corelaţie. Coeficienţi de corelaţie Pearson şi Spearman. ........................... 46
VII.1. Introducerea datelor. .................................................................................................. 47
VII.2. Corelaţia Pearson. ...................................................................................................... 48
VII.3. Interpretarea output-ului. ........................................................................................... 48
VII.4. Raportarea output-ului. .............................................................................................. 49
VII.5. Coeficientul de corelaţie Spearman. .......................................................................... 50
VII.6. Interpretarea output-ului. ........................................................................................... 51
VII.7. Raportarea output-ului. .............................................................................................. 51
VII.8. Diagrama scatter. ....................................................................................................... 51
VII.9. Interpretarea output-ului. ........................................................................................... 52
VII.10. Raportarea output-ului. ............................................................................................ 52
VIII. Regresia. Predicţia cu precizie. ........................................................................................ 54
VIII.1. Introducerea datelor. ................................................................................................. 54
VIII.2. Regresia simplă......................................................................................................... 55
VIII.3. Interpretarea output-ului. .......................................................................................... 56

2
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
VIII.4. Scatterplot-ul de regresie. ......................................................................................... 56
VIII.5. Interpretarea output-ului. .......................................................................................... 57
VIIII.6. Raportarea output-ului............................................................................................. 58
IX. Eroarea standard ................................................................................................................. 59
IX. 1. Introducerea datelor.................................................................................................... 59
IX. 2. Eroarea standard estimată a mediei. ........................................................................... 59
IX. 3. Interpretarea output-ului. ............................................................................................ 60
X. Testul t. Compararea a două eşantioane de scopuri corelate/relaţionate. ............................ 61
X.1. Introducerea datelor. ..................................................................................................... 62
X.2. Testul t pentru eşantioane perechi ................................................................................ 62
X.3. Interpretarea output-ului. .............................................................................................. 63
X.4. Raportarea output-ului. ................................................................................................. 63
XI. Testul t. Compararea a două eşantioane de scoruri necorelate/nerelaţionate. .................... 64
XI.1. Introducerea datelor..................................................................................................... 65
XI.2. Efectuarea Testului t pentru eşantioane independente. ............................................... 66
XI.3. Interpretarea output-ului. ............................................................................................. 67
XI.4. Raportarea output-ului................................................................................................. 68
XII. Testul Chi-Square. Diferenţe între frecvenţele eşantioanelor. .......................................... 69
XII.1. Introducerea datelor folosind procedura „Weighing cases”. ...................................... 69
XII.2. Introducerea datelor din tabelul 1 caz cu caz. ............................................................ 70
XII.3. Efectuarea Testului chi-square pe baza tabelului 1.................................................... 70
XII.4. Interpretarea output-ului pentru Testul chi-square..................................................... 72
XII.5. Raportarea output-ului pentru Testul chi-square. ...................................................... 73
XIII. Recodificarea variabilelor................................................................................................ 75
XIII.1. Recodificarea rezultatelor. ........................................................................................ 75
XIV. Calculul variabilelor noi. ................................................................................................. 78
XIV.1. Procedura unei variabile noi. .................................................................................... 79
XV. Testele rangurilor. Statistici nonparametrice. ................................................................... 80
XV.1. Scoruri relaţionate: testul semnului. .......................................................................... 81
XV.2. Interpretarea output-ului pentru testul semnului........................................................ 81
XV.3. Raportarea output-ului pentru testul semnului........................................................... 82
XV.4. Scoruri relaţionate: testul Wilcoxon. ......................................................................... 82
XV.6. Raportarea output-ului pentru Testul Wilcoxon. ....................................................... 83
XV.7. Scoruri nerelaţionate: Testul U Mann-Whitney......................................................... 84
XV.8. Interpretarea output-ului pentru testul U Mann-Whitney. ......................................... 85
XV.9 Raportarea output-ului pentru Testul U Mann-Whitney............................................. 86
XVI. Analiza de varianţă (ANOVA). Introducere în metoda one-way ANOVA cu scoruri
nerelaţionate sau necorelate. .................................................................................................... 87
XVI.1. Metoda one-way ANOVA pentru eşantioane independente. ................................... 88
XVI.2. Interpretarea output-ului. .......................................................................................... 89
XVI.3. Raportarea ouput-ului. .............................................................................................. 90
XVII. Analiza de varianţă bifactorială pentru scoruri nerelaţionate/necorelate. ..................... 91
XVII.1. Metoda two-way ANOVA pentru scoruri nerelaţionate. ........................................ 92
XVII.2. Interpretarea output-ului.......................................................................................... 93
XVII.3. Raportarea output-ului. ........................................................................................... 95
XVIII. Comparaţii multiple cu ANOVA. ................................................................................. 96
XVIII.1. Interpretarea output-ului. ....................................................................................... 97
XVIII.2. Raportarea output-ului. .......................................................................................... 99
ALEGEŢI RĂSPUNSUL CORECT ...................................................................................... 100
RĂSPUNSURI CORECTE .................................................................................................... 111
BIBLIOGRAFIE .................................................................................................................... 115

3
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

INTRODUCERE
_________________________________________________________________________________________________________________

Aplicaţia SPSS („Statistical Package for the Social Sciences” – „pachet


de programe statistice aplicate ştiinţelor sociale”) a fost elaborată în anul 1965
de către Universitatea Stanford din California.
Programul SPSS (Statistical Package for the Social Sciences) este
unul dintre cele mai utilizate în analiza statistică a datelor şi a evoluat până la
versiunea 19, aria de aplicabilitate extinzându-se de la versiune la versiune,
odată cu modul de operare şi cu facilităţile oferite. Programul este utilizat în
foarte multe domenii: în marketing, cercetare experimentală, educaţie, sănătate
etc. În afară de analizele statistice posibile, programul utilizează componente
atât pentru managementul datelor (selectare, reconfigurare, creare de date noi)
cât şi pentru documentarea datelor (există un dicţionar metadata, care reţine
caracteristici ale datelor).
Lucrarea de faţă constituie o introducere concisă şi clară în statistica
aplicată în ştiinţele de factură socio-economică, ca produs al faptului social.
Tehnicile statistice prezentate sunt văzute ca instrumente folosite pentru a
răspunde unor probleme de cercetare specifice. Cu alte cuvinte, acest material
nu se adresează statisticianului profesionist, ci psihologului, economistului, şi
mai larg, oricărui debutant în studiul ştiinţelor omului şi studenţilor care doresc
să analizeze date din psihologie, sociologie, criminologie, sau date similare.
Cartea se doreşte a fi un îndrumător pentru analiza datelor, fiind o carte
completă, de sine stătătoare care satisface nevoile studenţilor la toate nivelele.
Manualul este structurat pe XVIII capitole, oferind astfel posibilitatea
parcurgerii pas cu pas a informaţiilor prezentate dar şi o privire de ansamblu
asupra procedurilor de calcul din SPSS.

4
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Persoanele familiarizate cu fundamentele teoretice ale statisticii, pot


parcurge independent acest manual, deoarece, fiecare temă este însoţită de
indicarea referinţei teoretice precum şi devteme de control care vor putea fi
efectuate cu programul SPSS.
Ca obiective îşi propune să faciliteze:
• Asimilarea noţiunilor esenţiale ale acestei discipline ştiinţifice şi
descrierea într-un mod clar şi concis a unei colectivităţi, folosind informaţia
din datele obţinute prin observări statistice asupra fenomenelor studiate;
• Familiarizarea studenţilor cu limbajul şi cerinţele cercetării
ştiinţifice, din cadrul ştiinţelor politice, psihologiei, pedagogiei, sociologiei,
precum şi cu procedeele informaţionale de studiu şi cercetare folosind
Internetul.
• Înţelegerea ideilor care stau la baza statisticii, a principiilor de
organizare şi analiză a datelor, precum şi de evaluare statistică.
S-a urmărit folosirea cât mai multor exemple practice astfel încât, la
finalul manualului, sunt prezentate întrebări şi probleme care să vă ajute să
înţelegeţi mult mai bine materialul prezentat. Informaţiile prezentate aici nu sunt
în totalitate originale, ci ele se bazează pe afirmaţiile unor specialişti în
domeniu.

5
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

I. Noţiuni de bază despre introducerea


şi analiza statistică folosind SPSS
_________________________________________________________________________________________________________________

Psihologia a fost acceptată ca ştiinţă de sine stătătoare abia în sec. al


XIX-lea, o dată cu accentuarea laturii ei experimentale. Astfel, s-a recurs la
acumularea de observaţii şi date, care, comparate cu celelalte ştiinţe (care aveau
un statut epistemologic clar delimitat şi acceptat de comunitatea ştiinţifică), apar
deficitare sub aspectul interpretării lor.
Cuvântul statistică are semnificaţii multiple. Astfel poate să ne ducă cu
gândul la indicele preţurilor de consum, la cifra medie de afaceri a unor firme, la
rata şomajului, la datele publicate într-o revistă sau într-un buletin oficial etc.
Încercând să definim statistica, putem spune că „este un corp de metode
pentru a colecta, a descrie şi a analiza date numerice din observaţii sau
investigaţii ştiinţifice”. (Clocotici, Stan, 2000, p.13)
Obiectul de studiu al statisticii îl constituie „variaţia curentă-continuă, în
timp şi spaţiu şi din punct de vedere calitativ, al fenomenelor de tip stochastic
din orice domeniu al vieţii economico-sociale sau naturale”. (Jaba, 2004, p. 13-
16)
Statistica a fost folosită pentru rezolvarea unor nevoi practice ale vieţii
sociale din cele mai vechi timpuri şi până astăzi, o regăsim atât în primele forme
de evidenţă a populaţiei şi bunurilor materiale cât şi în rezolvarea celor mai
variate şi complexe probleme de conducere.
Statistica se referă la măsurare şi probabilităţi. Cuvântul statistică,
provine din latinescul „statista” şi desemna, pe vremuri, persoanele care se
ocupau cu afacerile statului, care numărau populaţia sau alte aspecte ce ajutau
statul să gestioneze mai bine politica de taxe şi costurile războaielor. În perioada
medievală, prin statistică, armatorii îşi calculau costurile echipării corăbiilor,
incluzând în calculele lor şi probabilitatea ca acestea să fie atacate de piraţi sau
de a naufragia. (Opariuc, 2009, apud Lungu 2001).

6
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

I.1. Accesarea SPSS-ului.

SPSS-ul for Windows este accesat în general prin folosirea butoanelor şi


meniurilor folosind pentru aceasta clicuri ale mouse-ului. Astfel, cea mai rapidă
modalitate de învăţare este de a urma paşii prezentaţi şi capturile de ecran.

Pasul 1:
Se dă dublu clic pe imagine
– dacă imaginea nu apare pe
ecran atunci accesaţi „Start”
→Programe→IBM SPSS Statistic 19.

Pasul 2:

Această fereastră va apărea


după câteva momente şi se
pot alege oricare dintre
opţiunile din fereastră.

(Fereastra se numeşte „Data Editor”.

Fereastra de editare (Data Editor) se deschide


implicit la lansarea SPSS şi este folosită
pentru introducerea, modificarea sau ştergerea
datelor în format spreadsheet. Într-o fereastră
de editare poate fi prezentat conţinutul unui
fişier de date care a fost selectat dintr-o
listă de fişiere creat anterior (în SPSS, Excel,
Statistica etc.) sau poate fi creată o nouă foaie
de lucru. Această fereastră recunoaşte fişierele de date care au extensia implicită .sav.
În fereastra Data Editor sunt afişate datele de lucru. Acestea sunt aranjate în format tabel
(spreadsheet), care conţine coloane şi linii. La intersecţia acestora sunt celulele (casetele,
căsuţele) în care se introduc datele. La un moment dat este activă (curentă) o singură celulă,
cea în care este plasat cursorul. Celula curentă este scoasă în evidenţă printr-un chenar
îngroşat. Trecerea de la o celulă la alta se realizează prin clic de mouse în noua celulă sau de
la tastatură cu ajutorul tastelor de control (taste săgeţi, Page Up, Page Down).

7
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

I.2. Introducerea datelor.

Pasul 3:
Aceasta este fereastra Data Editor a SPSS-ului şi este un spaţiu de lucru
cu linii şi coloane în care pot fi introduse datele.

Coloanele sunt folosite pentru a


desemna diferite variabile.

Liniile sunt cazurile sau indivizii


despre care se deţin date.

Pasul 4:

Pentru a introduce date in SPSS


se selectează una dintre celule şi se dă
clic pe celula respectivă.

* În SPSS există întotdeauna o singură celulă


selectată.

Pasul 5:

Se introduce un număr folosind tastatura


calculatorului. La apăsarea tastei „Enter”
sau la selectarea cu mouse-ul a unei alte
celule numărul va fi introdus în foaia de
lucru la fel cum este arătat în figură.
Valoarea 5 este înregistrarea pentru primul
rând (primul caz) al variabilei VAR00001.

• Se observă că această variabilă a primit automat un nume standard. Pentru


a efectua schimbarea se dă clic pe numele variabilei.

8
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 6:

Corectarea erorilor se face folosind mouse-ul:


se selectează celula unde este eroarea şi se
introduce valoarea corectă.
Atunci când este apăsată tasta „Enter”
sau se deplasează cursorul pe o altă celulă,
valoarea corectată va fi introdusă.

I.3. Salvarea datelor.

Pasul 7:
Selectând „File”→ „Save As” datele se vor
salva sub forma unui fişier. Fişierul salvat
va primi automat de la SPSS extensia „.sav”.
* Se recomandă folosirea unor nume
de fişiere distincte (ex. date1) pentru
a face conţinutul lor cât mai clar. Salvarea
datelor este recomandat să se facă într-un fişier
diferit de cel al SPSS-ului.

Pasul 8:
Pentru a alege locaţia unde va fi salvat
fişierul de date, se alege calea în mediul
„Save In” (se foloseşte săgeata pentru a
ajunge la locaţia dorită).

O bază de date aflată în lucru nu are un


corespondent într-un fişier decât după ce se execută
o salvare a acesteia, deoarece, programul nu are
o funcţie de salvare automată dup un interval de
timp prestabilit (Popa, 2008, p. 250).
Salvarea unui fişier se realizează prin pictograma
Save din bara de instrumente Standard sau cu
ajutorul comenzilor Save sau Save As şi meniul
File. Aceste comenzi deschid fereastra Save Data As în care se pot stabili: numele fişierului
(File name); tipul fişierului (Save as type); locaţia în care să aibă loc salvarea (Save In).

9
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

I.4. Folosirea „Variabilei View” pentru crearea şi etichetarea


variabilelor
Pasul 9:
Apăsarea meniului „Variable
View”, situat în josul paginii,
schimbă fereastra „Data View”
(spaţiul de lucru pentru introducerea
datelor) în altă fereastră în
care pot fi introduse informaţii
despre variabilele create.

Pasul 10:
Acesta este spaţiul de lucru „Variable View”. În acest caz, o variabilă este
deja înscrisă fiind introdusă la pasul 8. Variabila poate fi redenumită şi pot fi
adăugate alte variabile selectând celula corespunzătoare şi tastând numele
variabilei.

Aici se modifică Aici se modifică


lăţimea coloanei. numărul de zecimale.

Pasul 11:
La versiunea SPSS 19 nu există
limită pentru lungimea numărului
unei variabile.
Se selectează o celulă din coloana
„Name” şi se scrie un nume diferit
de variabilă. Celelalte variabile vor
primi valori care vor fi implicit
schimbate ulterior.
Acesta este numărul de zecimale care va apărea pe ecran.

10
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

*La editarea unei variabile trebuie să se ţină cont de următoarele restricţii: numele variabilei
să fie unic, primul caracter să fie o literă, sa nu conţină simboluri speciale folosite în SPSS sau
spaţii.
Semnificaţia coloanelor din figura de la Pasul 10.
Numărul cazlui – identifică poziţia cazului în baza de date;
Name – numele variabilelor;
Type – tipul variabilelor;
Width – numărul total de digiţi;
Decimals – numărul de digiţi pentur partea zecimală;
Label – etichetarea variabilelor;
Values – valorile pe care le poate lua variabila;
Missing – valorile lipsă;
Columns – lăţimea coloanei din Data editor;
Align – alinierea valorilor în coloană.

Pasul 12:
Apare acest buton:
se dă clic pe el.

Pasul 13:

Va apărea această fereastră. În


continuare se vor urmări paşii
care vor arăta cum genul biologic
„masculin” şi „feminin” este introdus
folosind codul „1” (masculin)
respectiv „2” (feminin).

Pasul 14:

Se scrie „1” în dreptul


câmpului „value”
şi „masculin” în dreptul
câmpului „value Label”.

Apoi se apasă „Add”

11
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 15:

Aceasta operaţie de adăugare


transferă informaţia în câmpul
aflat dedesubt.
* La fel se procedează şi pentru
introducerea celeilalte variabile
(Ex. 2 - feminin).

* Cele mai frecvent utilizate ferestre in SPSS sunt „data Editor”, „Syntax Editor” şi „Output
Viewer”, „Pivot Table (Pivot Table Editor)”, “Chart Editor”.
Fereastra de sintaxă (Syntax Editor) este folosită pentru a genera programe de comenzi
pe care le vom executa asupra datelor (exemplu: calculul unor noi variabile). Opţiunile
selectate în casetele de dialog sunt afişate în fereastra de sintaxă sub formă de comenzi.
Aceste ferestre îi sunt specifice fişierele de tip .sps.
Fereastra de rezultate (Output Viewer) devine disponibilă automat după ce a fost
efectuată o comandă de analiză a datelor. În această fereastră, sunt afişate rezultatele
statistice, tabele şi grafice care au asociate ferestre distincte. Fereastra de editare a rezultatelor
(Text Output Editor) este folosită pentru modificarea textului rezultat, care nu a fost afişat în
tabele pivot.
* Fereastra de rezultate (Output Viewer) devine disponibilă automat după ce a fost efectuată o
comandă de analiză a datelor. În această fereastră, sunt afişate rezultatele statistice, tabele şi
grafice care au asociate ferestre distincte. Fereastra de editare a rezultatelor (Text Output
Editor) este folosită pentru modificarea textului rezultat, care nu a fost afişat în tabele pivot.
Toate rezultatele obţinute din analizele statistice sunt afişate în fereastra Output Viewer.
Această fereastră se aseamănă cu fereastra Windows Explorer şi se deschide doar dacă s-au
lansat comenzi din meniurile Statistics sau Graphs.
Fereastra Output Wiewer este structurată în două cadre/zone. Cadrul din stânga
(cuprinsul/structura) prezintă, sub forma unei schiţe, obiectele conţinute în fereastră.
Elementele din schiţă se referă la titlu, note şi denumirea rezultatelor statistice propriu-zise.
Fereastra Pivot Table (Pivot Table Editor) oferă multiple posibilităţi de modificare a
tabelelor pivot: editare text, schimbarea datelor din rânduri şi coloane, adăugarea de culori,
crearea unor tabele multidimensionale, ascunderea sau afişarea selectivă a rezultatelor.
Fereastra de editare a graficelor (Chart Editor) permite modificarea elementelor unui
grafic (axe, scale, diagramă, legendă etc.)

I.5. Exemplu de calcul statistic


Pasul 16:
Pentru a calcula media de
vârstă se urmăresc următoarele
etape:
- se dă clic pe „Analyze”;
- Se selectează „Descriptive
statistics”;
- Se selectează „Descriptives…”

12
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 17:

Se selectează „atenţie”.
Se apasă butonul ► pentru a
muta „atentie” în căsuţa
„Variable(s)” cu ajutorul săgeţii.
Se dă clic pe „OK”.

Pasul 18:
Fereastra „Data Editor” este înlocuită de output-ul SPSS-ului. Acest tabel
apare pentru analiza realizată anterior.

Media scorului pentru atenţie este încercuită.


*Ferestrele în SPSS reprezintă zone de pe ecran tratate ca elemente de sine stătătoare,
cu caracteristici proprii, care determină acţiunile ce se pot executa în cadrul lor.
*O bază de date în SPSS este o structură formată din linii şi coloane, la intersecţia
cărora se formează celule care conţin anumite unităţi de informaţii.

Elementele de statistică sunt foarte simple dar apar probleme la


asamblarea elementelor, abilităţile matematice având un mic rol în analiza
statistică a datelor.

 Variabila – concept de bază utilizat în statistică.


Definiţie: Caracteristica (variabila) statistică reprezintă trăsătura, proprietea,
însuşirea comună tuturor unităţilor unei colectivităţi şi care variază ca nivel,
variantă sau valoarea de la o unitate a colectivităţii la alta. (Vasilescu, Puiu,
1992.)
Variabilitatea se referă la „proprietatea obiectului de studiu de a lua
valori diferite” (Popa, 2008, p. 23).

13
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Fiecare dintre criteriile de diferenţiere este o variabilă, adică o entitate
care ia valori diferite pentru componenţii colectivităţii şi este comună tuturor
elementelor colectivităţii.
Exemplul 1. „mediul de provenienţă” este o variabilă care poate lua trei
valori: „urban”, „rural” – variabilă categorială;
Exemplul 2. Variabila „gen biologic” poate lua 2 valori: „feminin” şi
„masculin”. – variabilă categorială;
Exemplul 3: „Vârsta” poate lua valori de la 0 ani la peste 100 de ani. –
variabilă numerică;
Variabila „Vârsta” poate fi şi variabilă categorială şi lua diferite valori
in funcţie de categoriile stabilite. (se stabilesc categorii de vârste).
Exemplu: 1. 10-20 ani
2. 21-30 ani
3. 31-40 ani.
O variabilă, reprezintă un concept cheie în statistică şi nu este altceva
decât un nume pentru un element a cărui proprietate principală este aceea
că variază, îşi modifică parametrii. (Opariuc, 2009) Mulţimea valorilor
înregistrate pentru o caracteristică particulară constituie distribuţia variabilei
respective.

Modalitatea de realizare a unei variabile (modul în care îi sunt atribuite


valorile) constituie un eveniment întâmplător (probabilistic), de aceea variabila
se mai numeşte şi variabilă aleatoare.

Definiţie: Varianta/valoarea reprezintă nivelul concret pe care îl poate


lua o variabilă la nivelul unei unităţi sau grup de unităţi statistice. (Benţea,
Munteanu, 2007, p. 22).
Exemplu: Înălţimea copiilor dintr-o clasă poate lua aleatoriu diferite valori pe
care le pot avea copiii la această caracteristică.
→ valorile pe care le poate lua variabila, se grupează într-un anumit interval de
valori.
14
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
O variabilă aleatoare poate fi discretă sau continuă, după cum mulţimea
de definiţie a valorilor sale poate fi numărabilă (discontinuă) sau nenumărabilă
(continuă).

a. Variabile discrete.

Variabilele discrete sunt cele care sunt exprimate prin numere întregi
(număr finit de valori pe care le poate lua). (Popa, 2008).
Exemplu:
 numărul de copii pe care îi are o familie;
 numărul de oraşe dintr-un judeţ;
 genul biologic;
 Gradul didactic;
În cazul variabilelor discrete, mulţimea de definiţie a valorilor sale este o
mulţime discontinuă iar între două valori nu poate fi interpusă o valoare
intermediară.
Variabilele discrete pot fi categoriale sau de rang.
b. Variabile continue
Sunt variabile „de tip numeric (cantitativ, de tip interval/raport) care au
un număr teoretic infinit de niveluri de măsurare...poate lua orice valoarea
(exprimabilă şi prin numere fracţionate), permiţând utilizarea zecimalelor”.
(Popa, 2008, p. 25).
Exemplu:
 greutatea → între un subiect de 72 kg şi un subiect de 76 kg putem găsi
oricând un subiect de 74,5 kg;
 cifra de afaceri a unei firme;
 înălţimea subiecţilor.
În cazul acestor variabile, mulţimea de definiţie a valorilor sale este una
continuă, ne-numărabilă. Aceste variabile se mai numesc şi variabile scalare
(de interval sau de raport).

15
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

*Este foarte important să se hotărască pentru fiecare variabilă în parte dacă este
variabilă nominală (categorială) sau variabilă cantitativă.
Definirea atributelor unei variabile este prima operaţie din procesul de pregătire a
setului de date. Definirea presupune precizarea atributelor unei variabile: numele variabilei,
tipul, lungimea (numărul de caractere), numărul de zecimale (pentru cele numerice), eticheta,
valorile etichetei, valorile lipsă, alinierea şi modalităţile de măsurare a variabilei. Variabilele
se definesc în coloanele foii Variabile View din fereastra Data Editor.
Tipul variabilei – variabilele pot fi de mai multe tipuri: numerice (Numeric, Coma, Dot,
Scientific notation), alfanumerice (String), date calendaristice, simbol monetar.
*O sesiune de lucru în SPSS presupune, obligatoriu, existenţa unei baze de date
(începând cu versiunea 14, SPSS poate deschide simultan mai multe baze de date).

16
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

II. Descrierea variabilelor.


Tabele şi diagrame.
________________________________________________________
Tabelele şi diagramele reprezintă o parte importantă a analizei datelor şi
reprezintă un aspect important al înţelegerii datelor obţinute şi al familiarizării
cu acestea. (Howitt, Cramer, 2010, p. 59).

II.1. Frecvenţa procentuală.

Pentru realizarea unui tabel de frecvenţă este necesară o coloană căreia i


se va da un nume.

Pasul 1:

Se defineşte variabila.

Se etichetează valorile variabilei.

Valorile pentru specializare se definesc


aşa cum este descris în paşii 13-15 din
capitolul I.

Pasul 2:

Se selectează:
„Analize”,
„Descriptive Statistics”
„Frequencies…”

17
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 3:
Se selectează specializare şi se mută
în partea dreaptă a tabelului
(procedeul a fost descris la pasul 17
din capitolul I).

Se apasă „OK”

Pasul 4:
1. Prima coloană a tabelului conţine eticheta celor 4 categorii de specializări.

2. A doua şi a treia coloană afişează


Frecvenţa absolută şi relativă pentru 3. A patra coloană afişează
fiecare categorie. frecvenţa excluzând valorile lipsă
Exemplu: 3 (jurnalism) reprezintă * Deoarece nu sunt valori lipsă,
procentajul 30% din totalul de este acelaşi ca în coloana a treia.
10 specializări.

4. A cincea coloană adună procentele în josul tabelului.


(reprezintă frecvenţa relativă cumulată ascendent).

• În ceea ce priveşte raportarea rezultatelor se prezintă numai etichetele categoriale,


frecvenţele şi frecvenţele procentuale.

II.2. Diagrama circulară pentru date categoriale.

Pasul 1:

Se selectează:
„Graphs”
„Legacy dialogs”
„Pie”.

18
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 2:

Se selectează „Define”.

Pasul 3:

Se selectează „specializarea”
şi se transferă prin apăsarea
butonului ►(◄) în rubrica
„define slices by”.
Se apasă „OK”.

Diagrama Pie este un cerc divizat


în sectoare. Fiecare sector de cerc
reprezintă o categorie, aria
acestuia fiind proporţională cu
numărul de cazuri din această
categorie a variabilei nominale.

Pasul 4:

Acesta este felul în care apare o diagramă


circulară folosind opţiunile din SPSS.
Sectoarele din cerc sunt codate cu diferite culori.

* Caracteristicile din această diagramă pot fi modificate


cu „Chart Editor”.

19
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

II.3. Adăugarea etichetelor unei diagrame circulare

Pasul 1:

Se dă dublu clic oriunde în dreptunghiul


care conţine diagrama, pentru a selecta
„Chart Editor”.

Se selectează:
„Elements”
„Show Data Labels”.

* Diagrama de structură „pie” este folosită


pentru reprezentarea frecvenţelor absolute
(numere) şi/sau relative (procente) pe
categorii/grupe.

Pasul 2:
Se selectează „Count” şi
„X”-ul roşu pentru a nu afişa.

Se selectează „specializare” şi săgeata


Verde curbată în sus pentru a afişa
denumirile specializărilor.

Se procedează asemănător pentru


„Procent” pentru a afişa procentajul
fiecărei specializări în parte.

Se selectează „Apply” şi „Close”.

20
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 3:

Pentru a înlătura legenda,


se selectează „Options”
şi „Hide Legend”.

Diagrama circulară cu sectoarele


denumite şi frecvenţă procentuală afişată.

II.4. Diagrama cu bare pentru date categoriale.

Pasul 1:

Se selectează:
„Graphs”
„Legacy dialogs”
„Bar…”.

21
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 2:

Selectaţi „Define”.
„Simple” este preselectat.

*Selectare unei alte variante se face prin


clic cu mouse-ul pe varianta respectivă.

Pasul 3:

Se selectează ocupaţia şi se apasă


butonul ► de lângă „Category
Axis” pentru a introduce acolo
specializarea.

Se selectează „% of cases”.

Se apasă „OK”

Diagrama cu bare.

22
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
* Diagrama cu bare este folosită pentru a reprezenta grafic mediile diferitelor grupe dintr-o
colectivitate (Summaries for groups of cases) sau valorile medii ale diferitelor variabile pentru
aceeaşi colectivitate (Summaries of separate variables).
Diagrama Bar este folosită pentru a ilustra categoriile unei distribuţii în formă convenabilă.
Diagrama prezintă atâtea bare câte categorii are o variabilă. Barele au aceeaşi bază, egală cu
unitatea, iar înălţimea proporţională cu frecvenţa categoriei astfel încât aria fiecărei bare
reprezintă numărul cazurilor categoriei considerate.
Pentru a fi interpretat un grafic trebuie să conţină următoarele elementele:
- titlul graficului – oferă informaţii asupra fenomenului reprezentat (Titlul graficului
coincide cu titlul tabelului de date);
- axele de coordonate sunt folosite pentru a reprezenta variabilele. Pe abscisă se înscrie
variabila de distribuţie, iar pe ordonată frecvenţa.
- legenda – este folosită pentru a explica elementele din diagramă;
- sursa – precizează originea datelor reprezentate.

II.5. Histograme.

Pentru a ilustra procesul de realizare a unei histograme vom folosi datele


obţinute din răspunsurile subiecţilor la întrebarea „Vă place statistica?”.
(răspunsuri: a. foarte mult; b. mult; c. puţin d. foarte puţin; e. deloc).
Pasul 1:

Se introduc datele în „Data Editor”


(aşa cum a fost prezentat la
începutul capitolului).

Se selectează:
„Graphs”
„Legacy Dialog”
„Hitogram”

Pasul 2:
Se selectează întrebarea „Vă place
statistica?” şi se apasă butonul ►de
lângă „Variable” pentru a duce întrebarea
în căsuţa din dreapta.
Se apasă „OK”.

Histograma

23
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

* Pentru a schimba denumirile axelor se dă clic pe ele şi se editează.


* Histograma este folosită pentru a arăta forma unei distribuţii după o variabilă
înregistrată asupra unei colectivităţi (frecvenţa de apariţie pentru diferite clase de valori
ale variabilei observate).

Alte tipuri de grafice:


Line – diagrama liniară este folosită pentru a reprezenta de regulă valori medii.
Boxplot – diagrama „cutia cu mustăţi” este folosită pentru a prezenta amplitudinea, intervalul
intercuartilic şi mediana unei distribuţii.
Error Bar – diagrama „bara erorilor” este folosită pentru a arăta media şi intervalul de
variabile.
Scatter – diagrama „norul de puncte” este folosită pentru a reprezenta relaţiile dintre încredere
de 95% pentru media respectivă.

24
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

III. Descrierea numerică a variabilelor


- Medie, mod, mediană, variaţie şi dispersie –
_________________________________________________________________________________________________________________

III.1. Introducerea datelor şi efectuarea analizei

Pentru realizarea acestui exemplu am selectat un număr de 0 subiecţi cu vârste


cuprinse între 15-35 ani.
Pasul 1:

În „Variable View” din „Data Editor” se denumeşte prima coloană „Vârstă”.


* Se îndepărtează cele 2 zecimale şi se scrie 0.

Pasul 2: Pasul 3:

În “Data View” Se selectează “Analize” →


din “Data Editor” “Descriptives statistics” şi
se introduc vârstele “Frequencies...”
în prima coloană.

25
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 4:

Se selectează „vârsta”
şi butonul ► pentru a
introduce în lista de
variabile.

Se deselectează
butonul „Display frequencys tables”
şi se ignoră mesajul de avertizare.

Se dă clic pe „Statistics…”

Pasul 5:

Se selectează
„Mean”;
„Median”;
„Mode”.

Se dă clic pe „Continue”.

Se apasă „OK” din ecranul anterior,


care reapare.

III.2. Interpretarea output-ului.

Statistics
varsta Există 10 cazuri cu date valide pe care se
N Valid 10 bazează analiza.
Missing 0
Nu sunt date lipsă (0).
Mean 26,90
Media de vârstă, media aritmetică
Median 28,50
=26,9 ani.
Mediana de vârstă (vârsta persoanei
Mode 34
aflate la mijlocul liniei de vârste de la cea
mai mică la cea mai mare) este de 28.5 ani, ceea ce înseamnă că, jumătate
dintre subiecți au vârste mai mici decât valoarea medianei iar cealaltă jumătate
au vârste mai mari decât valoarea medianei.
Valoarea mod de vârstă este 34, ceea ce semnifică faptul că cei mai mulți
subiecți au vârsta de 34 de ani.

26
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Definiţie: Indicatorul statistic reprezintă expresia numerică a unor fenomene şi
procese social-economice, definite în timp, spaţiu şi structură organizatorică. (Benţea, M,
Munteanu, G , 2007, p. 59)
Media reprezintă suma aunui număr de scoruri împărţită la numărul de scoruri.
(Howitt, Cramer, 2010, p. 74).
Modul este categoria cu frecvenţa cea mai mare, el reprezintă valoarea cel mai des
întâlnită într-o serie statistică sau cea care are cea mai mare frecvenţă de apariţie. Modul se
mai numeşte şi dominanta seriei sau valoarea modală şi este singura măsură a mediei care
poate fi folosită pntru date nominale.
Grafic, într-o histogramă ori poligon al frecvenţelor el reprezintă valoarea de pe
abscisă corespunzătoare vârfului reprezentării.
O serie de date statistice poate să aibă una sau mai multe valori modale. O distribuţie
cu un singur mod se numeşte unimodală, dacă are două valori dominante se numeşte
bimodală, iar dacă are mai mult de două moduri se numeşte multimodală.
Mediana este o altă măsură a tendinţei centrale şi reprezintă valoarea care împarte
şirul de măsurători în două părţi egale; jumătate din şirul de date vor avea valori mai mici
decât mediana în timp ce cealaltă jumătate vor avea valori mai mari decât mediana (Opariuc,
2009, p. 79).
Mediana prezintă valoarea/varianta din mijlocul unei serii de date, serie în care
observaţiile au fost ordonate crescător (sau descrescător). Mediana este situată în centrul
(mijlocul) seriei.
Mediana poate fi folosită în caracterizarea tendinţei centrale pentru o serie de date
măsurate pe o scală ordinală. Mediana ia în considerare doar poziţia observaţiilor în serie, nu
şi magnitudinea lor efectivă.
Pentru a determina mediana introducem noţiunea de ranguri, adică, numere de
ordine asociate observaţiilor (cea mai mică – rang 1; cea mai mare – rang n).
Mediana, prezintă, mai intuitiv decât abaterea standard, gradul de împrăştiere al
rezultatelor în jurul mediei, deoarece este o expresie procentuală a împărţirii abaterii standard
la medie. (Opariuc, 2009, p. 130).
Se calculează ca raport între abaterea medie pătratică şi nivelul mediu al seriei,
deoarece abaterea standard se foloseşte frecvent pentru măsurarea abaterii medii.
Valoarea coeficientului de variaţie exprimă un raport procentual dintre abaterea standard şi
medie. Cu cât este mai mare, cu atât se poate spune că media este mai puţin reprezentativă
pentru distribuţia respectivă. (Popa, 2008).
După Popa (2006), sunt propuse anumite limite de interpretare a coeficientului de variaţie:
- dacă v x ˂ 15%, împrăştierea este mică, deci media este reprezentativă;
- dacă v x este cuprins între 15 şi 30%, împrăştierea este mijlocie şi media este sufucient
de reprezentativă;
- dacă v x ˃ 30%, împrăştierea este mare, iar media are o reprezentativitate redusă.
Cu cât nivelul lui vx este mai apropiat de zero cu atât variaţia este mai redusă,
colectivitatea este mai omogenă, media având un grad mai ridicat de reprezentativitate; cu cât
valoarea sa este mai departe de zero, cu atât variaţia este mai intensă, colectivitatea mai
eterogenă, iar media are un nivel de semnificaţie mai scăzut.

27
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

III.3. Alte caracteristici.

În căsuţele de dialog de la pasul 5 se pot observa mai multe valori


statistice adiţionale care pot fi calculate:
1. Centilele – indică punctele de separaţie pentru procentajele scorurilor.
Exemplu: Al 90-lea centil este valoarea numerică care separă cele 90% de
valori de dedesubt, din punct de vedere al mărimii.
2. Cvartilele – sunt valorile distribuţiei care indică punctele de separare
pentru cele ai mici 25%, cele mai mici 50% şi cele mai mici 75% dintre scoruri.
3. Suma – indică totalul scorurilor pentru o variabilă.
4. Skewness – Este un indice de asimetrie sau înclinare a distribuţiei
scorurilor pentru o variabilă. Valoarea este pozitivă dacă valorile sunt asimetrice
spre stânga, sau negativă dacă valorile sunt asimetrice spre dreapta.
5. Kurtosis – este un indice de aplatizare care arată cât de ascuţită sau turtită
este distribuţia scorurilor pentru o variabilă, comparativ cu distribuţia normală.
Va fi cu semnul „+” pentru curbe de frecvenţe ascuţite şi cu semnul „-” pentru
curbe de frecvenţe „turtite”.
6. Abaterea standard (estimată) – este o evaluare a măsurii în care scorurile
diferă în medie faţă de media scorurilor pentru o variabilă particulară.
*În SPSS, abaterea standard este calculată ca o estimare a abaterii standard a populaţiei.
Este un indice pentru variabilitatea scorurilor în jurul valorii medii a variabilei. (Howitt,
Cramer, 2010, p. 79).

7. Variaţia (estimată) – este o evaluare a măsurii în care scorurile variază în


medie faţă de media scorurilor pentru variabila respectivă. Ea este pătratul
abaterii standard şi se află în strânsă legătură cu ea.
*În SPSS, variația reprezintă o estimare a varianţei populaţiei şi mai este numită şi
„indicator varianţă a eşantionului”. (Howitt, Cramer, 2010, p. 79).

8. Rang – diferenţa dintre cel mai mare şi cel mai mic scor obţinut pentru o
variabilă.
9. Minim (scor) – valoarea celui mai mic scor al datelor pentru o variabilă
particulară.

28
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

10. Maxim (scor) – valoarea celui mai mare scor al datelor pentru o variabilă
particulară.
11. Eroarea standard (ES medie) – valoarea medie cu care mediile
eşantioanelor extrase dintr-o populaţie, diferă faţă de media populaţiei.
Poate fi utilizată asemănător cu baterea standard şi varianţa, ca indice al
variabilităţii scorurilor pentru o anumită variabilă.
12. Amplitudinea – reprezintă diferenţa numerică dintre scorul maxim şi
scorul minim al unei variabile.

29
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

IV. Forme ale distribuţiei scorurilor


_________________________________________________________________________________________________________________

Este foarte important de studiat forma distribuţiilor scorurilor pentru o


variabilă. Este bine ca o distribuţie să fie simetrică şi cu o formă normală (formă
de clopot).
Distribuţia normală, a fost descrisă prima dată de Ch. Fr. Gauss (1777-
1855) şi de aceea distribuţia normală se mai numeşte şi distribuţie gaussiană.
Deoarece la demonstrarea acestui concept a participat şi P.S. Laplace (1749-
1827), în literatura de specialitate se va întâlni şi termenul de distribuţie Gauss-
Laplace.

Pentru ca o distribuţie să fie considerată normală, trebuiesc îndeplinite


simultan următoarele condiţii:

• Să fie unimodală – adică să existe un singur modul, o singură categorie


cu frecvenţă maximă;

• Să fie simetrică faţă de medie – adică să nu fie deplasată spre stânga


sau spre dreapta;

• Să fie normal boltită – adică să nu fie nici ascuţită şi nici „turtită”;

Toţi aceşti termeni se referă la acelaşi lucru, distribuţia normală.

De asemenea, limitele din stânga şi din dreapta ale unei distribuţii


normale tind spre valoarea zero, pe care însă nu o întâlnesc niciodată. O
distribuţie perfect normală are aceeaşi valoare pentru toţi cei trei indicatori ai
tendinţei centrale (media, mediana şi modulul), adică media = mediana =
modulul. În practică, acest lucru se întâlneşte extrem de rar şi, de aceea, ne
punem problema între ce limite putem considera o distribuţie ca fiind normală.

În exemplul următor este elaborat un tabel de frecvenţă şi o histogramă cu


scorurile obţinute la evaluarea coeficientului de inteligenţă pentru 20 de jurişti.

30
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

IV.1. Introducerea datelor.

Pasul 1:

În „Variable View” din


„Data Editor” se denumeşte
prima coloană „Atenţie”.

Se înlătură cele două zecimale.


*Datele se salvează ca fişier
deoarece vor fi folosite şi la
capitolul 9.

Pasul 2:
În „Data View”
din „Data Editor”
se introduc
scorurile obţinute
la „Atenţie” în
prima coloană.

Pasul 3:
Se selectează
„Analyze”,
„Descriptives
Statistics” şi
Frequencies…”

Pasul 4:
Se selectează
„atenţie” şi apoi
se apasă butonul
►pentru a
introduce în lista
de variabile.
Se apasă „OK”.

31
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

IV.2. Interpretarea Output-ului

Prima coloană arată


scorurile obţinute la
testul de „atenţie”. Cumulative
atentie
Frequency Percent Valid Percent Percent
A doua coloană arată Valid 56 1 10,0 10,0 10,0
frecvenţa acestor
57 1 10,0 10,0 20,0
valori.
58 2 20,0 20,0 40,0
Exemplu: este 1 caz
64 1 10,0 10,0 50,0
în care scorul obţinut
are valoarea 56. 65 2 20,0 20,0 70,0

66 1 10,0 10,0 80,0


A treia coloană 69 2 20,0 20,0 100,0
exprimă aceste Total 10 100,0 100,0
frecvenţe ca
un procent al numărului total A patra coloană A cincea coloană
incluzând şi datele care exprimă aceste frecvenţe cumulează aceste
lipsesc. ca un procent al numărului procentaje în josul
Exemplu: Din totalul cazurilor, total excluzând datele lipsă. tabelului.
10% au obţinut scorul 56.

IV.3. Histograme.

Histograma este un grafic, folosit în statistica descriptivă şi arată o distribuţie de


frecvenţă. Distribuţia de frecvenţă se referă la numărul de evenimente statistice pe clase
(grupe) de evenimente. Pentru o serie de date statistice cu o distribuţie de frecvenţă după o
variabilă numerică continuă (sau continuă pe porţiuni), reprezentările grafice care ne permit să
vizualizăm distribuţia de frecvenţe sunt histograma şi poligonul frecvenţelor.
Se reiau paşii de la capitolul II.5.

32
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

IV.4. Interpretarea output-ului

Axa verticală arată frecvenţa


cazurilor de la 0 la 3.

Înălţimea barelor arată cât de


frecvent apare fiecare scor la atenţie.

Axa orizontală arată scorurile


diferite ale „Atenţiei”.

*Media scorului la atenţie este 62,7.


*Abaterea standard este 4,99.
*Numărul cazurilor este 10.

IV.5. Modalitatea.

O distribuţie normală (figura 1)


este o distribuţie unimodală, adică există
doar o singură categorie cu frecvenţa
Frecvenţa de apariţie

maximă. Prezenţa a două sau mai multe


valori mod determină distribuţii
bimodale, trimodale, în general
polimodale, distribuţii ce nu pot fi
Înălţimea subiecţilor. considerate ca fiind distribuţii normale.

Figura nr. 1.
O distribuţie similară distribuţiei din
figura 1, este o distribuţie bimodală
(figura 2), deoarece observăm existenţa a
două categorii cu frecvenţa egală şi
maximă.

Figura nr. 2.

33
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Normalitatea distribuţiei, sub aspectul modalităţi, se verifică prin
calcularea valorii modul. Dacă există o singură valoare cu frecvenţa maximă,
atunci distribuţia poate fi considerată normală sub acest aspect. În condiţiile în
care sunt două sau mai multe valori cu frecvenţa maximă şi, evident, egală,
distribuţia este polimodală (multimodală) şi nu poate fi considerată ca fiind
normală.

IV.6. Simetria.

O distribuţie este
simetrică, dacă valorile sunt
egal (simetric) răspândite în
jurul tendinţei centrale. Atunci
când rezultatele tind către valori
mici, sunt aglomerate în partea
stângă a distribuţiei, avem de a

Figura nr. 3 face cu o distribuţie asimetrică

spre dreapta (sau distribuţie skewness pozitiv). Când rezultatele tind către valori
mari, se aglomerează în partea dreaptă a distribuţiei, vorbim despre o distribuţie
asimetrică la stânga (skewness negativ). Cu alte cuvinte putem spune că,
asimetria este dată de panta distribuţiei şi nu de vârful acesteia.

În figura nr. 3, distribuţia „B” este o distribuţie simetrică. Distribuţia „A”


este o distribuţie asimetrică la dreapta (skewness pozitiv) unde predomină
scorurile scăzute (mici), în timp ce distribuţia „C” este o distribuţie asimetrică la
stânga (skewness negativ) în care predomină scorurile mari.

Nu ne putem limita la o apreciere pur vizuală a simetriei; acest lucru necesită


demonstrarea statistică a simetriei sau asimetriei distribuţiei. În acest scop, există mai mulţi
coeficienţi care pot fi calculaţi.

34
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Atunci când discutăm de asimetrie, trebuie să precizăm o serie de relaţii
care apar între indicatorii tendinţei centrale, media, mediana şi modul.

 Într-o distribuţie simetrică, media, mediana şi modul au exact aceleaşi


valori.

Caracteristica acestei distribuţii o


reprezintă coincidenţa absolută a celor
trei indicatori ai tendinţei centrale. După
cum puteţi observa în figura de mai sus,
atât media, cât şi mediana şi modul, se
află în acelaşi punct, la mijlocul
distribuţiei. (Opariuc, 2009, p. 140).

 Într-o distribuţie asimetrică la dreapta (distribuţie skewness pozitiv,


vezi figura alăturată), predomină scorurile mici. În acest caz, modulul este
valoarea situată cel mai la stânga în şirul de date, iar mediana este mai mare
decât media. Evident, mediana fiind valoarea care împarte şirul ordonat de date
în două părţi egale, iar dacă în distribuţie predomină scorurile mici, atunci
scorurile mari sunt considerate ca scoruri extreme. Ştim, de la analiza preciziei
indicatorilor tendinţei centrale, că într-o serie de date în care întâlnim scoruri
extreme mari, media tinde să le pună în valoare. Iată că acest fapt este ilustrat
grafic în figura de mai sus. Observaţi relaţia existentă într-o asemenea
distribuţie: Mo<Me<m. Această relaţie este relaţia caracteristică a unei
distribuţii asimetrice pozitiv (ibidem).

 Într-o distribuţie asimetrică la stânga (distribuţie skewness negativ,


vezi figura alăturată), predomină scorurile mari. În acest caz, modul este
valoarea situată cel mai la dreapta în şirul de date, iar mediana este mai mare
decât media. Evident, mediana fiind valoarea care împarte şirul ordonat de date
în două părţi egale, iar dacă în distribuţie predomină scorurile mari, atunci
scorurile mici sunt considerate ca scoruri extreme.

35
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Ştim, de la analiza preciziei indicatorilor tendinţei centrale, că într-o serie
de date în care întâlnim scoruri extreme
mici, media tinde să le pună în valoare.
Iată că acest fapt este ilustrat grafic în
figura de mai sus în care se observă relaţia
existentă.

Într-o asemenea distribuţie:


Mo>Me>m. Această relaţie este relaţia caracteristică a unei distribuţii
asimetrice negativ. (ibidem).

IV.7. Boltirea (excesul).

Asimetria pe orizontală, presupune, după cum am văzut, o deplasare a


tendinţei centrale spre stânga sau spre dreapta, către scoruri mici sau către
scoruri mari. Dar, aceasta nu este singura asimetrie posibilă. Există şi un fel de
„asimetrie verticală” sau boltire. Termenul folosit generic pentru acest concept
este termenul de kurtosis (din limba greacă, kurtos = „cocoşat”).

Practic, boltirea se referă la aspectul „cocoaşei” distribuţiei rezultatelor.


Cocoaşa poate fi ascuţită şi atunci vorbim de o distribuţie ascuţită sau
leptocurtică, poate fi turtită, distribuţia turtită, plată sau platicurtică sau
normală, distribuţie mezocurtică. O distribuţie normală este întotdeauna o
distribuţie mezocurtică.

În figura alăturată, distribuţia „C” este


o distribuţie leptocurtică, ascuţită. Distribuţia
„B” este o distribuţie platicurtică, turtită, iar
distribuţia „A” este o distribuţie normală sub
aspectul boltirii, sau mezocurtică.

Figura nr. 7 - Ilustrarea tipurilor de aplatizare (după Opariuc, 2009).

36
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Termenul folosit generic pentru acest concept este termenul de kurtosis


(din limba greacă, kurtos = „cocoşat”) şi „indică gradul de extindere pe verticală
a curbelor de distribuţie” (Popa, 2008, p. 73). Practic, boltirea se referă la
aspectul „cocoaşei” distribuţiei rezultatelor.

Cocoaşa poate fi ascuţită şi atunci vorbim de o distribuţie ascuţită sau


leptocurtică, poate fi turtită, distribuţia turtită, plată sau platicurtică sau
normală, distribuţie mezocurtică. O distribuţie normală este întotdeauna o
distribuţie mezokurtică.

În figura de mai sus, distribuţia „C” indicele de apltizare pozitivă indică o


curbă înaltă, leptocurtică. În distribuţia „B”, indicele de apltizare negativă
indică o curbă aplatizată, platicurtică, iar distribuţia „A” este o distribuţie
normală sub aspectul boltirii, sau mezocurtică.

• distribuţie leptocurtică, ascuţită, arată că datele sunt foarte grupate


şi apropiate de medie, lotul de subiecţi având un mare grad de
omogenitate a scorurilor

• O distribuţie platicurtică, plată, este o distribuţie în care rezultatele


sunt foarte împrăştiate faţă de medie şi indică un grad ridicat de
eterogenitate a scorurilor.

La fel ca în cazul indicelui de asimetrie (skewness), cu cât acesta este mai


îndepărtat de valorile +1/-1m cu ctât avem de-a face cu distribuţii cu o abatere
mai accentuată de la aplatizarea normală.

37
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

V. Abaterea standard.
________________________________________________________________________________________________________________

Abaterea standard este un indice care arată cât de mult deviază (diferă)
unele scoruri „în medie” faţă de media setului de scoruri din care acestea fac
parte. (Howitt, Cramer, 2010, p. 90).
Abaterea standard poate fi folosită şi pentru a transforma scoruri pentru
variabile foarte diferite în scoruri Z (sau standard), care sunt uşor de comparat şi
însumat.
Abaterea patratică medie este radacina patrată din media aritmetică a

pătratelor abaterilor valorilor observate în raport cu media lor aritmetică 22


σx.
Ea măsoară modul în care rezultatele se împrăştie în jurul mediei, valorile mari
indicând un grad mare de împrăştiere. Cu alte cuvinte, abaterea standard este un
indicator care ne arată în ce măsură modelul statistic se potriveşte cu modelul
real (Opariuc, 2009, p. 129).
Calcularea abaterii standard şi a scorurilor Z este prezentată în exemplul
următor:

Vârstă 20 22 25 26 35 38 28 24 23 24

V.1. Introducerea datelor.

Pasul 1:

În „Variable View” din


„Data Editor” se denumeşte
prima coloană „Vârsta”.

Se înlătură cele două zecimale.

22
Petruş, Al., 2005 – Introducere în statstica socială, Editura Paralela 45, Piteşti, p. 52

38
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 2:
În „Data View” din „Data Editor”
se introduc vârstele în prima
coloană.

Pasul 3:
Se selectează:
„Analyze”
„Descriptive Statistics”
„Descriptives…”

Pasul 4:
Se selectează „vârsta” şi apoi se
apasănbutonul ► pentru a o i
ntroduce în lista de variabile.

Se selectează „Options…”

Pasul 5:

Se deselectează „Mean”,
„Minimum”, „Maximum”.

Se selectează „Continue”.

Se selectează „OK” din


ecranul precedent care
reapare.

39
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

V. 2. Interpretarea output-ului.

Descriptive Statistics

N Std. Deviation
Numărul 10 reprezintă numărul de cazuri. varsta 10 5,740
Abaterea standard pentru vârstă este de Valid N (listwise) 10
5,740.

Abaterile mici, indică faptul că valorile sunt uşor distanţate de medie, în timp ce abaterile
mari, arată că datele sunt distanţate, împrăştiate în jurul mediei, care, nu mai este
reprezentativă. Abaterea standard se exprimă în aceleaşi unităţi de măsură ca şi media
Proprietăţile abaterii standard (Popa, 2008, p. 70):
- dacă se adaugă /scade o constntă la fiecare valoare a unei distribuţii, abaterea standard
nu este afectată;
- dacă se multiplică/divide fiecare valoarea a unei distribuţii cu o constantă, abaterea
stabdard se multiplică/divide cu acea constantă.
Abaterea standard nu poate fi calculată decât atunci când sunt date numerice. Ea nu se
calculează dacă sunt folosite variabile nominale (categoriale).

V.3. Scorurile Z

Pasul 1:
La pasul 4 selectaţi „Save
standardized values as variables”.

Se apasă „OK”.

Pasul 2:

Scorurile Z sau standard


sunt în a doua coloană din
„Data View” în „Data Editor”
şi sunt numite „ZVârstă”.

40
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

V.4. Raportarea output-ului.

Abaterea standard pentru o variabilă este uşor de menţionat în textul


raportului: „A fost determinată abaterea standard a vârstei ca fiind 5,74 ani (N=
10)”.
*Este posibil ca abaterea standard să fie înregistrată împreună cu alte statistici, cum ar
fi media, rangul, etc.
Notele „z” reprezintă diferenţa dintre scorul observat şi medie, în
termeni de abatere standard. Cu alte cuvinte, notele „z” nu sunt altceva decât
distanţele la care se situează scorurile particulare în raport cu media grupului iar
această distanţă este exprimată standardizat.

Teoretic, notele „z” sunt note obţinute pe o „curbă” cu media 0 şi abaterea


standard 1. În acest caz, o distribuţie normală are practic notele „z” cuprinse
între -3 şi +3, între aceste note regăsindu-se peste 99% din populaţie, după cum
observaţi în figura de mai jos.

Notele „z” au şi ele o serie de proprietăţi cu aplicabilitate practică


deosebită, dintre care menţionăm (Popa, 2006):

• Media unei distribuţii „z” este egală cu zero, afirmaţie ce rezultă din
proprietatea acestui indicator de a se diminua atunci când scădem o
constantă din fiecare scor particular. Deoarece din formulă rezultă această
diferenţă (se scade fiecare scor particular din medie), în final media va
ajunge la valoarea zero

• Abaterea standard a unei distribuţii „z” este întotdeauna 1. Şi această


afirmaţie rezultă din proprietăţile abaterii standard. Ştim că dacă împărţim
abaterea standard cu o constantă, valoarea acesteia se divide corespunzător.
Din formulă, observăm că acea constantă cu la care împărţim este chiar
abaterea standard iar împărţirea a două numere egale are ca rezultat 1.

41
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Notele „z” sunt note direct calculabile, utilizându-se media şi abaterea


standard şi reprezintă „temelia” oricărui proces de standardizare. Totuşi,
principalul dezavantaj al notelor „z” este acela că sunt puţin intuitive. Trebuie să
ştim bine ce înseamnă distribuţia normală pentru a înţelege corect semnificaţia
acestor note. În plus, au valori pozitive şi negative, ceea ce le face, iarăşi, greu
de utilizat.

V.5. Alte caracteristici.

În meniul „Descriptives Statistics sunt conţinute mai multe calcule


statistice care pot fi selectate:
 Mean (media);
 Sum (suma);
 Standard deviation (estimate) (abaterea standard);
 Range (amplitudinea);
 Minimim;
 Maximum;
 Kurtosis;
 Skewness.
* Aceste concepte sunt explicate pe scurt la sfârşitul capitolului 3.

42
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

VI. Relaţiile dintre două sau mai multe variabile.


Diagrame şi tabele.
________________________________________________________________________________________________________________

În foarte multe cercetări se studiază relaţiile dintre două sau mai multe
variabile. Procedurile statistice univariate (cu o singura variabilă) care au fost
descrise până acum pot fi utilizate pentru analiza oricăror date. Dar, cercetarea
poate necesita ca relaţiile şi corelaţiile dintre diferitele variabile să fie studiate.
La fel ca statistica univariată, statistica bivariată a datelor necesită
studierea tendinţelor fundamentale ale datelor utilizând tabele şi diagrame.
Modelele de prezentare a relaţiilor bivariate includ crearea tabelelor scatter.
O condiţie esenţială o constituie etichetarea tabelelor şi diagramelor şi
denumirea acestora.
În continuare se va ilustra elaborarea unui tabel de asociere şi a unei
diagrame cu bare.

VI.1. Introducerea datelor.

În studiu sunt introduşi 11 copii instituţionalizaţi şi 9 copii


neinstituţionalizaţi. Dintre aceştia 9 au fost fete şi 11 au fost băieţi.

Pasul 1:
În „Variable View” din „Data Editor” se denumeşte:
- prima coloană „Instituţionalizare”
- a doua coloană „Genul biologic”;
- A treia coloană „Frecvenţa”.

Se înlătură cele două zecimale.

43
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 2:

Se etichetează cele două valori


ale instituţionalizării:
1 - instituţionalizat;
2 - neinstituţionalizat.
Şi genul biologic:
1. Feminin;
2. Masculin
*Paşii acestei proceduri au fost explicaţi în capitolul 1.

Pasul 3:
Se introduc aceste numere în „Data
View” din „Data Editor”.
Primul rând se referă la fetele care
au fost instituţionalizate: sunt în număr
de 5.
Al doilea rând se referă la băieţii
care au fost instituţionalizaţi:
sunt în număr de 6.
Al treilea rând se referă la fetele neinstituţionalizate: sunt în număr de 4.
Al patrulea rând se referă la băieţii
neinstituţionalizaţi: sunt în număr de 5.

VI.2. Ponderea datelor

Pasul 4:

Pentru a pondera datele cu scopul


ca cele patru celule să conţină
numărul de cazuri corespunzător,
se selectează:
„Data”
„Weight Cases…”

Pasul 5:

Se selectează „Frecvenţa”,
„Weight cases by” şi apoi se
apasă butonul ►pentru
transfer în căsuţa
variabilei„Frequency
Variable”.Se apasă „OK”

44
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

VI.3. Crearea tabelelor de asociere (Crosstabs).

Pasul 6:

Se selectează:
„Analize”
„Descriptivesc statistics”
„Crosstabs…”.

Pasul 7:
Pentru a pune „instituţionalizare”
pe rândurile tabelului, se selectează
şi apoi se apasă butonul ►de lângă
eticheta „Row(s)”.

Pentru a pune „genul biologic” pe


coloanele tabelului, se selectează
şi apoi se apasă butonul ► de lângă
eticheta „Column(s).

Se apasă „OK”.

*Pentru afişarea frecvenţelor ca procentaj se accesează cells – percentages – se selectează, în


funcţie de preferinţe, rown, column sau total.(Howitt, Cramer, 2010, p. 107)

Pasul 8:

În tabel sunt
prezentate valorile
celor două variabile.
Se observă că sunt 5
fete şi 6 băieţi
instituţionalizaţi (în total 11) şi 4 fete şi 5 băieţi neinstituţionalizaţi (în total 9).
(N=20).

*Tabelul de asociere este folosit pentru prezentarea relaţiilor dintre două variabile
categoriale. În fiecare celulă a tabelului este prezentată frecvenţa parţială (adică efectivul care
poartă simultan o valoare a fiecărei variabile).
Observaţie:
1. Dacă într-un crosstabs numărul categoriilor unei variabile este mai mare decât al
alteia, atunci categoriile acelei variabile se plasează pe rânduri.
2. O celulă din crosstabs oferă informaţia despre intersecţia celor două variabile. Pentru
aceasta alegem din fereastra Crosstabs butonul de comandă Cell ce are ca efect
afişarea ferestrei Crosstabs Cell Display.

45
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

VII. Coeficienţi de corelaţie.


Coeficienţi de corelaţie Pearson şi Spearman.
_________________________________________________________________________________________________________________

Corelaţia este o metodă statistică utilizată pentru a determina relaţiile


dintre două sau mai multe variabile. Există mai multe tipuri de corelaţii atât
parametrice cât şi neparametrice.
Coeficientul de corelaţie este un indice numeric care precizează puterea şi
direcţia unei relaţii dintre două variabile. (Howitt, Cramer, 2010, p. 111).
Este o valoare cantitativă ce descrie relaţia dintre două sau mai multe
variabile. El variază între (-1 si +1), unde valorile extreme presupun o relaţie
perfectă între variabile în timp ce 0 înseamnă o lipsa totala de relaţie liniară. O
interpretare mai adecvată a valorilor obţinute se face prin compararea
rezultatului obţinut cu anumite valori prestabilite în tabele de corelaţii în funcţie
de numărul de subiecţi, tipul de legătură şi pragul de semnificaţie dorit.
Cel mai comun şi cel mai folositor este coeficientul de corelaţie Pearson
şi coeficientul de corelaţie Spearman.
Corelaţia Pearson (r) evaluează gradul de asociere dintre două variabile
măsurate pe scală de interval/raport. Aceasta se referă la intensitatea şi sensul de
variaţie concomitentă a valorilor unei variabile în raport cu cealaltă, după un
model de tip liniar. Dacă valorile unei variabile urmează, în sens direct,
crescător, sau invers, descrescător, valorile celeilalte variabile, atunci cele două
variabile corelează între ele. Domeniul de variaţie a coeficientului de corelaţie
Pearson(r) este între r = -1 (corelaţie perfectă negativă: ceea ce înseamnă că în
timp ce scorurile unei variabile cresc, scorurile pentru cealaltă variabilă
descresc) şi r = +1 (corelaţie perfectă pozitivă: ceea ce înseamnă că scorurile
unei variabile se măresc odată cu creşterea scorurilor celeilalte variabile).
Absenţa oricărei legături (corelaţii) dintre variabile se traduce prin r =0.
O corelaţie de 1,00 indică o asociere perfectă între cele două variabile. Cu
alte cuvinte, o diagramă scatter a celor două variabile va arăta că toate punctele
sunt conţinute de o singură dreaptă. O valoare de 0,00 indică faptul că toate

46
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
punctele din diagrama scatter sunt dispersate aleatoriu în jurul oricărei drepte
desenate pe această diagramă a datelor sau sunt aranjate într-o manieră
curbilinie. (Howitt, Cramer, 2010, p. 111).
Coeficienţii de corelaţie neparametrici
- Se utilizează atunci când una dintre variabilele folosite nu îndeplineşte
condiţiile unei distribuţii normale. După Opariuc (2011), datele care se
află la un nivel de interval sau de raport, pot fi convertite uşor în ranguri
sau în frecvenţe (la nivel ordinal sau nominal) dar această situaţie nu este
posibilă şi în sens invers.
În cazul corelaţiei există trei elemente esenţiale în interpretarea unui
coeficient de corelaţie: sensul, valoarea şi semnificaţia. (Opariuc, 2011, p. 102).
O corelaţie pozitivă semnifică faptul că, cele două variabile evoluează în aceaşi
direcţie în timp ce o corelaţie negativă indică faptul că, în timp ce o variabilă
creşte, cealaltă variabilă scade.

În continuare vom ilustra calculul corelaţiei Pearson, o diagramă scatter


şi coeficientul de corelaţie Spearman, folosind pentru aceasta datele din tabelul
următor, care reprezintă scoruri ale abilităţilor muzicale şi matematice pentru 10
copii.
muzica 3 7 8 9 9 6 4 3 4 7
matematică 7 5 4 4 5 8 9 9 7 6

VII.1. Introducerea datelor.

Pasul 1:
În „Variable „View” din „Data
Editor” se denumeşte primul
rând „muzică”
şi al doilea rând „matematică”.
* Se înlătură cele două zecimale.

47
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 2:

În „Data View” din „Data editor”


se introduc datele pentru:
- muzică în prima coloană;
- matematică în a doua coloană.

VII.2. Corelaţia Pearson.

Pentru a putea calcula coeficientul de corelaţie Pearson, eşantionul trebuie să fie


aleatoriu, iar cele două variabile (ambele măsurate pe scale de interval/raport) să aibă o
distribuţie care să nu se abată grav de la distribuţia normală. (Popa, 2008, p. 160).

Pasul 1:

Se selectează:
„Analyze”,
„Corelate”,
„Bivariate…”

Pasul 2:
Se selectează „Muzică” şi
„Matematică” şi apoi se apasă
butonul ►pentru a le introduce
în lista de variabile aşa cum este
arătat în figura din dreapta.

Se apasă „OK”.

VII.3. Interpretarea output-ului.


Corelaţia dintre
„matematică” şi „muzică”
este - 0,845 La un test de
semnificaţie, two-tailed la
nivelul de probabilitate 0,01
sau mai mic, corelaţia este
statistic semnificativă
Numărul cazurilor pe care
este bazată corelaţia este 10. Informaţia apare şi în această celulă.
*One tailed – dacă distribuţia este unidirecţională.
Two-tailed – dacă distribuţia este bidirecţională.

48
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

VII.4. Raportarea output-ului.

 Corelaţia dintre abilităţile muzicale şi cele matematice este – 0,845.


* Se obişnuieşte să se rotunjească corelaţia cu două zecimale, deci aceasta va deveni 0,90,
acesta fiind un rezultat mult mai precis pentru majoritatea măsurătorilor psihologice.
 Nivelul de semnificaţie exact, cu trei zecimale, este 0,002. Înseamnă că
nivelul de semnificaţie este mai mic decât 0,01.
 Interpretarea psihologică va fi: „Există o relaţie negativă semnificativă între
abilităţile muzicale şi cele matematice , ceea ce înseamnă că, copii cu nivel
ridicat al abilităţilor muzicale au un nivel scăzut al abilităţii matematice”.

Un coeficient de corelație poate fi calculat corect numai când datele ambelor variabile
se referă la eșantioane și fiecare este ales independent.
Coeficientul de corelaţie Pearson evaluează asocierea dintre două variabile cantitative
iar domeniul de variaţie al acestuia este cuprins între -1 (corelaţie puternic negativă) şi +1
(corelaţie puternic pozitivă).
Un coeficient de corelatie poate fi apropiat de 1, deci ne va indica o corelație puternică,
dar ea poate fi nesemnificativă din cauza volumului mic a eșantionului studiat.
Eșantionul reprezintă un subset de elemente selectate dintr-o colectivitate statistică.
Eşantionul reprezintă „unităţile de informaţie selecţionate pentru a fi efectiv studiate” (Popa,
2008, p. 38). „Calitatea unui eşantion de a permite extinderea concluziilor la întreaga
populaţie din care a fost extras se numeste reprezentativitate” (Popa, 2008, p. 39).
După Rotariu (2006), reprezentativitatea este „capacitatea eşantionului de a reproduce cât
mai fidel structurile şi caracteristicile populaţiei din care a fost extras”.
Gradul de reprezentativitate al unui esantion depinde de:
- caracteristicile populaţiei;
- mărimea eşantionului;
- procedura de eşantionare folosită.
Corelația nu trebuie identificată cu cauzalitatea, în sensul că, observațiile a 2 variabile
se pot corela foarte bine fără să avem motive logice și știintifice că una dintre variabile poate
fi cauza celeilalte.
Semnul (+/-) indică sesnul asocierii dintre cele două variabile. O valoarea pozitivă
arată că, pe măsură ce valorile unei variabile cresc, valorile celeilalte variabile cresc şi ele. O
valorea negativă arată că, pe măsură ce valorile unei variabile cred, valorile ceilalte variabile
scad (Popa, 2008, p. 309).
Testul de corelaţie Pearson implică două măsuri pentru aceeaşi subiecţi. Acest model
se întâlneşte şi atunci când se aplică Testul t pentru eşantioane perechi, iar utilizarea uneia
dintre cele două teste este dată de problema cercetării:
- Dacă se testează diferenţa dintre mediile variabilelor, măsurate în două moment
diferite, se utlizează testul t;
- Dacă se testează asocierea dintre variabile diferite, măsurate pe aceeaşi subiecţi, atunci
se foloseşte testul de corelaţie.

49
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Condiţia principală pentru calcularea coeficientului de corelaţie liniară Pearson este ca


variabilele implicate să fie măsurate pe scală interval/raport, iar distribuţia să nu se abată de la
curba normală.

*Coeficientul de corelaţie Pearson poate fi folosit atunci când cercetătorul doreşte să


afle măsura în care o variabilă se află în relaţie cu alta. (Howitt, Cramer, 2010, p.114).

Ca o concluzie, se poate spune că, corficientul de corelaţie Pearson, testează


intensitatea asocierii dintre două variabile măsurate pe aceeaşi subiecţi, în condiţii diferite sau
cu instrumente diferite. Acesta, nu este un indicator al relaţiei cauzale, ci al variaţiei
concomitente a valorilor variabilelor testate.

VII.5. Coeficientul de corelaţie Spearman.

Pasul 1:
Identic corelaţiei Pearson se
selectează „Analyze”, „Correlate”,
„Bivariate” şi variabilele care se
doresc pentru corelaţie.
Se selectează „Spearman” şi se
deselectează Pearson (dacă nu se
doreşte ca şi corelaţie).

Se apasă „OK”.

*Testul de corelaţie a rangurilor, Spearman, este echivalentul pentru date ordinale al testului
de corelaţie Pearson.

50
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

VII.6. Interpretarea output-ului.

Coeficientul de corelaţie Spearman Numărul cazurilor este 10.


între muzică şi matematică este – 0,842.
Nivelul de semnificaţie este 0,001 sau
mai mic, deci corelaţia este statistic
semnificativă.

VII.7. Raportarea output-ului.


 Corelaţia raportată cu două zecimale este – 0,84.
 Interpretarea psihologică va fi: „Există o corelaţie negativă semnificativă
între abilităţile muzicale şi cele matematice, ceea ce semnifică faptul că, cei cu
un nivel ridicat al abilităţii muzicale au abilităţi matematice scăzute şi
viceversa”.
• Coeficientul de corelație al rangurilor (Spearman) testeaza gradul de corelare între 2
variabile calitative; este alternativa neparametrică a “coeficientului de corelație Pearson”.
• Acest coeficient variază între -1 si +1. O valoare apropiată de +1, înseamnă că suma
pătratelor diferențelor este aproape nulă, deci avem clasamente identice.
• O valoare apropiată de 0, înseamnă necorelarea variabilelor, iar valoarea apropiată de -1
pune în evidență discordanța maximă a variabilelor.

VII.8. Diagrama scatter.

Pasul 1:
Se selectează:
„Graphs”
„Legacy Dialogs”
„Scatter Dot”

Pasul 2:

Se selectează „define”
din moment ce „simple”
este deja selectat.

51
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 3:

Pentru a avea variabila


„muzică” ca axă verticală,
se selectează şi apoi se
apasă butonul ►de lângă
căsuţa „Y Axis”

Pentru a avea variabila


„matematică” ca axă
orizontală, se selectează
apoi se apasă butonul ◄ de
lângă căsuţa „X Axis”.

Se apasă „OK”.

VII.9. Interpretarea output-ului.

În diagrama scatter, răspândirea punctelor


este relativ îngustă, ceea ce indică o
corelaţie mare.
Forma împrăştierii rezultatelor este relativ
în linie dreaptă, indicând mai degrabă o
relaţie în linie dreaptă decât o relaţie
curbilinie.
Linia este de la colţul stânga sus până în
dreapta jos, ceea ce indică o corelaţie
negativă.

*Dacă relaţia este curbilinie atunci corelaţiile Pearson şi Spearman pot fi înşelătoare.

VII.10. Raportarea output-ului.

Despre diagrama scatter s-ar putea scrie următoarele afirmaţii: „ A fost


examinată o diagramă scatter pentru relaţia dintre abilităţile muzicale şi
matematice. Nu există nicio dovadă privind o relaţie curbilinie sau asupra
influenţei avute de rezultatele atipice”.

52
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Coeficientul de corelaţie pentru date ordinale (Spearman) se utiliuzează atunci când
(Popa, 2008):
- ambele variabile sunt de tip ordinal;
- una dintre variabile este de tip ordinal şi cealaltă este de tip interval/raport;
- Ambele variabile sunt de tip interval/raport, dar una sau ambele prezintă valori
extreme.
- variabilele sunt măsurate pe scale de interval sau de raport, dar distribuţia uneia sau a
ambelor se îndepărtează grav de la forma normală.
Spearman este un coeficient care se bazează pe ranguri şi reprezentativitatea mediei nu
are influenţă asupra lui. Coeficientul se utilizează de regulă atunci când lotul de cercetare este
sub 30 de cazuri. Acest coeficient transformă scorurile originale în ranguri şi analizează
relaţia dintre acestea.
Coeficientul de corelaţie a rangurilor Spearman este „un coeficient de corelaţie
direcţional şi poate avea valori cuprinse între -1 şi -1” (Opariuc, 2011, p. 24-25).
Dacă se obţin valori apropiate de +1 atunci înseamnă că există o asociere pozitivă între
cele două variabile. Dacă se obţin valori apropiate de -1 atunci există o asociere negativă. În
situaţiile în care valoarea coeficientului de corelaţie se apropie mai mult de zero, varibilele nu
se corelează, adică, nu au nicio legătură între ele.

53
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

VIII. Regresia.
Predicţia cu precizie.
_________________________________________________________________________________________________________________

Dacă există o relaţie între două variabile atunci sunt posibile estimarea
sau predicţia scorului unei persoane la o variabilă pornind de la scorul obţinut la
cealaltă variabilă. Cu cât este mai puternică corelaţia cu atât este mai bună
predicţia. Variabila independentă este variabila folosită pentru a realiza
predicţia, aceasta fiind cunoscută şi ca variabilă predictor sau variabila X.
*Este foarte important a nu se confunda variabila independentă cu cea dependentă. Cel
mai bun mod de a evita aceste probleme este de a examina scatterplot-ul sau diagrama scatter
a relaţiei dintre cele două variabile. Axa orizontală X este variabila independentă şi axa
verticala Y este variabila dependentă. Se poate investiga şi punctul de tăiere, acesta fiind
punctul în care panta se intersectează cu axa verticală.
Regresia devine o tehnică mult mai importantă atunci când sunt folosite
mai multe variabile pentru predicţia valorilor unei alte variabile.
În continuare este ilustrată procesarea unei regresii simple şi a unei
diagrame de regresie folosind datele din tabelul următor.
Scor muzica 3 7 8 9 9 6 4 3 4 7
Scor 7 5 4 4 5 8 9 9 7 6
matematică

Unul din principalele capitole ale statisticii are în vedere posibilitatea de a face
predicții. Deși nu se găsesc relații perfecte în lumea reală, prin intermediul regresiei se pot
face predicții ale unei variabile, în funcție de valoarea alteia. Predicția este procesul de
estimare a valorii unei variabile cunoscând valoarea unei alte variabile.
Regresia se leagă foarte mult de conceptul de corelație. O asociere puternică între
două elemente conduce la creșterea preciziei predicției unei variabile pe seama alteia. Dacă
am avea o corelație perfectă (+1 sau –1) estimarea ar fi extrem de precisă.

VIII.1. Introducerea datelor.


Pasul 1:
În „Variable „View” din „Data
Editor” se denumeşte primul
rând „muzică”
şi al doilea rând „matematică”.
* Se înlătură cele două zecimale.

54
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 2:

În „Data View” din „Data editor” se


introduc datele pentru:
- muzică în prima coloană;
- matematică în a doua coloană.

VIII.2. Regresia simplă.

Pasul 1:
Se selectează:
„Analyze”
„Regression”
„Linear…”

Pasul 2:

Se selectează „Muzică” şi apoi


se apasă butonul ► de lângă
eticheta „Dependent”, pentru a
introduce această variabilă în
căsuţa variabilei dependente.

Se selectează „matematica”
şi apoi se apasă butonul ◄ de
lângă eticheta „Independent(s)
pentru a introduce această
variabilă în căsuţa variabilei
(lor) independente.
Se selectează „Statistics…”

Pasul 3:

Se selectează „Confidence Intervals”.

Se selectează „Continue”.
Se apasă „OK” din ecranul precedent
care reapare.

55
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

VIII.3. Interpretarea output-ului.


Acest tabel conţine datele esenţiale pentru analiza regresiei.
Constanta este 12,716. Acesta este punctul în care linia de regresie
intersectează axa verticală.

Coeficientul nestandardizat Coeficientul standardizat Intervalul de


al regresiei este – 1,049. al regresiei este – 0,845. încredere ia valori
Acesta semnifică faptul că, Acesta este mai mult sau de la -1,591 la -0,507.
pentru fiecare creştere cu 1 mai puţin coeficientul de
a variabilei “matematică” corelaţie Pearson dintre
valoarea variabilei “muzică” abilităţile muzicale şi
descreşte cu – 1,049. cele matematice.
 În acest tabel, B este panta liniei de regresie (în SPSS fiind denumită
coeficient de regresie nestandardizat).
 Intervalul de încredere de 95% pentru aceşti coeficienţi este de la -1,59 la -
0,50. Intervalul de încredere de 95% arată intervalul pantelor de regresie în care
putem fi siguri într-o proporţie de 95% că panta pentru populaţie se va găsi.
 Cota denumită „Beta” are valoarea -0,845. Aceasta este de fapt corelaţia
Pearson între cele două variabile.
Regresia simplă - o variabila dependentă și una independentă

VIII.4. Scatterplot-ul de regresie.


Atunci când se realizează o regresie este recomandabilă cercetarea
diagramei scatter pentru cele două variabile.

Pasul 1:
Se selectează:
„Graphs”
„Legacy Dialog”
„Scatter/Dot”

Pasul 2:

Se selectează „define”; „simple” este deja selectat.

56
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 3:

Pentru a avea variabila


„muzică” ca axă verticală, se
selectează şi apoi se apasă
butonul ►de lângă căsuţa „Y
Axis”

Pentru a avea variabila


„matematică” ca axă
orizontală, se selectează apoi
se apasă butonul ◄ de lângă
căsuţa „X Axis”.
Se apasă „OK”

Pasul 4:

Pentru a încadra o linie de


regresie în scatterplot, se dă
dublu clic oriunde în interior şi
se va deschide „Chart Editor”.

Se selectează „Elements” şi
„Fit Line at Total”.

VIII.5. Interpretarea output-ului.

Punctele de pe scatterplot sunt apropiate de linia de regresie. În plus,


punctele par să formeze o linie dreaptă (relaţia nu este curbilinie).
În regresie, axa verticală este
variabila-criteriu sau
dependentă (în cazul nostru =
muzica).

Linia de regresie are o pantă


negativă în acest caz; de
exemplu: de la stânga sus spre
dreapta jos. În consecinţă B are
valoare negativă.

57
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
În regresie axa orizontală este variabila predictor sau independentă (în
cazul nostru „matematică”).

* Linia de regresie oblică, de la stânga sus spre dreapta jos, indică o relaţie negativă între cele
două variabile.

Punctele par relativ apropiate de line, ceea ce sugerează că beta (corelaţia)


ar trebui sa fie un număr mare (negativ) şi că intervalul de încredere este relativ
mic.
*Regresia liniară - relația dintre cele două variabile poate fi descrisă printr-o dreaptă în cadrul
norului de puncte.

VIIII.6. Raportarea output-ului.

Interpretarea diagramei se poate realiza în felul următor:


„Diagrama scatterplot a relaţiei dintre abilităţile matematice şi muzicale
sugerează o relaţie liniară negativă între cele două variabile. Este posibilă
predicţia cu acurateţe a abilităţii muzicale a unei persoane cunoscând abilitatea
sa matematică.

58
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

IX. Eroarea standard


_________________________________________________________________________________________________________________

Eroarea standard este un indice pentru variabilitatea mediilor mai multor


eşantioane extrase din populaţie; cu alte cuvinte este media măsurii cu care
media eşantioanelor diferă faţă de media populaţiei din care au fost extrase.
Eroarea standard poate fi folosită ca un pas intermediar în alte tehnici
statistice, cum ar fi Testul t şi este un concept important pentru calculul
intervalelor de încredere.
Calcularea erorii standard estimate pentru medie este ilustrată cu un set
de şase scoruri ale stimei de sine, prezentate în tabelul următor.

Stima de sine 5 7 3 6 4 5

IX. 1. Introducerea datelor.

Pasul 1:
Se introduc datele în „Data Editor”.
Se etichetează variabila „Stima”.

IX. 2. Eroarea standard estimată a mediei.

Pasul 1:
Se selectează:
„Analyze”
„Descriptive Statistics”
„Descriptive…”

În testul erorii standard al mediei, se presupune că sunt îndeplinite condiţiile care


asigură mediei de sondaj o repartiţie normală (eşantion n ≥ 30) sau aproape normală. De aceea
variabila aleatoare z urmează o distribuţie normală standard (z este variabila normală
normată).

59
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 2:

Se selectează „stima de sine” şi apoi


se apasă butonul ◄pentru a
introduce variabila „Stima de sine”
în „variable(s)”.
Se selectează „Options…”

Pasul 3:

Se selectează „ S-E mean”.

Se selectează „continue”.

Se apasă „OK” din ecranul anterior care reapare.

IX. 3. Interpretarea output-ului.

Eroarea standard (estimată) pentru medie a acestui eşantion este 0,577.


este o indicaţie a mediei cu care mediile eşantioanelor diferă de media populaţiei
din care au fost extrase.

 testul oferă valoarea erorii standard a mediilor eşantioanelor ca fiind 0,58


(suma este rotunjită la două zecimale) aceasta fiind valoarea medie cu care
mediile eşantioanelor (N=6) diferă faţă de media populaţiei.
 tabelul include şi alte informaţii cum ar fi media (5,00), abaterea standard
estimată a populaţiei bazată pe acest eşantion, valorile minime şi maxime ale
datelor.
 ultima coloană oferă abaterea standard (estimată) a celor şase scopuri, care
este 1,41.

60
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

X. Testul t.
Compararea a două eşantioane
de scopuri corelate/relaţionate.
_________________________________________________________________________________________________________________

Testul t pentru eşantioane pereche se foloseşte atunci când „există un


singur grup de participanţi care a fost măsurat de două ori – în două momente
diferite”. (Howitt, Cramer, 2010, p.114).
Testul t este folosit pentru evaluarea semnificaţiei statistice a diferenţei
dintre mediile pentru două seturi de scoruri. Cu ajutorul testului t se pune în
evidenţă dacă valoarea medie pentru un set de scoruri diferă în medie de
valoarea medie pentru alt set de scoruri.
Testul t are două variante:
1. prima variantă este folosită atunci când cele două seturi de scoruri ce
trebuie comparate provin dintr-un singur eşantion sau când coeficientul de
corelaţie între cele două seturi este mare – testul t pentru eşantioane
perechi;
2. a doua variantă a testului t este utilizată în momentul în care două seturi
diferite de valori provin din grupe diferite de participanţi. – testul t pentru
eşantioane independente.
* Testul t pentru eşantioane perechi este optim dacă distribuţia diferenţelor dintre
cele două seturi de valori se prezintă (aproximativ) sub formă de clopot (atunci când
distribuţia este normală). Dacă distribuţia este foarte diferită de forma de clopot ar trebui luată
în considerare utilizarea unei tehnici statistice relaţionate nonparametrică pentru eşantioane
perechi, cum ar fi testul de perechi Wilcoxon.
Procesarea unui Test t este ilustrată cu datele din tabelul următor unde
sunt prezentate numărul de cuvinte pe care aceeaşi copii le-au verbalizat cu
mamele lor la 18 luni şi la 24 luni.
Numărul de cuvinte verbalizate într-un minut la vârste diferite.

Alina Cristina Raluca Carmen Simona Radu Cristi Dan


18 luni 3 2 4 5 2 3 2 4
24 luni 5 4 7 8 3 4 4 6

61
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

X.1. Introducerea datelor.

Pasul 1:
În „Variable View” din „Data
Editor” se etichetează primul rând cu
„optsprezece” şi al doilea rând cu
„douăzeci şi patru”.
* Se înlătură cele două zecimale.

Pasul 2:

În „Data View” din „Data Editor”


se introduc datele în primele două
coloane.

X.2. Testul t pentru eşantioane perechi

Pasul 1:

Se selectează:
„Analyze”
„Compare Means”
„Paired-Samples T Test…”

Pasul 2:
Se selectează „optsprezece”
şi se pune această variabilă
lângă eticheta „Variable1”
sub „Curent Selections”.
Se selectează „douăzeci şi
patru” şi se pune această
variabilă lângă eticheta
„Variable2” sub „Curent
Selections”.
Se apasă butonul ►pentru a
pune aceste două variabile
în lista variabilelor relaţionale.
Se apasă „OK”.

62
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

X.3. Interpretarea output-ului.

Primul tabel arată media, numărul de cazuri şi abaterea standard


pentru cele două grupuri. Media pentru „optsprezece” este 3,13 şi abaterea
standard este 1,126.

Al doilea tabel arată gradul în care cele două seturi de valori sunt corelate.
Corelaţia dintre ele 0,94. Aceasta este o corelaţie mare, nivelul de semnificaţie
fiind de 0,00.
Primele trei coloane care conţin cifre sunt componentele fundamentale ale
calcului unui Test t relaţionat. Media de -2,000 este de fapt diferenţa dintre
mediile pe 18 şi 24 luni, deci în realitate este media diferenţei. Valoarea lui t
este bazată pe această medie a diferenţei (-2,00), divizată cu eroarea standard a
mediei (0,267). Calculul oferă valoarea lui t (-7,483).

X.4. Raportarea output-ului.

Rezultatele obţinute ar putea fi prezentate astfel: „Media numărului de


cuvinte verbalizate la 18 luni diferă semnificativ de media cuvintelor verbalizate
la 24 de luni”.

63
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XI. Testul t.
Compararea a două eşantioane de
scoruri necorelate/nerelaţionate.
_________________________________________________________________________________________________________________

Atunci cînd o investigaţie de tip statistic se efectuează pe un eşantion,


orice rezultat obţinut are o valoare relativă, în sensul că datele respective nu
numai că nu coincid cu cele referitoare la populaţie, dar nici măcar nu se poate
şti cu certitudine care este diferenţa dintre cele două genuri de date, de vreme ce
starea populaţiei este, de regulă, necunoscută. Teoria matematică a
probabilităţilor oferă însă proceduri pentru evaluarea rezultatelor studiilor
selective, permiţînd o estimare, în termeni de probabilitate, a marjei maxime de
eroare ce se poate comite prin utilizarea mărimilor din eşantion în locul celor
care caracterizează populaţia.
Testul t pentru eşantioane necorelate sau independente este utilizat
pentru „a calcula dacă mediile a două seturi de scoruri diferă semnificativ între
ele iar semnificaţia statistică indică faptul că cele două eşantioane diferă într-o
măsură suficient de mare pentru ca diferenţa să nu se datoreze factorilor aleatori
apăruţi în urma eşantionării”. (Howitt, Cramer, 2010, p.149). El este utilizat
atunci când cele două seturi de scoruri provin din două eşantioane diferite.
Ca urmare, el este potrivit atunci când variabila dependentă este
măsurată pe scală cantitativă (interval-raport). Distribuţia teoretică de referinţă
(distribuţia de nul) este cea normală, pentru eşantioane mai mari de 30 de
subiecţi, şi distribuţia t (Student), pentru eşantioane mai mici de 30 de subiecţi.
Chiar dacă formulele de calcul sunt diferite, forma de prezentare a rezultatelor şi
ra ţionamentul decizional sunt similare pentru ambele situaţii.
Testul t pentru eşantioane independente este utilizat pentru a calcula
dacă mediile pentru două seturi de variabile sunt diferite semnificativ una faţă de
cealaltă.
* Testul t pentru eşantioane independente nu se foloseşte atunci când se doreşte
compararea a mai mult de două eşantioane. Dacă sunt trei sau mai multe grupuri de
participanţi, atunci se foloseşte ANOVA. (Howitt, Cramer, 2010, p.151).

64
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Testul t pentru eşantioane independente este utilizat atunci când cele
două seturi de variabile provin din două eşantioane diferite de oameni.
Procesarea unui Test t pentru eşantioane independente este ilustrată cu
datele din tabelul următorcare arată valorile la un test de emotivitate pentru 10
copii care provin din familii biparentale şi 10 copii care provin din familii
monoparentale. Scopul analizei este de a aprecia dacă valorile emotivităţii sunt
diferite la copii care provin din familii cu doi părinţi faţă de copii care provin
din familii monoparentale.
Familii 12 18 14 10 19 8 15 11 10 13
biparentale
monoparentale 6 9 4 13 14 9 8 12 11 9

XI.1. Introducerea datelor

Pasul 1:
În „Variable View” din „Data Editor”, se etichetează pe rând „Familii”.
Aceasta va defini cele două tipuri de familii.

Se etichetează al doilea rând


„Emotivitate” (aici vor fi introduse
rezultatele la testul de emotivitate).
Se înlătură cele două zecimale.

Pasul 2:

În „Data View” din


„Data Editor” se introduc
valorile pentru cele două
variabile în primele două
coloane.
* Se observă că sunt două coloane
de date: A doua coloană conţine
cele 20 de valori ale testului de
emotivitate de la ambele grupe de
copii. Datele nu sunt păstrate
separat pentru cele două grupe;
valorile 1 din prima coloană indică
copii proveniţi din familiile
biparentale şi valorile 2 indică
copii proveniţi din familiile monoparentale. Astfel, este utilizată o singura variabilă
dependentă (în cazul nostru „emotivitatea”) şi altă coloană pentru variabila independentă

65
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
(familia). Cu alte cuvinte, fiecare rând în parte reprezintă un anumit copil şi variabilele sale
dependente şi independente sunt introduse separat în „Data Editor”.

XI.2. Efectuarea Testului t pentru eşantioane independente.

Pasul 1:

Se selectează:
„Analyze”
„Compare Means”
„Independent Samples T test…”

Pasul 2:
Se selectează „Emotivitate” şi
apoi se apasă butonul ► pentru
a introduce această variabilă în
lista variabilelor de test.

Se selectează „Familie” şi apoi


se apasă butonul ◄pentru a
introduce această variabilă în
căsuţa „Grouping Variable”.

Se selectează „Define Groups…” pentru a defini cele două grupuri.

Pasul 3:
Se introduce:
- valoarea 1 (codul pentru familiile
- biparentale) lături de eticheta
- „Group 1”
- valoarea 2 (codul pentru familiile
- monoparentale) alături de eticheta
- „Group 2”.

Se selectează „Continue”

Se apasă „OK” din ecranul precedent, care reapare.

66
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XI.3. Interpretarea output-ului.

Primul tabel arată , pentru fiecare grup în parte, numărul de cazuri, media
şi abaterea standard. Media pentru familiile biparentale este 13,00. După cum se
observă există o diferenţă între cele două tipuri de familii, dar, întrebarea este
dacă mediile diferă semnificativ.
Valoarea lui t este media diferenţei (3,500) divizată cu eroarea standard a
diferenţei (1,493), diviziune ce produce valoarea 2,345.

Dacă valoarea semnificaţiei pentru Pentru varianţe egale, t este 2,345,


Testul Levene este mai mare de 0,05, care la 18 grade de libertate este
lucru care se întâmplă aici (0,642) semnificativ la 0,031 pentru nivelul
se foloseşte informaţia de pe acest two-tailed.
prim rând.
Dacă valoarea semnificaţiei pentru
Testul Levene este mai mică de 0,05,
se foloseşte informaţia de pe al doilea
rând (al doilea rând oferă cifrele pentru
cazul în care varianţele sunt diferite
semnificativ).

67
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XI.4. Raportarea output-ului.

Rezultatele obţinute se pot raporta astfel: „Media pentru valorile testelor


de emotivitate ale copiilor ce provin din familii cu doi părinţi este semnificativ
mai mare decât cea a copiilor proveniţi din familiile cu un singur părinte”.
Dacă se preferă folosirea intervalelor de încredere , se poate scrie:
„Diferenţa dintre valorile testelor de emotivitate ale copiilor ce provin din
familii cu doi părinţi (M=13,00, SD=3,55) şi cei proveniţi din familii cu un
singur părinte (M=9,50, SD=3,10) este de 3,50. Intervalul de încredere de 95%
pentru această diferenţă este de la 0,36 la 6,63.Deoarece intervalul nu conţine
punctul 0,00 diferenţa este statistic semnificativă la nivelul de semnificaţie two-
tailed de 5%.

68
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XII. Testul Chi-Square.


Diferenţe între frecvenţele eşantioanelor.
_________________________________________________________________________________________________________________

În general Testul chi-square este folosit pentru evaluarea existenţei unei


diferenţe semnificative între două eşantioane formate din date de frecvenţă (date
nominale). (Howitt, Cramer, 2010, p.160). Acesta, analizează tabelele de
asociere sau contingenţă pe baza a două variabile categoriale nominale.
*Testul chi-square analizează frecvenţe. Niciodată acestea nu trebuie să fie
transformate în procente pentru a fi introduse în SPSS, deoarece vor da rezultate eronate
atunci când se vor calcula valoarea şi semnificaţia chi-square.
* O analiză chi-square trebuie să includă datele fiecărui individ o singură dată, astfel
încât frecvenţele totale să fie egale cu numărul persoanelor folosite în analiză.
Chi-pătrat este folosit atunci când datele sunt alcătuite doar din variabile nominale
(categoriale).

Tabel 1. Relaţia dintre site-urile accesate şi genul biologic.


Respondenţi Site-uri anunţuri muzică
matrimoniale
Feminin 27 14 19
Masculin 17 33 9

XII.1. Introducerea datelor din tabelul anterior


folosind procedura „Weighing cases”.

Procesarea Testului chi-square folosind două sau mai multe eşantioane


este exemplificată cu datele din tabelul anterior, care arată care dintre cele trei
tipuri de site-uri este preferat de către un eşantion de 119 adolescenţi de ambele
sexe.
Pasul 1:

În meniul „Variable View” Se îndepărtează cele Se etichetează valorile


din „Data Editor” se etichetează două zecimale. „gen” şi „program”.
primele trei coloane cu „gen
biologic”, „Site” şi „Frecvenţă”.

69
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 2:
Se introduc valorile adecvate în meniul
„Data View” din meniul „Data Editor”.
Fiecare rând reprezintă una dintre cele şase
celule din tabelul prezentat anterior.

Paul 3:

Pentru a pondera aceste celule


se selectează:
„Data”
„Weight Cases…”

Pasul 4:

Se selectează „Frecvenţa”, „Weight


cases by” şi apoi se apasă butonul
◄.

Se apasă „OK”.

XII.2. Introducerea datelor din tabelul 1 caz cu caz.

Se introduc valorile pentru


cele două variabile în fiecare
dintre cele 119 cazuri.

XII.3. Efectuarea Testului chi-square pe baza tabelului 1.


Pasul 1:

Se selectează:
„Analyze”
„descriptives statistics”
„Crosstabs…”(tabele de asociere)

70
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 2:

Se selectează „Gen” şi se
apasă butonul ► pentru
„Row(s)”: pentru a-l
introduce în caseta respectivă.

Se selectează „Site” şi se apasă


butonul ◄ pentru „Column(s)”:
pentru a-l introduce în caseta
respectivă.

Se selectează „Statistics…”

Pasul 3:

Se selectează „Chi-square”.
Se selectează „Continue”.

Pasul 4:

Se selectează „Cells..”

Pasul 5:
În secţiunea „Counts” se selectează
„Expected”. Se selectează
„Unstandardized” în secţiunea
„Residuals”. Se selecteaze „Continue”,
apoi se apasă „OK în ecranul anterior
care reapare.
* Termenul „rezidual” se referă la diferenţe.

71
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XII.4. Interpretarea output-ului pentru Testul chi-square.

Acest al doilea tabel din output indică frecvenţa (Count), frecvenţa


aşteptată (Expected Count” şi diferenţa (Residual) dintre cele două pentru
fiecare dintre cele şase celule ale tabelului.

De exemplu: Frecvenţa sau numărul de


fete care spun că preferă site-rile de
matrimoniale este de 17, iar numărul
anticipat de probabilitate este 21,8,
diferenţa dintre cele două valori fiind de
– 4,8.

Al treilea tabel, şi ultimul


indică valoarea
coeficientului (Pearson)
chi-square (13,518),
gradele de libertate (2) şi
semnificaţia two-tailed
(0,001). Din moment ce
această valoare este mai
mică de 0,05, coeficientul
chi-square este
semnificativ.

 Al doilea tabel indică frecvenţele observate şi cele aşteptate ale cazurilor şi


diferenţa (valoarea reziduală) dintre acestea pentru fiecare celulă. Frecvenţa
observată (numită „Count”) este prezentată prima, apoi frecvenţa aşteptată
(numită „Expected Count”. Frecvenţele observate sunt întotdeauna numere
întregi, astfel încât să fie uşor de localizat.

72
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
 Coloana finală din tabel etichetată „Total” conţine numărul de cazuri din
respectivul rând, urmat de numărul aşteptat de cazuri din tabel. Astfel primul
rând are 60 de cazuri, urmat de numărul aşteptat de cazuri din tabel. Astfel,
primul rând are 60 de cazuri, număr care va fi identic numărului de cazuri
aşteptate (adică 60).
 În mod similar, rândul final din acest tabel (etichetat „Total) prezintă mai
întâi numărul de cazuri din respectiva coloană urmat de numărul aşteptat de
cazuri din tabel pentru coloana respectivă. Astfel, prima coloană are 44 de
cazuri, număr care ca fi întotdeauna egal cu numărul aşteptat de cazuri (adică
44,0).
 Valoarea chi-square, gradul său de liberate şi nivelul său de semnificaţie sunt
afişate în al treilea tabel care începe cu „Pearson” (cel care a elaborat acest test).
Valoarea chi-square este de 13,518, care, rotunjită la un număr cu două
zecimale, devine 13,52. Gradul său de libertate este 2, iar probabilitatea two-
tailed exactă este 0,001.
 Sub acest tabel se mai poate vedea şi mărimea „minimum expected count” a
oricărei celule din tabel, care este 13,88 pentru ultima celulă (fetele care preferă
site-urile cu muzică). Dacă diferenţa minimă aşteptată este mai mică decât 5.0,
atunci trebuie să se acorde foarte multă atenţie Testului chi-square.

* Dacă se foloseşte un tabel 2x2 de tip chi-square şi apar frecvenţe anticipate reduse, este
recomandat să se folosească testul Fisher, pe care aplicaţia SPSS îl include în output în astfel
de situaţii.

XII.5. Raportarea output-ului pentru Testul chi-square.


Există două modalităţi de descriere a rezultatelor.

* Pentru o persoană neexperimentată aceste două posibilităţi de interpretare pot părea


foarte diferite, dar, practic, ele înseamnă acelaşi lucru.

73
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

 Rezultatele se pot descrie astfel: „A existat o diferenţă semnificativă


între frecvenţele observate şi cele aşteptate în cazul adolescenţilor băieţi şi fete
în ceea ce priveşte preferinţa lor pentru cele trei tipuri de site-uri ( χ2 =
13,51. DF = 2, p = 0,001)”.
 O altă posibilitate de interpretare a rezultatelor obţinute ar putea fi:
„ Există o asociere semnificativă între genul biologic şi tipul de site
preferat ( χ2 = 13,51. DF = 2, p = 0,001)”.
 Raportarea şi direcţia rezultatelor se poate face astfel: „ Fetele tind mai
mult decât băieţii să prefere site-urile cu anunţuri (de toate genurile) şi preferă
mai puţin site-urile despre matrimoniale sau pe cele cu muzică”.

*În general, testul chi-square este folosit pentru evaluarea existenţei unei diferenţe
semnificative între două sau mai multe eşantioane care sunt formate din date de frecvenţă
(date nominale). Altfel spus, este testul statistic uzual care analizează tabelele de asociere sau
contingenţă pe baza a două variabile categoriale nominale.

74
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XIII. Recodificarea variabilelor.

Aplicaţia SPSS poate recodifica valori în mod rapid şi cu uşurinţă, ceea ce


îi oferă cercetătorului o mare libertate de recodificare a datelor.
*Nu se modifică variabilele decât în cazul în care este absolut sigur că se doreşte
modificarea permanentă a datelor originare.
Scorurile abilităţilor muzicale şi matematice
obţinute de către un număr de 10 copii
Scor muzică Scor matematică Gen biologic Vârstă
3 7 1 10
7 5 1 9
8 4 2 12
9 4 1 8
9 5 2 11
6 8 2 13
4 9 2 7
3 9 1 10
4 7 2 9
7 6 1 11

* Scorurile abilităţilor muzicale şi matematice sunt aceleaşi care au fost prezentate


anterior în capitolul VIII.1.

Dorim să se realizeze corelaţia dintre valorile abilităţilor muzicale şi a


celor matematice, în cazul copiilor mici şi a celor mari. Pentru a realiza această
corelaţie este important să se stabilească numărul de grupe de vârstă dorite. În
acest caz se vor alege două grupe de vârstă: copii mai mici de 10 ani şi copii mai
mari de 10 ani.

XIII.1. Recodificarea rezultatelor.

Pasul 1:

Se introduc datele aşa cum este


prezentat în tabelul alăturat.
(Paşii de introducere a datelor
sunt prezentaţi în capitolele
anterioare).

75
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 2:

Se selectează „Transform”,
„recode”
Şi „Into Different Variables”

Pasul 3:

Se selecteaă „Vârstă” şi se
apasă butonul ◄ pentru a
introduce „Vârsta” în
caseta „Numeric Variable
– Output variable”.
Se introduce numele noii
variabile.
Se selectează „Change”
pentru a adăuga acest nume Se selectează „Old and New values”.
nou în caseta „Numeric variable
– Output Variable”.

Pasul 4:

Se selectează „Lowest
through” şi se scrie 9 în
caseta alăturată.

Se selectează „Value”
din meniul „new value”
şi se scrie 1 în căsuţa
alăturată.

Se selectează „Add” şi
se introduce „lowest
throught 9→1 „ în caseta
„Old→New”.

76
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 5:

Se selectează
„Range: through
highest” şi se scrie
10 în caseta de
lângă el.
Se selectează
„value” şi se scrie
2 în caseta
alăturată.

Se selectează
„Add” şi se
introduce „10
through
Highest→2” în
caseta „Old→New”. Se apasă „OK” în ecranul care va reapărea.
Pasul 6:
Noua variabilă şi valorile sale sunt
afişate în meniul „Data View”.

• 1 semnifică copii cu vârste mai mici de 10


ani
• 2 semnifică copii cu vârste mai mari de
10 ani.

Pentru o astfel de recodificare se deschide fereastra Recode into Different Variables


(din meniul Transform comanda Recode) în care:
- se selectează variabila pe care dorim să o recodificăm din lista variabilelor din partea
stângă şi se mută în lista variabileor de recodat;
- se scrie numele noii variabile în caseta Name din zona Output Variable;
- se scrie în caseta Label eticheta noii variabile;
- se acţionează butonul de comandă Change pentru a se realiza modificarea.
Pentru a defini categoriile variabilei numerice acţionăm butonul de comandă Old and
New Values ce are ca efect deschiderea unei ferestre de dialog în care pentru a schimba o
valoare particulară într-o valoare nouă se introduce valoarea veche în caseta Old Value şi
valoarea nouă în caseta New Value şi se acţionează butonul Add.
De regulă se schimbă o valoare reală cu altă valoare reală. În acest scop selectăm
butonul de opţiuni Range. Casetele de editare sunt folosite pentru a stabili limita inferioară şi
respectiv limita superioară a intervalului dorit. Apoi se selectează butonul de opţiuni Value
din zona New Value în care se introduce noua valoare şi acţionăm butonul Add.
Prin clic pe butonul de comandă Continue se revine în fereastra Record into Different
Variables în care acţionăm OK pentru recodificarea variabilei.

77
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XIV. Calculul variabilelor noi.


_________________________________________________________________________________________________________________

Calculul variabilelor noi permite adunarea, scăderea, etc. a valorilor


câtorva variabile pentru a obţine o nouă variabilă.
Exemplu: Se doreşte să se adune câteva întrebări dintr-un chestionar, pentru a
obţine un indice general al ceea ce măsoară chestionarul.
Atunci când sunt măsurate variabilele psihologice, se folosesc mai multe
întrebări pentru a măsura mai mult sau mai puţin acelaşi lucru.
De exemplu, următoarele afirmaţii pot fi folosite pentru evaluarea satisfacţiei
profesională:
a. În general mă bucură profesia mea.
b. Uneori stresul de la serviciu devine insuportabil.
c. Unii colegi sunt enervanţi câteodată.
d. Viitorul pare promiţător la locul de muncă.
Participanţilor li se cere să afirme în ce măsură sunt de acord cu fiecare
dintre aceste afirmaţii, pe următoarea scală de la 1 la 4:
1. întru totul de acord; 2. de acord;
3. dezacord; 4. total dezacord.
Aceşti itemi se pot folosi pentru a determina nivelul de satisfacţie
profesională a angajaţilor, prin adunarea răspunsurilor date tuturor celor patru
afirmaţii.
Întru totul De acord dezacord Total dezacord
de acord
Respondent 1
Respondent 2
Respondent 3
Deoarece este nevoie de scoruri mari pentru a indica satisfacţia
profesională, se va inversa evaluarea, astfel:
4. total de acord; 3. de acord;
2. dezacord; 1. total dezacord.

78
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XIV.1. Procedura unei variabile noi.


Pasul 1:
Se scrie un nume
pentru noua
variabilă în caseta
de sub „Target
Variable” (ex. scor
total.
Se scrie sau se
selectează termenii
expresiei şi se
introduc în caseta
„Numeric
Expression”.
Se apasă „OK”.
Se selectează
„Paste” pentru a
salva această
procedură sub formă
de sintaxă.

Pasul 4:
Pentru a salva această
procedură sub formă de fişier
de sintaxă, se selectează
„Paste” în caseta principală.
Această comandă de sintaxă
va apărea în fereastra
„Syntax”.

79
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XV. Testele rangurilor.


Statistici nonparametrice.
_________________________________________________________________________________________________________________

Testele nonparametrice sunt folosite atunci când nu este îndeplinită


condiţia ca scorurile fiecărei variabile să fie cât de cât normal distribuite (în
formă de clopot). Aceste teste fac mai puţine presupuneri referitoare la
caracteristicile populaţiei de la care provin datele, trăsătură care nu este
caracteristică testelor parametrice (cum ar fi Testul t). Metodele statistice
nonparametrice nu testează diferenţele dintre medii, deoarece acestea folosesc
scoruri transformate în ranguri. De obicei, prin aceste metode se verifică dacă
rangurile dintr-un grup sunt mai mari sau mai mici decât rangurile din celălalt
grup.
În acest capitol vom vorbi despre Testul semnului şi Testul Wilcoxon
pentru date corelate (eşantioane perechi). Cu alte cuvinte, aceste teste sunt
echivalentele nonparametrice ale Testului t pentru eşantioane perechi.
Testul U Mann-Witney se foloseşte pentru date nerelaţionate, acesta
fiind echivalentul nonparametric al Testului pentru eşantioane independente.
Procesarea a două teste nonparametrice pentru scoruri relaţionate este
exemplificată folosind datele din tabelul următor, care a fost folosit şi în
capitolul X şi care indică numărul de cuvinte pe care aceeaşi copii le-au
verbalizat cu mamele lor la 18 luni şi la 24 luni.

Numărul de cuvinte verbalizate într-un minut la vârste diferite.

Alina Cristina Raluca Carmen Simona Radu Cristi Dan


18 luni 3 2 4 5 2 3 2 4
24 luni 5 4 7 8 3 4 4 6

80
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XV.1. Scoruri relaţionate: testul semnului.

Pasul 1:

În „Data View” din „Data Editor”


se introduc datele în primele două
coloane.

Pasul 2:

Se selectează:
„Analyze”
„Nonparametric Tests”

„Legacy dialog”

„2 Related Samples…”

Pasul 3:
Se selectează „Optsprezece”
şi „douăzecisipatru” şi se
apasă butonul ◄ pentru a
introduce aceste două
variabile în caseta „Test Pair
(s) List”.
Se deselectează „Wilcoxon”.
Se selectează „Sign”.
Se apasă „OK”.

XV.2. Interpretarea output-


ului pentru testul semnului.
Se poate ignora primul dintre cele
două tabele care indică numărul de
diferenţe negative (0), pozitive (8)
şi inexistente (0) în ceea ce
priveşte numărul de cuvinte
verbalizate la cele două vârste.

81
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Al doilea tabel indică nivelul de


semnificaţie al acestui test. Probabilitatea
two-tailed este de 0,008 ceea ce este
semnificativ la nivelul de 5%.

XV.3. Raportarea output-ului pentru testul semnului.

Rezultatele obţinute pot fi raportate astfel: „Există o schimbare


semnificativă la nivelul numărului de cuvinte verbalizate de la 18 luni la 24 de
luni (Testul semnului: N=0,008).
*Testul semnului este utilizat pentru a testa diferenţa dintre valori. Dacă nu ar exista
nicio diferenţă între valorile pereche, atunci numărul diferenţelor pozitive ar trebui sp fie egal
cu numărul diferenţelor negative. Cu cât numărul diferenţelor de un anumit semn este mai
mare, comparativ cu cel al diferenţelor de semn opus, cu atât creşte probabilitatea ca diferenţa
dintre variabile să fie semnificativă. (Popa, 2008, p. 323).

XV.4. Scoruri relaţionate: testul Wilcoxon.

Testul Wilcoxon reprezintă opţiunea predefinită în caseta de dialog a


testelor cu două eşantioane perechi. Dacă s-a deselectat anterior, se selectează
din nou. Se apasă „OK” pentru a obţine output-ul Testului Wilcoxon.

XV.5. Interpretarea output-ului pentru Testul Wilcoxon.

82
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Se poate ignora primul dintre cele două tabele de output. Acestea indică
numărul de diferenţe negative (0), pozitive (8) şi inexistente (0) în ceea ce
priveşte datele ordonate după cele două vârste, şi media şi suma catalogate
negative şi pozitive. Valorile pentru „două zeci şi patru „ de luni sunt mai mari
decât cele pentru „optsprezece” luni.
Al doilea tabel indică nivelul de
semnificaţie al acestui test. În loc să
folosească tabelul valorilor critice,
computerul utilizează o formulă care
stabileşte o conexiune cu distribuţia Z.
Scorul Z este de – 2,558, care are o
probabilitate two-tailed de 0,011. Aceasta înseamnă că diferenţele dintre cele
două variabile sunt semnificative din punct de vedere statistic la un nivel de 5%.

XV.6. Raportarea output-ului pentru Testul Wilcoxon.

Rezultatele obţinute pot fi raportate astfel: „Există o diferenţă


semnificativă între numărul de cuvinte verbalizate de copii între 18 şi 24 de luni
(Wilcoxon: N=8, z =2,56, two-tailed p = 0,011)”.
Tesul Wilcoxon – se foloseşte atunci când subiecţii sunt evaluaţi de două ori pe o scală
de interval, iar variabilele nu întrunesc condiţiile pentru utilizarea testului t al diferenţelor
pentru eşantioane independente. Testul utilizează proceduri de tip neparametric şi apelează la
diferenţele dintre valorile-pereche şi la ordonarea lor.

83
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XV.7. Scoruri nerelaţionate: Testul U Mann-Whitney.

Pentru procesarea unui test nonparametric pentru scoruri necorelate, vom


folosi datele din tabelul următor, care indică scoruri ale emotivităţii obţinute de
10 copii care provin din familii biparentale şi 10 copii care provin din familii
monoparentale.

Familii 12 18 14 10 19 8 15 11 10 13
biparentale
monoparentale 6 9 4 13 14 9 8 12 11 9

Pasul 1:
- este acelaşi ca şi cel prezenta la capitolul XI.

Pasul 2:

Se selectează:
„Analyze”
„Nonparametric tests”
„Legacy dialog”
„2 Independent Samples…

Pasul 3:

Se selectează „Emotivitate” şi
se apasă butonul
►pentru a introduce parametrul
„Emotivitate” în caseta „Test
Variable List”.

Se selectează „Familie” şi se
apasă butonul ◄pentru a
introduce „Familie” în caseta
„Grouping Variables”.

Se selectează „Define Groups…”

84
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Pasul 4:

Se scrie 1 (pentru un singur părinte) în c


aseta de lângă „Group 1”.
Se scrie 2 (pentru 2 părinţi) în caseta de
lângă „Group 2”.
Se selectează „Continue”.
Se apasă „OK” din ecranul anterior care va
reapărea.

*Testul Mann-Whitney este utilizat pentru testarea diferenţelor dintre grupuri independente
pentru care variabila dependentă este exprimată în valori ordinale (de rang) sau atunci când nu
suportă un test parametric (testul t). (Popa, 2008, p. 333).

XV.8. Interpretarea output-ului pentru testul U Mann-Whitney.

Se poate ignora primul dintre cele două tabele de output. Acest tabel
indică faptul că rangul mediu dat parametrului „Emotivitate” pentru primul grup
(adică valoarea 2) este 13,15, iar rangul mediu pentru al doilea grup (adică
valoarea 1) este de 7,85. Aceasta înseamnă că valorile din grupul 2 (biparentale)
au tendinţa să fie mai mari decât cele din grupul 1 (monoparentale).

Al doilea tabel indică statistica de bază mann-


Whitney, valoarea U fiind de 23,500, ceea ce
este semnificativ din punct de vedere statistic
la un nivel de 0,043.
Computerul a listat şi un scor Z de -2,011, care
este semnificativ la nivel de 0,044.
Aceasta este valoarea Testului Mann-Whitney
atunci când se aplică o corecţie pentru ranguri înrudite. După cum se poate

85
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
vedea, aceasta a modificat nivelul de semnificaţie doar marginal, de la 0,44 la
0,44.

XV.9 Raportarea output-ului pentru Testul U Mann-Whitney.

Rezultatele obţinute în urma acestei analize se pot raporta astfel: „ Testul


U Mann-Whitney a concluzionat că scorurile emotivităţii la copii din fa,iliile cu
doi părinţi sunt semnificativ mai mari decât la cei din familiile cu un singur
părinte (U=23,5, N1,2=10, p two-tailed p= 0,044)”.
Testul Man-Whitney se aplică ragurilor pe care le au datele şi este sensibil la numărul
de cazuri.
Este un test statistic pentru date ordinale şi se utilizează atunci când (Popa, 2008):
- Variabila dependentă este exprimată pe scală de tip ordinal;
- Variabila dependentă este măsurată pe scală de interval/raport – aici are loc o
transformare de rang, adică, se înlocuieşte fiecare valoare a distribuţiei cu poziţia pe
care o are în cadrul distribuţiei, sub aspectul ordinii de mărime.

86
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XVI. Analiza de varianţă (ANOVA).


Introducere în metoda one-way ANOVA
cu scoruri nerelaţionate sau necorelate.
_________________________________________________________________________________________________________________

Analiza de varianţă cu scoruri nerelaţionate/necorelate indică măsura în


care câteva (două sau mai multe) grupuri au medii foarte diferite. (Howitt,
Cramer, 2010, p.202).
*Grupurile diferite aparţin variabilei independente iar valorile numerice corespund
variabilei dependente.
Analiza de varianţă calculează variaţia dintre scoruri şi pe cea dintre
mediile eşantioanelor.
One – way ANOVA este folosit pentru testare pentru diferenţele între
două sau mai multe grupe independente. ANOVA este utilizat pentru a testa
diferenţe între cel puţin trei grupuri, deoarece cele două grupuri de caz pot fi
acoperite de u un T-test.
De fapt, testul t independent este un tip special de ANOVA simpla în
care sunt implicate doar doua grupe. ANOVA simpla permite evaluarea ipotezei
nule între mediile a doua sau mai multe serii de date cu restricţia ca acestea sa
fie trepte ale aceleiaşi variabile independente.
ANOVA simpla permite compararea simultana a trei sau mai multe
grupe menţinând nivelul α la valoarea dorita, de maxim 0,05.
Procesarea analizei one-way de varianţă cu scoruri nerelaţionate este
exemplificată folosind datele din tabelul următor, care indică rezultatele obţinute
de către diferiţi participanţi în condiţii diferite. Este vorba despre un studiu
asupra efectului unor tratamente hormonale şi placebo asupra depresiei.
Astfel, medicamentul este variabila independentă şi depresia este
variabila dependentă.
Date studiu
Grup 1 Grup 2 Grup 3
Tratament hormonal Tratament hormonal Placebo
8 4 4
11 2 6
8 4 4

87
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XVI.1. Metoda one-way ANOVA pentru eşantioane independente.

Pasul 1:

Se introduc datele.
Se codifică cele trei
condiţii cu valorile 1, 2, 3.
Se etichetează „Hormon 1”,
„Hormon 2” şi „Placebo”.

Pasul 2:

Se selectează:
„Analyze”
„Comparea Means”
„One-Way ANOVA”.

Pasul 3:
Se selectează „depresie” şi se
apasă butonul ►de lângă caseta
„Dependent List” – pentru a
introduce parametrul în casetă.

Se selectează „Condiţie” şi se
apasă butonul ◄ de lângă caseta
„Factor” – pentru a introduce
parametrul acolo.

Se selectează „Options…

Pasul 4:
Se selectează metodele statistice „descriptive”
şi „Homogenity of variance test”.

Se selectează „Continue…”.
Se apasă „OK” din ecranul anterior, care va
reapărea.

88
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XVI.2. Interpretarea output-ului.

Primul tabel oferă diferite statistici descriptive, cum ar fi numărul de


cazuri, media şi abaterea standard în cele trei condiţii şi pe eşantionul total.

Al doilea tabel oferă rezultatele


Testului Levene al similarităţii
varianţelor. Acest test nu este
semnificativ deoarece are o
semnificaţie de 0,441.

Al treilea tabel indică rezultatele analizei de varianţă. Raportul F este


semnificativ la nivel de 0,00, acesta fiind mai mic decât 0,05.
 Raportul F se calculează prin împărţirea „sum of square” (suma
pătratelor abaterilor de la medie) dintre grupe, este împărţită suma pătratelor de
la media din interiorul grupelor (sum of squares groups)m ceea ce dă un Raport
F de 13,941 (20,333/0,889 = 13,941).
 Aceasta înseamnă că există o diferenţă semnificativă între cele trei
grupuri.

89
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XVI.3. Raportarea ouput-ului.

Rezultatele obţinute pot fi raportate astfel: „Per total, efectul tratamentului


cu medicamente a fost semnificativ (F2,6 = 13,94, p= 0,00). În schimb, nu a
existat nicio diferenţă semnificativă între media controlului placebo şi media
tratamentului hormonal 2.

90
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XVII. Analiza de varianţă bifactorială pentru


scoruri nerelaţionate/necorelate.
_________________________________________________________________________________________________________________

Analiza two-way de varianţă permite compararea mediilor unei variabile


dependente atunci când există două variabile independente.
Dacă există mai mult de o variabilă dependentă, atunci analiza se
realizează separat pentru fiecare variabilă.
Realizarea unei analize two-way pentru scoruri nerelaţionate de varianţă
este exemplificată în tabelul următor, care indică scorurile obţinute de către
diferiţi participanţi în şase condiţii, reflectând cei doi factori ai privării de somn
şi alcool. Scopul acestei analize este acela de a aprecia dacă diferitele combinaţii
de cafea şi deprivare de somn afectează diferenţiat numărul mediu de greşeli
făcute.

Datele pentru un experiment referitor la privarea de somn:


Numărul de erori în cazul unui test video.

privare de somn
3 ore 6 ore 9 ore
Consum alcool 14 16 20
10 14 22
15 23 30
Fără alcool 9 11 10
9 8 14
12 11 12

91
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XVII.1. Metoda two-way ANOVA pentru scoruri nerelaţionate.

Pasul 1:
Se introduc datele. Cele ouă coduri pentru
„Alcool” (1=alcool; 2= fără alcool) – în prima
coloană.

Cele trei coduri pentru „Privare de somn” se


regăsesc în a doua coloană (1= 3 ore, 2= 6 ore,
3= 9 ore).

Greşelile sunt prezentate în a treia coloană.

Se elimină cele două zecimale din mediul


„Variable View”.

Pasul 2:

Se selectează:
„Analyze”
„General Linear Model”
„Univariate…”

Pasul 3:

Se selectează „Erori” şi se apasă butonul


► de lângă caseta „Dependent Variable
”pentru a introduce parametrul acolo.
Se selectează „Alcool” şi „Privare de
somn” fie împreună, fie separat, şi se
apasă butonul „Fixed factor(s)” pentru
a le introduce în casetă.
Se selectează „Options…”

92
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 4:

Se selectează „Descriptives
statistics” şi „Homogeneity test”.

Se selectează „Continue”.

În ecranul anterior, care va


reapărea, se selectează „Plots…”.
Pasul 5:

Se selectează „Alcool” şi se apasă


butonul ► de lângă caseta
„Horizontal axis” – pentru a
introduce parametrul acolo.

Se selectează „Privare de somn” şi


se apasă butonul ◄ de lângă caseta
„Separate Lines” - pentru a
introduce opţiunea în casetă.

Se selectează „Add”
.
Se selectează „Continue”. Se apasă „OK” din ecranul anterior
care va reapărea-

XVII.2. Interpretarea output-ului.

Acest tabel conţine


mediile , abaterile
standard şi numărul
(N) de cazuri pentru
cele două variabile
„Alcool” şi „Privare
de somn”. Luate
separat sau
împreună.
Media pentru
condiţia „Alcool”
este comparată cu „Totalul” pentru
„Privare de somn” (adică 18,22). Media pentru privare de 3 ore de somn este
comparată cu „Total” pentru „Alcool” (adică 11,50).

93
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Al treilea tabel de oferă


informaţii referitoare la Testul
Levene, care verifică
similaritatea varianţelor. Din
moment ce semnificaţia acestui
test este 0,085 (valoarea care este
mai mare decât 0,05), varianţele
sunt similare

Al patrulea
tabel indică
nivelele de
semnificaţie
pentru cele două
variabile
„Alcool” şi
„Privare de
somn”, şi
interacţiunea
dintre acestea.

 În tabelul de analiză a varianţei, raportul F pentru cele două efecte principale


(Alcool şi Privare de somn) este prezentat primul.

 Pentru prima variabilă, cea a alcoolului, Raportul F este 22,891, ceea ce este
semnificativ la nivelul 0,000. Deoarece sunt numai două condiţii pentru ca acest
efect să se producă, se poate conhide că scorul mediu al uneia dintre condiţii
este mult mai mare decât pentru cealaltă.
 Pentru a doua variabilă a privării de somn, aceasta este egală cu 5,797,
valoare care are un nivel exact de semnificaţie de 0,017. Astfel, Raportul f este
semnificativ din punct de vedere statistic la un nivel de 0,05, ceea ce înseamnă
că mediile celor trei condiţii legate de somn nu sunt similare.
 Mediile care diferă de celelalte pot fi determinate ulterior prin folosirea
testelor de comparaţii multiple, cum este Testul t pentru eşantioane
independente.

94
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
 raportul F pentru interacţiunile dintre cele două variabile (Alcool şi Privare de
somn) este de 2,708 → nivelul de semnificaţie al acestui raport este de 0,107→
nu este nicio interacţiune semnificativă.
Acest grafic este realizat pentru mediile celor şase condiţii. El a fost editat
cu ajutorul comenzii “Chart Editor”.

Estimated Marginal Means of erori

privare de somn
3 ore
22,50 6 ore
9 ore
Estimated Marginal Means

20,00

17,50

15,00

12,50

10,00

alcool fara alcool

XVII.3. Raportarea output-ului.

 Rezultatele din output se pot raporta astfel: „O analiză de varianţă two-way


ANOVA demonstrează obţinerea unor efecte semnificative în cazul alcoolului
(F = 22,981, p< 0,001) şi al privării de somn (F=5,80, p = 0,017), dar nu şi în
cazul interacţiunii celor două variabile (F =2,70, p= 0,107).

95
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

XVIII. Comparaţii multiple cu ANOVA.


_________________________________________________________________________________________________________________

Acest capitol extinde aria de acoperire a Testelor t multiple prezentate în


capitolele anterioare şi explică modul în care se decide care perechi de medii
sunt diferite în mod semnificativ între ele, în cazul analizei de varianţă.
Această tehnică se foloseşte atunci când sunt mai mult de două medii.
Pentru a prezenta această procedură vor fi folosite informaţiile prezentate
la capitolul XV.

Date studiu
Grup 1 Grup 2 Grup 3
Tratament hormonal Tratament hormonal Placebo
8 4 4
11 2 6
8 4 4

Pasul 1:

Se introduc datele.
Se codifică cele trei
condiţii cu valorile 1, 2, 3.
Se etichetează „Hormon 1”,
„Hormon 2” şi „Placebo”.

Pasul 2:

Se selectează:
„Analyze”
„Comparea Means”
„One-Way ANOVA”.

96
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

Pasul 3:
Se selectează „depresie” şi se
apasă butonul ►de lângă caseta
„Dependent List” – pentru a
introduce parametrul în casetă.

Se selectează „Condiţie” şi se
apasă butonul ◄ de lângă caseta
„Factor” – pentru a introduce
parametrul acolo.

Se selectează „Post Hoc…”

Pasul 4:

Se selectează:
„Tukey”
„Duncan”
„Scheffe”.

Se apasă
„Continue”.

Se selectează „OK” în
ecranul care va apărea
din nou.

XVIII.1. Interpretarea output-ului.

Primul tabel reprezintă rezultatele analizei de varianţă. Raportul F pentru


efectul dintre grupuri (adică efectul hormonilor) este 13,941, care are un nivel
exact de semnificaţie de 0,006. Acest lucru înseamnă că efectul dintre grupuri
este semnificativ; per total, mediile pentru cele trei grupuri diferă.

97
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
Al doilea tabel şi ultimul oferă rezultatele celor trei teste de comparaţii
multiple.

Dacă se foloseşte Testul Tukey al diferenţei semnificative oneste


(HSD), media de la grupul hormonului 1 este semnificativ diferită de media de
la grupul hormonului 2 (semnificaţia=0,06) şi semnificaţia de la media grupului
Controlului placebo (semnificaţia=0,020).

Subgrupele omogene.

Grupul hormonului 2 şi al
controlului Placebo
aparţin aceleiaşi
subgrupe, ceea ce
înseamnă că nu sunt
semnificativ diferite.

Grupul hormonului 1 este


singurul din această a
doua subgrupă, motiv
pentru care aceasta este
semnificativ diferită de
mediile celorlalte două
grupe.
* Sunt reprezentate mediile grupelor din subgrupele omogene.
a. Foloseşte Media armonică a dimensiunilor eşantioanelor
=3,000.

98
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
 Tabelul final, numit „Subgrupele omogene”, enumeră grupurile de medii care
nu sunt semnificativ diferite între ele.
Dacă se ia în calcul aceste două rânduri pentru a se folosi în Testul Tukey HSD,
în acest caz există două subgrupe de medii. Subgrupa 1 indică faptul că mediile
grupelor hormonului 2 şi ale controlului placebo cu valorile 3,33 şi 4,67 nu
diferă semnificativ. Subgrupa 2 conţine doar media grupei hormonului 1, în
valoare de 9,00. Astfel, media grupului hormonului 1 este semnificativ diferită
atât de media grupei hormonului 2, cât şi de cea a gupelor de control placebo .
 Toate cele trei teste prin comparaţii multiple sugerează acelaşi lucru: faptul că
există diferenţe semnificative între grupele hormonului 1 şi hormonului 2 şi între
grupele hormonului 1 şi cele ale controlului placebo. Alte diferenţe nu mai
există.

XVIII.2. Raportarea output-ului.

Rezultatele output-ului pot fi raportate astfel: „O analiză de varianţă


unifactorială pentru scoruri necorelate a demonstrat producerea unui efect
general semnificativ pe tip de tratament medicamentos (F=13,94, p= 0,06). Prin
Metoda Scheffe de analiză a intervalului s-a descoperit că grupul hormonului 1
era diferit de grupul hormonului 2 (p= 0,07) şi de grupul controlului placebo
(p=0,24), dar nu s-au mai găsit alte diferenţe semnificative”.

99
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

ALEGEŢI RĂSPUNSUL CORECT

1. Fereastra de editare (Data Editor):


a. se deschide implicit la lansarea SPSS;
b. este folosită pentru introducerea, modificarea sau ştergerea datelor în
format spreadsheet;
c. este folosită pentru a genera programe de comenzi pe care le vom
executa asupra datelor;
d. este folosită pentru modificarea textului rezultat, care nu a fost afişat în
tabele pivot;

2. Fereastra de rezultate (Output Viewer):


a. afişează rezultatele statistice, tabele şi grafice care au asociate ferestre
distincte;
b. permite modificarea elementelor unui grafic (axe, scale, diagramă,
legendă etc.);
c. este folosită pentru a genera programe de comenzi pe care le vom
executa asupra datelor.

3. Ferestrele în SPSS reprezintă:


a. zone de pe ecran tratate ca elemente de sine stătătoare, cu caracteristici
proprii, care determină acţiunile ce se pot executa în cadrul lor;
b. elemente constitutive ale programului SPSS;
c. elemente prin care i se conferă utilizatorului posibilitatea selectării unei
anumite opţiuni.

4. Care sunt cele mai frecvent utilizate ferestre în SPSS


a. data editor;
b. output editor;
c. syntax editor;
d. syntax viewer;
e. output viewer.

5. În SPSS fereastra SPSS Output Viewer este utilizată pentru:


a. afişarea rezultatelor;
b. editarea de date;
c. editarea de date şi tabele;

100
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

6. La editarea unei variabile trebuie să se ţină cont de următoarele


restricţii:
a. să conţină spaţii sau simboluri folosite în SPSS;
b. să conţină numai litere;
c. să aibă cel puţin 8 caractere;
d. primul caracter trebuie să fie o cifră;
e. să fie unic.

7. Numele variabilei trebuie să ţină cont de câteva restricţii:


a. să aibă cel mult 6 caractere;
b. se poate repeta;
c. primul caracter să fie literă;
d. poate să conţină simboluri speciale folosite în SPSS sau spaţii.

8. Pentru a introduce date în SPSS se selectează:


a. o celulă dând clic pe celula respectivă;
b. meniul data, split file;
c. meniul transform, compute.

9. Prin apăsarea butonului “Variable View”:


a. se schimbă fereastra “Data View”;
b. apare fereastra output;
c. se poate introduce o variabilă diferită.

10. Care dintre următoarele afirmaţii este adevărată?


a. indicatorul “medie” reprezintă media aritmetică a unui scor şi se obţine
prin însumarea valorilor şi înmulţirea cu numărul de valori;
b. modul este valoarea cu cea mai mare frecvenţă si este frecvenţa cu care
apare cel mai frecvent scor;
c. mediana este valoarea din centrul distribuţiei, dacă variabilele numerice
sunt ordonate după mărime, de la cea mai mică la cea mai mare.

11. Pentru a calcula media aritmetică alegem


a. SE Mean;
b. Median;
c. Mean;
d. Rouge.

12. Care sunt graficele folosite pentru o distribuţie după o variabilă


calitativă?
a. diagrama Bar si diagrama Pie
b. diagrama Boxplot
c. Scatter sau Line

101
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
13. Diagrama de bare este folosită pentru:
a. a reprezenta valori medii;
b. a reprezenta frecvenţe absolute (numere) şi/sau relative (procente);
c. a reprezenta relaţiile dintre variabile;
d. a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate.

14. Diagrama de structură este folosită pentru:


a. a reprezenta frecvenţele absolute (numere) şi/sau relative (procente);
b. a arăta forma unei distribuţii după variabila înregistrată asupra unei
colectivităţi;
c. a prezenta amplitudinea şi mediana unei distribuţii;
d. a reprezenta relaţia dintre variabile.

15. Histograma este folosită pentru:


a. a reprezenta grafic valorile medii ale diferitelor variabile pentru aceeaşi
colectivitate;
b. a arăta forma unei distribuţii după o variabilă înregistrată asupra unei
colectivităţi;
c. a reprezenta relaţia dintre variabile;
d. a reprezenta intervalul intercuartilic.

16. Pentru o distribuţie după o variabilă cantitativă se folosesc


următoarele grafice:
a. scatter (norul de puncte) şi histograma;
b. pie (diagrama de structută) şi line (diagrama liniară);
c. histograma şi curba frecvenţelor;
d. bar (diagrama de bare) şi curba frecvenţelor.

17. Media aritmetică se calculează pentru:


a. variabile categoriale
b. variabile categoriale şi cantitative
c. variabile cantitative.

18. Prima coloană a tabelului de frecvenţe conţine:


a. etichetele categoriilor introduse;
b. procentul de frecvenţă pentru fiecare categorie;
c. valorile lipsă.

19. Pentru a realiza o diagramă circulară se selectează:


a. analize/ descriptive statistics/descriptives;
b. graphs/ pie;
c. graphs/ area.

102
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
20. Indicatorii tendinţei centrale sunt:
a. modul, mediana, abaterea standard
b. medie, mod, mediană
c. dispersie, abaterea standard

21. Care dintre următoarele afirmaţii este adevărată?


a. indicatorul “medie” reprezintă media aritmetică a unui scor şi se obţine
prin însumarea valorilor şi înmulţirea cu numărul de valori;
b. modul este valoarea cu cea mai mare frecvenţă si este frecvenţa cu care
apare cel mai frecvent scor;
c. mediana este valoarea din centrul distribuţiei, dacă variabilele numerice
sunt ordonate după mărime, de la cea mai mică la cea mai mare.

22. Cum putem calcula mediana?


a. alegând din meniul Transform / Compute;
b. statistics / summarize / case summaries / statistics;
c. statistics / Compare Means / Means;

23. Pentru a calcula eroarea medie de selecţie alegem:


a. Mean;
b. Std Deviation;
c. S.E. mean;
d. Range;

24. Pentru a calcula asimetria alegem una din opţiunile:


a. Range;
b. Std Deviation;
c. Skewness;
d. Kurtosis;
e. Variance;

25. Într-un calcul statistic, media reprezintă:


a. valoarea cu cea mai mare frecvenţă;
b. valoarea din centrul distribuţiei;
c. media aritmetică a unui set de scoruri, care se obţine prin însumarea
valorilor şi împărţirea rezultatului la numărul de valori;
d. media aritmetică a unui set de scoruri, care se obţine prin diferenţa
valorilor şi împărţirea rezultatului la numărul de valori.

26. Într-un calcul statistic, abaterea standard este:


a. valoarea a măsurii în care scorurile diferă în medie faţă de media
scorurilor pentru o variabilă particulară;
b. diferenţa numerică între cel mai mare şi cel mai mic scor obţinut pentru
o variabilă;
c. valoarea cu frecvenţa cea mai mare
103
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
27. Kurtosis, ca indicator al formei distribuţiei, indică:
a. cât de ascuţită sau turtită este distribuţia scorurilor pentru o variabilă,
comparativ cu distribuţia normală;
b. simetria sau asimetria unei distribuţii de frecvenţe faţă de medie;
c. distribuţia scorurilor pentru 2 variabile comparative;

28. Eroarea standard este:


a. diferenţa numerică între cel mai mare şi cel mai mic scor obţinut pentru
o variabilă;
b. valoarea medie cu care mediile eşantioanelor extrase dintr-o populaţie,
diferă faţă de media populaţiei;
c. diferenţa scorurilor a 2 variabile.

29. Pentru a calcula boltirea alegem:


a. Range;
b.Variance;
c. Skewness;
d. Kurtoses.

30. Histograma:
a. este un grafic folosit în statistica descriptivă;
b. arată o distribuţie de frecvenţă;
c. se foloseşte pentru date calitative.

31.Valid procent:
a. exprimă aceste frecvenţe ca un procent al numărului total excluzând
datele lipsă.
b. frecvenţe ca un procent al numărului total lipsesc incluzând şi datele
care lipsesc.
c. frecvenţa valorilor.

32.Pentru a obţine un tabel de frecvenţe accesăm:


a. analyze/ descriptive statistics/frequences;
b. analyze/ descriptive statistics/descriptives;
c. analyze/ descriptive statistics/frequences/descriptives.

33.Pentru a crea o histogramă accesăm:


a. graphs/histogram;
b. graphs/interactve;
c. graphs/control.

34.O distribuţie poate fi:


a. unimodală;
b. bimodală;
c. trimodală.
104
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

35.Într-o distribuţie simetică:


a. media < mdiana< modul;
b. media = mediana = modul;
c. media >mediana>modul.

36.Într-o distribuţie asimetrică la dreapta:


a. modul <mediana<media;
b. modul>mediana>modul;
c. modul=mediana=modul.

37. Într-o distribuţie asimetrică la dreapta:


a. modul=mediana=media;
b. modul <mediana>modul;
c. modul>mediana>modul.

38. O distribuţie poate fi:


a. leptocurtică;
b. platicurtică;
c. asimetrică pozitiv;
d. asimetrică negativ;
e. mezocurtică.
f. toate variantele de mai sus.

39. O distribuţie leptocurtică arată că:


a. datele sunt foarte grupate şi apropiate de mediană iar lotul de subiecţi
are un grad mare de omogenitate;
b. datele sunt foarte împrăştiate de mediană iar lotul de subiecţi are un
grad mare de eterogenitate;
c. distribuţia este normală.

40.O distribuţie platicurtică arată că:


a. datele sunt foarte grupate şi apropiate de mediană iar lotul de subiecţi
are un grad mare de omogenitate;
b. datele sunt foarte împrăştiate de mediană iar lotul de subiecţi are un
grad mare de eterogenitate;
c. distribuţia este normală.

41.Abaterea standard:
a. este un indice care arată cât de mult deviază (diferă) unele scoruri „în
medie” faţă de media setului de scoruri din care acestea fac parte.
b. este un indice care arată cât de simetrică sau asimetrică este o
distribuţie;
c. este un indice care arată cât de turtită sau boltită este o distribuţie.
105
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

42. Media este o mărime generalizată , adică, înlocuind fiecare nivel


individual al caracteristicii de distribuţie cu nivelul mediu:
a. suma seriei rămâne aceeaşi
b. suma termenilor seriei se modifică
c. suma termenilor seriei este nulă.

43. Media aritmetică reprezintă:


a. valoarea pe care ar purta-o fiecare unitate statistică dacă distribuţia ar fi
eterogenă
b. valoarea pe care ar purta-o fiecare unitate statistică dacă distribuţia ar
fi omogenă
c. valoarea pe care ar purta-o fiecare variabilă statistică dacă distribuţia ar
fi omogenă.

44. Media aritmetică, ca indicator fundamental al tendinţei centrale:


a. reprezintă valoarea care modifică nivelul totalizator;
b. se foloseşte cel mai frecvent şi reprezintă suma valorilor raportată la
numărul lor;
c. se calculează adunând valorile existente;
d. nu poate determina numărul de unităţi din colectivitate.

45. Corelaţia:
a. măsoară variaţia concomitentă a doi factori
b. măsoară parametria distribuţiei între două eşantioane
c. măsoară rangul unei distribuţii trihotomice

46. Corelaţia Pearson(r):


a. evaluează gradul de asociere dintre două variabile măsurate pe scală de
interval/raport.
b. evaluează gradul de asociere dintre două variabile măsurate pe scală
nominală;
c. evaluează gradul de asociere dintre două variabile măsurate pe scală
ordinală.

47. O corelaţie de 1,00 indică:


a. o asociere perfectă între cele două variabile;
b. faptul că toate punctele din diagrama scatter sunt dispersate aleatoriu
în jurul oricărei drepte desenate pe această diagramă a datelor;
c. absenţa oricărei legături (corelaţii) dintre variabile.

48. Pearson este un indicator de corelaţie:


a. parametric;
b. neparametric;
c. ambele variante de mai sus.
106
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

49. Spearman este un indice de corelaţie:


a. parametric;
b. neparametric;
c. ambele variante de mai sus.

50. O corelaţie negativă semnifică faptul că:


a. în timp ce scorurile unei variabile cresc, scorurile pentru cealaltă
variabilă descresc;
b. că scorurile unei variabile se măresc odată cu creşterea scorurilor
celeilalte variabile).
c. nu există nicio legătură între variabile.

51. O corelaţie pozitivă semnifică faptul că:


a. în timp ce scorurile unei variabile cresc, scorurile pentru cealaltă
variabilă descresc;
b. că scorurile unei variabile se măresc odată cu creşterea scorurilor
celeilalte variabile).
c. nu există nicio legătură între variabile.

52. Norul de puncte este folosit pentru:


a. a reprezenta relaţia dintre variabile;
b. a arăta frecvenţa de apariţie pentru diferite clase de valori ale variabilei
observate;
c. a arăta intzervalul de încredere de 95% pentru media respectivă.

53. Pentru a realiza un tabel de asociere selectăm:


a. Analyze/Descrisptiv statistics/crosstabs;
b. Analyze/Descrisptiv statistics/Explore;
c. Statistics / Corelate / Crosstabs
d. Statistics / Custom tables / Crosstabs

54. Tabelul de asociere este folosit pentru:


a. selectarea unor subiecţi
b. prezentarea relaţiilor dintre două variante categoriale
c. recodificarea variabilelor
d. modificarea unui tabel

55. Independent – Samples T Test se aplică în cazul:


a. aceluiaşi eşantion
b. eşantioanelor independente
c. eşantioanelor dependente

107
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

56. Independent – Samples T Test testează:


a. dacă mediile a două grupe sunt egale;
b. dacă mediile a două grupe diferă;
c. dacă se compară mediile pentru un singur grup observat la momente
diferite;

57. Testul „t” se foloseşte pentru:


a. compararea a două seturi de date pentru identificarea diferenţelor;
b. identificarea predictorilor pentru o variabilă numerică;
c. compararea datelor de frecvenţă.

58. One sample T Test este un procedeu prin care:


a. se compară mediile pentru un singur grup observat în momente diferite
b. se testează dacă mediile a două grupe sunt egale
c. se testează dacă media unei variabile este egală cu o constantă
specificată
b. se testează dacă mediile a două grupe diferă

59. Paired – Samples T test:


a. testează dacă mediile a două grupe sunt egale
b. testează dacă media unei variabile este egală cu o constantă specificată
c. compară mediile pentru un singur grup observat în momente diferite
d. compară mediile pentru mai multe medii observate în momente diferite

60. Testul t pentru eşantioane independente este utilizat atunci când:


a. cele două seturi de scoruri ce trebuie comparate provin dintr-un singur
eşantion
b. coeficientul de corelaţie între cele două seturi este mare
c. cele două seturi de variabile provin din două eşantioane diferite de
oameni.

61. Testul t pentru eşantioane perechi este utilizat atunci când:


a. cele două seturi de scoruri ce trebuie comparate provin dintr-un singur
eşantion
b. coeficientul de corelaţie între cele două seturi este mare
c. cele două seturi de variabile provin din două eşantioane diferite de
oameni.

108
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
62. Testul t:
a. este folosit pentru evaluarea semnificaţiei statistice a diferenţei dintre
mediile pentru două seturi de scoruri;
b. este potrivit atunci când variabila dependentă este măsurată pe scală
cantitativă (interval-raport).
c. este utilizat pentru a calcula dacă mediile pentru două seturi de variabile
sunt diferite semnificativ una faţă de cealaltă.

63. Comanda RECODE permite:


a. recodificarea într-o variabilă diferită sau în aceeaşi variabilă;
b. tranformarea unei variabile prin divizarea valorilor acesteia într-un
număr mai mare de categorii;
c. combinarea valorilor acestei variabile cu scopul creării unei alte serii;

64. Comanda RECODE se găseşte în meniul:


a. transform/recode/into different variables;
b. transform/recode/into same variables;
c. ambele variante de mai sus.

65. Chi – Square


a. testează egalitatea a două sau mai multe proporţii
b. testează egalitatea unei proporţii cu o valoare specificată
c. testează egalitatea mediilor a două eşantioane independente
d. testează egalitatea mediilor a două eşantioane perechi

66. Pentru recodificarea în aceeaşi variabilă se selectează:


a. transform/recode/into different variables;
b. transform/recode/into same variables;
c. nicio variantă de mai sus.

67. Pentru recodificarea într-o variabilă diferită se selectează:


a. transform/recode/into different variables;
b. transform/recode/into same variables;
c. nicio variantă de mai sus.

68. Calculul variabilelor noi:


a. adunarea şi scăderea;
b. înmulţirea şi împărţirea;
c. ambele variante de mai sus.

69. Analiza de varianţă (ANOVA):


a. indică măsura în care două sau mai multe grupuri au medii foarte
diferite;
b. calculează variaţia dintre două scoruri;
c. calculează variaţia dintre mediile eşantionului.
109
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

70. ANOVA este utilizată pentru:


a. a testa diferenţa între cel puţin 2 grupuri;
b. a testa diferenţa între cel puţin 3 grupuri;
c. a testa diferenţa între cel puţin 4 grupuri;

71. Analiza two-way de varianţă permite:


a. compararea mediilor unor variabile independente;
b. compararea mediilor dintre două grupuri;
c. compararea mediilor unei variabile dependente atunci când există două
variabile independente.

72. Comparaţiile multiple cu ANOVA:


a. explică modul în care se decise care perechi de medii sunt diferite în
mod semnificativ între ele;
b. se foloseşte atunci când sunt mai mult de două medii;
c. indică scorurile obţinute de respondenţi.

110
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

RĂSPUNSURI CORECTE

1. a. se deschide implicit la lansarea SPSS;


2. a. afişează rezultatele statistice, tabele şi grafice care au asociate
ferestre distincte;
3. a. zone de pe ecran tratate ca elemente de sine stătătoare, cu
caracteristici proprii, care determină acţiunile ce se pot executa în cadrul
lor ;
4. a. data editor;
c. syntax editor;
e. output viewer;
5. a. afişarea rezultatelor;
6. e. să fie unic;
7. c. primul caracter să fie literă;
8. a. o celulă dând clic pe celula respectivă;
9. a. se schimbă fereastra “Data View”;
10. c. mediana este valoarea din centrul distribuţiei, dacă variabilele
numerice sunt ordonate după mărime, de la cea mai mică la cea mai mare;
11. c. mean.
12. a. diagrama Bar şi diagrama Pie
13. d. a reprezenta grafic mediile diferitelor grupe dintr-o colectivitate.
14. a. a reprezenta frecvenţele absolute (numere) şi/sau relative
(procente);
15. b. a arăta forma unei distribuţii după o variabilă înregistrată asupra
unei colectivităţi;
16. c. histograma şi curba frecvenţelor;
17. c. variabile cantitative.
18. a. etichetele categoriilor introduse;

111
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
19. b. graphs/ pie;
20. b. medie, mod, mediană

21. c. mediana este valoarea din centrul distribuţiei, dacă variabilele


numerice sunt ordonate după mărime, de la cea mai mică la cea mai mare.
22. c. statistics / Compare Means / Means;
23. c. S.E. mean;
24. c. Skewness;
25. c. media aritmetică a unui set de scoruri, care se obţine prin însumarea
valorilor şi împărţirea rezultatului la numărul de valori;
26. a. valoarea a măsurii în care scorurile diferă în medie faţă de media
scorurilor pentru o variabilă particulară;
27. a. cât de ascuţită sau turtită este distribuţia scorurilor pentru o
variabilă, comparativ cu distribuţia normală;
28. b. valoarea medie cu care mediile eşantioanelor extrase dintr-o
populaţie, diferă faţă de media populaţiei;
29. d. Kurtoses.
30. a. este un grafic folosit în statistica descriptivă;
b. arată o distribuţie de frecvenţă;
31. a. analyze/ descriptive statistics/frequences;
32. a. analyze/ descriptive statistics/frequences;
33. a. graphs/histogram;
34. a. unimodală;
b. bimodală;
c. trimodală.
35. b. media = mediana = modul;
36. b. modul <mediana<media;
37. c. modul>mediana>modul.
38. f. toate variantele de mai sus.
39. a. datele sunt foarte grupate şi apropiate de mediană iar lotul de
subiecţi are un grad mare de omogenitate;

112
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
40. b. datele sunt foarte împrăştiate de mediană iar lotul de subiecţi are un
grad mare de eterogenitate;
41. a. este un indice care arată cât de mult deviază (diferă) unele scoruri „în
medie” faţă de media setului de scoruri din care acestea fac parte.
42. a) suma seriei rămâne aceeaşi
43. b) valoarea pe care ar purta-o fiecare unitate statistică dacă distribuţia ar
fi omogenă
44. b. se foloseşte cel mai frecvent şi reprezintă suma valorilor raportată la
numărul lor;
45. a. măsoară variaţia concomitentă a doi factori
46. a. evaluează gradul de asociere dintre două variabile măsurate pe scală de
interval/raport.
47. a. o asociere perfectă între cele două variabile;
48. b. neparametric;
49. b. neparametric;
50. a. în timp ce scorurile unei variabile cresc, scorurile pentru cealaltă
variabilă descresc;
51. e. că scorurile unei variabile se măresc odată cu creşterea scorurilor
celeilalte variabile).
52. a. a reprezenta relaţia dintre variabile;
53. a. Analyze/Descrisptiv statistics/crosstabs;
54. b. prezentarea relaţiilor dintre două variante categoriale
55. b. eşantioanelor independente;
56. a. dacă mediile a două grupe sunt egale;
57. a. compararea a două seturi de date pentru identificarea diferenţelor;
58. c. se testează dacă media unei variabile este egală cu o constantă
specificată;
59. c. compară mediile pentru un singur grup observat în momente diferit
60. c. cele două seturi de variabile provin din două eşantioane diferite de
oameni.

113
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu
61. a. cele două seturi de scoruri ce trebuie comparate provin dintr-un singur
eşantion
b. coeficientul de corelaţie între cele două seturi este mare
62. a. este folosit pentru evaluarea semnificaţiei statistice a diferenţei dintre
mediile pentru două seturi de scoruri;
b. este potrivit atunci când variabila dependentă este măsurată pe scală
cantitativă (interval-raport).
c. este utilizat pentru a calcula dacă mediile pentru două seturi de
variabile sunt diferite semnificativ una faţă de cealaltă.
63. a. recodificarea într-o variabilă diferită sau în aceeaşi variabilă;
64. c. ambele variante de mai sus.
65. a. testează egalitatea a două sau mai multe proporţii
66. b. transform/recode/into same variables;
66. a. transform/recode/into different variables;
67. c. ambele variante de mai sus.
68. a. indică măsura în care două sau mai multe grupuri au medii foarte
diferite;
69. b. testa diferenţa între cel puţin 3 grupuri;
70. c. compararea mediilor unei variabile dependente atunci când există
două variabile independente.
71. a. explică modul în care se decise care perechi de medii sunt diferite în
mod semnificativ între ele;
72. a. se foloseşte atunci când sunt mai mult de două medii;

114
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

BIBLIOGRAFIE

1. Benţea, M, Munteanu, G , 2007 – Elemente de statistică economică şi


socială, Ed. “Andrei Şaguna”, Constanţa;
2. Clocotici Vasile, Stan Aurel, 2000 – Statistica aplicată în psihologie, Ed.
Polirom, Iaşi;
3. Howitt, D, (2002), Statistical Methods for Psychology, Ediţia a v-a,
Duxbury Press Boston;
4. Howitt, D, Cramer, D, 2006 – Introducere în SPSS pentru psihologie, Ed.
Polirom, Iaşi;
5. Howitt, D, Cramer, D, 2010 – Introducere în SPSS pentru psihologie,
Ediţia a II-a, Ed. Polirom, Bucureşti;
6. Jaba E., Gramma A., (2004) – Analiza statistică cu SPSS sub Windows,
Ed. Polirom, Iaşi;
7. Opariuc, C.D., 2009 - Statistică aplicată în științele socio-umane.
Noțiuni de bază. Statistici univariate, Editura ASCR, Cluj-Napoca;
8. Opariuc, C.D., 2011 - Statistică aplicată în ştiinţele socio-umane.
Analiza relaţiilor şi a diferenţelor statistice, Editura Arhip-Art, Sibiu;
9. Rotariu T. şi coord., 2006 – Metode statistice aplicate în ştiinţele sociale,
Ed. Polirom, Iaşi;
10. Rus, M., Naidin, M. – 2010 – ”Elemente de statistică aplicată”, Editura
Bren, București.
11. Sava, F. A., (2004) - Analiza datelor în cercetarea psihologică. Metode
statistice complementare. Editura ASCR, Cluj-Napoca;
12. Vasilescu, Ilie P., 1992 – Statistică informatizată pentru ştiinţele despre
om, Ed. Militară, Bucureşti.

115
Aspecte teoretice şi practice ale programului SPSS - Mihaela Sandu

116

S-ar putea să vă placă și