Sunteți pe pagina 1din 130

UNIVERSITATEA TRANSILVANIA DIN BRAȘOV

Facultatea de Psihologie și Științele Educației


Învățământ la distanță

Ana-Maria CAZAN

APLICAȚII COMPUTERIZATE
DE ANALIZĂ A DATELOR

Curs pentru anul III, învățământ la distanță

Brașov, 2015
2
Introducere

Acest curs reprezintă continuarea cursului de Statistica psihologică pentru studenții de


la specializarea Psihologie, prezentând într-o manieră succintă principalele tehnici statistice
descriptive și inferențiale bivariate, specifice datelor obținute în cercetarea psihologică.
Fiecare unitate de curs prezintă noțiunile statistice de bază în scopul reactualizării
cunoștințelor dobândite de către studenți la cursul de statistică din anul I. Calculul
indicatorilor statistici descriptivi cu ajutorul programului SPSS (Software Package used for
Statistical Analysis) este prezentat la finalul fiecărei unități de învățare. Prin intermediul
capturilor de ecran prezentate, cursul își propune să ofere studenților un succint tutorial pentru
tehnicile statistice fundamentale. Rezolvarea testelor de (auto)evaluare reprezintă o modalitate
eficientă de formare a deprinderilor de calcul statistic, studentul având un feedback rapid în
legătură cu gradul de progres atins în însușirea acestor tehnici.

Obiectivele cursului
După parcurgerea acestui curs, studentul va fi capabil:
 Să opereze cu conceptele statistice fundamentale.
 Să determine și să interpreteze caracteristicile de bază ale distribuțiilor
univariate.
 Să testeze ipotezele statistice prin analiza relațiilor dintre variabile și a
diferențelor.

Competente conferite
 Operarea cu concepte fundamentale în domeniul psihologiei.
 Proiectarea şi realizarea unui demers de cercetare în psihologie.

Resurse și mijloace de lucru


Pentru parcurgerea cursului este necesară parcurgerea bibliografiei recomandate în
fișa disciplinei. Folosirea unui program computerizat de analiză a datelor este
esențială. De asemenea, rezolvarea unora dintre aplicații presupune reactualizarea
cunoștințelor din domeniul metodologiei cercetării și al psihologiei experimentale.
Se recomandă un management eficient al timpului alocat studiului la această

3
disciplină, prin asigurarea unui interval suficient destinat consultării surselor
bibliografice, recapitulării și efectuării temelor de control.

Structura cursului
Cursul este compus din nou unități de învățare. La finalul unităților de învățare
sunt prezentate teste de autoevaluare și teste de evaluare.
Temele se vor transmite tutorilor în format electronic, prin intermediul platformei
E-Learning, la datele stabilite la prima întâlnire. Feedback-ul pentru rezolvarea
temelor va fi încărcat pe platforma electronică.

Cerințe preliminare
Discipline necesare a fi parcurse și eventual promovate înaintea acestei discipline
sunt următoarele:
 Statistică aplicată în psihologie
 Metodologia cercetării
Discipline deservite:
 Metode și tehnici experimentale

Durata medie de studiu individual


Timpul necesar parcurgerii unei UI este de aproximativ 2–4 ore de studiu
individual.

Evaluarea
Componența notei finale va fi următoarea:
 Examen: Evaluare prin sarcini de lucru practice, reprezentând 40% din
nota finală.
 Teme de control: Studenții vor rezolva și vor încărca pe platforma E-
learning trei teme la alegere dintre cele prezentate la secțiunile Test de
(auto)evaluare a cunoștințelor, reprezentând 30% din nota finală.
 Proiect de cercetare realizat în echipe de câte 3 studenți. Echipa va
realiza un raport de cercetare în care va exersa cel puțin două tehnici
statistice de testare a ipotezelor, reprezentând 30% din nota finală.

4
Cuprins

Contents
Introducere ............................................................................................................................... 3

Chestionar de evaluare inițială ............................................................................................... 8

Managementul datelor brute. Organizarea bazei de date .................................................. 10


1.1. Introducere .................................................................................................................... 10
1.2. Competenţele unităţii de învăţare .................................................................................. 10
1.3. Măsurarea în psihologie ................................................................................................ 11
1.4. Crearea bazei de date - Folosirea SPSS pentru crearea bazei de date ........................... 15
Test de autoevaluare a cunoștințelor .................................................................................... 17
Test de evaluare a cunoștințelor ........................................................................................... 19

Distribuții și frecvențe ............................................................................................................ 21


2.1. Introducere .................................................................................................................... 21
2.2. Competenţele unităţii de învăţare .................................................................................. 21
2.3. Ordonarea și gruparea datelor ....................................................................................... 22
2.4. Histograma și poligonul frecvențelor ............................................................................ 26
2.4. Folosirea SPSS pentru redarea distribuțiilor și frecvențelor ......................................... 28
Test de (auto)evaluare a cunoştinţelor ................................................................................. 31

Indicatorii statistici descriptivi ............................................................................................. 33


3.1. Introducere .................................................................................................................... 33
3.2. Competenţele unităţii de învăţare .................................................................................. 33
3.3. Indicatorii tendinței centrale .......................................................................................... 34
3.4. Indicatorii împrăștierii ................................................................................................... 36
3.5. Indicatorii formei distribuției ........................................................................................ 38
3.6. Folosirea SPSS pentru calculul indicatorilor descriptivi............................................... 40
Test de (auto)evaluare a cunoștințelor ................................................................................. 45

Testele de comparație – testele t............................................................................................ 48


4.1. Introducere .................................................................................................................... 48
4.2. Competenţele unităţii de învăţare .................................................................................. 48
4.3. Calculul testelor t .......................................................................................................... 49
4.4. Folosirea SPSS pentru calculul testelor t ...................................................................... 53
4.5. Raportarea rezultatelor testelor t în format APA .......................................................... 59
4.6. Calculul mărimii efectului pentru testele t .................................................................... 61
Test de evaluare a cunoștințelor ........................................................................................... 63

5
Test de autoevaluare a cunoștințelor .................................................................................... 65

Testele nonparametrice de comparație. Testul Mann-Whitney și testul Wilcoxon ......... 68


5.1. Introducere .................................................................................................................... 68
5.2. Competenţele unităţii de învăţare .................................................................................. 68
5.3. Testul MANN-WHITNEY pentru două eșantioane independente ............................... 69
5.4. Testul Wilcoxon pentru două eșantioane perechi ........................................................ 69
5.5. Folosirea SPSS pentru calculul testelor nonparametrice............................................... 70
Test de (auto)evaluare a cunoștințelor ................................................................................. 75

Testele de comparație a mediilor grupurilor – ANOVA simplă ........................................ 77


6.1. Introducere .................................................................................................................... 77
6.2. Competenţele unităţii de învăţare .................................................................................. 77
6.3. Analiza de varianță – noțiuni introductive .................................................................... 78
6.4. Folosirea SPSS pentru calculul ANOVA simplă .......................................................... 79
6.5. Raportarea rezultatelor ANOVA în format APA .......................................................... 84
Test de (auto)evaluare a cunoștințelor ................................................................................. 85

Corelația bivariată liniară ..................................................................................................... 87


7.1. Introducere .................................................................................................................... 87
7.2. Competenţele unităţii de învăţare .................................................................................. 87
7.3. Corelația bivariată – concept și condiții de aplicare ..................................................... 88
7.4. Reprezentarea grafică a corelației ................................................................................. 90
7.5. Intrepretarea asocierii dintre două variabile .................................................................. 93
7.6. Corelația parțială ........................................................................................................... 95
7.7.Folosirea SPSS pentru calculul corelației ...................................................................... 97
7.8. Raportarea rezultatelor corelației conform regulilor APA .......................................... 101
Test de (auto) evaluare a cunoștințelor .............................................................................. 102

Regresia liniară simplă ........................................................................................................ 106


8.1. Introducere .................................................................................................................. 106
8.2. Competenţele unităţii de învăţare ................................................................................ 106
8.3. Regresia liniară simplă – noțiuni de bază.................................................................... 107
8.4. Condiţii de aplicare pentru regresia liniară simplă şi multiplă ................................... 109
8.5. Folosirea SPSS pentru calculul regresiei liniare simple.............................................. 110
8.6. Raportarea rezultatelor analizei de regresie în format APA ....................................... 112
Test de (auto) evaluare a cunoștințelor .............................................................................. 114

Tehnicile chi pătrat .............................................................................................................. 117


9.1. Introducere .................................................................................................................. 117
9.2. Competențele unității de învățare ................................................................................ 117
9.3. Testul chi-pătrat pentru gradul de potrivire................................................................. 118
6
9.4. Testul chi-pătrat pentru gradul de asociere sau independență ..................................... 119
9.5. Folosirea SPSS pentru calculul chi pătrat ................................................................... 122
Test de (auto) evaluare a cunoștințelor .............................................................................. 127

Bibliografie ............................................................................................................................ 129

Webografie ............................................................................................................................ 130

7
Chestionar de evaluare inițială

Alegeți răspunsul corect pentru fiecare dintre întrebările de mai jos:

1. Măsurătorile nominale tind să aibă validitate mai scăzută decât cele ordinale.
 Adevărat  Fals
2. Outlierul se mai numește și valoare aberantă și se află la o distanță mai mare de o cutie și
jumătate (1,5 abateri intercuartile).
 Adevărat  Fals
3. Media este influențată de valorile atipice sau extreme.
 Adevărat  Fals
4. Testul t pentru eșantioane independente pleacă de la asumpția că varianțele variabilelor
normal distribuite sunt:
a) mari; b) medii; c) mici; d) egale.
5. O corelație puternică între variabilele X şi Y arată că x influențează pe Y.
 Adevărat  Fals
6. Un cercetător a descoperit ca studenții care au multe absențe obțin note mici la examen.
Corelația dintre cele două variabile este:
a) pozitivă; b) negativă c) nu există nicio corelație
7. Să presupunem ca aţi obţinut un coeficient de corelaţie de 1,3 între două variabile. Acest
coeficient indică o corelaţie foarte puternică.
 Adevărat  Fals
8. Dacă într-un model de regresie liniară simplă există o corelaţie foarte puternică între
variabila dependentă şi variabila independentă, atunci coeficientul de corelaţie va fi:
a) apropiat de valoarea 0; b) apropiat de valoarea -1; c) apropiat de valoarea +1; d)
apropiat de valoarea -1 sau +1.
9. Testul chi pătrat pentru potrivire este folosit pentru verificarea reprezentativității unui
eșantion.
 Adevărat  Fals
10. Testul Mann-Whitney este echivalentul testului t pentru eșantioane dependente.
 Adevărat  Fals
8
Rezolvarea testului de evaluare inițială:

1, Adevărat;
2, Fals;
3, Adevărat;
4, d);
5, Fals,
6, b);
7, Fals;
8, d); 9,
Adevărat;
0, Fals.

9
Unitatea de învățare I.1.

Managementul datelor brute. Organizarea bazei de date

Cuprins
1.1. Introducere ................................................................................................................
1.2. Competențe ................................................................................................................
1.3. Măsurarea în psihologie ............................................................................................
1.4. Crearea bazei de date ...............................................................................................

1.1. Introducere

Unitatea de învățare își propune reactualizarea principalelor concepte


utilizate în statistică: populație, individ, variabilă, scală de măsură. Măsurarea în
psihologie trebuie înțeleasă ca atribuire de numere datelor continue sau
discontinue (discrete). Există mai multe tipuri de măsurare în funcţie de tipul de
scală utilizat: nominală, ordinală, de interval şi de raport. Termenul de populaţie
statistică nu este sinonim cu cel de populaţie din limbajul comun. Indivizii care
compun populația statistică se pot diferenţia în funcţie de vârstă, sex, mediu de
provenienţă, nivelul propriu de instrucţie sau al părinţilor, status cultural, nivel
economic, religie, rasă, etnie etc. Fiecare dintre aceste criterii care operează
diferenţe se numeşte variabilă.

1.2. Competenţele unităţii de învăţare

După parcurgerea acestei unități, studenții vor fi capabili:


 să dea exemple de variabile numerice și categoriale;
 să diferenţieze variabilele continue de cele discrete;
 să recunoască scalele de măsurare adecvate în diverse exemple.
 Să creeze o bază de date respectând regulile de organizare a datelor.

Durata medie de parcurgere a primei unități de învățare este de 2 ore.

10
1.3. Măsurarea în psihologie

Măsurarea în psihologie trebuie înțeleasă ca atribuire de numere datelor continue sau


discontinue (discrete). Există mai multe tipuri de măsurare în funcţie de tipul de scală utilizat:
nominală, ordinală, de interval şi de raport. O scală are proprietatea magnitudinii atunci
când o caracteristică a atributului măsurat reprezintă mai mult, mai puţin sau la fel o cantitate
sau însuşire, comparativ cu o altă stare a aceluiaşi atribut. O scală are intervale egale dacă
diferenţa dintre două puncte aflate pe oricare zonă a scalei are aceeaşi semnificaţie ca
diferenţa dintre alte două puncte care diferă prin acelaşi număr de unităţi. Zero absolut este
posibil de evidenţiat când variabila măsurată are un nivel la care ea nu mai există deloc: zero
ca distanţă înseamnă absenţa oricărei distanţe.
Scala nominală nu are nici una dintre cele trei caracteristici enumerate anterior. Scopul
ei este să numească obiectele. Scala ordinală permite ca elementele să fie aranjate fie
crescător, fie descrescător, existând şi posibilitatea ca mai multe elemente să ocupe acelaşi
loc. Scala ordinală posedă caracteristica magnitudinii. Scalele de interval specifică mărimea
exactă a intervalelor sau a distanţelor care separă elementele aflate pe toate treptele succesive
ale scalei, având o unitate constantă şi comună de măsură. Scala de raport are toate
proprietăţile unei scale de măsură: magnitudine, intervale egale şi zero absolut, fiind
caracteristică mărimilor fizice (Clinciu, 2013).

Exemplu
Un cercetător vrea să măsoare nivelul de stres pe care îl manifestă angajații la
locul de muncă. El construiește un chestionar care măsoară stresul. Una dintre
întrebări este următoarea: “Cât de stresat v-ați simțit în ultima săptămână la locul
de muncă?”. Răspunsul participanților la cercetare se măsoară pe o scală în cinci
trepte, unde 1 înseamnă deloc stresat iar 5 foarte stresat. În acest exemplu,
variabila este stresul manifestat de angajați; stresul poate să ia valori de la 1 la 5
iar răspunsul oricăruia dintre participanți reprezintă un scor posibil. Participanții
reprezintă cazurile.

Aplicația 1
Un tată îşi evaluează fiica cu doi pe o scală cu cinci puncte (unde 1 înseamnă
total dezinteres, 2 dezinteres, 3 nici dezinteres nici interes, 4 interes, 5 interes
total) în ceea ce priveşte importanţa pe care aceasta o acordă studiilor. În acest
exemplu, care este variabila, care este scorul/valoarea particulară a fetei, ce fel de
scală este utilizată, care este domeniul de variaţie al acestei variabile?
.

11
Să ne reamintim..
Termen Definiție Exemplu
Înălțimea, greutatea, genul,
naționalitatea,
Caracteristică ce poate lua diverse calificativele școlare,
Variabilă
valori ordinea pe o listă de
așteptare, anxietatea,
stresul
0, 5, 25, 1200, român,
Valoare Număr sau categorie femeie, I, VI, suficient,
34,5
0, 5, 25, 1200, român,
Valoarea particulară a unei variabile
Scor femeie, I, VI, suficient,
pentru o persoană
34,5
(Aron, Aron, & Aron, 2013)

 Tipuri de variabile: Numerice – nominale


? Care este diferenţa dintre o variabilă numerică şi una nominală?
- Variabila din exemplul de mai sus este o variabilă numerică, valoarea sa exprimându-se prin
număr. Variabilele numerice se mai numesc și variabile cantitative.
- Variabilele nominale sunt acele variabile ale căror valori sunt categorii sau nume. Aceste
variabile se mai numesc și variabile calitative.

 Tipuri de variabile: continue - discrete


? Care este diferenţa dintre o variabilă discretă şi una continuă?
- Variabila discretă este acea variabilă care are valori specifice și care nu poate avea valori
situate între valorile specifice.
- Variabila continuă poate să ia o infinitate de valori între oricare două valori ale variabilei.

Aplicația 2
Analizați tabelul de mai jos și propuneți minimum trei exemple noi pentru
fiecare tip de variabilă.
Tip de Exemple ???
variabilă
Înălțimea …………………………………
Numerică Nivelul stresului …………………………………
Coeficientul de inteligență …………………………………
Mediul de proveniență …………………………………
Categorială Genul …………………………………
Culoarea ochilor …………………………………
Numărul de discipline studiate pe an …………………………………
Discretă Numărul de persoane dintr-o sală …………………………………
Numărul de vizite la dentist …………………………………
Durata unui spot publicitar …………………………………
Continuă Greutatea …………………………………
Vârsta …………………………………

12
Aplicația 3

Analizaţi lista de mai jos şi decideţi care variabile sunt discrete şi care sunt
continue:
(a) lungimea piciorului unui copil;
(b) mărimea la pantofi a unui copil;
(c) durata unui film;
(d) timpul de parcurgere a unei curse;
(e) numărul alergătorilor dintr-o cursă;
(f) temperatura aerului;
(g) numărul de chibrituri dintr-o cutie;
(h) viteza unei maşini;
(i) numărul de goluri marcate la un meci;
(j) timpul arătat pe un ceas cu display digital.

 Scalele de măsurare: nominale, ordinale, de interval, de raport


 Scala nominală are ca valori nume sau categorii și este considerată cel mai scăzut
nivel de măsurare, neavând niciuna dintre proprietățile scalelor. O condiție importantă
a scalei nominale este ca un individ să se afle numai într-una dintre categorii la un
moment dat. Atunci când datele sunt clasificate, nu sunt plasate întâmplător în
categorii; se pornește de la judecăți calitative bazate pe similarități și diferențe.
Numerele sunt folosite numai în scop calitativ, fiind mai degrabă etichete care sunt
atribuite categoriilor (Peers, 2006). De exemplu, variabila categorială profil de
învățământ primește eticheta 1 pentru categoria profil uman și eticheta 2 pentru
categoria profil real.
 Scala ordinală este caracteristică variabilei ale cărei valori sunt rangurile sau
ierarhiile. Un exemplu este ordinea trecerii liniei de sosire la un maraton. Scala
ordinală posedă proprietatea magnitudinii. Ierarhiilor li se pot aloca numere care
reflectă ordinea diferenței calitative (Peers, 2006). Deși spunem că cel care trece linia
de sosire este mai rapid decât toți ceilalți (magnitudine), nu putem afirma că cel situat
pe locul întâi este de trei ori mai rapid decât cel situat pe locul al treilea.
 Scala de interval are, în afară de proprietatea magnitudinii și pe cea a intervalelor
egale dar neexistând un punct zero, intervalele pot fi deplasate, extinse sau
comprimate, dacă prin aceasta ele devin mai maniabile sau mai bine adaptate realităţii
măsurate (Clinciu A. I., 2013). Astfel, diferența dintre nota 3 și nota 5 este egală cu
diferența dintre nota 7 și nota 9 dar nu putem afirma că cel care a luat nota 9 are de trei
ori mai multe competențe decât cel care a luat nota 3.
 Scala de raport are toate proprietățile scalelor de măsurare și este caracteristică, de
obicei, măsurătorilor din fizică unde zero absolut înseamnă inexistența caracteristicii

13
măsurate. Zero bătăi ale inimii pe minut înseamnă absența vieții, dar punctajul zero
obținut de o persoană la un chestionar de stimă de sine nu înseamnă că persoanei
respective îi lipsește stima de sine.

Proprietăţi
Tip de scală Magnitudine Intervale egale Zero absolut
Nominală - - -
Ordinală X - -
De interval X X -
De raport X X X
(Clinciu A. I., 2013)

Aplicația 4
Să presupunem că vrem să cunoaştem opinia studenţilor faţă de următoarea
propunere: cursurile se vor ţine şi sâmbăta. Determinaţi diferitele scale de
măsură posibile.

Aplicația 5
Determinaţi nivelul de măsurare (scala de măsurare) pentru următoarele
variabile: (a) grupul etnic căruia îi aparţine un individ, (b) numărul de greşeli pe
care le face un şoarece în parcurgerea unui labirint, (c) poziţia pe care cineva se
află la sfârşitul unei curse, (d) nivelul anxietăţii unui individ.

Aplicația 6
Citiţi afirmaţiile de mai jos. Dacă vreuna dintre ele vi se pare incorectă,
specificaţi în ce constă greşeala. Specificaţi şi tipul de scală pe care pot fi
măsurate variabilele prezentate:
a) Manchester United a marcat 6 goluri – de două ori mai multe decât rivala sa,
Charlton Athletic.
b) S-a trezit la ora 6 p.m. – de două ori mai târziu decât îşi programase ceasul,
adică la ora 3 p.m.
c) S-a întors cu 6 ore mai târziu decât sora ei care a venit cu 3 ore mai târziu
decât promiseseră.
d) Temperatura a fost de 15 ºC dar săptămâna trecută a fost de două ori mai
cald, au fost 30 ºC.
e) S-a clasat pe locul 4, de două ori mai slab decât colegul său care s-a clasat pe
locul 2 la proba de alergare.

14
Aplicația 7
Clasificați următoarele tipuri de măsurători:
a) Răspunsul la o întrebare dintr-un chestionar: cum apreciați afirmația:
Adolescenții preferă emisiunile muzicale?, măsurată pe următoarea scală: 1 =
In mică măsură adevărat, 2 = Nici adevărat, nici fals, 3 = În mare măsură
adevărat
b) Scalele de măsurare a greutății
c) Numărul de bătăi ale inimii pe minut
d) Numerele de pe tricourile fotbaliștilor
e) Scorul la un chestionar care măsoară stima de sine.
f) Genul
g) Scorul la un test de cunoştinţe
h) Coeficientul de inteligenţă
i) Distanța de la școală până acasă.

Aplicația 8
Poate o variabilă ordinală să fie măsurată cu o scală continuă (de interval sau de
raport)? Poate o variabilă continuă să fie măsurată cu o scală ordinală?
Argumentaţi folosind câte un exemplu adecvat (Clinciu A. I., 2013).

Aplicația 9
Unui student îi este prezentat un şir de 50 de cuvinte pentru a le memora şi pentru
a-şi aminti mai târziu cât mai multe dintre ele, la diferite intervale de timp.
Participantul a reactualizat 17 cuvinte după o oră, 10 după o zi, 7 după o
săptămână. Răspundeți la următoarele întrebări:
(a) Care sunt variabilele?
(b) Care sunt valorile posibile pe care le-ar putea obţine subiectul?
(c) Care sunt scorurile subiectului?
(d) Pe ce scală poate fi măsurată variabila număr de cuvinte reactualizate?

1.4. Crearea bazei de date - Folosirea SPSS pentru crearea bazei de date

 Deschideți o bază de date nouă.


 Type in data.
 OK.
 Selectați Variable view.
 Definiți numele (Name), tipul variabilei (Type – Numeric pentru date numerice, String
pentru cele nominale).

15
 Completați câmpurile Width și Decimals cu valorile corespunzătoare datelor pe care
trebuie să le introduceți.
 Completați la Label numele complet al variabilei.
 Values – este util pentru variabilele măsurate pe scale nominale, pentru că fiecărei
categorii îi atribuim o valoare numerică.
 De la Measures alegem scala de măsură adecvată: Nominal, Ordinal sau Scale.

 După ce ați definit toate variabilele, reveniți în meniul Data view și introduceți datele
pe linii, pentru fiecare subiect în parte.

16
Rezumat
Cele trei proprietăți ale scalelor sunt magnitudinea, intervalele egale și
zero absolut. Nivelurile de măsurare în științele socio-umane sunt: nivelul
nominal, ordinal, de interval și de raport. Scala nominală nu are nici una dintre
cele trei caracteristici enumerate anterior. Scopul ei este să numească obiectele.
Scala ordinală permite ca elementele să fie aranjate fie crescător, fie
descrescător, existând şi posibilitatea ca mai multe elemente să ocupe acelaşi loc.
Scala ordinală posedă caracteristica magnitudinii. Scalele de interval specifică
mărimea exactă a intervalelor sau a distanţelor care separă elementele aflate pe
toate treptele succesive ale scalei, având o unitate constantă şi comună de
măsură. Scala de raport are toate proprietăţile unei scale de măsură:
magnitudine, intervale egale şi zero absolut, fiind caracteristică mărimilor fizice.

Test de autoevaluare a cunoștințelor

1. Indicaţi nivelul de măsurare pentru fiecare dintre următoarele variabile:


a) naţionalitatea unei persoane (american, mexican, canadian, român, etc);
b) scorul unei persoane la un test de inteligenţă;
c) locul unei persoane pe o listă de aşteptare;
d) religia;
e) nivelul anxietăţii;
f) poziţia pe care o ocupă un atlet la sfârşitul unei probe;
g) timpul de reacţie;
h) calificativele şcolare;
i) nivelul stimei de sine;
j) salariul.

2. Transformaţi variabila profil de învăţământ cu patru categorii într-o variabilă cu


două categorii:
profil de învăţământ: 1 = matematică, 2 = informatică, 3 = limbi străine, 4 = științe
socioumane.
...…………………………………………………………………………………………
...…………………………………………………………………………………………
……….……………………..……………………………………………………………
3. Transformați variabila vârstă dintr-o variabilă continuă într-una categorială.
17
...…………………………………………………………………………………………
...…………………………………………………………………………………………
……….……………………..……………………………………………………………
4. Alegeţi varianta corectă:
4.1.Variabilele discrete sunt cele care:
 pot lua numai valori întregi
 pot lua orice valoare într-un interval dat
4.2.“Numărul membrilor unei familii” reprezintă o variabilă cantitativă:
 continuă
 discretă
 calitativă
 categorială
4.3.Pe ce tip de scală se măsoară variabila “poziţia în clasament”?
 nominală
 ordinală
 de intervale
 de rapoarte
4.4.Pe ce tip de scală se exprimă variabila la care un subiect obţine scorul 40
milisecunde?
 nominală
 ordinală
 de intervale
 de rapoarte
4.5.Scalele de intervale împreună cu scalele de rapoarte fac parte din categoria
scalelor ________________________ .
4.6.Rangul este pentru scala ordinală ceea ce categoria este pentru scala:
 nominală
 ordinală
 de intervale
 de rapoarte
4.7.Care dintre următoarele caracteristici nu se potrivește pentru o scală de interval?
 Jim este mai mare decât Sally cu două unități
 Jim este mai mare decât Sally
 Jim este de două ori mai bun decât Sally
 Jim este diferit de Sally
4.8. Ce tip de scală este implicată în următoarea afirmație: Scorul obținut de Ioana
este de 3 ori mai mare decât cel obținut de Andrei.
 nominală

18
 ordinală
 de intervale
 de rapoarte

5. Adevărat sau fals?


5.1.Măsurătorile nominale tind să aibă validitate mai scăzută decât cele ordinale.
 Adevărat  Fals
5.2.Scalele nominale si cele ordinale permit calcule statistice parametrice.
 Adevărat  Fals
5.3.Variabila dependentă dintr-o cercetare poate deveni variabilă independentă în
altă cercetare.
 Adevărat  Fals
5.4.Pentru datele culese pe o scală ordinală putem face media deoarece aceasta are
proprietatea aditivităţii.
 Adevărat  Fals
5.5.Numărul de amenzi primite pe an într-un oraș este o variabilă continuă.
 Adevărat  Fals
5.6.Scalele nominale evidențiază diferențe cantitative între indivizi.
 Adevărat  Fals
5.7.Scala de intervale permite deplasarea punctului zero (adică a originii) spre stânga
sau spre dreapta scalei şi, de asemenea, permite comprimarea sau dilatarea
acesteia.
 Adevărat  Fals
5.8.Scala de raport are zero convențional.
 Adevărat  Fals
5.9.Durata unui film este o variabilă continuă.
 Adevărat  Fals
5.10. Variabila dihotomică este în același timp și variabilă discretă.
 Adevărat  Fals
5.11. Populația este pentru parametru ceea ce eșantionul este pentru indicatorul
statistic.
 Adevărat  Fals

Test de evaluare a cunoștințelor


Un cercetător a cerut următoarele informații unui număr de 10 persoane:
- Genul (masculin sau feminin)
- Vârsta (în ani împliniți)

19
- Câte minute se uită în fiecare seară la TV
- Care este tipul de program preferat (film, știri, documentar, lifestyle sau sport)
- Pe o scară de la 1 la 5 cât de mulțumiți sunt de programele vizionate (unde 1
înseamnă deloc mulțumit iar 5 foarte mulțumit)
Datele sunt prezentate în tabelul de mai jos.

Cerințe:
a) Introduceți datele într-un fișier SPSS.
b) Creați variabilele, etichetați variabilele, acordați valori variabilelor
categoriale, alegeți scala de măsură adecvată pentru fiecare variabilă.
c) Salvați fișierul cu numele Baza de date_exercitiu.sav si încărcați-o pe
platformă la secțiunea corespunzătoare.

Nr_crt Nume Gen Varsta Minute_TV Program Multumire


1 Ion Masculin 21 170 stiri 1
2 Maria Feminin 20 140 film 2
3 Andreea Feminin 22 60 documentar 5
4 Dan Masculin 24 240 stiri 3
5 Vlad Masculin 19 120 documentar 5
6 Ioana Feminin 20 50 lifestyle 2
7 Dana Feminin 21 60 sport 2
8 Marius Masculin 22 75 stiri 3
9 Liliana Feminin 21 120 film 3
10 Doru Masculin 25 60 sport 1

20
Unitatea de învăţare I.2.

Distribuții și frecvențe

Cuprins
2.1. Introducere ................................................................................................................
2.2. Competenţe ................................................................................................................
2.3. Ordonarea și gruparea datelor ..................................................................................
2.4. Histograma și poligonul frecvențelor ........................................................................
2.5. Folosirea SPSS pentru redarea distribuțiilor și frecvențelor ....................................

2.1. Introducere

Unitatea de învățare Distribuții și frecvențe propune studenților


familiarizarea cu noțiunile de distribuție, efectiv, simetrie, boltire. Studenții vor
exersa abilități de redare grafică a unei distribuții, interpretarea rezultatelor
obținute, identificarea cazurilor care influențează normalitatea distribuției.

2.2. Competenţele unităţii de învăţare

După parcurgerea acestei unități, studenții vor fi capabili:


 să explice principalele reguli de organizare a datelor;
 să identifice avantajele și dezavantajele reprezentărilor grafice în
prezentarea datelor;
 să realizeze grafice de tip histogramă și grafice cu bare;
 să interpreteze grafice făcând referire la simetrie și la boltire;
 să calculeze frecvențele absolute și relative ale unui șir de date;
 să interpreteze tabele care conțin valori ale frecvențelor.

Durata medie de parcurgere a acestei unităţi de învăţare este de 2 ore.

21
2.3. Ordonarea și gruparea datelor

 Pași pentru ordonarea și gruparea datelor


- Identificăm în șirul de date valorile Xmin și Xmax.
- Pe o foaie de hârtie cu liniatură matematică, se trec toate valorile în ordine strict
crescătoare, de la Xmin la Xmax, alocând fiecărei valori o pătrățică.
- Descărcăm datele, trecând în dreptul fiecărui scor un X, pentru fiecare apariție. De
exemplu, dacă scorul 5 apare de trei ori, vom avea în dreptul scorului 5 de trei ori X, trei
reprezentând în acest caz frecvența brută a scorului 5.
- La sfârşitul operaţiei vom număra frecvenţele corespunzătoare fiecărui scor de la Xmin la
Xmax şi numărul va fi trecut sub pătrăţica corespunzătoare fiecărui scor. Acestea sunt
frecvențele brute sau frecvențele absolute. Suma tuturor frecvențelor brute trebuie să fie
egală cu N (numărul total de cazuri).
- Inspecţia vizuală evidenţiază următoarele aspecte:
- amplitudinea scorurilor (Xmax - Xmin);
- aglomerarea datelor.

Exemplu

Se dă următorul șir de date care reprezintă notele obținute de 15 studenți la


un test de statistică: 9, 5, 4, 7, 8, 9, 8, 7, 10, 6, 8, 7, 10, 3, 8.

x
x x
x x x x
x x x x x x x x
Scor 1 2 3 4 5 6 7 8 9 10
Frecvență 0 0 1 1 1 1 3 4 2 2

În acest exemplu, Xmin este 3, Xmax este 5. Scorul cu frecvența cea mai mare
de apariție este 8. Amplitudinea scorurilor este Xmax - Xmin = 10 - 3 = 7.
Cele mai multe date sunt aglomerate spre dreaptă, deci distribuția pare să
fie asimetrică negativ.

22
Să ne reamintim...

 Realizarea tabelului de frecvențe


- Desenați un tabel cu următoarele coloane: scor, frecvență brută, frecvență
brută cumulată, frecvență relativă, frecvență relativă cumulată.
- Introduceți scorurile în tabel în ordine crescătoare.
- Completați coloana frecvențelor brute și brute cumulate. Prima frecvență
brută cumulată este identică cu prima frecvență brută, pentru următoarele,
adunați la prima frecvență brută, pe cea imediat următoare.
- Completați coloana frecvențelor relative și relative cumulate, transformând în
procente frecvențele brute, după regula de trei simplă.

Exemplu

Pornim de la datele de la exemplul anterior.


Scor Fr. brută Fr. brută Fr. relativă Fr. rel. cum.
cum.
1 0 0 0 0
2 0 0 0 0
3 1 1 6,66 6,6
4 1 2 6,66 13,3
5 1 3 6,66 20
6 1 4 6,66 26,6
7 3 7 20 46,6
8 4 11 26,6 73,3
9 2 13 13,3 86,6
10 2 15 13,3 100

Aplicaţia 1
Se dă următorul șir de date care reprezintă greutatea unui grup de 20
studente: 65, 60, 55, 54, 50, 54, 55, 62, 51, 55, 49, 60, 55, 48, 51, 52, 55,
62, 57, 58. Ordonați aceste date, calculați frecvențele absolute și
amplitudinea împrăștierii. Interpretați rezultatele obținute, făcând referire
la aglomerarea datelor. Realizați tabelul frecvențelor pentru aceste date

23
 Gruparea datelor
- Primul pas constă în stabilirea intervalului de grupare, după următoarele reguli:
- nu mai puţin de 5 - 7 intervale şi nu mai mult de 20
- pentru mărimea intervalului folosim numere impare (3, 5 sau 7), pentru a avea ca
valori centrale de interval numere întregi
- Determinarea mărimii intervalului: amplitudinea împrăştierii se împarte la câteva din
mărimile dorite ale intervalului, pentru a vedea câte clase rezultă şi se alege aceea care se
apropie cel mai mult de numărul de clase considerat convenabil.
- Primul interval este bine să înceapă cu un multiplu al mărimii lui. De exemplu, intervalele
de lungime 3 pot începe cu 3, 6 sau 9 (Clinciu A. I., 2013).

Exemplu

O grupă de studenți au fost rugați să răspundă la următoarea întrebare: Câte ore


ați învățat pe săptămână pentru a vă pregăti pentru examenul de statistică?
Răspunsurile studenților sunt prezentate mai jos:
2, 10, 15, 5, 30, 24, 4, 7, 22, 20, 3, 8, 35, 0, 18, 15, 33, 5, 10, 30, 12, 7, 20, 6, 7.

În acest exemplu, Xmin este 0, Xmax este 35. Amplitudinea scorurilor este Xmax -
Xmin = 35 - 0 = 35. În cazul nostru, dacă am dori să avem intervale de mărimea
cinci, atunci rezultă 35/5 = 7 intervale, iar dacă am dori intervale de șapte, atunci
ar rezulta 35/7= 5 intervale. Cum șapte intervale ar fi prea puține, alegem prima
situație, în care mărimea intervalului este cinci.

Frecvență 4 7 3 3
interval x
x x x x
x x x x x x x x x x x x
Scor 0 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19
Frecvență 1 0 1 1 1 2 1 3 1 0 2 0 1 0 0 2 0 0 1 0

24
Frecvență 4 0 3 1
interval x x
x x x x x x
Scor 2 2 2 2 2 2 2 2 2 2 3 3 3 3 3 3 3 3
0 1 2 3 4 5 6 7 8 9 0 1 2 3 4 5 6 7
Frecvență 2 0 1 0 1 0 0 0 0 0 2 0 0 1 0 1 0 0

 Realizarea tabelului de frecvențe pentru date grupate


- Realizăm un tabel cu următoarele coloane: scoruri clase, limite exacte, centrul intervalului
(punctul central), frecvențe brute, frecvențe brute cumulate, frecvențe relative, frecvențe
relative cumulate, frecvența brută X centrul intervalului, număr interval.
- În locul scorurilor, introducem intervalele. Limitele exacte ale intervalelor se obțin
scăzând 0,5 din limita inferioară a intervalului și adăugând 0,5 la limita superioară a
intervalului identificat.
- Coloanele cu frecvențe brute, frecvențe brute cumulate, frecvențe relative, frecvențe
relative cumulate se calculează după același algoritm ca în cazul datelor negrupate.
- Pe penultima coloană, se calculează pentru fiecare interval produsul dintre centrul
intervalului și frecvența brută.

Exemplu

Introducem în tabel datele de la exemplul anterior

F. br. *
Scoruri Limite Punctul Frecv. F.br. Frecv. F. rel. Nr.
centrul
clase exacte central brute cum. relative cum. interval
int.
0-4 -0,5-4,5 2 4 4 16 16 8 1
5-9 4,5-9,5 7 7 11 28 44 49 2
10-14 9,5-14,5 12 3 14 12 56 36 3
15-19 14,5-19,5 17 3 17 12 68 51 4
20-24 19,5-24,5 22 4 21 16 84 88 5
25-29 24,5-29,5 27 0 21 0 84 0 6
30-34 29,5-34,5 32 3 24 12 96 96 7
35-39 34,5-39,5 37 1 25 4 100 37 8
N=25 Σ=100

25
Aplicaţia 2

Mai jos, sunt prezentate numărul de minute necesare unui grup de 34 de


copii cu vârsta de 10 ani pentru a realiza o serie de puzzle-uri abstracte:
24, 83, 36, 22, 81, 39, 60, 62, 38, 66, 38, 36, 45, 20, 20, 67, 41,
87, 41, 82, 35, 82, 28, 80, 80, 68, 40, 27, 43, 80, 31, 89, 83, 24.
a) Realizaţi tabelul frecvenţelor (brute, brute cumulate, relative,
relative cumulate).
b) Realizaţi tabelul pentru date grupate. Stabiliţi centrul intervalelor.

2.4. Histograma și poligonul frecvențelor


Informațiile prezentate în tabelul de frecvențe pot fi redate sub forma unui grafic, numit
histogramă. Într-o histogramă, înălțimea fiecărei bare reprezintă frecvența fiecărui scor
sau interval de scoruri (Aron, Aron, & Aron, 2013). Histograma este informativă în
legătură cu forma distribuţiei, cu simetria ei, dar este mai puţin adecvată pentru a exprima
boltirea (aplatizarea acesteia).

 Pași pentru realizarea histogramei și a poligonului frecvențelor


- Realizați tabelul frecvențelor.
- Redați pe axa OX scorurile sau intervalele de scoruri, în ordine crescătoare și marcați
printr-un punct centrul intervalului (este bine să alegeți ca unitate de măsură pentru
scoruri sau intervale două căsuțe din caietul de matematică).
- Pe axa OY marcați frecvențele de la zero la cea mai ridicată frecvență întâlnită.
- Identificați punctul de intersecție dintre centrul intervalului și frecvența corespunzătoare
fiecărui interval.
- Desenați barele histogramei.
- Pentru poligonul frecvențelor, uniți centrele intervalelor succesive prin linii drepte.
! Histograma și poligonul frecvențelor pot fi realizate atât pentru frecvențe brute,
cât și cumulate.

Exemplu
Histograma și poligonul frecvențelor brute și histograma și poligonul
frecvențelor brute cumulate
26
Aplicaţia 4

Arătaţi pe scurt care sunt asemănările şi deosebirile dintre histogramă şi


poligonul frecvenţelor ca mijloace de reprezentare şi vizualizare a datelor.

Aplicaţia 5

Explicați diferențele dintre o distribuție unimodală și o distribuție


multimodală în termenii:
a) Histogramei
b) Tabelului de frecvențe (Aron, Aron, & Aron, 2013).

 Alte tipuri de reprezentări grafice


- Graficul cu bare reprezintă o reprezentare grafică specifică variabilelor măsurate pe scale
nominale, lungimea barelor fiind echivalentă cu frecvența categoriei.
- Graficul de tip ”plăcintă” (pie) se prezintă sub forma unui sector de cerc cu arii
proporționale cu frecvența categoriilor sau intervalelor, fiind folosite cel mai adesea
pentru redarea variabilelor măsurate pe scale nominale (Lwanga, Tye, & Ayeni, 1999).

27
2.4. Folosirea SPSS pentru redarea distribuțiilor și frecvențelor
 Crearea unui tabel de frecvențe
Se dă următorul șir de date care reprezintă notele obținute de 15 studenți la un test de
statistică: 9, 5, 4, 7, 8, 9, 8, 7, 10, 6, 8, 7, 10, 3, 8. Introduceți aceste date în SPSS.
 Analyze.
 Descriptive Statistics.
 Frequencies.
 Selectați variabila pentru care doriți să calculați frecvențele și introduceți-o în
câmpul Variable(s).
 Bifați opțiunea Display frequency tables.
 OK.

28
 Crearea graficelor din meniul Frequencies
 Reluați toți pașii pentru redarea tabelului de frecvențe.
 Charts.
 Alegeți tipul de grafic dorit, în funcție de datele cu care lucrați. Pentru
Histogramă, alegeți Histogram.
 Show normal curve (redarea curbei distribuției normale).
 Continue.
 Dacă nu mai aveți nevoie de tabelul de frecvențe, debifați Display frequency
tables.
 OK.

29
 Crearea tabelelor de tipul Crosstabs

 Analyze > Descriptive Statistics > Crosstabs

30
Rezumat

Pentru determinarea celor mai importanţi indicatori statistici avem


nevoie de frecvenţe. În domeniul variabilei, fiecare mărime are un număr de
reprezentanţi, numit „efectiv”. Efectivul se numeşte frecvenţă absolută. Când
frecvenţa este transformată în procente, ea se numeşte frecvenţă relativă.
Histograma este un grafic care dă o imagine în „scară” a distribuţiei, fiind cea
mai potrivită reprezentare a datelor ordinale, discontinue. Histograma este
informativă în legătură cu forma distribuţiei, cu simetria ei, dar este mai puţin
adecvată să exprime boltirea (aplatizarea acesteia). Cea mai bună redare a
datelor de interval o constituie poligonul frecvenţelor.
O distribuţie poate fi simetrică, atunci când cele două cozi ale sale se
repartizează simetric în raport cu tendinţa centrală care este media ; poate fi
asimetrică spre stânga, situaţie în care cel mai mare volum de date se
aglomerează spre latura stângă. O asemenea distribuţie se cheamă pozitivă.
Situaţia inversă este cea a datelor aglomerate spre dreapta. O asemenea
distribuţie se cheamă negativă. Boltirea arată dacă distribuția este una normală,
adică dacă distribuţia este suficient de înaltă (normocurtică) sau dimpotrivă
prea joasă (prăbuşită, cu deficit), situaţie în care ea se numeşte platikurtică

Test de (auto)evaluare a cunoştinţelor

Se dau următoarele date:


nr gen med_generala qi m_intrinseca m_extrinseca
(0=masculin, (Medie (Coeficient de (Motivație (Motivație
1= feminin) generală) inteligenţă) intrinsecă) extrinsecă)
1 0 5.00 68 37 28
2 1 8.00 100 51 28
3 1 7.50 102 53 29
4 1 9.50 122 49 31
5 1 9.50 104 35 32
6 0 9.00 98 40 32
7 1 8.00 98 48 32
8 0 6.00 81 43 34
9 1 10.00 120 45 34
10 1 9.00 122 35 35
11 0 6.00 86 41 35
12 0 7.00 104 42 35
13 1 8.00 84 45 35
14 0 6.50 81 47 35
31
nr gen med_generala qi m_intrinseca m_extrinseca
(0=masculin, (Medie (Coeficient de (Motivație (Motivație
1= feminin) generală) inteligenţă) intrinsecă) extrinsecă)
15 1 6.00 109 29 36
16 1 8.50 110 36 36
17 0 8.00 104 43 36
18 1 8.00 112 46 36
19 0 8.50 118 50 36
20 1 9.50 128 54 36
21 1 9.50 124 55 36
22 1 5.00 96 38 37
23 0 5.50 106 39 37
24 1 7.00 105 42 37
25 1 10.00 104 44 37
26 1 8.00 102 38 38
27 0 7.00 100 39 38
28 1 8.50 116 41 38
29 0 8.00 110 45 38
30 0 6.50 88 50 38

1. Introduceţi datele într-un fişier SPSS. Etichetaţi corespunzător variabilele şi alegeţi


scalele de măsură adecvate.
2. Realizaţi o histogramă pentru a evidenţia distribuţia scorurilor la QI. Supraimprimaţi
curba distribuției normale. Comentaţi rezultatele.
3. Realizaţi aceiaşi reprezentare (distribuţia scorurilor la QI) alegând în plus opţiunea Panel
by columns şi introduceţi variabila gen în câmpul Panel by columns. Ce observaţi legat de
distribuţia inteligenţei în funcţie de gen?
4. Realizaţi poligonul frecvenţelor brute cumulate pentru variabila medie generală, folosind
un grafic simplu, cu bare (folosiţi opţiunea Cum.N.).
5. Redaţi printr-un grafic „pie” numărul de băieţi şi de fete. Afişaţi valorile şi coloraţi
graficul cu roşu şi albastru.
6. Redaţi printr-un grafic cu bare nivelul mediei generale în funcţie de gen. Comentaţi
rezultatele.
7. Redaţi printr-un grafic cu bare nivelul motivației intrinsece și al celei extrinsece. Afişaţi
valorile şi schimbaţi culorile graficului obţinut.
8. Redaţi printr-un grafic cu bare nivelul motivației intrinsece şi al celei extrinsece în funcţie
de gen.
9. Pentru exerciţiul 1 de la secțiunea Exerciții introduceţi datele în SPSS şi rezolvaţi
cerinţele 1.3., 1.4., 1.5., cu ajutorul SPSS-ului.

32
Unitatea de învăţare I.3.

Indicatorii statistici descriptivi

Cuprins
3.1. Introducere ................................................................................................................
3.2. Competenţe ................................................................................................................
3.3. Indicatorii tendinței centrale ....................................................................................
3.4. Indicatorii împrăștierii...............................................................................................
3.5. Indicatorii formei distribuției ....................................................................................
3.6. Folosirea SPSS pentru calculul indicatorilor descriptivi ..........................................

3.1. Introducere

Unitatea de învățare 3 propune reactualizarea cunoștințelor dobândite la


cursul de statistică privind indicatorii statistici descriptivi, indicatorii tendinței
centrale (media, mediana, modul), indicatorii împrăștierii (amplitudinea
împrăștierii, abaterea standard, varianța), indicatorii formei distribuției (simetria
și boltirea)

3.2. Competenţele unităţii de învăţare

După parcurgerea acestei unități, studenții vor fi capabili:


 să calculeze media, mediana și modul pentru un șir de date;
 să explice semnificația mediei, medianei și a modului;
 să aleagă indicatorul statistic adecvat pentru un șir de date;
 să calculeze indicatorii împrăștierii pentru un șir de date;
 să explice semnificația amplitudinii împrăștierii, a abaterii standard și a
dispersiei;
 să analizeze din punct de vedere psihologic indicatorii descriptivi raportați
în articolele de specialitate;

Durata medie de parcurgere a acestei unităţi de învăţare este de 4 ore.

33
3.3. Indicatorii tendinței centrale

Media este acea valoare care se obţine împărţind suma scorurilor tuturor indivizilor
care compun populaţia statistică la numărul acestora. Media este o mărime la care participă
toate valorile variabilei respective și se exprimă în aceleaşi unităţi de măsură în care sunt
exprimate şi valorile variabilei respective. Mediana este un punct aflat pe scara măsurătorilor,
sub şi peste care se află exact jumătate din numărul cazurilor. Modul este valoarea care are
cea mai mare frecvenţă, deci cea care caracterizează individul tipic al populaţiei statistice
respective. Ea este foarte uşor de reperat pe un poligon al frecvenţelor, unde modul
corespunde punctului de maxim al acestei linii. Cei trei indicatori de poziţie, media, mediana
şi modul, tind să se suprapună în distribuţiile simetrice. În cazul distribuţiilor asimetrice,
media tinde să se situeze către valorile extreme, spre dreapta sau spre stânga, în sensul cozii
asimetriei. În aceeaşi situaţie, mediana oferă o imagine mai bună a centrului distribuţiei
(Clinciu A. I., 2013).

 Media
- Reprezintă cea mai reprezentativă valoare pentru un șir de scoruri.
- Modul de calcul constă în împărţirea sumei scorurilor tuturor indivizilor care compun
populaţia statistică la numărul acestora.

Să ne reamintim...

∑𝑋 X 1  X 2  X 3  ...  X n
𝑋̅ = X 
𝑁 N
- Formula pentru date ordonate este următoarea:
∑ 𝐾𝑋
𝑋̅ =
𝑁
unde N = număr de cazuri, K = frecvențe de apariție ale unui scor.

- Formula pentru date ordonate şi grupate în k clase (intervale):

f1c1  f 2c2  ...  f n cn f c  f c  ...  f n cn


X   11 2 2
f1  f 2  ...  f n N
unde k = numărul de interval, f =frecvenţa fiecărui interval, c = centrele de
interval, N = numărul de observaţii.

34
Aplicaţia 1

O grupă de studenți au fost întrebați câte ore petrec rezolvând temele la


statistică pe săptămână. Răspunsurile lor au fost următoarele: 5, 7, 10, 1, 0,
8, 6, 7, 9, 10. Calculați media acestui șir de date, interpretați rezultatul
obținut și decideți dacă media obținută este relevantă pentru toți
participanții la studiu.

 Mediana
- Este punctul de pe linia scorurilor care împarte distribuția în două părți egale, de aceea ea
se mai numește punctul percentil 50 sau quartilul 2.
- Pentru a identifica mediana, notați toate scorurile în ordine strict crescătoare și identificați
scorul care împarte distribuția în două părți egale, după formula:

Să ne reamintim...

𝑁+1
𝑀𝑑 =
2
unde N = numărul de cazuri
 De exemplu, pentru un șir de 19 scoruri vom adăuga 1 și, împărțind la
doi, obținem 10, ceea ce înseamnă că al zecelea scor este mediana. Dacă
avem 20 scoruri, adunând 1 și împărțind la 2, obținem 10,5. Acest lucru
înseamnă că valoarea situată la jumătatea distanței dintre al 10-lea și al
11-lea scor este mediana.

Aplicaţia 2

Calculați mediana următoarelor șiruri de date:


a) 3, 5, 2, 10, 7, 4, 11.
b) 10, 15, 21, 24, 23, 14, 22, 17.
c) 12, 12, 12, 12, 14, 14, 14, 15, 17, 17

 Modul
- este valoarea care are cea mai mare frecvență, deci caracterizează individul tipic al
populației statistice respective;
35
- în poligonul frecvențelor, modul corespunde punctului maxim al acestei linii. În cazul
distribuţiilor discontinue, nominale sau ordinale, modul este categoria cu cea mai mare
frecvenţă.

Exemple

Pentru șirul următor de date, identificați modul: 10, 11, 11, 11, 12, 13, 14, 14, 15,
15, 15, 15, 17.

Modul este scorul cu frecvența de apariție cea mai mare, adică 15.

Aplicaţia 3

Recitiți aplicația 1 și calculați modul pentru șirul de date prezentat.

3.4. Indicatorii împrăștierii

Indicatorii dispersiei măsoară gradul de împrăştiere al indivizilor ce compun o


populaţie statistică, în cadrul seriei de valori pe care le iau. Ei sunt indicativi pentru raportul
omogenitate/eterogenitate în legătură cu caracteristica dată. Cea mai simplă măsură a
împrăştierii este amplitudinea împrăştierii și reprezintă diferența dintre cea mai mare
valoare din șirul de date și cea mai mică valoare. Abaterea medie este definită ca media
aritmetică a abaterilor absolute de la medie. Abaterea standard sau media pătratică a
abaterilor de la medie şi dispersia sau varianţa sunt măsurile cele mai reprezentative ale
variabilităţii, cu o foarte largă utilizare. Pentru a fi posibilă comparaţia asupra raportului
omogenitate–eterogenitate folosim coeficientul de variaţie. Pentru a stabili dacă o distribuție
este normală sau nu, se calculează indicatorii formei distribuției, indicatorul simetriei
(skewness) și indicatorul boltirii (kurtosis) (Clinciu A. I., 2013).

 Amplitudinea împrăștierii
Reprezintă diferența dintre cea mai mare valoare din șirul de date și cea mai mică
valoare.

Exemple
AI = R (Range) = Xmax - Xmin
Pentru șirul de date 6, 7, 7, 8, 8, 8, 9, 9, amplitudinea este de 9-6 = 3.

36
 Abaterea standard și varianța
- sunt măsurile cele mai reprezentative ale variabilităţii (Clinciu A. I., 2013);
- varianţa sau dispersia este egală cu media aritmetică a pătratelor abaterilor de la media
unei distribuţii;
- varianța reprezintă măsura geometrică a suprafeţei de sub curba lui Gauss;
- abaterea standard este o unitate de lungime standardizată a liniei ce definește lungimea
unei distribuţii, fiind egală cu radical din varianță.

Să ne reamintim...

 Formula varianței pentru date negrupate:


(∑ 𝑋)2
∑ 𝑋2 −
𝑠2 = 𝑁
𝑁−1
unde X = scorurile, N= numărul de cazuri

 Formula varianței pentru date grupate:


(∑ 𝑓𝑋)2
∑ 𝑓𝑋 2 −
𝑠2 = 𝑁
𝑁−1
unde X = scorurile, f = frecvența, N= numărul de cazuri

 Alte formule pentru calcularea varianței


Pentru date negrupate:

2
∑(𝑋 − 𝑋̅)2
𝑠 =
𝑁−1
unde X = scorurile, 𝑋̅ = media scorurilor, N= numărul de cazuri
! Atunci când numărul de cazuri este mai mare de 30, în toate formulele de
mai sus se înlocuiește N-1 cu N

 Notele z
Formula pentru calculul notelor z este:
𝑋 − 𝑋̅
𝑧=
𝜎
Unde X = scorul, 𝑋̅ = media, σ = abaterea standard.

37
- Intr-o distribuție transformată în note z, media este 1, abaterea standard este 0 iar scorurile
z iau valori incluse în intervalul (-3, 3).

Aplicaţia 4

Mai jos sunt prezentate scorurile obținute de 18 studenți la un chestionar


care măsoară strategiile de învățare.
154 109 137 115 152 140 154 178 101 103 126 126 137 165 165 129 200
148
a) Calculați indicatorii tendinței centrale pentru aceste date. Cum este
media față de mediană, mai mare sau mică? Cum explicați rezultatul?
b) Calculați indicatorii împrăștierii pentru aceste date.
c) Ce scor din șirul dat considerați că este un outlier? Identificați
outlierul, eliminați-l și calculați din nou indicatorii tendinței centrale
și ai împrăștierii Ce observați? (Moore, 2009).

3.5. Indicatorii formei distribuției


 Indicatorul simetriei (skewness)
- Când datele se aglomerează spre extrema stânga, distribuţia este asimetrică pozitiv, dacă
sunt grupate spre extrema dreaptă , atunci asimetria este negativă.
- Valorile simetriei
• în intervalul [-0,80; 0,80] - distribuţia este considerată simetrică;
• sub -0,80 (pozitivă) curba este asimetrică spre stânga,
• peste 0,80 (negativă) ea este asimetrică spre dreapta.

 Indicatorul boltirii (kurtosis)


Boltirea reprezintă înălţimea curbei unei distribuţii prin raportare la o curbă gaussiană
perfectă, numită distribuţie normocurtică
- platicurtică = curbă plată, prăbuşită, având un exces spre extremele seriei de variaţie şi
un deficit pe centru;
- leptocurtică = ascuţită şi înaltă, un deficit spre extreme şi un exces pe centru.
Curba nomocurtică are valorile apropiate de zero, cea leptocurtică are valori pozitive
iar cea platicurtică are valori negative.

38
 Boxplotul și punctele cuartile
** Valori aberante

◦◦ Valori extreme (outlieri)

Mustață

P75 Q3

Mediana P50 Q2

P25 Q1

Mustață ◦◦ Outlieri

* * Valori aberante

Să ne reamintim...

- Boxplotul este o reprezentare grafică asemănătoare unei cutii.


- Linia situată la jumătatea cutiei este mediana sau punctul percentil P50 sau
Q2.
- Mustața corespunde celei mai mari valori care nu este un outlier.
- Q1 este punctul cuartil 1 care corespunde punctului percentil 25.
- Q3 este punctul cuartil 3 care corespunde punctului percentil 75.
- Outlierii (valorile extreme) sunt punctele aflate între 1,5 - 3 lungimi de cutie
de percentilul 25.
- Valorile aberante sunt punctele aflate la peste 3 lungimi de cutie de
percentilul 25.
- Intr-o distribuție simetrică, mediana este situată la jumătatea cutiei.

39
3.6. Folosirea SPSS pentru calculul indicatorilor descriptivi

 Folosirea SPSS pentru calculul indicatorilor tendinței centrale

 Accesați meniul Analyze.


 Descriptive Statistics.
 Frequencies.
 Introduceți variabila în câmpul Variable(s).
 La Central tendencies bifați: Mean, Median, Mode, Sum.
 Continue – OK.

 În output, veți obține un tabel asemănător cu cel de mai jos:

40
Folosirea SPSS pentru calculul indicatorilor împrăștierii și ai formei distribuției

 Accesați meniul Analyze.


 Descriptive Statistics.
 Frequencies.
 Introduceți variabila în câmpul Variable(s).
 La Dispersion bifați: Std. deviation, Variance, Range, Minimum, Maximum.
 Pentru indicatorii formei distribuției, bifăm în plus Distribution: Skewness, Kurtosis.
 Continue – OK.

 În output, veți obține un tabel asemănător cu cel de mai jos:


 Testele de normalitate
- N> 50 - Kolmogorov-Smirnov test
- N< 50 - Shapiro-Wilk test

Regula de decizie:
- p (Sig.) mai mic sau egal cu 0.05 → se respinge ipoteza de normalitatea
distribuţiei(distribuţiavariabilei se abate de la forma normală);
- p (Sig.) mai mare decât 0.05 → se acceptă ipoteza de normalitatea
distribuţiei(distribuţia)

Folosirea SPSS pentru calculul testelor de normalitate

 Accesați meniul Analyze.


 Descriptive Statistics.
 Explore
 Introduceți variabila în câmpul Dependent list
 Continue – OK.

42
 Graficul percentilelor unei distribuții normale standard față de cea a datelor
observate. Pași SPSS pentru obținerea Q-Q plot

 Analyze > Descriptive Statistics > Q-Q


 Analyze > Descriptive > Explore > Plots > Normality plots with tests

43
Să ne reamintim...

Q-Q Plot vs Histograma


- Histograma nu redă cu exactitate boltirea pentru că alegerea intervalelor
de grupare este arbitrară.
Q-Q Plot vs Boxplot
- Boxplotul nu spune nimic despre boltire, numai despre simetrie.

44
Rezumat

Media este acea valoare care se obţine împărţind suma scorurilor tuturor
indivizilor care compun populaţia statistică la numărul acestora. Media este o
mărime la care participă toate valorile variabilei respective și se exprimă în
aceleaşi unităţi de măsură în care sunt exprimate şi valorile variabilei
respective. Mediana este un punct aflat pe scara măsurătorilor, sub şi peste care
se află exact jumătate din numărul cazurilor. Modul este valoarea care are cea
mai mare frecvenţă, deci cea care caracterizează individul tipic al populaţiei
statistice respective. Indicatorii dispersiei măsoară gradul de împrăştiere al
indivizilor ce compun o populaţie statistică, în cadrul seriei de valori pe care le
iau. Cea mai simplă măsură a împrăştierii este amplitudinea împrăştierii și
reprezintă diferența dintre cea mai mare valoare din șirul de date și cea mai
mică valoare. Abaterea medie este definită ca media aritmetică a abaterilor
absolute de la medie. Abaterea standard sau media pătratică a abaterilor de la
medie şi dispersia sau varianţa sunt măsurile cele mai reprezentative ale
variabilităţii, cu o foarte largă utilizare. Pentru a stabili dacă o distribuție este
normală sau nu, se calculează indicatorii formei distribuției, indicatorul
simetriei (skewness) și indicatorul boltirii (kurtosis)

Test de (auto)evaluare a cunoștințelor

Un psiholog face o cercetare cu privire la efectul alcoolului asupra timpului de


reacție. Psihologul a împărțit participanții în două grupuri: un grup de participanți (A)
care nu au consumat alcool și cu un alt grup (B), care au primit o doză de alcool.
Timpul de reacție în rezolvarea unei sarcini care constă dintr-o probă de atenție a fost
înregistrat pentru fiecare participant.
Despre participanții la cercetare se mai știe că sunt băieți și fete. Înainte de
experiment, ei au completat și un chestionar care măsoară stabilitatea emoțională
(scoruri mici înseamnă stabilitate scăzută, scoruri mari, stabilitate ridicată).
Datele sunt prezentate în tabelul următor:

nr Grup Gen Timp_reacție Stabilitate_emotionala


1. A masculin 33 24
2. A masculin 44 35
3. A masculin 36 22
4. A masculin 40 16
nr Grup Gen Timp_reacție Stabilitate_emotionala
5. A feminin 29 10
6. A feminin 36 25
7. A feminin 16 65
8. A feminin 41 53
9. A feminin 39 41
10. A masculin 26 44
11. A masculin 47 35
12. A masculin 41 36
13. A feminin 38 40
14. A feminin 25 65
15. A feminin 27 67
16. B feminin 33 41
17. B masculin 48 50
18. B feminin 39 52
19. B feminin 45 24
20. B masculin 36 20
21. B masculin 49 10
22. B feminin 35 12
23. B feminin 68 22
24. B feminin 51 25
25. B feminin 52 27
26. B feminin 40 56
27. B masculin 30 43
28. B masculin 52 55
29. B masculin 47 49
30. B feminin 51 52
31. B feminin 51 36
32. B feminin 57 60
33. B feminin 58 66
34. B masculin 64 64
35. B masculin 49 50
36. B masculin 62 52
37. B masculin 47 43
38. B feminin 40 20
39. B feminin 44 13
40. B masculin 41 15

1. Creați un fișier SPSS cu aceste date. Alegeți scalele de măsură adecvate, etichetați
variabilele și acordați valori variabilelor categoriale, astfel:
Nr → Nr de ordine
Grup → Grup experimental. Codificați 1= Grup A – fără alcool, 2 = Grup B – cu
alcool
Gen → Genul subiectului 1=Masculin, 2= Feminin
Timp_reactie → Timp reacție

46
Stabil_emotionala → Stabilitate emoțională.

2. Calculaţi indicatorii tendinței centrale (medie, mediană, mod), ai împrăștierii


(amplitudinea împrăștierii, abaterea standard, dispersia), ai formei distribuției
(Skewness și Kurtosis) pentru toți subiecții pentru variabila timp de reacție Comentați
rezultatele.
3. Calculaţi media, abaterea standard și indicele de variabilitate separat, pentru fiecare
grup, pentru variabila timp de reacție (Folosiți opțiunea Split file). Discutaţi
comparativ aceste valori pentru cele două grupuri.
4. Construiţi histogramele pentru cele două distribuții ale timpului de reacție (distribuția
grupului A și distribuția grupului B) și discutaţi diferenţele de aspect pe care le
constataţi.
5. Realizați un grafic de tip Pie pentru a arăta câți băieți și câte fete sunt în baza de date.
6. Realizați un grafic cu bare pentru a reprezenta mediile timpului de reacție și a
stabilității emoționale, în funcție de grupul (A sau B) în care sunt incluși participanții.
Afișați valorile, schimbați culorile barelor. Explicați rezultatele.
7. Redați distribuția stabilității emoționale printr-un grafic de tip boxplot. Explicați ce
observați în graficul obținut.
8. Redați printr-un grafic cu bare media stabilității emoționale în funcție de gen. Afișați
valorile, schimbați culorile barelor. Explicați rezultatele.
9. Determinați următoarele puncte de pe linia distribuției pentru variabila timp de reacție:
Q1, Q2, Q3.

47
Unitatea de învăţare I.4.

Testele de comparație – testele t

Cuprins
4.1. Introducere ................................................................................................................
4.2. Competenţe ................................................................................................................
4.3.Calculul testelor t .......................................................................................................
4.4. Raportarea rezultatelor testelor t în format APA ......................................................
4.5. Folosirea SPSS pentru calculul testelor t ..................................................................
4.5. Calculul mărimii efectului pentru testele t.................................................................

4.1. Introducere

Testele t reprezintă o modalitate de testare a ipotezelor. Testele t


reprezintă unele dintre cele mai frecvente tehnici folosite în cercetarea
psihologică. Testele t sunt folosite pentru compararea mediilor, în situații în care
testăm ipoteze privind existența diferențelor dintre două populații pornind de la
compararea a două grupe (Sava, 2004). In această situație, variabilă dependentă
este evaluată prin scale numerice. Tipurile de teste t folosite în cercetarea
psihologică sunt: testul t pentru un singur eșantion, testul t pentru eșantioane
independente și testul t pentru eșantioane perechi – privește diferența dintre
mediile a două eșantioane perechi (corelate, dependente).

4.2. Competenţele unităţii de învăţare

După parcurgerea acestei unități, studenții vor fi capabili:


 să analizeze condițiile de aplicare a tehnicilor de comparație a mediilor;
 să aplice testul t adecvat tipurilor de variabile culese;
 să formuleze ipoteze care pot fi testate prin intermediul testelor t pentru un
singur eșantion, pentru eșantioane independente și pentru eșantioane
perechi.
 să raporteze conform normelor APA rezultatele testelor t.

Durata medie de parcurgere a acestei unităţi de învăţare este de 4 ore.

48
4.3. Calculul testelor t

 Testul t pentru un singur eșantion


Acest tip de test t se folosește atunci când avem scorurile unui eșantion și vrem să le
comparăm cu media populației din care eșantionul a fost extras.
Formula de calcul a testului t pentru un singur eșantion este următoarea:
X −μ
𝑡= 𝜎
√𝑁
X = media eșantionului
𝜇 = media populației
𝜎 = abaterea standard a eșantionului.
𝑁 = numărul de participanți.
Gradele de libertate (df) în cazul testului t pentru un singur eșantion se calculează după
următoarea formulă:

Df = N – numărul de eșantioane = N-1

Exemplu

Testaţi ipoteza potrivit căreia cei 70 de studenţi de anul I de la Facultatea


de Psihologie, cu un QI de 114 şi o abatere standard de 11, au un nivel de
inteligenţă semnificativ mai mare comparativ cu populaţia de bază (QImediu
= 100).
114 − 100 14
𝑡= = = 10,68
11 1,31
√70
t(69) = 10,68, p < .001.

 Testul t pentru eșantioane independente


Acest tip de test t se folosește atunci când cele două grupuri comparate au fost alese la
întâmplare, pe baza situației lor naturale, ca în cazul a două clase paralele de elevi sau a două
grupuri diferite de vârstă (Sava, 2004). În situații de acest gen, cercetătorul compară mediile
49
unei variabile (preferința pentru risc, timpul de reacție) măsurate pe două eșantioane formate
din participanții care diferă sub aspectul unei alte variabile (gen, vârstă, mediu de
proveniență). In acest caz, variabila comparată trebuie să fie măsurată pe scală de interval sau
de raport, iar variabila de grupare trebuie să fie categorială.
Formula de calcul a testului t pentru eșantioane independente este următoarea:

 Testele t destinate eşantioanelor de volum mic necorelate


X1  X 2
t
 X 12  X 2 2  N1  N 2 
 
 N  N  2  N N 
 1 2  1 2 
în care X 1 , X 2 sunt mediile de selecţie; N1, N2 numărul de cazuri pentru X1 şi X2;
ΣX12 şi ΣX22 reprezintă suma pătratelor abaterilor individuale de la medie. Singura
precauţie importantă este aceea de a-l căuta pe t în coloana lui Fisher la df = N1 + N2 -
2 grade de libertate.
X1  X 2
t
 ( N1  1) s1  ( N 2  1) s2 2  1
2
1 
   
 N 1  N 2  2   N1 N 2 

 Eşantioanele independente, dar de volum mare


X1  X 2
t
 12  22

N1 N2

Să ne reamintim... Pașii pentru calculul testului t pentru eșantioane


independente

a. Se calculează cele două medii.


b. Se calculează cele două abateri standard (de selecţie) ale distribuţiilor.
c. Se calculează erorile standard ale celor două medii.
d. Se calculează eroarea standard a diferenţei dintre cele două medii după
formula:
2 2
 sX   sY  sX
2
sY
2
S X Y  S X  SY 
2
 2
     
 N 1   N 1  N X 1 NY 1
 X   Y 
e. Se calculează semnificaţia statistică a diferenţei mediilor după formula:

50
X Y X Y
t 
S X Y sX
2
s
2
 Y
N X  1 NY  1

f. Se evaluează t în tabela corespunzătoare.

Exemplu
In tabelul de mai jos sunt date informații despre greutatea unui eșantion de
băieți și unul de fete. Calculați testul t și stabiliți dacă diferența greutății
pentru cele două grupuri este semnificativă statistic.
Ipoteza de nul: nu există diferențe în ceea ce privește greutatea între
băieți și fete.
Ipoteza specifică: există diferențe în ceea ce privește greutatea între
băieți și fete.

Greutate
Fete Băieți
N 14 14
X 48,29 50,43
σ 7,32 6,65
ΣX 676 706
ΣX² 33338 36178

50,43  48,29 2,14 2,14 2,14


t     0,11
33338  36178 14  14 69516 28 381,96 19,54
 
14  14  2 14  14 26 196

In tabelul lui Fisher căutam df = N1 + N2 - 2 = 28 – 2 = 26, valoarea este foarte


departe de pragurile de semnificaţie critice p = 0,05 sau p = 0,01, deci ipoteza de
nul nu poare fi respinsă, acceptăm ipoteza de nul.

 Testul t pentru eșantioane dependente (perechi)


Acest tip de test t se folosește atunci când:
- acelaşi grup este comparat cu el însuşi, înainte şi după introducerea unui factor
experimental;

51
- două grupuri au fost în prealabil comparate, egalizate şi puse într-o situaţie prin care se
influenţează reciproc, vorbim de eşantioane (selecţii) corelate;
- eşantioane perechi au fost construite astfel încât fiecărui element dintr-un eşantion să-i
corespundă un altul din celălalt, cu care formează pereche (eşantioane apariate) (Clinciu
A. I., 2013).

Formula de calcul a testului t pentru eșantioane independente este următoarea:


∑∆
𝑡= 𝑁
2
2 (∑ ∆)
√∑ ∆ − 𝑁
(𝑁 − 1) ∗ 𝑁

Să ne reamintim... Pașii pentru calculul testului t pentru eșantioane perechi

1. Formularea ipotezei de nul și a ipotezei cercetării.


2. Determinarea caracteristicilor distribuției comparației:
a. Se scriu pe două coloane scorurile obținute de fiecare subiect.
b. Se calculează media diferenței.
c. Se calculează abaterea standard a diferenței.

() 2
2 
3. Se calculează întâi dispersia ( s 2  N ), după care abaterea
N 1

standard (s = s 2 ).

s
4. Se calculează eroarea standard a mediei diferenţelor: S  
N 1 .

5. Se calculează t care este câtul dintre media diferenţelor şi eroarea standarda mediei diferenţelor: t 
S

6. Forma distribuției este o distribuție cu 𝑑𝑓 = 𝑁 − 1.


7. Se evaluează t alegând de pe coloana f din tabelul lui Fisher numărul
gradelor de libertate echivalent cu N-1. În funcţie de valoarea găsită vedem
52
dacă, în cazul respingerii ipotezei nule, probabilitatea de eroare este mai
aproape de unul dintre pragurile critice căutate (p = 0,05 sau p = 0,01).

4.4. Folosirea SPSS pentru calculul testelor t

 Testul t pentru un singur eșantion


Acest tip de test t se folosește atunci când avem scorurile unui eșantion și vrem să le
comparăm cu media populației din care eșantionul a fost extras.

 Pași SPSS
 Accesați meniul Analyze – Compare Means – One Sample T Test.

Calculul testului t pentru un singur eșantion (Pasul 1)

53
Calculul testului t pentru un singur eșantion (Pasul 2)

 Introduceți variabila pe care vreți să o analizați în câmpul Test Variable(s).


 Scrieți în câmpul Test Value media populației cu care doriți să comparați eșantionul
dvs, în cazul de față, 8,5.
 OK.

Testul t pentru un singur eșantion

54
 Primul tabel, One-SampleStatistics, prezintă indicatorii descriptivi pentru variabila
dependentă: număr de participanți (N), media, abaterea standard, eroarea standard a
mediei.
 Al doilea tabel, One Sample Test, oferă rezultatele testului t: valoarea testului t,
gradele de libertate (df), pragul de semnificație (Sig. (2-tailed)), diferența mediilor,
intervalele de încredere ale diferenței mediilor (95% Confidence Interval of the
Difference).

 Testul t pentru eșantioane independente


Acest tip de test t se folosește atunci când cele două grupuri comparate au fost alese la
întâmplare, pe baza situației lor naturale, ca în cazul a două clase paralele de elevi sau a două
grupuri diferite de vârstă (Sava, 2004). În situații de acest gen, cercetătorul compară mediile
unei variabile (preferința pentru risc, timpul de reacție) măsurate pe două eșantioane formate
din participanții care diferă sub aspectul unei alte variabile (gen, vârstă, mediu de
proveniență). In acest caz, variabila comparată trebuie să fie măsurată pe scală de interval sau
de raport, iar variabila de grupare trebuie să fie categorială.

 Pași SPSS
 Accesați meniul Analyze – Compare Means – Independent Samples T Test
 Introduceți variabila dependentă în câmpul Test Variable(s).
 Introduceți variabila de grupare (variabila categorială) în câmpul Grouping Variable .
 La Defines Groups introduceți pentru fiecare dintre cele două grupuri valorile atribuite
(în cazul de față, 1 și 2, unde 1 înseamnă masculin, 2 înseamnă feminin).

55
Calculul testului t pentru eșantioane independente (Pasul 1)

Calculul testului t pentru eșantioane independente (Pasul 2)

 Continue – OK.

Testul t pentru eșantioane independente

 Primul tabel, Group Statistics, prezintă indicatorii descriptivi pentru fiecare grup în
parte: număr de participanți (N), media, abaterea standard, eroarea standard a mediei.
 Al doilea tabel, Independent Samples T Test, conține valorile Testului Levene pentru
egalitatea varianțelor (Levene’s Test for Eqality of Variances), pragul de semnificație
al testului Levene (Sig.), valoarea testului t, gradele de libertate (df), pragul de
semnificație (Sig. (2-tailed)), diferența mediilor și eroarea standard a diferenței,
intervalele de încredere ale diferenței mediilor.
56
 Testul Levene ne indică ce valoare a testului t citim: dacă testul Levene este
semnificativ statistic, ne aflăm în situația în care cele două grupuri comparate au
varianță egală și vom citi valoarea testului t de pe prima linie a tabelului; dacă testul
Levene este nesemnificativ statistic, ne aflăm în situația în care cele două grupuri
comparate nu au varianță egală și vom citi valoarea testului t de pe a doua linie a
tabelului.

 Testul t pentru eșantioane dependente (perechi)


Acest tip de test t se folosește atunci când:
- acelaşi grup este comparat cu el însuşi, înainte şi după introducerea unui factor
experimental;
- două grupuri au fost în prealabil comparate, egalizate şi puse într-o situaţie prin care se
influenţează reciproc, vorbim de eşantioane (selecţii) corelate;
- eşantioane perechi au fost construite astfel încât fiecărui element dintr-un eşantion să-i
corespundă un altul din celălalt, cu care formează pereche (eşantioane apariate) (Clinciu
A. I., 2013).

 Pași SPSS
 Accesați meniul Analyze – Compare Means – Paired Samples T Test.
 Introduceți cele două variabile corelate în câmpurile Variable 1, Variable 2, în cazul
de față variabilele Pretest și Postest.
 OK.

Calculul testului t pentru eșantioane perechi (Pasul 1)

57
Calculul testului t pentru eșantioane perechi (Pasul 2)

 Primul tabel, Paired-Sample Statistics, prezintă indicatorii descriptivi pentru


variabilele introduse în analiză: număr de participanți (N), media, abaterea standard,
eroarea standard a mediei.
 Al doilea tabel, Paired Samples Correlation prezintă coeficientul de corelație dintre
cele două variabile și pragul de semnificație al corelației
 Al treilea tabel, Paired Samples T Test, oferă rezultatele testului t: media, abaterea
standard, eroarea standard a mediei, intervalele de încredere ale diferenței mediilor,
valoarea testului t, gradele de libertate (df), pragul de semnificație (Sig. (2-tailed)).

58
Testul t pentru eșantioane perechi

4.5. Raportarea rezultatelor testelor t în format APA

 Raportarea rezultatelor unui test t pentru u singur eșantion (μ ≠ μ0):

Studenții care urmează cursuri de statistică în psihologie de la Universitatea Transilvania


raportează că învață mai multe ore pentru teste (M = 121, SD = 14.2) decât învață studenți în
general t(33) = 2.10, p = .034.

 Raportarea rezultatelor unui test t pentru eșantioane dependente (μ1 ≠ μ2):

Rezultatele arată o preferință mai puternică a studenților pentru cursul de Psihologie (M =


3.45, SD = 1.11), decât pentru cursul de Pedagogie (M = 3.00, SD =.80), t(15) = 4.00, p =
.001.

 Raportarea rezultatelor unui test t pentru eșantioane in dependente (μ1 ≠ μ2):

Studenții de la Universitatea Transilvania care urmează cursuri de statistică au un QI mai


ridicat (M = 121, SD = 14.2) decât cei care nu urmează cursuri de statistică (M = 117, SD =
10.3), t(44) = 1.23, p = .09.

Exemplu
Raportarea rezultatelor testelor de comparație a mediilor folosind tabele în
format APA

Să ne reamintim...

Raportarea rezultatelor testelor de semnificație trebuie precedată de analiza


indicatorilor statistici descriptivi necesari pentru verificarea îndeplinirii
condițiilor de aplicare a testelor statistice.

59
Tabelul … Indicatori statistici descriptivi pentru variabilele incluse in cercetare

N R XMin XMax M SD SD2 Simetria Boltirea


performanta
test inainte
25 2,20 1,80 4,00 2,90 ,75 ,56 -,03 -1,33
prog experim

performanta
test dupa prog 25 2,15 1,85 4,00 3,18 ,62 ,39 -,50 -,71
experim

 Testul t pentru un singur eșantion a evidențiat următoarele rezultate:


Participanții sunt semnificativ mai satisfăcuți (M = 3,44 SD = 1,39 decât populația generală
(M = 2,25), t(24) = 4,29, p <.001.

Tabelul… Rezultatele testului t pentru un singur eșantion…


M SD t df p d Cohen
satisfacție 3,44 1,39 4,24 24 < 0,001 2,34
note

 Testul t pentru eșantioane independente


Testul t pentru eșantioane independente a evidenta ca există diferențe semnificative statistic,
astfel fetele (M = 2,28, SD = 0,45) au rezultate semnificativ mai scăzute decât băieții (M =
3,48, SD =0,42), t(23) = 6,92, p <.001.

Tabelul… Rezultatele testului t pentru eșantioane independente …


gen M SD t df p d Cohen
băieți 3,48 0,42
performanta test
6,92 23 < 0,001 2,77
înainte prog experim fete 0,45
2,27
performanta test băieți 3,63 0,28
5,75 23 < 0,001 2,31
după prog experim
fete 2,69 0,50

 Testul t pentru eșantioane dependente (perechi)

Testul t pentru eșantioane dependente a evidențiat ca exista diferențe semnificative statistic


înainte (M = 2,90, SD = 0,75) și după parcurgerea programului experimental (M = 3,18, SD =
0,62), după programul experimental performantele participanților fiind semnificativ mai
ridicate: t (24) = -5,49, p <.001.

60
Tabelul…. Rezultatele testului t pentru eșantioane dependente …
M SD t df p d Cohen
performanta test inainte prog 2,90 ,75
experim 0,59
-5,487 24 < 0,001
performanta test dupa prog 3,18 ,62
experim

4.6. Calculul mărimii efectului pentru testele t

Folosirea programului GPower

Mărimea efectului este un indicator care cuantifică mărimea diferenței dintre medii sau
intensitatea asocierii dintre variabile.
 Indicatori care se bazează pe diferența standardizată dintre medii:
o d al lui Cohen; delta(δ) al lui Glass sau gal lui Hedges.
 Indicatori care se bazează pe gradul de asociere dintre variabile (de tipul corelației
Pearson r) care descriu procentul variabilității explicate de fiecare variabilă în
raport cu cealaltă:
o r2, R2(coeficientul de regresie), η2(eta pătrat, pentru ANOVA), ω2(omega
pătrat, pentru ANOVA), f.
(http://imaging.mrc-cbu.cam.ac.uk/statswiki/FAQ/effectSize)

! Neraportarea mărimii efectului este o eroare conform regulilor APA!

Gradul de suprapunere dintre Ho si Hs


(http://www.mpopa.ro/statistica_master/02_inferenta_test_ipot_power_2014.pdf)

61
Beneficiile raportării mărimii efectului
- Permite includerea cercetării respective în studii de meta-analiză
- Oferă un sprijin cercetătorilor care vor aborda în viitor aceeași temă
- Facilitează evaluarea măsurii în care rezultatele unei cercetări se potrivesc cu
rezultate similare din literatura științifică

Mod de calcul al mărimii efectului (d Cohen) folosind GPower

Programul GPower poate fi descărcat gratuit de la următoarea adresă:


http://www.gpower.hhu.de/

! Există multe alte aplicații online pentru calculul mărimii efectului!

62
Rezumat

Testele t reprezintă o modalitate de testare a ipotezelor. Testele t


reprezintă unele dintre cele mai frecvente tehnici folosite în cercetarea
psihologică. Testele t sunt folosite pentru compararea mediilor, în situații în care
testăm ipoteze privind existența diferențelor dintre două populații pornind de la
compararea a două grupe (Sava, 2004). In această situație, variabilă dependentă
este evaluată prin scale numerice. Tipurile de teste t folosite în cercetarea
psihologică sunt:
- Testul t pentru un singur eșantion – privește diferența dintre media unui
eșantion și cea a populației din care acesta a fost extras
- Testul t pentru eșantioane independente – privește diferența dintre mediile a
două eșantioane independente
- Testul t pentru eșantioane perechi – privește diferența dintre mediile a două
eșantioane perechi (corelate, dependente).

Test de evaluare a cunoștințelor

Un cercetător a creat o bază de date în care a inclus mai multe date obținute de la o
grupă de studenți cu care a lucrat pe parcursul a patru săptămâni. Cei 25 studenți au fost
implicați într-un program privind dezvoltarea abilităților de operare pe calculator.
In baza sa de date, cercetătorul a inclus băieți și fete. Băieții sunt codificați cu 1 iar
fetele cu 2. Cercetătorul a măsurat performanțele la o probă de folosire a calculatorului ale
studenților Înainte și După parcurgerea programului experimental. Cercetătorul le-a cerut
participanților să declare câte ore pe săptămână folosesc calculatorul. Participanții au răspuns
și la următoarea întrebare: Cât de satisfăcuți sunteți de modul în care a fost desfășurat
programul, variantele de răspuns fiind 1, foarte nemulțumit, 2 – nemulțumit, 3 nici
nemulțumit, nici mulțumit, 3, mulțumit, 5 – foarte mulțumit.

Datele sunt prezentate în tabelul de mai jos:

63
Inainte După
Număr_ore
(Performante test (Performante test
(Număr ore pe
Participant Gen înaintea după parcurgerea Satisfacție
săptămână de folosire
programului programului
a calculatorului)
experimental) experimental)
1. 2 1.8 1.85 15 2
2. 1 3.9 3.88 38 3
3. 2 2.1 2.80 10 4
4. 1 2.8 3.20 24 5
5. 1 3.3 3.60 36 1
6. 2 3.1 3.57 15 1
7. 1 4.0 4.00 45 5
8. 1 3.4 3.35 28 4
9. 1 3.3 3.66 35 5
10. 2 2.2 2.55 10 4
11. 2 2.5 2.67 6 5
12. 2 1.8 2 15 4
13. 1 3.9 3.88 38 2
14. 2 2.1 2.80 10 3
15. 1 2.8 3.20 24 4
16. 1 3.3 3.60 36 5
17. 2 3.1 3.57 15 4
18. 1 4.0 4.00 45 4
19. 1 3.4 3.35 28 5
20. 1 3.3 3.66 35 1
21. 2 2.2 2.55 10 2
22. 2 2.5 2.67 6 3
23. 2 1.8 2.5 15 5
24. 1 3.9 3.88 38 3
25. 2 2.1 2.80 10 2

Pornind de la situația prezentată, răspundeți la întrebările următoare:


1. Introduceți aceste date în SPSS, etichetați variabilele, alegeți corect scalele de măsură.
2. Calculați indicatorii descriptivi ai tendinței centrale, ai împrăștierii și ai formei
distribuției pentru variabilele Înainte și După.
3. Împărțiți eșantionul după criteriul gen și redați prin histograme distribuția numărului de
ore petrecute la calculator. Analizați graficele și descrieți ceea ce observați.
4. Calculați testul t adecvat pentru a arăta dacă există diferențe la nivelul întregului
eșantion între scorurile obținute Înainte și După programul experimental. Formulați
ipoteza specifică. Determinați pragul de semnificație și raportați corespunzător
rezultatele, decideți dacă ipoteza de nul este respinsă sau nu.
5. Realizați un grafic cu bare pentru arăta diferențele mediilor înainte și după examen.

64
6. Calculați testul t adecvat pentru a arăta dacă există diferențe între scorurile Înainte și
scorurile după între băieți și fete. Formulați ipoteza de nul și ipoteza specifică.
Determinați pragul de semnificație și raportați corespunzător rezultatele.
7. Redați printr-un grafic cu bare diferența mediilor între băieți și fete pentru scorurile
Înainte și După.
8. Verificați dacă media numărului de ore de lucru pe calculator pentru întregul eșantion
este diferită de media obținută de participanții din anul trecut, de 30 ore. Formulați
ipoteza de nul și ipoteza specifică. Determinați pragul de semnificație și raportați
corespunzător rezultatele.
9. Verificați, folosind testul t adecvat, dacă există diferențe între băieți și fete în ceea ce
privește numărul de ore petrecute pe săptămână la calculator. Determinați pragul de
semnificație și raportați corespunzător rezultatele. Redați grafic diferențele dintre bieți
și fete în ceea ce privește media numărului de ore, printr-un grafic cu bare sau cu linii.
10. Calculați frecvențele de apariție pentru gradul de satisfacție. Redați același lucru și
printr-un grafic cu bare.
11. Creați o nouă variabilă, numită diferență, folosind meniul Compute, după formula:
diferența = După - Înainte și apoi calculați eroarea standard a diferenței.

Test de autoevaluare a cunoștințelor

Se prezintă următoarea situație: două grupuri de studenți au participat la o școală de


vară de statistică. Grupul 1 sunt studenți de la domeniul de studii Psihologie iar grupul 2 sunt
studenți de la domeniul de studii Științele Educației. Cunoștințele lor de statistică au fost
testate înainte de curs și după curs. Tabelul de mai jos prezintă scorurile obținute de studenți
înainte și după examen.
Genul este codificat in felul următor: 1 masculin, 2- feminin. O altă variabilă inclusă
în studiu este nota la matematică din timpul liceului. De asemenea, participanții au răspuns la
următoarea întrebare: cât de satisfăcuți sunteți de modul în care a fost desfășurat cursul,
variantele de răspuns fiind 1, foarte nemulțumit, 2 – nemulțumit, 3 nici nemulumit, nici
mulțumit, 3, mulțumit, 5 – foarte mulțumit.

Nr crt Grup Gen Inainte După Nota_matematica Satisfacție


1. 1 1 32 34 9 1

65
2. 1 2 31 31 7 2
3. 1 1 29 35 6 3
4. 1 2 10 16 5 5
5. 1 1 30 33 9 1
6. 1 2 33 36 9 2
7. 1 1 22 24 6 3
8. 1 2 25 28 6 4
9. 1 1 32 26 7 5
10. 1 2 20 26 5 4
11. 2 1 30 36 10 3
12. 2 2 20 26 8 2
13. 2 1 24 27 7 1
14. 2 1 24 24 6 2
15. 2 2 31 32 10 3
16. 2 2 30 31 10 5
17. 2 1 15 15 5 4
18. 2 1 32 34 10 5
19. 2 1 23 26 7 4
20. 2 2 23 26 8 3

1. Introduceți aceste date în SPSS, etichetați variabilele, alegeți corect scalele de măsură.
2. Calculați indicatorii descriptivi ai tendinței centrale, ai împrăștierii și ai formei
distribuției pentru variabilele măsurate pe scale de interval.
3. Calculați mediana pentru variabila satisfacție.
4. Realizați o histogramă pentru scorurile obținute Înainte și una pentru scorurile obținute
După examen (pentru toți cei 20 participanți).
5. Realizați o histogramă pentru scorurile Înainte pentru grupul 1 și una pentru grupul 2.
Analizați diferențele.
6. Calculați testul t adecvat pentru a arăta dacă există diferențe la nivelul întregului eșantion
între scorurile obținute înainte și după examen. Formulați ipoteza de nul și ipoteza
specifică. Determinați pragul de semnificație și raportați corespunzător rezultatele.
7. Realizați un grafic cu bare pentru arăta diferențele mediilor înainte și după examen.
8. Impărțiți eșantionul după criteriul grupului din care fac parte (Psih sau St educatiei),
folosind comanda Splite File. Calculați testul t pentru a arăta dacă există diferențe la între
scorurile obținute înainte și după examen. Analizați diferențele între cele două grupuri.
9. Realizați un grafic cu bare pentru a arăta diferențele dintre cele două grupuri, pentru
rezultatele Înainte și După examen.
10. Calculați testul t adecvat pentru a arăta dacă există diferențe între scorurile Înainte între
cele două grupuri de studenți. Formulați ipoteza de nul și ipoteza specifică. Determinați
pragul de semnificație și raportați corespunzător rezultatele.

66
11. Realizați un grafic cu bare pentru a arăta nivelul rezultatelor Înainte de examen pentru
cele două grupuri de studenți.
12. Realizați o histogramă pentru scorurile După pentru grupul 1 și una pentru grupul 2.
Analizați diferențele.
13. Calculați testul t adecvat pentru a arăta dacă există diferențe între scorurile După între
cele două grupuri de studenți. Formulați ipoteza de nul și ipoteza specifică. Determinați
pragul de semnificație și raportați corespunzător rezultatele.
14. Realizați un grafic cu bare pentru a arăta nivelul rezultatelor După examen pentru cele
două grupuri de studenți.
15. Verificați dacă media scorurilor pentru întregul eșantion este diferit de media obținută de
participanții din anul trecut, 24. Formulați ipoteza de nul și ipoteza specifică. Determinați
pragul de semnificație și raportați corespunzător rezultatele.
16. Arătați prin intermediul unui grafic de tip plăcintă câți băieți și câte fete sunt în baza de
date.
17. Verificați, folosind testul t adecvat, dacă există diferențe între băieți și fete în ceea ce
privește notele la matematică. Determinați pragul de semnificație și raportați
corespunzător rezultatele.
18. Calculați frecvențele de apariție pentru gradul de satisfacție. Redați același lucru și printr-
un grafic cu bare.
19. Creați o nouă variabilă, numită diferență, folosind meniul Compute, după formula:
diferența = După-Înainte.
20. Calculați eroarea standard a diferenței (variabila creată la punctul anterior).
21. Verificați ipoteza potrivit căreia studenții din anul I la Psihologie și Științele Educației, au
rezultate la matematică semnificativ mai bune decât studenții de la Litere, a căror medie
este de 6.

67
Unitatea de învăţare I.5.

Testele nonparametrice de comparație. Testul Mann-Whitney și


testul Wilcoxon

Cuprins
5.1. Introducere ................................................................................................................
5.2. Competenţe ................................................................................................................
5.3. Testul Mann-Whitney pentru două eșantioane independente ....................................
5.4. Testul Wilcoxon pentru două eșantioane perechi .....................................................
5.5. Folosirea SPSS pentru calculul testelor nonparametrice ..........................................

5.1. Introducere

Unitatea de învățare 5 propune familiarizarea studenților cu tehnicile


neparametrice de comparație. Studenții vor exersa două tipuri de teste statistice,
testul Mann-Whitney pentru două eșantioane independente și testul Wilcoxon
pentru eșantioane perechi. Demonstrarea modului de calcul este însoțită de
exemple pentru formularea corectă a ipotezelor statistice și interpretarea
rezultatelor.

5.2. Competenţele unităţii de învăţare

După parcurgerea acestei unități, studenții vor fi capabili:


 să analizeze condițiile de aplicare a tehnicilor nonparametrice de
comparație;
 să aplice testul adecvat tipurilor de variabile incluse în cercetare;
 să formuleze ipoteze care pot fi testate prin intermediul testelor, pentru
eșantioane independente și pentru eșantioane perechi;
 să raporteze conform normelor APA rezultatele testelor t.

Durata medie de parcurgere a acestei unităţi de învăţare este de 4 ore.

68
5.3. Testul MANN-WHITNEY pentru două eșantioane independente

Tehnicile nonparametrice sunt necesare atunci când nu sunt îndeplinite condițiile


pentru folosirea testelor t. aceste tipuri de teste nu fac presupuneri legate de distribuția datelor.
Ele se aplică în orice condiții, dacă măsurătorile sunt independente. Testele nonparamerice
sunt teste care au o acuratețe a rezultatului mai slabă decât a testelor parametrice și se aplică
numai atunci când nu este posibilă aplicarea unui test parametric. Aceste teste compară mai
degrabă medianele, decât mediile.
Testul Mann-Whitney se folosește pentru testarea diferenței dintre grupuri
independente pentru care variabila dependentă este exprimată în valori ordinale. Acest test
este echivalentul testului t pentru eșantioane independente.

Să ne reamintim...
Scopul aplicării
- Variabila dependentă este ordinală.
- Variabila dependentă este cantitativă dar nu urmează o distribuție
normală.
- Eșantioanele sunt mici (de ex, 8-10 subiecți).
- Testul are la bază compararea medianelor celor două grupuri comparate.

Exemplu
Ipoteza: Rezultatele la un test docimologic sunt influențate de familiarizarea cu
tipul de itemi.
Procedura:
O grupă de studenți lucrează exemple de itemi cu două zile înainte de test (grup
experimental)
O grupă nu primește nici un fel de informații despre tipul de itemi (grup control)

5.4. Testul Wilcoxon pentru două eșantioane perechi

Testul Wilcoxon presupune testarea diferenței rangurilor pe eșantioane dependente


(două măsurări pe aceiași subiecți).

Să ne reamintim...
Scopul aplicării
- Variabila dependentă este ordinală.
- Variabila dependentă este cantitativă dar nu urmează o distribuție

69
normală.
- Variabila dependentă este cantitativă dar eșantioanele sunt mici (de ex, 8-
10 subiecți).
- Testul are la bază compararea medianelor celor două grupuri comparate.
Condiții
- Eșantioanele sunt pereche
- Variabila dependentă este cantitativă sau ordinală cu mai mult de două
categorii

Exemplu
Ipoteza: Verificăm dacă aplicarea unei noi metode de predare pe un lot de 10
elevi duce la performanțe superioare.
Procedura: Testul Wilcoxon calculează diferența dintre scorurile Înainte și
După, apoi stabilește semnul diferențelor, in final ierarhizează diferențele în
valoare absolută. Se calculează media rangurilor pozitive și media celor negative.

Aplicaţia 1
Formulați patru ipoteze care pot fi testate prin intermediul testelor
nonparametrice de comparație. Argumentați pentru fiecare ipoteză necesitatea
alegerii unuia dintre testele nonparametrice.

Aplicaţia 2
Pornind de la ipotezele formulate anterior, explicați ce modificări ar fi necesare
la nivelul desig-ului cercetării, pentru a folosi testele parametrice t, în locul
testelor nonparametrice.

5.5. Folosirea SPSS pentru calculul testelor nonparametrice

Pași SPSS pentru calculul testului Mann-Withney

o Analyze – Nonparametric - Legacy Dialogs – Two Independent Samples

70
71
Din tabelul 2 ne interesează valoarea lui Z și pragul de semnificație (sig). Z este
transformarea lui Mann-Withney în scor z: Z=-2,626, p = 0,007.
Pentru a interpreta rezultatele, vom spune că există diferențe semnificative statistic între cele
două grupe în ceea ce privește rezultatul la test:
Meg experimental = 15,5

Meg control = 7,5

Să ne reamintim...
Testul Mann-Withney este echivalentul nonparametric al testului t pentru
eșantioane independente, însă este mai puțin puternic decât acesta.
Pentru a decide în favoarea cărui grup diferențele sunt semnificative, ne vom
raporta la mediile rangurilor celor două grupe, și nu la sumele rangurilor.

72
Pași SPSS pentru calculul testului Wilcoxon

o Analyze – Nonparametric - Legacy Dialogs – Two Related Samples

73
Tabelele din outputul SPSS ne oferă valoarea lui Z= -2,055, p = 0,04, ceea ce înseamnă că
există diferențe semnificative între stima de sine măsurată înainte de intervenție și cea după
intervenție.
În ceea ce privește suma rangurilor (Sum of ranks), suma cea mai mare apare pentru
DUPA>INAINTE, ceea ce înseamnă că stima de sine După intervenție este mai mare decât
Înainte.

Rezumat

Tehnicile nonparametrice sunt necesare atunci când nu sunt îndeplinite


condițiile pentru folosirea testelor t. aceste tipuri de teste nu fac presupuneri
legate de distribuția datelor. Ele se aplică în orice condiții, dacă măsurătorile
sunt independente. Testele nonparamerice sunt teste care au o acuratețe a
rezultatului mai slabă decât a testelor parametrice și se aplică numai atunci
când nu este posibilă aplicarea unui test parametric. Aceste teste compară mai
degrabă medianele, decât mediile.
Testul Mann-Whitney se folosește pentru testarea diferenței dintre
grupuri independente pentru care variabila dependentă este exprimată în valori
ordinale. Acest test este echivalentul testului t pentru eșantioane independente.
Testul Wilcoxon presupune testarea diferenței rangurilor pe eșantioane
dependente (două măsurări pe aceiași subiecți).

74
Test de (auto)evaluare a cunoștințelor

Deschideți baza de date Nonparametrice recapitulare.sav.


In această bază de date sunt înregistrate rezultatele unei cercetări privind
reducerea fricii de păianjeni.
Variabilele sunt următoarele:
o Genul: 1= masculin, 2 = feminin
o Grup: 1= g. experimental 1, 2= g experimental 2. Primul grup a urmat un
program terapeutic de reducere a fricii de păianjeni derulat e o perioada
de 14 ședințe, al doilea grup, 7 ședințe
o Anxietate – nivelul anxietății după programul experimental
o Imagine = anxietate după tehnicile terapeutice care au vizat expunerea la
imaginile unor păianjeni
o Real = anxietate după tehnicile terapeutice care au vizat expunerea la
păianjeni reali
o Informații = sursa de informare despre existența tehnicilor de reducere a
fricii de păianjeni: 1 = TV, 2 = prieteni, 3 = psiholog
o Ordinea in fratrie = ordinea nașterii (0 = fără frați, 1 = primul născut, 2 =
al doilea născut etc)
o Stima de sine
o Increderea în terapeut 1= încredere, 2- neîncredere

Cerințe:
1. Verificați, calculând indicatorii formei distribuției și testul de normalitate
adecvat dacă distribuția anxietății este normală.
2. Verificați, folosind testul statistic adecvat (nonparametric), dacă există
diferențe între băieți și fete in ceea ce privește nivelul anxietății.
Interpretați dpdv psihologic rezultatul obținut. Redații grafic diferența.
3. Verificați, folosind testul statistic adecvat (nonparametric), dacă există
diferențe între cele două grupuri experimentale in ceea ce privește nivelul
anxietății. Interpretați dpdv psihologic rezultatul obținut. Redați grafic
diferența.
4. Verificați, calculând indicatorii formei distribuției și testul de normalitate

75
adecvat dacă distribuția variabilelor Imagine și Real este normală.
5. Verificați, folosind testul statistic adecvat (nonparametric), dacă există
diferențe între nivelul anxietății participanților în etapa de expunere la
imagini cu păianjeni și etapa de expunere la păianjeni reali. Interpretați
dpdv psihologic rezultatul obținut. Redați grafic diferența.
6. Verificați aceiași diferență de la punctul 5, dar separat pentru băieți și
fete. Interpretați dpdv psihologic rezultatul obținut. Redați grafic
diferența.
7. Verificați folosind tehnica chi pătrat adecvată dacă există diferențe între
ponderea diferitelor mijloace de informare folosite pentru obținerea de
informații despre tratamentul fricii de păianjeni.
8. Verificați folosind tehnica chi pătrat adecvată proporția mijloacelor de
informare folosite este diferită pentru persoanele de gen masculin și
feminin.
9. Verificați dacă există o asociere semnificativă statistic intre nivelul
anxietății și poziția în fratrie. Interpretați dpdv psihologic rezultatul
obținut.
10. Verificați dacă variabila stimă de sine este normal distribuită.
11. Verificați dacă există o asociere semnificativă statistic intre nivelul
anxietății și stima de sine. Interpretați dpdv psihologic rezultatul obținut.
12. Verificați, folosind testul statistic adecvat (nonparametric), dacă există
diferențe între cei care manifestă încredere și cei care nu manifestă
încredere in terapeut in ceea ce privește nivelul anxietății. Interpretați
dpdv psihologic rezultatul obținut. Redații grafic diferența.
13. Verificați folosind tehnica chi pătrat adecvată proporția mijloacelor de
informare folosite este diferită pentru persoanele care manifestă și cele
care nu manifestă încredere în terapeut.
14. Pornind de la aceste date, formulați o ipoteză care poate fi testată printr-
un chi pătrat. Verificați dacă ipoteza se confirmă și prezentați rezultatele.
15. Pornind de la aceste date, formulați o ipoteză care poate fi testată prin
testul Mann-Withney sau Wilcoxon. Verificați dacă ipoteza se confirmă
și prezentați rezultatele.

76
Unitatea de învăţare I.6.

Testele de comparație a mediilor grupurilor – ANOVA simplă

Cuprins
6.1. Introducere ................................................................................................................
6.2. Competenţe ................................................................................................................
6.3. Analiza de varianță – noțiuni introductive ...............................................................
6.4. Folosirea SPSS pentru calculul ANOVA simplă ........................................................
6.5. Raportarea rezultatelor ANOVA în format APA .......................................................

6.1. Introducere

Unitatea de învățare 6 propune o scrută incursiune în calculul analizei de


varianță simplă. Analiza de varianță înseamnă analiza dispersională și reprezintă
o extensie a testelor t de testare a ipotezei semnificației diferenței dintre medii,
atunci când numărul de grupuri comparate este mai mare de două. Studenții vor
exersa modalitatea de calcul cu ajutorul SPSS-ului dar și modalitatea de
raportare corectă a rezultatelor conform normelor APA.

6.2. Competenţele unităţii de învăţare

După parcurgerea acestei unități, studenții vor fi capabili:


 să analizeze condițiile de aplicare a tehnicilor de comparație a mediilor;
 să aplice corect analiza de varianță;
 să formuleze ipoteze care pot fi testate prin intermediul tehnicilor ANOVA;
 să raporteze conform normelor APA rezultatele testelor ANOVA.

Durata medie de parcurgere a acestei unităţi de învăţare este de 2 ore.

77
6.3. Analiza de varianță – noțiuni introductive

Analiza de varianță înseamnă analiza dispersională → ANOVA (Analysis of Variance)


și reprezintă o extensie a testelor t de testare a ipotezei semnificației diferenței dintre medii,
atunci când numărul de grupuri comparate este mai mare de două.
 ANOVA presupune existența cel puțin a unei variabile discontinue (categoriale),
care are minimum trei categorii. Când comparația se face doar pentru două
categorii, rezultatele ANOVA sunt identice cu cele ale testului t (Clinciu, 2012).
 Tipuri de analiză de varianță
o ANOVA simplă (one-way, adică pe o cale) corespunde testului t pentru
două eşantioane independente;
o ANOVA cu măsurători repetate este corespondentul la nivelul tehnicilor
ANOVA al testului t pentru comparația eșantioanelor perechi;
o ANOVA factorială - sunt cercetate efectele a două sau mai multe variabile
independente, numite factori, asupra unei singure variabile dependente;
o ANOVA mixtă presupune o combinație dintre ANOVA simplă și cea cu
măsurători repetate.
ANOVA simplă încearcă să evidențieze efectele unui singur factor de variație (VI), cu mai
multe niveluri, asupra unei singure variabile dependente (VD).

Exemplu
 Nivelul anxietății în raport cu trei categorii de fumători („1-10 țigări
zilnic”, „11-20 țigări” şi „21-30 țigări”).
 Timpul de răspuns la un strigăt de ajutor, în funcție de natura vocii
persoanelor care solicită ajutorul (copil, femeie, bărbat).
 Scorul la un test de cunoștințe statistice ale studenților de la psihologie, în
funcție de tipul de liceu absolvit (real, umanist, agricol, artistic) (Popa,
2008).

Modul de operare al tehnicii ANOVA pornește de la analiza diferitelor surse din care
apare variația în scoruri:
Varianța totală = varianța intergrupuri (between groups variance) + varianța intragrup (within
groups variance) = varianță explicată + varianță neexplicată.

78
Atunci când varianța explicată este mult mai mare decât varianța neexplicată, diferențele
dintre grupuri sunt semnificative, testul F fiind semnificativ statistic.
ANOVA presupune parcurgerea a două etape:
1. Verificarea diferențelor la nivel global între grupuri prin intermediul testului F.
2. Dacă testul F este semnificativ statistic, vom calcula testele de comparație multiplă
pentru a afla care dintre grupuri diferă între ele.

Să ne reamintim...

Condiții necesare aplicării ANOVA simplă și factorială (Sava, 2004)


- Eșantionul a fost selectat randomizat din populație
- Variabila dependentă este normal distribuită
- Fiecare persoană din eșantion este testată o singură dată – evaluările sunt
independente
- Dispersia subiecților pe grupe experimentale este egală (Testul Levene)

6.4. Folosirea SPSS pentru calculul ANOVA simplă

Sunt posibile două căi:

 General Linear Model: Analyze→General Linear Model→ Univariate, sau


 Compare Means: Analyze→Compare Means→One-Way ANOVA Analyse
Exemplu – Anova simpla.sav

Lansarea One Way Anova (Pasul 1)

79
Lansarea One Way Anova (Pasul 2, Options)

 în partea stângă, ca la orice altă fereastră SPSS, este câmpul variabilelor;


 în dreapta se află câmpul de lucru, cu mai multe celule, prima celulă fiind pentru
Dependent Variabile, unde se introduce variabila care va fi supusă analizei - variabilă
numerică;
 celula a doua de pe verticala Fixed Factor(s) este cea unde se introduce variabila
(eventual variabilele) independentă în funcţie de care se va face analiza;
 butoanele Model, Contrasts, Plots, Post Hoc, Save şi Options fixează condiţii şi setări
suplimentare care nuanţează analiza de varianţă.
 Options deschide o fereastră de dialog care propune efectuarea şi furnizarea unor
statistici descriptive pentru grupurile comparate; determinarea mărimii efectului şi a
puterii ipotezei; estimarea parametrilor; confirmarea/ infirmarea ipotezei omogenităţii
varianţelor pentru grupurile comparate; redarea grafică a mediilor acestor grupuri sau
a valorilor reziduale, lipsa potrivirii etc.

80
Lansarea One Way Anova (Pasul 3, Post hoc)

 Post hoc - testul F este unul de tip omnibuz, pentru a afla mai multe detalii despre
semnificaţia diferenţelor dintre medii pe categorii de studii parentale efectuăm şi o
analiză post hoc (Post Hoc Multiple Comparisons for Observed Means). Procedura
este selectată în funcţie de rezultatele testului Levene pentru omogenitatea varianţei.
Dacă testul Levene indică dispersii omogene şi grupurile comparate sunt aproximativ
egale, atunci alegem între Tukey şi Bonferroni; când grupurile sunt uşor inegale între
Tukey b sau Gabriel, iar pentru cele marcat inegale opţiunea este doar Hochberg GT2.
Pentru dispersii inegale, dar cu număr egal de subiecţi, procedeul recomandat este
Dunnett T3, pe când pentru grupuri uşor inegale sau profund inegale opţiunea este una
singură, Games-Howell.

Outputul va conține următoarele aspecte:


 Between-Subjects Factors ne informează despre numărul subiecţilor din fiecare
categorie,.
 Descriptive Statistics indică valorile de referinţă ale mediilor şi abaterilor standard
pentru fiecare categorie.
 Testul Levene pentru omogenitatea varianței (Când valoarea testului Levene este
semnificativă statistic, grupurile nu au varianță egală.

81
Outputuri ale ANOVA unifactorială

Outputuri ale ANOVA unifactorială

 Potrivit acestui output F obţinut este extrem de semnificativ statistic, cu o probabilitate


de eroare sub pragul de 0,01, cu o valoare practică semnificativă a mărimii efectului
(η2= 0,75).

82
 F(2,33) = 50,98, p<.001, η2=0,75

Outputuri ale ANOVA unifactorială

 Outputul analizei post hoc:


 prima coloană, notată cu I, ia drept referinţă variabila independentă în raport cu care se
fac comparaţiile;
 a doua coloană, notată cu J, indică celelalte niveluri ale variabilei independente care
sunt comparate cu I;
 coloana a treia dă diferenţele dintre I şi J ale variabilei (I – J), diferenţă care poate fi
pozitivă (I > J) sau negativă (I < J). Aceste diferenţe ale mediilor pot sau nu să aibă o
steluţă, în funcţie de prezenţa sau absenţa semnificaţiei statistice (p < .05);
 coloana a patra prezintă şi ea interes deoarece raportul dintre diferenţă şi eroarea
standard a diferenţei dă valoarea testului t de semnificaţie a diferenţei mediilor;
 coloana a cincea indică cu precizie valoarea pragului de semnificaţie (Clinciu, 2012)

Mărimea efectului (d) Eta pătrat (η2) Interpretare


0,2 ≤ d < 0,5 0,01 ≤ η < 0,06
2
Mică
0,5 < d < 0,8 0,06 ≤ d < 0,14 Medie
d ≥ 0,8 d > 0,14 Mare
Interpretarea dată lui eta pătrat de Cohen

83
6.5. Raportarea rezultatelor ANOVA în format APA

Raportarea rezultatelor în stilul APA presupune prezentarea următoarelor aspecte:


- indicatorii statistici descriptivi pentru variabilele dependente;
- graficul diferențelor dintre grupurile analizate;
- rezultatul testului F, gradele de libertate, pragul de semnificație și mărimea efectului;
- dacă testul F este semnificativ statistic, raportați rezultatele testului de comparație
multiplă.

Tabel 1… Indicatori statistici descriptivi și analiza de ANOVA pe o cale în funcție de …


Grupuri M SD N
Control 75,00 2,94 30
Placebo 85,00 2,58 30
Experimental 95,00 0,82 30
Sursă df F Eta pătrat
Rezultate 2 75,00* 0,13
Eroare 9
* p < 0,05

Tabel 2. … Rezultatele comparațiilor multiple …


Comparație Diferența mediilor Eroarea standard 95% intervale de încredere
Control-Placebo -10,00* 1,63 -14,79; -5,21
Control-Experimental -20,00* 1,63 -24,79; -15,21
Experimental-placebo 10,00* 1,63 5,21; 14,79
* p < 0,05

Analizele statistice au arătat că există diferențe semnificative statistic la pragul 0,05 între cele
trei grupuri. Comparațiile multiple Bonferroni au demonstrat că grupul experimental a avut
cele mai bune rezultate, urmat de grupul placebo. Diferențele dintre grupuri sunt
semnificative statistic între oricare două grupuri comparate între ele.

Rezumat

Analiza de varianță înseamnă analiza dispersională (ANOVA înseamnă Analysis


of Variance) și reprezintă o extensie a testelor t de testare a ipotezei semnificației
diferenței dintre medii, atunci când numărul de grupuri comparate este mai mare
de două. ANOVA presupune existența cel puțin a unei variabile discontinue
84
(categoriale), care are minimum trei categorii. Când comparația se face doar
pentru două categorii, rezultatele ANOVA sunt identice cu cele ale testului t
(Clinciu, 2012).

Test de (auto)evaluare a cunoștințelor

Deschideți baza de date Anova aplicatii.sav.

Datele prezentate reprezintă informaţii culese în urma unei cercetări realizate pe


o populaţie de 291 subiecţi, vizând schimbarea atitudiniii faţă de persoanele
bolnave de SIDA. Design-ul experimental vizează două grupuri experimentale
(1-grup experimental, mesaj persuasiv, 3 – gr experimental- dezbatere. şi un grup
de control (2). Subiecţii fac parte din trei etape de vârstă diferite: clasa a VI-a,
clasa a X-a, facultate. Variabila dependenta este atitudinea subiectilor fata de
persoanele bolnave de SIDA. Subiecţii din grupul experimental au fost testaţi în
două etape: pretest pentru stabilirea nivelului iniţial al acceptării faţă de
persoanele bolnave şi posttest, în urma aplicării unui mesaj persuasiv. Cei din
grupul de control nu au fost supuşi niciunui mesaj persuasiv dar şi în cazul lor au
existat două etape, pretest şi posttest. Obiectivul cercetării îl reprezintă
identificarea atitudinilor subiecţilor fata de bolnavii de SIDA si a măsurii în care
un mesaj persuasiv poate duce la modificarea atitudinii de respingere a
subiecţilor fata de persoanele infectate. la grupul experimental 3 s-a folosit în
locul mesajului persuasiv o dezbatere cu subiecţii referitoare la persoanele
infectate, pentru a evidenţia care dintre cele 3 metode este mai eficientă: folosirea
mesajului persuasiv sau dezbaterea.

1. Verificaţi dacă variabila pretest este normal distribuită.


2. Evidenţiaţi dacă există diferenţe semnificative statistic în ceea ce priveşte
nivelul acceptării faţă de persoanele infectate (pretest) în funcţie de tipul
temperamental. Redaţi grafic această diferenţă.
3. Verificaţi ipoteza potrivit căreia există diferenţe semnificative statisitic între
cele trei grupuri (1, 2 şi 3) în etapa de posttest. Evidenţiaţi prin procedurile
post hoc adecvate care este direcţia acestor diferenţe. Realizaţi un grafic în

85
care să evidenţiaţi diferenţele dintre cele trei grupuri. Comentaţi rezultatele
făcând referire la eficienţa mesajului persuasiv şi a dezbaterii asupra
modificării atitudinii.
4. Splitaţi eşantionul după criteriul apartenenţei la cele trei grupuri
(experimental, dezbatere, control) şi calculaţi testul t pentru eşantioane
perechi, pentru pretest şi posttest. Explicaţi rezultatele.
5. Verificaţi ipoteza potrivit căreia există diferenţe între nivelul acceptării faţă
de persoanele bolnave (pretest) în funcţie de ciclul de şcolaritate. Evidenţiaţi
prin procedurile post hoc adecvate care este direcţia acestor diferenţe.
Realizaţi un grafic în care să evidenţiaţi diferenţele dintre cele trei grupuri.
Explicaţi diferenţele.
6. Selectaţi numai grupul experimental 1 şi verificaţi dacă există diferenţe între
nivelul acceptării faţă de persoanele bolnave înainte de aplicarea mesajului
persuasiv în funcţie de ciclul de şcolaritate. Aceiași cerință pentru etapa de
posttest. Cum explicaţi rezultatele obţinute?
7. Verificaţi ipoteza potrivit căreia persoanele care deţin informaţii corecte
despre HIV/SIDA manifestă un nivel ridicat de acceptare faţă de persoanele
bolnave. Redaţi grafic această ipoteză.
8. Formulaţi şi verificaţi o ipoteză unidirecţională referitoare la relaţia dintre
inteligenţa emoţională şi atitudinea faţă de persoanele infectate.
9. Există diferenţe semnificative statistic între băieţi şi fete în ceea ce priveşte
atitudinea faţă de persoanele infectate? Cum verificaţi acest lucru?
10. Recodificaţi variabila vârstă într-o variabilă dihotomică după media de vârstă
şi verificaţi ipoteza potrivit căreia există diferenţe în ceea ce priveşte
atitudinea faţă de persoanele infectate în funcţie de vârstă.
11. Recodificaţi variabila inteligenţă emoţională într-o variabilă trihotomică
(inteligenţă emoţionala mica, medie şi mare), în fiecare clasă incluzând o
treime din cazuri.
12. Realizaţi o analiză de varianţă pentru a evidenţia în ce măsură există diferenţe
semnificative în ceea ce priveşte atitudinea iniţială faţă de HIV/SIDA în
funcţie de nivelul inteligenţei emoţionale.

86
Unitatea de învăţare I.7.

Corelația bivariată liniară

Cuprins
7.1. Introducere ................................................................................................................
7.2. Competenţe ................................................................................................................
7.3. Corelația bivariată – concept și condiții de aplicare ................................................
7.4. Reprezentarea grafică a corelației ............................................................................
7.5. Interpretarea asocierii dintre două variabile ............................................................
7.6. Corelația parțială ......................................................................................................
7.7.Folosirea SPSS pentru calculul corelației ..................................................................
7.8. Raportarea rezultatelor corelației conform regulilor APA .......................................

7.1. Introducere

Unitatea de învățare propune reactualizarea noțiunilor de bază privind


corelația bivariată. Sunt prezentate aspecte privitoare la condițiile necesare
analizei corelaționale și la interpretarea coeficienșilro de corelație Pearson și
Spearman.

7.2. Competenţele unităţii de învăţare

După parcurgerea acestei unități, studenții vor fi capabili:


 să interpreteze corect valorile coeficienților de corelaţie Pearson și
Spearman;
 să explice asocierea a două variabile pornind de la grafice de tip nor de
puncte;
 să evalueze semnificaţia statistică a coeficienţilor de corelaţie Pearson și
Spearman pornind de la exemplele date;
 să formuleze ipoteze care pot fi testate prin intermediul corelației;
 să calculeze coeficienți de corelaţie Pearson și Spearman.

Durata medie de parcurgere a acestei unităţi de învăţare este de 4 ore.

87
7.3. Corelația bivariată – concept și condiții de aplicare

Necesitatea analizei corelaționale poate fi identificată din modul de formulare a


obiectivului şi al ipotezelor („urmărim să evidenţiem gradul de asociere dintre memorie şi
inteligenţă”, „există o legătură între scorurile la testele de inteligenţă şi performanţa şcolară”,
„un nivel ridicat al extraversiei se asociază cu performanţe ridicate în vânzări”) (Sava, 2004).
Corelația nu înseamnă cauzalitate. Uneori putem obține coeficienți de corelație puternici dar
care nu au nicio semnificație practică, în acest caz avem de-a face cu o corelaţie
întâmplătoare.

Să ne reamintim...
„Un studiu recent a arătat că există o corelaţie pozitivă între vânzările la
îngheţată şi numărul actelor violente, astfel, cu cât se înregistrează vânzări la
îngheţată mai mari, cu atât se produc mai multe acte violente”.
- Care credeţi că este explicaţia acestei descoperiri?
- De ce vânzările la îngheţată se asociază cu implicarea oamenilor în acte de
violenţă?
Studiul prezentat nu demonstrează că consumul de îngheţată duce la acte
violente sau că persoanele violente consumă mai multă îngheţată, ci există o
explicaţie alternativă: se consumă mai multă îngheţată vara, anotimp în care
nivelul ridicat al temperaturii predispune la implicarea în mai multe acte
violente. Astfel, atunci când interpretăm rezultatele unui studiu trebuie să fim
precauţi în formularea concluziilor, pentru a nu ajunge la generalizări greşite sau
la concluzii cauzale, pornind de la studii corelaţionale. Concluziile la care
ajungem pot să ducă la decizii inadecvate.

Exemplu: Determinarea sursei covariaţiei dintre două variabile


Asocierea dintre satisfacţia maritală şi implicarea în activități distractive:
- Implicarea în activităţi distractive poate duce la creşterea satisfacţiei
maritale: X → Y
- Oamenii satisfăcuți de relaţiile lor aleg să desfăşoare mai multe activităţi
împreună:

88
- Este posibil ca satisfacţia pentru profesie să determine ambele aspecte (3).

Exemple de studii corelaționale Z

- Există vreo legătură între scorurile la testele de inteligenţă şi performanţa


X Y
şcolară?
- Există asociere între înălţime şi greutate?
- Există asociere între inteligenţa părinţilor şi inteligenţa copiilor?

Aplicația 1
Formulați cinci ipoteze care pot fi testate prin corelații bivariate. Formulați
ipotezele bidirecțional, apoi transformați-le în ipoteze unidirecționale.

 Condiţiile de aplicare a lui r sunt îndeplinite?


O condiție importantă pentru corelația liniară este ca datele să fie numerice.
- Variabilele sunt măsurate pe scale de interval sau de raport (pentru corelaţia Pearson).
- Variabilele sunt normal distribuite.
- Numărul de subiecţi este mai mare de 30.
- Absenţa outlierilor sau a valorilor extreme.
- Relaţia dintre variabile este liniară.
- Norul de puncte indică homoscedasticitate.
Folosim corelaţia Spearman, atunci când:
- Cel puţin una dintre variabile este măsurată pe scală ordinală.
- Cel puţin una dintre variabile nu este normal distribuită.
- Numărul de subiecţi este mai mic de 30.

 Ce fel de ipoteză trebuie testată?


În formularea ipotezei alegem variabile între care pot exista asocieri, pe baza observaţiilor sau
pe baza studiilor anterioare. Ipoteza nu este un adevăr unanim acceptat ci o asumpţie care se
cere a fi testată.

Exemplu
Este dovedit faptul că celebrarea aniversării dovedește longevitatea şi sănătatea.
Statisticile arată că acei oameni care îşi sărbătoresc cele mai multe aniversări
devin şi cei mai în vârstă.

89
7.4. Reprezentarea grafică a corelației

 Pași pentru reprezentarea grafică a corelaţiei


- Desenarea axelor şi decizia cu privire la plasarea fiecărei variabile pe o axă.
- Alegerea intervalelor pentru reprezentarea valorilor.
- Marcarea punctelor pe grafic, ca intersecţie a fiecărei perechi de date.

Aplicația 2
Desenați cu creta pe podea, orientativ, axele OX şi OY reprezentând înălţimea şi
mărimea la pantofi. Vă veți așeza în ordinea crescătoare a înălţimii apoi vă veți
deplasa astfel încât să fiți situaţi la intersecţia dintre înălţimea şi mărimea la
pantofi care vă reprezintă (Hulsizer & Woolf, 2009).
Aplicația 3
Formați echipe de câte 8 studenţi și răspundeți la două întrebări.
- Câte ore aţi dormit noaptea trecută?
- Cât de fericit vă simţiţi acum, pe o scală de la 0 la 8, unde 0 înseamnă deloc
fericit iar 8 extrem de fericit?
Pentru datele obţinute, redaţi norul de puncte.

Exemple de corelații

90
Aplicația 4
Analizați graficele de la exemplul anterior și oferiți câte un exemplu pentru
fiecare diagramă.

Aplicația 5
Estimaţi valoarea şi intensitatea corelaţiilor din graficele de mai jos. Daţi
nume variabilelor care să exemplifice graficele prezentate. Pentru două
dintre grafice, la alegere, eliminaţi punctele care duc la scăderea
coeficientului de corelaţie. Pentru graficele a și b desenaţi câte un punct
care ar duce la scăderea corelaţiei.

Norul de puncte ca modalitate de a testa normalitatea distribuției


Norul de puncte evidențiază patternul de organizare a datelor, fiind și o
modalitate de a testa normalitatea distribuției. Atunci când normalitatea este
încălcată, norul de puncte tinde să fie asimetric la unul dintre capete (Tabachnick
& Fidell, 2007). Forma norului de puncte ne oferă detalii și despre variabilitatea
datelor. Cu cât variabilitatea crește, cu atât corelația scade. Variabilitatea scăzută
se obține în cazul datelor omogene, leptocurtice, asimetrice pozitiv sau negativ.
De asemenea, norul de puncte este o modalitate eficientă de a depista outlierii
bivarați sau valorile aberante.

91
Să ne reamintim... Calculul coeficientului de corelaţie Pearson
Expresia tipică a coeficientului de corelaţie este dată de Bravais – Pearson:

rxy 
   xx y y

  xx
2
 y  y
2

x şi y sunt rezultatele obţinute la cele două înregistrări, iar x şi y


reprezintă mediile celor două distribuţii.

Exemple de corelații
Presupunem că există o legătură între numărul de ore de somn pe noapte şi starea
de bine (Aron, Aron, & Aron, 2013).

Număr ore somn/noapte Starea de fericire Produsul ab. de la medie


Y- y (Y- y )2 (X- x ) *(Y- y )
X X- x (X- x )2 Y
7 0 0 4 0 0 0
5 -2 4 2 -2 4 4
8 1 1 7 3 9 3
6 -1 1 2 -2 4 2
6 -1 1 3 -1 1 1
10 3 9 6 2 4 6
∑=42 ∑=16 ∑=24 ∑=22 ∑=16
x=7 y =4

 x  x  y  y  16 16
𝑟= = = = 0,85
 x  x     y  y  √16 ∗ 22 √352
2 2

Cum interpretăm coeficientului de corelaţie obţinut?


Între numărul de ore de somn pe noapte şi starea de fericire există o corelaţie pozitivă
sau persoanele care dorm mai multe ore pe noapte manifestă în mai mare măsură
starea de fericire. Tabelel cu valori critice ale lui r, ne vor spune că valoarea obținută
este semnificativă statistic: r(4) = 0,85, p <0,05.

92
7.5. Intrepretarea asocierii dintre două variabile
Coeficientul de corelaţie poate să ia valori cuprinse în intervalul (-1; 1). Indiferent de semn
(pozitiv sau negativ), coeficientul de corelaţie este interpretat în felul următor:

Coeficient de corelaţie Interpretare


0,0-0,1 Foarte mic, neglijabil
0,1-0,3 Mic, minor
0,3-0,5 Moderat, mediu
0,5-0,7 Mare, ridicat
0,7-0,9 Foarte mare, foarte ridicat
0,9-1 Aproape perfect

- Corelaţia pozitivă arată relaţia directă între cele două variabile: creşterea variabilei X se
asociază cu creșterea variabilei Y.
- Corelaţia negativă arată relaţia de inversă între cele două variabile: creșterea variabilei X
se asociază cu scăderea variabilei Y.

 Intensitatea asocierii dintre variabile – coeficientul de determinare


Coeficientul de determinare este cel mai utilizat criteriu pentru a aprecia intensitatea
relaţiei dintre două variabile și se notează cu r2. Prin intermediul său se evaluează partea de
asociere comună a două variabile, indicând procentul din dispersia unei variabile care se
asociază cu modul de împrăştiere a celorlalte variabile (Sava, 2004). Valorile lui r trebuie
considerate pe o scală ordinală. Nu este corect să afirmăm că un coeficient de corelaţie de
0,40 este de două ori mai mare decât un altul de 0,20. Dacă dorim să comparăm în mod direct
doi coeficienţi de corelaţie trebuie să ridicăm valorile lui r la pătrat (r2) (Popa, 2008).

Intensitatea asocierii dintre variabile

93
Coeficientul de determinare este un indicator al mărimii efectului. Acesta se
interpretează astfel:

r2 0,01 Efect mic


0,13 Efect mediu
0,26 Efect mare

Exemple de corelații
Pentru exemplul de mai sus, am obţinut un coeficient de corelaţie de r = 0,85.
Coeficientul de determinare va fi r2 = 0,72, deci 72% din variabilitatea stării de
fericire este explicată de numărul de ore de somn pe noapte. Mărimea efectului
este mare.
Cele două variabile au în comun 72% din varianţă, restul de 28% provenind din
alte surse.

Să ne reamintim... Cauzele care pot afecta precizia unui coeficient de


corelaţie
- Presupunerea că între x şi y există coliniaritate, deși în realitate unele
distribuţii evidenţiază foarte greu liniaritate, ele putând fi curbilinii, rectilinii
până la un punct şi apoi haotice etc.
- Distribuţiile atipice care, prezentând valori atipice la extremele seriei de
variaţie (outlieri sau outlieri extremi), accentuează mult variabilitatea datelor
ceea ce conduce la creşterea artificială a coeficientului de corelaţie.
- Erorile de introducere a datelor.
- Erorile de eşantionare: cu cât omogenitatea grupului este mai mare, cu atât
corelaţia descreşte, şi invers.
- Erorile de măsurătoare sau de tastare (Clinciu, 2013).

 Corelația rangurilor - Pași pentru atribuirea de ranguri (rangarea)


- Subiecţii sunt ierarhizaţi în ordinea performanţei sau scorurilor obţinute, de la mare la mic
sau invers.
- Pe o foaie de hârtie se scriu tot atâtea numere câte ranguri trebuie alocate (egale cu
numărul subiecţilor) şi se taie rangurile pe măsură ce ele se alocă, ceea ce ajută la corecta
94
gestiune a acestora. Singura precauţie importantă este aceea de a rezolva corect situaţia în
care două, trei sau mai multe cazuri au aceeaşi valoare de scor a variabilei. De exemplu,
dacă am ajuns cu rangarea la al şaptelea subiect şi următorii trei au aceeaşi performanţă,
din rangurile 8, 9, 10 se selectează rangul din mijloc, 9, care se atribuie tuturor celor trei,
următorul rang ce va fi atribuit fiind 11. Dacă ar fi fost doi subiecţi cu acelaşi scor, atunci
pentru rangurile 8, 9 se acordă rangul intermediar 8,5, următorul rang atribuibil fiind 10.
Pentru ca operaţia de calcul să nu producă o distorsiune prea mare a lui rho cazurile de
acest fel trebuie să fie cât mai puţine.
- Dacă operaţia de rangare a fost corect executată, la sfârşitul ei toţi subiecţii vor avea
ranguri şi toate rangurile vor fi epuizate, în caz contrar trebuind identificată şi corectată
eroarea de rangare.

Să ne reamintim... Formula de calcul a coeficientului de corelație a


rangurilor
6d 2
 1
N ( N 2  1)

unde d este diferenţa rangurilor şi N numărul subiecţilor.

 Interpretarea coeficientului de corelație a rangurilor:


- Ca şi r, ρ are valori cuprinse între –1 şi +1, trecând prin zero, situaţie care indică absenţa
corelaţiei (deci a concordanţei dintre cele două ierarhii exprimate prin ranguri).
- Valoarea calculată pentru ρ se interpretează, ca si r, în comparaţie cu ρ critic dat de
tabelul ρ a lui Spearman la gradul de libertate egal cu numărul de cupluri:
o Dacă ρ calculat < ρ critic, ipoteza nulităţii corelaţiei se păstrează. Între cele două
variabile nu există corelaţie semnificativă statistic.
o Dacă ρ calculat ≥ ρ critic, ipoteza nulă se respinge. Cele două variabile sunt
corelate. În acest caz, trebuie să ne raportăm la semnul lui r calculat pentru a
determina sensul corelaţiei, pozitiv sau negativ.

7.6. Corelația parțială

- Relația dintre două variabile este afectată de o a treia variabilă. Acest lucru este evident în
cazul unor relații false sau a unor relații de moderare.

95
C Y X Y
Schemele unor relații false între
două variabile
X C

Exemplul 1
Zilele ploioase duc la o dispoziție afectivă negativă.
In realitate, există alți factori precum presiunea atmosferică, gradul de
luminozitate pot influența dispoziția afectivă, nu ploaia propriu-zis.

Exemplul 2
Persoanele mai scunde au părul mai lung.
Dacă avem în vedere variabila gen care corelează atât cu lungimea părului cât și
cu înălțimea, obținem un alt rezultat. Femeile au păr mai lung și sunt mai scunde,
iar relația dintre X și Y devine nesemnificativă, dacă ținem cont de gen.

X Y Schema unei relații între X și Y


moderată de a treia variabilă

Exemplul 3
Relația dintre timpul stat la soare și nivelul de bronzare.
Dacă avem în vedere variabila tip de ten, rezultatele sunt diferite.

Schema unei relații între X și Y


X C Y
mediată de a treia variabilă

Exemplul 4
Relația dintre motivația pentru învățare și performanțele școlare este mediată de
strategiile de învățare.
Motivația pentru învățare duce la alegerea unor strategii mai eficiente care, la
rândul lor, duc la rezultate școlare ridicate.

96
7.7.Folosirea SPSS pentru calculul corelației

 Corelația Pearson și Spearman

 Introduceți datele în SPSS.


 Graphs – Legacy Dialogs – Scatter/Dot – Simple Scatter.

Obținerea norului de puncte (Pasul 1)

 Introduceți variabila stare de fericire în câmpul Y Axis și variabila Număr de ore de


somn în câmpul X Axis – OK.

Obținerea norului de puncte (Pasul 2)

 Graficul va apărea în output:

97
Reprezentarea grafică a corelației

Pentru calculul corelației Pearson sau Spearman, urmați pașii de mai jos:

 Analyze – Correlate – Bivariate.

Calculul corelației bivariate (Pasul 1)

 Introduceți în câmpul Variables variabilele între care doriți să calculați coeficientul de


corelație.
 Bifați coeficientul adecvat datelor introduse (Pearson sau Spearman).
98
Calculul corelației bivariate (Pasul 2)

 Matricea de corelații va apărea în output:

Coeficient de corelație (r)

Prag de semnificație (p)

Număr de participanți (N)


Coeficientul de corelație bivariată Pearson

99
 Corelația parțială
 Analyze – Correlate – Partial.


Pași SPSS pentru calculul corelației parțiale (1)

Relația dintre abilitățile spațiale și calculul matematic este moderată de nivelul QI.
 Introducem abilitățile spațiale și calculul matematic în câmpul Variables
 Introducem QI în câmpul Controlling for
 La options bifăm Menas and standard deviations și Zero order correlations

Pași SPSS pentru calculul corelației parțiale (2)

100
Output SPSS pentru calculul corelației parțiale

Prima parte a tabelului arată că există o corelație bivariată (Pearson) puternică semnificativă
statistic între reprezentări spațiale și calcul aritmetic.
- QI corelează semnificativ cu ambele variabile!
In partea a doua a tabelului (Controlling for QI) observăm că de această dată corelația dintre
Reprezentarea spațială și calculul aritmetic devine nesemnificativă legătura dintre cele două
variabile nu era decât efectul influenței pe care o exercita inteligența asupra lor (Popa, 2009).
Dacă relația dintre Reprezentarea spațială și Calculul aritmetic ar fi rămas semnificativă, în
condițiile în care influența QI este eliminată, am fi putut vorbi despre existența uni corelații
parțiale.

7.8. Raportarea rezultatelor corelației conform regulilor APA

Tabelul … Coeficientii de corelație Pearson obținuți intre variabilele cercetării


M (SD) Vârstă Venit Educație Religie Stres
Vârstă 31,88 (10,29) 0,08 0,19* 0,20* .01
Venit 2,60 (1,57) 0,04 -0,14 -0,35**
Educație 3,44 (1,06) -0,29* -0,06
Religiozitate 1,21 (,30) -0,19*
Stres 3,75 (1,19) 1
Notă. N = 109. * p < 0,05, ** p < 0,01.

101
Tabelul … Coeficientii de corelație Spearman obținuți intre variabilele cercetării (N = 9)
Reprezentări Calcul QI
spațiale aritmetic
rho 1 0,786 0,864
Reprezentări spațiale p 0,012 0,003

rho 1 0,905
Calcul aritmetic p 0,001

Rezumat

Un coeficient de corelaţie este un număr unic care indică mărimea relaţiei


dintre două fenomene, procese psihice, lucruri, adică în ce grad variază unul
în paralel cu variaţia celuilalt. Coeficientul de corelație (r) poate lua valori
între -1 și 1, unde 0 înseamnă absența legăturii între două variabile.
Corelaţia nu dezvăluie o relaţie de tip cauză–efect, nu este deci o măsură a
cauzalităţii, ci doar a gradului de paralelism, a modului de asociere, natura
relaţiei urmând a fi interpretată (Clinciu, 2013). Reprezentarea grafică a
corelației se numește nor de puncte. Norul de puncte oferă informații despre
direcția și intensitatea asocierii dintre variabile. Pentru a aprecia
intensitatea relației dintre două variabile se folosește coeficientul de
determinare. Prin intermediul coeficientului de determinare se evaluează
partea de asociere comună a două variabile, indicând procentul din dispersia
unei variabile care se asociază cu modul de împrăștiere a celeilalte variabile
(Sava, 2004).

Test de (auto) evaluare a cunoștințelor


Aplicația 1
Datele din tabelul de mai jos au fost culese într-o cercetare despre relația dintre
frica de eșec și rezultatele la examen.

Nr_crt Gen Frica de eșec Rezultat


1 masculin 8,00 7,80
2 feminin 5,00 8,20
3 masculin 8,00 8,00
4 feminin 7,00 6,50
5 masculin 6,00 8,30

102
6 feminin 7,00 7,70
7 masculin 7,00 6,90
8 feminin 9,00 6,00
9 masculin 5,00 9,00
10 feminin 6,00 8,90
11 masculin 4,00 9,25
12 feminin 7,00 8,00
13 masculin 5,00 8,80
14 feminin 9,00 5,80
15 masculin 7,00 9,00
16 feminin 7,00 7,60
17 masculin 8,00 6,00
18 feminin 9,00 6,00
19 masculin 5,00 9,00
20 feminin 6,00 8,90
21 masculin 5,00 8,80
22 feminin 9,00 5,80
23 masculin 7,00 9,00
24 feminin 7,00 7,60
25 masculin 5,00 8,00

Pornind de la situația prezentată, răspundeți la întrebările următoare:


1. Introduceți datele în SPSS, codificând și etichetând adecvat variabilele.
2. Calculaţi valorile tendinţei centrale (media, mediana, modul şi suma
valorilor), ale împrăştierii (amplitudinea împrăştierii, valorile minimă şi
maximă, abaterea standard, dispersia şi eroarea standard a mediei = SEM) şi
formei distribuţiei pentru variabilele Frica de eșec și Rezultate.
3. Verificați dacă cele două variabile măsurate pe scale de interval prezintă
outlieri sau valori aberante, construind câte un boxplot pentru fiecare
variabilă. Descrieți boxploturile făcând referire la normalitatea distribuției, la
prezenta outlierilor sau a valorilor aberante, la poziția medianei.
4. Realizați norul de puncte pentru a reda asocierea dintre Frica de eșec și
Rezultate. Comentați graficul făcând referire la liniaritatea norului, grosimea
sa, la direcția norului de puncte, la prezența outlierilor.
5. Realizați din nou norul de puncte, dar de această dată, colorați diferit băieții și
fetele pe acest grafic.
6. Calculați coeficientul de corelație Pearson între Frica de eșec și Rezultate.
Prezentați corespunzător rezultatul, precizați dacă această corelație este
semnificativă statistic și care este pragul de semnificație. Explicați rezultatele

103
obținute din punct de vedere psihologic.
7. Calculați coeficientul de corelație Pearson între Frica de eșec și Rezultate, dar
separat pentru băieți și fete. Prezentați corespunzător rezultatul, precizați dacă
această corelație este semnificativă statistic și care este pragul de
semnificație. Explicați rezultatele obținute din punct de vedere psihologic.
8. Transformați variabilele Frica de eșec și Rezultate, în variabile ordinale
(opțiunea Rank Cases).
9. Calculați coeficientul de corelație Spearman între cele două variabile nou
create. Prezentați corespunzător rezultatul, precizați dacă această corelație
este semnificativă statistic și care este pragul de semnificație. Explicați
rezultatele obținute din punct de vedere psihologic.
10. Transformați variabilele Frica de eșec și Rezultate în note z și apoi calculați
coeficientul de corelație Pearson între cele două variabile standardizate.
Analizați rezultatele obținute și comparați-le cu cele obținute în cazul
calculului corelației cu variabilele exprimate în note brute. Ce observați și
cum explicați rezultatele?

Aplicația 2
Deschideți baza de date Baza de date proiect.sav. Pornind de la această bază
de date, rezolvați următoarele cerințe:
1. Calculați indicatorii statistici descriptivi pentru variabilele care măsoară
trăsături de personalitate.
2. Redați norurile de puncte pentru asocierea dintre stima de sine și
trăsăturile de personalitate măsurate cu EPQ. Analizați și interpretați
graficele obținute.
3. Calculați corelația dintre stima de sine și trăsăturile de personalitate
măsurate cu EPQ.
4. Calculați mărimea efectului pentru toate corelațiile calculate și explicați
dpdv psihologic rezultatele obținute.
5. Calculați corelația dintre perceperea de sine și perceperea de sine
corporală, separat pentru băieți și fete. Calculați mărimea efectului pentru
corelațiile obținute și explicați dpdv psihologic rezultatele obținute.
6. Transformați variabilele nevrotism și stima de sine în variabile ordinale,
folosind opțiunea Rank Cases.
104
7. Calculați coeficientul de corelație adecvat între cele două variabile nou
create la punctul 6.
8. Verificați asocierea dintre stima de sine și perceperea de sine corporală, în
condițiile în care influența genului este ținută constantă.
9. Verificați, folosind testul statistic adecvat dacă există diferențe de gen în
ceea ce privește stima de sine, eficacitatea de sine și perceperea de sine
corporală. Calculați mărimile efectului și explicați dpdv psihologic
rezultatele obținute.
10. Calculați coeficienții de corelație între Înălțimea știută – dorită și
Greutatea știută-dorită.
11. Redați grafic asocierile dintre Înălțimea știută – dorită și Greutatea știută-
dorită, marcând cu culori diferite băieții și fetele.
12. Verificați asocierile de la punctul 10, în condițiile în care influența
genului și a vârstei sunt ținute constante.
13. Formulați două ipoteze care pot fi testate prin corelații bivariate.
Verificați dacă cele două ipoteze se confirmă. Calculați mărimea
efectului, raportați conform APA rezultatele și interpretați psihologic
rezultatele obținute.
14. Formulați o ipoteză care poate fi testată printr-o corelație parțială.
Verificați dacă ipoteza se confirmă. Calculați mărimea efectului, raportați
conform APA rezultatele și interpretați psihologic rezultatele obținute.
15. Formulați o ipoteză care poate fi testată prin intermediul unui test t.
Verificați dacă ipoteza se confirmă. Calculați mărimea efectului, raportați
conform APA rezultatele și interpretați psihologic rezultatele obținute.

105
Unitatea de învăţare I.8.

Regresia liniară simplă

Cuprins
8.1. Introducere ................................................................................................................
8.2. Competențe ................................................................................................................
8.3. Regresia liniară simplă – noțiuni de bază .................................................................
8.4. Condiții de aplicare pentru regresia liniară simplă și multiplă ...............................
8.5. Folosirea SPSS pentru calculul regresiei liniare simple ...........................................
8.6. Raportarea rezultatelor analizei de regresie în format APA .....................................

8.1. Introducere

Regresia este o procedură frecvent utilizată în cercetarea psihologică, fie pentru


validarea unor modele teoretice, fie pentru scopuri practice, precum selecția.
Unitatea de învățare 8 prezintă principalele condiții are trebuie respectate pentru
analiza de regresie. Accentul este pus pe regresia liniară simplă: mod de calcul,
interpretare și raportare conform regulilor APA.

8.2. Competenţele unităţii de învăţare

După parcurgerea acestei unități, studenții vor fi capabili:


 să explice conceptul de regresie liniară;
 să diferențieze conceptele de predictor și criteriu;
 să deseneze linia de regresie;
 să calculeze valoarea criteriului pornind de la ecuația de regresie;
 să identifice situații de aplicare a regresiei liniare.

Durata medie de parcurgere a acestei unităţi de învăţare este de 2 ore.

106
8.3. Regresia liniară simplă – noțiuni de bază

 Regula predicției liniare (Ecuația de regresie) reprezintă formula pentru a face predicții
sau formula pentru a prezice scorul unei persoane, predicția criteriului pornind de la unul
sau mai mulți predictori.

𝒀 = 𝒂 + 𝒃𝒙
Scorul prezis al unei persoane este egal cu constanta regresiei plus rezultatul înmulțirii
coeficientului de regresie cu scorul persoanei la variabila predictor.

Y = scor prezis, variabila dependentă, criteriul;


X = scor obținut de persoană la variabila predictor, variabila independentă, predictor;
a = constanta (un număr fix care se adaugă predicției);
b = coeficientul nestandardizat de regresie (număr multiplicat cu scorul persoanei obținut la
variabila predictor, ca parte a regulii de predicție liniară).

- a se mai numește intercept, adică punctul de intersecţie al liniei de regresie cu


ordonata (axa OY);
- b indică panta liniei de regresie; deoarece el este dat de valoarea tangentei unghiului
teta (θ) - acesta indică cu cât creşte Y atunci când X creşte cu o unitate; panta este
ascendentă pentru corelaţiile pozitive şi descendentă pentru cele negative.

 În cazul regresiei bivariate b este dat de formula:

𝜎𝑦
𝑏=𝑟
𝜎𝑥
unde r este coeficientul de corelaţie iar σx şi σy sunt abaterile standard pentru cele două
variabile.

 Coeficientul a se calculează după formula:

𝑎 = 𝑌̅ − 𝑏 ∗ 𝑋̅
în care x şi y sunt mediile variabilelor Y şi X iar b este coeficientul nestandardizat de regresie.

107
Exemplu
Media inteligenței unei clase de elevi este de 106,71 cu o abatere standard de σx
= 13,52, iar media la matematică este de 7,98 cu o abatere standard σy = 0,92,
corelaţia dintre QI şi matematică fiind r = 0,83. Vom avea:
b = 0,83 · 0,92/13,52 = 0,0565.
a = 7,98 - 0,0565 · 106,71 = 7,98 - 6,03 = 1,95
Y = 1,95 + 0,0565 · X
Pentru QI de 116 şi 87, valoarea anticipată a mediei la matematică va fi:
Y = 1,95 +0,0565 · 116 = 8,50
Y = 1,95 + 0,0565 · 87 = 6,87

 Regresia liniară simplă, în cazul în care datele sunt exprimate în note standard sau
note z

Cunoscând nota z a unei persoane la o variabilă, vom prezice nota sa z la cealaltă variabilă
după formula:
𝑧𝑦 = 𝐵 ∗ 𝑧𝑥
în care B se numește chiar coeficient de regresie.

Deoarece valoarea coeficientului standardizat de regresie este exprimată de coeficientul de


corelaţie dintre variabile, formula anterioară devine:
𝑧𝑦 = 𝑟 ∗ 𝑧𝑥

 Desenarea liniei de regresie


Linia de regresie este reprezentarea vizuală a ecuației de regresie.
Pași :
1) Desenați și etichetați axele unui nor de puncte.
2) Identificați valoarea prezisă pentru variabila criteriu pentru o valoare scăzută a
variabilei predictor și marcați punctul pe grafic. Veți face predicția folosind
formula învățată 𝑌̂ = 𝑎 + 𝑏𝑋.
3) Faceți același lucru, dar pentru o valoare ridicată a variabilei predictor. Cel mai
bine este să alegeți o valoare a variabilei predictor (X), care este mult mai mare

108
decât cea utilizată la Pasul 2). Punctele vor fi, astfel, îndepărtate unele de altele, iar
desenul va fi mai precis.
4) Desenați o linie care trece prin ambele puncte. Aceasta este linia de regresie.

Exemplu
Pornim de la datele obținute la exemplul 1:

scor
X: QI 87 116
Y: medie matematică 6,87 8,50

8,5
Medie matematica

7,5
medie
7 matematica

6,5
Linear (medie
matematica)
6

5,5
80 85 90 95 100 105 110 115 120
QI

 Regresia liniară multiplă


Regresia liniară multiplă presupune folosirea mai multor predictori. In acest caz, ecuația de
regresie este următoarea:

Y = B0 + B1·X1 + B2·X2 + ... + Bn·Xn

8.4. Condiţii de aplicare pentru regresia liniară simplă şi multiplă

1) Variabila dependentă (VD) și variabila independentă (VI) să fie variabile cantitative


normal distribuite.
2) Relaţia dintre VD şi VI să fie liniară (scatterplot - matrix).

109
3) Erorile (reziduurile) să fie normal distribuite (histogramă sau Kolmogorov-Smirnov).
4) Evitarea multicoliniarităţii (corelaţii mari 0,50 – 0,60 între oricare două VI).
5) Evitare cazurilor extreme şi a cazurilor influente (inspectarea tabelului Residuals
statitics).
6) Evitarea homoscedasticităţii : reziduurile vor avea aceeaşi varianţă pentru fiecare nivel
al variabilelor predictor (VI).

8.5. Folosirea SPSS pentru calculul regresiei liniare simple

 Analyse – Regression – Linear

Calculul regresiei liniare simple (Pasul 1)

 Introduceți variabila dependentă (variabila criteriu) în câmpul Dependent și variabila


independentă în câmpul Independent.
 Dacă doriți să obțineți informații descriptive despre variabile, selectați Statistics –
Descriptives.
 OK.

110
Calculul regresiei liniare simple (Pasul 2)

 Outputul obținut va conține mai multe tabele:


o Primul tabel arată variabilele din modelul de predicție.
o Al doilea tabel, Model Summary, oferă coeficientul de corelație dintre variabila
dependentă și variabila independentă (R – coeficientul de corelație multiplă, pentru
regresia multiliniară), coeficientul de determinare (R2) care arată procentul de variație
al variabilei criteriu explicat de variabila predictor.
o Al treilea tabel, ANOVA, testul F arată în ce măsură există diferențe semnificative
statistic între estimările oferite pe baza ecuației de regresie implicate în comparație cu
estimările bazate pe valoarea mediei (Sava, 2004). Pentru un model eficient, F este
semnificativ statistic.
o Al patrulea tabel, Coefficients, conține coeficienții standardizați și nestandardizați de
regresie și valoarea constantei. Testul t de pe ultima coloană arată dacă fiecare
coeficient de regresie este semnificativ diferit de 0. Pragul de semnificație mai mic de
0,05 arată că predictorul ales este un predictor semnificativ.

111
8.6. Raportarea rezultatelor analizei de regresie în format APA

Tabelul … Coeficienții de corelație Pearson obțtinuți între variabilele…..


Număr de țigări Vârsta Venit
consumate pe zi la 40 ani inițială lunar
** **
Numar de tigari consumate pe zi la 40 ani 1 -0,64 0,73
Varsta initiala 1 -0,74**
Venit lunar 1

Nota: *p < 0,05, **p < 0,01, N = 20

Variabilele incluse în analiza au fost: Vârsta de debut și Venitul lunar, ca variabile predictor
și Numărul țigări consumate pe zi la 40 ani, variabila criteriu. Coeficienții de corelație
Pearson arată asocieri semnificative statistic între cei doi predictori si criteriu. Analiza de
regresie liniară simplă arată că 56% din variația Numărului de țigări consumate pe zi la 40 ani
poate fi explicat de venitul lunar și vârsta de debut, modelul fiind semnificativ statistic (F =
11,01, p < .01). Analiza coeficienților de regresie arată că numai Venitul este un predictor

112
semnificativ (t = 2,42, p < 0,05), in timp ce Vârsta de debut nu este un predictor semnificativ
(t = -0,88, p > 0,05).

Tabelul … Coeficienți de regresie pentru predicția …..


Coeficienții de regresie
Nestandardizați Standardizați
Variabile B SE B β t
2
R 0,56

F 11,01**
Constanta -1,308
Varsta de debut -0,40 0,45 -0,21 -0,88
Venitul lunar 0,07 0,02 0,58 2,42*
Nota: Variabila criteriu: Numărul țigări consumate pe zi la 40 ani
*p < 0,05, **p < 0,01, N = 20.

Ecuația de regresie obținută este următoarea:


Nr. de țigări consumate pe zi la 40 ani = -1,31 -0,40 * Vârsta de debut + 0,07 * Venitul lunar

Rezumat

Regresia este o procedură frecvent utilizată în cercetarea psihologică, fie pentru


validarea unor modele teoretice, fie pentru scopuri practice, precum selecția. De
exemplu, cunoscând nivelul inteligenței unui elev, putem prezice performanța sa
școlară. Regresia ne permite să estimăm rezultatele viitoare pe baza unor
indicatori din prezent. Variabila ale cărei valori dorim să le prezicem, se
numește criteriu, iar variabila ale cărei valori le utilizăm pentru a prezice
valorile criteriului, se numește predictor. Regresia pleacă de la premisa unei
corelații puternice între predictor și criteriu. Măsura în care norul de puncte
descrie o relație liniară între variabile poate fi ilustrată prin trasarea unei drepte
prin acest nor de puncte care conturează patternul norului de puncte și care se
numește linie de regresie. În cazul regresiei liniare simple este vorba de o
distribuţie bivariată, în care există un singur predictor (variabila independentă)
şi un singur criteriu (variabila dependentă). Regresia multiliniară sau multiplă
presupune mai multe surse de variaţie, ecuaţia de regresie include mai mulţi

113
factori ce intervin cu ponderi diferite în predicţia criteriului.

Test de (auto) evaluare a cunoștințelor


Aplicația 1
În tabelul de mai jos sunt înregistrate date pentru o cercetare privind
predicția performanței în muncă. Un cercetător a obținut de la angajații unei
organizații date despre satisfacția acestora în muncă și despre media de absolvire
a facultății (rezultatele academice). De la managerul organizației a obținut date
privind performanța în muncă a angajaților. Pornind de la datele din tabel,
rezolvați cerințele de mai jos.
Nr Satisfacție Rezultate Performanța
academice în muncă
1 15 8 25
2 25 5 10
3 20 6 20
4 19 4 26
5 18 7 28
6 9 9 40
7 8 8 50
8 18 5 12
9 15 5 12
10 27 4 10
11 16 6 26
12 26 6 11
13 22 7 22
14 20 6 24
15 19 10 30
16 17 10,00 42
17 10 8,00 49
18 9 5,00 16
19 19 9,00 14
20 17 5,00 12

1. Introduceți datele în SPSS, codificând și etichetând adecvat variabilele.


2. Calculați coeficienţii de corelaţie Pearson dintre performanța în muncă,
satisfacție și rezultatele academice.
3. Verificați dacă variabila satisfacție este un predictor eficient al
performanței în muncă. Calculaţi coeficientul de corelație multiplă,
coeficientul de determinare, verificaţi dacă modelul de regresie este
eficient în predicţie și dacă predictorul ales este semnificativ statistic.
4. Scrieți ecuația de regresie pe baza coeficienților obținuți.

114
5. Verificați dacă variabila performanțe academice este un predictor eficient
al performanței în muncă. Calculaţi coeficientul de corelație multiplă,
coeficientul de determinare, verificaţi dacă modelul de regresie este
eficient în predicţie și dacă predictorul ales este semnificativ statistic.
6. Scrieți ecuația de regresie pe baza coeficienților obținuți.
7. Decideți care dintre cele două modele testate la punctele 3 și 5 este mai
eficient și argumentați alegerea.
8. Propuneți încă un predictor al performanței în muncă și formulați o
ipoteză care poate fi testată prin intermediul regresiei liniare simple.
9. Transformați variabilele performanță în muncă satisfacție în note z.
10. Verificați dacă variabila satisfacție este un predictor eficient al
performanței folosind variabilele transformate în note z. Scrieți ecuația de
regresie.

Aplicația 2
O cercetare realizată de Miles şi Johnson a încercat să evidenţieze care este
influenţa factorilor de personalitate asupra conducerii agresive a automobilului.
Prin comportamentul de conducere agresivă se înţelege un ansamblu de practici
precum conducerea automobilului cu viteză excesivă, nesocotirea regulilor de
circulaţie în trafic, nervozitate la volan etc. Autorii au identificat trei dimensiuni
de personalitate care ar exercita o influenţă semnificativă asupra conducerii de tip
agresiv. Astfel, o conştiinciozitatea, agreabilitate scăzută si un nivel ridicat de
neuroticism favorizează conduita agresivă la volan. Alte variabile care ar putea fi
luate în considerare sunt genul, tipul automobilului pe care îl deţine subiectul
(străină sau autohtonă) vârsta şi nivelul de educaţie.

Cerinţe:

1. Calculati coeficienţii de corelaţie dintre agresivitatea la volan si celelalte


variabile măsurate pe scale de interval.
2. Verificati daca variabila constiinciozitate este un predictor eficient al
agresivitatii la volan. Calculaţi coeficientul de corelatie multipla,
coeficientul de determinare, verificaţi daca modelul de regresie este
eficient in predicţie si daca predictorul ales este semnificativ statistic.

115
Realizati graficul care arata şi gradul de suprapunere dintre valorile
prezise şi cele reale selectand optiunea adecvata din meniul Regression.
Scrieti ecuatia de regresie pe baza coeficientilor obtinuti.
3. Verificati daca agresivitatea la volan a subiectilor din esantion este
diferita de media la nivel national a agresivitatii (media populatiei = 3,95)
4. Verificati daca exista diferente intre baieti si fete in ceea ce priveste
agresivitatea la volan. Apoi, redati grafic aceasta diferenta printr-un grafic
cu bare sau cu linii.
5. Verificati daca variabila agresivitatea la volan este normal distribuita.
6. Redati grafic cat la suta dintre subiecti au studii superioare si cat la suta
au studii medii.
7. Redati printr-n boxplot si printr-o histograma distributia variabilei
agresivitate la volan.
8. Testati ipoteza conform careia soferii care conduc masini straine tind sa
fie mai agresivi la volan decat soferii care conduc masini
autohtone.Explicati rezultatele. Redati grafic diferenta.
9. Calculati corelatia dintre agresivitatea la volan si agreabilitate separat
pentru baieti si fete. Redati grafic asocierea si explicati dpdv psihologic
rezultatele. Reaalizati si reprezentarile grafice pentru aceste asocieri.
10. Transfomati variabilele agresivitate si constiinciozitate in note z.
11. Verificati daca variabila conștiinciozitate este un predictor eficient al
agresivității la volan, folosind variabilele transformate în note z. Scrieți
ecuația de regresie.

116
Unitatea de învăţare I.9.

Tehnicile chi pătrat

Cuprins
9.1. Introducere ................................................................................................................
9.2. Competenţe ................................................................................................................
9.3. Testul chi-pătrat pentru gradul de potrivire ..............................................................
9.4. Testul chi-pătrat pentru gradul de asociere sau independență .................................
9.5. Folosirea SPSS pentru calculul chi pătrat.................................................................
9.6......................................................................................................................................

9.1. Introducere

Testele nonparametrice sunt destinate testării ipotezelor statistice, dar fără


a mai face inferențe asupra parametrilor populației şi fără a testa ipoteze legate
de aceştia. Încălcarea asumpției de normalitate a variabilelor, numărul mic de
participanți, variabilele măsurate pe scale nominale și ordinale fac necesară
stăpânirea principalelor tehnici nonparametrice. Unitatea de învățare 9 se
centrează pe două dintre cele mai frecvent utilizate tehnici chi pătrat pentru
potrivire și chi pătrat pentru asociere.

9.2. Competențele unității de învățare

După parcurgerea acestei unități, studenții vor fi capabili:


 să diferențieze testele parametrice de cele nonparametrice;
 să identifice corect situațiile de aplicare a tehnicilor chi pătrat pentru
asociere și pentru potrivire;
 să aplice formula de calcul a tehnicilor chi pătrat;
 să formuleze ipoteze care pot fi testate prin intermediul tehnicilor
nonparametrice.

Durata medie de parcurgere a acestei unităţi de învăţare este de 2 ore.

117
9.3. Testul chi-pătrat pentru gradul de potrivire

Scopul testului chi pătrat pentru potrivire este de a compara un set de frecvențe observate cu
un set de frecvențe teoretice. Frecvențele teoretice pot fi egale pentru fiecare categorie sau pot
fi specificate de către cercetător. Testul este folosit frecvent pentru verificarea
reprezentativității unui eșantion (în acest caz frecvențele teoretice vor fi specificate de către
cercetător) sau pentru identificarea unor preferințe/opinii/atitudini (frecvențele teoretice nu
sunt specificate, ci sunt considerate egale) (Labăr, 2008).

Exemplu
Un cercetător vrea să afle care dintre instituții (mass-media, familia sau școala)
are o influență mai mare în formarea atitudinilor prosociale.

 Condiții de aplicare a testului chi-pătrat pentru gradul de potrivire


- Observațiile sunt independente.
- Variabila analizată este categorială.

Aplicația 1
Propuneți trei exemple de situații pentru care este preferabilă folosirea testului
chi pătrat pentru gradul de potrivire.

Să ne reamintim... Formula de calcul a testului chi pătrat și pașii pentru


calculul său
1. Determinarea frecvențelor observate la nivelul fiecărei categorii.
2. Determinarea frecvențelor așteptate pentru fiecare categorie.
3. Pentru fiecare categorie, se calculează diferența dintre frecvența
observată și frecvența așteptată.
4. Diferențele obținute se ridică la pătrat.
5. Fiecare diferență ridicată la pătrat se împarte la frecvența expectată
pentru fiecare categorie.
6. Se face suma tuturor rezultatelor de la punctul anterior.

2
(𝑂 − 𝐸)2
𝜒 =∑
𝐸

118
O este frecvența observată, E este frecvența așteptată (expectată).

Exemplu
Care dintre următoarele trei instituții (mass-media, familia, școala) are o
.
influență mai mare în formarea atitudinilor prosociale?

Categorii Frecvențe Frecvențe Diferența Diferența2 (𝑶 − 𝑬)𝟐


observate O expectate E O-E (O-E)2 𝑬
Mass-media 12 20,7 -8,7 75,69 3,65
Familia 14 20,7 -6,7 44,89 2,23
Școala 36 20,7 15,3 234,09 11,30
Total 62 ∑ = 17,18

2
(𝑂 − 𝐸)2
𝜒 =∑ = ∑(3,65 + 2,23 + 11,30) = 17,18
𝐸

 Testarea ipotezelor prin tehnica chi pătrat


1. Formularea ipotezei cercetării și a ipotezei de nul.
2. Determinarea caracteristicilor distribuției de comparație.
3. Calculul chi pătrat.
4. Decizia statistică privind respingerea ipotezei de nul.

Aplicația 2
Aplicați testul chi pătrat pentru o situație în care o variabilă cu trei categorii are
15 frecvențe într-o categorie, 30 în a doua categorie și 25 în a treia categorie iar
categoriile au frecvențe expectate egale.
a) Imaginați un exemplu pentru aceste date.
b) Formulați ipoteza cercetării și verificați dacă ea se confirmă.

9.4. Testul chi-pătrat pentru gradul de asociere sau independență

Acest tip de test se folosește pentru verificarea asocierii dintre două variabile nominale sau
categoriale, sau pentru compararea frecvențelor între două eșantioane independente. Testul
chi pătrat calculează diferența dintre frecvențele observate și cele așteptate pentru fiecare
dintre celulele tabelului de contingență a celor două variabile. Dacă diferențele sunt nule,
atunci cele două variabile sunt independente, dacă diferențele sunt mari, atunci este posibil ca

119
rezultatele testului chi pătrat să fie semnificative statistic și să existe asociere între cele două
variabile (Labăr, 2008).
Exemplu
Un cercetător vrea să afle dacă există diferențe între tipul de mijloc de informare
folosit între oamenii din mediul urban și cei din mediul rural.

 Condiții de aplicare a testului chi-pătrat pentru gradul de asociere


- Variabilele sunt categoriale.
- Observațiile sunt independente.
- Categoriile sunt mutual exclusive.
- Numărul minim de frecvențe așteptate pentru o celulă trebuie să fie mai mare au egal cu 5.

Aplicația 3
Propuneți trei exemple de situații pentru care este preferabilă folosirea testului
chi pătrat pentru gradul de asociere sau independență.

 Tabelele de contingență
Tabelul de contingență este un tabel în care distribuțiile celor două variabile sunt calculate
astfel încât să se obțină frecvențele combinațiilor dintre ele și frecvențele totale (Aron, Aron,
& Aron, 2013).

Exemplu
Pentru exemplul de mai sus, tabelul obținut este un tabel de tip 3X2, pentru că
variabila mijloc de informare are 3 categorii iar variabila mediu de proveniență
are 2 categorii.

Mijloc de informare Total


Internet Ziar TV
Mediu Urban 60 30 30 120 (60%)
proveniență Rural 20 20 40 80 (40%)
Total 80 50 70 200 00%)

120
Să ne reamintim... Pași pentru calculul frecvențelor observate și expectate în
tabelele de contingență și calcului chi pătrat
1. Calculul procentelor totale pe fiecare rând.
2. Pentru fiecare celulă, se înmulțește procentul total de pe rând cu
totalul de pe coloană. Acestea sunt frecvențele expectate.
3. Se calculează chi pătrat după formula:
(𝑂 − 𝐸)2
𝜒2 = ∑
𝐸
O este frecvența observată, E este frecvența expectată.

Exemplu

Mijloc de informare Total


Internet Ziar TV
Mediu Urban 60 (48) 30 (30) 30 (42) 120 (60%)
proveniență Rural 20 (32) 20 (20) 40 (28) 80 (40%)
Total 80 50 70 200 (100%)

(𝑂 − 𝐸)2 (60 − 48)2 (30 − 30)2 (40 − 28)2


𝜒2 = ∑ = + + ⋯+ = 16,07
𝐸 48 30 28

 Testarea ipotezelor prin tehnica chi pătrat


1. Formularea ipotezei cercetării și a ipotezei de nul.
Calculul gradelor de libertate: Df = (Ncategorii - 1) (Nrânduri - 1).
2. Calculul chi pătrat.
3. Decizia statistică privind respingerea ipotezei de nul.

Aplicația 4
Aplicați testul chi pătrat pentru o situație în care se dă o variabilă cu două
categorii care are 15 frecvențe într-o categorie și 20 în a doua categorie iar a
două variabila are 10 frecvențe într-o categorie și 12 în a doua categorie.

Variabila A
Categoria 1 Categoria 2
Variabila B Categoria 1 15 20
Categoria 2 10 12

121
a) Imaginați un exemplu pentru aceste date.
b) Formulați ipoteza cercetării și verificați dacă ea se
confirmă.

9.5. Folosirea SPSS pentru calculul chi pătrat

În SPSS au fost create două variabile, variabila informare, cu trei categorii (1 = Internet, 2 =
Ziar, 3 = TV) și variabila mediu cu două categorii (1 = urban, 2 = rural)

 Testul chi-pătrat pentru gradul de potrivire

Calculul testului chi pătrat pentru gradul de potrivire (Pasul 1)

 Analyze – Nonparametric Tests – Legacy Dialogs – Chi-sqare.


 Introduceți variabila informare în câmpul Test Variables List.
 Bifați All categories equal.
 OK.

122
Calculul testului chi pătrat pentru gradul de potrivire (Pasul 2)

 Outputul obținut este cel de mai jos și conține două tabele:


o Primul tabel, Frequencies, prezintă pentru fiecare categoriile frecvențele
observate, frecvențele așteptate și reziduurile (Diferența O-E).
o Al doilea tabel, Test Statistics, prezintă rezultatele testului chi pătrat.
Observăm că χ2= 0,40 iar pragul de semnificație este p = 0,819. Acest lucru
înseamnă că nu există diferențe între ponderea diferitelor mijloace de
informare folosite.

Testul chi pătrat pentru gradul de potrivire

123
Analiza reziduurilor din primul tabel ne arată că cel mai mult ca sursă de informare este
folosit Internetul, dar diferența dintre categorii nu este semnificativă statistic.

 Testul chi-pătrat pentru gradul de asociere sau independență

Calculul testului chi pătrat pentru gradul de asociere (Pasul 1)

 Analyze – Descriptives Statistics – Crosstabs.


 Introducem variabila Informare în câmpul Row(s) și variabila Mediu în câmpul
Column(s).
 Crostabs – Chi square – Continue.
 Dacă dorim afișarea și a frecvențelor observate și așteptate, bifăm Cells – Observed și
Expected – Continue – OK.

124
Calculul testului chi pătrat pentru gradul de asociere (Pasul 2)

 Outputul obținut este cel de mai jos și conține două tabele:

Tabelul de contingență

o Primul tabel este tabelul de contingență.

125
o Al doilea tabel oferă rezultatele testului chi pătrat. Observăm că χ2= 7,50 iar
pragul de semnificație este p = 0,024. Acest lucru înseamnă că ipoteza
cercetării se confirmă, cele două variabile nu sunt independente, astfel
proporția mijloacelor de informare folosite este diferită pentru persoanele din
mediul urban și din mediul rural.

Testul chi pătrat pentru gradul de asociere

Rezumat

Testele nonparametrice sunt destinate testării ipotezelor statistice, dar


fără a mai face inferenţe asupra parametrilor populaţiei şi fără a testa ipoteze
legate de aceştia. Testele nonparametrice nu pleacă de la premisa normalităţii
distribuţiei, fiind teste independente de forma distribuţiilor. Testele
nonparametrice sunt aplicabile doar datelor non-numerice de tip categorial şi
nominal, fiind prin aceasta utile în zone în care testele parametrice nu mai sunt
operaţionale. Când avem o singură variabilă categorială, raportată la o
distribuţie teoretică sau la frecvenţe de apariţie dinainte ştiute, chi-pătrat
determină gradul de suprapunere al distribuţiei real observate peste cea
așteptată și vorbim despre chi-pătrat pentru potrivire (goodness of fit). În cazul
a două variabile categoriale, chi-pătrat determină dacă ele sunt independente
una în raport cu cealaltă, sau dacă sunt relaţionate sau asociate, adică
neindependente, vorbim în acest caz despre chi-pătrat pentru asocierea datelor
categoriale.

126
Test de (auto) evaluare a cunoștințelor

În tabelul de mai jos sunt sumarizate răspunsurile unui grup de 30 studenți la


psihologie, fete (1) și băieți (2) la două întrebări:
- Ați mai urmat vreun curs de statistică până acum? Variantele de răspuns sunt: 1
= Da, 0 = Nu.
- Cum considerați învățarea statisticii pentru studenții de la psihologie?
Variantele de răspuns sunt: 1 = inutilă, 2 = utilă, 3 = interesantă, 4 = dificilă, 5 =
facilă.

Nr Gen Participare Opinie Nr Gen Participare Opinie


1 1 0 1 16 1 1 4
2 2 0 2 17 1 0 4
3 2 0 3 18 1 1 4
4 1 0 4 19 2 0 2
5 1 0 5 20 2 1 3
6 2 0 2 21 1 0 1
7 2 0 2 22 1 1 1
8 2 0 2 23 2 0 2
9 2 0 3 24 2 1 3
10 2 1 3 25 2 0 3
11 1 0 4 26 1 1 4
12 2 1 5 27 2 0 5
13 1 0 5 28 1 1 4
14 2 1 5 29 2 0 3
15 1 0 5 30 1 1 5

1. Introduceți datele în SPSS și etichetați corespunzător variabilele.


2. Aplicați testul statistic adecvat pentru a identifica dacă există diferențe
între opiniile studenților la psihologie față de învățarea statisticii.
3. Redați printr-un grafic simplu, cu bare, frecvențele de apariție pentru
fiecare categorie de răspuns de la întrebarea 2.
4. Redați tabelul de contingență pentru asocierea celor două variabile
Participare X Opinie. Afișați frecvențele observate și frecvențele
așteptate.
5. Verificați, folosind testul statistic adecvat, dacă există asociere între
participarea/ nonparticiparea la cursuri de statistică a studenților la
psihologie și opiniile față de învățarea statisticii. Formulați ipoteza

127
cercetării și explicați rezultatele.
6. Redați printr-un grafic cu bare asocierea dintre variabilele Participare și
Opinie.
7. Verificați folosind testul statistic adecvat dacă există asociere între
apartenența de gen și opiniile față de învățarea statisticii. Formulați
ipoteza cercetării și explicați rezultatele.
8. Pornind de la datele prezentate, formulați o ipoteză care poate fi testată cu
ajutorul testului chi pătrat pentru potrivire și verificați dacă se confirmă.
9. Pornind de la datele prezentate, formulați o ipoteză care poate fi testată cu
ajutorul testului chi pătrat pentru asociere și verificați dacă se confirmă.

128
Bibliografie

Aron, A., Aron, E., & Aron, E. C. (2013). Statistics for psychology. Sixth Edition. New
Jersey: Pearson Education.
Cazan, A. M. (2014). Statistică psihologică: Noțiuni teoretice, exemple și aplicații. Brașov:
Editura Universității Transilvania din Brașov.
Clinciu, A. I. (2013). Statistică aplicată în psihologie. Brașov: Editura Universității
Transilvania din Brașov.
Huck, S. W. (2012). Reading statistics and research. Boston: Pearson.
Hulsizer, M. R., & Woolf, L. M. (2009). A guide to teaching statistics. Innovations and best
practices. Newe York: Willey Blackwell.
Labăr, V. A. (2008). SPSS pentru științele educației. Metodologia analizei datelor în
cercetarea pedagogică. Iași: Polirom.
Lwanga, S. K., Tye, C. Y., & Ayeni, O. (1999). Teaching health statistics. Lesson and
seminar outlines. Geneva: World Health Organization .
Miles, J., & Banyard, P. (2007). Understanding and using statistics in psychology. A practical
introduction or how I cameto know and love standard error. New Delhi: Sage
Publication.
Moore, D. S. (2009). Additional exercices for the basic practice of statistics. New York: W.
H. Freeman and Company.
Moore, D. S., McCabe, G. P., & Craig, B. A. (2009). Introduction to the practice of statistics.
New York: W. H. Freeman and Company.
Peers, I. (2006). Statistical analysis for education and psychology researchers. London:
Routledge.
Popa, M. (2008). Statistică pentru psihologie. Teorie și aplicații SPSS. Iași: Polirom.
Sava, F. (2004). Analiza datelor în cercetarea psihologice. Metode statistice complementare.
Cluj-Napoca: ASCR.
Tabachnick, B. G., & Fidell, L. S. (2007). Using multivariate statistics (5th ed.). Boston, MA:
Allyn and Bacon.

129
Webografie

http://statisticshelp.com/interpreting-significant-results
http://statisticshelp.com/exercises-9

130