Sunteți pe pagina 1din 53

Corelaţia – utilizare şi valorificare în

cercetarea psihologică

Conf. univ. dr. Ana-Maria CAZAN


Corelaţia – utilizare şi valorificare în
cercetarea psihologică
La finalul cursului, veţi fi capabili să:
• interpretaţi corect valorile coeficienţiilor de corelaţie
Pearson
• explicaţi asocierea a două variabile pornind de la
grafice de tip nor de puncte
• evaluaţi semnificaţia statistică a coreficienţilor de
corelaţie Pearson pornind de la exemplele date
• formulaţi ipoteze care pot fi testate prin intermediul
corelaţiei
Corelaţia – utilizare şi valorificare în cercetarea
psihologică
1. Exemple de studii corelaţionale
2. Cum identificăm faptul că este vorba despre o corelaţie?
3. Condiţiile de aplicare a lui r
4. Ce fel de ipoteză trebuie testată?
5. Reprezentarea grafică a corelaţiei
6. Calculul coeficientului de corelaţie
7. Semnificaţia coeficientului de corelaţie
8. Intensitatea asocierii dintre variabile – coeficientul de
determinare
9. Cauzele care pot afecta precizia unui coeficient de corelaţie
10. Utilizările coeficientului de corelaţie
Statistica inferenţială – recapitulare
• Ce este statistica inferenţială?
• Care este diferenţa dintre statistica descriptivă şi
statistica inferenţială?
• Care este diferenţa dintre ipoteza cercetării şi
ipoteza de nul?
• Formulaţi o ipoteză de cercetare şi ipoteza de
nul.
• Ce este semnificaţia statistică?
• Care este rolul pragului de semnificaţie?
Galton - Inventatorul corelaţiei statistice
Pearson – Formula celor mai mici pătrate
• "numărător" înfocat, număra aproape orice
• a numărat odată de câte ori cască audienţa la o
conferinţă, în funcţie de plictiseala indusă de
vorbitor.
• în timp ce un pictor îi făcea portretul, a numărat
de câte ori trage acesta cu pensonul pe pânză (el
a constatat că un pictor dă cu pensula cam de
20.000 ori în timp ce face un portret
• A construit un mic dispozitiv de numărat, pe
categorii.
• metodă de a măsura faptul că "un lucru merge
împreună cu alt lucru"

• Karl Pearson a propus însă formula de


calcul a corelaţiei liniare
„Un studiu recent a arătat că există o corelaţie
pozitivă între vânzările la îngheţată şi numărul
actelor violente, astfel, cu cât se înregistrează
vânzări la îngheţată mai mari, cu atât se produc mai
multe acte violente”.

• Care credeţi că este explicaţia acestei descoperiri?


• De ce vânzările la îngheţată se asociază cu
implicarea oamenilor în acte de violenţă?
Distincţia dintre corelaţie şi cauzalitate
 consumul de îngheţată nu duce la acte
violente sau
 persoanele violente nu consumă mai multă
îngheţată
• explicaţie alternativă: se consumă mai multă
îngheţată vara, anotimp în care nivelul ridicat al
temperaturii predispune la implicarea în mai
multe acte violente.
Exemplul 1:
• „Un studiu realizat în Londra a arătat că există o asociere între
numărul de accidente în care erau implicaţi şoferi de taxi şi
purtarea paltoanelor, astfel că şoferii care purtau paltoane
erau implicaţi mai frecvent în accidente rutiere”.
• Pornind de la acest studiu, a fost adoptată o lege prin care
şoferilor de taxi li s-a interzis să mai poarte paltoane în trafic.

Explicaţia : paltoanele sunt purtate în zilele ploioase, când


condiţiile meteorologice duc la un trafic dificil, ceea ce explică
prevalenţa accidentelor. Deci ploaia şi condiţiile meteo generau
numărul mare de accidente, fără ca purtarea paltoanelor să aibă
vreo influenţă.
Conceptul de corelaţie
• Un coeficient de corelaţie este un număr unic care
indică mărimea relaţiei dintre două variabile, adică
în ce grad variază una în paralel cu variaţia
celeilalte.
• Fără corelaţie nu ar fi posibilă predicţia şi chiar
atunci când sunt implicate relaţii întâmplătoare,
fără cunoaşterea covariaţiei (variaţiei comune a
două variabile) nu am fi capabili să controlăm o
variabilă prin manipularea celeilalte (Clinciu,
2007).
1) Exemple de studii corelaţionale:
 Există vreo legătură între scorurile la testele
de inteligenţă şi performanţa şcolară?
 Există asociere între înălţime şi greutate?
 Există asociere între inteligenţa părinţilor şi
inteligenţa copiilor?
 Există o relaţie între numărul orelor de studiu
la statistică şi punctajul obţinut la evaluări?
• Întrebarea 1:

• Există o asociere între anxietatea generată de


învăţarea statisticii şi performanţa la examen?
2) Cum identificăm faptul că este vorba
despre o corelaţie?
• modul de formulare a obiectivului şi al
ipotezelor
– „urmărim să evidenţiem gradul de asociere dintre
memorie şi inteligenţă”
– „există o legătură între scorurile la testele de
inteligenţă şi performanţa şcolară”
– „un nivel ridicat al extraversiei se asociază cu
performanţe ridicate în vânzări” (Sava, 2004).
3) Ce fel de date au fost colectate?
4) Care sunt condiţiile de aplicare?

• Date numerice
• Variabile măsurate pe scale de interval sau de raport
• Variabile normal distribuite
• Numărul de subiecţi este mai mare de 30
• Absenţa outlierilor sau a valorilor extreme
• Relaţia dintre variabile este liniară
• Norul de puncte indică homoscedasticitate
Folosim corelaţia Spearman, atunci când…

• Cel puţin una dintre variabile este măsurată pe


scală ordinală
• Cel puţin una dintre variabile nu este normal
distribuită
• Numărul de subiecţi este mai mic de 30
5) Ce fel de ipoteză trebuie testată?

• Exemplu:
• Este dovedit faptul că celebrarea aniversării
dovedeşte longevitatea şi sănătatea. Statisticile
arată că acei oameni care îşi sărbătoresc cele
mai multe aniversări devin şi cei mai în vârstă.

• Ipoteza nu este un adevăr unanim acceptat ci o


asumpţie care se cere a fi testată.
Există o asociere între numărul de ore petrecute
pentru învăţarea statisticii şi punctajul obţinut la
examenul final?

Care sunt ipotezele?


Ipoteza de nul: Nu există nicio asociere între numărul de ore de
studiu la statistică şi punctajul obţinut la examen.

Ipoteza cercetării: Există o asociere între numărul de ore petrecute pentru


învăţarea statisticii şi punctajul obţinut la examenul final
6) Rerezentarea grafică a corelaţiei

Paşi:
• Desenarea axelor şi decizia cu privire la
plasarea fiecărei variabile pe o axă
• Alegerea intervalelor pentru reprezentarea
valorilor
• Marcarea punctelor pe grafic, ca intersecţie a
fiecărei perechi de date.
Rerezentarea grafică a corelaţiei
Exerciţiul 1:
• Sunt desenate pe podea orientativ
axele OX şi OY reprezenând înălţimea şi
mărimea la pantofi.

• Studenţii sunt rugaţi să se aşeze în


ordinea crescătoare a înălţimii apoi sunt
rugaţi să se deplaseze astfel încât să fie
situaţi la intersecţia dintre înălţimea şi
mărimea la pantofi care îi reprezintă
(Connor, 2003 cit in Hulisizer & Wolf,
2009).
Exerciţiul 2:

Numărul de ore de Starea de


• Câte ore aţi dormit somn/noapte bine

noaptea trecută?
• Cât de fericit vă simţiţi
acum, pe o scală de la 0
la 8, unde 0 înseamnă
deloc fericit iar 8
extrem de fericit?
• Pentru datele obţinute,
redaţi norul de puncte.
Exemplul 2:

• paşii pentru realizarea norului de puncte cu


ajutorul SPSS

• Baza de date Corelaţie date exemplu.sav


Patternuri ale norului de puncte

• Corelatie liniara
• Corelatie pozitivă
• Corelatie negativă
• Corelatie curbilinie
• Absenţa corelatiei
7) Cum interpretăm asocierea dintre două
variabile?
Indică direcţia sau relaţia
(pozitivă sau negativă)

Coeficient de
corelatie r = +.37

Indică puterea
asocierii
Coeficient de corelaţie Interpretare
0.0-0.1 Foarte mic, negliabil
0.1-0.3 Mic, minor
0.3-0.5 Moderat, mediu
0.5-0.7 Mare, ridicat
0.7-0.9 Foarte mare, foarte ridicat
0.9-1 Aproape perfect

 Corelaţia pozitivă arată relaţia de directă proporţionalitate


între cele două variabile: cu cât creşte x, cu atât creşte şi Y.

Corelaţia negativă arată relaţia de inversă proporţionalitate:


cu cît creşte X, cu atât scade Y.
Exemplul 3:
• Să presupunem că un grup de studenţi au efectuat un test de
inteligenţă bazat pe raţionament abstract/figurativ si un altul,
bazat pe raţionament verbal/logic.
• Dacă studenţii care obţin valori mari la primul test tind să
obţină valori mari si la cel de-al doilea, avem ceea ce se
numeste o corelaţie pozitivă.
• Dacă, dimpotrivă, studenţii care obţin valori mari la unul
dintre teste tind să obţină valori mici la cel de-al doilea, atunci
ne aflăm în faţa unei corelaţii negative.
• Există si posibilitatea ca valorile celor două variabile să
evolueze absolut independent unele de celelalte, ceea ce
indică absenţa oricărei corelaţii (Popa, 2008).
Întrebarea 2

Care dintre următoarele situaţii sugerează


existenţa unei corelaţii pozitive, negative sau
absenţa oricărei corelaţii?
a) Inălţime şi mărimea la pantofi
b) Cantitatea de spanac mâncată de fotbalişti şi
numărul de goluri la un meci
c) Temperatura în timpul iernii şi valoarea
facturii la electricitate.
8) Corelaţia nu implică o cauzalitate
Exemplu:

• Implicarea în activităţi • Trei posibile directii ale


cauzalităţii:
distractive poate duce la
creşterea satisfacţiei 1. X Y
maritale (1)
• Oamenii satisfacuţi de 2. X Y
relaţiile lor aleg să
desfăşoare mai multe
activităţi împreună (2)
3. Z
• E posibil ca satisfacţia
pentru profesie să
determine amble aspecte;
(3) X Y
Exerciţiul 4:

• Determinaţi sursa covariaţiei dintre variabilele


următoare:

a) Depresia şi anxietatea
b) Timiditate şi abilităţi sociale;
c) Stima de sine şi rezultatele şcolare;
d) Satisfacţia în muncă şi motivaţie;
e) Media şcolară din gimnaziu şi cea din liceu
Intrebarea 4:

• Care dintre coeficienții de corelație enumeraţi


mai jos exprimă cea mai mică și mai înaltă
corelație? Enumerați-le în ordinea de la cel
mai mic la cel mai mare.
a).5 b) 0 c) -.09 d).03 e)-.73
Ex. 5: Estimaţi valoarea şi intensitatea corelaţiilor din graficele de mai
jos. Daţi nume variabilelor care să exemplifice graficele prezentate.
• Pentru două dintre grafice, la alegere, eliminaţi punctele care duc la
scăderea coeficintului de corelaţie.
• Pentru graficele a si b desenaţi câte un punct care ar duce la
scăderea corelaţiei.
Intrebarea 5:
• Care sunt motivele pentru care primul pas în
analiza corelaţiei este realizarea norului de
puncte?
Norul de puncte ca modalitate a a testa
normalitatea distribuției
• Norul de puncte evidențiază patternul de organizare a
datelor, fiind și o modalitate de a testa normalitatea
distribuției.
• Atunci când normalitatea este încălcată, norul de puncte
tinde să fie asimetric la unul dintre capete (Tabachnick, &
Fidell, 2007).
• Forma norului de puncte ne oferă detalii și despre
variabilitatea datelor. Cu cât variabilitatea crește, cu atât
corelația scade.
• Variabilitatea scăzută se obține în cazul datelor omogene,
leptocurtice, asimetrice pozitiv sau negativ.
• De asemenea, norul de puncte este o modalitate eficientă
de a depista outlierii bivarați sau valorile aberante.
Norul de puncte ca modalitate a a testa
normalitatea distribuției
Norul de puncte ca modalitate a a testa
normalitatea distribuției
9) Calculul coeficientului de corelaţie

rxy 
 x  x  y  y 
 x  x     y  y 
2 2

• în care x şi y sunt rezultatele obţinute la cele


două înregistrări, iar x şi y reprezintă mediile
celor două distribuţii.
Exemplul 5
• Presupunem că există o legătură între numărul de ore de
somn pe noapte şi starea de bine (Aron, Aron, & Coups, 2006)
Număr ore somn/noapte Starea de fericire Produsul ab. de la
medie
X X- x (X- x )2 Y Y- y (Y- y )2 (X- x ) *(Y- y )
7 0 0 4 0 0 0
5 -2 4 2 -2 4 4
8 1 1 7 3 9 3
6 -1 1 2 -2 4 2
6 -1 1 3 -1 1 1
10 3 9 6 2 4 6
∑=42 ∑=16 ∑=24 ∑=22 ∑=16
x=7 y =4
Exerciţiile 6 ,7, 8:

6. Cum interpretaţi coeficientul de corelaţie


obţinut?
7. Realizaţi norul de puncte pentru această
asociere.
8. Exerciţiul 2 (continuare), grupurile de studenţi
deja create vor calcula corelaţia dintre cele două
variabile completate în tabel. Există diferenţe între
corelaţiile obţinute la nivelul fiecărui grup? Ce duce
la aceste diferenţe?
10) Semnificaţia coeficientului de corelaţie

• Întrebarea 6
• Să presupunem că un cercetător a prezis că ar
exista fie o corelaţie pozitivă, fie o corelație
negativă între două seturi de scoruri măsurate.
Ipoteza sa este una unidirecţională sau
bidirecţională?
Pasi pt determinarea semnificaţiei
• Pornim de la ipoteza cercetării şi de la ipoteza de nul,
pentru a decide dacă alegem un test bilateral sau unilteral.
• Calculam gradele de libertate: df = N-2.
• Determinăm valoarea critică a lui r pentru care ipoteza de
nul este respinsă, analizând tabelul distribuţiei t.
• Determinăm scorul t al eşantionului nostru, după formula:

• Decidem dacă respingem ipoteza de nul.


• Raportăm corespunzător rezultatul.
Exemplul 6:
corelaţia dintre numărul de ore de somn pe noapte şi starea de fericire

• Formulăm ipoteza: Între numărul de ore de somn pe


noapte şi starea de fericire există o asociere (ipoteza
bidirecţională)
• Df = 6-2 = 4
• Din tabel, identificam valoarea critică, 2.77.

• Scorul t, 3.21 ese mai mare decât 2.77, deci putem


respinge ipoteza de nul şi acceptăm ipoteza cercetării.

• r(4) = 0,85, p < .05


Exemplul 7:
• Calculul corelaţiei cu ajutorul SPSS.
• Baza de date Corelaţie date exemplu.sav
11) Intensitatea asocierii dintre variabile –
coeficientul de determinare
r 2 x 100 –coeficientul de determinare
- procentul din
dispersia variabilei
depndente explicat
evoluţia variabilei
independente (cât
de mare este
influenţa variabilei
independente
asupra celei
dependente)
Exerciţiul 9:
• a) De câte ori este mai mare o corelaţie de .80
faţă de una de.20?
• b) dar o corelaţie de .70 faţă de una de.25?
• c) o corelaţie de .50 faţă de una de .15?
12) Cauzele care pot afecta precizia unui
coeficient de corelaţie
• Presupunerea că între x şi y există coliniaritate, adică
faptul că norului de puncte ce materializează corelaţia
i-ar putea fi ajustată o linie dreaptă numită linia de
regresie a lui y în raport cu x.
• Distribuţiile atipice care, prezintă valori atipice la
extremele seriei de variaţie
• Erorile de introducere a datelor
• Erorile de eşantionare: cu cât omogenitatea grupului
este mai mare, cu atât corelaţia descreşte
• Erorile de măsurătoare sau de tastare
13) Utilizările coeficientului de corelaţie
• Analiza principalelor calităţi psihometrice (fidelitatea şi validitatea) ale
testelor psihologice.
• Construirea unor scale sau subscale ale testelor de personalitate în care
menţinerea sau îndepărtarea unor itemi depinde de corelaţia acestora
cu scala.
• În selectarea itemilor dintr-o multitudine de variabile pentru a genera
prin analiza factorială scale omogene, care măsoară un acelaşi
construct.
• Alcătuirea unor baterii de teste care prezic cu o mai mare acurateţe
criteriul, graţie modelării corelaţiilor dintre criteriu şi predictori prin
ecuaţia de regresie simplă sau multiplă.
• Analiza de clusteri, similară în multe privinţe analizei factoriale, dar
indicând într-o formă uşor de vizualizat nu numai ierarhia factorilor
care compun clusterii, dar şi ordinea sau nivelul la care intră în
combinaţie fiecare variabilă în parte cu cele anterioare (Clinciu, 2007).
Corelaţia şi mărimea eşantionului
• O corelaţie slabă poate fi semnificativă statistic dacă
eşantionul este mare → cu cât creşte numărul de subiecţi,
creşte variabilitatea eşantionului → scăderea coeficientului de
corelaţie dar → creşte semnificaţia statistică. Este greşit să
afirmăm că am obţinut o corelaţie slabă din cauza numărului
mic de subiecţi!!!
• D.p.d.v teoretic şi corelaţiile slabe pot fi importante
• Exemplu: un grup de cercetători a demonstrat că între
consumul aspirinei şi atacul de cord există o corelaţie de -.034,
ceea ce înseamnă că folosirea aspirinei explică doar 1% din
variaţia apariţiei atacului de cord, → adică dintr-un grup de
20.000 persoane care nu consumau aspirină, 72 făceau atac de
cord !!!
"If you torture data enough it will confess" …
If not… it will torture you

• … dacă vom avea un număr foarte mare de


variabile într-o cercetare, cresc şansele de a
obţine corelaţii semnificative statistic dar care
să nu aibă nicio semnificaţie sau incorectă
(spurious correlation):
• de exemplu, o corelaţie între numărul electrocasnicelor şi
notele şcolare!
• intre numărul de biblioteci şi consumul de droguri
• Între salariul miniştrilor preţul vodcii
• Între numărul bisericilor şi rata crimelor.
Aplicatii
• Fisa de lucru
Tema pentru acasă

• http://elearning.unitbv.ro/mod/quiz/attempt.
php?attempt=11995

S-ar putea să vă placă și