Sunteți pe pagina 1din 6

M.

Popa Aplicaii SPSS (Corelaia parial)

Corelaia parial
Conceptul de corelaie
Conceptul de corelaie se bazeaz pe concepia lui Galton i Pearson conform creia
cauzalitatea este doar limita extrem categoriei de relaie ntre dou fenomene. n concepia lor,
principiul explicator al faptelor i fenomenelor ar putea fi extins de la riguros demonstrata
cauzalitate, specific tiinelor fizice i naturale, la cel de asociere. Aceasta poate fi pus mai uor
n eviden n lumea realitii social-umane, unde cauzalitatea are un caracter prea complex pentru a fi
ntotdeauna demonstrat. Dei mai puin riguroas, asocierea fenomenelor poate fi evideniat prin
msurarea variaiei lor concomitente, indiferent de natura exact, adesea insondabil, a cauzei care
produce aceast co-variaie. Este suficient s obinem msurtori concomitente ale unor variabile
pentru a fi n msur s aflm gradul lor de variaie reciproc. Astfel s-a deschis posibilitatea de a se
aduce n domeniul tiinelor sociale i umane rigoarea specific tiinelor fizice i naturale.
Precursorul teoretic al coeficientului de corelaie este coeficientul de covarian. El se
definete ca sum a produselor dintre valorile celor dou variabile, raportat la numrul perechilor de
valori din cele dou distribuii.

cov xy =

x* y
N

Problema pe care o avem cu coeficientul de covarian este aceea legat de unitile de


msur. Valorile perechi se pot exprima fiecare n uniti de msur diferite, ceea ce poate face dificil
interpretarea semnificaiei coeficientului. Soluia problemei const n transformarea valorilor celor
dou variabile n scoruri standard, ceea ce produce un rezultat care nu mai are legtur cu unitatea de
msur. Ca urmare, formula de definiie a coeficientului de corelaie Pearson (r), probabil unul dintre
cele mai utilizate teste utilizate n statistica aplicat la tiinele social-umane, este:

r=

* zy

unde zx i zy sunt transformrile n note standard z ale variabilelor x, respectiv y, iar N este
volumul eantionului (numrul perechilor de valori pe care se calculeaz corelaia).
Nu facem dect s reamintim aici c r poate lua valori pe o plaj ntre +1 (corelaie pozitiv,
direct, perfect) i -1 (corelaie negativ, invers, perfect). ntre aceste limite extreme, un coeficient
de corelaie 0 (zero) indic absena total a corelaiei sau, cu alte cuvinte, independena variabilelor
una fa de alta. Pe de alt parte, coeficientul de corelaie Pearson se bazeaz pe un model de asociere
liniar ntre variabile. De aceea, absena unei valori suficient de mari, ori semnificative, nu exprim
neaprat absena unei legturi ntre variabile ci, poate, existena unui alt tip de variaie concomitent
dect cel liniar (curbiliniu). Mai adugm, de asemenea, c n studiile bazate pe coeficientul de
corelaie nu avem variabil independent, ambele variabile fiind considerate dependente. Cu alte
cuvinte, nici una variabile nu este considerat ca avnd o influen asupra celeilalte (cel puin din
punctul de vedere al raionamentului statistic).

Conceptul de corelaie parial


Aa cum am vzut, coeficientul de corelaie msoar gradul de variaie simultan dintre dou
variabile, cu eliminarea efectului uneia sau mai multor variabile. Dar puine aspecte ale realitii
social-umane interacioneaz n mod izolat de altele. Regula este, mai degrab, aceea de a avea
1/6
Actualizare: 04.04.2006; 8:15

M. Popa Aplicaii SPSS (Corelaia parial)


intercondiionri multiple. Variaia concomitent a dou variabile poate fi determinat de o legtur
intrinsec dintre ele i, n acelai timp, de o anumit influena pe care fiecare o suport din partea
uneia sau mai multor variabile de alt natur. Cu alte cuvinte, putem avea efecte exterioare care s
contribuie la mrimea coeficientului de corelaie bivariat. De exemplu, putem obine o corelaie
negativ, puternic i semnificativ, ntre lungimea prului i nlime (persoanele scunde au parul mai
lung). Dac, ns, lum n considerare influena variabilei sex, i i excludem efectul (deoarece
femeile sunt, de regul, mai scunde dect brbaii), atunci este foarte posibil s obinem o cu totul alt
valoare a corelaiei dintre lungimea prului i nlime, cel mai probabil mai mic i nesemnificativ.
S lum i un alt exemplu: Se iniiaz un studiu cu privire la relaia dintre nivelul salarizrii i vrst.
Rezultatele ne pot indica o legtur semnificativ ntre aceste dou variabile dar, dac izolm efectul
nivelului de instruire, putem ajunge la un coeficient de corelaie mai mic dect cel obinut iniial (ceea
ce sugereaz c, nu att vrsta n sine, ct timpul alocat procesului de instruire este factorul
determinant al nivelului de salarizare atins).
Soluia statistic a problemei enunate mai sus este coeficientul de corelaie parial care ne
ofer o posibilitate de calculare a corelaiei dintre dou variabile cu meninerea constant a influenei
externe din partea uneia sau mai multor variabile. Chiar dac n exemplele prezentate am sugerat doar
influena unei a treia variabile, modelul de analiz, dar i cel de calcul, al corelaiei pariale pot fi
extinse la orict de multe variabile externe.

Calcularea coeficientului de corelaie parial


Dei nu vom o utiliza n mod direct, redm mai jos formula de calcul pentru coeficientul de
corelaie parial:

r12.3 =

r12 r13 * r23


2

(1 r13 ) * (1 r23 )

unde: r12.3 este corelaia parial dintre variabila 1 i variabila 2 cu izolarea efectului variabilei
3; r12 este corelaia dintre variabila 1 i 2; r13 corelaia dintre variabila 1 i 3, iar r23 corelaia dintre
variabila 2 i 3.
Vom prezenta n continuare modul de calcul al coeficientului de corelaie parial prin
utilizarea programului SPSS. S lum n considerare un studiu ipotetic al crui scop ar fi evidenierea
relaiei dintre rezultatele la un test de reprezentare spaial i cele de la un test de calcul aritmetic. Dei
interesul cercetrii vizeaz relaia dintre aceste dou variabile, ne putem pune problema influenei
inteligenei asupra celor dou tipuri de performan, motiv pentru care aplicm i un test de inteligen.
Matricea de date, introdus n Editorul de date SPSS, arat ca mai jos:

Pentru a fi siguri cu privire la relaia dintre variabilele care ne intereseaz, prin excluderea
efectului celei de a treia, vom proceda la calcularea coeficientului de corelaie parial, care se
lanseaz n execuie din meniul Statistics-Correlate-Partial, cu deschiderea casetei Partial

2/6
Actualizare: 04.04.2006; 8:15

M. Popa Aplicaii SPSS (Corelaia parial)


Correlation, n care variabilele cercetate sunt trecute in lista Variables, iar variabila pe care dorim s o
izolm, n lista Controlling for:

Acionm butonul Options, care deschide caseta corespunztoare, unde bifm opiunile Means
and standard deviation (dac dorim s avem statistica descriptiv a variabilelor) i, mai ales, Zeroorder correlations pentru a obine i matricea de corelaie a tuturor variabilelor, fr eliminarea
vreuneia dintre ele.
Dup acionarea succesiv a comenzilor Continue i apoi OK, rezultatele procedurii vor fi
afiate n fereastra Viewer.
Primul lucru pe care l analizm este matricea corelaiilor complete, care apare ca n imaginea
alturat, similar cu matricea produs de procedura clasic a corelaiei bivariate.

Rezultatele indic corelaii ridicate ntre (de peste 0.80) ntre toate cele trei variabile. Dar, aa
cum am spus, avem motive teoretice s credem c relaia dintre cele dou variabile (reprezentare
spaial i calcul aritmetic) este intermediat de inteligen. Din aceast cauz semnificaia
coeficienilor nu poate fi acceptat ca i cum variabilele ar fi total independente (presupunerea tipic
pentru corelaia bivariat). Aa cum tim, fiecare dintre coeficienii de corelaie este purttor al unei
erori de tip I (probabilitatea de a respinge ipoteza de nul, dei ea ar putea fi adevrat). Acceptnd
acest lucru ar nsemna c, la un set de trei coeficieni de corelaie, cantitatea de eroare de tip I ar
nsuma 0.15 adic de trei ori 0.05, cea ce este inacceptabil. Ca urmare, se aplic metoda Bonferonni de
control pentru eroarea de tip I, la ansamblul celor trei perechi de corelaii: 0.05/3=0.017. Cu alte
cuvinte, se repartizeaz n mod egal valoare lui alfa pentru un singur test (0.05) la toi cei trei
coeficieni calculai. Nu ne rmne dect s constatm n ce msur coeficienii obinui sunt
semnificativi la acest prag corectat de siguran. Dup cum se observ, privind fie deasupra, fie sub
diagonala matricei, n toate cazurile coeficienii de corelaie dintre cele trei variabile sunt semnificativi
la un p<0.017, ceea ce sugereaz c toate perechile de variabile coreleaz semnificativ. Principala
concluzie este aceea c ambele variabile cercetate (reprezentarea spaial i operaiile aritmetice) au o
variaie comun, semnificativ, cu inteligena.

3/6
Actualizare: 04.04.2006; 8:15

M. Popa Aplicaii SPSS (Corelaia parial)


Mai departe, citim rezultatul procedurii de calcul dup ce influena inteligenei a fost
eliminat:
Din matricea alturat se observ c, dup
excluderea contribuiei variabilei QI, corelaia celorlalte
dou variabile devine 0.094, care corespunde cu p=0.823.
Astfel ajungem la concluzia de acceptare a ipotezei de nul
(inexistena unei asocieri ntre reprezentarea spaial i
capacitatea de calcul aritmetic1). Cu alte cuvinte, ceea ce
prea a fi o legtur ntre reprezentarea spaial i operarea
aritmetic nu era dect efectul influenei pe care o
exercita inteligena asupra ambelor variabile. Sau, altfel
spus, ambele variabile cercetate sunt componente ale
inteligenei i, n acelai timp, independente ntre ele.

QI

Repr_sp

Calc_ar

Dac ncercm s reprezentm relaia dintre cele


trei variabile pe o diagram Venn, ele ar putea arta ca n
imaginea alturat. Variabilele Repr_sp i Calc_ar au n
comun cu variabila QI o mare cantitate de variaie care se
traduce ntr-un fals coeficient de corelaie ntre ele. Odat
nlturat influena QI, relaia dintre reprezentarea spaial
i operarea aritmetic apare n adevrata ei lumin, adic
fr nici o relevan.

n exemplul de mai sus, datele au fost alese n aa fel nct efectul variabilei QI s fie extrem
de marcat, dar o situaie de acest gen se ntlnete rar pe date de cercetare autentice. n realitate,
coeficienii de corelaie dintre variabilele psihologice ating, de obicei, valori moderate, rareori mai
mari de 0.50-0.60, iar eventualele efecte ale eliminrii unei variabile prin procedura de corelaie
parial se vor manifesta printr-o anumit diminuare a coeficientului de corelaie dintre variabilele
investigate. Este adevrat c cercettorul este interesat, n mod obinuit, n descoperirea celei mai
mari corelaii posibile ntre variabilele cercetrii, dar acest lucru nu se poate face n dauna adevrului
tiinific. Ca urmare, chiar dac prin procedura de corelaie parial se pierde ceva din mrimea
corelaiei, aceasta estimeaz mai bine realitatea, dect dac ar fi fost ignorat efectul unei variabile
externe studiului.

Interpretarea coeficientului de corelaie parial


Plaja de valori i modul de interpretare pentru coeficientul de corelaie parial sunt ntru-totul
similare coeficientului de corelaie bivariat. Diferena const doar n menionarea eliminrii efectului
sau efectelor externe din partea altor variabile. Utilizarea sa aduce mai mult informaie tocmai pentru
c permite cercettorului s ia n calcul relaii mai complexe dintre variabile dect cele surprinse de
corelaia clasic.
Aa cum am spus deja, avem o corelaie perfect atunci cnd r este egal cu +1 sau 1.
Interpretarea coeficientului de corelaie ine cont de dou aspecte: semnificaia i mrimea. Un
coeficient de corelaie care se afl sub pragul de semnificaie (nivelul alfa), fixat anterior analizei
calculelor, nu va putea fi luat n discuie, indiferent de valoarea lui r. Desigur, atunci cnd aceast
valoare este promitor de mare iar studiul nu s-a bazat dect pe un numr relativ mic de subieci, se
1

Facem precizarea c acesta este un studiu ipotetic, fr nici o legtur cu date reale

4/6
Actualizare: 04.04.2006; 8:15

M. Popa Aplicaii SPSS (Corelaia parial)


poate avea n vedere reluarea cercetrii pe un eantion cu mai mui subieci. n ceea ce privete
valoarea n sine a lui r, desigur, cu ct este mai mare, cu att ea exprim o asociere mai intens ntre
variaiile concomitente dintre cele dou variabile. De-a lungul timpului au fost propuse diverse astfel
de scale de valorizare. Astfel, Jacob Cohen, ntr-o lucrare clasic2 sugera c o corelaie de 0.5 este
mare pe cnd una de 0.1, este mic. De aici ar rezulta c toate valorile peste 0.5 sunt mari, cele
ntre 0.3 si 0.5 sunt moderate, iar cele ntre 0.1 i 0.3 sunt mici. De reinut este, n primul rnd,
faptul c o corelaie sub valoarea de 0.1 va fi considerat ca neglijabil.
Relund subiectul ntr-o manier analitic, Hopkins3 propune o variant mai sensibil de
interpretare a valorii coeficienilor de corelaie, dup cum urmeaz:
Coeficientul de corelaie Descriptor
0.1

Foarte mic, neglijabil, nesubstanial

0.10.3

Mic, minor

0.30.5

Moderat, mediu

0.50.7

Mare, ridicat, major

0.70.9

Foarte mare, foarte ridicat

0.9

Aproape perfect, descrie relaia dintre dou variabile practic indistincte

n orice caz, prima condiie pentru a lua n considerare existena unei corelaii ntre dou
variabile rmne atingerea pragului de semnificaie (alfa). Dac valoarea lui r corespunde unui nivel
alfa mai mare de 0.05, existena unei corelaii este de neluat n seam, indiferent de mrimea
coeficientului Pearson. Aceasta, deoarece nu avem temei pentru a accepta c se ndeprteaz suficient
de o valoare care ar fi putut decurge din jocul hazardului.
Mai departe, n interpretarea coeficientului trebuie s operm cu distincia dintre
semnificaia statistic i relevana practic a valorii obinute. Un coeficient de corelaie
puternic semnificativ nu nseamn c are, automat, i o relevan practic pe msur. Ne ajut n
nelegerea acestei distincii ceea ce se numete coeficientul de determinare i care nu este altceva
dect valoarea lui r ridicat la ptrat. Coeficientul de determinare este utilizat n mod uzual n forma sa
procentual (r2*100) i indic procentul de varian pe care cele dou variabile o au n comun. Cu alte
cuvinte, ct la sut din gradul de mprtiere a unei variabile este determinat de variaia
(mprtierea) celeilalte variabile.
R
1.00
.90
.80
.70
.60
.50
.40
.30
.20
.10
.0

r2
1.00
.81
.64
.49
.36
.25
.16
.09
.04
.01
.0

Dac observm cu atenie tabelul alturat, vom observa c valoarea


coeficientului de determinare scade mult mai accentuat dect valorile lui r , datorit
efectului ridicrii la ptrat a unor numere subunitare.
Dac obinem un r=+0.80 ntre inteligen i performana colar, vom putea spune c
doar 64% din variaia celor dou variabile este comun, restul de 36% datorndu-se
altor influene. Ca regul general, la captul procedurii de testare a corelaiei se
recomand interpretarea coeficientului de determinare i nu a celui de corelaie, acesta
din urm sugernd o covarian mai mare dect exist n mod real.

Cohen, J. (1988). Statistical power analysis for the behavioral sciences (2nd ed.). New Jersey: Lawrence
Erlbaum
3
Hopkins, W. G. (2000). A new view of statistics. Internet Society for Sport Science:
http://www.sportsci.org/resource/stats/

5/6
Actualizare: 04.04.2006; 8:15

M. Popa Aplicaii SPSS (Corelaia parial)


n cele din urm, ce trebuie s lum n considerare, semnificaia sau intensitatea asocierii?
Desigur, rspunsul este unul relativ. Dac finalitatea studiului este aceea de a lua decizii, ca n cazul
seleciei de personal, de exemplu, se vor cuta valori ct mai mari ale coeficientului de corelaie (r),
implicit ale celui de determinare (r2). Dar dac obiectivul este preponderent teoretic, de a pune n
eviden relaii ascunse ntre variabile, atunci indiferent de mrimea lor, coeficienii de corelaie vor
fi luai n considerare (desigur, dac sunt mai mari de 0.1).

6/6
Actualizare: 04.04.2006; 8:15

S-ar putea să vă placă și