Sunteți pe pagina 1din 8

Calcularea coeficientului de corelaie Pearson dintre dou variabile

cantitative cu ajutorul funciei CORREL:


Coeficientul de corelaie Pearson este un indice numeric ce d o msur a relaiei dintre dou variabile
cantitative continue sau discrete (!!! Nu se calculeaz pentru altfel de variabile).
Realizai un tabel de felul
urmtor
Selectai celula unde vom
calcula coeficientul de
corelaie.
Meniul Formulas - Butonul Insert Function - Selectai funcia CORREL

Array 1 se selecteaza celulele primei variabile (ex. Varsta)


Array 2 - se selecteaza celulele celei de a doua variabile (ex. Greutate)
Apsai OK
Realizarea unui grafic de tip nor de puncte diagrama de dispersie (XY Scatter)
Copiai cele dou coloane cu date, mai nti coloana care va aprea pe axa Ox, apoi coloan care va aprea pe Oy, exemplu:

Selectai cele dou coloane: domeniul A1:B20


Meniul

Insert

Seciunea Chart
Butonul Column

Alegei subtipul potrivit:

Rezultat exemplu:
Introducei un titlu potrivit

Dezactivarea legendei:

Click dreapta pe Legend


Opiunea Delete

Introducei titlurile adecvate pentru axe

Adugarea dreptei de regresie pe grafic


Click dreapta pe oricare din punctele norului de puncte, selectare Add Trendline...

n fereastra aprut se selecteaz Linear pentru afiarea dreptei de regresie lineare, respectiv se selecteaz Display
Equation on chart pentru afiarea ecuaiei dreptei de regresie i Display R-squared value on chart pentru afiarea
coeficientului de determinare

Apsnd apoi butonul Close se obine (dup repoziionarea ecuaiei i coeficientului de determinare):

Modificarea valorii minime i maxime afiate pe axele norului de puncte


Pentru a modifica aceste valori pentru axa vertical se d dublu-click pe valorile axei verticale i se obine urmtoarea
fereastr:

Pentru a modifica valoarea minim, la Minimum se alege Fixed i se trece manual o valoare apropiat de cel mai jos
punct din grafic. Asemntor se face i pentru valoarea maxim.
n mod similar se modific i axa orizontal.
Se poate astfel obine un grafic similar cu urmtoarea imagine:

Schimbarea schimbarea axelor ntre ele (XYScatter):

Click dreapta pe o
coloan sau pe un
punct
Opiunea Select Data
Butonul Switch
Row/Column

Observaie: Din aceast fereastr se pot schimba titlurile de pe linii si coloane, domeniul datelor, se pot aduga serii de
date etc.

Interpretri

Coeficientul de corelaie
Interpretarea Coeficientului de corelaie conform regulilor empirice ale lui Colton (1974):
1. un coeficient de corelaie de la -0,25 la 0,25 indic o corelaie slab sau nul,
2. un coeficient de corelaie de la 0,25 la 0,50 (sau de la -0,25 la -0,50) indic un grad de asociere
acceptabil
3. un coeficient de corelaie de la 0,5 la 0,75 (sau de la -0,5 la -0,75) indic o corelaie moderat spre
bun
4. un coeficient de corelaie mai mare dect 0,75 (sau mai mic dect -0,75) indic o foarte bun
asociere sau corelaie

Coeficientul de determinare
Este ptratul coeficientului de corelaie r, adic d = r2.
Valoarea coeficientului de determinare exprim o intensitate a relaiei liniare ntre cele dou
variabile sau rspunde la ntrebarea: ct la sut din variaia lui Y se poate explica prin relaia
liniar cu X. Exemplu: un coeficient de determinare pentru relaia ntre tensiunea arterial

sistolic i vrst este egal cu 0,51. In cazul acesta r2 = 0,51, deci 51% din variaia tensiunii
arteriale sistolice se poate explica prin relaia liniar cu Vrsta.

Diagrama de dispersie (Norul de puncte)


O idee privind relaia ntre cele dou caracteristici se obine mprind diagrama de dispersie n patru
cadrane prin dou drepte perpendiculare care trec prin punctul (X, Y ), avnd coordonatele egale cu
mediile celor dou variabile.
II

III

IV

Dac exist o relaie liniar ntre cele dou variabile atunci punctele diagramei se vor repartiza
preferenial n anumite cadrane (II i IV sau I i III). Dac punctele sunt repartizate n cadranele I i III,
atunci diagrama de dispersie are o tendin cresctoare (dreapta de regresie va avea un trend
ascendent). Dac punctele sunt repartizate n cadranele II i IV, atunci diagrama de dispersie are o
tendin descresctoare (dreapta de regresie va avea un trend descendent). Dac punctele sunt
repartizate n toate cele patru cadrane n mod egal, atunci diagrama de dispersie ne indic o corelaie
nul.

Exemplu de interpretare:

Relaia intre vrsta gestiaional i


y = 167,85x - 1946,4
greutate
R = 0,4194

Greutate (grame)

5700
5200
4700
4200
3700
3200
2700
28

30

32

34

36

38

40

42

Vrsta gestaional (sptmni)

Punctele diagramei sunt repartizate preferenial n cadranele I i III. Dependena dintre


Greutate i Vrsta gestational este pozitiv: o cretere a Vrstei gestationale implic o cretere a
Greutii. Dreapta de regresie are un trend ascendent. Diagrama de dispersie indic o tendin
cresctoare. Interpretarea coeficientului de determinare (R2): aproximativ 42% din variaia Greutii
se explic prin relaia liniar cu Vrsta gestational. Interpretarea coeficientului variabilei x din
ecuaia de regresie: pentru fiecare cretere a Vrstei gestationale (x) cu o unitate de msur (cu o
sptmn), Greutatea (y) crete cu 167,85 uniti de msur (grame). Interpretarea coeficientului
liber dac Vrstei gestational ar fi egal cu 0, Greutatea ar fi egal cu -1946,4 grame.

Evaluare