Sunteți pe pagina 1din 2

Stabilirea relaţiilor dintre variabile (caractere)

Corelaţia
Corelaţia – este măsura statistică a legăturii posibile între două variabile independente (“x”
şi “y”). Această legătură poate să fie de acelaşi sens (corelaţie pozitivă) sau de sens contrar
(corelaţie negativă). Când se compară două variabile între ele corelaţia este simplă, iar când se
compară trei variabile, corelaţia este multiplă sau parţială.
Măsura în care două variabile sunt corelate între ele se determină cu ajutorul coeficientului
de corelaţie notat cu r (R), care se calculează cu formula:
x   y
xy 
N
rxy =
( x ) 2
( y ) 2
(x 2  )(y 2  )
N N
Coeficientul de corelaţie are valori cuprinse între 0 şi 1 (  ). Valoarea coeficientului de
corelaţie apropiată de “0” indică o legătură slabă, sau lipsa de legătură între cele două variabile
analizate, iar valoarea coeficientului de corelaţie apropiată de “1” indică o legătură strânsă între
variabile. La valori asigurate statistic pozitive, coeficientul de corelaţie ilustrează faptul că cele
două variabile sunt strâns corelate şi cresc sau descresc împreună, în timp ce valorile negative
denotă existenţa unei corelaţii invers proporţionale, astfel că, cu cât valoarea unui caracter creşte,
valoarea caracterului cu care acesta este corelat scade, şi invers.
Semnificaţia coeficientului de corelaţie se determină prin compararea cu coeficienţi de
corelaţie teoretici, regăsiţi în tabelul anexă, pentru probabilitățile P5%, P1% şi P0,1%.

Stabilirea semnificaţiei:
- “r” calculat < “r” teoretic – nu există legătură între variabilele analizate – r nesemnificativ - n.s.
- “r”P1% > “r” ≥ “r” P5% - există o legătură semnificativă între variabile – * (valori +) sau o (valori -)
- “r”P0,1% > “r” ≥ “r” P1% - există o legătură distinct semnificativă între variabile – r - ** (+) sau oo (-)
- r ≥ r P0,1% - există o legătură foarte semnificativă între variabile – r - *** (+) sau ooo (-)

Exemplu - Corelaţia simplă


Problemă. Să se determine corelaţia dintre gradul de atac (%) cu făinare (Sphaerotheca
pannosa) și pătare neagră (Diplocarpon rosae) la 12 soiuri de trandafir
“x” – GA% “y” – GA%
Nr. Făinare Pătarea neagră
Cultivarul) x2 y2 x*y
crt. (Sphaerotheca (Diplocarpon
pannosa) rosae)
1 Tiffany 31 41 961 1681 1271
2 Queen Elizabeth 13 24 169 576 312
3 Pascali 11 6 121 36 66
4 Juno 45 39 2025 1521 1755
5 Saratoga 12 16 144 256 192
6 Mister Lincoln 15 20 225 400 300
7 Rosa Mundi 2 6 4 36 12
8 Rose du Roi 54 27 2916 729 1458
9 Old Bush 4 6 16 36 24
10 Evening Star 12 25 144 625 300
11 Double Delight 1 5 1 25 5
12 Bonica 5 2 25 4 10
Total (suma) 205 217 6751 5925 5705

r= = 0,783**
Tabelul anexă

Coeficienţii de corelaţie care pot fi consideraţi semnificativ diferiţi de zero la nivelul de


probabilitate P 5%, P 1% şi P 0,1%

GL = N-2 Probabilitatea / Valoarea “r” teoretică


(N - nr. de cazuri
P 5% P 1% P 0,1%
studiate)
1 0.99692 0.99988 0.9999988
2 0.9500 0.9900 0.9990
3 0.878 0.9587 0.9911
4 0.811 0.9172 0.9741
5 0.754 0.875 0.9509
6 0.707 0.834 0.9249
7 0.666 0.798 0.898
8 0.632 0.765 0.872
9 0.602 0.735 0.847
10 0.576 0.708 0.823
11 0.553 0.648 0.801
12 0.532 0.661 0.780
13 0.514 0.641 0.760
14 0.497 0.623 0.742
15 0.482 0.606 0.725
16 0.468 0.590 0.708
17 0.456 0.575 0.693
18 0.444 0.561 0.679
19 0.433 0.549 0.665
20 0.423 0.537 0.652
25 0.381 0.487 0.597
30 0.349 0.449 0.554
35 0.325 0.418 0.519
40 0.304 0.393 0.490
45 0.288 0.372 0.465
50 0.273 0.354 0.443
60 0.250 0.325 0.404
70 0.232 0.302 0.380
80 0.217 0.283 0.357
90 0.205 0.267 0.338
100 0.195 0.254 0.321

Să se rezolve problema în Excel, iar valoarea ‘r’ să fie inclusă într-o reprezentare grafică a celor două
variabile.

S-ar putea să vă placă și