Sunteți pe pagina 1din 11

CURS STATISTICA NR.

5
INTENSITATEA CORELAŢIEI SIMPLE LINIARE

Intensitatea corelaţiei dintre o variabilă cauzală xi şi o variabilă efect yi, ale căror valori
evoluează după un trend liniar, se poate măsura prin intermediul coeficientului de corelaţie
Pearson.

Valoarea coeficientului de corelatie Pearson aparţine intervalului [-1,1]. Cu cât


coeficientul de corelaţie tinde către ± 1, cu atât intensitatea legăturii dintre variabilele
cercetate este mai puternică, şi cu cât coeficientul de corelaţie tinde către 0, cu atât
intensitatea legăturii dintre cele două variabile analizate este mai slabă.

- La SERII SIMPLE, în cazul în care perechea (xi,yi) apare o singură dată, coeficientul de
corelaţie Pearson va fi:
n
∑ (x i −x )( y i− y )
r= i=1
n⋅σ x⋅σ y


n
∑ ( x i −x )2
i =1
σ x=
unde: n

şi


n
∑ ( y i − y )2
i=1
σ y=
n

Varianta simplificată:

- La serii simple, în situaţia în care perechea (xi,yi) apare o singură dată:


n n n
n ∑ x i yi −∑ x i⋅∑ yi
i=1 i=1 i=1
r=


n n n n
[ n∑ x 2i −( ∑ x i ) ] [n ∑
2
y 2i −( ∑ y i )2 ]
i=1 i=1 i =1 i=1

1
Exemplul nr. 1 la SERII SIMPLE

În cazul distribuţiei celor 5 persoane în funcţie de vechime şi salarii, prezentată în


cadrul tabelului nr. 1, să se determine intensitatea legăturii dintre variabilele vechime şi
salarii, ştiind că între acestea există o legătură de tip liniar.

Tabelul 1 Distribuţia unui număr de 5 persoane în funcţie de vechime şi salarii

( y i− y )2
2
Nr. VECHIME SALARII
( xi −x) ( y i− y ) ( xi −x)( y i − y) ( xi −x)
Crt. xi $/saptamana

1. 2 200 -2 - 100 200 4 10000

2. 3 250 -1 - 50 50 1 2500

3. 4 300 0 0 0 0 0

4. 5 350 1 50 50 1 2500

5. 6 400 2 100 200 4 10000

Total 20 1500 500 10 25000

Vechimea medie va fi:


n
∑ xi
20
x= i=1 = =4
n 5 ani

Salariul mediu va fi:


n
∑ yi
1500
y= i =1 = =300
n 5 $/săptamana

Aplicând coeficientul de corelaţie al lui Pearson, vom obţine:


n
∑ (x i −x )( y i− y )
500
r= i =1 = ≃1
n⋅σ x⋅σ y 5⋅1 , 414⋅70 , 711


n
∑ ( x i −x )2
unde:
σ x=
i =1
n
=
√ 10
5
=1 , 414

şi

2

n
∑ ( y i − y )2
σ y=
i=1
n
=
√ 25000
5
=70 , 711

Aşadar, intensitatea legăturii dintre vechime şi salarii este foarte puternică.

Exemplul nr. 2 la SERII SIMPLE

Fie distributia a 6 persoane în funcţie de greutate şi inaltime, prezentată în cadrul


tabelului nr. 2, să se stabileasca intensitatea legăturii dintre variabilele greutate şi inaltime,
ştiind că între acestea există o legătură de tip liniar.

Tabelul 2 Distribuţia unui număr de 6 persoane în funcţie de greutate şi inaltime


2
Nr Greutate Inaltime
( xi −x) ( y i− y ) ( xi −x)( y i − y) ( xi −x)2 ( y i− y )
xi yi
Crt
(kg) (cm)

1. 50 166 -5 -5 25 25 25

2. 52 168 -3 -3 9 9 9

3. 54 170 -1 -1 1 1 1

4. 56 172 1 1 1 1 1

5. 58 174 3 3 9 9 9

6. 60 176 5 5 25 25 25

Total 330 1026 70 70 70

n
∑ xi
330
x= i=1 = =55
Greutatea medie va fi: n 6 kg
n
∑ yi
1026
y= i =1 = =171
Inaltimea medie va fi: n 6 cm

Aplicând coeficientul de corelaţie al lui Pearson, vom obţine:


n
∑ (x i −x )( y i− y )
70
r= i =1 = =1
n⋅σ x⋅σ y 6⋅3 , 415650255⋅3 , 415650255

unde:


n
∑ ( x i −x )2
σ x= i =1
n
=
√ 70
6
=3 , 415650255

3

n
∑ ( y i − y )2
şi
σ y=
i=1
n
=
√ 70
6
=3 , 415650255

Aşadar, intensitatea legăturii dintre greutate şi inaltime este foarte puternică.

- La SERII CU FRECVENTE, în situaţia în care perechea (xi,yi) apare de ni ori, coeficientul


de corelaţie Pearson va fi:
n
∑ ( x i −x )( y i− y ) ni
i=1
r= n
∑ ni⋅σ x⋅σ y
i=1

√ √
n n
∑ ( x i −x )2 ni ∑ ( y i − y )2 n i
i =1 i=1
σ x= n
σ y= n
∑ ni ∑ ni
unde: i=1 şi i =1

- Varianta simplificata la serii cu frecvente, în situaţia în care perechea (xi,yi) apare de


ni ori:
n n n n
∑ ni⋅∑ x i y i ni −∑ x i ni⋅∑ y i n i
i=1 i=1 i=1 i =1
r=


n n n n n n
[ ∑ ni⋅∑ xi2 ni−( ∑ x i ni )2 ][ ∑ ni⋅∑ y 2i ni−( ∑ y i ni )2 ]
i=1 i=1 i=1 i=1 i =1 i=1

Exemplul nr. 1 la SERII CU FRECVENTE

În cazul distribuţiei celor 30 persoane în funcţie de vechime şi salarii, prezentată în


cadrul tabelului nr. 3, să se determine intensitatea legăturii dintre variabilele vechime şi
salarii, ştiind că între acestea există o legătură de tip liniar.

Tabelul 3 Distribuţia unui număr de 30 persoane în funcţie de vechime şi salarii

( y i− y ) 2 2
VECHIME SALARII Nr xini yini ( xi −x) ( xi −x)( y i − y)ni ( xi −x ) n i ( y i− y ) ni
$/ pers
saptama
na

0-10 200-300 2 10 500 - 18 - 180 6480 648 64800

10-20 300-400 8 120 2800 -8 - 80 5120 512 51200

4
20-30 400-500 14 350 6300 2 20 560 56 5600

30-40 500-600 6 210 3300 12 120 8640 864 86400

Total 30 690 12900 20800 2080 208000

Vechimea medie va fi:


n
∑ xi n i
690
x= i=1n = =23
30
∑ ni
i=1 ani

Salariul mediu va fi:


n
∑ y i ni
i =1 12900
y= = =430
n 30
∑ ni
i=1 $/săptamana

Aplicând coeficientul de corelaţie al lui Pearson, vom obţine:


n
∑ ( x i −x )( y i− y ) ni
i=1 20800
r= = =1
n 20800
∑ ni⋅σ x⋅σ y
i=1


n
∑ ( x i −x )2 ni
σ x=
i =1
n
∑ ni
=
√ 2080
30
=8 , 326663998

unde: i=1


n
∑ ( y i − y )2 n i
σ y= i=1
n
∑ ni
=
√ 208000
30
=83 ,26663998

i =1

Deci, intensitatea legăturii dintre vechime şi salarii este foarte puternică.

5
Exemplul nr. 2 la SERII CU FRECVENTE

În cazul distribuţiei celor 180 persoane în funcţie de greutate şi inaltime, prezentată


în cadrul tabelului nr. 4, să se determine intensitatea legăturii dintre variabilele greutate şi
inaltime, ştiind că între acestea există o legătură de tip liniar.

Tabelul 4 Distribuţia unui număr de 180 persoane în funcţie de greutate şi inaltime


Greu- Inaltime Nr
tate
( y i− y ) 2 2
(cm) pers xini yini ( xi −x) ( xi −x)( y i − y)ni ( xi −x ) n i ( y i− y ) ni
(kg)

50-52 164-166 24 1224 3960 - 2,89 - 2,89 200,4504 200,4504 200,4504

52-54 166-168 68 3604 11356 - 0,89 - 0,89 53,8628 53,8628 53,8628

54-56 168-170 72 3960 12168 1,11 1,11 88,7112 88,7112 88,7112

56-58 170-172 16 912 2736 3,11 3,11 154,7536 154,7536 154,7536

Total 180 9700 30220 497,778 497,778 497,778

Greutatea medie va fi:


n
∑ xi n i
i=1 9700
x= = =53 , 89
n 180
∑ ni
i=1 kg

Inaltimea medie va fi:


n
∑ y i ni
30220
y= i =1n = =167 , 89
180
∑ ni
i=1 cm

Aplicând coeficientul de corelaţie al lui Pearson, vom obţine:

6
n
∑ (x i −x )( y i− y )ni
497 ,778
r= i =1 = =1
n 180⋅1 , 66295921⋅1 ,66295921
∑ ni⋅σ x⋅σ y
i=1

unde:


n
∑ ( x i −x )2 ni
σ x=
i=1
n
∑ ni
=
√ 497 ,778
180
=1 , 66295921

i=1


n
∑ ( y i − y )2 n i
σ y= i=1
n
∑ ni
=
√ 497 , 778
180
=1, 66295921

i =1

Deci, intensitatea legăturii dintre greutate şi inaltime este foarte puternică.

- în cazul TABELULUI DE CORELATIE, coeficientul de corelaţie Pearson va fi:

n n
∑ ∑ ( x i−x )( y j − y )nij
r= i=1 j=1
n n
∑ ∑ nij⋅σ x⋅σ y
i=1 j=1

unde:

√ √
n n

∑ ( x i −x )2 ni . ∑ ( y j − y )2 n . j
i =1 j=1
σ x= n
σ y= n

∑ ni . ∑ n. j
i=1 şi j=1

- Varianta simplificata în situaţia tabelului de corelaţie:

n n n n n n
∑ ∑ nij⋅∑ ∑ x i y j nij −∑ x i ni.⋅∑ y j n. j
i=1 j=1 i=1 j=1 i=1 j=1
r=


n n n n n n n n
[ ∑ ∑ n ij ∑ x2i ni.−( ∑ x i ni . )2 ][ ∑ ∑ nij ∑ y 2j n. j −( ∑ y j n . j )2 ]
i=1 j=1 i=1 i=1 i=1 j =1 j=1 j=1

7
Exemplul nr. 1 la Tabelul de Corelatie

În cazul distribuţiei celor 8 persoane în funcţie de vechime şi salarii, prezentată în


cadrul tabelului nr. 5, să se stabilească intensitatea legăturii dintre variabilele vechime şi
salarii, ştiind că între acestea există o legătură de tip liniar.

Tabelul 5 Distribuţia bidimensională a 8 persoane în funcţie de vechime şi de salarii


Salarii

0 -200 200-400 400 - 600 600 -800 ni. xini. ( xi −x) ( xi −x)2 n i
∑ (xi −x)( y j− y )nij
Vechime

0 –10 1 - - 1 2 10 - 15 450 -750

10–20 - 2 - - 2 30 - 5 50 750

20-30 - 1 1 - 2 50 5 50 250

30-40 1 - - 1 2 70 15 450 750

n.j 2 3 1 2 8 160 1000 1000

yjn.j 200 900 500 1400 3000

( y j − y) -275 - 75 125 325

( y j − y)2 n. j 151250 16875 15625 211250 395000

Vechimea medie va fi:


n
∑ xi n i .
160
x= i=1n = =20
8
∑ ni .
i=1 ani

8
Salariul mediu va fi:
n
∑ y j n. j
3000
y= j=1n = =375
8
∑ n. j
j=1 $/lună

Coeficientul de corelaţie Pearson va fi:


n n
∑ ∑ ( x i−x )( y j − y )nij
i=1 j=1 1000
r= n n
= =0 , 05
8⋅11 , 18⋅222 , 205
∑ ∑ nij⋅σ x⋅σ y
i=1 j=1

unde:


n
∑ ( x i −x )2 ni .
σ x=
i =1
n
∑ ni .
=
√ 1000
8
=11, 18

i=1


n
∑ ( y j − y )2 n . j
σ y= j =1
n
∑ n. j
=
√ 395000
8
=222, 205

j =1

Aşadar, intensitatea legăturii dintre vechime şi salarii este foarte slabă.

Exemplul nr. 2 la Tabelul de Corelatie

În cazul distribuţiei celor 16 persoane în funcţie de greutate şi inaltime, prezentată în


cadrul tabelului nr. 6, să se stabilească intensitatea legăturii dintre variabilele greutate şi
inaltime, ştiind că între acestea există o legătură de tip liniar.

Tabelul 6 Distribuţia bidimensională a 16 persoane în funcţie de greutate şi inaltime


Inaltime

2
(cm) 164-166 166 -168 168 -170 170 -172 ni. xini. ( xi −x) ( xi −x ) n i
∑ (xi −x)( y j− y )nij
Greutate

9
50-52 4 - - 2 6 306 -2,75 45,375 - 4,125

52–54 - 2 - - 2 106 -0,75 1,125 2,625

54-56 - 2 2 - 4 220 1,25 6,25 31,25

56-58 2 - - 2 4 228 3,25 42,25 16,25

n.j 6 4 2 4 16 860 95,00 46

yjn.j 978 668 338 684 2668

2
( y j − y) n.84,375
j
0,25 10,125 72,25 167

Greutatea medie va fi:


n
∑ xi n i.
860
x= i=1n = =53 , 75
16
∑ ni .
i=1 kg

Inaltimea medie va fi:


n
∑ y j n. j
j=1 2668
y= = =166 ,75
n 16
∑ n. j
j=1 cm

Coeficientul de corelaţie Pearson va fi:


n n
∑ ∑ ( x i−x )( y j − y ) nij
46
r= i =1 j=1
n n
= =0 ,36
16⋅2 , 436698586⋅3 , 230711996
∑ ∑ nij⋅σ x⋅σ y
i=1 j =1

unde:


n
∑ ( x i −x )2 ni .
σ x= i=1
n
∑ ni .
=
√ 95
16
=2 , 436698586

i=1

10

n
∑ ( y j − y )2 n . j
σ y=
j =1
n
∑ n. j
=
√ 167
16
=3 , 230711996

j =1

Aşadar, intensitatea legăturii dintre greutate şi inaltime este foarte slabă.

11

S-ar putea să vă placă și