Sunteți pe pagina 1din 4

Disciplina: Bazele statisticii

Profesor: conf. univ., dr., Natalia Gaşiţoi

Seminarul nr. 8
Serii statistice bidimensionale

1. Se cunoaşte următoarea distribuţie a 52 de societăţi comerciale cu acelaşi profil de ac-


tivitate, ı̂n raport cu variabilele X – volumul vânzărilor (u.c.) şi y – cheltuielile cu
publicitatea (u.c.).

Y
[3, 5) [5, 7) [7, 9] Total
X
[20, 40) 14 2 1 17
[40, 60) 3 10 5 18
[60, 80] 2 7 8 17
Total 19 19 14 52

− Să se verifice regula de adunare a varianţelor.


− În ce proporţie volumul vânzărilor depinde de cheltuielile cu publicitatea?

Răspunsuri:

30 · 17 + 50 · 18 + 70 · 17
− X= = 50.
17 + 18 + 17
m
1 X ∗
− Varianţa marginală (varianţa generală) 2
σX = (xi − x)2 ni• = 261.54.
n•• i=1
3
1 X ∗
− Mediile condiţionate X |Y ∈Ij = xj = (x · nij ) , j = 1, 3.
n•j i=1 i
− x1 = X |Y ∈[3,5) = 37.37; x2 = X |Y ∈[5,7) = 55.26; x3 = X |Y ∈[7,9] = 60.
3
1 X
− Varianţa mediilor condiţionate δ = 32
(xj − x)2 n•j = 95.32.
X j=1
n•j
j=1
3
1 X
− Varianţele condiţionate 2
σX |Y ∈Ij = (xi − xj )2 nij , j = 1, 3.
n•j i=1
2 2 2
− σX |Y ∈[3,5) = 177.28; σX |Y ∈[5,7) = 161.77; σX |Y ∈[7,9] = 157.14.
3
1 X 2
2
− Media varianţelor condiţionate σ = σ |Y ∈Ij ·n•j = 166.19.
n•• j=1 X
− Se verifică egalitatea σ 2 = σ 2 + δ 2 .
2 δ2
− Gradul de determinaţie R = 2 · 100% = 36.4%. Volumul vânzărilor depinde ı̂n
σ
proporţie de 36.4% de cheltuielile cu publicitatea şi ı̂n proporţie de 63.6% de alţi
factori.

1
Disciplina: Bazele statisticii
Profesor: conf. univ., dr., Natalia Gaşiţoi

− Coeficienţul χ2 a lui Pearson pentru un tabel bidimensional de dimensiune m × p se


defineşte prin formula:
m X p
2
X (nij − ñij )2
χ = ,
i=1 j=1
ñ ij

unde
ni• · n•j
ñij = , i = 1, m, j = 1, p.
n
Amplitudinea valorilor χ2 este:

0 ≤ χ2 ≤ n · (min{m, p} − 1).

Dacă χ2 este aproape zero, atunci ı̂ntre variabilele X şi Y există o dependenţă slabă.
Dacă χ2 este aproape de valoarea n · (min{m, p} − 1), atunci ı̂ntre variabilele X şi
Y există o dependenţă puternică.

2. Distribuţia angajaţilor unei firme după salariu (Y , euro) şi vechime ı̂n muncă (X, ani)
ı̂ntr-o lună este redată ı̂n tabelul:

Y
până la 150 150–250 250–350 350–450 450–550 peste 550 Total
X
până la 15 20 30 30 20 100
15–25 30 80 100 90 30 330
25–35 40 140 120 50 30 380
peste 35 80 70 20 20 190
Total 50 150 350 300 100 50 1000

− Să se verifice regula de adunare a varianţelor.


− În ce proporţie salariul angajaţilor depinde de stagiul de muncă?

Răspunsuri:

− y = 340.
− Varianţa marginală (varianţa generală) σY2 = 13400; σY = 115.76.
− y 1 = 250; y 2 = 303.03; y 3 = 371.05; y 4 = 389.47.
− Varianţa mediilor condiţionate δ 2 = 2092.38.
− σY2 |X∈I1 = 10500; σY2 |X∈I2 = 12412.06; σY2 |X∈I3 = 11530.47; σY2 |X∈I4 = 9362.88.
− Media varianţelor condiţionate σ 2 = 11307.5.
− Se verifică egalitatea σ 2 = σ 2 + δ 2 .
δ2
− Gradul de determinaţie R2 = 2 · 100% = 15.6%. Salariul angajaţilor depinde de
σ
stagiul de muncă ı̂n proporţie de 15.6% şi ı̂n mările de 84.4% de alţi factori.

3. Pentru seria statistică bidimensională dată să se verifice regula de adunare a varianţelor:

2
Disciplina: Bazele statisticii
Profesor: conf. univ., dr., Natalia Gaşiţoi

Y
60 70 80 90 Total
X
150 3 4 1 8
160 1 7 7 2 17
170 1 3 5 4 13
180 1 3 8 12
Total 5 15 16 14 50

☼☼☼☼☼☼☼☼☼☼

Covarianţa a două variabile aleatoare X şi Y este o măsură a varianţei simultane a acestora
şi se notează cu cov (X, Y ).
Dacă X şi Y sunt variabile independente, atunci cov (X, Y ) = 0. Afirmaţia inversă nu este
adevărată, adică faptul că cov (X, Y ) = 0 nu implică independenţa variabilelor X şi Y.
Pentru distribuţiile simple covarianţa se calculează după formula:
k
X
(xi − x)(yi − y)
i=1
cov (X, Y ) = .
n
În cazul distribuţiilor bidimensionale, prezentate ı̂ntr-un total de corelaţie, avem formula:
p
m X
X
(xi − x)(yj − y)nij
i=1 j=1
cov (X, Y ) = .
n
Valoarea absolută cov (X, Y ) nu are limită superioară. Pe măsură ce intensitatea corelaţiei
creşte şi covarianţa creşte.
Valorile ridicate ale acestui indicator arată o legătură puternică ı̂ntre X şi Y.

Coeficientul de corelaţie a două variabile aleatoare X şi Y măsoară direcţia şi gradul de
asociere liniară dintre ele şi se calculează după formula
n
X
(xi − x)(yi − y)
i=1
r=v ! n !.
u n
u X X
t (xi − x)2 (yi − y)2
i=1 i=1

Coeficientul de corelaţie indică direcţia dependenţei liniare: dacă r > 0, atunci avem o
dependenţă pozitivă şi dacă r < 0, avem o dependenţă negativă.
Coeficientul de corelaţie r ı̂ntotdeauna satisface relaţia −1 ≤ r ≤ 1 şi indică gradul de
asociere liniară. Corelaţia perfectă, r = −1 sau r = 1, apare numai atunci când punctele
(xi , yi ) se află ı̂ntocmai pe o linie draptă.
Dacă:

− r ∈ (−0.25; 0.25), atunci corelaţia se consideră slabă sau nulă;

3
Disciplina: Bazele statisticii
Profesor: conf. univ., dr., Natalia Gaşiţoi

− r ∈ (0.25; 0.5) sau r ∈ (−0.5; −0.25), atunci gradul de asociere este acceptabil;
− r ∈ (0.5; 0.75) sau r ∈ (−0.75; −0.5), atunci corelaţia este moderată spre bine;
− r > 0.75 sau r < −0.75, atunci corelaţia este foarte bună.

Problemă. Se se analizeze corelaţia dintre punctajele acumulate de 8 studenţi la primul test


şi la testul final de examinare a unui curs, precum şi la al doilea test şi la testul de examinare
a cursului.

Punctajul la I test 153 144 162 149 127 118 158 153
Punctajul la examen 145 140 145 170 145 175 170 160

Punctajul la al II-lea test 158 162 144 162 136 158 175 153
Punctajul la examen 145 140 145 170 145 175 170 160

S-ar putea să vă placă și