Sunteți pe pagina 1din 7

PROBLEME REZOLVATE

1. Pentru un magazin de mobilă s-au cules date privind numărul de spoturi publicitare difuzate şi
numărul vizitatorilor (mii pers.) timp de 14 zile. Să se măsoare intensitatea legăturii dintre cele două
variabile cu ajutorul unui indicator adecvat. Datele sunt prezentate în tabelul 1.

Tabelul 1
Ziua Nr. spoturi publicitare Nr.vizitatori(mii pers.)
0 1 2
1 7 42
2 5 32
3 1 10
4 8 40
5 10 61
6 2 8
7 6 35
8 7 34
9 9 45
10 3 11
11 12 64
12 8 37
13 4 30
14 11 55

Rezolvare:
Notăm cu X variabila factorială, independentă „nr.spoturi publicitare” şi cu Y variabila dependentă
„nr.vizitatori”.
Pentru a identifica existenţa, forma şi sensul legăturii dintre variabilele analizate construim
corelograma (figura 1).

70

60

50
nr.vizitatori

40

30

20

10

0
0 2 4 6 8 10 12 14

nr.spoturi

Figura 1 Corelograma (diagrama de împrăştiere)

Tabelul 2
xi yi xi2 xiyi yi2
0 1 2 3 4
7 42 49 294 1764
5 32 25 160 1024
1 10 1 10 100
8 40 64 320 1600
10 61 100 610 3721
2 8 4 16 64
6 35 36 210 1225
7 34 49 238 1156
9 45 81 405 2025
3 11 9 33 121

21
12 64 144 768 4096
8 37 64 296 1369
4 30 16 120 900
11 55 121 605 3025
 xi  yi  xi2  xi yi  yi2
=93 =504 =763 =4085 =22190
Pentru a măsura intensitatea legăturii dintre cele două variabile se va calcula coeficientul de corelaţie
liniară:
n  xi yi   xi  yi
r 
n x 2
i 
  xi  n  y   yi 
2 2
i
2

10318 10318
   0,9615
203314  22190  504 2
 10731
Acest indicator ne arată o legătură directă şi foarte puternică (r este pozitiv şi apropiat de valoarea
unitară).

2. Despre recolta medie la hectar la o anumită cultură şi suprafaţa cultivată, pentru 30 de judeţe se cunosc
datele:
Tabelul 3
Recolta medie la hectar (q/ha)
Suprafaţa cultivată (ha)
Sub 13 13 şi peste 13
Sub 20.000 10 5
20.000 şi peste 20.000 3 12
Coeficientul de asociere are valoarea: a) -0,70; b) 0,78; c) 0,59; d) -0,62; e) 0,82.

3. Pentru opt judeţe ale României, se cunosc: suprafaţa cultivată în 1996 ( mii ha) şi producţia agricolă
totală în acelaşi an (mil. RON preţuri curente):

Tabelul 4
Judeţul Suprafaţa cultivată în Producţia agricolă
1996 (mii ha) (mil. RON)
Alba 127 75,1
Arad 342 112,4
Bistriţa Năsăud 98 64,4
Botoşani 286 89,4
Braşov 111 80,4
Buzău 252 84,3
Caraş Severin 124 62
Călăraşi 404 96,5
Să se studieze existenţa, direcţia şi intensitatea legăturii dintre suprafaţa cultivată şi producţia agricolă, cu ajutorul coeficienţilor de corelaţie a
rangurilor ai lui Spearman şi Kendall.

Rezolvare:
Coeficientul lui Spearman se determină cu relaţia:
6  di2
rs  1 

n n2 1
,

unde di reprezintă diferenţa între rangurile celor două variabile, aferente aceleiaşi unităţi. Se ordonează
perechile de valori în ordinea crescătoare a valorilor xi, apoi se atribuie ranguri valorilor celor două variabile
(tabelul 5.).

Tabelul 5
Judeţ Suprafaţa Producţia
(xi) (yi)
Rx Ry di d i2
Bistriţa Năsăud 127 75,1 1 2 -1 1
Braşov 342 112,4 2 4 -2 4
Caraş Severin 98 64,4 3 1 2 4

22
Alba 286 89,4 4 3 1 1
Buzău 111 80,4 5 5 0 0
Botoşani 252 84,3 6 6 0 0
Arad 124 62 7 8 -1 1
Călăraşi 404 96,5 8 7 1 1
Total 12
6  12
rs  1   0 ,86 , valoare ce indică o legătură directă, puternică, între cele două variabile.
8  63
Coeficientul lui Kendall se calculează cu relaţia:
2 S , unde S reprezintă diferenţa între suma rangurilor superioare (P) şi suma rangurilor
rk 
n( n  1)
inferioare (Q), corespunzătoare fiecărui rang curent (tabelul 6).
2  20
rk   0,71 , valoare a cărei interpretare este aceeaşi ca în cazul coeficientului lui Spearman.
87

Tabelul 6
Judeţ Rx Ry P Q S=P-Q
Bistriţa Năsăud 1 2 6 1 5
Braşov 2 4 4 2 2
Caraş Severin 3 1 5 0 5
Alba 4 3 4 0 4
Buzău 5 5 3 0 3
Botoşani 6 6 2 0 2
Arad 7 8 0 1 -1
Călăraşi 8 7 0 0 0
Total - - 24 4 20

4. Datele sistematizate, obţinute în urma unui studiu statistic privind vechimea în muncă şi timpul zilnic
nelucrat, efectuat pe 800 de salariaţi ai unei societăţi comerciale, sunt:
Tabelul 7
Timp nelucrat (u.m.)
Vechimea
sub 60 u.m. peste 60 u.m.
peste 10 ani 300 150
sub 10 ani 100 250
Să se precizeze dacă între cele două variabile există o legătură.

Rezolvare:
Se foloseşte coeficientul de asociere, calculat cu relaţia:
ad  bc
Qa  , unde a = 300, b = 150, c = 100, d = 250.
ad  bc
300  250  100  150 60.000
Qa    0,67 .
300  250  100  150 90.000
Cum ad > bc, rezultă că între cele două variabile există o legătură de intensitate medie.

5. Un funcţionar al departamentului de sănătate doreşte să stabilească factorii determinanţi care


influenţează cheltuielile medicale ale familiilor. În acest scop, pentru 13 familii el înregistrează
numărul de membri ai familiei şi cheltuielile lunare cu îngrijirea sănătăţii (euro):
Tabelul 8
Familia Mărimea familiei Cheltuieli medicale lunare
(persoane) (euro)
1 2 20
2 2 28
3 4 52
4 5 50
5 7 78
6 3 35
7 8 102

23
8 10 88
9 5 51
10 2 22
11 3 29
12 5 48
13 2 25

a) Să se alcătuiască tabelul de asociere în raport cu mediile celor două variabile şi să se determine


coeficientul de asociere;
b) Să se măsorare intensitatea legăturii dintre variabile folosind coeficienţii de corelaţie a rangurilor ai
lui Spearman şi Kendall.

Rezolvare:
a) Notăm cu X variabila mărimea familiei şi cu Y variabila cheltuielile medicale.
 xi 58  yi 628
x   4,46 pers. , y    48,31 euro.
n 13 n 13

Tabelul 9
Mărimea familiei (X) Cheltuieli medicale (Y)
Total (ni)
(persoane) y  48,31 y > 48,31
x  4,46 n11 = 6 n12 = 1 7
x > 4,46 n21 = 1 n22 = 5 6
Total (nj) 7 6 13

n11  n22  n12  n21 36  1


Qa    0,95
n11  n22  n12  n21 36  1

b) Se acordă ranguri celor două variabile (tabelul 10).


Tabelul 10
Familia Rix Riy di di2 Pi Qi
0 1 2 3 4 5 6
1 2,5 1 1,5 2,25 12 -
10 2,5 2 0,5 0,25 11 -
13 2,5 3 -0,5 0,25 10 -
2 2,5 4 -1,5 2,25 9 -
11 5,5 5 0,5 0,25 8 -
6 5,5 6 -0,5 0,25 7 -
3 7 10 -3 9 3 3
12 9 7 2 4 5 -
4 9 8 1 1 4 -
9 9 9 0 0 3 -
5 11 11 0 0 2 -
7 12 13 -1 1 - 1
8 13 12 1 1 - -
Total - - 21,5 74 4

6 d i2 6  21,5
rs  1   1  0,94

n n 1 2
 13 168
2S 2  (74  4)
rk  , rk   0,89
n( n  1) 13 12

Valorile celor doi coeficienţi de corelaţie a rangurilor arată că legătura dintre cele două variabile este
foarte puternică şi directă.

24
Grile rezolvate:
1. Diagrama de împrăştiere este utilă pentru:
a) a determina abaterea medie pătratică din setul de date;
b) a determina valoarea raportului de corelaţie, ca punctul cel mai aproape de origine;
c) a determina valoarea critică în testarea semnificaţiei coeficientului de corelaţie;
d) a aprecia vizual legătura dintre două variabile;
e) a determina intervalul de încredere pentru coeficientul de corelaţie.
Răspuns: d)

2. Să se precizeze care dintre următoarele metode de analiză a legăturilor dintre variabilele statistice nu se
încadrează în categoria metodelor simple:
a) metoda seriilor interdependente;
b) metoda grupărilor;
c) metoda regresiei;
d) metoda tabelului de corelaţie;
e) metoda corelaţiei.
Răspuns: c) şi e)

3. Coeficientul de corelaţie :
a) arată cu câte unităţi se modifică variabila efect, la modificarea cu o unitate a variabilei cauză;
b) este un indicator al intensităţii legăturii liniare între variabile;
c) are întotdeauna valoare pozitivă;
d) este zero dacă nu există legătură între cele două variabile;
e) este zero dacă valoarea covarianţei este zero.
Răspuns: b), d), e).

4. O companie care produce un nou tip de îngrăşământ agricol este interesată în studierea relaţiei dintre
producţia de roşii (Y) şi cantitatea de îngrăşământ aplicat (X). O suprafaţă este divizată în opt parcele de
mărimi egale, pe care sunt aplicate cantităţi diferite de îngrăşământ. Producţiile de roşii (kg) şi cantităţile de
îngrăşământ aplicat (kg), înregistrate pentru fiecare parcelă, sunt:

xi 1 1,5 2 2,5 3 3,5 4 4,5


yi 25 31 27 28 36 35 32 34

Coeficientul de corelatie este : …..

5. În utilizarea metodei tabelului de corelaţie pentru analiza legăturilor dintre fenomene, dacă frecvenţele
sunt aproximativ egal repartizate în interiorul tabelului, atunci:
a) legătura este neliniară;
b) legătura este liniară directă;
c) legătura este inversă;
d) legătura este directă;
e) legătura este slabă sau nu există legătură între variabile.
Răspuns: e)

6. Să se precizeze care dintre următoarele metode de caracterizare a legăturilor dintre variabilele statistice nu
se încadrează în categoria „metodelor simple“:
a) metoda seriilor interdependente;
b) metoda grupărilor;
c) metoda grafică;

25
d) metoda corelaţiei;
e) metoda tabelului de corelaţie.
Răspuns: d)

7. Patronul unei firme ce vinde autoturisme presupune că relaţia dintre numărul de autoturisme vândute într-
o zi (Y) şi numărul de vânzători ce lucrează în salonul de prezentare şi în sectorul de publicitate a produsului
(X) poate fi modelată printr-o linie dreaptă. Datele culese pentru 5 zile sunt:

xi 6 6 4 2 3
yi 20 18 10 6 11

Coeficientul de corelatie este:…..

PROBLEME PROPUSE SPRE REZOLVARE

1. Numărătorul coeficientului de corelaţie (r) este covarianţa (covxy). De ce este preferat coeficientul de
corelaţie?
a) Pentru că trebuie calculată media produselor abaterilor individuale;
b) Deoarece numărătorul nu indică direcţia pantei sau a legăturii;
c) Deoarece numărătorul nu indică intensitatea legăturii;
d) Deoarece suma produselor abaterilor individuale este întotdeauna egală cu 0;
e) Pentru a evita utilizarea valorilor luate în modul.

2. În care dintre următoarele diagrame de împrăştiere coeficientul de corelaţie va avea valoare apropiată
de 1?

Figura 4.4

3. Semnul coeficientului de corelaţie:


a) este minus când legătura dintre variabile este slabă;
b) este determinat de abaterile medii pătratice ale variabilelor x şi y;
c) indică direcţia schimbării unei variabile când cealaltă variabilă se modifică;
d) este minus când descreşterea lui x este însoţită de descreşterea lui y;
e) este plus când valorile lui y sunt mai mari decât media.

26
4. Dacă valoarea coeficientului de corelaţie este 0, atunci:
a) y descreşte când x creşte;
b) schimbările variabile y explică schimbările variabilei x;
c) toate perechile (xi, yi) se află pe o linie dreaptă;
d) nu există legătură între x şi y;
e) legătura dintre x şi y, dacă există vreuna, nu este liniară.

5. Să se determine coeficientul de corelaţie pentru următorul set de date bivariate:


xi 1 5 6 5
yi 10 8 9 7
a) –7,2;
b) 7,2;
c) –0,93;
d) 0,64;
e) –0,64.

7. Pentru un mare magazin alimentar s-au cules date privind vânzările (sute mii RON) şi profitul (sute mii
RON) realizate in 10 săptămâni:
Tabelul 14
Vânzări (sute mii RON) 7 2 6 4 14 15 16 12 14 20
Profit (sute mii RON) 0,15 0,10 0,13 0,15 0,25 0,27 0,24 0,20 0,27 0,44
Se cere :
a) Să se reprezinte grafic datele;
b) Să se măsoare intensitatea legăturii dintre variabile folosind un indicator adecvat;

8. O asociaţie hotelieră din zona Mării Negre a înregistrat temperatura medie zilnică a aerului (° C) şi
numărul persoanelor ce vin pe plajă (sute persoane) pentru 9 weekenduri selectate aleator:
Tabelul 15
Temperatura medie zilnică (° C) 22 18 35 30 28 36 28 30 32
Nr. persoanelor ce vin pe plajă 27 17 43 40 42 38 40 44 48
(sute pers.)
Se cere :
a) Să se reprezinte grafic datele;
b) Să se măsoare intensitatea legăturii dintre variabile folosind un indicator adecvat;

9. Pentru 8 parcele de aceeaşi mărime s-au înregistrat datele:


Cantitate de îngrăşăminte (kg) 1 2,5 3,2 2,75 4,5 4,0 1,75 2,8
Producţie la hectar (q/ha) 12 16 20 18 30 22 15 14
Se cere :
a) Să se reprezinte grafic datele;
b) Să se măsoare intensitatea legăturii dintre variabile folosind coeficienţii de corelaţie a rangurilor ai lui
Spearman şi Kendal;

10. Pentru vânzările unui produs alimentar s-au înregistrat preţul (RON) şi cantitatea vândută (buc.) în
10 pieţe din Bucureşti:

Tabelul 17
Preţ (RON) 5 6 10 12 15 20 22 30 35 40
Cantitate 70 53 44 38 35 28 26 17 11 5
(buc.)
Se cere:
a) Să se analizeze existenţa, direcţia şi forma legăturii dintre cele două variabile;
b) Să se determine intensitatea legăturii dintre variabilele analizate.

27

S-ar putea să vă placă și