Sunteți pe pagina 1din 73

Curs: Conf.univ.dr.

Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.

Statistică Descriptivă—Seminar VIII

Analiza legăturii dintre variabilele statistice (CAP. III)

A. Variabile calitative
-pentru studiul legăturii se folosește testul 𝜒 2
Fie X și Y doua variabile calitative
formulăm: (1) ipoteza nulă (𝐻0 ): ∄ legătură între variabilele X, Y
(2) ipoteza alternativă (𝐻1 ): ∃ legătură între variabilele X, Y

Y/X 𝒙𝟏 𝒙𝟐 ⋯ 𝒙𝑹 Total
𝒚𝟏 𝑁11 𝑁12 ⋯ 𝑁1𝑅 𝑵𝟏•
𝒚𝟐 𝑁21 𝑁22 ⋯ 𝑁2𝑅 𝑵𝟐•
⋯ ⋯ ⋯ ⋯ ⋯ ⋯
𝒚𝑳 𝑁𝐿1 𝑁𝐿2 ⋯ 𝑁𝐿𝑅 𝑵𝑳•
Total 𝑵•𝟏 𝑵•𝟐 ⋯ 𝑵•𝑹 N

2

(𝑁𝑖𝑗 −𝑁𝑖𝑗 )
Calculăm: 𝜒 =
2 ∑𝑅𝑖=1 ∑𝐿𝑗=1 ∗ , unde
𝑁𝑖𝑗

𝑁𝑖• ∙ 𝑁•𝑗
𝑁𝑖𝑗∗ =
𝑁
Interpretări:
(1) 𝜒 2 = 0 => 𝑎𝑐𝑐𝑒𝑝𝑡ă𝑚 𝐻0 => ∄ legătură între variabile
(2) 𝜒 2 > 0 => 𝑟𝑒𝑠𝑝𝑖𝑛𝑔𝑒𝑚 𝐻0 (𝑎𝑐𝑐𝑒𝑝𝑡ă𝑚 𝐻1 ) => ∃ legătură între variabile

1
Pentru a testa intensitatea legăturii folosim:
(a) Coeficientul de contingență a lui Pearson

𝜒2
𝐶=√ ∈ [0; 1)
𝑁 + 𝜒2

dacă:
(1) 𝐶 = 0 (𝜒 2 = 0) => ∄ 𝑙𝑒𝑔ă𝑡𝑢𝑟ă
(2) 𝐶 ∈ [0; 0.3) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑠𝑙𝑎𝑏ă (𝑔𝑟𝑎𝑑 𝑚𝑖𝑐 𝑑𝑒 𝑎𝑠𝑜𝑐𝑖𝑒𝑟𝑒)
(3) 𝐶 ∈ [0.3; 0.7) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑒 (𝑔𝑟𝑎𝑑 𝑚𝑒𝑑𝑖𝑢 𝑑𝑒 𝑎𝑠𝑜𝑐𝑖𝑒𝑟𝑒)
(3) 𝐶 ∈ [0.7; 1) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑝𝑢𝑡𝑒𝑟𝑛𝑖𝑐ă (𝑔𝑟𝑎𝑑 𝑚𝑎𝑟𝑒 𝑑𝑒 𝑎𝑠𝑜𝑐𝑖𝑒𝑟𝑒)

(b) Coeficientul de contingență a lui Ciuprov

𝜒2
𝐶=√ ∈ [0; 1)
𝑁 ∙ √(𝐼 − 1)(𝐽 − 1)

unde: I-nr. de linii, J-nr. de coloane.


Avem aceleași interpretări ca și la coeficientul de contingență a lui Pearson.

Ex.1: Se cunoaște distribuția unui eșantion de societăți în funcție de variabilele statistice:


X: forma de proprietate
Y: rentabilitatea acțiunilor
Y/X publică privată mixtă Total
f. mare 2 5 10 17
mare 3 4 8 15
medie 1 6 2 9
mică 12 5 3 20
Total 18 20 23 N=61

a.) Stabiliți dacă există legătură între cele două variabile.


b.) În cazul în care există legătură, precizați intensitatea ei.

2
Rezolvare:

a.)
𝑅 𝐿 2
2
(𝑁𝑖𝑗 − 𝑁𝑖𝑗∗ )
𝜒 = ∑∑
𝑁𝑖𝑗∗
𝑖=1 𝑗=1
(2 − 5.02)2 (5 − 5.57)2 (10 − 6.41)2 (3 − 4.43)2
= + + +
5.02 5.57 6.41 4.43
(4 − 4.92) 2 (8 − 5.66) 2 (1 − 2.66) 2 (6 − 2.95)2
+ + + +
4.92 5.66 2.66 2.95
(2 − 3.39)2 (12 − 5.90)2 (5 − 6.56)2 (3 − 7.54)2
+ + + + = 19.66
3.39 5.90 6.56 7.54
> 0 => 𝑟𝑒𝑠𝑝𝑖𝑛𝑔𝑒𝑚 𝐻0 (𝑎𝑐𝑐𝑒𝑝𝑡ă𝑚 𝐻1 ) => ∃ legătură între variabile


17 ∙ 18
𝑁11 = = 5.02
61

17 ∙ 20
𝑁12 = = 5.57
61

17 ∙ 23
𝑁13 = = 6.41
61

15 ∙ 18
𝑁21 = = 4.43
61

15 ∙ 20
𝑁22 = = 4.92
61

15 ∙ 23
𝑁23 = = 5.66
61

9 ∙ 18
𝑁31 = = 2.66
61

9 ∙ 20
𝑁32 = = 2.95
61

9 ∙ 23
𝑁33 = = 3.39
61

20 ∙ 18
𝑁41 = = 5.90
61

20 ∙ 20
𝑁42 = = 6.56
61

20 ∙ 23
𝑁43 = = 7.54
61

3
b.)

𝜒2 19.66
𝐶= √ = √ = 0.49 ∈ [0.3; 0.7)
𝑁 + 𝜒2 61 + 19.66

=> 𝑎𝑣𝑒𝑚 𝑙𝑒𝑔𝑎𝑡𝑢𝑟𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑒 (𝑔𝑟𝑎𝑑 𝑚𝑒𝑑𝑖𝑢 𝑑𝑒 𝑎𝑠𝑜𝑐𝑖𝑒𝑟𝑒)

𝜒2 19.66
𝐶=√ =√ = 0.36 𝜖[0.3; 0.7)
𝑁 ∙ √(𝐼 − 1)(𝐽 − 1) 61 ∙ √(4 − 1)(3 − 1)

=> 𝑎𝑣𝑒𝑚 𝑙𝑒𝑔𝑎𝑡𝑢𝑟𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑒 (𝑔𝑟𝑎𝑑 𝑚𝑒𝑑𝑖𝑢 𝑑𝑒 𝑎𝑠𝑜𝑐𝑖𝑒𝑟𝑒)

B. Variabile ordinale
-sunt variabile calitative, dar în plus permit clasificări (unitătile statistice pot fi ierarhizate).
-legătura dintre variabilele ordinale se numește corelația rangurilor.

Ex.1: Într-un sondaj de piață efectuat pe 8 produse, s-au obținut următoarele rezultate în
funcție de variabilele: X-calitatea produsului, Y-prețul produsului, Z-renumele firmei
producătoare.
a.) Care este legătura dintre calitate și preț?
b.) Caracterizați nivelul corelației dintre cele trei variabile statistice.

X Y Z
𝑃1 𝑃6 𝑃8
𝑃2 𝑃7 𝑃5
𝑃3 𝑃4 𝑃2
𝑃4 𝑃8 𝑃4
𝑃5 𝑃1 𝑃1
𝑃6 𝑃2 𝑃3
𝑃7 𝑃3 𝑃7
𝑃8 𝑃5 𝑃6

4
Rezolvare:
a.)
P 𝑃1 𝑃2 𝑃3 𝑃4 𝑃5 𝑃6 𝑃7 𝑃8
rang X 1 2 3 4 5 6 7 8
rang Y 5 6 7 3 8 1 2 4
𝑑𝑖 -4 -4 -4 1 -3 5 5 4
rang Z 5 3 6 4 2 8 7 1
𝑆𝑖 11 11 16 11 15 15 16 13

𝑃 = 3 + 2 + 1 + 2 + 0 + 2 + 1 + 0 = 11
𝑄 = 4 + 4 + 4 + 2 + 3 + 0 + 0 + 0 = 17

𝑃 − 𝑄 11 − 17
𝐾= = = −0.21 < 0 => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑖𝑛𝑣𝑒𝑟𝑠ă
𝑃 + 𝑄 11 + 17
|0.21| ∈ (0; 0.3) => 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑠𝑙𝑎𝑏ă

6 ∙ ∑𝑛𝑖=1 𝑑𝑖2 6 ∙ (16 + 16 + 16 + 1 + 9 + 25 + 25 + 16)


ղ=1− 2
=1− = −0.48
𝑛 (𝑛 − 1) 8(64 − 1)

• Coeficientul de corelație simplă a rangurilor al lui Kendall.


𝑃−𝑄
𝐾= ,
𝑃+𝑄
unde:
𝑛

𝑃 = ∑ 𝑝𝑖
𝑖=1
𝑛

𝑄 = ∑ 𝑞𝑖
𝑖=1

𝑝𝑖 − 𝑛𝑟. 𝑟𝑎𝑛𝑔𝑢𝑟𝑖𝑙𝑜𝑟 𝑚𝑎𝑖 𝑚𝑎𝑟𝑖 𝑑𝑒𝑐â𝑡 𝑖 𝑎𝑓𝑙𝑎𝑡𝑒 𝑙𝑎 𝑑𝑟𝑒𝑎𝑝𝑡𝑎 𝑙𝑢𝑖 𝑖.


𝑞𝑖 − 𝑛𝑟. 𝑟𝑎𝑛𝑔𝑢𝑟𝑖𝑙𝑜𝑟 𝑚𝑎𝑖 𝑚𝑖𝑐𝑖 𝑑𝑒𝑐â𝑡 𝑖 𝑎𝑓𝑙𝑎𝑡𝑒 𝑙𝑎 𝑑𝑟𝑒𝑎𝑝𝑡𝑎 𝑙𝑢𝑖 𝑖.

5
Interpretări:
(1) 𝐾 < 0 => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑖𝑛𝑣𝑒𝑟𝑠ă (𝑋 𝑐𝑟𝑒ș𝑡𝑒 => 𝑌 𝑠𝑐𝑎𝑑𝑒)
(2) 𝐾 = 0 => ∄ 𝑙𝑒𝑔ă𝑡𝑢𝑟ă î𝑛𝑡𝑟𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑒
(3) 𝐾 > 0 => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑑𝑖𝑟𝑒𝑐𝑡ă (𝑋 𝑐𝑟𝑒ș𝑡𝑒 => 𝑌 𝑐𝑟𝑒ș𝑡𝑒)

Intensitatea legăturii:
(1) |𝐾| ∈ (0; 0.3) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑠𝑙𝑎𝑏ă
(2) |𝐾| ∈ [0.3; 0.7) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑒
(3) |𝐾| ∈ [0.7; 1) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑝𝑢𝑡𝑒𝑟𝑛𝑖𝑐ă

Obs: Se poate utiliza și un alt coeficient (Spearman).


Este recomanadat să se utilizeze când avem de-a face cu două sau mai multe ranguri egale:
6 ∙ ∑𝑛𝑖=1 𝑑𝑖2
ղ=1− ,
𝑛 (𝑛 2 − 1)
unde:
𝑑𝑖 = 𝑟𝑎𝑛𝑔 𝑋 − 𝑟𝑎𝑛𝑔 𝑌
𝑛 = 𝑛𝑟. 𝑑𝑒 𝑢𝑛𝑖𝑡ăț𝑖 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐𝑒
Interpretare: Idem Kendall.

b.)
𝑆𝑖 = 𝑟𝑎𝑛𝑔 𝑋 + 𝑟𝑎𝑛𝑔 𝑌 + 𝑟𝑎𝑛𝑔 𝑍
11 13 15 16
𝑆: ( )
3 1 2 2
𝑆̅ = 13.5
∑(𝑆𝑖 − 𝑆̅)2 ∙ 𝑁𝑖
𝜎𝑆2 (𝑒𝑓𝑒𝑐𝑡𝑖𝑣ă) = = 4.5
𝑁
𝑚 2 (𝑛 2 − 1)
𝜎𝑆2 (𝑚𝑎𝑥𝑖𝑚ă) = = 47.25
12

4.5
𝐾= = 0.095 => 𝑙𝑒𝑔𝑎𝑡𝑢𝑟𝑎 𝑑𝑖𝑟𝑒𝑐𝑡𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑠𝑙𝑎𝑏𝑎
47.25

6
• Coeficientul de corelație multiplă a rangurilor al lui Kendall.
𝜎𝑆2 (𝑒𝑓𝑒𝑐𝑡𝑖𝑣ă)
𝐾= ,
𝜎𝑆2 (𝑚𝑎𝑥𝑖𝑚ă)
unde:
∑(𝑆𝑖 − 𝑆̅)2 ∙ 𝑁𝑖
𝜎𝑆2 (𝑒𝑓𝑒𝑐𝑡𝑖𝑣ă) =
𝑁
𝑚 2 (𝑛 2 − 1)
𝜎𝑆2 (𝑚𝑎𝑥𝑖𝑚ă) =
12
𝑚 = 𝑛𝑟. 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑒 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐𝑒.
Interpretare: Idem Kendall simplu.

Exercițiu recapitulativ: Pentru un grup de țări se cunosc:


-valoare PIB/loc: 9.5; 10.7; 8.3; 7.9; 12.8. (u.m)
-cost mediu lunar/angajat: 103; 100; 97; 73; 85. (u.m)

a.) Determinați valoarea medie a PIB/loc în eșantionul analizat.


b.) Este reprezentativ PIB/loc mediu pentru cele 5 țări?
c.) Dacă adaugăm 3 (u.m) la PIB-ul/loc a fiecărei țări cum se va modifica PIB-ul/loc mediu?
d.) Care este costul mediu lunar/angajat înregistrat de cele mai multe țări din eșantion? Care
este valoarea ce divide eșantionul în două părți egale?
e.) Calculați decila 3 și 7 pentru variabila cost mediu lunar/angajat.
f.) Folosind valorile quartile să se studieze structura țărilor în raport cu PIB/loc.
g.) Carcaterizați corelația rangurilor construind câte un clasament pentru fiecare țară.
(hint: pentru PIB/loc utilizați principiul maximizării, iar pentru costul mediu lunar/angajat
principiul minimizării).

7
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.

Statistică Descriptivă—Seminar IX

Analiza legăturii dintre variabilele statistice (CAP. III)

C. Variabile cantitative
-se folosesc funcțiile de regresie (dreapta de regresie, hiperbola, parabola, etc.)
Ex.1. Fie repartiția unui grup de firme în raport cu variabilele X-nr de angajați respectiv Y-
costurile medii de producție.

Y/X 10-30 (20) 30-60 (45) 60-100 (80) Total


50-150 (100) 10 7 3 20
150-300 (225) 13 14 12 39
300-500 (400) 6 8 16 30
Total 29 29 31 N=89

a.) Sunt variabilele X si Y independente?


b.) În ipoteza unei forme liniare a funcției de regresie, calculați parametrii funcției.
Interpretați coeficientul de regresie.
c.) Cât de reprezentativă este dreapta de regresie pentru modelarea legăturii dintre X și
Y?
d.) Care este costul mediu de producție pentru 85 angajați?

Rezolvare:
a.)
𝑀(𝑋) ∙ 𝑀(𝑌) = 𝑀(𝑋 ∙ 𝑌)
𝑀(𝑋) = 49.04
𝑀(𝑌) = 255.89
𝑀(𝑋 ∙ 𝑌) = 13435.39
12548.84 ≠ 13435.39 => 𝑋, 𝑌 𝑠𝑢𝑛𝑡 𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒

1
b.) Obs: Pentru a studia formele posibile ale funcției de regresie, se reprezintă norul de
puncte.
𝑌̅/𝑋=20 = 218.1
𝑌̅/𝑋=45 = 243.1
𝑌̅/𝑋=80 = 303.2

Norul de puncte
320

300

280

260

240

220

200
0 10 20 30 40 50 60 70 80 90

Dreapta de regresie: 𝑌 = 𝑎 + 𝑏𝑋 + 𝜀

unde:
𝑐𝑜𝑣(𝑋,𝑌) 𝑀(𝑋∙𝑌)−𝑀(𝑋)∙𝑀(𝑌)
𝑏= = = 1.44
𝜎𝑥2 𝑀(𝑋 2 )−𝑀(𝑋)2

𝑀(𝑋) = 49.04
𝑀(𝑌) = 255.89
𝑀(𝑋 ∙ 𝑌) = 13435.39
𝑀(𝑋 2 ) = 3019.38

𝑎 = 𝑀(𝑌) − 𝑏 ∙ 𝑀(𝑋) = 185.27

𝑌 = 185.27 + 1.44𝑋

2
c.) Calculăm coeficientul de corelație

𝑐𝑜𝑣(𝑋, 𝑌) 𝑀(𝑋 ∙ 𝑌) − 𝑀(𝑋) ∙ 𝑀(𝑌)


𝑟𝑋𝑌 = = = 0.31 ∈ [0.3; 0.7)
𝜎𝑋 ∙ 𝜎𝑌 √𝑀(𝑋 2 ) − 𝑀(𝑋)2 ∙ √𝑀(𝑌 2 ) − 𝑀(𝑌)2
=> 𝑓𝑢𝑛𝑐ț𝑖𝑎 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖𝑒 𝑎𝑟𝑒 𝑜 𝑟𝑒𝑝𝑟𝑒𝑧𝑒𝑛𝑡𝑎𝑡𝑖𝑣𝑖𝑡𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑒

𝑀(𝑌 2 ) = 78363.76

Interpretări:

1. 𝑟𝑋𝑌 = 0 => funcția de regresie nu este reprezentativă; X și Y sunt independente


2. |𝑟𝑋𝑌 | ∈ (0; 0.3) => reprezentativitate slabă
3. |𝑟𝑋𝑌 | ∈ [0.3; 0.7) => reprezentativitate medie
4. |𝑟𝑋𝑌 | ∈ [0.7; 1) => reprezentativitate puternică

d.) Pentru X=05 => 𝑌 = 185.27 + 1.44 ∙ 85 = 307.67

3
Ex.3. Se consideră distribuția unor apartamente în funcție de variabilele X-suprafața (m2)
respectiv Y-preț (mii euro).

Y/X 10-20 (15) 20-50 (35) 50-100 (75) 100-160 (130) Total
20-40 (30) 2 3 2 - 7
40-80 (60) 3 4 5 1 13
80-150 (115) 1 2 3 2 8
150-200 (175) - 1 2 3 6
Total 6 10 12 6 34

a.) Stabiliți dacă există legătură între variabilele X și Y.


b.) În cazul în care există legătură precizați intensitatea ei.
c.) În ce măsură influențează suprafața prețul de vânzare al apartamentelor?
d.) Identificați funcția de regresie care ar modela legătura dintre variabile.
e.) În ipoteza unei funcții liniare de regresie, estimați parametrii acesteia.
f.) Interpretați coeficientul de regresie pentru funcția găsită la e.
g.) Cât de reprezentativă este dreapta de regresie pentru modelarea legăturii dintre X și
Y?
h.) Estimați prețul mediu al unui apartament cu o suprafață de 200m2.

Rezolvare:
a.) Pentru a stabili dacă există legătură între două variabile cantitative putem apela la două
metode învățate:

(1) proprietățile mediei, și anume calculăm:

𝑀(𝑋) ∙ 𝑀(𝑌) = 𝑀(𝑋 ∙ 𝑌)


𝑀(𝑋) = 62.35
𝑀(𝑌) = 87.06
𝑀(𝑋) ∙ 𝑀(𝑌) = 5428,19
𝑀(𝑋 ∙ 𝑌) = 6356.62
5428,19 ≠ 6356.62 => 𝑋, 𝑌 𝑠𝑢𝑛𝑡 𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒

(2) varianța explicită, și anume arătăm că aceasta este mai mare decât zero:

Obs: Trebuie determinat în baza raționamentului economic (sau în baza unui subpunct al
problemei – dacă este cazul, care este variabila dependentă și cea independentă). În contextul
acestui exercițiu, adițional raționamentului economic, ne putem da seama în baza
subpunctului c.) că prețul apartamentelor este influențat de suprafața acestora => prețul este
variabila dependentă (endogenă) iar suprafața cea independentă (exogenă/factorul).

𝑉𝑒𝑥𝑝𝑙𝑖𝑐𝑖𝑡ă = 611.44 > 0 => ∃ 𝑙𝑒𝑔ă𝑡𝑢𝑟ă î𝑛𝑡𝑟𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑒

b.) 𝑉𝑡𝑜𝑡𝑎𝑙ă (𝑣𝑎𝑟𝑖𝑎𝑛ț𝑎 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑒𝑖 𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒) = 2498.70 =>

4
𝑉𝑒𝑥𝑝𝑙𝑖𝑐𝑖𝑡ă 611.44
𝑅𝑌𝑋 = √ =√ = 0.49 ∈ [0.3; 0.7) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑒
𝑉𝑡𝑜𝑡𝑎𝑙ă 2498.70

𝑉𝑒𝑥𝑝𝑙𝑖𝑐𝑖𝑡ă 611.44
c.) 𝑅𝑌𝑋
2
= = 2498.70 = 0.24 = 24% =>
𝑉𝑡𝑜𝑡𝑎𝑙ă

𝑝𝑟𝑒ț𝑢𝑙 𝑎𝑝𝑎𝑟𝑡𝑎𝑚𝑒𝑛𝑡𝑒𝑙𝑜𝑟 𝑑𝑒𝑝𝑖𝑛𝑑𝑒 î𝑛 𝑝𝑟𝑜𝑝𝑜𝑟ț𝑖𝑒 𝑑𝑒 24% 𝑑𝑒 𝑠𝑢𝑝𝑟𝑎𝑓𝑎ț𝑎 𝑎𝑐𝑒𝑠𝑡𝑜𝑟𝑎, 𝑖𝑎𝑟 î𝑛 𝑝𝑟𝑜𝑝𝑜𝑟ț𝑖𝑒 𝑑𝑒 76% 𝑑

d.)
̅̅̅̅𝑋=15 = 59.17
𝑌/
̅̅
𝑌/̅̅𝑋=35 = 73.5
̅𝑌/
̅̅̅𝑋=75 = 87.92
̅̅̅̅𝑋=130 = 135.83
𝑌/

Norul de puncte
150
140
130
120
110
100
90
80
70
60
50
0 20 40 60 80 100 120 140

e.) Dreapta de regresie: 𝑌 = 𝑎 + 𝑏𝑋 + 𝜀

unde:
𝑐𝑜𝑣(𝑋,𝑌) 𝑀(𝑋∙𝑌)−𝑀(𝑋)∙𝑀(𝑌)
𝑏= 2 = = 0.63
𝜎𝑋 𝑀(𝑋 2 )−𝑀(𝑋)2

𝑀(𝑋) = 62.35
𝑀(𝑌) = 87.06
𝑀(𝑋) ∙ 𝑀(𝑌) = 5428,19
𝑀(𝑋 ∙ 𝑌) = 6356.62
𝑀(𝑋 2 ) = 5367.65

5
𝑎 = 𝑀(𝑌) − 𝑏 ∙ 𝑀(𝑋) = 47.78

𝑌 = 47.78 + 0.63𝑋

f.) Interpretare b: la o creștere cu o unitate a suprafeței apartamentelor, prețul acestora


crește cu 0.63 unități, in medie, ceteris paribus.

g.) Calculăm coeficientul de corelație

𝑐𝑜𝑣(𝑋, 𝑌) 𝑀(𝑋 ∙ 𝑌) − 𝑀(𝑋) ∙ 𝑀(𝑌)


𝑟𝑋𝑌 = = = 0.48 ∈ [0.3; 0.7)
𝜎𝑋 ∙ 𝜎𝑌 √𝑀(𝑋 2 ) − 𝑀(𝑋)2 ∙ √𝑀(𝑌 2 ) − 𝑀(𝑌)2
=> 𝑓𝑢𝑛𝑐ț𝑖𝑎 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖𝑒 𝑎𝑟𝑒 𝑜 𝑟𝑒𝑝𝑟𝑒𝑧𝑒𝑛𝑡𝑎𝑡𝑖𝑣𝑖𝑡𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑒

𝑀(𝑌 2 ) = 10077.94

Interpretări:

1. 𝑟𝑋𝑌 = 0 => funcția de regresie nu este reprezentativă; X și Y sunt independente


2. |𝑟𝑋𝑌 | ∈ (0; 0.3) => reprezentativitate slabă
3. |𝑟𝑋𝑌 | ∈ [0.3; 0.7) => reprezentativitate medie
4. |𝑟𝑋𝑌 | ∈ [0.7; 1) => reprezentativitate puternică

h.) Pentru X=200 => 𝑌 = 47.78 + 0.63 ∙ 200 = 173.78 𝑚𝑖𝑖 𝐸𝑈𝑅

6
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.

Statistică Descriptivă—Seminar X
Serii cronologice
𝑡 𝑡2 ⋯ 𝑡𝑛
𝑌: (𝑦1 𝑦2 ⋯ 𝑦𝑛 )
1

Ex. 1: Productia de cherestea (in tone) a unei fabrici pe un interval de 5 ani a fost:

2015 2016 2017 2018 2019


𝑌: ( )
10 11 16 15 17

a.) Calculati diferentele absolute, indicii statistici, si diferentele relative cu baza fixa si
baza in lant.
b.) Care este nivelul mediu anual al productiei in perioada analizata?
c.) Cu cat s-a modificat in medie productia de la un an la altul?
d.) De cate ori s-a modificat in medie si cu cat la suta productia?
e.) Reprezentati grafic seria cronologica.
f.) Scrieti ecuatia care modeleaza evolutia productiei in timp si studiati
reprezentativitatea ecuatiei.
g.) Previzionati productia pentru anul 2020.

Rezolvare:
a.) Diferentele absolute:
(i) cu baza fixa: ∆𝑦 𝑡/𝑡0 = 𝑦𝑡 − 𝑦𝑡0

2015 2016 2017 2018 2019


𝑡/𝑡0
∆𝑌 :( )
0 1 6 5 7
Interpretare (exemplu): producția de cherestea a crescut cu 5 tone in 2018 față de 2015.

(i) cu baza in lant: ∆𝑦 𝑡/𝑡−1 = 𝑦𝑡 − 𝑦𝑡−1

2015 2016 2017 2018 2019


𝑡/𝑡−1
∆𝑌 :( )
− 1 5 −1 2
Interpretare (exemplu): producția de cherestea a scăzut cu 1 tonă in 2018 față de 2017.

1
Indicii statistici
𝑡/𝑡 𝑦
(i) cu baza fixa: 𝐼𝑌 0 = 𝑦 𝑡
𝑡0

2015 2016 2017 2018 2019


𝑡/𝑡0
𝐼𝑌
:( )
1 1.1 1.6 1.5 1.7
Interpretare (exemplu): producția de cherestea a crescut de 1.5 ori in 2018 față de 2015.

𝑡/𝑡−1 𝑦𝑡
(i) cu baza in lant: 𝐼𝑌 =𝑦
𝑡−1

2015 2016 2017 2018 2019


𝑡/𝑡−1
𝐼𝑌 :( )
− 1.1 1.45 0.94 1.13
Interpretare (exemplu): producția de cherestea a scăzut de 0.94 ori in 2018 față de 2017.

Diferente relative
𝑡/𝑡
𝑡/𝑡0 𝑦𝑡 −𝑦𝑡0 ∆𝑌 0 𝑡/𝑡0
(i) cu baza fixa: 𝑅𝑌 = = = (𝐼𝑦 − 1) × 100
𝑦𝑡0 𝑦𝑡0

2015 2016 2017 2018 2019


𝑡/𝑡0
𝑅𝑌 :( )
0% 10% 60% 50% 70%
Interpretare (exemplu): producția de cherestea a crescut cu 50% in 2018 față de 2015.

𝑡/𝑡−1 𝑡/𝑡−1
(i) cu baza in lant: 𝑅𝑦 = (𝐼𝑦 − 1) × 100

2015 2016 2017 2018 2019


𝑡/𝑡−1
𝑅𝑦 :( )
− 10% 45% −6% 13%
Interpretare (exemplu): producția de cherestea a scăzut cu 6% in 2018 față de 2017.

b.) Nivelul mediu


Obs I: Daca Y este serie de intervale (exprima fluxuri: nasteri/ decese/ productia/ venituri/
cheltuieli/ importuri/ exporturi ...) =>

𝑦1 + 𝑦2 + ⋯ 𝑦𝑛 10 + 11 + 16 + 15 + 17
𝑦̅ = = = 13.8 𝑒𝑠𝑡𝑒 𝑝𝑟𝑜𝑑𝑢𝑐ț𝑖𝑎 𝑚𝑒𝑑𝑖𝑒 𝑎𝑛𝑢𝑎𝑙ă
𝑛 5

Obs II: Daca Y este serie de momente (exprima stocuri: nr. de autoturisme/ biblioteci/
studenti ...) =>

𝑇1 𝑇 +𝑇 𝑇 +𝑇 𝑇
𝑦1 + 1 2 2 𝑦2 + ⋯ 𝑛−2 2 𝑛−1 𝑦𝑛−1 + 𝑛−1
𝑦̅ = 2 2 𝑦𝑛
𝑇1 + 𝑇2 + ⋯ + 𝑇𝑛−1

2
c.) Diferenta absoluta medie
𝑦𝑛 − 𝑦1 17 − 10
∆̅𝑌 = = = 1.75
𝑛−1 5−1
Interpretare (exemplu): producția de cherestea a crescut în medie cu 1.75 tone de la un an
la altul.

d.) Indicele mediu


∑ 𝑦𝑡−1 ∙ 𝑦𝑡 10 ∙ 11 + 11 ∙ 16 + 16 ∙ 15 + 15 ∙ 17
𝐼𝑌̅ = 2 = = 1.11
∑ 𝑦𝑡−1 102 + 112 + 162 + 152
Interpretare (exemplu): producția de cherestea a crescut în medie de 1.11 ori de la un an la
altul.

Obs: Daca anii nu sunt consecutivi se poate folosi formula:

𝑛−1 𝑦𝑛
𝐼𝑌̅ = √
𝑦1

Ritmul mediu:
𝑅̅𝑌 = (𝐼𝑌̅ − 1) × 100 = 11%
Interpretare (exemplu): producția de cherestea a crescut în medie cu 11% de la un an la altul.

e.)
y = 1.8x + 8.4
Cronograma R² = 0.8351
19

17 17
16
15 15

13

11 11
10
9

5
2015 2016 2017 2018 2019

3
f.) functia (ecuatia) de regresie este
𝑌 = 𝑎 + 𝑏 ∙ 𝑡 + 𝜀,

unde:
𝑐𝑜𝑣(𝑡, 𝑌) 𝑀(𝑡 ∙ 𝑌) − 𝑀(𝑡) ∙ 𝑀(𝑌)
𝑏= = = 1.8
𝜎𝑡2 𝑀(𝑡 2 ) − 𝑀(𝑡)2

𝑎 = 𝑀(𝑌) − 𝑏 ∙ 𝑀(𝑡) = 8.4

𝑌 = 8.4 + 1.8 ∙ 𝑡

Notă: În cazul seriilor cronologice perioadele de timp se numerotează de la 1 la n (sau 0 la


n), iar valorile medii se calculează folosind media aritmetică.

1 2 3 4 5
𝑌: ( )
10 11 16 15 17

1+2+3+4+5
𝑀(𝑡) = =3
5

10 + 11 + 16 + 15 + 17
𝑀(𝑌) = = 13.8
5

10 ∙ 1 + 11 ∙ 2 + 16 ∙ 3 + 15 ∙ 4 + 17 ∙ 5
𝑀(𝑡 ∙ 𝑌) = = 45
5

2)
12 + 22 + 32 + 42 + 52
𝑀(𝑡 = = 11
5

𝑀(𝑡)2 = 9

2)
102 + 112 + 162 + 152 + 172
𝑀(𝑌 = = 198.2
5

𝑀(𝑌)2 = 190.44

𝑐𝑜𝑣(𝑡, 𝑌) 𝑀(𝑡 ∙ 𝑌) − 𝑀(𝑡) ∙ 𝑀(𝑌)


𝑟𝑡𝑌 = = = 0.92
𝜎𝑡 ∙ 𝜎𝑌 √𝑀(𝑡 2 ) − 𝑀(𝑡)2 ∙ √𝑀(𝑌 2 ) − 𝑀(𝑌)2

|0.92| ∈ [0.7; 1) => 𝑟𝑒𝑝𝑟𝑒𝑧𝑒𝑛𝑡𝑎𝑡𝑖𝑣𝑖𝑡𝑎𝑡𝑒 𝑝𝑢𝑡𝑒𝑟𝑛𝑖𝑐𝑎 𝑎 𝑑𝑟𝑒𝑝𝑡𝑒𝑖 𝑑𝑒 𝑟𝑒𝑔𝑟𝑒𝑠𝑖𝑒

4
g.) Pentru previziuni putem utiliza:

1. previziunea pe baza ecuației de regresie (anul 2020 are ca număr de ordine 6)

𝑌̂2020 = 8.4 + 1.8 ∙ 6 = 19.2 (𝑡𝑜𝑛𝑒)

2. previziune pe baza indicatorilor medii

𝑌̂𝑇+ℎ = 𝑌𝑡 + ℎ ∙ ∆̅𝑌 =

= 𝑌𝑡 + ℎ ∙ 1.75 = 17 + 1 ∙ 1.75 = 18.75 (𝑡𝑜𝑛𝑒)

𝑌̂𝑇+ℎ = 𝑌𝑡 ∙ (𝐼𝑌̅ )ℎ =

= 17 ∙ 1.11 = 18.87 (𝑡𝑜𝑛𝑒)

Extra: Fie stocul de făină a unei plăcintării:

Data Stocul (kg) 𝑡𝑘 (𝑇)


01.01.2006 140 1
31.01.2006 160 1
28.02.2006 240 1
31.03.2006 200 3
30.06.2006 120 4
31.10.2006 160 2
31.12.2006 220

a.) Care este stocul mediu de făină al plăcintăriei în trimestrul I?


b.) Care este stocul mediu de făină al plăcintăriei pe întreg anul?

𝑇1 𝑇 +𝑇 𝑇 +𝑇 𝑇
𝑦1 + 1 2 2 𝑦2 + ⋯ 𝑛−2 2 𝑛−1 𝑦𝑛−1 + 𝑛−1
𝑦̅ = 2 2 𝑦𝑛
𝑇1 + 𝑇2 + ⋯ + 𝑇𝑛−1

5
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.

Statistică Descriptivă—Seminar XI
Indicii statistici
Fie mărimea Z influențată de mai mulți factori: x, y, z, t, ... . În funcție de formula matematică
a lui Z avem mai multe modele matematice:
a.) Modelul aditiv:
𝑍 =𝑥+𝑦+𝑧+⋯
𝑍 =𝑥−𝑦+𝑡−𝑧+⋯

b.) Modelul multiplicativ

𝑍 =𝑥∙𝑦∙𝑧∙…
𝑥
𝑍= ∙𝑧∙…
𝑦
Fie modelul 𝑍 = 𝑥 + 𝑦
I. Indicele variației intregrale: ne arată de câte ori se modifică variabila Z în perioada
curentă k fată de perioada de bază j.
𝑘/𝑗 𝑍𝑘
𝐼𝑍 =
𝑍𝑗
II. Indicii elementari (Indicii factorilor)
- Pp. că mărimea Z este influențată de factorii x și y, atunci:

𝑘/𝑗 𝑥𝑘
𝐼𝑥 =
𝑥𝑗

𝑘/𝑗 𝑦𝑘
𝐼𝑦 =
𝑦𝑗

1
III. Indicii variației parțiale (Indicii variației factoriale) (ne arată de câte ori se
modifică Z sub influența exclusivă a unui singur factor—avem nevoie de modelul
matematic a lui Z !)

a.) Indicii Laspeyres: păstrează factorii neanalizați la perioada de bază j.

𝑘/𝑗 𝑥𝑘 + 𝑦𝑗
𝐼𝑍/𝑥 (𝐿) = (𝑎𝑖𝑐𝑖 𝑥 𝑒𝑠𝑡𝑒 𝑓𝑎𝑐𝑡𝑜𝑟𝑢𝑙 𝑎𝑛𝑎𝑙𝑖𝑧𝑎𝑡)
𝑥𝑗 + 𝑦𝑗

b.) Indicii Paasche: păstrează factorii neanalizați la perioada curentă k.

𝑘/𝑗 𝑥𝑘 + 𝑦𝑘
𝐼𝑍/𝑥 (𝑃) = (𝑎𝑖𝑐𝑖 𝑥 𝑒𝑠𝑡𝑒 𝑓𝑎𝑐𝑡𝑜𝑟𝑢𝑙 𝑎𝑛𝑎𝑙𝑖𝑧𝑎𝑡)
𝑥𝑗 + 𝑦𝑘

c.) Indicii Fischer: media geometrică dintre (L) și (P).

𝑘/𝑗 𝑘/𝑗 𝑘/𝑗


𝐼𝑍/𝑥 (𝐹) = √𝐼𝑍/𝑥 (𝐿) ∙ 𝐼𝑍/𝑥 (𝑃)

Exercițiu 1.
Exporturile și importurile unei țări în doi ani consecutivi au fost:

Valoare/An 2016 2017


Exporturi (mil EUR) 1000 1200
Importuri (mil EUR) 850 944

a.) Care a fost rezultatul balanței comerciale în fiecare an?


b.) Cum s-a modificat rezultatul balanței de la un an la altul?
c.) Calculați indicele Fisher pentru exporturi.
d.) Calculati indicele Fisher pentru importuri.

a.) Balanta comerciala= Exp-Imp


𝐵2016 = 1000 − 850 = 150 𝑚𝑖𝑙 𝐸𝑈𝑅

𝐵2017 = 1200 − 944 = 256 𝑚𝑖𝑙 𝐸𝑈𝑅

b.)
2017/2016 𝐵2017 256
𝐼𝐵 = = = 1.71 > 1
𝐵2016 150
Interpretare: balanta comerciala a crescut de 1.71 ori in 2017 fata de 2016.

2
c.) Laspeyres:

2017/2016 𝐸𝑥𝑝2017 − 𝐼𝑚𝑝2016 1200 − 850


𝐼𝐵/𝐸𝑥𝑝 (𝐿) = = = 2.33
𝐸𝑥𝑝2016 − 𝐼𝑚𝑝2016 1000 − 850

𝑘/𝑗 𝐸𝑥𝑝2017 − 𝐼𝑚𝑝2016


𝐼𝑍/𝑥 (𝐿) =
𝐸𝑥𝑝2016 − 𝐼𝑚𝑝2016

Paasche:

2017/2016 𝐸𝑥𝑝2017 − 𝐼𝑚𝑝2017 1200 − 944


𝐼𝐵/𝐸𝑥𝑝 (𝑃) = = = 4.57
𝐸𝑥𝑝2016 − 𝐼𝑚𝑝2017 1000 − 944

Fischer:
2017/2016 𝑘/𝑗 𝑘/𝑗
𝐼𝐵/𝐸𝑥𝑝 (𝐹) = √𝐼𝑍/𝑥 (𝐿) ∙ 𝐼𝑍/𝑥 (𝑃) = √2.33 ∙ 4.57 = 3.26

Interpretare: sub influenta exclusiva a exporturilor, balanta comerciala a crescut de 3.26 ori
in anul 2017 fata de 2016, in baza indicelui Fisher.
d.)
2017/2016
𝐼𝐵/𝐼𝑚𝑝 (𝐿) = 0.37

2017/2016
𝐼𝐵/𝐼𝑚𝑝 (𝑃) = 0.73

2017/2016
𝐼𝐵/𝐼𝑚𝑝 (𝐹) = 0.52

Interpretare: sub influenta exclusiva a importurilor, balanta comerciala a scazut de 0.52 ori
in anul 2017 fata de 2016, in baza indicelui Fisher.

3
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.

Statistică Descriptivă—Seminar VI

Parametrii repartițiilor (CAP. II)

A. Parametrii tendinței centrale


B. Parametrii de structură
C. Parametrii variației
D. Parametrii formei
E. Parametrii concentrării

C. Parametrii variației

• ne arată variația (depărtarea) valorilor unei variabile statistice față de valoarea medie
M(X) sau valoarea mediană Me

C1. Parametrii variatiei în raport cu valoarea medie


1. Dispersia (varianța) – cea mai utilizată
𝑥1 𝑥2 … 𝑥𝑅
Fie X: (𝑁 𝑁2 … 𝑁𝑅 ) , 𝑁
1

∑𝑅𝑖=1(𝑥𝑖 − 𝑋̅)2 ∙ 𝑁𝑖
𝜎𝑋2 =
𝑁
𝜎𝑋2 = 𝑀(𝑋 2 ) − 𝑀(𝑋)2

1
• de obicei pentru interpretări utilizăm:

- abaterea medie pătratică: 𝜎𝑋 = √𝜎𝑋2

• pentru interpretări referitoare la:

- reprezentativitatea mediei
- omogeneitatea/eterogeneitatea populației statistice

coeficientul de variație a lui Pearson


𝜎𝑋
𝐶𝑉𝑋 = ∙ 100
𝑋̅
𝑎. ) 𝐶𝑉𝑋 ≤ 30% => 𝑝𝑜𝑝𝑢𝑙𝑎ț𝑖𝑎 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐ă 𝑒𝑠𝑡𝑒 𝑜𝑚𝑜𝑔𝑒𝑛ă; 𝑚𝑒𝑑𝑖𝑎 𝑒𝑠𝑡𝑒 𝑟𝑒𝑝𝑟𝑒𝑧𝑒𝑛𝑡𝑎𝑡𝑖𝑣ă
𝑏. ) 𝐶𝑉𝑋 > 30% => 𝑝𝑜𝑝𝑢𝑙𝑎ț𝑖𝑎 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐ă 𝑒𝑠𝑡𝑒 𝑒𝑡𝑒𝑟𝑜𝑔𝑒𝑛ă; 𝑚𝑒𝑑𝑖𝑎 𝑒𝑠𝑡𝑒 𝑛𝑒𝑟𝑒𝑝𝑟𝑒𝑧𝑒𝑛𝑡𝑎𝑡𝑖𝑣ă

Ex. 1: Se consideră distrbuția angajaților unei societăți comerciale în funcție de vechimea în


muncă:
1 − 5 5 − 11 11 − 19
X: ( ) , 𝑁 = 10
3 5 2

a.) Aflați abaterea media pătratică și interpretați rezultatul.


b.) Este distribuția angajaților omogenă în raport cu vechimea (medie) în muncă?
Justificați răspunsul.
Rezolvare:
a.)

𝜎𝑋 = √𝜎𝑋2 = 4.16
Interpretare: vechimea angajatilor se abate in medie cu ±4.16 fata de vechimea
medie (7.9 ani).
∑𝑅𝑖=1(𝑥𝑖 − 𝑋̅)2 ∙ 𝑁𝑖
𝜎𝑋2 = = 17.29
𝑁
𝑋̅ = 7.9
b.)
𝜎𝑋 4.16
𝐶𝑉𝑋 = ∙ 100 = ∙ 100 = 52.65%
𝑋̅ 7.9

2
C2. Parametrii variației în raport cu mediana
1.) Abaterea intequantilică

𝑞𝑛−1 − 𝑞1
𝑄= ,
2
unde: 𝑞𝑛−1 - ultima quantilă
𝑞1 – prima quantilă

• cazuri particulare:
𝑞3 −𝑞1
(i) abaterea interquartilică: 𝑄 =
2

𝑑9 −𝑑1
(ii) abaterea interdecilică: 𝑄 = 2

𝑐99 −𝑐1
(iii) abaterea intercentilică: 𝑄 = 2

• pentru studiul omogeneității/eterogeneității populației statistice în raport cu Me


(pentru rezentativitatea medianei) utilizăm:
𝑄
abaterea relativă: 𝑄𝑟 = 𝑀𝑒 ∙ 100

𝑎. ) 𝑄𝑟 ≤ 30% =>
𝑝𝑜𝑝𝑢𝑙𝑎ț𝑖𝑎 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐ă 𝑒𝑠𝑡𝑒 𝑜𝑚𝑜𝑔𝑒𝑛ă î𝑛 𝑟𝑎𝑝𝑜𝑟𝑡 𝑐𝑢 𝑀𝑒; 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑒𝑠𝑡𝑒 𝑟𝑒𝑝𝑟𝑒𝑧𝑒𝑛𝑡𝑎𝑡𝑖𝑣ă
𝑏. ) 𝑄𝑟 > 30% =>
𝑝𝑜𝑝𝑢𝑙𝑎ț𝑖𝑎 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐ă 𝑒𝑠𝑡𝑒 𝑒𝑡𝑒𝑟𝑜𝑔𝑒𝑛ă î𝑛 𝑟𝑎𝑝𝑜𝑟𝑡 𝑐𝑢 𝑀𝑒; 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑒𝑠𝑡𝑒 𝑛𝑒𝑟𝑒𝑝𝑟𝑒𝑧𝑒𝑛𝑡𝑎𝑡𝑖𝑣ă

Ex. 1: Veniturile lunare înregistrate la un magazin alimentar au fost: 10, 15, 13, 11, 13, 14,
16, 17, 12, 10, 9, 11 (mii RON).
Studiați reprezentativitatea venitului median.
Rezolvare:
𝑄
abaterea relativă: 𝑄𝑟 = 𝑀𝑒 ∙ 100 = 16%

𝑞3 −𝑞1
abaterea interquartilică: 𝑄 = =2
2

3
𝑞1 = 10.5
𝑞2 = 12.5 (𝑚𝑒𝑑𝑖𝑎𝑛𝑎)
𝑞3 = 14.5

Regula de adunare a varianțelor (dispersiilor)


𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑡𝑜𝑡𝑎𝑙ă = 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑒𝑥𝑝𝑙𝑖𝑐𝑖𝑡ă + 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑟𝑒𝑧𝑖𝑑𝑢𝑎𝑙ă

Ex. 1: Fie distribuția unei firme în raport cu chetuielile cu publicitatea (X) respectiv volumul
vânzărilor (Y) (mii RON).
Y/ X 3-5 5-7 7-9 Total
20-40 3 2 1
40-60 2 1 -
Total

a.) Verificați regula de adunare a varianțelor.


b.) În ce proporție volumul vânzărilor depinde de cheltuielile cu publicitatea?
c.) În care grupă de cheltuieli cu publicitatea volumul mediu al vânzărilor este mai
reprezentativ?

4
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.

Statistică Descriptivă—Seminar VII

Parametrii repartițiilor (CAP. II)

A. Parametrii tendinței centrale


B. Parametrii de structură
C. Parametrii variației
D. Parametrii formei
E. Parametrii concentrării

(continuare problemă regula de adunare a varianțelor—parametrii variației)


Ex. 1: Fie distribuția unei firme în raport cu chetuielile cu publicitatea (X) respectiv volumul
vanzărilor (Y) (mii RON).
Y/ X 3-5 (4) 5-7 (6) 7-9 (8) Total
20-40 (30) 3 2 1 6
40-60 (50) 2 1 - 3
Total 5 3 1 N=9

a.) Verificați regula de adunare a varianțelor.


b.) În ce proporție volumul vânzărilor depinde de cheltuielile cu publicitatea?
c.) În care grupă de cheltuieli cu publicitatea volumul mediu al vânzărilor este mai
reprezentativ?
Rezolvare:
a.) Pentru Y ce depinde de X avem:
𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑡𝑜𝑡𝑎𝑙ă = 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑒𝑥𝑝𝑙𝑖𝑐𝑖𝑡ă + 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑟𝑒𝑧𝑖𝑑𝑢𝑎𝑙ă

𝜎𝑌2 = 𝜎𝑌2̅ /𝑋 + ̅̅̅̅̅̅


2
𝜎𝑌/𝑋

1
𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑡𝑜𝑡𝑎𝑙ă = 𝜎𝑌2 = 88.88

30 50
Y: ( ),𝑁 = 9
6 3
𝑌̅ = 36.66
𝜎𝑌2 = 88.88
∑𝑅𝑖=1(𝑦𝑖 − 𝑌̅)2 ∙ 𝑁𝑖
𝜎𝑌2 =
𝑁

𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑒𝑥𝑝𝑙𝑖𝑐𝑖𝑡ă = 𝜎𝑌2̅ /𝑋 = 5.92


38 36.66 30
𝑌̅ /𝑋: ( ),𝑁 = 9
5 3 1

M(𝑌̅/𝑋) = 𝑀(𝑌) = 36.66

30 50
𝑌/𝑋=4 : ( ),𝑁 = 5
3 2
𝑌̅/𝑋=4 = 38

30 50
𝑌/𝑋=6 : ( ),𝑁 = 3
2 1
𝑌̅/𝑋=6 = 36.66

30 50
𝑌/𝑋=8 : ( ),𝑁 = 1
1 0
𝑌̅/𝑋=8 = 30

𝜎𝑌2̅ /𝑋 = 5.92

𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑟𝑒𝑧𝑖𝑑𝑢𝑎𝑙ă = ̅̅̅̅̅̅
2
𝜎𝑌/𝑋 = 82.96

2 96 88.88 0
𝜎𝑌/𝑋 :( ),𝑁 = 9
5 3 1

2
2
𝜎𝑌/𝑋=4
= 96

2
𝜎𝑌/𝑋=6
= 88.88

2
𝜎𝑌/𝑋=8
=0

̅̅̅̅̅̅
2
𝜎𝑌/𝑋 = 82.96

𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑡𝑜𝑡𝑎𝑙ă = 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑒𝑥𝑝𝑙𝑖𝑐𝑖𝑡ă + 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑟𝑒𝑧𝑖𝑑𝑢𝑎𝑙ă


88.88=5.92+82.96 (q.e.d.)

b.) În ce proporție Y depinde de X?


𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑒𝑥𝑝𝑙𝑖𝑐𝑖𝑡ă 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑟𝑒𝑧𝑖𝑑𝑢𝑎𝑙ă
• raportul de determinare: 𝑅𝑋𝑌
2
= 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑡𝑜𝑡𝑎𝑙ă
=1− 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑡𝑜𝑡𝑎𝑙ă

- ne arată în ce proporție variabila dependentă depinde de variabila independentă


(factorul de infuență)

𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑒𝑥𝑝𝑙𝑖𝑐𝑖𝑡ă 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑟𝑒𝑧𝑖𝑑𝑢𝑎𝑙ă
• raportul de corelație: 𝑅𝑋𝑌 = √ 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑡𝑜𝑡𝑎𝑙ă
= √1 − 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑡𝑜𝑡𝑎𝑙ă

- indică intensitatea legăturii dintre variabile (X și Y aici)


- interpretare:
𝑅𝑋𝑌 = 0 => 𝑋, 𝑌 𝑠𝑢𝑛𝑡 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒
𝑅𝑋𝑌 ∈ (0; 0.3] => 𝑙𝑒𝑔𝑎𝑡𝑢𝑟𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑠𝑙𝑎𝑏𝑎
𝑅𝑋𝑌 ∈ (0.3; 0.7] => 𝑙𝑒𝑔𝑎𝑡𝑢𝑟𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑒
𝑅𝑋𝑌 ∈ (0.7; 1) => 𝑙𝑒𝑔𝑎𝑡𝑢𝑟𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑝𝑢𝑡𝑒𝑟𝑛𝑖𝑐𝑎
𝑅𝑋𝑌 = 1 => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑑𝑒𝑡𝑒𝑟𝑚𝑖𝑛𝑖𝑠𝑡ă

2
5.92
𝑅𝑋𝑌 = ∙ 100 = 6.66%
88.88
𝑅𝑋𝑌 = 0.26

3
c.)

√96
𝐶𝑉𝑌/𝑋=4 = ∙ 100 = 25.78%
38
√88.88
𝐶𝑉𝑌/𝑋=6 = ∙ 100 = 25.71%
36.66
√0
𝐶𝑉𝑌/𝑋=8 = ∙ 100 = 0%
30
𝐶𝑉𝑌/𝑋=8 < 𝐶𝑉𝑌/𝑋=6 < 𝐶𝑉𝑌/𝑋=4

D. Parametrii formei
- ne arată forma distribuției unităților statistice

𝑥1 𝑥2 … 𝑥𝑅
Fie X: ( 𝑓 𝑓2 … 𝑓𝑅 ) , 100%
1

- avem distribuție simetrică dacă 𝑓 (𝑥̅ − 𝑎) = 𝑓(𝑥̅ + 𝑎)

4
1. Parametrii asimetriei (skewness)

a.) Coeficientul de asimetrie a lui Pearson

- 𝛼 = 0 => 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢ț𝑖𝑒 𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑐ă


- 𝛼 > 0 => 𝑎𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑒 𝑝𝑜𝑧𝑖𝑡𝑖𝑣ă (𝑑𝑒 𝑑𝑟𝑒𝑎𝑝𝑡𝑎)
- 𝛼 < 0 => 𝑎𝑠𝑖𝑚𝑒𝑡𝑟𝑖𝑒 𝑛𝑒𝑔𝑎𝑡𝑖𝑣ă (𝑑𝑒 𝑠𝑡â𝑛𝑔𝑎)

𝑥̅ − 𝑀𝑜
𝛼=
𝜎𝑥

b.) Coeficientul de asimetrie a lui Fisher

𝑀 [(𝑥 − 𝑥̅ )3 ]
𝛼3 =
𝜎𝑥3
- idem interpretări coeficientul de asimetrie a lui Pearson

5
2. Paramterii boltirii (kurtosis)

a.) Coeficientul de boltire a lui Fisher

𝑀 [(𝑥 − 𝑥̅ )4 ]
𝛽4 =
𝜎𝑥4
- 𝛽4 = 3 => 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢ț𝑖𝑎 𝑢𝑟𝑚𝑒𝑎𝑧ă 𝑙𝑒𝑔𝑒𝑎 𝑛𝑜𝑟𝑚𝑎𝑙𝑎 𝑎 𝑙𝑢𝑖 𝐺𝑎𝑢𝑠𝑠 (𝑚𝑒𝑧𝑜𝑘𝑢𝑟𝑖𝑡𝑐ă)
-𝛽4 > 3 => 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢ț𝑖𝑒 𝑙𝑒𝑝𝑡𝑜𝑘𝑢𝑟𝑡𝑖𝑐ă (î𝑛𝑎𝑙𝑡ă ș𝑖 𝑎𝑠𝑐𝑢ț𝑖𝑡ă)
- 𝛽4 < 3 => 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢ț𝑖𝑒 𝑝𝑙𝑎𝑡𝑖𝑘𝑢𝑟𝑡𝑖𝑐ă (𝑗𝑜𝑎𝑠ă ș𝑖 𝑎𝑝𝑙𝑎𝑡𝑖𝑧𝑎𝑡ă)
Notă: Dacă scădem 3 din rezultat avem comparație în funcție de 0.

Obs: Pentru coeficienții lui Fisher avem de calculat momentele centrate de ordinul 3
respectiv 4.

𝑥1 𝑥2 … 𝑥𝑅
𝐹𝑖𝑒 𝑋: (𝑁 𝑁2 … 𝑁𝑅 ) , 𝑁
1

𝑥1 ∙ 𝑁1 + 𝑥2 ∙ 𝑁2 + ⋯ 𝑥𝑅 ∙ 𝑁𝑅
𝑥̅ =
𝑁

𝑥1 − 𝑥̅ 𝑥2 − 𝑥̅ … 𝑥𝑅 − 𝑥̅
𝑥 − 𝑥:
̅( ),𝑁
𝑁1 𝑁2 … 𝑁𝑅

(𝑥 − 𝑥̅ )𝑝 (𝑥2 − 𝑥̅ )𝑝 … (𝑥𝑅 − 𝑥̅ )𝑝
(𝑥 − 𝑥̅ )𝑝 : ( 1 ),𝑁
𝑁1 𝑁2 … 𝑁𝑅

∑(𝑥𝑖 − 𝑥̅ )𝑝 ∙ 𝑁𝑖
𝑀[(𝑥 − 𝑥̅ )𝑝 ] =
𝑁

6
Ex.1: Fie distribuția farmaciilor dintr-un oraș în raport cu cifra de afaceri (CA) în mii euro.
2 4 7 9
𝑋: ( ) , 𝑁 = 47
11 24 5 7
Calculați și interpretați coeficienții de asimetrie și boltire a lui Fisher și Pearson.
Rezolvare:
𝑥̅ − 𝑀𝑜
𝛼= = 0.26 > 0 (𝑎𝑠𝑖𝑚𝑖𝑡𝑒𝑟𝑖𝑒 𝑝𝑜𝑧𝑖𝑡𝑖𝑣ă)
𝜎𝑥
𝑥̅ = 4.59
𝑀𝑜 = 4
𝜎𝑥 = 2.29

𝑀[(𝑥 − 𝑥̅ )3 ]
𝛼3 = = 0.83 > 0 (𝑎𝑠𝑚𝑒𝑡𝑟𝑖𝑒 𝑝𝑜𝑧𝑖𝑡𝑖𝑣ă)
𝜎𝑥3
𝑀[(𝑥 − 𝑥̅ )3 ] = 9.93
𝜎𝑥3 = 12

𝑀[(𝑥 − 𝑥̅ )4 ]
𝛽4 = = 2.55 < 3 (𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢ț𝑖𝑒 𝑝𝑙𝑎𝑡𝑖𝑘𝑢𝑟𝑡𝑖𝑐ă)
𝜎𝑥4
𝑀[(𝑥 − 𝑥̅ )4 ] = 70.11
𝜎𝑥4 = 27.5

Ex.2: In urma unui control efectuat la mai multe restaurante din tara privind calitatea
preparatelor si a bauturilor oferite, au fost acordate note la 1 la 10 pentru fiecare restaurant.
Rezultatele au fost urmatoarele: 8, 7, 8, 9, 6, 5, 6, 7, 8, 7, 8, 9, 7 6, 10.
Calculați și interpretați parametrii formei distributiei restaurantelor in raport cu notele
obtinute.
5 6 7 8 9 10
𝑋: ( ) , 𝑁 = 15
1 3 4 4 2 1
Rezolvare:
𝑥̅ − 𝑀𝑜 7.4 − 7
𝛼= = = 0.30
𝜎𝑥 1.3

7
𝑥̅ − 𝑀𝑜 7.4 − 8
𝛼= = = −0.46
𝜎𝑥 1.3
Notă: Se observă că distribuția are două modale (7 respectiv 8). Astfel, calculând coeficientul
lui Pearson pentru fiecare valoare modală observăm că obținem rezultate contradictorii.
Prin urmare, pentru a avea un rezultat concludent, în momentul în care avem mai mult de o
modală utilizăm pentru asimetrie doar coeficientul lui Fisher (formula acestuia nu necesită
cunoașterea valorii modale).

5 ∙ 1 + 6 ∙ 3 + 7 ∙ 4 + 8 ∙ 4 + 9 ∙ 2 + 10 ∙ 1
𝑥̅ = = 7.4
15
𝑀𝑜 = 7 𝑠𝑖 8
∑(𝑥𝑖 − 𝑥̅ )2 ∙ 𝑁𝑖
𝜎𝑥2=
𝑁
(5 − 7.4)2 ∙ 1 + (6 − 7.4)2 ∙ 3 + (7 − 7.4)2 ∙ 4 + (8 − 7.4)2 ∙ 4 + (9 − 7.4)2 ∙ 2 + (10 − 7.4)2 ∙ 1
=
15
= 1.7

𝜎𝑥 = √𝜎𝑥2 = √1.7 = 1.3

𝑀[(𝑥 − 𝑥̅ )3 ]
𝛼3 = = 0.13
𝜎𝑥3
∑(𝑥𝑖 − 𝑥̅ )𝑝 ∙ 𝑁𝑖
𝑀[(𝑥 − 𝑥̅ )3 ] =
𝑁
(5 − 7.4)3 ∙ 1 + (6 − 7.4)3 ∙ 3 + (7 − 7.4)3 ∙ 4 + (8 − 7.4)3 ∙ 4 + (9 − 7.4)3 ∙ 2 + (10 − 7.4)3 ∙ 1
=
15
= 0.29

𝜎𝑥3 = 1.33 = 2.19

𝑀[(𝑥 − 𝑥̅ )4 ]
𝛽4 = = 2.43
𝜎𝑥4
𝑀[(𝑥 − 𝑥̅ )4 ] =
(5 − 7.4)4 ∙ 1 + (6 − 7.4)4 ∙ 3 + (7 − 7.4)4 ∙ 4 + (8 − 7.4)4 ∙ 4 + (9 − 7.4)4 ∙ 2 + (10 − 7.4)4 ∙ 1
=
15
= 6.94
𝜎𝑥4 = 1.34 = 2.84

8
Ex.3: Se știe că pentru o distribuție aproximativ simetrică, abaterea interquartilică
reprezintă 2/3 din abaterea medie pătratică. Dacă 50% din valori sunt cuprinse în intervalul
15-17.5, modala este de 18, iar coeficientul de variație a lui Pearson este 10.3% care este
valoarea coeficientului de asimetrie a lui Pearson?
Rezolvare:
2
𝑄 = 𝜎𝑥
3
𝑞3 − 𝑞1 17.5 − 15
𝑄= = = 1.25
2 2
𝑞1 = 15
𝑞3 = 17.5
2
1.25 = 𝜎𝑥
3
𝜎𝑥 = 1.875
𝜎𝑥
𝐶𝑉𝑋 = ∙ 100% = 10.3%
𝑥̅
1.875
𝑥̅ = = 18.2
0.103
𝑀𝑜 = 18
𝑥̅ − 𝑀𝑜 18.2 − 18
𝛼= = = 0.1066
𝜎𝑥 1.875

Extra. Fie distributia unor firme in raport cu profitul obtinut (mii euro).
[2, 4) [4, 6) [6, 8) [8, 10]
𝑋: ( ),𝑁 =
11 24 21 5

Calculati si interpretati coeficientii de asimetrie si boltire ai lui Fisher.


Rezolvare:

9
E. Parametrii concentrării

- sunt specifici seriilor calitative


- ne arată gradul de concentrare al unităților statistice

1. Energie informațională

𝑥1 𝑥2 … 𝑥𝑅
Fie X: ( 𝑓 𝑓2 … 𝑓𝑅 ) , 100%
1
𝑘

𝐸 = ∑ 𝑓𝑖2
𝑖=1

- pentru interpretări se calculează energia relativă


𝐸 − 𝐸𝑚𝑖𝑛
𝐸𝑟 = ∈ [0, 1]
𝐸𝑚𝑎𝑥− 𝐸𝑚𝑖𝑛
unde:
𝐸𝑚𝑎𝑥 = 1
1
𝐸𝑚𝑖𝑛 = (𝑅 − 𝑛𝑢𝑚ă𝑟𝑢𝑙 𝑑𝑒 𝑔𝑟𝑢𝑝𝑒)
𝑅

Interpretări: 𝐸𝑟 se apropie de 0 (𝐸𝑟 → 0) => concentrare minimă


𝐸𝑟 se apropie de 1 (𝐸𝑟 → 1) => concentrare maximă

Ex.1: Se consideră distribuția firmelor de transport călători în funcție de forma de


proprietate:
𝑝𝑢𝑏𝑙𝑖𝑐ă 𝑝𝑟𝑖𝑣𝑎𝑡ă 𝑚𝑖𝑥𝑡ă
𝑋: ( ) , 𝑁 = 41
3 10 28
Analizați gradul de concentrare a firmelor în raport cu forma de proprietate.

10
Rezolvare:

3 2 10 2 28 2
𝐸 = ( ) + ( ) + ( ) = 0.53
41 41 41
1
𝐸𝑚𝑖𝑛 = = 0. (33)
3
𝐸𝑚𝑎𝑥 = 1
0.53 − 0.33
𝐸𝑟 = = 0.29 ≈ 0.3 → 0
1 − 0.33
=> 𝑐𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑟𝑒 𝑚𝑖𝑛𝑖𝑚𝑎 𝑎 𝑓𝑖𝑟𝑚𝑒𝑙𝑜𝑟 î𝑛 𝑟𝑎𝑝𝑜𝑟𝑡 𝑐𝑢 𝑓𝑜𝑟𝑚𝑎 𝑑𝑒 𝑝𝑟𝑜𝑝𝑟𝑖𝑒𝑡𝑎𝑡𝑒.

Ex.2: Caracterizati gradul de concentrare cunoscand repartitia apartamentelor dintr-un


complex de locuinte dupa tipul lor:
garsoniere: 50;
apartamente cu 1 camera: 79;
apartament cu 2 camere: 150;
apartament cu 3 camere: 100;
apartamente cu 4 camere: 71;
apartamenet cu 5 camere: 20.

Analizați gradul de concentrare a firmelor în raport cu forma de proprietate.


Rezolvare:
𝑔𝑎𝑟𝑠 𝑎𝑝𝑡 1 𝑎𝑝𝑡 2 𝑎𝑝𝑡 3 𝑎𝑝𝑡 4 𝑎𝑝𝑡 5
𝑋: ( ) , 𝑁 = 470
50 79 150 100 71 20

50 2 79 2 150 2 100 2 71 2 20 2
𝐸=( ) +( ) +( ) +( ) +( ) +( ) = 0.19
470 470 470 470 470 470
1
𝐸𝑚𝑖𝑛 = = 0.16
6
𝐸𝑚𝑎𝑥 = 1
0.19 − 0.16
𝐸𝑟 = = 0.03
1 − 0.16
=> 𝑐𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑟𝑒 𝑚𝑖𝑛𝑖𝑚𝑎 𝑎 𝑎𝑝𝑟𝑡𝑎𝑚𝑒𝑛𝑡𝑒𝑙𝑜𝑟 𝑖𝑛 𝑓𝑢𝑛𝑐𝑡𝑖𝑒 𝑑𝑒 𝑡𝑖𝑝𝑢𝑙 𝑙𝑜𝑟.

11
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.

Statistică Descriptivă—Seminar I

Ce întelegeți prin statistică? La ce vă gândiți când auziți acest cuvânt?


.....
Obiectivul/scopul statisticii:
(i) analiza cantitativă a fenomenelor de masa=delimitarea/dezvăluirea unor
particularități.
(ii) în economie: identificarea unor legități (regularități) ce guvernează mediul
economic respectiv comportamentul agenților economici.
Ex: structura populației pe vârste; nivelul de studiu ; putem depista conexiuni/legături între
nivelul de trai și structura populației pe nivelul de studiu ; modelarea unor indicatori la nivel
micro-/macro-economic; previziune; finanțe (analiza financiară; dinamica evoluția unui
curs); management (decizii în condiții de risc); asigurări (calcule actuariale); marketing
(studii de piață); medicină; sociologie; psihologie; astronomie; inginerie; seismologie;
printre multe altele.

Etapele analizei statistice: observarea*; colectarea; organizarea; sumarizarea; descrierea


datelor -> scopul de a obține informații—STATISTICA DESCRIPTIVĂ (aceasta o abordăm
semestrul acesta).

extinderea rezultatelor pe întreaga populație; efectuarea de prognoze—


STATISTICA INFERENȚIALĂ (următoarea etapă după statistica descriptivă) .
*observarea statistică=identificarea unităților populației și înregistrarea stărilor variabilelor
în raport cu care este studiată – ansamblul stărilor variabilelor – statistici.
-observarea totală (ex: recensământul)
-observarea parțială (eșantion**)

1
**eșantion: la alegrea acestuia este important să se țină cont de reprezentativitate -> obținem
informații/statistici -> prin reorganizarea sistematizarea datelor obtinem seriile statistice
pe care le prelucrăm cu anumite metode de analiză statistică -> legități statistice.

Noțiuni de bază:
 Populație statistică: colecție de elemente de aceiași natură, care împărtășesc una sau
mai multe însușiri esențiale comune (ex: mulțimea consumatorilor unui produs; etc.)

 Unitatea statistică: elementul component al populației statistice, asupra căreia se va


efectua observarea.

 Volumul populației: nr. de unități statistice care alcătuiesc populația statistică (N).

 Eșantion: submulțime a unei populații statistice, construită după criterii bine stabilite
(ex: printr-un procedeu aleator) (volum eșantion: n).

 Variabila statistică: Trăsătură comună a tuturor unităților statistice a unei populații


(X, Y, Z, .....).

 Realizare (stare) a variabilei: nivelul înregistrat de variabilă la o unitate oarecare a


populației (X: 𝑥1 , 𝑥2 , 𝑥3 , .....).

Exemple:
(i) Pop. stat: mulțimea angajaților supermarketurilor din CJ
Unitatea stat: un angajat/angajatul
Eșantion: submulțimea angajaților care au vârsta între 20 și 30 de ani
submulțimea angajațior care sunt de sex feminin
Variabila stat: vârsta; sexul; nivelul de studii; vechime în muncă; culoarea părului;
înălțime; greutate; nr. de copii; stilul vestimentar; anul nașterii; locul nașterii;
statutul familial; religia; nivelul ierarhic (funcția).
Stare a var: vârsta (adolescenți, adulți, vârstnici)/(20, 30, 40, 50)/(20-30, 30-40,
40-50); sexul (m, f, a); nivelul de studii (gimnaziale, liceale, universitare, post-
universitare); vechime în muncă (0-5, 5-10, 10-15); culoarea părului (blond,
șaten, brunet, roșcat); înălțime (mică, medie, mare)/(150-160, 160-170, 170-
180)/(150, 160, 170, 180); greutate (mică, medie, mare)/(40-50, 50-60, 60-
70)/(50, 60, 70, 80); nr de copii (0-3, 3-6, 6-9)/(0, 2, 4, 6); stilul vestimantar
(casual, office); anul nașterii (1975, 1980, 1996); locul nașterii (CJ, Alba,
Constanța, Bistrița, Arad); statutul familial (singur/ă, logodit/ă, căsătorit/ă,
divorțat/ă); religia (ortodox, catolic, budist, reformat, penticostal, ateu); funcția
(lucrător comercial, șef de raion, manager de raion, manager general).

2
(ii) Pop. stat: mulțimea aparatelor electrocasnice din supermarketurile din CJ
Unitatea stat: un aparat electrocasnic
Eșantion: submulțimea aparatelor electrocasnice din supermarketurile din CJ
care au prețul sub 1000euro;
submulțimea aparatelor electrocasnice din supermarketurile din CJ
care au consumul de energie peste 300w.
Variabila stat: culoare; greutate; dimensiune, garanție, material, anul fabricației,
locul fabricației, marca, design, funcționalitate, model, accesorii.
Stare a var: culoare (alb, negru, gri); greutate (mică, normală/standard, mare)/(1,
5, 10)/(0-3, 3-6, 6-9); dimensiune (mică, normală, mare)/(0-30cm, 30-50cm, 50-
100cm)/(10, 30, 60, 90); garanție (1, 3, 5)/(standard, extra/extinsă); material
(inox, plastic, aluminiu, oțel, mixt); anul fabricației (2000, 2010, 2020); locul
fabricației (Asia, Europa, America, Africa, Antarctica); marca (samsung, zanussi,
phillips, acer); design (clasic/tradițional, modern, personalizat); funcționalitate
[durată de viață] (unifuncțional, multifuncțional)/(scurtă, medie, îndelungată);
model (simplu, personalizat, standard, inovativ); accesorii (fără accesorii, cu
accesorii)/(0-2, 2-4, 4-6, 6-10).

(iii) Pop. stat: mulțimea clienților clinicii Regina Maria


Unitatea stat: un client/clientul
Eșantion: submulțimea clienților clinicii RM care sunt programați pentru un
control
Variabila stat: afecțiunea; sexul; vârsta; înălțimea; culoare ochilor; nr. de copii;
data programării; statutul social; religia; locul de proveniență; anul nașterii;
greutatea; nivelul de studii; culoare părului; etc.
Stare a var: afecțiunea (răceală, migrenă, dureri articulare, covid); sexul (M, F, A);
vârsta (minori, tineri, adulți, vârstnici)/(sub 18, 18-24, 24-60, peste 60)/ (10, 15,
20, 25); înălțimea (mică, medie, mare)/(sub 160cm, 160-180, peste 180)/(140,
160 180); culoare ochilor (verzi, căprui, albaștri, negri); nr. de copii (0, 5,
10);/(fără copii, cu copii);/(0-3, 3-5, 5-8); data programării (12.10.2010;
20.11.2010; 18.12.2010); statutul social (student, angajat, șomer, pensionar);
religia (ortodox, baptist, catolic, budist, musulman, reformat); mediul de
proveniență (rural, urban)/(CJ, Alba, Arad, Sălaj, Constanța); anul nașterii (1975,
1982, 1998, 2000); greutatea (anorexic, subponderal, ponderat, supraponderal,
obez); (50, 60, 70, 80); (40-50, 50-60, 60-70); nivlul de studii (gimnaziale, liceale,
universitare, post-universitare); culoare părului (blond, brunet, șaten, roșcat).

3
Clasificarea variabilelor:

A. după natura
lor

(1) atributive (2) de timp (3) de spațiu

B. modul de
exprimare a
stărilor

(i) cantitative (ii) calitative

C. modul de
nominale ordinale
variație

continue discrete

Scurte explicații
(1) atributive Exprimă un atribut a unităților statistice; nici de spațiu, nici de timp.
(2) de timp Ne arată timpul/perioada în care există unitățile statistice.
(3) de spațiu Ne arată locul/spațiul unde se află unitățile statistice.
(i) cantitative Stările se exprimă prin valori numerice.
continue Pot lua orice valoare reală în intervalul de variație—proces de măsurare.
discrete Nr. finit de valori, intervalul de definiție înregistrează cel mult valori
raționale, variația are loc în salturi—proces de numărare.
(ii) calitative Stările se exprimă prin cuvinte/coduri.
nominale Nu avem o ordine logică în stări.
ordinale Avem o ordine logică în stări.

*Variabila aleatoare este variabila care poate lua orice valoare din valorile unei mulţimi
finite sau infinite, cu o anumită probabilitate, rezultată dintr-o funcţie asociată variabilei,
numit lege de probabilitate. Ca şi variabila statistică, variabila aleatoare în raport cu valorile
sale poate fi discretă sau continuă.

4
Seria statistică: construcție ce redă fie distribuția unui populații în raport cu una sau mai
multe variabile, fie variația unei mărimi în timp, spațiu, sau de la o categorie la alta.
- Nr. variabilelor: unidimensională; multidimensională (noi vom lucra ce cel mult
bidimensională).
- După natura lor: atributive; cronologice (timp sau istorice); de spațiu (teritoriale)
- Modul de exprimare a stărilor variabilelor: calitative; cantitative.
- Natura indicatorului: de frecvență sau serii de distribuție (repartiție); serii de
variație.

5
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.

Statistică Descriptivă—Seminar II

Seria de repartiție – frecvențe:


Fie o serie statistică unidimensională având la bază variabila X.
𝑥1 𝑥2 … 𝑥𝑖 … 𝑥𝑅
X: (𝑁 𝑁 … 𝑁 … 𝑁 ), i=1, ̅̅̅̅̅
𝑅
1 2 𝑖 𝑅

𝑁𝑖 – nr. de unități ale pop. din clasa i, pentru care variabila X a înregistrat valoarea 𝑥𝑖 .

Pe baza seriei cu frecvențe absolute construim:


(i) Seria X formată cu frecvețe relative simple
𝑥1 𝑥2 … 𝑥𝑖 … 𝑥𝑅
X: ( 𝑓 𝑓2 … 𝑓𝑖 … 𝑓𝑅 )
1

𝑓𝑖 – ponderea unităților din pop. care au înregistrat pentru variabila X starea 𝑥𝑖 .


𝑁𝑖 𝑁𝑖
𝑓𝑖 = ̅̅̅̅̅
, i=1, 𝑅 sau 𝑓𝑖 = ̅̅̅̅̅
x 100, i=1, 𝑅 sau ∑𝑅𝑖=1 𝑓𝑖 = 1 (100%).
𝑁 𝑁

(ii) Seria X cu frecvențe absolute cumulate

𝑥1 𝑥2 … 𝑥𝑖 … 𝑥𝑅
X: (𝑁 𝑁𝑥2 … 𝑁𝑥𝑖 … 𝑁𝑥𝑅 )
𝑥1

𝑁𝑥𝑖 = 𝑁1 + 𝑁2 + ⋯ . +𝑁𝑖
𝑁𝑥𝑖 - numărul de unități din populația studiată pentru care variabila înregistrează valori ce
nu depășesc valoarea 𝑥𝑖 .

1
(iii) Seria cu frecvențe relative cumulate

𝑥1 𝑥2 … 𝑥𝑖 … 𝑥𝑅
X: (𝐹 (𝑥 ) 𝐹 (𝑥 ) … 𝐹 (𝑥 ) … 𝐹𝑁 (𝑥𝑅 ))
𝑁 1 𝑁 2 𝑁 𝑖

𝐹𝑁 (𝑥𝑖 ) = 𝑓1 + 𝑓2 + ⋯ + 𝑓𝑖
𝑁𝑥𝑖
𝐹𝑁 (𝑥𝑖 ) = ̅̅̅̅̅
( x 100), i=1, 𝑅
𝑁

𝐹𝑁 (𝑥𝑖 ) – ponderea unității populației studiate pentru care variabila a înregistrat valori ce nu
depășesc valoarea 𝑥𝑖 .

Listă de observații: Notele la statistică a 10 studenți au fost următoarele: 10; 7; 8; 8; 5; 4; 6;


9; 9; 6.
4 5 6 7 8 9 10
X: ( ), N=10
1 1 2 1 2 2 1
[frecvențe absolute simple]
Probleme
(1) Se consideră repartiția clienților unei companii de asigurări în funcție de gradul de
satisfacție privind serviciile de asigurare oferite.
𝑛𝑒𝑠𝑎𝑡𝑖𝑠𝑓ă𝑐𝑢ț𝑖 𝑠𝑎𝑡𝑖𝑠𝑓ă𝑐𝑢ț𝑖 𝑓. 𝑠𝑎𝑡𝑖𝑠𝑓ă𝑐𝑢ț𝑖
X: ( ), N=50
8 27 15
[frecvențe absolute simple]
a.) Precizați tipul variabilei statistice X.
b.) Construiți seria de distribuție formată cu frecvențe relative simple.
c.) Cât la sută din clienți se declară cel mult satisfăcuți de serviciile de asigurare oferite?
Rezolvare:
a.) X=atributiva, calitativa, ordinala

b.) Seria cu frecvențe relative simple

𝑛𝑒𝑠𝑎𝑡𝑖𝑠𝑓ă𝑐𝑢ț𝑖 𝑠𝑎𝑡𝑖𝑠𝑓ă𝑐𝑢ț𝑖 𝑓. 𝑠𝑎𝑡𝑖𝑠𝑓ă𝑐𝑢ț𝑖


X: ( ) , 100% [frecvențe relative simple]
16% 54% 30%

𝑁1 8
𝑓1 = = × 100 = 16%
𝑁 50
𝑁2 27
𝑓2 = = × 100 = 54%
𝑁 50

2
𝑁3 15
𝑓3 = = × 100 = 30%
𝑁 50

c.) Cel mult satisfăcuți= nesati.+sati.=16%+54%=70%

(2) În urma unui sondaj efectuat în rândul angajaților (N=200) supermarketurilor din CJ s-
au obținut următoarele rezultate privind nivelul de studiu al acestora:

𝑔𝑖𝑚𝑛𝑎𝑧𝑖𝑎𝑙𝑒 𝑙𝑖𝑐𝑒𝑎𝑙𝑒 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑡𝑎𝑟𝑒 𝑝𝑜𝑠𝑡 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑡𝑎𝑟𝑒


X: ( )
45% 67% 81% 100%
[frecvențe relative cumulate]

a.) Precizați populația statistică, volumul acesteia, respectiv unitatea statistică.


b.) Care este nivelul de studiu absolvit de cei mai mulți dintre angajații
supermarketurilor?

Rezolvare:
a.) Pop. statistică: multimea angajatilor supermarketurilor din CJ
Vol. Pop: N=200
Unitatea stat: un angajat

b.)
𝑔𝑖𝑚𝑛𝑎𝑧𝑖𝑎𝑙𝑒 𝑙𝑖𝑐𝑒𝑎𝑙𝑒 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑡𝑎𝑟𝑒 𝑝𝑜𝑠𝑡 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑡𝑎𝑟𝑒
X: ( ) , 100%
45% 22% 14% 19%
[frecvențe relative simple]
f1=45%
f1+f2=67% =>f2=22%
f1+f2+f3=81% =>f3=14%
f1+f2+f3+f4=100% =>f4=19%

𝑔𝑖𝑚𝑛𝑎𝑧𝑖𝑎𝑙𝑒 𝑙𝑖𝑐𝑒𝑎𝑙𝑒 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑡𝑎𝑟𝑒 𝑝𝑜𝑠𝑡 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑡𝑎𝑟𝑒


X: ( ) , 𝑁 = 200
90 44 28 38
[frecvențe absolute simple]
𝑁1 1 𝑁
𝑓1 = => 0.45 = 200 => 𝑁1 = 90;
𝑁

N2=44;
N3=28;
N4=38.

3
(3) Repartiția angajaților unei societăți comerciale în funcție de salariul lunar este:
Salar lunar (sute euro) Nr. angajați
2-4 34
4-6 43
6-8 51
8-10 28
10-12 13

a.) Precizați caracteristicile variabilei salar lunar.


b.) Construiți seria statistică de distribuție cu frecvențe absolute cumulate respectiv
frecvențe relative cumulate.
Rezolvare:
a.) X – salar lunar: atributiva, cantitativa, continua.
b.)
2 − 4 4 − 6 6 − 8 8 − 10 10 − 12
X: ( ) [frecvențe absolute cumulate]
34 77 128 156 169

2−4 4−6 6−8 8 − 10 10 − 12


X: ( ) [frecvențe relative simple]
20.11% 25.44% 30.17% 16.56% 7.69%

2−4 4−6 6−8 8 − 10 10 − 12


X: ( ) [frecvențe relative cumulate]
20.11% 45.55% 75.72% 92.28% 100%

(4) Într-un județ din România există 200 de IMM-uri a căror distribuție în funcție de profitul
înregistrat anul trecut este redată de graficul de mai jos

4500ϵ 2000ϵ

?% 15%

5000ϵ 11%
4000ϵ
18%

36%

3500ϵ

4
a.) Construiți seriile de distribuție cu frecvențe derivate, care indică repartiția IMM-
urilor în raport cu profitul înregistrat în anul trecut.
Rezolvare:
2000 3500 4000 4500 5000
X: ( ) , 100% [frecvențe relative simple]
15% 36% 18% 20% 11%
Frecventa lipsa=100%-(15%+36%+18%+11%)=100%-80%=20%

2000 3500 4000 4500 5000


X: ( )
15% 36% + 15% = 51% 18% + 51% = 69% 20% + 69% = 89% 100%
[frecvențe relative cumulate]

2000 3500 4000 4500 5000


X: ( ), N=200 [frecvențe absolute simple]
30 72 36 40 22

2000 3500 4000 4500 5000


X: ( ) [frecvențe absolute cumulate]
30 102 138 178 200

(5) Profitul (mii ϵ) înregistrat anul trecut de câteva companii di IT din Cluj-Napoca a fost:
150; 200; 175; 150; 165; 200; 175; 175; 150; 200; 200; 175; 200; 200.
a.) Precizați populația statistică, unitatea statistică, respectiv volumul populației
statistice.
b.) Construiți seria de distribuție cu frecvențe absolute care indică repartiția companiilor
IT în raport cu profitul obținut.
c.) Caracterizați variabila de la baza seriei obținute la b.).
d.) Construiți seria de distribuție cu frecvențe relative.
Rezolvare:
a.) Populația statistică:
Unitatea statistică:
Volumul pop. statistice:

b.)
X: ( )
c.) X=

d.)

5
X: ( )

(6) La un service auto, în decursul a trei săptămâni, numărul autoturismelor reparate/pe zi


a fost: 3; 4; 2; 5; 3; 5; 2; 4; 4; 4; 5; 2; 4; 2; 4.
a.) Construiți seria de distribuție cu frecvențe absolute care indică repartiția mașinilor
reparate în total pe zilele lucrătoare ale unei săptămâni.
Rezolvare:
a.)
Luni Marți Miercuri Joi Vineri
Săptămâna 1 3 4 2 5 3
Săptămâna 2 5 2 4 4 4
Săptămâna 3 5 2 4 2 4
Total 13 8 10 11 11

𝐿 𝑀 𝑀 𝐽 𝑉
X: ( ), N=53
13 8 10 11 11

(7) La o stație meteo, s-au înregistrat de-a lungul mai multor zile consecutive de vară
următoarele temperaturi medii (grade Celsius): 25; 30; 27; 28; 29; 29; 30; 31; 25; 29; 28; 29;
28; 28; 30; 31.
a.) Precizați pop. statistică, unitatea stat., respectiv volumul pop.
b.) Construiți seria de distribuție a zilelor analizate în raport cu temeperaturile medii
înregistrate și precizați caracteristicile variabilei ce stă la baza seriei.
c.) Cât la sută din zilele analizate depășesc temperatura de 30 grade C?
Rezolvare:
a.) Pop. stat: multimea zilelor de vara analizate
Unit. stat: o zi
Volumul pop. stat.: N=16

b.)
25 27 28 29 30 31
X: ( ), N=16
2 1 4 4 3 2
Var. X=atributiva, cantitativa, discreta.

c.) Procentul zilelor cu temperatura mai mare de 30 grade C este:


2
× 100 = 12.5%
16

6
(8) Numărul telefoanelor mobile vândute de magazinul Orange în decursul unei săptămâni
a fost: 10; 7; 9; 11; 7; 7; 8; 10; 11; 10; 9; 8; 8; 8; 7; 10; 11; 9.
a.) Precizați pop. statistică, unitatea stat., respectiv volumul pop.
b.) Construiți seria de distribuție cu frecvențe derivate care indică repartiția magazinelor
Orange în raport cu numărul de telefoane vândute.
Rezolvare:
9) În urma unei lucrări de control, la o grupă de studenți, s-au obținut următoarele rezultate:
Prenume Nota
Ana 8
Angela 9
Bianca 7
Bogdan 5
Camelia 10
Cosmin 9
Dan 6
Emil 8
Florin 6
Gabriel 7

a.) Construiți seria statistică de distribuție pentru variabila statistică X, care indică nota
obținută la lucrare. Precizați caracteristicile variabilei X și volumul populației
statistice.
b.) Construiți seriile de distribuție cu frecvențe derivate.
Rezolvare:
a.)
5 6 7 8 9 10
X: ( ) , 𝑁 = 10 [frecvențe absolute simple]
1 2 2 2 2 1
Var. X=atributiva, cantitativa, discreta.
b.)
5 6 7 8 9 10
X: ( ) , 𝑁 = 10 [frecvențe absolute cumulate]
1 3 5 7 9 10

5 6 7 8 9 10
X: ( ) , 100% [frecvențe relative simple]
10% 20% 20% 20% 20% 10%

5 6 7 8 9 10
X: ( ) [frecvențe relative cumulate]
10% 30% 50% 70% 90% 100%

7
Serii bidimensionale: au la bază două variabile statistice (de ex. X și Y)

8
Probleme
(1) Se consideră repartiția studenților în funcție de variabilele X=județul de proveniență
respectiv Y=nota la examenul de admitere.
Y\X CJ BH AB Total
10 7
7 [90 × 100 = 7.77%] 3 [3.33%] 10 [11.11%] 20 [22.22%]
9 5 [5.55%] 19 [21.11%] 6 [6.66%] 30 [33.33%]
8 10 [11.11%] 8 [8.88%] 12 [13.33%] 30 [33.33%]
7 2 [2.22%] 5 [5.55%] 3 [3.33%] 10 [11.11%]
Total 24 [26.66%] 35 [38.88%] 31 [34.44%] N=90 [100%]

a.) Construiți seria bidimensională formată cu frecvențe relative.


b.) Extrageți toate seriile unidimensionale.
c.) Pentru seriile marginale și două serii condiționate la alegere, construiți seriile cu
frecvențe derivate.
d.) Câți studenți clujeni au luat cel mult nota 8 la examenul de admitere?
e.) Caracterizați variabila de la baza seriei: X/Y=10.
Rezolvare:
a.) frecvențele relative se găsesc în paranteza pătrata din tabel.
b.)
serii marginale:
𝐶𝐽 𝐵𝐻 𝐴𝐵
X: ( ), N=90
24 35 31
7 8 9 10
Y: ( ), N=90
10 30 30 20
serii condiționate:
𝐶𝐽 𝐵𝐻 𝐴𝐵 𝐶𝐽 𝐵𝐻 𝐴𝐵
X/Y=7: ( ) , 𝑁 = 10; X/Y=8: ( ) , 𝑁 =30;
2 5 3 10 8 12
𝐶𝐽 𝐵𝐻 𝐴𝐵 𝐶𝐽 𝐵𝐻 𝐴𝐵
X/Y=9: ( ) , 𝑁 = 30; X/Y=10: ( ) , 𝑁 = 20.
5 19 6 7 3 10

7 8 9 10
Y/X=CJ: ( ) , 𝑁 = 24;
2 10 5 7
9
7 8 9 10
Y/X=BH: ( ) , 𝑁 = 35;
5 8 19 3
7 8 9 10
Y/X=AB: ( ) , 𝑁 = 31
3 12 6 10
c.) de făcut acasă.

d.)
𝟕 𝟖 9 10
Y/X=CJ: ( ) , 𝑁 = 24;
𝟐 𝟏𝟎 5 7
2+10=12 studenți clujeni au luat cel mult nota 8 la examenul de admitere
e.)
𝐶𝐽 𝐵𝐻 𝐴𝐵
X/Y=10: ( ) , 𝑁 = 20
7 3 10
Var stat. de spațiu.

(2) Într-un dispensar medical, pe un eșantion de 100 de pacienți, s-au înregistrat înălțimea
și greutatea acestora.
greutate (kg) \înălțimea (m) [1.5; 1.7) [1.7; 1.9) >1.9 Total
[50-75) 21 [21%] a=24 [24%] b=12 [12%] 57 [57%]
>75 c=22 [22%] 15 [15%] d=6 [6%] e=43 [43%]
Total e=43 [43%] 39 [39%] 18 [18%] N=100 [100%]

a.) Găsiți valorile parametrilor necunoscuți.


b.) Construiți seria bidiomensională cu frecvențe relative.
c.) Cât la sută dintre pacienți au înălțimea de cel mult 1.9m și greutatea de cel mult 75kg?
Rezolvare:
a.) a+15=39=>a=24; 21+24+b=57=>b=12; 12+d=18=> d=6;
57+e=100=> e=43; 21+c=43=> c=22.
b.) frecvențele relative se găsesc în paranteza pătrata din tabel.
c.) 21%+24%=45% din pacienți au înălțimea de cel mult 1.9m și greutatea de cel mult 75kg.

10
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.

Statistică Descriptivă—Seminar III

Reprezentări grafice

1. Histograma – variabile cantitative continue (serii cantitative continue)


- sistemul xOy.
- pe Ox: intervalele de variație – bazele dreptunghiurilor.
- pe Oy: înălțimile dreptunghiurilor (ℎ𝑖 ).
ℎ𝑖 ∙ 𝑙𝑖 = 𝑘 ∙ 𝑁𝑖

2. Poligonul frecvențelor – variabile atributive cantitative continue (serii cantitative


continue)
Notă: În cazul în care toate intervalele de variație sunt de lunimi egale, poligonul frecvențelor
se poate obține din HISTOGRAMĂ unind prin segmente de dreaptă mijlocul laturilor
superioare ae dreptunghiurilor consecutive.

3. Diagrame prin benzi și coloane (barchart)


- variabile cantitative discrete (serii cantitative discrete)
- variabile calitative
Notă: Sunt formate din dreptunghiuri de lățimi egale dar separate (orizontal/vertical).
Înălțimea benzilor este direct proporțională cu frecvenșa absolută a clasei corespunzătoare.
ℎ𝑖 = 𝑘 ∙ 𝑁𝑖

1
4. Cercul de structură
- recomandat pentru variabile nominale, deși se poate utiliza pentru orice serie de distribuție
undimensională.
- suprafața lui reprezintă volumul întregii populații analizate (frecvențe absolute sau
relative).
- fiecare clasă în care este divizată populația supusă studiului este reprezentată prinr-un
sector de cerc de arie direct proporțională cu volumul clasei – determinarea măsurii în grade
a unghiurilor la centru a fiecărui sector – unghiul la centru corespunde volumului întregii
populații.
360° 360°
𝜇𝑖 = 𝑓𝑖 (%) ∙ = 𝑁𝑖 ∙
100% 𝑁

5. Cronograma
- variabile cronologice (serii de timp/cronologice).

6. Cartograma și cartodiagrama
- variabile spațiale (serii de spațiu/teritoriale).

7. Norul de puncte și diagrama prin benzi duble


- legătura dintre două variabile.
(i) cantitative (norul de puncte).
(ii) calitative (diagrama prin benzi).

2
Probleme
(1) Veniturile și cheltuielile înregistrate de mai multe magazine alimentare dintr-un oraș, în
decursul unui trimestu, au fost:
X=venituri 25, 10, 36, 42, 50, 75, 63, 90, 132, 145. u.m.
Y=cheltuieli 3, 4, 7, 8, 2, 3, 5, 6, 2, 8. u.m.
Z=profit 22, 6, 29, 34, 48, 72, 58, 84, 130, 137. u.m.

a.) Elaborați o serie unidimensională care să grupeze valorile profiturilor în patru


intervale egale. Reprezentați grafic seria obținută.
b.) Construiți o serie unidimensională de intervale astfel încât:
(i) valorile veniturilor să fie grupate în trei intervale egale.
(ii) valorile cheltuielilor să fie grupate în două intervale egale.
Reprezentați grafic seriile obținute.
Rezolvare:
Formule utile:
𝑥𝑚𝑎𝑥 −𝑥𝑚𝑖𝑛
𝑙=𝑙𝑢𝑛𝑔𝑖𝑚𝑒𝑎 𝑢𝑛𝑢𝑖 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙 = ղ (formula lui Struges)
=𝑛𝑟.𝑑𝑒 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙𝑒 =1+3.322𝑙𝑛𝑁

a.)
Z=profit (venituri-cheltuieli)
𝑥𝑚𝑎𝑥 = 137
𝑥𝑚𝑖𝑛 = 6
ղ=4
137 − 6
𝑙=𝑙𝑢𝑛𝑔𝑖𝑚𝑒𝑎 𝑢𝑛𝑢𝑖 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙 = = 32.75 ≈ 33
4

[6 − 39) [39 − 72) [72 − 105) [105 − 138]


Z: ( ) , 𝑁 = 10;
4 2 2 2

Reprezentarea grafică a variabilei Z:


𝑘 ∙ 𝑁𝑖
ℎ𝑖 ∙ 𝑙𝑖 = 𝑘 ∙ 𝑁𝑖 => ℎ𝑖 =
𝑙𝑖
𝑙1 = 𝑙2 = 𝑙3 = 𝑙4 = 33
k=33

3
𝑘 ∙ 𝑁1 33 ∙ 4
ℎ1 = = =4
𝑙1 33
33 ∙ 2
ℎ2 = =2
33
33 ∙ 2
ℎ3 = =2
33
33 ∙ 2
ℎ4 = =2
33

Histograma (cu verde poligonul frecventelor)

4
(2) Din mulțimea autoturismelor vândute prin licitație s-a construit un eșantion de 30 de
unități, rezultatele observării fiind obținute în rapot cu variabilele: X=vechime
autoturismelor (ani) respectiv Y=prețul de vânzare (mii ϵ).
Nr. crtiteriu X Y
1 4 30
2 1 40
3 9 20
4 13 17
5 15 17
6 8 28
7 13 20
8 19 13
9 6 33
10 0 41
11 6 32
12 5 33
13 11 24
14 13 19
15 2 38
16 8 22
17 12 20
18 20 10
19 5 35
20 14 17
21 7 30
22 10 25
23 5 36
24 8 23
25 10 27
26 12 22
27 3 35
28 9 29
29 14 19
30 7 30

a.) Reprezentați grafic lista de observații de mai sus în funcție de cele doua variabile (hint:
considerăm că 𝑌 = 𝑓(𝑋) – prețul de vânzare depinde de vechime).
b.) Elaborați repartiția bidimensională grupând valorile în intervale știind că nr. de intervale
pentru X=4, iar lungimea unui interval pentru Y=8, inervaelele fiind egale.

5
Rezolvare:
a.)

Nor de puncte (scatter plot)


pt. Y ce depinde de X
45
40
35
30
25
20
15
10
5
0
0 5 10 15 20 25

(3) Un depozit de materiale de construcții și-a împărțit clienții în funcție de valoare


achizițiilor dintr-o lună (Y) respectiv tipul lor (X).
Y\X Pers. fizice Ag. economici Alți ag. Total
construcții economici
0-250 35 (23.48%) 25 (16.77%) 11 (7.38%) 71 (47.65%)
250-1000 14 (9.39%) 56 (37.58%) 8 (5.36%) 78 (52.34%)
Total 49 (32.88%) 81 (54.36%) 19 (12.75%) 149 (100%)

a.) Construiți seria formată cu frecvențe relative.


b.) Extrageți toate seriile unidimensionale cu frecvențe absolute posibile.
c.) Reprezentați grafic variabilele ce stau la baza seriei bidimensionale de mai sus.
Rezolvare:

6
(4) Fie distribuția famiilor din satul Poplaca în funcție de numărul de copii:
0 1 2 3 4
𝑋𝑛𝑟. 𝑑𝑒 𝑐𝑜𝑝𝑖𝑖 : ( ) , 𝑁 = 37
10 15 7 3 2

a.) Descrieți tipul variabilei statistice X. Care este populația, volumul acesteia, respectiv
unitatea statistică.
b.) Construiți repartiția cu frecvențe relative. Interpretați pentru seria unidimensională cu
frecvențe relative a treia frecvență. Care este cel mai frecvent nr. de copii întâlnit în rândul
famiilor din satul Poplaca?
c.) Reprezentați grafic variabila X prin cel mai adecvat grafic.
Rezolvare:
a.) X(nr. de copii)=atributiva, cantitativa, discreta.
Pop. statistica: multimea famiilor din satul Poplaca
Unitatea stat: o familie
Vol. Pop. statistice: N=37
b.)
0 1 2 3 4
𝑋𝑛𝑟. 𝑑𝑒 𝑐𝑜𝑝𝑖𝑖 : ( ) , 100%
27% 40% 19% 8% 6%
10
𝑓1 = × 100 = 27%
37
15
𝑓2 = × 100 = 40%
37
7
𝑓3 = × 100 = 19%
37
3
𝑓4 = × 100 = 8%
37
2
𝑓5 = × 100 = 6%
37
0 1 2 3 4
𝑋𝑛𝑟. 𝑑𝑒 𝑐𝑜𝑝𝑖𝑖 : ( )
27% 67% 86% 94% 100%

𝑓3 - 19% din familiile din satul Poplaca au 2 copii.


𝐹𝑁 (𝑥3 ) - 86% din familiiledin satul Poplaca au cel mult 2 copii.
Cele mai multe dintre familii au 1 copil (40%).

7
c.)
ℎ𝑖 = 𝑘 ∙ 𝑁𝑖
k=1
ℎ1 = 𝑘 ∙ 𝑁1 => 1 ∙ 10 = 10
ℎ2 = 1 ∙ 15 => 15
ℎ3 = 1 ∙ 7 => 7
ℎ4 = 1 ∙ 3 => 3
ℎ5 = 1 ∙ 2 => 2

Diagrama prin benzi-orientare verticala


(bar chart)
16
14
12
10
8
6
4
2
0
0 1 2 3 4

Diagrama prin benzi-orientare orizontala


(bar chart)

0 2 4 6 8 10 12 14 16

8
(5) Fie distribuția clienților unui supermarket în functie de modalitatea de plată:
𝑐𝑎𝑠ℎ 𝑐𝑎𝑟𝑑 𝑏𝑜𝑛𝑢𝑟𝑖 𝑚𝑎𝑠ă
𝑋𝑚𝑜𝑑.𝑑𝑒 𝑝𝑙𝑎𝑡ă : ( ) , 𝑁 = 400
200 78 122
a.) Construiți toate tipurile de distribuții cu frecvențe relative posibile.
b.) Reprezentați grafic variabila X.
Rezolvare:
a.)
𝑐𝑎𝑠ℎ 𝑐𝑎𝑟𝑑 𝑏𝑜𝑛𝑢𝑟𝑖 𝑚𝑎𝑠ă
𝑋𝑚𝑜𝑑.𝑑𝑒 𝑝𝑙𝑎𝑡ă : ( ) , 100%
50% 19.5% 30.5%
Notă: Pentru variabile calitative nominale nu putem calcula frecvente cumulate (fie ele
absolute sau relative).!!!!!

b.)
360°
𝜇𝑖 = 𝑁𝑖 ∙
𝑁
360° 360°
𝜇1 = 𝑁1 ∙ = 200 ∙ = 180°
𝑁 400
360°
𝜇2 = 78 ∙ = 70.2°
400
360°
𝜇3 = 122 ∙ = 109.8°
400

Cercul de structura (pie chart)

cash card bonuri de masa

9
ℎ𝑖 = 𝑘 ∙ 𝑁𝑖
k=1
ℎ1 = 200
ℎ2 = 78
ℎ3 = 122

Diagrama prin benzi (bar chart)


250

200

150

100

50

0
cash card bonuri de masa

(6) Fie cursul valutar a două monede naționale pe parcursul a patru trimestre:
𝐼 𝐼𝐼 𝐼𝐼𝐼 𝐼𝑉
Y: ( )
2.98 3.14 3.01 2.95
Reprezentați grafic variabila Y.
Rezolvare:

Cronograma
3.2

3.15

3.1

3.05

2.95

2.9

2.85
I II III IV

10
(7) Fie repartiția clineților unui magazin de electrocasnice în funcție de valoare achizițiilor:
[0 − 2) [2 − 5) [5 − 10]
Y: ( )
10 15 25
Reprezentați grafic variabila Y.
Rezolvare:

(8) Managerul unui site informatic a contorizat nr. de tranzacții online efectuate de utilizatori
pentru achiziționarea unor produse. În decursul unei luni, nr. de tranzacții efectuate pe zi au
fost: 31, 27, 12, 32, 34, 33, 33, 22, 27, 15, 31, 37, 43, 23, 25, 27, 41, 39, 11, 14, 21, 37, 24, 19,
30, 28, 34, 20, 27, 33.
Construiți o serie unidimensională continuă care să grupeze tranzacțiile efectuate în patru
clase. Reprezentați grafic seria construită.
Rezolvare:

11
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.

Statistică Descriptivă—Seminar IV

Parametrii repartițiilor (CAP. II)

A. Parametrii tendinței centrale


B. Parametrii de structură
C. Parametrii variației
D. Parametrii formei
E. Parametrii concentrării

A. Parametrii tendinței centrale

A1. Valoarea medie (media) – var. cantitative


1. Dacă X este un șir de date, adică 𝑋: 𝑥1 , 𝑥2 , … , 𝑥𝑛
𝑛
𝑥1 + 𝑥2 + … + 𝑥𝑛 1
𝑀(𝑋) = 𝑋̅ = = ∑ 𝑥𝑖
𝑛 𝑛
𝑖=1

Ex: Profitul înregistrat de o cafenea în decursul unei săptămâni a fost: 1100, 1000, 1295,
1321, 1451, 1522, 1527. Calculați profitul mediu obținut în fiecare zi.

1100 + 1000 + 1295 + 1321 + 1451 + 1522 + 1527


𝑀(𝑋) = 𝑋̅ = =
7
7
1
= ∑ 𝑥𝑖 = 1316.57 𝑢. 𝑚.
7
𝑖=1

1
2. Dacă X este o serie unidimensională cu frecvențe absolute
𝑥1 𝑥2 … 𝑥𝑅
X: (𝑁 𝑁2 … 𝑁𝑅 )
1

𝑅
𝑥1 ∙ 𝑁1 + 𝑥2 ∙ 𝑁2 + … + 𝑥𝑅 ∙ 𝑁𝑅 1
𝑀(𝑋) = 𝑋̅ = = ∑ 𝑥𝑖 ∙ 𝑁𝑖
𝑁 𝑁
𝑖=1

Ex: Se consideră distribuția clienților unei bănci în funcție de nr. de conturi bancare deținute.
1 2 3 4
𝑋𝑛𝑟. 𝑑𝑒 𝑐𝑜𝑛𝑡𝑢𝑟𝑖 : ( ) , 𝑁 = 85
25 32 19 9
Găsiți nr. mediu de conturi ce-i revine fiecărui client.

1 ∙ 25 + 2 ∙ 32 + 3 ∙ 19 + 4 ∙ 9
𝑋̅ = = 2.14 ≈ 2 𝑐𝑜𝑛𝑡𝑢𝑟𝑖/𝑐𝑙𝑖𝑒𝑛𝑡
85
3. Dacă X este o serie unidimensională cu frecvențe relative

𝑥1 𝑥2 … 𝑥𝑅
X: ( 𝑓 𝑓2 … 𝑓𝑅 )
1

𝑅
𝑥1 ∙ 𝑓1 + 𝑥2 ∙ 𝑓2 + … + 𝑥𝑅 ∙ 𝑓𝑅 1
𝑀(𝑋) = 𝑋̅ = = ∑ 𝑥𝑖 ∙ 𝑓𝑖
100% 100%
𝑖=1

Ex: Fie distribuția famiilor din satul Poplaca în funcție de numărul de copii.

0 1 2 3 4
𝑋𝑛𝑟. 𝑑𝑒 𝑐𝑜𝑝𝑖𝑖 : ( ) , 100%
27% 40% 19% 8% 6%
Găsiți nr. mediu de copii ce-i revine fiecărei familii.

0 ∙ 27% + 1 ∙ 40% + 2 ∙ 19% + 3 ∙ 8% + 4 ∙ 6% 126%


𝑋̅ = = = 1.26 ≈ 1 𝑐𝑜𝑝𝑖𝑙/𝑓𝑎𝑚𝑖𝑙𝑖𝑒
100% 100%
Ex. interpretare: Unei familii îi revine în medie un copil.

2
4. În cazul seriilor continue (cu intervale) valorile 𝑥𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑅 reprezintă mijloacele
inervalelor.
𝑎+𝑏
de ex. pt. [𝑎, 𝑏] => 𝑥 ∗ = 2

Ex: Repartiția angajaților unei fabrici în funcție de salariul lunar (in EUR) este.

[700, 1200) [1200, 1800) [1800, 2500) [2500, 5000]


𝑆: ( ) , 𝑁 = 317
132 125 53 7
Aflați salariul mediu ce-l câștigă fiecare angajat.

700 + 1200 1200 + 1800 1800 + 2500 2500 + 5000


2 ∙ 132 + 2 ∙ 125 + 2 ∙ 53 + 2 ∙7
𝑀(𝑆) =
317
= 1429.34 𝐸𝑈𝑅

Proprietăți ale valorii medii (cele mai utilizate)


1. 𝑀(𝑥1 + 𝑥2 + … + 𝑥𝑛 ) = 𝑀(𝑥1 ) + 𝑀(𝑥2 ) + … + 𝑀(𝑥𝑛 )
𝑚𝑒𝑑𝑖𝑎 𝑠𝑢𝑚𝑒𝑖 = 𝑠𝑢𝑚𝑎 𝑚𝑒𝑑𝑖𝑖𝑙𝑜𝑟

̅ 𝑋) = 𝑀(𝑌)
2. 𝑀(𝑌|
𝑝𝑟𝑜𝑝𝑟𝑖𝑒𝑡𝑎𝑡𝑒 𝑑𝑒 𝑎𝑑𝑖ț𝑖𝑛𝑢𝑒 𝑎 𝑚𝑒𝑑𝑖𝑖𝑙𝑜𝑟

3. 𝑀(𝑋 ∙ 𝑌) = 𝑀(𝑋) ∙ 𝑀(𝑌), 𝑑𝑎𝑐ă 𝑋, 𝑌 𝑖𝑛𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒


𝑚𝑒𝑑𝑖𝑎 𝑝𝑟𝑜𝑑𝑢𝑠𝑢𝑙𝑢𝑖 = 𝑝𝑟𝑜𝑑𝑢𝑠𝑢𝑙 𝑚𝑒𝑑𝑖𝑖𝑙𝑜𝑟

4. 𝑀(𝑎𝑋 + 𝑏) = 𝑎 ∙ 𝑀(𝑋) + 𝑏

Ex. Se consideră distribuția firmelor din IT dintr-un oraș in funcție de variabilele: X=nr. de
angajați respectiv Y=venituri (mii euro).
Y\X [10-20] 15 (20-50] 35 (50-100] 75 Total
[10-50] 30 4 3 2 9
(50-100] 75 3 2 1 6
Total 7 5 3 N=15

Verificați proprietățile mediei (primele trei).


a.) 𝑀(𝑋 + 𝑌) = 𝑀(𝑋) + 𝑀(𝑌)

3
∑(𝑥𝑖 + 𝑦𝑗 ) ∙ 𝑁𝑖𝑗
𝑀(𝑋 + 𝑌) =
𝑁
(15 + 30) ∙ 4 + (35 + 30) ∙ 3 + (75 + 30) ∙ 2 + (15 + 75) ∙ 3 + (35 + 75) ∙ 2 + (75 + 75) ∙ 1
=
15
= 81.66
15 ∙ 7 + 35 ∙ 5 + 75 ∙ 3
𝑀(𝑋) = = 33.66
15
30 ∙ 9 + 75 ∙ 6
𝑀(𝑌) = = 48
15
81.66 = 33.66 + 48 𝑞. 𝑒. 𝑑

̅ 𝑋) = 𝑀(𝑌)
b.) 𝑀(𝑌|

30 75 4∙30+3∙75
𝑌|𝑋=[10−20] : ( ) , 𝑁 = 7 => 𝑀(𝑌|𝑋=[10−20] ) = = 49.28
4 3 7

30 75 3∙30+2∙75
𝑌|𝑋=(20−50] : ( ) , 𝑁 = 5 => 𝑀(𝑌|𝑋=(20−50] ) = = 48
3 2 5

30 75 2∙30+1∙75
𝑌|𝑋=(50−100] : ( ) , 𝑁 = 3 => 𝑀(𝑌|𝑋=(50−100] ) = = 45
2 1 3

̅ 𝑋: (49.28 48
𝑌|
45
) , 𝑁 = 15
7 5 3

49.28 ∙ 7 + 48 ∙ 5 + 45 ∙ 3
̅ 𝑋) =
𝑀(𝑌| = 48
15

48 = 48 𝑞. 𝑒. 𝑑

c.) 𝑀(𝑋 ∙ 𝑌) = 𝑀(𝑋) ∙ 𝑀(𝑌)

𝑀(𝑋) ∙ 𝑀(𝑌) = 33.66 ∙ 48 = 1615.68

4
∑(𝑥𝑖 ∙ 𝑦𝑗 ) ∙ 𝑁𝑖𝑗
𝑀(𝑋 ∙ 𝑌) =
𝑁
(15 ∙ 30) ∙ 4 + (35 ∙ 30) ∙ 3 + (75 ∙ 30) ∙ 2 + (15 ∙ 75) ∙ 3 + (35 ∙ 75) ∙ 2 + (75 ∙ 75) ∙ 1
=
15
= 1580

𝑀(𝑋 ∙ 𝑌) ≠ 𝑀(𝑋) ∙ 𝑀(𝑌)


 X, Y sunt dependente.

A1*. Media armonică


𝑁 100%
𝑋̅−1 = =
1 1
∑𝑅𝑖=1 ∙ 𝑁𝑖 ∑𝑅𝑖=1 ∙ 𝑓𝑖
𝑥𝑖 𝑥𝑖

Ex. Un tren parcurge distanța CJ-N – București în următorul mod: 40% din distanță cu viteza
de 80 km/h, 25% din distanță cu viteza de 75 km/h, iar în rest viteza trenului este de 90
km/h. Găsiți viteza medie a trenului.
1
𝑋̅−1 = = 81.82 𝑘𝑚/ℎ
1 1 1
80 ∙ 0.4 + 75 ∙ 0.25 + 90 ∙ 0.35

A1**. Media geometrică


𝑁 𝑁 𝑁 𝑁
 serie de repartiție: 𝑋̅𝑔 = √𝑥1 1 ∙ 𝑥2 2 ∙ … ∙ 𝑥𝑅 𝑅

 listă de observații: 𝑋̅𝑔 = 𝑛√𝑥1 ∙ 𝑥2 ∙ … ∙ 𝑥𝑁

Ex: Deținem o piesă de artă; în primul an după cumpărare valoarea acesteia crește cu 50%,
în al doilea an cu 20%, iar în al treilea an cu 90%. Care este rata medie de creștere în decursul
celor trei ani?
la sfârșitul primul an valoarea s-a multiplicat cu: 150% (1.5)
la sfârșitul celui de al doilea an valoarea s-a multiplicat cu: 120% (1.2)
la sfârșitul ultimului an an valoarea s-a multiplicat cu: 190% (1.9)
3
𝑋̅𝑔 = √1.5 ∙ 1.2 ∙ 1.9 = 1.506637

5
Verificare: S=1000 EUR
După primul an valoarea piesei de artă este 1500 EUR
După al doilea an valoarea piesei de artă este 1800 EUR
După al treilea an valoarea piesei de artă este 3420 EUR

1000 ∙ 1.5066373 = 3420 𝐸𝑈𝑅

6
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.

Statistică Descriptivă—Seminar V

Parametrii repartițiilor (CAP. II)

A. Parametrii tendinței centrale


B. Parametrii de structură
C. Parametrii variației
D. Parametrii formei
E. Parametrii concentrării

A. Parametrii tendinței centrale

A2. Valoarea mediană - variabile cantitative + calitative ordinale


 împarte populația în două părți egale
 dacă
𝑥1 𝑥2 … 𝑥𝑅 𝑥𝑚𝑖𝑛 − 𝑀𝑒 𝑀𝑒 − 𝑥𝑚𝑎𝑥
X: (𝑁 𝑁2 … 𝑁𝑅 ) , 𝑁 atunci X: ( )
1 50% 50%

1. Calculul medianei pt. șir de observații și serie discretă (si ordinala).

𝑁
(i) calculăm rangul medianei: 𝑟𝑀𝑒 = 2
(ii) mediana este:
𝑀𝑒 = 𝑥[𝑟𝑀𝑒 ]+1 , 𝑁 𝑖𝑚𝑝𝑎𝑟
𝑥𝑟𝑀𝑒 + 𝑥𝑟𝑀𝑒 +1
𝑀𝑒 = , 𝑁 𝑝𝑎𝑟
2

1
Ex. 1: Fie cheltuielile zilnice de la supermarket. Y=78, 50, 32, 46, 21, 19, 50, 35, 90, 46.
Găsiți mediana și interpretați rezultatul.
Sirul ordonat este: Y=19, 21, 32, 35, 46, 46, 50, 50, 78, 90. N=10
𝑁 10
𝑟𝑀𝑒 = = =5
2 2
𝑥𝑟𝑀𝑒 + 𝑥𝑟𝑀𝑒 +1 𝑥5 + 𝑥6 46 + 46
𝑀𝑒 = = = = 46
2 2 2
Interpretare: (1) Jumatate din cheltuieli sunt cuprinse intre 19-46 EUR, iar restul de 50%
intre 46-90 EUR.
(2) Jumatate din cheltuieli sunt de cel mult 46 EUR, iar restul de 50% sunt
peste (inclusiv) 46 UER.

Ex. 2: Fie distribuția apartamentelor dintr-un hotel în funcție de nr. de camere.


1 2 3 4 5
X: ( ) , 𝑁 = 57
11 15 7 21 3
Calculați mediana și interpretați rezultatul.
𝑁 57
𝑟𝑀𝑒 = = = 28.5
2 2
𝑀𝑒 = 𝑥[𝑟𝑀𝑒 ]+1 = 𝑥29 = 3

Notă: Pentru a afla mediana trebuie să însumăm frecvențele până valoarea obținută
depășește (sau este egală) cu rangul medianei.

1−3 3−5
X: ( )
50% 50%
Interpretare: (1) Jumatate din apartamente au intre 1-3 camere, iar cealalta jumatate intre
3-5 camere.
(2) Jumatate din apartamente sunt cu cel mult 3 camere, iar cealalta jumatate
au peste (inclusiv) 3 camere.

2
2. Calcul mediană repartitie continuă (doar determinăm intervalul median)
Ex. Repartiția unui eșantion de 30 de autoturisme vândute la licitație în raport cu variabila
prețul autoturismelor (mii RON) este:
[10, 18) [18, 26) [26, 34) [34, 42]
𝑌: ( ) , 𝑁 = 30
5 10 9 6
𝑁 30
𝑟𝑀𝑒 = = = 15
2 2
𝑀𝑒 ∈ [18,26)

A3. Valoarea modală (modala) – variabile cantitative + calitative


 ne arată valoarea/intervalul cu frevența maximă

Ex. 1: Fie repartiția studentilor unei grupe în funcție de culoarea părului.

𝑏𝑙𝑜𝑛𝑧𝑖 𝑏𝑟𝑢𝑛𝑒ț𝑖 ș𝑎𝑡𝑒𝑛𝑖 𝑟𝑜ș𝑐𝑎ț𝑖


X: ( ) , 𝑁 = 15
3 5 4 3
Mo=bruneti
Interpretare: Majoritatea studentilor sunt bruneti.

Ex. 2: Fie distribuția apartamentelor dintr-un hotel în funcție de nr. de camere.


1 2 3 4 5
X: ( ) , 𝑁 = 36
10 10 3 5 8
Mo=1 si 2
Interpretare: Majoritatea apartamentelor (cele mai multe) au 1 respectiv 2 camere.

Ex. 3: Repartiția angajaților unei fabrici în funcție de salariul lunar (in EUR) este.

[700, 1200) [1200, 1800) [1800, 2500) [2500, 5000]


𝑆: ( ),𝑁 =
132 125 53 7
Intervalul model este
𝑀𝑜 ∈ [700, 1200)
Interpretare: Majoritatea angajatilor fabricii au salariul lunar intre [700, 1200) EUR.

3
B. Parametrii de structură

 împart populația in n părți egale


 îi numim quantile și îi notăm cu q

𝑥1 𝑥2 … 𝑥𝑅
Fie X: (𝑁 𝑁2 … 𝑁𝑅 ) , 𝑁
1

𝑁
calculăm rangul quantilei: 𝑟𝑞𝑝 = 𝑝 ∙ 𝑛 =>

𝑞𝑝 = 𝑥[𝑟 𝑝∙𝑁 ⋮ 𝑛
𝑞𝑝 ]+1,

𝑥𝑟𝑞𝑝 + 𝑥𝑟𝑞𝑝 +1
𝑞𝑝 = , 𝑝∙𝑁 ⋮ 𝑛
2
unde: p – nr. de ordine al quantilei
n – nr. de părți în care împărțim populația statistică
N – volumul populației statistice

Obs:
 n=4 => quartile (avem 3 quartile care împart populația statistică în 4 părți egale,
fiecare cu frecvența de 25%)
𝑥 − 𝑞1 𝑞1 − 𝑞2 𝑞 − 𝑞3 𝑞3 − 𝑥𝑚𝑎𝑥
atunci X: ( 𝑚𝑖𝑛 ⁞ 2 )
25% 25% 25% 25%

𝑞2 = 𝑀𝑒
 n=10 => decile (avem 9 decile care împart populația statistică în 10 părți egale,
fiecare cu frecvența de 10%)

𝑑5 = 𝑀𝑒

 n=100 => centile/procentile (avem 99 centile/procentile care împart populația


statistică în 100 părți egale, fiecare cu frecvența de 1%)

𝑐50 = 𝑀𝑒

4
Ex. 1: Nr. vizitatorilor unui muzeu de artă pe parcursul a 12 zile a fost: 58, 72, 26, 34, 58, 72,
81, 91, 32, 42, 41, 50.
Aflați quartila mijlocie, centila 67 respectiv decila 4. Interpretați rezultatele obținute.
Rezolvare:

Ex. 2: Fie distribuția hotelurilor în funcție de catagoria de confort (nr. de stele).


1 2 3 4 5
X: ( ),𝑁 =
12 14 10 15 3
a.) Aflați quartilele seriei.
b.) Găsiți prima și ultima decilă.
c.) Aflați centila 78.
Interpretați toate rezultatele obținute.
Rezolvare:

Ex. 3: Distribuția locuitorilor uniu imobil în funcție de cheltuielile cu energia electrică este:
10 − 50 50 − 100 100 − 500
X: ( ),𝑁 =
8 22 10
Calculați intervalul quartilic.
Rezolvare:

S-ar putea să vă placă și