Documente Academic
Documente Profesional
Documente Cultură
Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.
A. Variabile calitative
-pentru studiul legăturii se folosește testul 𝜒 2
Fie X și Y doua variabile calitative
formulăm: (1) ipoteza nulă (𝐻0 ): ∄ legătură între variabilele X, Y
(2) ipoteza alternativă (𝐻1 ): ∃ legătură între variabilele X, Y
Y/X 𝒙𝟏 𝒙𝟐 ⋯ 𝒙𝑹 Total
𝒚𝟏 𝑁11 𝑁12 ⋯ 𝑁1𝑅 𝑵𝟏•
𝒚𝟐 𝑁21 𝑁22 ⋯ 𝑁2𝑅 𝑵𝟐•
⋯ ⋯ ⋯ ⋯ ⋯ ⋯
𝒚𝑳 𝑁𝐿1 𝑁𝐿2 ⋯ 𝑁𝐿𝑅 𝑵𝑳•
Total 𝑵•𝟏 𝑵•𝟐 ⋯ 𝑵•𝑹 N
2
∗
(𝑁𝑖𝑗 −𝑁𝑖𝑗 )
Calculăm: 𝜒 =
2 ∑𝑅𝑖=1 ∑𝐿𝑗=1 ∗ , unde
𝑁𝑖𝑗
𝑁𝑖• ∙ 𝑁•𝑗
𝑁𝑖𝑗∗ =
𝑁
Interpretări:
(1) 𝜒 2 = 0 => 𝑎𝑐𝑐𝑒𝑝𝑡ă𝑚 𝐻0 => ∄ legătură între variabile
(2) 𝜒 2 > 0 => 𝑟𝑒𝑠𝑝𝑖𝑛𝑔𝑒𝑚 𝐻0 (𝑎𝑐𝑐𝑒𝑝𝑡ă𝑚 𝐻1 ) => ∃ legătură între variabile
1
Pentru a testa intensitatea legăturii folosim:
(a) Coeficientul de contingență a lui Pearson
𝜒2
𝐶=√ ∈ [0; 1)
𝑁 + 𝜒2
dacă:
(1) 𝐶 = 0 (𝜒 2 = 0) => ∄ 𝑙𝑒𝑔ă𝑡𝑢𝑟ă
(2) 𝐶 ∈ [0; 0.3) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑠𝑙𝑎𝑏ă (𝑔𝑟𝑎𝑑 𝑚𝑖𝑐 𝑑𝑒 𝑎𝑠𝑜𝑐𝑖𝑒𝑟𝑒)
(3) 𝐶 ∈ [0.3; 0.7) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑒 (𝑔𝑟𝑎𝑑 𝑚𝑒𝑑𝑖𝑢 𝑑𝑒 𝑎𝑠𝑜𝑐𝑖𝑒𝑟𝑒)
(3) 𝐶 ∈ [0.7; 1) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑝𝑢𝑡𝑒𝑟𝑛𝑖𝑐ă (𝑔𝑟𝑎𝑑 𝑚𝑎𝑟𝑒 𝑑𝑒 𝑎𝑠𝑜𝑐𝑖𝑒𝑟𝑒)
𝜒2
𝐶=√ ∈ [0; 1)
𝑁 ∙ √(𝐼 − 1)(𝐽 − 1)
2
Rezolvare:
a.)
𝑅 𝐿 2
2
(𝑁𝑖𝑗 − 𝑁𝑖𝑗∗ )
𝜒 = ∑∑
𝑁𝑖𝑗∗
𝑖=1 𝑗=1
(2 − 5.02)2 (5 − 5.57)2 (10 − 6.41)2 (3 − 4.43)2
= + + +
5.02 5.57 6.41 4.43
(4 − 4.92) 2 (8 − 5.66) 2 (1 − 2.66) 2 (6 − 2.95)2
+ + + +
4.92 5.66 2.66 2.95
(2 − 3.39)2 (12 − 5.90)2 (5 − 6.56)2 (3 − 7.54)2
+ + + + = 19.66
3.39 5.90 6.56 7.54
> 0 => 𝑟𝑒𝑠𝑝𝑖𝑛𝑔𝑒𝑚 𝐻0 (𝑎𝑐𝑐𝑒𝑝𝑡ă𝑚 𝐻1 ) => ∃ legătură între variabile
∗
17 ∙ 18
𝑁11 = = 5.02
61
∗
17 ∙ 20
𝑁12 = = 5.57
61
∗
17 ∙ 23
𝑁13 = = 6.41
61
∗
15 ∙ 18
𝑁21 = = 4.43
61
∗
15 ∙ 20
𝑁22 = = 4.92
61
∗
15 ∙ 23
𝑁23 = = 5.66
61
∗
9 ∙ 18
𝑁31 = = 2.66
61
∗
9 ∙ 20
𝑁32 = = 2.95
61
∗
9 ∙ 23
𝑁33 = = 3.39
61
∗
20 ∙ 18
𝑁41 = = 5.90
61
∗
20 ∙ 20
𝑁42 = = 6.56
61
∗
20 ∙ 23
𝑁43 = = 7.54
61
3
b.)
𝜒2 19.66
𝐶= √ = √ = 0.49 ∈ [0.3; 0.7)
𝑁 + 𝜒2 61 + 19.66
𝜒2 19.66
𝐶=√ =√ = 0.36 𝜖[0.3; 0.7)
𝑁 ∙ √(𝐼 − 1)(𝐽 − 1) 61 ∙ √(4 − 1)(3 − 1)
B. Variabile ordinale
-sunt variabile calitative, dar în plus permit clasificări (unitătile statistice pot fi ierarhizate).
-legătura dintre variabilele ordinale se numește corelația rangurilor.
Ex.1: Într-un sondaj de piață efectuat pe 8 produse, s-au obținut următoarele rezultate în
funcție de variabilele: X-calitatea produsului, Y-prețul produsului, Z-renumele firmei
producătoare.
a.) Care este legătura dintre calitate și preț?
b.) Caracterizați nivelul corelației dintre cele trei variabile statistice.
X Y Z
𝑃1 𝑃6 𝑃8
𝑃2 𝑃7 𝑃5
𝑃3 𝑃4 𝑃2
𝑃4 𝑃8 𝑃4
𝑃5 𝑃1 𝑃1
𝑃6 𝑃2 𝑃3
𝑃7 𝑃3 𝑃7
𝑃8 𝑃5 𝑃6
4
Rezolvare:
a.)
P 𝑃1 𝑃2 𝑃3 𝑃4 𝑃5 𝑃6 𝑃7 𝑃8
rang X 1 2 3 4 5 6 7 8
rang Y 5 6 7 3 8 1 2 4
𝑑𝑖 -4 -4 -4 1 -3 5 5 4
rang Z 5 3 6 4 2 8 7 1
𝑆𝑖 11 11 16 11 15 15 16 13
𝑃 = 3 + 2 + 1 + 2 + 0 + 2 + 1 + 0 = 11
𝑄 = 4 + 4 + 4 + 2 + 3 + 0 + 0 + 0 = 17
𝑃 − 𝑄 11 − 17
𝐾= = = −0.21 < 0 => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑖𝑛𝑣𝑒𝑟𝑠ă
𝑃 + 𝑄 11 + 17
|0.21| ∈ (0; 0.3) => 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑠𝑙𝑎𝑏ă
𝑃 = ∑ 𝑝𝑖
𝑖=1
𝑛
𝑄 = ∑ 𝑞𝑖
𝑖=1
5
Interpretări:
(1) 𝐾 < 0 => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑖𝑛𝑣𝑒𝑟𝑠ă (𝑋 𝑐𝑟𝑒ș𝑡𝑒 => 𝑌 𝑠𝑐𝑎𝑑𝑒)
(2) 𝐾 = 0 => ∄ 𝑙𝑒𝑔ă𝑡𝑢𝑟ă î𝑛𝑡𝑟𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑒
(3) 𝐾 > 0 => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑑𝑖𝑟𝑒𝑐𝑡ă (𝑋 𝑐𝑟𝑒ș𝑡𝑒 => 𝑌 𝑐𝑟𝑒ș𝑡𝑒)
Intensitatea legăturii:
(1) |𝐾| ∈ (0; 0.3) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑠𝑙𝑎𝑏ă
(2) |𝐾| ∈ [0.3; 0.7) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑒
(3) |𝐾| ∈ [0.7; 1) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑝𝑢𝑡𝑒𝑟𝑛𝑖𝑐ă
b.)
𝑆𝑖 = 𝑟𝑎𝑛𝑔 𝑋 + 𝑟𝑎𝑛𝑔 𝑌 + 𝑟𝑎𝑛𝑔 𝑍
11 13 15 16
𝑆: ( )
3 1 2 2
𝑆̅ = 13.5
∑(𝑆𝑖 − 𝑆̅)2 ∙ 𝑁𝑖
𝜎𝑆2 (𝑒𝑓𝑒𝑐𝑡𝑖𝑣ă) = = 4.5
𝑁
𝑚 2 (𝑛 2 − 1)
𝜎𝑆2 (𝑚𝑎𝑥𝑖𝑚ă) = = 47.25
12
4.5
𝐾= = 0.095 => 𝑙𝑒𝑔𝑎𝑡𝑢𝑟𝑎 𝑑𝑖𝑟𝑒𝑐𝑡𝑎 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑠𝑙𝑎𝑏𝑎
47.25
6
• Coeficientul de corelație multiplă a rangurilor al lui Kendall.
𝜎𝑆2 (𝑒𝑓𝑒𝑐𝑡𝑖𝑣ă)
𝐾= ,
𝜎𝑆2 (𝑚𝑎𝑥𝑖𝑚ă)
unde:
∑(𝑆𝑖 − 𝑆̅)2 ∙ 𝑁𝑖
𝜎𝑆2 (𝑒𝑓𝑒𝑐𝑡𝑖𝑣ă) =
𝑁
𝑚 2 (𝑛 2 − 1)
𝜎𝑆2 (𝑚𝑎𝑥𝑖𝑚ă) =
12
𝑚 = 𝑛𝑟. 𝑑𝑒 𝑣𝑎𝑟𝑖𝑎𝑏𝑖𝑙𝑒 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐𝑒.
Interpretare: Idem Kendall simplu.
7
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.
Statistică Descriptivă—Seminar IX
C. Variabile cantitative
-se folosesc funcțiile de regresie (dreapta de regresie, hiperbola, parabola, etc.)
Ex.1. Fie repartiția unui grup de firme în raport cu variabilele X-nr de angajați respectiv Y-
costurile medii de producție.
Rezolvare:
a.)
𝑀(𝑋) ∙ 𝑀(𝑌) = 𝑀(𝑋 ∙ 𝑌)
𝑀(𝑋) = 49.04
𝑀(𝑌) = 255.89
𝑀(𝑋 ∙ 𝑌) = 13435.39
12548.84 ≠ 13435.39 => 𝑋, 𝑌 𝑠𝑢𝑛𝑡 𝑑𝑒𝑝𝑒𝑛𝑑𝑒𝑛𝑡𝑒
1
b.) Obs: Pentru a studia formele posibile ale funcției de regresie, se reprezintă norul de
puncte.
𝑌̅/𝑋=20 = 218.1
𝑌̅/𝑋=45 = 243.1
𝑌̅/𝑋=80 = 303.2
Norul de puncte
320
300
280
260
240
220
200
0 10 20 30 40 50 60 70 80 90
Dreapta de regresie: 𝑌 = 𝑎 + 𝑏𝑋 + 𝜀
unde:
𝑐𝑜𝑣(𝑋,𝑌) 𝑀(𝑋∙𝑌)−𝑀(𝑋)∙𝑀(𝑌)
𝑏= = = 1.44
𝜎𝑥2 𝑀(𝑋 2 )−𝑀(𝑋)2
𝑀(𝑋) = 49.04
𝑀(𝑌) = 255.89
𝑀(𝑋 ∙ 𝑌) = 13435.39
𝑀(𝑋 2 ) = 3019.38
𝑌 = 185.27 + 1.44𝑋
2
c.) Calculăm coeficientul de corelație
𝑀(𝑌 2 ) = 78363.76
Interpretări:
3
Ex.3. Se consideră distribuția unor apartamente în funcție de variabilele X-suprafața (m2)
respectiv Y-preț (mii euro).
Y/X 10-20 (15) 20-50 (35) 50-100 (75) 100-160 (130) Total
20-40 (30) 2 3 2 - 7
40-80 (60) 3 4 5 1 13
80-150 (115) 1 2 3 2 8
150-200 (175) - 1 2 3 6
Total 6 10 12 6 34
Rezolvare:
a.) Pentru a stabili dacă există legătură între două variabile cantitative putem apela la două
metode învățate:
(2) varianța explicită, și anume arătăm că aceasta este mai mare decât zero:
Obs: Trebuie determinat în baza raționamentului economic (sau în baza unui subpunct al
problemei – dacă este cazul, care este variabila dependentă și cea independentă). În contextul
acestui exercițiu, adițional raționamentului economic, ne putem da seama în baza
subpunctului c.) că prețul apartamentelor este influențat de suprafața acestora => prețul este
variabila dependentă (endogenă) iar suprafața cea independentă (exogenă/factorul).
4
𝑉𝑒𝑥𝑝𝑙𝑖𝑐𝑖𝑡ă 611.44
𝑅𝑌𝑋 = √ =√ = 0.49 ∈ [0.3; 0.7) => 𝑙𝑒𝑔ă𝑡𝑢𝑟ă 𝑑𝑒 𝑖𝑛𝑡𝑒𝑛𝑠𝑖𝑡𝑎𝑡𝑒 𝑚𝑒𝑑𝑖𝑒
𝑉𝑡𝑜𝑡𝑎𝑙ă 2498.70
𝑉𝑒𝑥𝑝𝑙𝑖𝑐𝑖𝑡ă 611.44
c.) 𝑅𝑌𝑋
2
= = 2498.70 = 0.24 = 24% =>
𝑉𝑡𝑜𝑡𝑎𝑙ă
𝑝𝑟𝑒ț𝑢𝑙 𝑎𝑝𝑎𝑟𝑡𝑎𝑚𝑒𝑛𝑡𝑒𝑙𝑜𝑟 𝑑𝑒𝑝𝑖𝑛𝑑𝑒 î𝑛 𝑝𝑟𝑜𝑝𝑜𝑟ț𝑖𝑒 𝑑𝑒 24% 𝑑𝑒 𝑠𝑢𝑝𝑟𝑎𝑓𝑎ț𝑎 𝑎𝑐𝑒𝑠𝑡𝑜𝑟𝑎, 𝑖𝑎𝑟 î𝑛 𝑝𝑟𝑜𝑝𝑜𝑟ț𝑖𝑒 𝑑𝑒 76% 𝑑
d.)
̅̅̅̅𝑋=15 = 59.17
𝑌/
̅̅
𝑌/̅̅𝑋=35 = 73.5
̅𝑌/
̅̅̅𝑋=75 = 87.92
̅̅̅̅𝑋=130 = 135.83
𝑌/
Norul de puncte
150
140
130
120
110
100
90
80
70
60
50
0 20 40 60 80 100 120 140
unde:
𝑐𝑜𝑣(𝑋,𝑌) 𝑀(𝑋∙𝑌)−𝑀(𝑋)∙𝑀(𝑌)
𝑏= 2 = = 0.63
𝜎𝑋 𝑀(𝑋 2 )−𝑀(𝑋)2
𝑀(𝑋) = 62.35
𝑀(𝑌) = 87.06
𝑀(𝑋) ∙ 𝑀(𝑌) = 5428,19
𝑀(𝑋 ∙ 𝑌) = 6356.62
𝑀(𝑋 2 ) = 5367.65
5
𝑎 = 𝑀(𝑌) − 𝑏 ∙ 𝑀(𝑋) = 47.78
𝑌 = 47.78 + 0.63𝑋
𝑀(𝑌 2 ) = 10077.94
Interpretări:
h.) Pentru X=200 => 𝑌 = 47.78 + 0.63 ∙ 200 = 173.78 𝑚𝑖𝑖 𝐸𝑈𝑅
6
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.
Statistică Descriptivă—Seminar X
Serii cronologice
𝑡 𝑡2 ⋯ 𝑡𝑛
𝑌: (𝑦1 𝑦2 ⋯ 𝑦𝑛 )
1
Ex. 1: Productia de cherestea (in tone) a unei fabrici pe un interval de 5 ani a fost:
a.) Calculati diferentele absolute, indicii statistici, si diferentele relative cu baza fixa si
baza in lant.
b.) Care este nivelul mediu anual al productiei in perioada analizata?
c.) Cu cat s-a modificat in medie productia de la un an la altul?
d.) De cate ori s-a modificat in medie si cu cat la suta productia?
e.) Reprezentati grafic seria cronologica.
f.) Scrieti ecuatia care modeleaza evolutia productiei in timp si studiati
reprezentativitatea ecuatiei.
g.) Previzionati productia pentru anul 2020.
Rezolvare:
a.) Diferentele absolute:
(i) cu baza fixa: ∆𝑦 𝑡/𝑡0 = 𝑦𝑡 − 𝑦𝑡0
1
Indicii statistici
𝑡/𝑡 𝑦
(i) cu baza fixa: 𝐼𝑌 0 = 𝑦 𝑡
𝑡0
𝑡/𝑡−1 𝑦𝑡
(i) cu baza in lant: 𝐼𝑌 =𝑦
𝑡−1
Diferente relative
𝑡/𝑡
𝑡/𝑡0 𝑦𝑡 −𝑦𝑡0 ∆𝑌 0 𝑡/𝑡0
(i) cu baza fixa: 𝑅𝑌 = = = (𝐼𝑦 − 1) × 100
𝑦𝑡0 𝑦𝑡0
𝑡/𝑡−1 𝑡/𝑡−1
(i) cu baza in lant: 𝑅𝑦 = (𝐼𝑦 − 1) × 100
𝑦1 + 𝑦2 + ⋯ 𝑦𝑛 10 + 11 + 16 + 15 + 17
𝑦̅ = = = 13.8 𝑒𝑠𝑡𝑒 𝑝𝑟𝑜𝑑𝑢𝑐ț𝑖𝑎 𝑚𝑒𝑑𝑖𝑒 𝑎𝑛𝑢𝑎𝑙ă
𝑛 5
Obs II: Daca Y este serie de momente (exprima stocuri: nr. de autoturisme/ biblioteci/
studenti ...) =>
𝑇1 𝑇 +𝑇 𝑇 +𝑇 𝑇
𝑦1 + 1 2 2 𝑦2 + ⋯ 𝑛−2 2 𝑛−1 𝑦𝑛−1 + 𝑛−1
𝑦̅ = 2 2 𝑦𝑛
𝑇1 + 𝑇2 + ⋯ + 𝑇𝑛−1
2
c.) Diferenta absoluta medie
𝑦𝑛 − 𝑦1 17 − 10
∆̅𝑌 = = = 1.75
𝑛−1 5−1
Interpretare (exemplu): producția de cherestea a crescut în medie cu 1.75 tone de la un an
la altul.
𝑛−1 𝑦𝑛
𝐼𝑌̅ = √
𝑦1
Ritmul mediu:
𝑅̅𝑌 = (𝐼𝑌̅ − 1) × 100 = 11%
Interpretare (exemplu): producția de cherestea a crescut în medie cu 11% de la un an la altul.
e.)
y = 1.8x + 8.4
Cronograma R² = 0.8351
19
17 17
16
15 15
13
11 11
10
9
5
2015 2016 2017 2018 2019
3
f.) functia (ecuatia) de regresie este
𝑌 = 𝑎 + 𝑏 ∙ 𝑡 + 𝜀,
unde:
𝑐𝑜𝑣(𝑡, 𝑌) 𝑀(𝑡 ∙ 𝑌) − 𝑀(𝑡) ∙ 𝑀(𝑌)
𝑏= = = 1.8
𝜎𝑡2 𝑀(𝑡 2 ) − 𝑀(𝑡)2
𝑌 = 8.4 + 1.8 ∙ 𝑡
1 2 3 4 5
𝑌: ( )
10 11 16 15 17
1+2+3+4+5
𝑀(𝑡) = =3
5
10 + 11 + 16 + 15 + 17
𝑀(𝑌) = = 13.8
5
10 ∙ 1 + 11 ∙ 2 + 16 ∙ 3 + 15 ∙ 4 + 17 ∙ 5
𝑀(𝑡 ∙ 𝑌) = = 45
5
2)
12 + 22 + 32 + 42 + 52
𝑀(𝑡 = = 11
5
𝑀(𝑡)2 = 9
2)
102 + 112 + 162 + 152 + 172
𝑀(𝑌 = = 198.2
5
𝑀(𝑌)2 = 190.44
4
g.) Pentru previziuni putem utiliza:
𝑌̂𝑇+ℎ = 𝑌𝑡 + ℎ ∙ ∆̅𝑌 =
𝑌̂𝑇+ℎ = 𝑌𝑡 ∙ (𝐼𝑌̅ )ℎ =
𝑇1 𝑇 +𝑇 𝑇 +𝑇 𝑇
𝑦1 + 1 2 2 𝑦2 + ⋯ 𝑛−2 2 𝑛−1 𝑦𝑛−1 + 𝑛−1
𝑦̅ = 2 2 𝑦𝑛
𝑇1 + 𝑇2 + ⋯ + 𝑇𝑛−1
5
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.
Statistică Descriptivă—Seminar XI
Indicii statistici
Fie mărimea Z influențată de mai mulți factori: x, y, z, t, ... . În funcție de formula matematică
a lui Z avem mai multe modele matematice:
a.) Modelul aditiv:
𝑍 =𝑥+𝑦+𝑧+⋯
𝑍 =𝑥−𝑦+𝑡−𝑧+⋯
𝑍 =𝑥∙𝑦∙𝑧∙…
𝑥
𝑍= ∙𝑧∙…
𝑦
Fie modelul 𝑍 = 𝑥 + 𝑦
I. Indicele variației intregrale: ne arată de câte ori se modifică variabila Z în perioada
curentă k fată de perioada de bază j.
𝑘/𝑗 𝑍𝑘
𝐼𝑍 =
𝑍𝑗
II. Indicii elementari (Indicii factorilor)
- Pp. că mărimea Z este influențată de factorii x și y, atunci:
𝑘/𝑗 𝑥𝑘
𝐼𝑥 =
𝑥𝑗
𝑘/𝑗 𝑦𝑘
𝐼𝑦 =
𝑦𝑗
1
III. Indicii variației parțiale (Indicii variației factoriale) (ne arată de câte ori se
modifică Z sub influența exclusivă a unui singur factor—avem nevoie de modelul
matematic a lui Z !)
𝑘/𝑗 𝑥𝑘 + 𝑦𝑗
𝐼𝑍/𝑥 (𝐿) = (𝑎𝑖𝑐𝑖 𝑥 𝑒𝑠𝑡𝑒 𝑓𝑎𝑐𝑡𝑜𝑟𝑢𝑙 𝑎𝑛𝑎𝑙𝑖𝑧𝑎𝑡)
𝑥𝑗 + 𝑦𝑗
𝑘/𝑗 𝑥𝑘 + 𝑦𝑘
𝐼𝑍/𝑥 (𝑃) = (𝑎𝑖𝑐𝑖 𝑥 𝑒𝑠𝑡𝑒 𝑓𝑎𝑐𝑡𝑜𝑟𝑢𝑙 𝑎𝑛𝑎𝑙𝑖𝑧𝑎𝑡)
𝑥𝑗 + 𝑦𝑘
Exercițiu 1.
Exporturile și importurile unei țări în doi ani consecutivi au fost:
b.)
2017/2016 𝐵2017 256
𝐼𝐵 = = = 1.71 > 1
𝐵2016 150
Interpretare: balanta comerciala a crescut de 1.71 ori in 2017 fata de 2016.
2
c.) Laspeyres:
Paasche:
Fischer:
2017/2016 𝑘/𝑗 𝑘/𝑗
𝐼𝐵/𝐸𝑥𝑝 (𝐹) = √𝐼𝑍/𝑥 (𝐿) ∙ 𝐼𝑍/𝑥 (𝑃) = √2.33 ∙ 4.57 = 3.26
Interpretare: sub influenta exclusiva a exporturilor, balanta comerciala a crescut de 3.26 ori
in anul 2017 fata de 2016, in baza indicelui Fisher.
d.)
2017/2016
𝐼𝐵/𝐼𝑚𝑝 (𝐿) = 0.37
2017/2016
𝐼𝐵/𝐼𝑚𝑝 (𝑃) = 0.73
2017/2016
𝐼𝐵/𝐼𝑚𝑝 (𝐹) = 0.52
Interpretare: sub influenta exclusiva a importurilor, balanta comerciala a scazut de 0.52 ori
in anul 2017 fata de 2016, in baza indicelui Fisher.
3
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.
Statistică Descriptivă—Seminar VI
C. Parametrii variației
• ne arată variația (depărtarea) valorilor unei variabile statistice față de valoarea medie
M(X) sau valoarea mediană Me
∑𝑅𝑖=1(𝑥𝑖 − 𝑋̅)2 ∙ 𝑁𝑖
𝜎𝑋2 =
𝑁
𝜎𝑋2 = 𝑀(𝑋 2 ) − 𝑀(𝑋)2
1
• de obicei pentru interpretări utilizăm:
- reprezentativitatea mediei
- omogeneitatea/eterogeneitatea populației statistice
𝜎𝑋 = √𝜎𝑋2 = 4.16
Interpretare: vechimea angajatilor se abate in medie cu ±4.16 fata de vechimea
medie (7.9 ani).
∑𝑅𝑖=1(𝑥𝑖 − 𝑋̅)2 ∙ 𝑁𝑖
𝜎𝑋2 = = 17.29
𝑁
𝑋̅ = 7.9
b.)
𝜎𝑋 4.16
𝐶𝑉𝑋 = ∙ 100 = ∙ 100 = 52.65%
𝑋̅ 7.9
2
C2. Parametrii variației în raport cu mediana
1.) Abaterea intequantilică
𝑞𝑛−1 − 𝑞1
𝑄= ,
2
unde: 𝑞𝑛−1 - ultima quantilă
𝑞1 – prima quantilă
• cazuri particulare:
𝑞3 −𝑞1
(i) abaterea interquartilică: 𝑄 =
2
𝑑9 −𝑑1
(ii) abaterea interdecilică: 𝑄 = 2
𝑐99 −𝑐1
(iii) abaterea intercentilică: 𝑄 = 2
𝑎. ) 𝑄𝑟 ≤ 30% =>
𝑝𝑜𝑝𝑢𝑙𝑎ț𝑖𝑎 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐ă 𝑒𝑠𝑡𝑒 𝑜𝑚𝑜𝑔𝑒𝑛ă î𝑛 𝑟𝑎𝑝𝑜𝑟𝑡 𝑐𝑢 𝑀𝑒; 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑒𝑠𝑡𝑒 𝑟𝑒𝑝𝑟𝑒𝑧𝑒𝑛𝑡𝑎𝑡𝑖𝑣ă
𝑏. ) 𝑄𝑟 > 30% =>
𝑝𝑜𝑝𝑢𝑙𝑎ț𝑖𝑎 𝑠𝑡𝑎𝑡𝑖𝑠𝑡𝑖𝑐ă 𝑒𝑠𝑡𝑒 𝑒𝑡𝑒𝑟𝑜𝑔𝑒𝑛ă î𝑛 𝑟𝑎𝑝𝑜𝑟𝑡 𝑐𝑢 𝑀𝑒; 𝑚𝑒𝑑𝑖𝑎𝑛𝑎 𝑒𝑠𝑡𝑒 𝑛𝑒𝑟𝑒𝑝𝑟𝑒𝑧𝑒𝑛𝑡𝑎𝑡𝑖𝑣ă
Ex. 1: Veniturile lunare înregistrate la un magazin alimentar au fost: 10, 15, 13, 11, 13, 14,
16, 17, 12, 10, 9, 11 (mii RON).
Studiați reprezentativitatea venitului median.
Rezolvare:
𝑄
abaterea relativă: 𝑄𝑟 = 𝑀𝑒 ∙ 100 = 16%
𝑞3 −𝑞1
abaterea interquartilică: 𝑄 = =2
2
3
𝑞1 = 10.5
𝑞2 = 12.5 (𝑚𝑒𝑑𝑖𝑎𝑛𝑎)
𝑞3 = 14.5
Ex. 1: Fie distribuția unei firme în raport cu chetuielile cu publicitatea (X) respectiv volumul
vânzărilor (Y) (mii RON).
Y/ X 3-5 5-7 7-9 Total
20-40 3 2 1
40-60 2 1 -
Total
4
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.
1
𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑡𝑜𝑡𝑎𝑙ă = 𝜎𝑌2 = 88.88
30 50
Y: ( ),𝑁 = 9
6 3
𝑌̅ = 36.66
𝜎𝑌2 = 88.88
∑𝑅𝑖=1(𝑦𝑖 − 𝑌̅)2 ∙ 𝑁𝑖
𝜎𝑌2 =
𝑁
30 50
𝑌/𝑋=4 : ( ),𝑁 = 5
3 2
𝑌̅/𝑋=4 = 38
30 50
𝑌/𝑋=6 : ( ),𝑁 = 3
2 1
𝑌̅/𝑋=6 = 36.66
30 50
𝑌/𝑋=8 : ( ),𝑁 = 1
1 0
𝑌̅/𝑋=8 = 30
𝜎𝑌2̅ /𝑋 = 5.92
𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑟𝑒𝑧𝑖𝑑𝑢𝑎𝑙ă = ̅̅̅̅̅̅
2
𝜎𝑌/𝑋 = 82.96
2 96 88.88 0
𝜎𝑌/𝑋 :( ),𝑁 = 9
5 3 1
2
2
𝜎𝑌/𝑋=4
= 96
2
𝜎𝑌/𝑋=6
= 88.88
2
𝜎𝑌/𝑋=8
=0
̅̅̅̅̅̅
2
𝜎𝑌/𝑋 = 82.96
𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑒𝑥𝑝𝑙𝑖𝑐𝑖𝑡ă 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑟𝑒𝑧𝑖𝑑𝑢𝑎𝑙ă
• raportul de corelație: 𝑅𝑋𝑌 = √ 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑡𝑜𝑡𝑎𝑙ă
= √1 − 𝑉𝑎𝑟𝑖𝑎𝑛ț𝑎𝑡𝑜𝑡𝑎𝑙ă
2
5.92
𝑅𝑋𝑌 = ∙ 100 = 6.66%
88.88
𝑅𝑋𝑌 = 0.26
3
c.)
√96
𝐶𝑉𝑌/𝑋=4 = ∙ 100 = 25.78%
38
√88.88
𝐶𝑉𝑌/𝑋=6 = ∙ 100 = 25.71%
36.66
√0
𝐶𝑉𝑌/𝑋=8 = ∙ 100 = 0%
30
𝐶𝑉𝑌/𝑋=8 < 𝐶𝑉𝑌/𝑋=6 < 𝐶𝑉𝑌/𝑋=4
D. Parametrii formei
- ne arată forma distribuției unităților statistice
𝑥1 𝑥2 … 𝑥𝑅
Fie X: ( 𝑓 𝑓2 … 𝑓𝑅 ) , 100%
1
4
1. Parametrii asimetriei (skewness)
𝑥̅ − 𝑀𝑜
𝛼=
𝜎𝑥
𝑀 [(𝑥 − 𝑥̅ )3 ]
𝛼3 =
𝜎𝑥3
- idem interpretări coeficientul de asimetrie a lui Pearson
5
2. Paramterii boltirii (kurtosis)
𝑀 [(𝑥 − 𝑥̅ )4 ]
𝛽4 =
𝜎𝑥4
- 𝛽4 = 3 => 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢ț𝑖𝑎 𝑢𝑟𝑚𝑒𝑎𝑧ă 𝑙𝑒𝑔𝑒𝑎 𝑛𝑜𝑟𝑚𝑎𝑙𝑎 𝑎 𝑙𝑢𝑖 𝐺𝑎𝑢𝑠𝑠 (𝑚𝑒𝑧𝑜𝑘𝑢𝑟𝑖𝑡𝑐ă)
-𝛽4 > 3 => 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢ț𝑖𝑒 𝑙𝑒𝑝𝑡𝑜𝑘𝑢𝑟𝑡𝑖𝑐ă (î𝑛𝑎𝑙𝑡ă ș𝑖 𝑎𝑠𝑐𝑢ț𝑖𝑡ă)
- 𝛽4 < 3 => 𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢ț𝑖𝑒 𝑝𝑙𝑎𝑡𝑖𝑘𝑢𝑟𝑡𝑖𝑐ă (𝑗𝑜𝑎𝑠ă ș𝑖 𝑎𝑝𝑙𝑎𝑡𝑖𝑧𝑎𝑡ă)
Notă: Dacă scădem 3 din rezultat avem comparație în funcție de 0.
Obs: Pentru coeficienții lui Fisher avem de calculat momentele centrate de ordinul 3
respectiv 4.
𝑥1 𝑥2 … 𝑥𝑅
𝐹𝑖𝑒 𝑋: (𝑁 𝑁2 … 𝑁𝑅 ) , 𝑁
1
𝑥1 ∙ 𝑁1 + 𝑥2 ∙ 𝑁2 + ⋯ 𝑥𝑅 ∙ 𝑁𝑅
𝑥̅ =
𝑁
𝑥1 − 𝑥̅ 𝑥2 − 𝑥̅ … 𝑥𝑅 − 𝑥̅
𝑥 − 𝑥:
̅( ),𝑁
𝑁1 𝑁2 … 𝑁𝑅
(𝑥 − 𝑥̅ )𝑝 (𝑥2 − 𝑥̅ )𝑝 … (𝑥𝑅 − 𝑥̅ )𝑝
(𝑥 − 𝑥̅ )𝑝 : ( 1 ),𝑁
𝑁1 𝑁2 … 𝑁𝑅
∑(𝑥𝑖 − 𝑥̅ )𝑝 ∙ 𝑁𝑖
𝑀[(𝑥 − 𝑥̅ )𝑝 ] =
𝑁
6
Ex.1: Fie distribuția farmaciilor dintr-un oraș în raport cu cifra de afaceri (CA) în mii euro.
2 4 7 9
𝑋: ( ) , 𝑁 = 47
11 24 5 7
Calculați și interpretați coeficienții de asimetrie și boltire a lui Fisher și Pearson.
Rezolvare:
𝑥̅ − 𝑀𝑜
𝛼= = 0.26 > 0 (𝑎𝑠𝑖𝑚𝑖𝑡𝑒𝑟𝑖𝑒 𝑝𝑜𝑧𝑖𝑡𝑖𝑣ă)
𝜎𝑥
𝑥̅ = 4.59
𝑀𝑜 = 4
𝜎𝑥 = 2.29
𝑀[(𝑥 − 𝑥̅ )3 ]
𝛼3 = = 0.83 > 0 (𝑎𝑠𝑚𝑒𝑡𝑟𝑖𝑒 𝑝𝑜𝑧𝑖𝑡𝑖𝑣ă)
𝜎𝑥3
𝑀[(𝑥 − 𝑥̅ )3 ] = 9.93
𝜎𝑥3 = 12
𝑀[(𝑥 − 𝑥̅ )4 ]
𝛽4 = = 2.55 < 3 (𝑑𝑖𝑠𝑡𝑟𝑖𝑏𝑢ț𝑖𝑒 𝑝𝑙𝑎𝑡𝑖𝑘𝑢𝑟𝑡𝑖𝑐ă)
𝜎𝑥4
𝑀[(𝑥 − 𝑥̅ )4 ] = 70.11
𝜎𝑥4 = 27.5
Ex.2: In urma unui control efectuat la mai multe restaurante din tara privind calitatea
preparatelor si a bauturilor oferite, au fost acordate note la 1 la 10 pentru fiecare restaurant.
Rezultatele au fost urmatoarele: 8, 7, 8, 9, 6, 5, 6, 7, 8, 7, 8, 9, 7 6, 10.
Calculați și interpretați parametrii formei distributiei restaurantelor in raport cu notele
obtinute.
5 6 7 8 9 10
𝑋: ( ) , 𝑁 = 15
1 3 4 4 2 1
Rezolvare:
𝑥̅ − 𝑀𝑜 7.4 − 7
𝛼= = = 0.30
𝜎𝑥 1.3
7
𝑥̅ − 𝑀𝑜 7.4 − 8
𝛼= = = −0.46
𝜎𝑥 1.3
Notă: Se observă că distribuția are două modale (7 respectiv 8). Astfel, calculând coeficientul
lui Pearson pentru fiecare valoare modală observăm că obținem rezultate contradictorii.
Prin urmare, pentru a avea un rezultat concludent, în momentul în care avem mai mult de o
modală utilizăm pentru asimetrie doar coeficientul lui Fisher (formula acestuia nu necesită
cunoașterea valorii modale).
5 ∙ 1 + 6 ∙ 3 + 7 ∙ 4 + 8 ∙ 4 + 9 ∙ 2 + 10 ∙ 1
𝑥̅ = = 7.4
15
𝑀𝑜 = 7 𝑠𝑖 8
∑(𝑥𝑖 − 𝑥̅ )2 ∙ 𝑁𝑖
𝜎𝑥2=
𝑁
(5 − 7.4)2 ∙ 1 + (6 − 7.4)2 ∙ 3 + (7 − 7.4)2 ∙ 4 + (8 − 7.4)2 ∙ 4 + (9 − 7.4)2 ∙ 2 + (10 − 7.4)2 ∙ 1
=
15
= 1.7
𝑀[(𝑥 − 𝑥̅ )3 ]
𝛼3 = = 0.13
𝜎𝑥3
∑(𝑥𝑖 − 𝑥̅ )𝑝 ∙ 𝑁𝑖
𝑀[(𝑥 − 𝑥̅ )3 ] =
𝑁
(5 − 7.4)3 ∙ 1 + (6 − 7.4)3 ∙ 3 + (7 − 7.4)3 ∙ 4 + (8 − 7.4)3 ∙ 4 + (9 − 7.4)3 ∙ 2 + (10 − 7.4)3 ∙ 1
=
15
= 0.29
𝑀[(𝑥 − 𝑥̅ )4 ]
𝛽4 = = 2.43
𝜎𝑥4
𝑀[(𝑥 − 𝑥̅ )4 ] =
(5 − 7.4)4 ∙ 1 + (6 − 7.4)4 ∙ 3 + (7 − 7.4)4 ∙ 4 + (8 − 7.4)4 ∙ 4 + (9 − 7.4)4 ∙ 2 + (10 − 7.4)4 ∙ 1
=
15
= 6.94
𝜎𝑥4 = 1.34 = 2.84
8
Ex.3: Se știe că pentru o distribuție aproximativ simetrică, abaterea interquartilică
reprezintă 2/3 din abaterea medie pătratică. Dacă 50% din valori sunt cuprinse în intervalul
15-17.5, modala este de 18, iar coeficientul de variație a lui Pearson este 10.3% care este
valoarea coeficientului de asimetrie a lui Pearson?
Rezolvare:
2
𝑄 = 𝜎𝑥
3
𝑞3 − 𝑞1 17.5 − 15
𝑄= = = 1.25
2 2
𝑞1 = 15
𝑞3 = 17.5
2
1.25 = 𝜎𝑥
3
𝜎𝑥 = 1.875
𝜎𝑥
𝐶𝑉𝑋 = ∙ 100% = 10.3%
𝑥̅
1.875
𝑥̅ = = 18.2
0.103
𝑀𝑜 = 18
𝑥̅ − 𝑀𝑜 18.2 − 18
𝛼= = = 0.1066
𝜎𝑥 1.875
Extra. Fie distributia unor firme in raport cu profitul obtinut (mii euro).
[2, 4) [4, 6) [6, 8) [8, 10]
𝑋: ( ),𝑁 =
11 24 21 5
9
E. Parametrii concentrării
1. Energie informațională
𝑥1 𝑥2 … 𝑥𝑅
Fie X: ( 𝑓 𝑓2 … 𝑓𝑅 ) , 100%
1
𝑘
𝐸 = ∑ 𝑓𝑖2
𝑖=1
10
Rezolvare:
3 2 10 2 28 2
𝐸 = ( ) + ( ) + ( ) = 0.53
41 41 41
1
𝐸𝑚𝑖𝑛 = = 0. (33)
3
𝐸𝑚𝑎𝑥 = 1
0.53 − 0.33
𝐸𝑟 = = 0.29 ≈ 0.3 → 0
1 − 0.33
=> 𝑐𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑟𝑒 𝑚𝑖𝑛𝑖𝑚𝑎 𝑎 𝑓𝑖𝑟𝑚𝑒𝑙𝑜𝑟 î𝑛 𝑟𝑎𝑝𝑜𝑟𝑡 𝑐𝑢 𝑓𝑜𝑟𝑚𝑎 𝑑𝑒 𝑝𝑟𝑜𝑝𝑟𝑖𝑒𝑡𝑎𝑡𝑒.
50 2 79 2 150 2 100 2 71 2 20 2
𝐸=( ) +( ) +( ) +( ) +( ) +( ) = 0.19
470 470 470 470 470 470
1
𝐸𝑚𝑖𝑛 = = 0.16
6
𝐸𝑚𝑎𝑥 = 1
0.19 − 0.16
𝐸𝑟 = = 0.03
1 − 0.16
=> 𝑐𝑜𝑛𝑐𝑒𝑛𝑡𝑟𝑎𝑟𝑒 𝑚𝑖𝑛𝑖𝑚𝑎 𝑎 𝑎𝑝𝑟𝑡𝑎𝑚𝑒𝑛𝑡𝑒𝑙𝑜𝑟 𝑖𝑛 𝑓𝑢𝑛𝑐𝑡𝑖𝑒 𝑑𝑒 𝑡𝑖𝑝𝑢𝑙 𝑙𝑜𝑟.
11
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.
Statistică Descriptivă—Seminar I
1
**eșantion: la alegrea acestuia este important să se țină cont de reprezentativitate -> obținem
informații/statistici -> prin reorganizarea sistematizarea datelor obtinem seriile statistice
pe care le prelucrăm cu anumite metode de analiză statistică -> legități statistice.
Noțiuni de bază:
Populație statistică: colecție de elemente de aceiași natură, care împărtășesc una sau
mai multe însușiri esențiale comune (ex: mulțimea consumatorilor unui produs; etc.)
Volumul populației: nr. de unități statistice care alcătuiesc populația statistică (N).
Eșantion: submulțime a unei populații statistice, construită după criterii bine stabilite
(ex: printr-un procedeu aleator) (volum eșantion: n).
Exemple:
(i) Pop. stat: mulțimea angajaților supermarketurilor din CJ
Unitatea stat: un angajat/angajatul
Eșantion: submulțimea angajaților care au vârsta între 20 și 30 de ani
submulțimea angajațior care sunt de sex feminin
Variabila stat: vârsta; sexul; nivelul de studii; vechime în muncă; culoarea părului;
înălțime; greutate; nr. de copii; stilul vestimentar; anul nașterii; locul nașterii;
statutul familial; religia; nivelul ierarhic (funcția).
Stare a var: vârsta (adolescenți, adulți, vârstnici)/(20, 30, 40, 50)/(20-30, 30-40,
40-50); sexul (m, f, a); nivelul de studii (gimnaziale, liceale, universitare, post-
universitare); vechime în muncă (0-5, 5-10, 10-15); culoarea părului (blond,
șaten, brunet, roșcat); înălțime (mică, medie, mare)/(150-160, 160-170, 170-
180)/(150, 160, 170, 180); greutate (mică, medie, mare)/(40-50, 50-60, 60-
70)/(50, 60, 70, 80); nr de copii (0-3, 3-6, 6-9)/(0, 2, 4, 6); stilul vestimantar
(casual, office); anul nașterii (1975, 1980, 1996); locul nașterii (CJ, Alba,
Constanța, Bistrița, Arad); statutul familial (singur/ă, logodit/ă, căsătorit/ă,
divorțat/ă); religia (ortodox, catolic, budist, reformat, penticostal, ateu); funcția
(lucrător comercial, șef de raion, manager de raion, manager general).
2
(ii) Pop. stat: mulțimea aparatelor electrocasnice din supermarketurile din CJ
Unitatea stat: un aparat electrocasnic
Eșantion: submulțimea aparatelor electrocasnice din supermarketurile din CJ
care au prețul sub 1000euro;
submulțimea aparatelor electrocasnice din supermarketurile din CJ
care au consumul de energie peste 300w.
Variabila stat: culoare; greutate; dimensiune, garanție, material, anul fabricației,
locul fabricației, marca, design, funcționalitate, model, accesorii.
Stare a var: culoare (alb, negru, gri); greutate (mică, normală/standard, mare)/(1,
5, 10)/(0-3, 3-6, 6-9); dimensiune (mică, normală, mare)/(0-30cm, 30-50cm, 50-
100cm)/(10, 30, 60, 90); garanție (1, 3, 5)/(standard, extra/extinsă); material
(inox, plastic, aluminiu, oțel, mixt); anul fabricației (2000, 2010, 2020); locul
fabricației (Asia, Europa, America, Africa, Antarctica); marca (samsung, zanussi,
phillips, acer); design (clasic/tradițional, modern, personalizat); funcționalitate
[durată de viață] (unifuncțional, multifuncțional)/(scurtă, medie, îndelungată);
model (simplu, personalizat, standard, inovativ); accesorii (fără accesorii, cu
accesorii)/(0-2, 2-4, 4-6, 6-10).
3
Clasificarea variabilelor:
A. după natura
lor
B. modul de
exprimare a
stărilor
C. modul de
nominale ordinale
variație
continue discrete
Scurte explicații
(1) atributive Exprimă un atribut a unităților statistice; nici de spațiu, nici de timp.
(2) de timp Ne arată timpul/perioada în care există unitățile statistice.
(3) de spațiu Ne arată locul/spațiul unde se află unitățile statistice.
(i) cantitative Stările se exprimă prin valori numerice.
continue Pot lua orice valoare reală în intervalul de variație—proces de măsurare.
discrete Nr. finit de valori, intervalul de definiție înregistrează cel mult valori
raționale, variația are loc în salturi—proces de numărare.
(ii) calitative Stările se exprimă prin cuvinte/coduri.
nominale Nu avem o ordine logică în stări.
ordinale Avem o ordine logică în stări.
*Variabila aleatoare este variabila care poate lua orice valoare din valorile unei mulţimi
finite sau infinite, cu o anumită probabilitate, rezultată dintr-o funcţie asociată variabilei,
numit lege de probabilitate. Ca şi variabila statistică, variabila aleatoare în raport cu valorile
sale poate fi discretă sau continuă.
4
Seria statistică: construcție ce redă fie distribuția unui populații în raport cu una sau mai
multe variabile, fie variația unei mărimi în timp, spațiu, sau de la o categorie la alta.
- Nr. variabilelor: unidimensională; multidimensională (noi vom lucra ce cel mult
bidimensională).
- După natura lor: atributive; cronologice (timp sau istorice); de spațiu (teritoriale)
- Modul de exprimare a stărilor variabilelor: calitative; cantitative.
- Natura indicatorului: de frecvență sau serii de distribuție (repartiție); serii de
variație.
5
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.
Statistică Descriptivă—Seminar II
𝑁𝑖 – nr. de unități ale pop. din clasa i, pentru care variabila X a înregistrat valoarea 𝑥𝑖 .
𝑥1 𝑥2 … 𝑥𝑖 … 𝑥𝑅
X: (𝑁 𝑁𝑥2 … 𝑁𝑥𝑖 … 𝑁𝑥𝑅 )
𝑥1
𝑁𝑥𝑖 = 𝑁1 + 𝑁2 + ⋯ . +𝑁𝑖
𝑁𝑥𝑖 - numărul de unități din populația studiată pentru care variabila înregistrează valori ce
nu depășesc valoarea 𝑥𝑖 .
1
(iii) Seria cu frecvențe relative cumulate
𝑥1 𝑥2 … 𝑥𝑖 … 𝑥𝑅
X: (𝐹 (𝑥 ) 𝐹 (𝑥 ) … 𝐹 (𝑥 ) … 𝐹𝑁 (𝑥𝑅 ))
𝑁 1 𝑁 2 𝑁 𝑖
𝐹𝑁 (𝑥𝑖 ) = 𝑓1 + 𝑓2 + ⋯ + 𝑓𝑖
𝑁𝑥𝑖
𝐹𝑁 (𝑥𝑖 ) = ̅̅̅̅̅
( x 100), i=1, 𝑅
𝑁
𝐹𝑁 (𝑥𝑖 ) – ponderea unității populației studiate pentru care variabila a înregistrat valori ce nu
depășesc valoarea 𝑥𝑖 .
𝑁1 8
𝑓1 = = × 100 = 16%
𝑁 50
𝑁2 27
𝑓2 = = × 100 = 54%
𝑁 50
2
𝑁3 15
𝑓3 = = × 100 = 30%
𝑁 50
(2) În urma unui sondaj efectuat în rândul angajaților (N=200) supermarketurilor din CJ s-
au obținut următoarele rezultate privind nivelul de studiu al acestora:
Rezolvare:
a.) Pop. statistică: multimea angajatilor supermarketurilor din CJ
Vol. Pop: N=200
Unitatea stat: un angajat
b.)
𝑔𝑖𝑚𝑛𝑎𝑧𝑖𝑎𝑙𝑒 𝑙𝑖𝑐𝑒𝑎𝑙𝑒 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑡𝑎𝑟𝑒 𝑝𝑜𝑠𝑡 𝑢𝑛𝑖𝑣𝑒𝑟𝑠𝑖𝑡𝑎𝑟𝑒
X: ( ) , 100%
45% 22% 14% 19%
[frecvențe relative simple]
f1=45%
f1+f2=67% =>f2=22%
f1+f2+f3=81% =>f3=14%
f1+f2+f3+f4=100% =>f4=19%
N2=44;
N3=28;
N4=38.
3
(3) Repartiția angajaților unei societăți comerciale în funcție de salariul lunar este:
Salar lunar (sute euro) Nr. angajați
2-4 34
4-6 43
6-8 51
8-10 28
10-12 13
(4) Într-un județ din România există 200 de IMM-uri a căror distribuție în funcție de profitul
înregistrat anul trecut este redată de graficul de mai jos
4500ϵ 2000ϵ
?% 15%
5000ϵ 11%
4000ϵ
18%
36%
3500ϵ
4
a.) Construiți seriile de distribuție cu frecvențe derivate, care indică repartiția IMM-
urilor în raport cu profitul înregistrat în anul trecut.
Rezolvare:
2000 3500 4000 4500 5000
X: ( ) , 100% [frecvențe relative simple]
15% 36% 18% 20% 11%
Frecventa lipsa=100%-(15%+36%+18%+11%)=100%-80%=20%
(5) Profitul (mii ϵ) înregistrat anul trecut de câteva companii di IT din Cluj-Napoca a fost:
150; 200; 175; 150; 165; 200; 175; 175; 150; 200; 200; 175; 200; 200.
a.) Precizați populația statistică, unitatea statistică, respectiv volumul populației
statistice.
b.) Construiți seria de distribuție cu frecvențe absolute care indică repartiția companiilor
IT în raport cu profitul obținut.
c.) Caracterizați variabila de la baza seriei obținute la b.).
d.) Construiți seria de distribuție cu frecvențe relative.
Rezolvare:
a.) Populația statistică:
Unitatea statistică:
Volumul pop. statistice:
b.)
X: ( )
c.) X=
d.)
5
X: ( )
𝐿 𝑀 𝑀 𝐽 𝑉
X: ( ), N=53
13 8 10 11 11
(7) La o stație meteo, s-au înregistrat de-a lungul mai multor zile consecutive de vară
următoarele temperaturi medii (grade Celsius): 25; 30; 27; 28; 29; 29; 30; 31; 25; 29; 28; 29;
28; 28; 30; 31.
a.) Precizați pop. statistică, unitatea stat., respectiv volumul pop.
b.) Construiți seria de distribuție a zilelor analizate în raport cu temeperaturile medii
înregistrate și precizați caracteristicile variabilei ce stă la baza seriei.
c.) Cât la sută din zilele analizate depășesc temperatura de 30 grade C?
Rezolvare:
a.) Pop. stat: multimea zilelor de vara analizate
Unit. stat: o zi
Volumul pop. stat.: N=16
b.)
25 27 28 29 30 31
X: ( ), N=16
2 1 4 4 3 2
Var. X=atributiva, cantitativa, discreta.
6
(8) Numărul telefoanelor mobile vândute de magazinul Orange în decursul unei săptămâni
a fost: 10; 7; 9; 11; 7; 7; 8; 10; 11; 10; 9; 8; 8; 8; 7; 10; 11; 9.
a.) Precizați pop. statistică, unitatea stat., respectiv volumul pop.
b.) Construiți seria de distribuție cu frecvențe derivate care indică repartiția magazinelor
Orange în raport cu numărul de telefoane vândute.
Rezolvare:
9) În urma unei lucrări de control, la o grupă de studenți, s-au obținut următoarele rezultate:
Prenume Nota
Ana 8
Angela 9
Bianca 7
Bogdan 5
Camelia 10
Cosmin 9
Dan 6
Emil 8
Florin 6
Gabriel 7
a.) Construiți seria statistică de distribuție pentru variabila statistică X, care indică nota
obținută la lucrare. Precizați caracteristicile variabilei X și volumul populației
statistice.
b.) Construiți seriile de distribuție cu frecvențe derivate.
Rezolvare:
a.)
5 6 7 8 9 10
X: ( ) , 𝑁 = 10 [frecvențe absolute simple]
1 2 2 2 2 1
Var. X=atributiva, cantitativa, discreta.
b.)
5 6 7 8 9 10
X: ( ) , 𝑁 = 10 [frecvențe absolute cumulate]
1 3 5 7 9 10
5 6 7 8 9 10
X: ( ) , 100% [frecvențe relative simple]
10% 20% 20% 20% 20% 10%
5 6 7 8 9 10
X: ( ) [frecvențe relative cumulate]
10% 30% 50% 70% 90% 100%
7
Serii bidimensionale: au la bază două variabile statistice (de ex. X și Y)
8
Probleme
(1) Se consideră repartiția studenților în funcție de variabilele X=județul de proveniență
respectiv Y=nota la examenul de admitere.
Y\X CJ BH AB Total
10 7
7 [90 × 100 = 7.77%] 3 [3.33%] 10 [11.11%] 20 [22.22%]
9 5 [5.55%] 19 [21.11%] 6 [6.66%] 30 [33.33%]
8 10 [11.11%] 8 [8.88%] 12 [13.33%] 30 [33.33%]
7 2 [2.22%] 5 [5.55%] 3 [3.33%] 10 [11.11%]
Total 24 [26.66%] 35 [38.88%] 31 [34.44%] N=90 [100%]
7 8 9 10
Y/X=CJ: ( ) , 𝑁 = 24;
2 10 5 7
9
7 8 9 10
Y/X=BH: ( ) , 𝑁 = 35;
5 8 19 3
7 8 9 10
Y/X=AB: ( ) , 𝑁 = 31
3 12 6 10
c.) de făcut acasă.
d.)
𝟕 𝟖 9 10
Y/X=CJ: ( ) , 𝑁 = 24;
𝟐 𝟏𝟎 5 7
2+10=12 studenți clujeni au luat cel mult nota 8 la examenul de admitere
e.)
𝐶𝐽 𝐵𝐻 𝐴𝐵
X/Y=10: ( ) , 𝑁 = 20
7 3 10
Var stat. de spațiu.
(2) Într-un dispensar medical, pe un eșantion de 100 de pacienți, s-au înregistrat înălțimea
și greutatea acestora.
greutate (kg) \înălțimea (m) [1.5; 1.7) [1.7; 1.9) >1.9 Total
[50-75) 21 [21%] a=24 [24%] b=12 [12%] 57 [57%]
>75 c=22 [22%] 15 [15%] d=6 [6%] e=43 [43%]
Total e=43 [43%] 39 [39%] 18 [18%] N=100 [100%]
10
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.
Reprezentări grafice
1
4. Cercul de structură
- recomandat pentru variabile nominale, deși se poate utiliza pentru orice serie de distribuție
undimensională.
- suprafața lui reprezintă volumul întregii populații analizate (frecvențe absolute sau
relative).
- fiecare clasă în care este divizată populația supusă studiului este reprezentată prinr-un
sector de cerc de arie direct proporțională cu volumul clasei – determinarea măsurii în grade
a unghiurilor la centru a fiecărui sector – unghiul la centru corespunde volumului întregii
populații.
360° 360°
𝜇𝑖 = 𝑓𝑖 (%) ∙ = 𝑁𝑖 ∙
100% 𝑁
5. Cronograma
- variabile cronologice (serii de timp/cronologice).
6. Cartograma și cartodiagrama
- variabile spațiale (serii de spațiu/teritoriale).
2
Probleme
(1) Veniturile și cheltuielile înregistrate de mai multe magazine alimentare dintr-un oraș, în
decursul unui trimestu, au fost:
X=venituri 25, 10, 36, 42, 50, 75, 63, 90, 132, 145. u.m.
Y=cheltuieli 3, 4, 7, 8, 2, 3, 5, 6, 2, 8. u.m.
Z=profit 22, 6, 29, 34, 48, 72, 58, 84, 130, 137. u.m.
a.)
Z=profit (venituri-cheltuieli)
𝑥𝑚𝑎𝑥 = 137
𝑥𝑚𝑖𝑛 = 6
ղ=4
137 − 6
𝑙=𝑙𝑢𝑛𝑔𝑖𝑚𝑒𝑎 𝑢𝑛𝑢𝑖 𝑖𝑛𝑡𝑒𝑟𝑣𝑎𝑙 = = 32.75 ≈ 33
4
3
𝑘 ∙ 𝑁1 33 ∙ 4
ℎ1 = = =4
𝑙1 33
33 ∙ 2
ℎ2 = =2
33
33 ∙ 2
ℎ3 = =2
33
33 ∙ 2
ℎ4 = =2
33
4
(2) Din mulțimea autoturismelor vândute prin licitație s-a construit un eșantion de 30 de
unități, rezultatele observării fiind obținute în rapot cu variabilele: X=vechime
autoturismelor (ani) respectiv Y=prețul de vânzare (mii ϵ).
Nr. crtiteriu X Y
1 4 30
2 1 40
3 9 20
4 13 17
5 15 17
6 8 28
7 13 20
8 19 13
9 6 33
10 0 41
11 6 32
12 5 33
13 11 24
14 13 19
15 2 38
16 8 22
17 12 20
18 20 10
19 5 35
20 14 17
21 7 30
22 10 25
23 5 36
24 8 23
25 10 27
26 12 22
27 3 35
28 9 29
29 14 19
30 7 30
a.) Reprezentați grafic lista de observații de mai sus în funcție de cele doua variabile (hint:
considerăm că 𝑌 = 𝑓(𝑋) – prețul de vânzare depinde de vechime).
b.) Elaborați repartiția bidimensională grupând valorile în intervale știind că nr. de intervale
pentru X=4, iar lungimea unui interval pentru Y=8, inervaelele fiind egale.
5
Rezolvare:
a.)
6
(4) Fie distribuția famiilor din satul Poplaca în funcție de numărul de copii:
0 1 2 3 4
𝑋𝑛𝑟. 𝑑𝑒 𝑐𝑜𝑝𝑖𝑖 : ( ) , 𝑁 = 37
10 15 7 3 2
a.) Descrieți tipul variabilei statistice X. Care este populația, volumul acesteia, respectiv
unitatea statistică.
b.) Construiți repartiția cu frecvențe relative. Interpretați pentru seria unidimensională cu
frecvențe relative a treia frecvență. Care este cel mai frecvent nr. de copii întâlnit în rândul
famiilor din satul Poplaca?
c.) Reprezentați grafic variabila X prin cel mai adecvat grafic.
Rezolvare:
a.) X(nr. de copii)=atributiva, cantitativa, discreta.
Pop. statistica: multimea famiilor din satul Poplaca
Unitatea stat: o familie
Vol. Pop. statistice: N=37
b.)
0 1 2 3 4
𝑋𝑛𝑟. 𝑑𝑒 𝑐𝑜𝑝𝑖𝑖 : ( ) , 100%
27% 40% 19% 8% 6%
10
𝑓1 = × 100 = 27%
37
15
𝑓2 = × 100 = 40%
37
7
𝑓3 = × 100 = 19%
37
3
𝑓4 = × 100 = 8%
37
2
𝑓5 = × 100 = 6%
37
0 1 2 3 4
𝑋𝑛𝑟. 𝑑𝑒 𝑐𝑜𝑝𝑖𝑖 : ( )
27% 67% 86% 94% 100%
7
c.)
ℎ𝑖 = 𝑘 ∙ 𝑁𝑖
k=1
ℎ1 = 𝑘 ∙ 𝑁1 => 1 ∙ 10 = 10
ℎ2 = 1 ∙ 15 => 15
ℎ3 = 1 ∙ 7 => 7
ℎ4 = 1 ∙ 3 => 3
ℎ5 = 1 ∙ 2 => 2
0 2 4 6 8 10 12 14 16
8
(5) Fie distribuția clienților unui supermarket în functie de modalitatea de plată:
𝑐𝑎𝑠ℎ 𝑐𝑎𝑟𝑑 𝑏𝑜𝑛𝑢𝑟𝑖 𝑚𝑎𝑠ă
𝑋𝑚𝑜𝑑.𝑑𝑒 𝑝𝑙𝑎𝑡ă : ( ) , 𝑁 = 400
200 78 122
a.) Construiți toate tipurile de distribuții cu frecvențe relative posibile.
b.) Reprezentați grafic variabila X.
Rezolvare:
a.)
𝑐𝑎𝑠ℎ 𝑐𝑎𝑟𝑑 𝑏𝑜𝑛𝑢𝑟𝑖 𝑚𝑎𝑠ă
𝑋𝑚𝑜𝑑.𝑑𝑒 𝑝𝑙𝑎𝑡ă : ( ) , 100%
50% 19.5% 30.5%
Notă: Pentru variabile calitative nominale nu putem calcula frecvente cumulate (fie ele
absolute sau relative).!!!!!
b.)
360°
𝜇𝑖 = 𝑁𝑖 ∙
𝑁
360° 360°
𝜇1 = 𝑁1 ∙ = 200 ∙ = 180°
𝑁 400
360°
𝜇2 = 78 ∙ = 70.2°
400
360°
𝜇3 = 122 ∙ = 109.8°
400
9
ℎ𝑖 = 𝑘 ∙ 𝑁𝑖
k=1
ℎ1 = 200
ℎ2 = 78
ℎ3 = 122
200
150
100
50
0
cash card bonuri de masa
(6) Fie cursul valutar a două monede naționale pe parcursul a patru trimestre:
𝐼 𝐼𝐼 𝐼𝐼𝐼 𝐼𝑉
Y: ( )
2.98 3.14 3.01 2.95
Reprezentați grafic variabila Y.
Rezolvare:
Cronograma
3.2
3.15
3.1
3.05
2.95
2.9
2.85
I II III IV
10
(7) Fie repartiția clineților unui magazin de electrocasnice în funcție de valoare achizițiilor:
[0 − 2) [2 − 5) [5 − 10]
Y: ( )
10 15 25
Reprezentați grafic variabila Y.
Rezolvare:
(8) Managerul unui site informatic a contorizat nr. de tranzacții online efectuate de utilizatori
pentru achiziționarea unor produse. În decursul unei luni, nr. de tranzacții efectuate pe zi au
fost: 31, 27, 12, 32, 34, 33, 33, 22, 27, 15, 31, 37, 43, 23, 25, 27, 41, 39, 11, 14, 21, 37, 24, 19,
30, 28, 34, 20, 27, 33.
Construiți o serie unidimensională continuă care să grupeze tranzacțiile efectuate în patru
clase. Reprezentați grafic seria construită.
Rezolvare:
11
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.
Statistică Descriptivă—Seminar IV
Ex: Profitul înregistrat de o cafenea în decursul unei săptămâni a fost: 1100, 1000, 1295,
1321, 1451, 1522, 1527. Calculați profitul mediu obținut în fiecare zi.
1
2. Dacă X este o serie unidimensională cu frecvențe absolute
𝑥1 𝑥2 … 𝑥𝑅
X: (𝑁 𝑁2 … 𝑁𝑅 )
1
𝑅
𝑥1 ∙ 𝑁1 + 𝑥2 ∙ 𝑁2 + … + 𝑥𝑅 ∙ 𝑁𝑅 1
𝑀(𝑋) = 𝑋̅ = = ∑ 𝑥𝑖 ∙ 𝑁𝑖
𝑁 𝑁
𝑖=1
Ex: Se consideră distribuția clienților unei bănci în funcție de nr. de conturi bancare deținute.
1 2 3 4
𝑋𝑛𝑟. 𝑑𝑒 𝑐𝑜𝑛𝑡𝑢𝑟𝑖 : ( ) , 𝑁 = 85
25 32 19 9
Găsiți nr. mediu de conturi ce-i revine fiecărui client.
1 ∙ 25 + 2 ∙ 32 + 3 ∙ 19 + 4 ∙ 9
𝑋̅ = = 2.14 ≈ 2 𝑐𝑜𝑛𝑡𝑢𝑟𝑖/𝑐𝑙𝑖𝑒𝑛𝑡
85
3. Dacă X este o serie unidimensională cu frecvențe relative
𝑥1 𝑥2 … 𝑥𝑅
X: ( 𝑓 𝑓2 … 𝑓𝑅 )
1
𝑅
𝑥1 ∙ 𝑓1 + 𝑥2 ∙ 𝑓2 + … + 𝑥𝑅 ∙ 𝑓𝑅 1
𝑀(𝑋) = 𝑋̅ = = ∑ 𝑥𝑖 ∙ 𝑓𝑖
100% 100%
𝑖=1
Ex: Fie distribuția famiilor din satul Poplaca în funcție de numărul de copii.
0 1 2 3 4
𝑋𝑛𝑟. 𝑑𝑒 𝑐𝑜𝑝𝑖𝑖 : ( ) , 100%
27% 40% 19% 8% 6%
Găsiți nr. mediu de copii ce-i revine fiecărei familii.
2
4. În cazul seriilor continue (cu intervale) valorile 𝑥𝑖 , 𝑖 = ̅̅̅̅̅
1, 𝑅 reprezintă mijloacele
inervalelor.
𝑎+𝑏
de ex. pt. [𝑎, 𝑏] => 𝑥 ∗ = 2
Ex: Repartiția angajaților unei fabrici în funcție de salariul lunar (in EUR) este.
̅ 𝑋) = 𝑀(𝑌)
2. 𝑀(𝑌|
𝑝𝑟𝑜𝑝𝑟𝑖𝑒𝑡𝑎𝑡𝑒 𝑑𝑒 𝑎𝑑𝑖ț𝑖𝑛𝑢𝑒 𝑎 𝑚𝑒𝑑𝑖𝑖𝑙𝑜𝑟
4. 𝑀(𝑎𝑋 + 𝑏) = 𝑎 ∙ 𝑀(𝑋) + 𝑏
Ex. Se consideră distribuția firmelor din IT dintr-un oraș in funcție de variabilele: X=nr. de
angajați respectiv Y=venituri (mii euro).
Y\X [10-20] 15 (20-50] 35 (50-100] 75 Total
[10-50] 30 4 3 2 9
(50-100] 75 3 2 1 6
Total 7 5 3 N=15
3
∑(𝑥𝑖 + 𝑦𝑗 ) ∙ 𝑁𝑖𝑗
𝑀(𝑋 + 𝑌) =
𝑁
(15 + 30) ∙ 4 + (35 + 30) ∙ 3 + (75 + 30) ∙ 2 + (15 + 75) ∙ 3 + (35 + 75) ∙ 2 + (75 + 75) ∙ 1
=
15
= 81.66
15 ∙ 7 + 35 ∙ 5 + 75 ∙ 3
𝑀(𝑋) = = 33.66
15
30 ∙ 9 + 75 ∙ 6
𝑀(𝑌) = = 48
15
81.66 = 33.66 + 48 𝑞. 𝑒. 𝑑
̅ 𝑋) = 𝑀(𝑌)
b.) 𝑀(𝑌|
30 75 4∙30+3∙75
𝑌|𝑋=[10−20] : ( ) , 𝑁 = 7 => 𝑀(𝑌|𝑋=[10−20] ) = = 49.28
4 3 7
30 75 3∙30+2∙75
𝑌|𝑋=(20−50] : ( ) , 𝑁 = 5 => 𝑀(𝑌|𝑋=(20−50] ) = = 48
3 2 5
30 75 2∙30+1∙75
𝑌|𝑋=(50−100] : ( ) , 𝑁 = 3 => 𝑀(𝑌|𝑋=(50−100] ) = = 45
2 1 3
̅ 𝑋: (49.28 48
𝑌|
45
) , 𝑁 = 15
7 5 3
49.28 ∙ 7 + 48 ∙ 5 + 45 ∙ 3
̅ 𝑋) =
𝑀(𝑌| = 48
15
48 = 48 𝑞. 𝑒. 𝑑
4
∑(𝑥𝑖 ∙ 𝑦𝑗 ) ∙ 𝑁𝑖𝑗
𝑀(𝑋 ∙ 𝑌) =
𝑁
(15 ∙ 30) ∙ 4 + (35 ∙ 30) ∙ 3 + (75 ∙ 30) ∙ 2 + (15 ∙ 75) ∙ 3 + (35 ∙ 75) ∙ 2 + (75 ∙ 75) ∙ 1
=
15
= 1580
Ex. Un tren parcurge distanța CJ-N – București în următorul mod: 40% din distanță cu viteza
de 80 km/h, 25% din distanță cu viteza de 75 km/h, iar în rest viteza trenului este de 90
km/h. Găsiți viteza medie a trenului.
1
𝑋̅−1 = = 81.82 𝑘𝑚/ℎ
1 1 1
80 ∙ 0.4 + 75 ∙ 0.25 + 90 ∙ 0.35
Ex: Deținem o piesă de artă; în primul an după cumpărare valoarea acesteia crește cu 50%,
în al doilea an cu 20%, iar în al treilea an cu 90%. Care este rata medie de creștere în decursul
celor trei ani?
la sfârșitul primul an valoarea s-a multiplicat cu: 150% (1.5)
la sfârșitul celui de al doilea an valoarea s-a multiplicat cu: 120% (1.2)
la sfârșitul ultimului an an valoarea s-a multiplicat cu: 190% (1.9)
3
𝑋̅𝑔 = √1.5 ∙ 1.2 ∙ 1.9 = 1.506637
5
Verificare: S=1000 EUR
După primul an valoarea piesei de artă este 1500 EUR
După al doilea an valoarea piesei de artă este 1800 EUR
După al treilea an valoarea piesei de artă este 3420 EUR
6
Curs: Conf.univ.dr. Codruța MARE
Seminar: Asist.univ.drd. Alexandra-Anca PURCEL (orar consultații: Joi, 11:20-12:50)
Notă finală: examen (80%) + seminar* (20%)
*Compunere notă seminar: două teste pe parcursul semestrului (fiecare test fiind format din
10 întrebări iar fiecare întrebare valorând un punct; astfel rezolvarea corectă a celor 10
întrebări va conduce la nota 10 pe respectivul test, rezolvarea corectă a 9 întrebări la nota 9,
etc.) + activitatea de la seminar care poate îmbunătății nota de la teste (două steluțe de la
seminar echivalează o întrebare de la test).
Bibliografie: cartea de statistică descriptivă a catedrei + oricare altă sursă conexă relevantă.
Statistică Descriptivă—Seminar V
𝑁
(i) calculăm rangul medianei: 𝑟𝑀𝑒 = 2
(ii) mediana este:
𝑀𝑒 = 𝑥[𝑟𝑀𝑒 ]+1 , 𝑁 𝑖𝑚𝑝𝑎𝑟
𝑥𝑟𝑀𝑒 + 𝑥𝑟𝑀𝑒 +1
𝑀𝑒 = , 𝑁 𝑝𝑎𝑟
2
1
Ex. 1: Fie cheltuielile zilnice de la supermarket. Y=78, 50, 32, 46, 21, 19, 50, 35, 90, 46.
Găsiți mediana și interpretați rezultatul.
Sirul ordonat este: Y=19, 21, 32, 35, 46, 46, 50, 50, 78, 90. N=10
𝑁 10
𝑟𝑀𝑒 = = =5
2 2
𝑥𝑟𝑀𝑒 + 𝑥𝑟𝑀𝑒 +1 𝑥5 + 𝑥6 46 + 46
𝑀𝑒 = = = = 46
2 2 2
Interpretare: (1) Jumatate din cheltuieli sunt cuprinse intre 19-46 EUR, iar restul de 50%
intre 46-90 EUR.
(2) Jumatate din cheltuieli sunt de cel mult 46 EUR, iar restul de 50% sunt
peste (inclusiv) 46 UER.
Notă: Pentru a afla mediana trebuie să însumăm frecvențele până valoarea obținută
depășește (sau este egală) cu rangul medianei.
1−3 3−5
X: ( )
50% 50%
Interpretare: (1) Jumatate din apartamente au intre 1-3 camere, iar cealalta jumatate intre
3-5 camere.
(2) Jumatate din apartamente sunt cu cel mult 3 camere, iar cealalta jumatate
au peste (inclusiv) 3 camere.
2
2. Calcul mediană repartitie continuă (doar determinăm intervalul median)
Ex. Repartiția unui eșantion de 30 de autoturisme vândute la licitație în raport cu variabila
prețul autoturismelor (mii RON) este:
[10, 18) [18, 26) [26, 34) [34, 42]
𝑌: ( ) , 𝑁 = 30
5 10 9 6
𝑁 30
𝑟𝑀𝑒 = = = 15
2 2
𝑀𝑒 ∈ [18,26)
Ex. 3: Repartiția angajaților unei fabrici în funcție de salariul lunar (in EUR) este.
3
B. Parametrii de structură
𝑥1 𝑥2 … 𝑥𝑅
Fie X: (𝑁 𝑁2 … 𝑁𝑅 ) , 𝑁
1
𝑁
calculăm rangul quantilei: 𝑟𝑞𝑝 = 𝑝 ∙ 𝑛 =>
𝑞𝑝 = 𝑥[𝑟 𝑝∙𝑁 ⋮ 𝑛
𝑞𝑝 ]+1,
𝑥𝑟𝑞𝑝 + 𝑥𝑟𝑞𝑝 +1
𝑞𝑝 = , 𝑝∙𝑁 ⋮ 𝑛
2
unde: p – nr. de ordine al quantilei
n – nr. de părți în care împărțim populația statistică
N – volumul populației statistice
Obs:
n=4 => quartile (avem 3 quartile care împart populația statistică în 4 părți egale,
fiecare cu frecvența de 25%)
𝑥 − 𝑞1 𝑞1 − 𝑞2 𝑞 − 𝑞3 𝑞3 − 𝑥𝑚𝑎𝑥
atunci X: ( 𝑚𝑖𝑛 ⁞ 2 )
25% 25% 25% 25%
𝑞2 = 𝑀𝑒
n=10 => decile (avem 9 decile care împart populația statistică în 10 părți egale,
fiecare cu frecvența de 10%)
𝑑5 = 𝑀𝑒
𝑐50 = 𝑀𝑒
4
Ex. 1: Nr. vizitatorilor unui muzeu de artă pe parcursul a 12 zile a fost: 58, 72, 26, 34, 58, 72,
81, 91, 32, 42, 41, 50.
Aflați quartila mijlocie, centila 67 respectiv decila 4. Interpretați rezultatele obținute.
Rezolvare:
Ex. 3: Distribuția locuitorilor uniu imobil în funcție de cheltuielile cu energia electrică este:
10 − 50 50 − 100 100 − 500
X: ( ),𝑁 =
8 22 10
Calculați intervalul quartilic.
Rezolvare: