Sunteți pe pagina 1din 5

Consultații EAM Statistică 9 februarie 2023

*Pentru rezolvarea exercițiilor precizați notațiile, formula/formulele folosite și modul de calcul)

1. Pentru un eșantion aleator de 10 vizitatori ai unei biblioteci universitare s-au înregistrat datele privind vârsta
(în ani împliniți). Datele sunt: 27, 28, 23, 22, 26, 16, 18, 25, 30, 17
a) Vârsta medie a vizitatorilor este de 23,2 ani
∑𝒏 𝒙𝒊 𝒙𝟏 + ⋯ + 𝒙𝟏𝟎 𝟐𝟑𝟐
̅ = 𝒊=𝟏 =
𝒙 = = 𝟐𝟑, 𝟐
𝒏 𝒏 𝟏𝟎
b) Valoarea mediană și modală a distribuției vor fi de 24 ani, respectiv de ( nu exista valoare modală
pentru acest set de date).
Pentru mediana P1. Ordonăm seria

nr ordine 1 2 3 4 5 6 7 8 9 10
Varsta 16 17 18 22 23 25 26 27 28 30

1 1
P2. Calculăm locul 𝐿𝑀𝑒 = 𝐿𝑄2 = 2 ⋅ (𝑛 + 1) = 2 ⋅ (11) = 5,5
P3. Determinăm mediana. Deoarece locul indică poziția medianei ca fiind situată între valoare a
cincea și valoarea a șasea, mediana va fi media acestora 𝑀𝑒 =(23+25)/2=24

c) Abaterea standard a variabilei vârsta medie a vizitatorilor este de 4,87 ani


∑𝒏 ̅)𝟐
𝒊=𝟏(𝒙𝒊 −𝒙
𝒔𝟐 = = 𝟐𝟑, 𝟕𝟑𝟑 , 𝒔 = √𝒔𝟐 = 4,87
𝒏−𝟏

d) Indicați (pe baza calculelor anterioare), tipul de asimetrie al seriei analizate asimetrie .
̅ − 𝑴𝒆 = 𝟐𝟑, 𝟐 − 𝟐𝟒 = −𝟎, 𝟖 Asimetrie negativă, predomină valorile mari
𝒙
Calcul CAS (nu este necesar pentru acesta întrebare, dar se poate regăsi în alte cerințe)
̅−𝑴𝒆 )
𝟑∙(𝒙 𝟑∗(−𝟎,𝟖)
𝑪𝒂𝒔 = = = −𝟎, 𝟒𝟗 asimetrie pronunțată (vezi curs)
𝒔 𝟒,𝟖𝟕

e) Scorul z pentru un vizitator care are 30 de ani este… (30-23,2)/4,87= 1,39 care se poate interpreta
ca : v vârstă de 30 de ani se situează la 1,39 abateri standard peste medie
f) Valoarea coeficientului de variație este de 𝟐𝟎, 𝟗𝟗% , iar media este / nu este reprezentativă deoarece
__________
𝒔 𝟒,𝟖𝟕
𝒗 = 𝒙̅ ∙ 𝟏𝟎𝟎 = 𝟐𝟑,𝟐 ∙ 𝟏𝟎𝟎 = 𝟐𝟎, 𝟗𝟗% , deoarece v < 35% seria este omogenă, media este
reprezentativă
g) Valorile cuartilelor (Q1 și Q3) sunt de …, respectiv de … ore.
P1, ordonăm seria

nr ordine 1 2 3 4 5 6 7 8 9 10
Varsta 16 17 18 22 23 25 26 27 28 30
1 11 3 3⋅11
P2. Calculăm locul cuartilelor 𝐿𝑜𝑐𝑄1 = ⋅ (𝑛 + 1) = = 2,75, 𝐿𝑜𝑐𝑄3 = 4 ⋅ (𝑛 + 1) = 4
= 8,25
4 4

P3. Determinăm cuartilele Q1=(17+18)/2=17,5 ani Q3= (27+28)/2=27,5 ani


Interpretări (pot fi utile în rezolvarea altor cerințe)
Q1 - 25 % dintre vizitatori au mai puțin de 17,5 ani (Q1 este percentila de ordinul 25), iar 75% dintre
vizitatori au mai mult de 17,5 ani;
Q3 - 75 % dintre vizitatori au mai puțin de 27,5 ani (Q1 este percentila de ordinul 25), iar 25% dintre
vizitatori au mai mult de 27,5 ani;
Consultații EAM Statistică 9 februarie 2023
*Pentru rezolvarea exercițiilor precizați notațiile, formula/formulele folosite și modul de calcul)

h) Orice valoare a vârstei vizitatorilor mai mică decât 2,5 ani, respectiv mai mare decât 42,5 ani este
outlier în raport cu setul de date inițial;
Spunem că o valoare x este outlier pentru un set de date statistice numerice dacă:
𝒙 < 𝑸𝟏 − 𝟏, 𝟓 ⋅ 𝑰𝑸𝑹 sau 𝒙 > 𝑸𝟑 + 𝟏, 𝟓 ⋅ 𝑰𝑸𝑹
𝑰𝑸𝑹 = 𝑸𝟑 − 𝑸𝟏 (abaterea intercuartilică)

IQR= 27,5-17,5=10 Limita inferioara= 𝑸𝟏 − 𝟏, 𝟓 ⋅ 𝑰𝑸𝑹 = 𝟏𝟕, 𝟓 − 𝟏𝟓 = 𝟐, 𝟓 ani, limita superioară= 𝑸𝟑 +


𝟏, 𝟓 ⋅ 𝑰𝑸𝑹 = 𝟐𝟕, 𝟓 + 𝟏𝟓 = 𝟒𝟐, 𝟓 𝒂𝒏𝒊

i) Conform regulii empirice a lui Cebîșev, 95% dintre valorile situate în mijlocul distribuției sunt
cuprinse între _______ și _________;

Detalii: Pentru intervalul de 95% limitele sunt (𝒙 ̅ + 𝟐𝒔) = (23,2-4,87; 23,2+4,87)


̅ − 𝟐𝒔, 𝒙

Nota bene, pentru alte intervale, limitele de normalitate sunt:


Pentru intervalul de 68% limitele sunt (𝒙
̅ − 𝒔, 𝒙
̅ + 𝒔)
Pentru intervalul de 99,8% limitele sunt ̅ − 𝟑𝒔, 𝒙
(𝒙 ̅ + 𝟑𝒔)

j) Limitele intervalului de încredere pentru vârsta medie a vizitatorilor, pentru o probabilitate de 95%
(𝑧𝛼/2 = 1,95) sunt 23,2 și 26,2 ani;

Eroarea standard (eroarea medie probabilă):


𝑠 𝑠2 4,87
𝑠𝑥̅ = = √𝑛 = = 1,54 ani
√𝑛 √10

Eroarea maximă admisă (eroarea limită, eroarea de estimație):


∆𝑥̅ = 𝑠𝑥̅ ∙ 𝑧𝛼 = 1,96 ∙ 1,54 = 3,02 ani
2

Intervalul de încredere:
𝑥̅ − ∆𝑥̅ ≤ 𝜇 ≤ 𝑥̅ + ∆𝑥̅ ↔ 23,2 − 3,02 ≤ 𝜇 ≤ 23,2 − 3,02 ↔ 23,18 ≤ 𝜇 ≤ 26,22 (ani)
Consultații EAM Statistică 9 februarie 2023
*Pentru rezolvarea exercițiilor precizați notațiile, formula/formulele folosite și modul de calcul)

2. Distribuţia salariaţilor firmei DAS în funcţie de numărul copiilor minori în întreţinere este prezentată ȋn
tabelul următor:
Număr copii minori 𝒙 Număr salariaţi 𝒏 𝑥𝑖 ∙ 𝑛𝑖 𝐹𝑐𝑖 𝑥𝑖 − 𝑥̅ (𝑥𝑖 − 𝑥̅ )2 (𝑥𝑖 − 𝑥̅ )2 ∙ 𝑛𝑖
𝒊 𝒊
0 20 0*25=0 20 -2 4 80
1 25 25 45 -1 1 25
2 35 70 80 0 0 0
3 25 75 105 1 1 25
4 20 80 125 2 4 80
Total 125 250 210

∑𝒓𝒊=𝟏 𝒙𝒊 ∙𝒏𝒊 𝟐𝟓𝟎


a) Numărul mediu de copii este de 2 𝒙
̅= ∑𝒓𝒊=𝟏 𝒏𝒊
== 𝟏𝟐𝟓
b) Valoarea mediană și modală a distribuției vor fi de 2 copii, respectiv de 2 copii.
𝟏 𝟏
𝑳𝒐𝒄𝑴𝒆 = 𝑳𝒐𝒄𝑸𝟐 = 𝟐 ⋅ (𝒏 + 𝟏) = 𝟐 ⋅ (𝟏𝟐𝟔) = 𝟔𝟑, prima 𝑭𝒄𝒊 ≥ 𝑳𝒐𝒄𝑴𝒆 este 80 => 2 copii

c) Dispersia numărului de copii minori este de 1,69

𝟐 ∑𝒓𝒊=𝟏(𝒙𝒊 −𝒙
̅)𝟐 ∙𝒏𝒊 𝟐𝟏𝟎
𝒔 = ∑𝒓𝒊=𝟏 𝒏𝒊
= = 1,69
𝟏𝟐𝟓

d) Examinați tendința de normalitate a distribuției folosind un grafic adecvat.


Graficul are tendința de normalitate, cele mai multe
Număr salariaţi valori sunt la mijloc, iar cele mai puține la extremitățile
40 distribuției.

30

20

10

0
0 1 2 3 4

e) Valorile cuartilelor (Q1 și Q3) sunt de 1, respectiv de 3 copii.

𝟏 𝟑
𝑳𝒐𝒄𝑸𝟏 = ⋅ (𝒏 + 𝟏) = 𝟑𝟏, 𝟓, 𝑳𝒐𝒄𝑸𝟑 = ⋅ (𝒏 + 𝟏) = 𝟗𝟒, 𝟓
𝟒 𝟒

Prima Fci> loc Q1 este 45, iar Prima Fci> loc Q3 este 105.

3.Pentru un eșantion de 40 de farmacii, ce aparțin unui anumit lanț farmaceutic, din doua orașe reședința de
județ, s-au înregistrat valorile aferente vânzărilor medii zilnice, in unități monetare (u.m.). După prelucrarea
valorilor primare au rezultat datele din tabelul următor:

Abaterea standard
Număr de Vânzări medii Dispersia Coeficientul de variație (Abaterea medie
Orașul
farmacii zilnice (u.m.) vânzărilor al vânzărilor (%) pătratica) a vânzărilor
(u.m.)
Orașul A 15 45 100 25,71% √100=10
Orașul B 25 35 81 22,22% √81=9
Consultații EAM Statistică 9 februarie 2023
*Pentru rezolvarea exercițiilor precizați notațiile, formula/formulele folosite și modul de calcul)

a) Completați informațiile lipsa din tabel.


𝒔𝑨 𝟗
𝒗𝑨 = ∙ 𝟏𝟎𝟎 = ∙ 𝟏𝟎𝟎 = 𝟐𝟓, 𝟕𝟏%
̅𝑨
𝒙 𝟑𝟓
𝒔𝑩 𝟏𝟎
𝒗𝑩 = ∙ 𝟏𝟎𝟎 = ∙ 𝟏𝟎𝟎 = 𝟐𝟐, 𝟐𝟐%
̅𝑩
𝒙 𝟒𝟓
b) Valoarea medie a vânzărilor este de 38,75 u.m.
∑𝒓𝒊=𝟏 𝒙
̅ 𝒊 ∙ 𝒏𝒊 𝒙̅ 𝑨 ∙ 𝒏𝑨 + 𝒙
̅𝑩 ∙ 𝒏𝑩 𝟒𝟓 ∙ 𝟏𝟓 + 𝟑𝟓 ∙ 𝟐𝟓 𝟏𝟓𝟓𝟎
̅=
𝒙 = = =
𝒏 𝒏 𝟒𝟎 𝟒𝟎
c) Care dintre cele două orașe este mai omogen din punct de vedere a vânzărilor este mai omogen? Iac
care este mai eterogen?

𝒗𝑨 > 𝒗𝒃 => orașul B este mai omogen, iar orașul A este mai eterogen dpdv al vânzărilor

4. Producţia de grâu la o fermă agricolă în perioada 2012-2021 se prezintă sub forma seriei de mai jos:
Anii Producția de grâu (tone)

2012 126
2013 113
2014 125
2015 114
2016 138
2017 137
2018 97
2019 99
2020 144

Care dintre afirmații este adevărată (argumentați răspunsul):


a) Valoarea medie a producției a crescut, în medie, anual cu 2 tone.
b) Valoarea medie anuală a producției a fost de 121 tone.
c) Valoarea medie a producției a crescut, în medie, anual cu 1,68%.
d) Valoarea medie a producției a crescut, în medie, anual cu 2,25 tone.
e) Valoarea medie a producției a crescut, în medie, anual cu 3,2%.

Pentru a răspunde cerințelor se vor indicatorii medii ce caracterizează seria (serie de flux sau de
interval):
∑𝒏
𝒕=𝟏 𝒚𝒕 𝟏𝟎𝟗𝟑
 nivelul mediu al seriei cronologice: 𝒚 = 𝒏
= 𝟗
= 𝟏𝟐𝟏, 𝟒𝟒𝟒 tone
În perioada analizată valoarea medie a producției a fost de 121 tone → răspuns corect (b).
𝒚𝒏 −𝒚𝟏 𝟏𝟒𝟒−𝟏𝟐𝟔 𝟏𝟖
 modificarea medie absolută: 𝜟 = 𝒏−𝟏
= 𝟖
= 𝟖
= 𝟐, 𝟐𝟓 tone
În perioada analizată, valoarea producției a crescut, în medie, anual cu 2,25 tone. → răspuns
corect (d).
𝒚 𝟖 𝟏𝟒𝟒

𝒏−𝟏 𝒏 𝟖
indicele mediu de dinamică: 𝑰 = √𝒚 = √𝟏𝟐𝟔 = √𝟏, 𝟏𝟒𝟐𝟖 = 𝟏, 𝟎𝟏𝟔𝟖 (101,68%);
𝟏

În perioada analizată, valoarea producției a crescut, în medie, anual de 1,0168 ori.


% %
 ritmul mediu de dinamică: 𝑹 = (𝑰 − 𝟏) ⋅ 𝟏𝟎𝟎 = 𝑰 − 𝟏𝟎𝟎 = 𝟏, 𝟔𝟖%.
În perioada analizată, valoarea producției a crescut, în medie, anual cu 1,68%. → răspuns corect
(c).
Consultații EAM Statistică 9 februarie 2023
*Pentru rezolvarea exercițiilor precizați notațiile, formula/formulele folosite și modul de calcul)

5. Pentru 7 cinematografe s-au înregistrat datele

Nr bilete Nr pungi popcorn


470 175
485 160
495 130
520 90
510 150
500 185
530 125

a) Analizați grafic existența, sensul și forma legăturii dintre cele două variabile;

Chart Title
190
180
170
160
150
140
130
120
110
100
460 480 500 520 540

Există o legătura, inversă, liniară

b) Măsurați intensitatea legăturii dintre variabile folosind coeficientul de corelație a rangurilor


Spearman.

bilete popcorn rx ry di di2


470 175 7 2 5 25
485 160 6 3 3 9
495 130 5 5 0 0
520 90 2 7 -5 25
510 150 3 4 -1 1
500 185 4 1 3 9
530 125 1 6 -5 25

∑ 𝑑𝑖2 = 94

6 ∑ 𝑑𝑖2 6 ⋅ 94
𝑟𝑠 = 1 − 2
= 1− = −0,678
𝑛(𝑛 − 1) 7 ⋅ 48
Legătură inversă, moderată ca intensitate.

S-ar putea să vă placă și