Sunteți pe pagina 1din 4

Seminar1 Econometrie − Soluții la Recapitulare Statistică

1. a) Serie simplă
b) Populaţia statistică: Mulţimea salariaţilor unei firme mari
Eşantionul: Cei 10 salariaţi selectaţi aleator
Unitatea statistică: Un salariat
c) Calculaţi şi interpretaţi media, mediana şi valoarea modală
∑𝑛
𝑖=1 𝑥𝑖 330
𝑥̅ = = = 33 ore
𝑛 10
Interpretare: Spunem că, în medie, salariaţii firmei analizate lucrează săptămânal 33 ore.

Vom ordona crescător termenii seriei şi le vom acorda numere de ordine (în paranteze):
𝑥𝑖 24 25 28 30 34 36 36 38 39 40
Numere de ordine (1) (2) (3) (4) (5) (6) (7) (8) (9) (10)

𝑛+1 10+1
𝐿𝑜𝑐𝑀𝑒 = 2
= 2 = 5,5  mediana este media aritmetică termenilor x5 si x6, ai seriei ordonate crescător
𝑀𝑒 = 35 ore.
Interpretare: 50% din salariaţii firmei analizate lucrează săptămânal sub 35 ore iar 50% din salariaţii firmei
lucrează săptămânal peste 35 ore
Valoarea modală este valoarea cu cea mai mare frecvenţă de apariţie. 36 apare de 2 ori.  𝑀𝑜 = 36 ore.
Interpretare: Cel mai frecvent, salariaţii firmei analizate lucrează săptămânal 36 ore
Asimetria:
𝐴𝑠=3(𝑥̅−𝑀𝑒) = 3(33-35) = −6  asimetrie negativa, predomină valorile mari
𝐴𝑠=𝑥̅−𝑀𝑜 = 33-36 = −3  asimetrie negativa, predomină valorile mari.

d) Dispersia (în cazul seriilor simple) se calculează folosind formula:


2 ∑𝑛
𝑖=1(𝑥𝑖 −𝑥̅ )
2 308
𝑠 = = = 34,2222
𝑛−1 9
Abaterea medie pătratică (sau deviaţia standard sau abaterea standard):
𝑠 = √𝑠 2 = √34,2222 = 5,8499
Interpretare: În medie, numărul de ore lucrate se abate de la medie cu 5,85 ore.
e) Coeficientul de variaţie
𝑠 5,85
𝑣 = ∙ 100 = ∙ 100 = 17,73%  35%  seria este omogenă  media este reprezentativă.
𝑥̅ 33

f) Selectăm: Data, apoi Data Analysis şi apoi Descriptive Statistics din lista de instrumente afişate.

Ce facem dacă nu apare Data Analysis în menu?


Selectăm File → Options → Add-Ins → Go → bifăm opţiunea Analysis ToolPak → OK.

1
Seminar1 Econometrie − Soluții la Recapitulare Statistică

2. a) Serie de distribuţie de frecvenţe pe intervale de variaţie egale.


b) Calculaţi şi interpretaţi media şi mediana
Vom efectua calculele şi vom trece toate datele în tabel:
Grupe pachete turistice Fr.abs Centre 𝑥𝑖 ∙ 𝑛𝑖 Fr.abs.cum. (𝑥𝑖 − 𝑥̅ )2 ∙ 𝑛𝑖
după valoare(sute euro) 𝑛𝑖 𝑥𝑖 cresc. 𝐹𝑐𝑖
2−4 4 3 12 4 67,24
4−6 20 5 100 24 88,2
6−8 32 7 224 56 0,32
8−10 16 9 144 72 57,76
10−12 8 11 88 80 121,68
Totaluri 80 35 568 − 335,2
Notă: Limita superioară a intervalului inclusă în interval.

∑𝑟𝑖=1 𝑥𝑖 ∙𝑛𝑖 568


𝑥̅ = ∑𝑟𝑖=1 𝑛𝑖
= = 7,1 sute euro
80
Interpretare: În medie, un pachet turistic are valoarea de 7,1 sute euro (710 euro).
Pentru o serie de distributie de frecvenţe pe intervale de variaţie, mediana se poate determina astfel:
1. Se cumulează crescător frecvenţele absolute  𝐹𝑐𝑖
2. Se determină locul medianei în cadrul seriei cu formula:
𝑛+1 80+1
𝐿𝑜𝑐𝑀𝑒 = 2 = = 2 = 40,5
3. Se identifică intervalul median (intervalul care conţine mediana) ca fiind primul interval a cărui frecvenţă
absolută cumulată este imediat mai mare sau egală cu 𝐿𝑜𝑐𝑀𝑒 .
Observăm că Frecvenţa cumulată 𝐹𝑐3 = 56  40,5
 Intervalul 3 este intervalul median.  Mediana se găseşte în intervalul 6−8.
 𝑀𝑒 ≈ 7 sute euro (mediana poate fi aproximată cu valoarea din mijlocul intervalului median)
Interpretare: 50% dintre pachetele turistice analizate au valoarea sub 700 euro iar 50% dintre pachetele turistice
analizate au valoarea peste 700 euro.

2
Seminar1 Econometrie − Soluții la Recapitulare Statistică

c) Calculaţi şi interpretaţi cuartila inferioară.


Cuartila inferioară este notată 𝑸𝟏 şi delimitează cele mai mici 25% din valori.
𝑛+1 80+1
𝐿𝑜𝑐𝑄1 = 4 = 4 = 20,25 Prima 𝐹𝑐𝑖 ≥ 𝐿𝑜𝑐𝑄1 este 24  20,25  𝑄1 se află intervalul 4−6.
 𝑄1 ≈ 5 sute euro (𝑄1 poate fi aproximat cu valoarea din mijlocul intervalului care conţine pe 𝑄1 )
Interpretare: 25% dintre dintre pachetele turistice analizate au valoarea sub 500 euro iar 75% dintre pachetele
turistice analizate au valoarea peste 500 euro.

d)
∑𝑟𝑖=1(𝑥𝑖 −𝑥̅ )2 ∙𝑛𝑖 335,2
𝑠2 = ∑𝑟𝑖=1 𝑛𝑖
= = 4,19
80
Abaterea standard sau deviaţia standard sau abaterea medie pătratică
𝑠 = √𝑠 2 = √4,19 = 2,05 sute euro
Interpretare: În medie, un pachet turistic se abate de la medie cu 2,05 sute euro.

Pentru a putea compara variabile cu unităţi de măsură diferite se calculeaza scorurile z.


Scorul z se calculează prin scăderea mediei din fiecare valoare şi împărţirea rezultatului la
abaterea standard, obţinându-se astfel distanţa dintre o anumită valoare şi medie, în unităţi
ale abaterii standard:
𝑥𝑖 −𝑥⃐
− Scorul z pentru o observaţie xi din eşantion se calculează cu formula:
𝑠

e) Calculaţi dispersia variabilei alternative ”Nr de pachete cu valoarea sub 8 sute euro”
m 56
Media variabilei alternative: f= n
= 80 = 0,7
Interpretare: aproximativ 70% din pachetele turistice au valori sub 8 sute euro
Dispersia variabilei alternative: 𝑠 2𝑓 = f(1 − f) = 0,7 ⋅ 0,3 = 0,21.

3. a) Calculaţi şi interpretaţi coeficientul de variaţie.


Din enunt avem : 𝑥̅ = 42, 𝑠 = 9 iar 𝑀𝑒 = 40.
Coeficientul de variaţie:
𝑠 9
𝑣 = 𝑥 ⋅ 100 = 42 ∗ 100 = 21,43%
Interpretare: Deoarece v  35% seria este omogenă; media este reprezentativă

b) Calculaţi şi interpretaţi asimetria.


𝐴𝑠 = 3(𝑥̅ − 𝑀𝑒 ) = 3(42 − 40) = 6  0  asimetrie pozitivă; predomină valorile mici

4. Calculaţi şi interpretaţi coeficientul de corelaţie Pearson

𝑛 ∑𝑛𝑖=1 𝑥𝑖 ⋅ 𝑦𝑖 − ∑𝑛𝑖=1 𝑥𝑖 ⋅ ∑𝑛𝑖=1 𝑦𝑖


𝑟𝑥𝑦 = ∈ [−1,1]
2 2
√[𝑛 ⋅ ∑𝑛𝑖=1 𝑥𝑖2 − (∑𝑛𝑖=1 𝑥𝑖 ) ] ⋅ [𝑛 ⋅ ∑𝑛𝑖=1 𝑦𝑖2 − (∑𝑛𝑖=1 𝑦𝑖 ) ]

Am facut calculele intermediare:

3
Seminar1 Econometrie − Soluții la Recapitulare Statistică

 Am obtinut 𝑟𝑥𝑦 = 0,78

Verificati apoi, folosind functia „Correlation” din Excel

5. d) Legatura este Liniară, inversă şi puternică;

6. Observaţie: Vom face Inferenţă statistică


Trebuie să facem distincţie între populaţie, eşantion, parametru şi valoarea estimată a parametrului.
Vom estima media populaţiei (notată cu ) pe interval de încredere.
Parametrul populatiei, , este necunoscut. La nivelul eşantionului vom calcula media de selecţie 𝒙
̅.
Intervalul de încredere 100(1−)% pentru media , a populaţiei, este de forma:
𝑠
𝑥̅ ± 𝑧𝛼/2 ∙
√𝑛
Pasul 1) Culegem datele din problemă

Variabila de interes este X: Timpul de servire. Vrem să ştim care este timpul mediu de servire.

Din eşantion avem: 𝑛 = 49 clienţi, 𝑥̅ = 28 min, 𝑠 = 14 min.


𝒔 𝟏𝟒
Pasul 2) determinăm Eroarea standard (eroarea medie probabilă): 𝒔𝒙̅ = = = 2 min
√ 𝒏 √𝟒𝟗
Pasul 3) calculăm Eroarea de estimaţie (Eroarea maximă admisă):
𝒔
∆𝑥̅ = 𝑧𝛼/2 ∙ 𝑠𝑥̅ = 𝑧𝛼 ∙ 𝒏 = (1,96) ∙ 2  4
2 √
Pasul 4) calculăm intervalul de încredere şi interpretăm rezultatul. Intervalul de încredere este:
𝑠 𝑠
𝑥̅ − ∆𝑥̅ ≤ 𝜇 ≤ 𝑥̅ + ∆𝑥̅ sau 𝑥̅ − 𝑧𝛼 ∙ ≤ 𝜇 ≤ 𝑥̅ + 𝑧𝛼/2 ∙
2 √𝑛 √𝑛
 28 − 4 ≤ 𝜇 ≤ 28 + 4  24 ≤ 𝜇 ≤ 32
Concluzie: Timpul mediu de servire a unui client, pentru o probabilitate de încredere (de garantare a
rezultatelor) de 95% , este cuprins între aproximativ 24 şi 32 de minute.

S-ar putea să vă placă și