Sunteți pe pagina 1din 4

Seminar1 - Solutii la Recapitulare STATISTICA

1. a) Serie simplă
b) PopulaŃia statistică: MulŃimea salariaŃilor unei firme mari
Eşantionul: Cei 10 salariaŃi selectaŃi aleator
Unitatea statistică: Un salariat
c) CalculaŃi şi interpretaŃi media, mediana şi valoarea modală



    = 33 ore

Interpretare: Spunem că, în medie, salariaŃii firmei analizate lucrează săptămânal 33 ore.

Vom ordona crescător termenii seriei şi le vom acorda numere de ordine (în paranteze):
 24 25 28 30 34 36 36 38 39 40
Numere de ordine (1) (2) (3) (4) (5) (6) (7) (8) (9) (10)

  
  = = 5,5 ⇒ mediana este media aritmetică termenilor x5 si x6, ai seriei ordonate crescător
 
 = 35 ore.
Interpretare: 50% din salariaŃii firmei analizate lucrează săptămânal sub 35 ore iar 50% din salariaŃii firmei
lucrează săptămânal peste 35 ore
Valoarea modală este valoarea cu cea mai mare frecvenŃă de apariŃie. 36 apare de 2 ori. ⇒  = 36 ore.
Interpretare: Cel mai frecvent, salariaŃii firmei analizate lucrează săptămânal 36 ore
Asimetria:
=3(−) = 3(33-35) = −6 ⇒ asimetrie negativa, predomină valorile mari
=− = 33-36 = − 3 ⇒ asimetrie negativa, predomină valorile mari.

d) Dispersia (în cazul seriilor simple) se calculează folosind formula:




  
 
    = 34,2222

Abaterea medie pătratică (sau deviaŃia standard sau abaterea standard):
  !  = !"#$%%%% = 5,8499
Interpretare: În medie, numărul de ore lucrate se abate de la medie cu 5,85 ore.
e) Coeficientul de variaŃie
' +$+
&  ( )**  ( )** = 17,73% < 35% ⇒ seria este omogenă ⇒ media este reprezentativă.


f) Selectăm: Data, apoi Data Analysis şi apoi Descriptive Statistics din lista de instrumente afişate.

Ce facem dacă nu apare Data Analysis în menu?


Selectăm File → Options → Add-Ins → Go → bifăm opŃiunea Analysis ToolPak → OK.

1
Seminar1 - Solutii la Recapitulare STATISTICA

2. a) Serie de distribuŃie de frecvenŃe pe intervale de variaŃie egale.


b) CalculaŃi şi interpretaŃi media şi mediana
Vom efectua calculele şi vom trece toate datele în tabel:

Grupe pachete turistice Fr.abs Centre  ( , Fr.abs.cum.  /   ( ,


după valoare(sute euro) ,  cresc. -.
2−4 4 3 12 4 67,24
4−6 20 5 100 24 88,2
6−8 32 7 224 56 0,32
8−10 16 9 144 72 57,76
10−12 8 11 88 80 121,68
Totaluri 80 35 568 − 335,2
Notă: Limita superioară a intervalului inclusă în interval.

0
 (  +1
   0

 = 7,1 sute euro

Interpretare: În medie, un pachet turistic are valoarea de 7,1 sute euro (710 euro).
Pentru o serie de distributie frecvenŃe pe intervale de variaŃie, mediana se poate determina astfel:
1. Se cumulează crescător frecvenŃele absolute ⇒ -.
2. Se determină locul medianei în cadrul seriei cu formula:
  
  = = 40,5
 
3. Se identifică intervalul median (intervalul care conŃine mediana) ca fiind primul interval a cărui frecvenŃă
absolută cumulată este imediat mai mare sau egală cu  .
Observăm că FrecvenŃa cumulată -.  23 > 40,5
⇒ Intervalul 3 este intervalul median. ⇒ Mediana se găseşte în intervalul 6−8.
⇒  4 7 sute euro (mediana poate fi aproximată cu valoarea din mijlocul intervalului median)
Interpretare: 50% dintre pachetele turistice analizate au valoarea sub 700 euro iar 50% dintre pachetele turistice
analizate au valoarea peste 700 euro.

2
Seminar1 - Solutii la Recapitulare STATISTICA

c) CalculaŃi şi interpretaŃi cuartila inferioară.


Cuartila inferioară este notată 56 şi delimitează cele mai mici 25% din valori.
  
7   = 20,25 Prima -. 9 7 este 24 > 20,25 ⇒ 7 se află intervalul 4−6.
8 8
⇒ 7 4 5 sute euro (7 poate fi aproximat cu valoarea din mijlocul intervalului care conŃine pe 7)
Interpretare: 25% dintre dintre pachetele turistice analizate au valoarea sub 500 euro iar 75% dintre pachetele
turistice analizate au valoarea peste 500 euro.

d)
0
   (  +$
  0

 = 4,19

Abaterea standard sau deviaŃia standard sau abaterea medie pătratică
  !   !#$): = 2,05 sute euro
Interpretare: În medie, un pachet turistic se abate de la medie cu 2,05 sute euro.

Pentru a putea compara variabile cu unităŃi de măsură diferite se calculeaza scorurile z.


Scorul z se calculează prin scăderea mediei din fiecare valoare şi împărŃirea rezultatului la
abaterea standard, obŃinându-se astfel distanŃa dintre o anumită valoare şi medie, în unităŃi
ale abaterii standard:
 ;
− Scorul z pentru o observaŃie xi din eşantion se calculeaza cu formula:
'

e) CalculaŃi dispersia variabilei alternative ”Nr de pachete cu valoarea sub 8 sute euro”
= +1
Media variabilei alternative: <   = 0,7
> 
Interpretare: aproximativ 70% din pachetele turistice au valori sub 8 sute euro
Dispersia variabilei alternative:  ?  <) / <  *$@ A *$" = 0,21.

3. a) CalculaŃi şi interpretaŃi coeficientul de variaŃie.


Din enunt avem :  = 42,  = 9 iar  = 40.
Coeficientul de variaŃie:
'
&  A )**  B )**  21,43%
 8
Interpretare: Deoarece v < 35% seria este omogenă; media este reprezentativă

b) CalculaŃi şi interpretaŃi asimetria.


  " /   = 3(42 − 40) = 6 > 0 ⇒ asimetrie pozitivă; predomină valorile mici

4. CalculaŃi şi interpretaŃi coeficientul de corelaŃie Pearson

,  F  A E /   F  A  F E


CD  L M/)$)N
 
GH, A  F  / I F  J K  A H, A  F E / I F E J K

Am facut calculele intermediare:

3
Seminar1 - Solutii la Recapitulare STATISTICA

⇒ Am obtinut CD = 0,78

Verificati apoi, folosind functia „Correlation” din Excel

5. d) Legatura este Liniară, inversă şi puternică;

6. ObservaŃie: Vom face InferenŃă statistică


Trebuie să facem distincŃie între populaŃie, eşantion, parametru şi valoarea estimată a parametrului.
Vom estima media populaŃiei (notată cu µ) pe interval de încredere.
P.
Parametrul populatiei, µ, este necunoscut. La nivelul eşantionului vom calcula media de selecŃie O
Intervalul de încredere 100(1−α)% pentru media µ, a populaŃiei, este de forma:

 Q RST (
!,
Pasul 1) Culegem datele din problemă
Variabila de interes este X: Timpul de servire. Vrem să ştim care este timpul mediu de servire.
Din eşantion avem: , = 49 clienŃi,  = 28 min,  = 14 min.
U 6W
Pasul 2) determinăm Eroarea standard (eroarea medie probabilă): UOP  V  = 2 min
! !WX
Pasul 3) calculăm Eroarea de estimaŃie (Eroarea maximă admisă):
U
Y  RST (   RZ (  )$:3 ( % ≈ 4
 !V
Pasul 4) calculăm intervalul de încredere şi interpretăm rezultatul. Intervalul de încredere este:
' '
 / Y [ \ [  ] Y sau  / RZ ( [ \ [  ] RST (
 ! !
⇒ %^ / # [ \ [ %^ ] # ⇒ %# [ \ [ "%
Concluzie: Timpul mediu de servire a unui client, pentru o probabilitate de încredere (de garantare a
rezultatelor) de 95% , este cuprins între aproximativ 24 şi 32 de minute.

7. c)

S-ar putea să vă placă și