Sunteți pe pagina 1din 16

Anul I, CSIE 2011-2012

Statistica I

Exercitii pregatitoare pentru testul de la seminar si pentru examen – partea I

Ex. 1. Următoarea serie de date arată preţul de vânzare (sute lei) pentru 13 lucrări de grafică la o licitaţie
de obiecte de artă: 51, 60, 72, 35, 32, 57, 63, 61, 48, 33, 67, 54, 37.
Stabiliţi valoarea de adevăr a următoarelor afirmaţii, justificând răspunsurile:
a) 25 % dintre lucrarile licitate s-au vandut pentru un pret mai mic de 48 sute de lei;
b) jumatate dintre lucrarile licitate au un pret mai mic sau egal cu 54 sute lei;
c) 25 % dintre lucrari s-au vandut cu cel putin 62 sute de lei;
d) pentru 75% dintre obiecte s-a obtinut un pret de cel putin 36 sute lei;
e) precizati care dintre urmatoarele valori: 25, 29, 16, 40, 124, 85, 99,8 sute lei sunt outliers in
raport cu datele initiale.
Rezolvare:
Cele n=13 valori ale seriei de date se ordonează crescător:
x(1)=32, x(2)=33, x(3)=35, x(4)=37, x(5)=48, x(6)=51, x(7)=54, x(8)=57, x(9)=60, x(10)=61, x(11)=63, x(12)=67, x(13)=72.

Q1 – cuartila de ordinul 1 sau cuartila inferioara


n 1 13  1
Locul lui Q1 este 1  1  3,50  N, dar 3 < 3,50 < 4
4 4
x  x 4  35  37
 x 3  Q1  x 4  si Q1   3   36 sute lei.
2 2

x1  x 2  x3  x 4  x5  x6  x7  x8  x9  x10  x11  x12  x13
                              
25%  75%
Q1

36
Cu interpretarea:
 25 % dintre termenii seriei au valori mai mici decat 36 sute lei (Q1 este percentila de ordinul 25),
iar 75% dintre termenii seriei au valori mai mari ca 36 sute lei;
sau
 25% dintre lucrarile de grafica licitate s-au vandut pentru un pret mai mic decat 36 sute lei, iar
restul de 75% dintre ele s-au vandut cu un pret mai mare de 36 sute lei.
Q2=Me – cuartila de ordinul 2 sau mediana seriei de date statistice.
n  1 13  1
Locul lui Q2=Me este   7  N  Me  x 7   54 sute lei
2 2
x1  x 2   x 3  x 4   x 5  x 6   x 7   x 8  x 9   x10  x11  x12  x13

                            
50% Me 50%

54

Cu interpretarea:
 jumatate dintre termenii seriei au valori mai mici ca 54 sute lei (Me este percentila de ordinul 50),
iar restul au valori mai mari ca 54 sute lei;
sau
 jumatate dintre lucrarile de grafica licitate s-au vandut cu mai putin de 54 sute lei, iar restul s-au
vandut cu un pret mai mare de 54 sute lei.
Q3 – cuartila de ordinul 3 sau cuartila superioara
n 1 13  1
Locul lui Q3 este 3   3  10,50  N, dar 10 < 10,50 < 11
4 4
x  x11 61  63
 x10   Q3  x 11 si Q3   10    62 sute lei.
2 2

x1  x 2  x3  x4  x5  x6  x7  x8  x9  x10  x11  x12  x13
                             
25%  75%
Q3

62
Cu interpretarea:
 75 % dintre termenii seriei au valori mai mici decat 62 sute lei (Q3 este percentila de ordinul 75),
iar 25% dintre termenii seriei au valori mai mari ca 62 sute lei;
sau
 75% dintre lucrarile de grafica licitate s-au vandut pentru un pret mai mic decat 62 sute lei, iar
restul de 25% dintre ele s-au vandut cu un pret mai mare de 62 sute lei.

2
x1  x2  x3  x4  x5  x6  x7  x8  x9  x10  x11  x12  x13
                             
25%  50%  25%
Q1 Q3

36 62
Jumatate din termenii din mijlocul seriei au valori cuprinse intre Q1=36 sute lei si Q3=62 sute lei.
Abaterea intercuatilica este IQR=Q3-Q1=26 sute lei.

Definitie: Spunem ca o valoare x este outlier pentru un set de date statistice numerice daca:
x  Q1  1,5  IQR sau x  Q3  1,5  IQR
sau
valoarea x este outlier pentru un set de date statistice daca daca se gaseste in afara intervalului
 Q1  1,5  IQR; Q3  1,5  IQR .

In cazul nostru,  Q1  1,5  IQR; Q3  1,5  IQR     3; 101 , deci numai valoarea 124 este outlier in
raport cu setul initial de date statistice.

In concluzie, a) fals; b) adevarat; c) adevarat; d) adevarat; e) numai valoarea 124 sute lei este
outlier in raport cu seria initiala de date.

Ex. 2. Se considera urmatoarea serie, reprezentand valoarea inregistrata a 9 facturi emise de o societate
comerciala in ultima luna: 47; 58; 41; 36; 54; 42; 65; 43; 37 (mil. lei).
Alegeti afirmatiile false:
a) Cuartilele inferioara si superioara sunt 43 si respectiv 58 mil. lei.
b) Abaterea intercuartilica este de 10 mil. lei;
c) Jumatate dintre termenii seriei, plasati pe mijocul distributiei, se regasesc intre 39 si 56.
d) Percentilele de ordinul 25 si 75 sunt 39 si respectiv 56 mil. lei
e) In raport cu datele initiale, valorile: 73, 29, 18, 73, 23 sunt toate outliers.
f) Daca fiecare valoare s-ar mari intai cu 4,25 lei, apoi de 2 ori, dispersia noilor valori ar fi 396.

Ex. 3. Structura unui esantion de 90 de copii dupa nivelul maxim atins al unui joc pe calculator este:

3
Unde A – nivelul cel mai slab, E – nivelul cel mai
inalt.

Construiti distributia de frecvente absolute si


reprezentati-o grafic.
Studiati tendinta centrala a distributiei folosind
indicatori adecvati.
Calculati media si dispersia unei variabile
alternative, a carei stare favorabila este data de
copiii care au atins cel mult nivelul C al jocului.

Ex. 4. Pentru 39 de actrite care au obtinut premiul Oscar se cunoaste varsta, in ani impliniti, la momentul
castigarii premiului:
50, 44, 35, 80, 26, 28, 41, 21, 61, 38, 49, 33, 74, 30, 33, 41, 31, 35, 41, 42,
37, 26, 34, 34, 35, 26, 61, 60, 34, 24, 30, 37, 31, 27, 39, 34, 26, 25, 33 ani.
Se cere:
a) sa se determine si sa se interpreteze indicatorii tendintei centrale si cuartilele acestei serii de date;
b) sa se construiasca diagrama box-plot (sau diagrama cu mustati box-and-whisker), punand in
evidenta daca seria are valori extreme;
c) sa se calculeze indicatorii variatiei si sa se stabileasca daca seria este omogena;
d) analizati asimetria;
e) Descriptive Statistics.

Rezolvare: a)
o Populatia statistica este multimea actritelor care au castigat premiul Oscar.
o Unitatea statistica este o actrita.
o Variabila sau caracteristica de interes, notata X, este variabila ce arata varsta unei actrite la momentul
obtinerii premiului; variabila numerica, discreta.
o Pentru un esantion de volum n  39 de actrite se cunosc valorile variabilei X, adica {x1=50, x2=44,
x3=35, x4=80, ..., xn=x39=33 ani}, care reprezinta o serie simpla sau nesistematizata de date statistice
numerice.
n

x1  x2  ...  xn 
xi
o Media unei serii simple de date numerice  x1 , x2 , ..., xn  este .
x  i 1
n n
In cazul acestei serii, varsta medie a unei actrite din esantion care a castigat premiul Oscar este
39

x1  x2  ...  x39 
xi
1486 ani.
x  i 1
  38,1025
39 39 39

4
o Pentru a determina mediana, vom proceda astfel:
- seria simpla de date se ordoneaza crescator x 1  x 2   ...  x n  , unde x i  , i  1, n este
elementul cu rangul i din seria ordonata crescator,
n 1
- locul medianei este  20  N  Me  x 20   34 ani.
2
Jumatate dintre actritele din selectie au obtunut premiul Oscar la o varsta de cel mult 34 de ani
(jumatate dintre actritele din esantion au castigat premiul Oscar la o varsta de peste 34 de ani).
o Exista doua valori care au frecventa maxima si anume valorile 26 ani si 34 ani, care apar pentru 4
actrite fiecare.

Nr. crt. Varsta actritelor xi Varsta actritelor, in ordine crescatoare x i 


1 x1=50 x(1)=21
2 x2=44 x(2)=24
3 x3=35 x(3)=25
4 x4=80 x(4)=26
5 x5=26 x(5)=26
6 28 26
7 41 26
8 21 27
9 61 28
10 38 x(10)=30=Q1
11 49 30
12 33 31
13 74 31
14 30 33
15 33 33
16 41 33
17 31 34
18 35 34
19 41 34
20 42 x(20)=34=Me
21 37 35
22 26 35
23 34 35
24 34 37
25 35 37
26 26 38
27 61 39
28 60 41
29 34 41
30 24 x(30)=41=Q3
31 30 42
32 37 44
33 31 49
34 27 x(34)=50
35 39 x(35)=60
36 34 x(36)=61
37 26 x(37)=61
38 25 x(38)=74
39 x39=33 x(39)=80
o Pentru determinarea cuartilelor procedam astfel:

5
n 1
- locul cuartilei de ordinul 1, Q1, este 1  10  N  Q1  x 10   30 ani; un sfert dintre
4
actrite au castigat premiul Oscar la o varsta mai mica sau egala cu 30 de ani, iar restul
la cel putin 30 de ani;
n 1
- locul cuartilei de ordinul 3, Q3, este  3  30  N  Q3  x 30   41 ani; trei sferturi
4
dintre actrite au castigat premiul Oscar la o varsta mai mica sau egala cu 41 de ani, iar
restul la cel putin 41 de ani.
o Abaterea intercuartilica este IQR  Q3  Q1  11 ani si arata lungimea intervalului in care se gasesc
jumatate dintre valorile din mijlocul seriei de date.
b) Diagrama cu mustati (box-and-whisker) sau diagrama box-plot pentru o serie de date statistice
numerice se construieste punand in evidenta urmatoarele cinci elemente si eventualele valori extreme sau
outliers:
- cuartila inferioara sau de ordinul 1, Q1=30 ani;
- mediana sau cuartila de ordinul al 2-lea, Q2=Me=34 ani;
- cuartila superioara sau de ordinul al 3-lea, Q3=41 ani;
- limita sau marginea inferioara a diagramei box-plot este cea mai mica dintre valorile
seriei de date cu proprietatea ca este mai mare sau egala cu Q1  1,5  IQR , adica
lim inf box  plot  min x i  , i  1, n x i   Q1  1,5  IQR :
o Q1  1,5  IQR  13,5
o cea mai mica dintre valorile seriei de date, cu proprietatea ca este  13,5 , este
x(1)=21 ani, deci marginea inferioara este egala cu 21 ani,
lim inf box  plot  21  x 1 ;
- limita sau marginea superioara a diagramei box-plot este cea mai mare dintre valorile
seriei de date cu proprietatea ca este mai mica sau egala cu Q3  1,5  IQR , adica
lim sup box plot  max x i  , i  1, n x i   Q3  1,5  IQR :
o Q3  1,5  IQR  57,5
o cea mai mare dintre valorile seriei de date, cu proprietatea ca este  57,5 , este
x(34)=50 ani, deci marginea superioara este egala cu 50 ani,
lim sup box  plot  50  x 34  .

Se observa ca intervalul cuprins intre marginea inferioara si cea superioara diagramei box-plot,
adica intervalul de numere reale [21; 50] nu contine toate valorile observate, in afara lui ramanand
valorile x(35)=60, x(36)=61, x(37)=61, x(38)=74, x(39)=80 ani.
Valoarea x este outlier pentru seria de date statistice numerice daca x se gaseste in afara
intervalului  Q1  1,5  IQR; Q3  1,5  IQR  13,5; 57,5 , x(35)=60, x(36)=61, x(37)=61, x(38)=74, x(39)=80
sunt outliers si vor fi reprezentate distinct in diagrama box-plot.

6
*
* * * *

21 30 34 41 50 60 61 74 80
(Q1) (Me) (Q3)

Fig. …. Diagrama box-plot sau diagrama cu mustati (box-and-whisker).

Fig. …. Diagrama box-plot in SPSS.

c) Dispersia de selectie (sample variance) pentru o serie simpla de date numerice asupra variabilei X este
n
 xi  x  2
 x  x  2  ...   xn  x  2  
s2  1 i 1 ,
x
n 1 n 1
39

 x  x
2
i
adica 6791,5897 ,
s x2  i 1
  178,7260
39  1 39  1

7
abaterea standard (standard deviation) este s x  s x2  13,3688 ani.
s
Coeficientul de variatie este v x  x  100  35,09%  35% , ceea ce indica faptul ca seria de date nu
x
este omogena, iar media nu este reprezentativa pentru colectivitate, ca indicator al tendintei centrale.

Varsta actritelor
Nr. crt. xi xi  x  xi  x  2

1 x1=50 11,8974 141,5489


2 x2=44 5,8974 34,7797
3 x3=35 -3,1026 9,6259
4 x4=80 41,8974 1755,3951
5 x5=26 -12,1026 146,4720
6 28 -10,1026 102,0618
7 41 2,8974 8,3951
8 21 -17,1026 292,4977
9 61 22,8974 524,2925
10 38 -0,1026 0,0105
11 49 10,8974 118,7541
12 33 -5,1025 26,0361
13 74 35,8974 1288,6259
14 30 -8,1025 65,6515
15 33 -5,1025 26,0361
16 41 2,8974 8,3951
17 31 -7,1025 50,4464
18 35 -3,1025 9,6259
19 41 2,8974 8,3951
20 42 3,8974 15,1900
21 37 -1,1025 1,2156
22 26 -12,1025 146,4720
23 34 -4,1025 16,8310
24 34 -4,1025 16,8310
25 35 -3,1025 9,6259
26 26 -12,1025 146,4720
27 61 22,8974 524,2925
28 60 21,8974 479,4977
29 34 -4,10256 16,8310
30 24 -14,1025 198,8823
31 30 -8,1025 65,6515
32 37 -1,1025 1,2156
33 31 -7,1025 50,4464

8
34 27 -11,1025 123,2669
35 39 0,8974 0,8053
36 34 -4,1025 16,8310
37 26 -12,1025 146,4720
38 25 -13,1025 171,6771
39 x39=33 -5,1025 26,0361

39 39

 x  x   x  x   6791,589
39 2

 xi  1486
i 1
i 1
i
i 1
i

0 7
x  38,1025 s  178,7260
2
x

sx  s x2  13,3688
v x  35,09%

d) Asimetria unei serii de distribuţie de frecvenţe se poate stabili:


- prin compararea indicatorilor tendintei centrale,
- prin analiza distantei intre mediana si cele doua cuartile inferioara si superioara,
- prin calculul si interpretarea valorii unui indicator specific, coeficientul de asimetrie,
- se observă din reprezentarea grafică prin histogramă sau poligonul frecvenţelor.
- Cum Me  34  38,1025  x , atunci concluzionam ca seria de date prezinta asimetrie pozitiva.
- Cum mediana este mai apropiata de Q1 decat de Q2, adica Me  Q1  Q3  Me , asa cum se poate
vedea din diagrama box-plot, atunci concluzionam ca seria prezinta asimetrie pozitiva, in seria de date
predominand valorile mici.
n

 x  x
3
i
- Indicatorul asimetriei este coeficientul de asimetrie (Skewness) , al carui semn si
CAS  i 1

n   sx 
3

marime arata tipul asimetriei (pozitiva sau negativa), iar marimea arata gradul mai putin accentuat sau
mai accentuat al asimetriei seriei de date sau al distributiei. In cazul acestei serii de date, CAS  1,5734 , o
valoare pozitiva si mai mare ca 1, ceea ce arata ca seria de date prezinta o asimetrie pozitiva pronuntata.
- Sistematizarea printr-o serie de distributie de frecvente pe r  6 intervale de variatie de marime
egala a dat urmatoarea distributie a celor n=39 de actrite din esantion dupa varsta la momentul obtinerii
premiului Oscar:
Frecventa absoluta nk
Centrul x k
Intervalul k de variatie a intervalului k de variatie
Nr. crt. al intervalului k de
(clasa de varsta) (numarul de actrite
variatie
din fiecare clasa de varsta)
1 20-30 ani 11 25
2 30-40 ani 16 35
3 40-50 ani 7 45
4 50-60 ani 1 55
5 60-70 ani 2 65
6 70-80 ani 2 75
6

n
k 1
k  39=n

Reprezentarea grafica seriei de distributie de frecvente pe intervale, adica histograma si poligonul


frecventelor sugereaza ca aceasta prezinta asimetrie pronuntata la dreapta sau asimetrie pozitiva, adica
predomina valorile mai mici ale variabilei de interes, cu coada mai lungă a distribuţiei spre valorile mari,

9
care apar cu frecventa mai mica. Intre cele 39 de actrite castigatoare ale premiului Oscar, predomina cele
cu varste relativ mai mici.

e) Indicatorii tendintei centrale, principalii indicatori ai variatiei si ai formei distributiei pentru o serie
simpla de date numerice pot fi calculati in Excel si in SPSS, output-urile fiind de forma:
Output-ul Descriptive Statistics in Excel Output-ul Descriptive Statistics in SPSS

10
Varsta actritelor
Statistics

Mean (media) x  38.1025 Varsta actritelor Oscar


Standard Error 2.1407 N Valid 39
Median Me=34
Mode Mo=26 Missing 0
Standard Deviation
(abaterea standard) sx  s x2  13.3688 Mean x  38.10
Sample Variance
(dispersia de selectie) s x2  178.7260 Std. Error of Mean 2.141
Kurtosis 2.3830 Median Me=34.00
Skewness
(coeficientul de asimetrie) CAS  1.5734 Mode Mo=26a
Range
(Amplitudinea) Ax  x max  xmin  59 Std. Deviation sx  s x2  13.369
Minimum x min  21 Variance s x2  178.726
Maximum xmax  80
39 Skewness CAS  1.573
Sum x i 1
i  1486 Std. Error of Skewness .378

Count n=39 Kurtosis 2.383

Std. Error of Kurtosis .741

Range Ax  xmax  xmin  5


9

Minimum xmin  21
Maximum xmax  80
39
Sum
x
i 1
i  1486

Percentiles 25 Q1  30.00

50 Q2  Me  34.00

75 Q3  41.00

a. Multiple modes exist. The smallest value is shown

Observatie: Analiza boltirii/aplatizării


Boltirea(kurtosis, în engl.) exprimă înălţimea curbei („cocoaşei”) comparativ cu distribuţia normală
teoretică. Întâlnim, astfel distribuţii leptocurtice, ascuţite (cu „cocoaşa” înaltă) şi distribuţii platicurtice,
aplatizate. Coeficientul de boltire sau aplatizare (kurtosis) este o măsură a împrăştierii fiecărei
observaţii în jurul unei valori centrale şi se determină, pe eşantion, cu formula:
n

 x  x
n

 x  x
4 2
i i
CBA  i 1
 3 , unde s x2  i 1 .
 
n s 2 2
x n 1

Definiţia este bazată pe momentul centrat de ordinul 4.

Interpretarea valorii coeficientului de aplatizare si boltire:


 Dacă CBA  0 , avem distribuţie leptocurtică, valorile varibilei fiind concentrate în jurul
indicatorilor tendinţei centrale

11
 Dacă CBA  0 , avem distribuţie platicurtica, valorile varibilei fiind dispersate în raport cu
indicatorii tendinţei centrale
 Dacă CBA  0 , avem distribuţie mezocurtică, adică distribuţia normală.

In cazul acestei serii de date statistice, CAB  2,383  0 , ceea ce indica o distributie leptocurtica
(cu cocoasa, asa cum se poate vedea si din histograma sau poligonul frecventelor).

Ex. 5. Un agent al companiei de asigurari W vinde contracte de asigurare de locuinte. In luna iulie a
incheiat: 2 contracte cu prime anuale de 50 Eur, 3 contracte cu prime anuale de 60 Eur, 6 contracte cu
prime de 70 Eur, 9 contracte cu prime de 90 Eur, 16 contracte cu prime anuale de 120 Eur, 8 contracte cu
prime anuale de 130 Eur si 6 contracte cu prime de 140 Eur. Se cere:
a) Construiţi seria de distribuţie de frecvenţe şi analizaţi grafic tendinţa de normalitate a acesteia.
b) Caracterizaţi omogenitatea şi asimetria distribuţiei contractelor în funcţie de valoarea primelor
anuale.
c) Calculati media si abaterea standard a variabilei alternative care evidentiaza contractele cu prime
anuale de valoare mai mica sau egala cu 90 Eur.

Rezolvare: a)
o Populatia statistica este multimea contractelor de asigurare de locuinte din portofoliul companiei W.
o Unitatea statistica este un contract de asigurare de locuinta.
o Variabila statistica sau caracteristica de interes, notata X, este variabila ce arata marimei primei
anuale, in Eur, pentru un contract de asigurare de locuinta incheiat de un agent al companiei; variabila
numerica, continua.
o Agentul a incheiat intr-o luna n=50 de contracte, seria de date statistice referitoare la primele anuale
ale acestor contracte fiind sistematizata intr-o serie de distributie de frecvente pe r=7 variante
distincte. Astfel distributia celor n=50 de contracte dupa valoarea primei anuale, in Eur, este:
Nr. Valoarea x k Eur Numarul de contracte, nk ,
crt. a unei prime anuale (frecventa absoluta)
1 x1  50 Eur n1  2 contracte
2 x2  60 Eur n2  3
3 x3  70 Eur n3  6
4 x4  90 Eur n4  9
5 x5  120 Eur n5  16
6 x6  130 Eur n6  8
7 x7  140 Eur n7  6
7

n
k 1
k  50  n contracte

 x1  50 Eur x2  60 x3  70 x4  90 x5  120 x6  130 x7  120 


sau X :  ,
 n1  2 contracte n2  3 n3  6 n4  9 n5  16 n6  8 n7  6 
7
unde n
k 1
k  50  n contracte.

o Reprezentarea grafica a acestei serii de distributie este poligonul frecventelor absolute.

12
o Poligonul frecventelor sugereaza ca distributia are tendinta de normalitate, dar prezinta asimetrie la
stanga, coada poligonului freventelor absolute fiind mai alungita spre stanga.
o Poligonul frecventelor se mai poate reprezenta si cu ajutorul frecventelor relative

nk
Nr. Valoarea x k Eur Numarul de contracte, nk , Frecventa relativa nk*    0,1
crt. a unei prime anuale (frecventa absoluta) n
1 x1  50 Eur n1  2 contracte n1*  0,04
2 x2  60 Eur n2  3 n2*  0,06
3 x3  70 Eur n3  6 n3*  0,12
4 x4  90 Eur n4  9 n4*  0,18
5 x5  120 Eur n5  16 n5*  0,32
6 x6  130 Eur n6  8 n6*  0,16

7 x7  140 Eur n7  6 n7*  0,12


7 7

 nk  50  n
k 1
contracte n
k 1
*
k 1

13
b)
o Media pentru o serie de distributie de frecvente pe r variante distincte ale variabilei de interes este
r

x  n  ...  xr  nr x k  nk
,
x 1 1  k 1
n1  ...  nr n
r
unde  xk , k  1, r  sunt variantele distincte observate ale variabilei, iar n k  n volumul
k 1
esantionului.
7

In cazul nostru, x k  nk
5310 Eur este valoarea medie a unei prime anuala
x k 1

 106,2
50 50
corespunzatoare unui contract de asigurare de locuinta incheiat de respectivul agent de vanzari.
o Mediana pentru o serie de distributie de frecvente pe r variante distincte se calculeaza parcurgand
urmatorii pasi:
 Cele r variante distincte sunt ordonate crescator x1  x2  ...  xr .
n 1
 Se determina locul medianei, adica  25,5 .
2
 Se calculeaza frecventele absolute cumulate crescator ale celor r variante distincte
Fck  n1  ...  nk , k  1, r .
 Mediana este acea valoare distincta cu proprietatea ca frecventa sa absoluta cumulata
crescator este prima care depaseste locul medianei
Fc1  2  25,5
Fc 2  5  25,5
Fc 3  11  25,5
Fc 4  20  25,5
si Fc 5  36  25,5 , deci a 5-a varianta sau valoare distincta, x5 , este mediana sau
valoarea mediana: Me  x5  120 Eur, adica jumatate dintre contractele incheiat de
agentul de vanzari au o prima anuala de valoare mai cica sau egala cu 120 Eur.

14
Valoarea nk ,
Nr.
crt.
distincta,
(frecventa x k  nk Fck  n1  ...  nk  x k  x  2  nk
x k Eur absoluta)

1 x1  50 n1  2 x1  n1  100 Fc1  n1  2  x2  x  2  n1  6316,88


2 x2  60 n2  3 x2  n2  180 Fc 2  n1  n2  5  x2  x  2  n2  6403,32
3 x3  70 n3  6 420 Fc 3  n1  n2  n3  11 7862,64
4 x4  90 n4  9 810 Fc 4  n1  ...  n4  20 2361,96
5 x5  120 n5  16 1920 Fc 5  n1  ...  n5  36 3047,04
6 x6  130 n6  8 1040 Fc 6  n1  ...  n6  44 4531,52
Fc 7  n1  ...  n7  n  5
7 x7  140 n7  6 840 0  x7  x  2  n7  6854,64
7 7

 xk  nk  531  x  x   nk  3737
2
7

n
k
k  50  n k 1 k 1
k 1 0 8
x  106,2 s x2  762,8163265
sx  s x2  27,61912972
v x  26,01%

o Modul sau valoarea modala pentru o serie de distributie de frecvente pe r variante distincte este acea
varianta sau valoare care apare cu frecventa absoluta sau relativa cea mai mare:
 Frecventa absoluta cea mai mare este:
16  n5  maxnk , k  1, r  .
 valoarea modala este deci a 5-a varianta sau valoare distincta de raspuns a
variabilei de interes, Mo  x5  120 Eur, aceasta fiind valoarea cea mai des intalnita a unei
prime anuale pentru contractele incheiate de respectivul agent.
o Relatia in care se gasesc indicatorii tendintei centrale, x  Me  Mo , ca si reprezentatrea grafica
pentru poligonul frecventelor absolute sau relative, arata ca distributia contractelor dupa valoarea
primelor anuale prezinta asimetrie negativa, in serie predominand valorile mai mari ale primelor
anuale, iar coada distributiei este alungita spre stanga.
o Dispersia in esantion (de selectie) pentru o serie de distributie de frecvente pe r intervale de variatie
este
r

 x  x   nk
2

s x2 
 x1  x  2
 n1  ...   xr  x   nr
2

 k 1
k
,
 n1  ...  nr   1 n 1
r
unde  x 
k , k  1, r sunt variantele distincte observate ale variabilei, n k  n volumul esantionului.
k 1
7

In cazul nostru,  x k  x   nk
37378
2

, iar abaterea standard sau abaterea medie


s x2  k 1
 762,8163 
50  1 50  1
patratica este s x  s x  27,6191 Eur, care arata cu cat se abat, in medie, valorile observate fata de
2

nivelul mediu in esantion al primelor anuale.


sx 27,6191
o Coeficientul de variatie in esantion este v x  100  100  26,01%  30% , ceea ce arata ca
x 106,2
distributia este omogena si media este reprezentativa pentru colectivitate.

15
c) Definim “evenimentul favorabil” ca evenimentul ca un contract de asigurare are o prima anuala de
valoare mai mica sau egala cu 90 Eur. Variabila alternativa care evidentiaza contractele ale caror prime
 0 1
anuale sunt de valoare mai mica sau egala cu 90 Eur este Y :  ,
n  m m 

unde Y  1 pentru unitatile statistice din esantion care verifica evenimentul favorabil, iar m este
numarul de unitati statistice din esantion care verifica evenimentul favorabil,
m  n1  n2  n3  n4  20 contracte,
iar Y  0 pentru unitatile statistice din esantion care nu verifica evenimentul favorabil, n  m este
numarul de unitati statistice din esantion pentru care nu se verifica evenimentul favorabil,
n  m  30 de contracte cu prime anuale mai mari de 90 Eur.

m 20
Media variabilei alternative este y    0,4 , adica 40% dintre contracte au valori ale
n 50
primelor anuale mai mici sau egale cu 90 Eur.
m  m
Dispersia variabilei alternative este s y   1    0,24 , iar abaterea standard
2

n  n
m  m
sy   1    0,48
n  n

16