Sunteți pe pagina 1din 205

Caz 2 GRUPARE PE VARIANTE

Număr de copii (xi)

0
1
2
3
4
Total

1.Identificati notiunile de baza din statistica


Conceptele de bază
Unitatea statistică-familia
Eșantionul-20 de familii
Variabila-nr. De copii
Populația- totalitatea familiilor
din județul Ilfov
Număr de familii( Ni-frecvența
absolută de aparitie)

0 3
1 5
2 8
3 3

4 1

0
1
2
3
4

6. Sa se reprezinte grafic frecventele absolute

Frecvente absolute cumulate cres

25
i
Frecvente absolute cumulate cres

25

Nr familii
20 19

16
15

10
8

5
3

0
0 1 2 3
Nr cop

7 Sa se determine omogenitatea distributiei

ni xi
3 0
5 1
8 2
3 3
1 4
20

dx
vx   100
x

Sx
vx  100
x

8. Sa se determine asimetria seriei de date


Cas =1,7-2/1,12=-0,26
Număr de familii( ni-frecvența absolută de
aparitie)

3
5
8
3
1
n=20

aza din statistica


Modulul

Etapa 1: Se determina frecventa


absoluta maxima
nmax=8

Etapa 2: varianta corespunzatoare acestei


frecvente este valoarea modala
Mo=2 cop

Frecvente absolute cumulate


crescator(Fci)
3
8
16
19
20

ecventele absolute cumulate

recvente absolute cumulate crescator(Fci)


recvente absolute cumulate crescator(Fci)

20
19

16
Frecvente absolute cumulate
crescator(Fci)

2 3 4
Nr cop

atea distributiei
2

x i− x
-2
-1
0
1
2
42%
00

56%

seriei de date
Cas=3(1,7-2)/1,12=-0,80
2 DETERMINATI TOATE CATEGORIILE DE FRECVENTE CUNOSCUTE

Frecvențe relative-ni*
3/20*100=15
5/20*100=25
8/20*100=40
3/20*100=15
1/20*100=5
100

3.Reprezentati grafic structura familiilor dupa nr cop.


Column1
0
1
2

3
4
4.Indicatorii tendintei centrale
Mediana Q2
Etapa 1 Se cumuleaza crescator frecventele absolute
Etapa 2:Locul Me= n+1/2=21/2=10,5

Etapa 3: Se determina prima frecventa cumulata crescat


16> 10,5
Etapa 4: varianta corespunzatoare acestei frecvente este
Frecvente relative
cumulate crescator (Fci*)
15
40
80
95
100
2
( x i− x )
4
1
0
1
4
Abaterea medie patratica (abatere standard)

Dispersia

Abaterea medie liniara


d̄=
∑ |xi− x̄|∗ni
( ∑ ni )−1
Asimetrie negativa , de stinga
EGORIILE DE FRECVENTE CUNOSCUTE

Frecvente absolute cumulate


crescator(Fci)
3
3+5=8
8+8=16
16+3=19
19+1=20

ructura familiilor dupa nr cop.


Ponderea familiilor
15
25
40

15
5
centrale

crescator frecventele absolute


1/2=21/2=10,5

prima frecventa cumulata crescator mai mare decat locul Me

punzatoare acestei frecvente este valoarea mediana

Frecvente absolute cumulate descrescator(Fdi)

25
Frecvente absolute cumulate descrescator(Fdi)

25

Nr familii
20
20
17

15
12

10

5 4

0
0 1 2 3
Nr cop

( x i − x ) ni
2 |x i− x |
12
5
0
3
4
24

atica (abatere standard)

d̄=
∑ |xi− x̄|∗ni
( ∑ ni )−1
stinga
Frecvente relative
cumulate crescator (Fci*)
15
15+25=40
40+40=80
80+15=95
95+5=100

Ponderea familiilor in functie de numarul de cop


5%
15%

15%

25%

40%

0 1 2 3 4
40%

0 1 2 3 4

¯x=(∑_(i=1)^5▒ 〖 x_i n_i 〗 )/(

cator mai mare decat locul Me

este valoarea mediana

0
1
2
3
4

Frecvente absolute cumulate descrescator(Fdi)


Frecvente absolute cumulate descrescator(Fdi)

Frecvente absolute cumulate


12 descrescator(Fdi)

2 3 4
Nr cop

|x i− x |
2
1
0
1
2
1.12249721603218

Esantion de volum mic


1.26315789473684
Frecvente absolute cumulate
descrescator(Fdi)
17+3=20
12+5=17
4+8=12
1+3=4
1

Ponderea familiilor in functie de numarul de copii


5%
15%

15%

25%

40%

0 1 2 3 4
40%

0 1 2 3 4

4. Determinati indicatorii tendintei centrale


Media aritmetica

i=1)^5▒ 〖 x_i n_i 〗 )/(∑_(i=1)^5▒n_i )=

Frecvente absolute cumulate


descrescator(Fdi)
20
17
12
4
1

Fdi)
Fdi)

Frecvente absolute cumulate


descrescator(Fdi)

|x i−x|∗ni
6
5
0
3
2
16

0.842105263157895
Frecvente relative
cumulate
descrescator-Fdi* Column1
100
85
60
20
5

Distributia familiilor dupa nr c


9

8
8

5
5

3
3

2
2

1
1

0
0
1 2 3
Număr de copii (xi) Număr de familii( ni-frecvența
2

1
1

0
0
1 2 3
Număr de copii (xi) Număr de familii( ni-frecvența

ntei centrale

∑_(i=1)^5▒n_i )=x mediu=0*3+1*5+2*8+3*3+4*1/20=

Xmediu=Me=Mo

Me= 2 cop
Distributia familiilor dupa nr cop.

3 3

1 1

2 3 4 5
Număr de copii (xi) Număr de familii( ni-frecvența absolută de aparitie)
1 1

2 3 4 5
Număr de copii (xi) Număr de familii( ni-frecvența absolută de aparitie)

*3+1*5+2*8+3*3+4*1/20=1,7=2 cop

Me=Mo

Repartizarea familiilor dupa nr de c

8
Nr fam.

Număr de familii( Ni-frecvența absolută de apa


Nr cop
Număr de familii( Ni-frecvența absolută de apa
Nr cop
5. Sa se determine cuartilele
Cuartile
Q1 inferioara
Etapa 1: Se cumuleaza crescator frecventele
Etapa 2: Se determina locul Q1
locul Q1=0,25(n+1)=0,25*21=
Etapa3: Se determina prima frecventa cumulata crescato
8> 5,25

Etpa 4: varianta corespunzatoare acestei frecvente este


Q1= 1cop
Q3- superioara

Etapa 1: Se cumuleaza crescator frecventele


Etapa 2: Se determina locul Q3
locul Q3=0,75(n+1)=0,75*21=15,75

Etapa3: Se determina prima frecventa cumulata cre


16>1 5,75
Etpa 4: varianta corespunzatoare acestei frecvente

Q3=2 cop
rtizarea familiilor dupa nr de cop.

0
1
2
3
3
4

de familii( Ni-frecvența absolută de aparitie)


Nr cop
1

de familii( Ni-frecvența absolută de aparitie)


Nr cop
se determine cuartilele

nferioara
a 1: Se cumuleaza crescator frecventele
a 2: Se determina locul Q1
Q1=0,25(n+1)=0,25*21=
a3: Se determina prima frecventa cumulata crescator mai mar

4: varianta corespunzatoare acestei frecvente este Q1


Q3- superioara

Etapa 1: Se cumuleaza crescator frecventele


Etapa 2: Se determina locul Q3
locul Q3=0,75(n+1)=0,75*21=15,75

Etapa3: Se determina prima frecventa cumulata crescator ma


16>1 5,75
Etpa 4: varianta corespunzatoare acestei frecvente este Q3

Q3=2 cop
pa nr de cop.

0
1
2
3
3
4

solută de aparitie)
1

solută de aparitie)
5.25
rescator mai mare decat locul Q1

e este Q1
ata crescator mai mare decat locul Q3

cvente este Q3
5.
Caz 1 serie negrupata

Nivelul profitului anual (mii RON) pentr


firme producătoare de mobilă este:
1.Sa se determine indicatorii tendinte
2.Sa se identifice notiunile de baza din
3. Sa se calculeze cuartilele si omogen
4. Sa se grupeze pe intervale neegale (
5.Sa se determine pe baza gruparii de
6.Sa se determine omogenitatea serie
4. caz 3
var I

Clase de variatie
Gr.mica ; ( 61-82]
Gr mijlocie:(82-94]
Gr mare: (94-120]
Nota: Limita superioara inclusa in inter

Serie de date grupate pe intervale de v


Sa se determine indicatorii tendintei ce
Mediana
Media aritmetica
Column1

Mean

Standard Error

Median

Mode

Standard Deviation

Sample Variance

Kurtosis

Skewness

Range
Minimum

Maximum

Sum

Count
ale.
stica.
seriei de date.
and 3 grupe) valoarea profitului obtinuta
nctul 4, indicatorii tendintei centrale si cua
ate pe baza gruparii de la punctul 4.
1
Numar firme

e- caz 3
5.
6.
85.7

6.342186794264

83.5

#N/A

20.05575561612

402.2333333333

-0.70986294314

0.44362942233

57
62

119

857

10
valoarea profitului obtinuta de cele 10 fir
torii tendintei centrale si cuartilele
ruparii de la punctul 4.
3.
Etapa 1 Se cumuleaza crescator frecven
Etapa 2:Se determina locul medianei: L

Etapa 3: Se determina prima frecventa


7> 5,5
Etapa 4: Se determina intervalul media

Etapa 5:Se aplica formula de calcul a m


Modulul
Etapa 1: Se determina frecventa absolu

Etapa 2: se determina intervalul modal

Etapa3: Se aplica formula de calcul a M


Dispersia
Abaterea medie patratica(DEVIATIE ST
7.Testati empiric normalitatea
distributiei

8.Determinati coeficientul de asimetrie


0 firme din domeniul industrie si sa se repr

Q1
Etapa 1: Se ordoneaza crescator seria d
Etapa 2: serie para

Etapa 3: Se determina loculQ1= 0,25(n


Etapa 4: Q1=x2*0,2+x3*0,8=63*0,2+64
Q2=Me

Q3

Etapa 1: Se ordoneaza crescator seria d


Etapa 2: serie para
Etapa 3: Se determina loculQ3= 0,75(n
Etapa 4: Q3=x8*0,7+x9*0,3=97*0,7+11
IQR=Q3-Q1=38,3
var 2

Gr mica:[62-82)
Gr mijlocie:[82-97)
Gr mare:[97-120)
Total
Nota: Limita inferioara inclusa in interv

cventele absolute
ei: Locul Me= n+1/2=11/2=5,5

nta cumulata crescator mai mare decat loc

edian ca fiind intervalul caruia ii corespund

Me apartine intervalului : [82-97)


a medianei
soluta maxima:
nmax=4
odal ca fiind intervalul cu frecventa absolut

Mo apartine intervalului : [82-97)


a Mo

Mo=x_0+h_ ⋅Δ_1/(Δ_1+Δ_2
¯x=(∑_(i=1)^5▒ 〖 x_i n_i 〗

Esantion de volum mic


E STANDARD)
s=√(s^2 )=√((∑_(i=1)^r▒ 〖 (x_i-¯

Coef de variatie
Abaterea medie liniara

d̄=
∑ |xi− x̄|∗ni
( ∑ ni )−1

d̄≃ 0 , 8∗S
etrie Pearson pe baza modulului
2.
Populatia
esantionul
variabila
unitatea statistica
ustrie si sa se reprezinte grafic rezultatul o

a crescator seria de date

a loculQ1= 0,25(n+1)=0,25*11=2,8
x3*0,8=63*0,2+64*0,8=63,8
a crescator seria de date

a loculQ3= 0,75(n+1)=0,75*11=8,3
x9*0,3=97*0,7+114*0,3=102,1
frecvente absolute

Numar firme-ni
3
4
3
10
ra inclusa in interval
2=5,5

mai mare decat locul Me

aruia ii corespunde frecventa cumulata cre

ului : [82-97)
frecventa absoluta maxima

ului : [82-97)

_1/(Δ_1+Δ_2 )
▒ 〖 x_i n_i 〗 )/(∑_(i=1)^5▒n_i
89.95

Mo< X mediu<Me
=1)^r▒ 〖 (x_i-¯x)^2 n_i 〗 )/(∑_(i=1)^

v_x=S_x/x ̄ ⋅100
x̄|∗ni
−1

8∗S
dulului
totalitatea firmelor de mobila
10 firme
profitul, cantitativa, continua
firma,complexa
zinte grafic rezultatul obtinut.

date

1)=0,25*11=2,8
0,8=63,8
date

1)=0,75*11=8,3
*0,3=102,1
Abaterea intercuartilica

Media
Fci-frecvente cumulate crescator
3
7
10

4.5 Dist
4
3.5
3
2.5
2
1.5
1
3
2.5
2
1.5
1
0.5
Me 0
Gr mic

frecventa cumulata crescator mai mare dec


maxima
/(∑_(i=1)^5▒n_i )=
^2 n_i 〗 )/(∑_(i=1)^r▒n_i -1))

14.9060949502768

⋅100
12.3666666666667

11.9248759602214
0,8*S
0.0302013422818794
85.7
lim inf+lim sup/2

Xi-centrul de
interval xi*ni
72 216
89.5 358
108.5 325.5
899.5

Distributia firmelor dupa valoarea profitului-ni


Gr mica:[62-82) Gr mijlocie:[82-97) Gr mare

mare decat locul Me

92.4
89.5
Seria de date prezinta asimetrie

222.191667
16.57153413038
In medie valoarea profitului este de 85
89.95

(xi-xmediu)
-17.95
-0.450000000000003
18.55

ea profitului-ni
97) Gr mare:[97-120)

82+15*(5,5--3)/4
metrie
ofitului este de 85,7 mii Ron pe o firma din
(xi-xmediu)2
322.2025
0.202500000000003
344.1025
varianta a 3-a

[62-80)
[80-95)
[95-120)
Nota: Limita inferioara inclusa in interv

ii Ron pe o firma din esantionul tipic.


(xi-xmediu)2*ni
966.6075
0.81000000000001
1032.3075
1999.725
Se observa ca 70% dintre firme au nive
Serie de date negrupata
Caz 1
Interpretare:
Interpretare:

Nr firme

erioara inclusa in interval

esantionul tipic.
Ixi-xmediuI
17.95
0.45
18.55
Quartilele

Etapa 1 Se cumuleaza crescator frecven


Etapa 2:Se determina locul cuartilelor:
Etapa 3: Se determina prima frecventa
3> 2,8 si 10>8,25
Etapa 4: Se determina intervalul cuarti

Q1 apartine intervalului : [62


Q3 apartine intervalului : [97
Etapa 5: Se aplica formula
7.Calculați media pentru caracteristica
Media variabilei alternative se calculea

Unde:
m - numărul de unități în stare favorab
n - numărul total de unități din eșantio

Salariul (lei)
Sub 90 (DA)

Mai mare sau egal cu


90 mii ROn (NU)

Total

0% dintre firme au nivelul profitului mai mi


upata
1. Mediana
Etapa 1: Se ordoneaza
Etapa 2: serie para
Etapa 3: Se determina
Etapa 4: Me=83+84/2=
Interpretare:
Modulul
Mo =valoarea care se r
Seria nu prezinta valoa
Ixi-xmediuI*ni
53.85
1.8
55.65
111.3
caz 3

aza crescator frecventele absolute


ina locul cuartilelor: Locul Q1=0,25( n+1)=0
Locul Q3=0,75*(n+1)=0
mina prima frecventa cumulata crescator m

mina intervalul cuartilic ca fiind intervalul ca

ntervalului : [62-82)
ntervalului : [97-120)
ormula
pentru caracteristica nivel al profitului < 90
ternative se calculează după relația:

w=m/n

nități în stare favorabilă,


de unități din eșantion (volumul eșantionul

Media
w=m/n=
7/10 =0,7
m=3+4=7

1-w=1-
n-m=3 0,7=0.3

10 1

lul profitului mai mic de 90 mii Ron, în timp


Se ordoneaza crescator seria de date
serie para
Se determina loculMe= n+1/2=11/2=5,5
Me=83+84/2=83,5
are:

area care se repeta de cele mai multe ori


prezinta valoare modala

25% dintre firme ce formeaza esantion


valoare a profitului sub 63,8 mii RON ia
realizat o valoare a profitului peste 63,
75% dintre firmele ce formeaza esantio
profit sub 105,5 mii RON, iar 25% au re
105,5 mii RON
4.5
4
3.5

Firme
3
2.5
2
1.5
1
0.5
0
olute
=0,25( n+1)=0,25*11=2,8
=0,75*(n+1)=0,75*11=8,25
a crescator mai mare decat locul Q1 si Q3

d intervalul caruia ii corespunde frecventa


profitului < 90 mii RON
relația:

mul eșantionului) .
mii Ron, în timp ce 30% dintre firme au nive
50% din profitul anual este mai mic de
or dupa profit

Gr mica:[62-82)
Gr mijlocie:[82-97)
Gr mare:[97-120)
i mare decat locul Q1 si Q3
sau egal cu 90 mii RON.
ai mic de 83,5 mii Ron iar 50% din valoarea
de 83,5 mii Ron iar 50% din valoarea profit
80.6666666666667
106.583333333333
oarea profitului este mai mare de 83,5 mi
85.7
Omogenitatea seriei de date
Profit xi-x mediu
62 -23.7
63 -22.7
64 -21.7
82 -3.7
83 -2.7

84 -1.7
89 3.3
97 11.3
114 28.3
119 33.3

857

v_x=d ̄_x/x ̄ ⋅100
de 83,5 mii Ron
Ixi-x mediuI
23.7
22.7
21.7
3.7
2.7

1.7
3.3
11.3
28.3
33.3

152.4

 ̄ ⋅100
25% dintre firme au avut un nivel al pro
75% dintre firme au avut un nivel al pro
(xi-x mediu)2
561.69
515.29
470.89
13.69
7.29

2.89
10.89
127.69
800.89
1108.89

3620.1

0.1975884869701
19.75%
u avut un nivel al profitului mai mic de 80,6
u avut un nivel al profitului mai mic de 106
v_x=S_x/x ̄ ⋅100

16.933333333333
s=√(s^2 )=√((
ofitului mai mic de 80,66 mii RON, iar 75%
ofitului mai mic de 106,58 mii RON , iar 25
=S_x/x ̄ ⋅100
s=√(s^2 )=√((∑_(i=1)^n▒(x
80,66 mii RON, iar 75% au avut un nivel al
106,58 mii RON , iar 25% au avut un nivel a
0.23402281932456
23.40%
√((∑_(i=1)^n▒(x_i-¯x)^2 )/(n-1
75% au avut un nivel al profitului mai mare
r 25% au avut un nivel al profitului mai ma
402.2333
¯x)^2 )/(n-1))
20.05576
fitului mai mare de 80,66 mii RON.
rofitului mai mare de 105,58 mii RON.
Pentru 5 sucursale ale unei bănci comerciale au fost înregistrate valorile creditelor în luna decembrie 2006 şi anum
1.Care este valoarea medie a creditelor acordate în luna decembrie 2006?
2.Determinati mediana si modulul seriei de date.(Determinati indicatorii tendintei centrale)
3. Sa se determine cuartilele.(Indicatori de pozitie)
4. Identificati conceptele de baza utilizate in statistica.

4. Esantionul: 5 sucursale ale BComerciala


Unitatea statistica:sucursala, complexa
Variabila statistica: valoarea creditelor, numerica, discreta
Populatia:totalitatea sucursalelor BComerciale

Vom nota:
n=Sni-volum al esantionului = 5 sucursale
xi=valorile variabilei valoarea creditelor

1. Caz1: Date negrupate ( un sir de valori)


Euro/sucursală
5
∑ xi 200 . 000+240 . 000+250 . 000+180 .000+160. 000
i=1
x= =medie a creditelor acordate în luna decembrie 2006=206
Valoarea a fost. 000
206 mii Euro pe o sucursala din esantionul tipi
5 5

Modul=0 ( Modulul pentru o serie de date negrupate reprezinta valoarea care se repeta de cele mai multe ori)

Seria de date nu prezinta valoare modala.

Mediana-valoarea centrala a unei serii de date


Pentru caz 1 se parcurg etapele:
Etapa1: Se ordoneaza crescator valorile seriei

160 mii, 180 mii, 200 mii, 240 mii, 250 mii

Etapa 2: Se determina tipul seriei: serie impara

Etapa 3: Me este valoarea termenului de mijloc: Me=200 mii Euro

50% dintre sucursale au incasat o valoare a creditelor in luna decembrie 2006 sub 200 mii Euro iar 50% dintre sucu

Cuartilele-valori care impart seria in 4 parti egale

Caz1: Date negrupate (un sir de valori)


Etapa 1: Se ordoneaza crescator valorile seriei de date

160 mii, 180 mii, 200 mii, 240 mii, 250 mii
Etapa 2: Se determina locul cuartilelor
locul Q1=0,25*(n+1)=0,25*6=1,5
locul Q3=0,75*(n+1)=0,75*6=4,5
Q2=Me → locul Me=n+1/2, dar pentru ca avem o serie de date impara nu se determina locul Q2=Me=200 mii

Etapa 3: Se determina cuartila 1 ca o medie aritmetica simpla din valorile celor 2 termeni specificati de locul Q1
Q1=x1+x2/2=160mii+180mii/2=170 mii Euro
Se determina cuartila 3 ca o medie aritmetrica simpla din valorile celor 2 termeni specificati de locul Q3
Q3=x4+x5/2=240+250/2=245 mii Euro
→Concluzie:
Me ≠ x̄
deci seria de date nu este simetrica, prezinta asimetrie, adica avem o distributie pozitiv asimetrica. In seria mea de
a decembrie 2006 şi anume: 200.000 Euro; 240.000 Euro; 250.000 Euro; 180.000 Euro; 160.000 Euro.

ucursala din esantionul tipic.

de cele mai multe ori)

mii Euro iar 50% dintre sucursale au incasat o valoare a creditelor peste 200 mii Euro.
locul Q2=Me=200 mii

i specificati de locul Q1

cati de locul Q3

asimetrica. In seria mea de date predomina valori mici ale valorilor creditelor în luna decembrie 2006
1. Procentul din profit cheltuit de 70 de firme pentru reclamă şi publicitate în anul 2007 a avut următoarea distr

% pentru reclamă şi publicitate Nr. firme (ni)


0,6-1,0 14
1,0-1,4 18
1,4-1,8 24
1,8-2,2 8
2,2-2,6 4
2,6 si peste 2
Total 70
Notă: limita inferioară inclusă în interval.
Se cere:
a) Să se reprezinte grafic distributia firmelor in functie de procentul din profit cheltuit pentru reclamă şi publi­ci­t
b) Caracterizati colectivitatea folosind indicatorii tendintei centrale;
c) Analizati omogenitatea si asimetria colectivitatii;
d) Determinati media şi dispersia firmelor care au cheltuit mai mult de 2,2% din profit pentru reclamă şi publicit
e) Estimati procentul mediu din profit cheltuit pentru reclamă şi publi­ci­tate din colectivitatea generala, in ipote

% cheltuit pentru reclamă şi


publicitate Frecvenţe absolute Centre de interval (xi)
(nr. firme)
2
(ni) xi x i ni x i−x ( x i−x ) ni
0,6-1,0 14 0,8 11,2 -0,66 6,098
1,0-1,4 18 1,2 21,6 -0,26 1,217
1,4-1,8 24 1,6 38,4 0,14 0,470
1,8-2,2 8 2,0 16 0,54 2,333
2,2-2,6 4 2,4 9,6 0,94 3,534
2,6-3,0 2 2,8 5,6 1,34 3,591
Total 70 - 102,4 17,244

a ) HISTOGRAMA

Distribuţia firmelor după procentul cheltuit pentru reclamă şi publicitate

b) Indicatorii tendintei centrale :


Media x=
∑ x i ni =102 , 4 =1 , 4628≈1 , 46
∑ ni 70
Aşadar, o firmă din cele 70 luate în studiu a cheltuit, în medie, 1,46% din profit pentru reclamă şi publicitate.
Mediana (Me)
FCi locMe =
∑ ni +1 =71 =35 , 5
2 2
Mediana se găseşte în intervalul 1,4-1,8.
loc Me− Fc Me −1 35 ,5−32
Me= x 0 +h =1 , 4+0 , 4⋅ = 1, 458
n Me 24
loc Me− Fc Me −1 35 ,5−32
Me= x 0 +h =1 , 4+0 , 4⋅ = 1, 458
n Me 24
Deci, 50% din firme au cheltuit pentru reclamă şi publicitate mai mult de 1,458 % din profit, iar 50% mai puţin.

Δ1
Modul Mo = x 0 + h
Δ1+ Δ2
unde:
x0 = limita inferioară a intervalului modal;
h = mărimea intervalului modal;
Intervalul modal este intervalul cu frecvenţa maximă: [1,4-1,8)
∆1 = frecvenţa intervalului modal minus frecvenţa intervalului anterior celui modal;
∆2 = frecvenţa intervalului modal minus frecvenţa intervalului următor celui modal;
Se obţine 24−18
Mo=1 , 4 +0 , 4⋅ =1 ,52 % .
( 24−18 )+( 24−8 )
Cele mai multe firme au cheltuit pentru reclamă şi publicitate 1,52% din profit.

c) Omogenitatea
s
se determina coeficientul de variaţie: v= ⋅100
x

Dispersia variabilei în eşantion este:

s= √ s2
Abaterea medie pătratică va fi:

s= √ 0 ,2463=0 , 4963≈
s 0 ,5 0,5
iar coeficientul de variaţie: v = x ⋅100 = ⋅100=34 , 24 %
x 1 , 46
< 35%, ceea ce înseamnă că media calculată este reprezentativă, colectivitatea fiind omogenă.
asimetria

coeficientul de asimetrie Pearson


x − Mo 1 , 46−1 ,52
Cas= Cas= =−0 , 12
sx 0 , 4963
< 0 ceea ce arată o asimetrie uşoară, negativă, în serie predomină valorile mari.

d) Se creează o caracteristică alternativă cu o stare favorabilă (firmele care au cheltuit peste 2,2%) şi o stare nef
Media caracteristicii alternative este: m 6
w= = = 0 , 086≈ 0 , 09
(în medie, 9% din firme au cheltuit peste 2,2%) n 70
iar dispersia:
. 2
s =w ( 1− w )= 0 , 09⋅0 , 91=0 , 08
7 a avut următoarea distribuţie:

entru reclamă şi publi­ci­tate;

entru reclamă şi publicitate;


itatea generala, in ipoteza ca cele 70 de firme formeaza un esantion selectat aleator, iar probabilitatea de garantare a rezultatelor este 95

Fci
14 30
Număr de firme

32 25
56 20
64
15
68
10
70
5

0
0,6-1,0 1,0-1,4 1,4-1,8 1,8-2,2 2,2-2,6 2,6-3,0
procentul pt. reclama si publicitate

amă şi publicitate.

= 1, 458
= 1, 458
t, iar 50% mai puţin.

34 , 24 %

=−0 , 12

este 2,2%) şi o stare nefavorabilă (firmele care au cheltuit mai puţin de 2,2%).
086≈ 0 , 09
ntare a rezultatelor este 95% (z=1.96)
Distribuţia celor 54 de agenţi comerciali ai unei firme ce comercializează produse cosmetice de după numărul de z

Zile
lucrate Număr vânzători
21 6
22 7
23 14
24 11
25 9
26 4
27 3
Total 54
Se cere:
a) Să se reprezinte grafic distribuţia vânzătorilor după numărul de zile lucrate;
b) Să se determine numărul mediu de zile lucrate şi să se studieze dacă valoarea obţinută este reprezentativă;
c) Care este numărul de zile lucrate peste care se situează 50% din vânzători?
d) Să se analizeze asimetria distribuţiei.

Rezolvare:
a) În tabel avem o serie de distribuţie de frecvenţe pe variante, variabila analizată X fiind „număr zile lucr

vezi grafic

b) Se calculează numărul mediu de zile lucrate cu ajutorul mediei aritmetice ponderate:

Zile lucrateNumăr vânzători


2
(xi) (ni) x i⋅ni ( x i− x̄ ) ni FCi
0 1 2 3 4
21 6 126 40,56 6
22 7 154 17,92 13
23 14 322 5,04 27
24 11 264 1,76 38
25 9 225 17,64 47
26 4 104 23,04 51
27 3 81 34,68 54
Total 54 1276 140,64 -

Aşadar, un vânzător din cei 54 luaţi în studiu a lucrat, în medie, aproximativ 23 de zile şi jumătate.
Pentru a verifica reprezentativitatea mediei obţinute, trebuie calculat coeficientul de variaţie, pe baza abaterii med
s
v= x⋅100
x
Dispersia variabilei este: ∑ ( x i −x ) 2 ni 140 , 64
s2x= = =2, 6044
∑ i n 54
∑ ( x i −x ) 2 ni 140 , 64
s2x= = =2, 6044
. ∑ ni 54
Calculele intermediare necesare în determinarea dispersiei sunt prezentate în tabel.

Abaterea medie pătratică va fi:


zile. x s = √ s2 x s x= √2 , 6044=1 , 61
s 1 ,61
iar coeficientul de variaţie: v= x⋅100= ⋅100=6 , 8 %
x 23 , 6
< 35%, ceea ce înseamnă că media calculată este reprezentativă, colectivitatea fiind foarte omogenă.
c) Se cere determinarea medianei
Mediana (Me)
locMe=
∑ ni +1 55 = =27 , 5
2 2
Me = 24 zile.
Deci, 50% din vânzători au lucrat mai mult de 24 de zile, iar 50% mai puţin.

d) Analizăm asimetria distribuţiei cu ajutorul coeficientului de asimetrie al lui Pearson.


x−Mo 23 , 6−23
Cas= = =0 , 37
sx 1 ,61
Cas ϵ [-1,1]
Mo = 23 zile (nivelul variabilei cu frecvenţa cea mai mare).
Valoarea coeficientului de asimetrie indică fapul că seria este moderat asimetrică la dreapta

Cas ϵ [-3,3]

Valoarea coeficientului de asimetrie indică fapul că seria este moderat asimetrică la stanga.

P2: Un profesor doreşte să vadă care au fost rezultatele medii obţinute de studenţii săi la examen. De asemenea, a

8,1 9,2 3,0 7,9 9,0 6,9 9,6 3,9


9,4 9,3 7,3 7,8 8,6 5,7 9,8 9,3
9,5 7,0 8,1 9,1 7,5 8,2 8,3 6,5
8,4 4,8 8,1 9,6 9,1 9,6 8,3 4,1
5,3 6,9 6,6 9,4 8,0 5,5 8,4 6,6
7,2 8,3 8,7 7,4 9,4 9,0 8,4 9,5
Rezolvare folosind EXCEL:
Instrumentul de analiză Descriptive Statistics generează un raport de statistici univariate pentru datele din zona de
Pentru obținerea indicatorilor tendinței centrale și pentru indicatorii variabilității accesăm: Data/Data Analysis/Des
Pentru instalarea modului Data Analysis procedăm astfel:
1. Din mediu, accesăm File/Options/Add-ins/Go/Analysis ToolPak – VBA și enter
2 În fereastra deschisă, bifăm opțiunea Analysis ToolPak și OK (enter)
Rezultatul prelucrarii optiunii Descriptive Statistics.

Note
Mean
7.398
Standard E 0.215022
Median 8.1
Mode 8.4
Standard D 2.150216
Sample Var 4.62343
Kurtosis 0.393661
Skewness -1.0731
Range 8.9
Minimum 1.1
Maximum 10
Sum 739.8
Count 100
Media notelor obţinute la examen este 7,398 (Mean) cu mediana 8,1 (Median). Modulul este 8,4 (Mode). Acesta e
Cea mai mică notă obţinută a fost 1,1 (Minimum) iar cea mai mare Maximum = 10. Amplitudinea (diferenţa între va
Variaţia măsurată prin dispersie este 4,62 (Sample Variance) iar abaterea medie pătratică este 2,15 (Standard devia
Deoarece Skewness este negativ şi mult diferit de zero (-1,07) seria de date este puternic asimetrică negativ, curba
Kurtosis este 0,39, pozitiv, ceea ce înseamnă că avem o curbă ascuţită (distribuţie leptocurtică).S-au înregistrat ven
tice de după numărul de zile lucrate în luna iulie este următoarea:

ă este reprezentativă;

ată X fiind „număr zile lucrate”. Pentru reprezentarea grafică se foloseşte diagrama prin coloane (column Chart)

x=
∑ x i ni =1276 =23 , 6 aproximativ 24 zile
∑ ni 54

riaţie, pe baza abaterii medii pătratice:


rte omogenă.

a examen. De asemenea, ar vrea să observe care a fost variaţia notelor. Calculaţi mărimile necesare. Notele obţinute de studenţi la exame

9,4 8,8 6,5 7,3 8,4 8,3 9,5 3,8 9,7


8,3 9,9 4,2 9,9 5,1 8,4 9,0 8,8 5,9
3,4 8,9 4,3 8,5 7,5 6,4 6,4 9,3 8,6
10,0 2,5 4,8 7,1 8,9 6,1 7,7 7,6 1,8
3,4 9,8 7,2 1,1 3,8 8,5 7,7 9,6 5,0
9,0 7,3 9,9 8,5 7,1 3,7 1,6

pentru datele din zona de intrare, furnizând informații despre tendința centrală și variabilitatea datelor.
m: Data/Data Analysis/Descriptive Statistics
este 8,4 (Mode). Acesta este posibil să nu fie singurul, deoarece EXCEL nu afişează decât o singură valoare.
litudinea (diferenţa între valoarea minimă şi cea maximă) este 8,9 (Range).
ă este 2,15 (Standard deviation). Eroarea standard (acest indicator va fi explicat la capitolul de sondaj statistic) este 0,215 (Standard Error)
c asimetrică negativ, curba fiind alungită spre stânga. Predomina valori mari ai in ceea ce priveste notele.
curtică).S-au înregistrat veniturile a 310 salariați ai unei companii din domeniul IT( indicatori ce vor fi prezentati in cursul urmator).
inute de studenţi la examen au fost următoarele:
este 0,215 (Standard Error).

in cursul urmator).
Problema 3. Un studiu efectuat asupra unui număr de 50 de cutii de brânză topită la cutie dintr-un magazin a relief
Calorii- [75-85) [85-95) [95-105)
Nr. cutii cu 5 10 15 –frecv maxima
brânză topită
Frec absolute cumulate crescator (Fci) 5 15 30 >25,5
Se cere: 1. Identificati conceptele de baza din statistica
2.Să se calculeze indicatorii tendinţei centrale
3. Sa se reprezinte grafic distributia nr de cutii de branza topita in functie de nr de calorii
1. Populatia: Totalitatea cutiilor de branza topita din magazin
Unitatea statistica: cutia de branza topita
Esantionul: 50 de cutii de brânză topită la cutie
Variabila: numar de calorii, cantitativa, continua
Vom nota: xi-numar calorii
Volumul es= n=Sni=50 cutii de brânză topită
2.Caz3: seria de date este grupata pe intervale egale de variatie
Indicatorii tendinţei centrale sunt:
a1) Media – se calculează ca o medie aritmetică ponderată
xi -reprezintă centrul de interval calculat ca medie aritmetică simplă între limita inferioară şi limita superioară a fiec
lim . inf + lim . sup
x1=75+85/2=80 xi=
2
x2=85+95/2=90
x3=95+105/2=100, etc.

Numarul mediu de calorii /cutie din esantionul tipic a fost de 101,2 calorii.
5
∑ x i ni
80⋅5 +90⋅10 +100⋅15 +110⋅14 +120⋅6 5060
i=1
x= 5
= = = 101 , 2 ca
50 50
∑ ni
i=1
a2) Mediana (valoarea centrală a seriei):
Etapa 1: Se cumulează crescator frecvenţele absolute (vezi tabel)
Etapa 2: Se determina locul Me in serie:

5
1 1
Locul Me : ( ∑ ni +1)= ⋅51=0 , 5∗(50+1)=25 ,5
2 i=1 2
Etapa 3: Se determina intervalul median astfel : este intervalul in care prima frecventa cumulata crescator este ma
Intervalul care corespunde frecvenţei absolute cumulate crescator ce îndeplineşte condiţia de mai sus este interva
30 > 25,5 ®MeÎ[95-105)
Etapa 4: Me se calculează cu relaţia:

loc Me −F c ( Me−1 ) 25 , 5−15


Me=x 0 +h⋅ =95+10⋅ =102 calorii/ cutie
nMe 15
x0 = limita inferioară a intervalului median=95;
h = mărimea intervalului de grupare ;pasul de numarare=10
Fc(Me-1) = suma frecvenţelor absolute până la intervalul median, sau frecventa absoluta cumulata crescator anter
nMe = frecvenţa absolută a intervalului median=15.
Deoarece Me = 102 calorii Þ 50% din cutii au sub 102 calorii, iar 50% au peste 102 calorii din esantionul tipic..
a3) Modulul (dominanta seriei):
Etapa1: Se determina frecventa absoluta maxima
n3=15=frecventa absoluta maxima→n max=15 cutii de branza topita
Etapa 2: Se determina intervalul modal, ca fiind intervalul caruia ii corespunde frecventa absoluta maxima.
MoÎ[95-105)
Etapa 3: Modulul se determina conform relatiei de calcul:

Δ1 15−10
Mo= x 0 + h⋅ =95+10⋅ =103 , 33 calori
Δ1 + Δ 2 ( 15−10 )+( 15−14 )

x0 = limita inferioară a intervalului modal=95;


h = mărimea intervalului modal=10;
D1 = diferenţa dintre frecvenţa absolută a intervalului modal şi frecvenţa absolută a intervalului anterior celui mod
D2 = diferenţa dintre frecvenţa absolută a intervalului modal şi frecvenţa absolută a intervalului următor celui mod
Majoritatea cutiilor de branza topita din esantionul tipic au 103,33 calorii.
Concluzie: Me≠Mo≠ x̄
,
Seria de date nu este simetrica, prezinta asimetrie de stanga, deci in seria de date predomina valori mari ale variab
2. Se utilizeaza in acest caz urmatoarele tipuri de grafice: histograma, diagrama prin coloane, diagrama prin benzi,

4.Sa se determine omogenitatea distributiei


Calorii-xi Nr cutii branza(ni) xi
[75-85) 5 80
[85-95) 10 90
[95-105) 15 100
[105-115) 14 110
[115-125) 6 120
Total 50

xmediu=101

Dispersia
Deviatia standard
(Abaterea medie patratica)

Coeficientul de variatie

vx=11,60/101*100=11,48%
Sa se determine asimetria distributiei numarului de cutii de branza dupa numarul de calorii
Me=102
Mo=103

Coeficientul de asimetrie al lui Pearson


•valorile negative indică o asimetrie negativă de stinga iar cele pozitive o asimetrie pozitivă de dreapta
•valoarea 0 indică o repartiţie simetrică

Cas = Xmediu-Mo/Sx

Cas=3( Xmediu-Me)/Sx
a cutie dintr-un magazin a reliefat următoarele informaţii cu privire la numărul de calorii conţinute:
[105-115) [115-125)
14 6

44 50

erioară şi limita superioară a fiecărui interval:

5060
= = 101 , 2 calorii/cutie
50

nta cumulata crescator este mai mare decat loculMe.


condiţia de mai sus este intervalul median.

=102 calorii/ cutie


soluta cumulata crescator anterioara intervalului median=15

alorii din esantionul tipic..

venta absoluta maxima.

=103 , 33 calorii / cutie


4)

a intervalului anterior celui modal=15-10;


a intervalului următor celui modal=15-14.

predomina valori mari ale variabilei (numar de calorii)


n coloane, diagrama prin benzi, diagrama de structura (cerc) daca se reprezinta ponderea cutiilor de branza, diagrama frecventelor cumula

Xi-xmediu (Xi-xmediu)2 (Xi-xmediu)2*ni


-21 441 2205
-11 121 1210
-1 1 15
9 81 1134
19 361 2166
6730

6730/50=134,6
pozitivă de dreapta

Cas= 101-103/11,60= -0,17


asimetrie redusa , negativa , de stanga, in serie
Cas= 3(101-102)/11,60=-0,25 predomina valori destul de mari ale numarului de calorii
diagrama frecventelor cumulate.
P 1. Valoarea vânzărilor realizate în cadrul a 10 supermarketuri într-o lună se caracterizează prin seria d

Se cere:
1) Să se determine valoarea modală şi mediană a vânzărilor şi să se interpreteze valorile obţinute;
2) Să se calculeze media seriei, verificându-se reprezentativitatea acesteia.(indicatorii sintetici ai vari
3) Sa se determine indicatorii simpli ai variatiei
4) Sa se analizeze asimetria setului de date prin calculul si interpretarea coeficientului de asimetrie P

Rezolvare

Notaţii: xi : vectorul valoarilor inregistrate ale vânzărilor


Caz 1 –date negrupate
1. Valoarea modală (Modul) şi mediană (Mediana) formează indicatorii medii de poziţie şi se determină
Modul (Mo) este valoarea care se repetă de cele mai multe ori. Seria are doua valori
seria de date este bimodală.
Mediana (Me) – Valoarea centrală a unei serii
Et. 1 – se ordonează crescător valorile vânzărilor realizate: 10, 20, 30, 40, 40, 50, 50, 58, 60, 64
Et. 2 – n +1 10 +1
Locul Me → L Me= = =5,5
2 2
Et. 3 Tipul seriei de date (para) – se determină mediana ca o medie aritmetică simplă a termenilor de m

x5 + x 6 40 +50
Me= = =45mii u . m
2 2

Cele 10 supermarketuri realizează într-o lună vânzări în majoritate de 40 mii u.m. res

2. Pentru determinarea reprezentativităţii mediei este necesar să determinăm coeficientul de variaţie d


Sx
v= ⋅100

· Media aritmetică ( x̄)
se calculeaza dupa formula simpla:

x̄=
∑ x i =30+60+ 40+50+20+ 50+ 40+10+58+64
=
422
= 42,2
n 10 10

· Dispersia ( 2
S)
∑ ( x i− x̄ ) 2 (30− 42,2 )2 + ( 60− 42,2 )2 + ( 40− 42,2 )2 +⋯+( 64−
2
S = =
n-1 9
=316 , 86
· Abaterea (deviatia) standard: S x= √ S x 2= √ 316 , 86=17 ,80
mii u.m.
S x= √ S x 2= √ 316 , 86=17 ,80
· Coeficientul de variaţie (v ) Sx 17,80
v= ⋅100= ⋅100= 42,18%
x̄ 42,2
cv > 5% apreciem ca seria de date este foarte omogena iar media este o valoare foarte reprezentativa.
cv ≤ 33% apreciem ca datele sunt omogene iar media este o valoare reprezentativa,
Aşadar un supermarket din cele 10 luate în studiu a realizat în medie într-o lună o valoare a vânzărilor d
x̄ ) sunt negative atunci înseamnă că acestea înregistrează valori sub media vânzărilor. Valoarea coeficien

3. Indicatorii simpli ai variatiei

Amplitudinea absoluta a variatiei

A= xmax-xmin=64-10=54 mii um

Abaterile individuale absolute

di=xi- x̄
( vezi table)

Abaterile individuale relative

d%=
xi− x̄ vezi tabel
∗100

Val. Vanz di=xi-x mediu d%=(xi-xmediu/xmediu)*100
10 -32.2 -76.3
20 -22.2 -52.61
30 -12.2 -28.91
40 -2.2 -5.21
40 -2.2 -5.21
50 7.8 18.48
50 7.8 18.48
58 15.8 37.44
60 17.8 42.18
64 21.8 51.66

4. Coeficientului de asimetrie Pearson.

x− Mo
Cas=
sx
= 3( 42 , 2− 45)
=− 0 , 47
17 , 80
Seria de date prezinta o asimetrie moderata, negativa, de stanga.In seria de date predomina valori mari
Indicatorii descriptivi
Val. Vanz

Mean 42.2 Media aritmetica


Standard Error 5.628893714 Eroarea standard
Median 45 Mediana
Mode 40 Modulul
Standard Deviatio 17.80012484 Abaterea (deviatia standard)
Sample Variance 316.8444444 Dispersia
Kurtosis -0.564930247 Coeficientul de aplatizare
Skewness -0.622331056 Coeficientul Fisher de asimetrie
Range 54 Amplitudinea absoluta a variatiei
Minimum 10 Valoarea minima
Maximum 64 Valoarea maxima
Sum 422 Suma valorilor
Count 10 Numarul de observatii

5) Sa se determine cuartilele
locul Q1=0,25*(n+1)=0,25*11=2,75
Q1=x2+x3/2=20+30/2=25
loculQ3=0,75*(n+1)=0,75*11=8,25
Q3=x8+x9/2=58+60/2=59
racterizează prin seria de date (mii u.m..): 30, 60, 40, 50, 20, 50, 40, 10, 58, 64.

eze valorile obţinute;


ndicatorii sintetici ai variatiei)

ficientului de asimetrie Pearson.

e poziţie şi se determină astfel:


ori. Seria are doua valori modale: M 01=50mii u . m M 02 =40mii u . m⇒

50, 50, 58, 60, 64

implă a termenilor de mijloc (centrali)

ritate de 40 mii u.m. respectiv 50 mii u.m. Jumătate dintre acestea realizează vânzări peste 45 mii u.m. iar jumătate sub 45 mii u.m.

coeficientul de variaţie după relaţia:

64 422
= = 42,2 mii u . m
10

42,2 )2 +⋯+( 64−42 . 2)2

86=17 ,80
86=17 ,80

⋅100= 42,18%

e foarte reprezentativa.

ă o valoare a vânzărilor de 42,2 mii u.m.. cu o deviatie standard de 17,8 mii u.m. care ne arată că în medie valoarea vânzărilor realizate de
ărilor. Valoarea coeficientului de variaţie (cv) este cv > 40%) ceea ce ne indică faptul că eşantionul are o omogenitate redusă, media de 42,

− Mo
sx

te predomina valori mari ale val. vanzarilor.


tate sub 45 mii u.m.
rea vânzărilor realizate de cele 10 supermarket-uri se abat de la media eşantionului de 42,2 mii u.m. în plus sau în minus. Pentru acele vân
itate redusă, media de 42,2 mii u.m. are o reprezentativitate redusa.
în minus. Pentru acele vânzări pentru care abaterile (xi-

S-ar putea să vă placă și