Sunteți pe pagina 1din 27

Statistica probleme rezolvate partea I

Pb. 1. Urmtoarea serie de date arat preul de vnzare (sute lei) pentru 13 lucrri de grafic la o licitaie
de obiecte de art: 51, !, "#, 35, 3#, 5", 3, 1, $%, 33, ", 5$, 3"&
'e cere:
a) s se calculeze (i s se interpreteze indicatorii tendinei centrale)
b) s se stabileasc dac media este reprezentativ)
c) s se calculeze (i s se interpreteze cuartilele acestei serii de date)
d) optiunea *escriptive 'tatistics din *ata +nal,sis -.cel)
e) s se analizeze asimetria acestei serii de date)
f) stabilii valoarea de adevr a urmtoarelor afirmaii, /ustificnd rspunsurile:
f1) #5 0 dintre lucrarile licitate s1au vandut pentru un pret mai mic de $% sute de lei)
f2) /umatate dintre lucrarile licitate au un pret mai mic sau egal cu 5$ sute lei)
f3) #5 0 dintre lucrari s1au vandut cu cel putin # sute de lei)
f4) pentru "50 dintre obiecte s1a obinut un pret de cel putin 3 sute lei)
f5) precizati care dintre urmtoarele valori: #5, #2, 1, $!, 1#$, %5, 22,% sute lei sunt
outliers 3n raport cu datele iniiale)
f6) coeficientul de variaie este #,330)
f7) media este reprezentativ&
Rezolvare a)
o 4opulaia statistic este mulimea lucrarilor de grafic puse 3n vnzare la licitaiile cu obiecte de art&
o Unitatea statistic este o lucrare de grafic pus 3n vnzare la o licitaie&
o 5ariabila statistic sau caracteristica de interes, notat cu X, arat preul de vnzare, 3n sute lei, al unei
lucrri de grafic&
o 4entru un e(antion de volum n613 uniti statistice (lucrri de grafic), se cunoa(te preul de vnzare,
adic avem urmtoarea serie statistic simpl sau nesistematizat de date numerice:
7x
1
651, x
#
6!, x
3
6"#, x
$
635, x
5
63#, x

65", x
"
63, x
%
61, x
2
6$%, x
1!
633, x
11
6", x
1#
65$, x
13
6x
n
63"8&
o 4entru o serie simpl de date numerice { }
n
x x x ,&&&, ,
# 1
,
media aritmetic (Mean) este
n
x
n
x x x
x
n
i
i
n

=
=
+ + +
=
1 # 1
&&& &
9r& crt&
5alorile
i
x
ale variabilei X - preul de vnzare (sute lei)
1 x
1
6 51
# x
#
6 !
3 x
3
6 "#
$ x
$
6 35
5 x
5
6 3#
x

6 5"
" x
"
6 3
% x
%
6 1
2 x
2
6 $%
1! x
1!
633
11 x
11
6"
1# x
1#
65$
13 x
13
63"

=

=
13
1 i
i
x
"!
1
o :n cazul nostru,
5$ , 51 53%5 , 51
13
"!
13 13
&&&
13
1 13 # 1
= = =
+ + +
=

= i
i
x
x x x
x
sute lei, adic preul mediu de
vnzare al unei lucrri de grafic este de 51,5$ sute lei&
o 4entru a determina Mediana (Median) unei serii simple de date, se parcurg urmtoarele etape:
5alorile seriei de date se ordoneaz cresctor: ( ) ( ) ( ) ( ) n n
x x x x
1 # 1
&&&
, unde ( )
n i x
i
, 1 , =

reprezint a i1a valoare din (irul ordonat cresctor de date numerice (astfel, ( ) 1
x
este prima
valoare din (irul ordonat cresctor, adic cea mai mic valoare, ( ) #
x
este urmtoarea valoare 3n
ordine cresctoare (i a(a mai departe pn la ( ) n
x
, care este cea mai mare valoare)&
4entru aceast serie, cele n613 valori ordonate cresctor sunt:
x
(1)
63#, x
(#)
633, x
(3)
635, x
($)
63", x
(5)
6$%, x
()
651, x
(")
65$, x
(%)
65", x
(2)
6!, x
(1!)
61, x
(11)
63,
x
(1#)
6", x
(13)
6"#&
'e stabile(te locul medianei:
! =
+
=
+
"
#
1 13
#
1 n
;ediana este a "1a valoare din (irul ordonat de date, adic ( )
5$
"
= = x Me
sute de lei (valoarea
din mi/locul seriei ordonate de date)&
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

0 5!
5$
0 5!
13 1# 11 1! 2 % " 5 $ 3 # 1
Me
x x x x x x x x x x x x x


<nterpretarea: /umtate dintre unitile statistice din e(antion au nivelul variabilei de interes mai
mic sau egal cu Mediana, iar restul au nivelul variabilei de interes cel puin egal cu Mediana,
adic /umtate dintre lucrrile de grafic licitate s1au vndut cu mai puin de 5$ sute lei, iar
restul s1au vndut cu un pre mai mare de 5$ sute lei&
o Modul (Mode) sau valoarea modal este acea valoare sau variant de rspuns care apare cu cea mai
mare frecven& :n cazul nostru se observ c niciuna dintre valorile seriei de date nu are o frecven
mai mare ca 1, adic avem numai valori distincte, prin urmare, seria nu are valoare modal&
b) pentru a stabili dac media este reprezentativ, se calculeaz coeficientul de variaie al seriei de date,
adic 1!! =
x
s
v , unde
#
s s =
este abaterea standard a seriei de date&
o Dispersia de selecie (sample variance) pentru o serie simpl de date numerice asupra variabilei X
este
( ) ( )
( )
1 1
&&&
1
#
# #
1 #

+ +
=

=
n
x x
n
x x x x
s
n
i
i
n
&
=alculele intermediare sunt prezentate 3n tabelul de mai /os:
#
9r& crt& 5alorile
i
x
( )
#
x x
i

1 x
1
6 51 ( ) ( ) = =
# #
1
5$ , 51 51 x x !,#21
# x
#
6 ! ( ) ( ) = =
# #
#
5$ , 51 ! x x "1,5"1
3 x
3
6 "# ( ) ( ) = =
# #
3
5$ , 51 "# x x $1%,11
$ x
$
6 35 ( ) ( ) = =
# #
$
5$ , 51 35 x x #"3,5"1
5 x
5
6 3# 3%1,%11
x

6 5" #2,%11
" x
"
6 3 131,331
% x
%
6 1 %2,$21
2 x
2
6 $% 1#,531
1! x
1!
633 3$3,"31
11 x
11
6" #32,!11
1# x
1#
65$ ( ) ( ) = =
# #
1#
5$ , 51 5$ x x ,!51
13 x
13
63" ( ) ( ) = =
# #
13
5$ , 51 3" x x #11,$11
=

=
13
1 i
i
x
"
!
( ) =

=
13
1
#
i
i
x x
##!2,#31
= x 51,5$
=

=
1 13
#31 , ##!2
#
s
1%$,1!#
= = = 1!# , 1%$
#
s s
13,5%$
= v
#,330
adic dispersia (sample variance) este
( )
1!# , 1%$
1#
#31 , ##!2
1 13
13
1
#
#
= =

= i
i
x x
s
,
iar abaterea standard (standard deviation) este
5%$ , 13 1!# , 1%$
#
= = = s s
sute lei, cu interpretarea
c valorile individuale ale seriei se abat, 3n medie, cu 13,5%$ sute lei fa de nivelul mediu de 51,%$ sute
lei al preului de vnzare din e(antion&
o =oeficientul de variaie este
0 35 0 33 , # 1!!
5$ , 51
5%$ , 13
1!! < = = =
x
s
v
, ceea ce indic faptul c seria de
date este omogen) media este reprezentativ pentru colectivitate, ca indicator al tendinei centrale&
3
c) =uartilele seriei de date sunt
3 # 1
, , Q Me Q Q =
, iar pentru determinarea lor, seria de date trebuie s fie
ordonat cresctor ( ) ( ) ( ) ( ) n n
x x x x
1 # 1
&&&
&
o Q
1
> cuartila de ordinul 1 sau cuartila inferioar se determin astfel:
se stabile(te locul lui Q
1
: =
+
=
+
5! , 3 1
$
1 13
1
$
1 n
!, dar 3 ? 3,5! ? $
(locul lui
1
Q
cuartilei este 3ntre 3 (i $, astfel c
1
Q
se va gsi 3ntre a 31a (i a $1a valoare
din (irul ordonat cresctor)
( ) ( ) $ 1 3
x Q x
(i
( ) ( )
3
#
3" 35
#
$ 3
1
=
+
=
+
=
x x
Q sute lei&
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

0 "5
13 1# 11 1! 2 % " 5 $
3
0 #5
3 # 1
1
x x x x x x x x x x x x x
Q

interpretarea: #50 dintre unitile statistice din e(antion au nivelul variabilei de interes mai
mic sau egal cu
1
Q
, iar restul de "50 dintre unitile statistice din e(antion au nivelul
variabilei de interes cel puin egal cu
1
Q
) adic #50 dintre lucrrile de grafic licitate s1au
vndut pentru un pre mai mic dect 3 sute lei, iar restul de "50 dintre ele s1au vndut cu
un pre mai mare de 3 sute lei&
o Q
#
6Me65$ sute lei este cuartila de ordinul # sau mediana seriei de date statistice&
o Q
3
> cuartila de ordinul 3 sau cuartila superioar se determin astfel:
se stabile(te locul lui Q
3
: =
+
=
+
5! , 1! 3
$
1 13
3
$
1 n
!, dar 1! ? 1!,5! ? 11
(locul lui
1
Q
cuartilei este 3ntre 1! (i 11, astfel c
3
Q
se va gsi 3ntre a 1!1a (i a 111a
valoare din (irul ordonat cresctor)
( ) ( ) 11 3 1!
x Q x
si
( ) ( )
#
#
3 1
#
11 1!
3
=
+
=
+
=
x x
Q sute lei,
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

0 #5
13 1# 11
#
0 "5
1! 2 % " 5 $ 3 # 1
3
x x x x x x x x x x x x x
Q

interpretarea: "50 dintre unitile statistice din e(antion au nivelul variabilei de interes mai
mic sau egal cu
3
Q
, iar restul de #50 dintre unitile statistice din e(antion au nivelul
$
variabilei de interes cel puin egal cu
3
Q
) adic "50 dintre lucrrile de grafic licitate s1
au vndut pentru un pre mai mic dect # sute lei, iar restul de #50 dintre ele s1au vndut
cu un pre mai mare de # sute lei&
o
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

0 #5
13 1# 11
#
0 5!
1! 2 % " 5 $
3
0 #5
3 # 1
3 1
x x x x x x x x x x x x x
Q Q


@umatate din termenii din mi/locul seriei au valori cuprinse intre Q
1
63 sute lei si Q
3
6# sute lei&
+baterea intercuatilic (interAuratile range) este A
Q
6Q
3
1Q
1
6# sute lei&
d) pentru o serie statistica simpla de date numerice, principalii indicatori ai tendintei centrale, variatiei si
formei distributiei se pot calcula in -.cel astfel:
datele statistice se introduc intr1o foaie de lucru a unui fisier -.cel, asa cum se poate vedea in
Bigura nr& 1)
in -.cel #!!3, din meniul Cools se alege *ata +nal,sis, iar apoi se selecteaza *escriptive
'tatistics asa cum se poate vedea in Bigura nr& 1)
in -.cel #!!" sau versiuni ulterioare, din meniul *ata, se alege *ata +nal,sis, iar apoi se
selecteaza*escriptive 'tatistics, asa cum se poate vedea in Bigura nr& 1)
5
Bigura nr& 1& <ntroducerea datelor seriei simple intr1o foaie de lucru si selectarea optiunii *escriptive
'tatistics din *ata +nal,sis&
in urmatoarea fereastra care se va descDide, asa cum se poate observa in Bigura nr& #, se va
completa:
la sectiunea <nput Eange se selecteaza cu mouse1ul sirul de celule care contin datele seriei
statistice simple,
la sectiunea Futput options se alege o celula din foaia de lucru unde vor aparea rezultatele
prelucrarii datelor,
se bifeaza 'ummar, 'tatistics,
se da clicG pe butonul FH)

Bigura nr& #& Bereastra *escriptive 'tatistics&


Eezultatele sunt prezentate intr1un tabel de forma:
Mean (media) 51,5385 x =
Standard Error 3,7632
Median (mediana) 54 Me =
Mode (modul) #N/A (nu exista)
Standard Deviation (abaterea standard) 13,5684
#
x x
s s = =
Sample Variance (dispersia de seletie) 184,1!26
#
x
s =
Kurtosis (oe"iientul de boltire sau
aplati#are)
$1,2%426 CBA =
Skewness (oe"iientul de asimetrie) $!,23%38 CAS =
Range (Amplitudinea)
4!
min ma.
x x A
x
= =
Minimum (&aloarea minima) 32
( ) 1 min
x x = =
Maximum (&aloarea maxima) 72
( ) n
x x = =
ma.
Sum (suma &alorilor) 67!

=
=
n
i
i
x
1
Count (&olumul esantionului) 13 n =
"
e) asimetria unei serii de date statistice se poate analiza din mai multe puncte de vedere:
o prin compararea indicatorilor tendintei centrale:
in cazul nostru, comparam doar media aritmetica si mediana, deoarece modul nu e.ista,
astfel: Me x < , ceea ce indica o asimetrie negativa, in seria de date predominand valorile
mai mari, adica intre lucrarile de grafica licitate sunt mai numeroase cele care au o valoare
de vanzare mai mare)
o prin calculul si evaluarea semnului urmatorului coeficient de asimetrie
( )
! 5$$# , !
3
< =

=
s
Me x
C
as
ce arata ca distributia prezinta asimetrie negativa)
o prin calculul coeficientului de asimetrie ('GeIness),
( )
( )
3
1
3
s n
x x
CAS
n
i
i

= , a carui valoare este data


in tabelul ce reprezinta output1ul prelucrarii datelor statistice in -.cel
valoarea acestuia este
#323 , ! = CAS
, o valoare negativa si apropiata de !, indicand ca
distributia prezinta o asimetrie negativa destul de redusa)
o prin aprecierea pozitiei medianei fata de cele doua cuartile:

1%
1
= Q Me
sute lei,
%
3
= Me Q
sute lei, deci
Me Q Q Me >
3 1 , adica ;ediana este
mai apropiata de cuartila superioara decat de cea inferioara, ceea ce arata ca seria prezinta
asimetrie negativa&
f)
f1) #5 0 dintre lucrarile licitate s1au vandut pentru un pret mai mic de $% sute de lei:
afirmatie falsa deoarece cuartila de ordinul intai este
3
1
= Q
sute lei)
f2) /umatate dintre lucrarile licitate au un pret mai mic sau egal cu 5$ sute lei:
afirmatie adevarata deoarece mediana este 5$ = Me sute lei)
f3) #5 0 dintre lucrari s1au vandut cu cel putin # sute de lei:
afirmatie corecta deoarece curatila superioara este
#
3
= Q
sute lei)
f4) pentru "50 dintre obiecte s1a obinut un pret de cel putin 3 sute lei)
afirmatie adevarata deoarece cuartila inferioara este
3
1
= Q
sute lei
f5) precizati care dintre urmtoarele valori: #5, #2, 1, $!, 1#$, %5, 22,% sute lei sunt outliers 3n raport cu
datele iniiale:
Definitie: 'punem ca o valoare x este outlier pentru un set de date statistice numerice dac:
Q
A Q x < 5 , 1
1 sau Q
A Q x + > 5 , 1
3
sau
valoarea x este outlier pentru un set de date statistice daca se gse(te 3n afara intervalului
[ ]
Q Q
A Q A Q + 5 , 1 ) 5 , 1
3 1 &
:n cazul nostru,
[ ] [ ] 1!1 ) 3 5 , 1 ) 5 , 1
3 1
= +
Q Q
A Q A Q
, deci numai valoarea 1#$ este outlier 3n raport cu
setul iniial de date statistice)
f6) coeficientul de variaie este #,330:
afirmatie adevarata)
f7) media este reprezentativ pentru colectivitate:
afirmatie adevarata deoarece coeficientul de variatie este mai mic de 350&
%
Pb. 2. 4entru 32 de actrite care au obtinut premiul Fscar se cunoaste varsta, in ani impliniti, la momentul
castigarii premiului:
5!, $$, 35, %!, #, #%, $1, #1, 1, 3%, $2, 33, "$, 3!, 33, $1, 31, 35, $1, $#,
3", #, 3$, 3$, 35, #, 1, !, 3$, #$, 3!, 3", 31, #", 32, 3$, #, #5, 33 ani&
'e cere:
a) sa se determine si sa se interpreteze indicatorii tendintei centrale si cuartilele acestei serii de date)
b) sa se arate daca seria are valori e.treme)
c) sa se calculeze indicatorii variatiei si sa se stabileasca daca seria este omogena)
d) analizati asimetria)
e) *escriptive 'tatistics&
Rezolvare: a)
o 4opulatia statistica este multimea actritelor care au castigat premiul Fscar&
o Unitatea statistica este o actrita&
o 5ariabila sau caracteristica de interes, notata X, este variabila ce arata varsta unei actrite la momentul
obtinerii premiului) variabila numerica, discreta&
o 4entru un esantion de volum 32 = n de actrite se cunosc valorile variabilei X, adica 7x
1
65!, x
#
6$$,
x
3
635, x
$
6%!, &&&, x
n
6x
32
633 ani8, care reprezinta o serie simpla sau nesistematizata de date statistice
numerice&
o ;edia unei serii simple de date numerice { }
n
x x x &&&, , ,
# 1
este
n
x
n
x x x
x
n
i
i
n

=
=
+ + +
=
1 # 1
&&& &
<n cazul acestei serii, varsta medie a unei actrite din esantion care a castigat premiul Fscar este
1!#5 , 3%
32
1$%
32 32
&&&
32
1 32 # 1
= = =
+ + +
=

= i
i
x
x x x
x
ani&
o 4entru a determina mediana, vom proceda astfel:
1 seria simpla de date se ordoneaza crescator ( ) ( ) ( ) n
x x x &&&
# 1 , unde ( )
n i x
i
, 1 , =
este
elementul cu rangul i din seria ordonata crescator,
1 locul medianei este
( )
3$ #!
#
1
#!
= = =
+
x Me
n
!
ani&
@umatate dintre actritele din selectie au obtunut premiul Fscar la o varsta de cel mult 3$ de ani
(/umatate dintre actritele din esantion au castigat premiul Fscar la o varsta de peste 3$ de ani)&
o -.ista doua valori care au frecventa ma.ima si anume valorile # ani si 3$ ani, care apar pentru $
actrite fiecare&
Nr' rt' (arsta atritelor
i
x (arsta atritelor, in ordine resatoare
( ) i
x
1
x
1
65! x
(1)
621
2
x
#
644 x
(#)
624
3
x
3
635 x
(3)
625
4
x
$
68! x
($)
626
5
x
5
626 x
(5)
626
6 28 26
7 41 26
8 21 27
% 61 28
1! 38
x
(1!)
63!6Q
1
11 4% 3!
12 33 31
13 74 31
14 3! 33
2
15 33 33
16 41 33
17 31 34
18 35 34
1% 41 34
2! 42
x
(#!)
6346Me
21 37 35
22 26 35
23 34 35
24 34 37
25 35 37
26 26 38
27 61 3%
28 6! 41
2% 34 41
3! 24
x
(3!)
6416Q
3
31 3! 42
32 37 44
33 31 4%
34 27
x
(3$)
65!
35 3%
x
(35)
66!
36 34
x
(3)
661
37 26
x
(3")
661
38 25
x
(3%)
674
3%
x
32
633 x
(32)
68!
o 4entru determinarea cuartilelor procedam astfel:
1 locul cuartilei de ordinul 1, Q
1
, este
( )
3! 1! 1
$
1
1! 1
= = =
+
x Q
n
!
ani) un sfert dintre
actrite au castigat premiul Fscar la o varsta mai mica sau egala cu 3! de ani, iar restul
la cel putin 3! de ani)
1 locul cuartilei de ordinul 3, Q
3
, este
( )
$1 3! 3
$
1
3! 3
= = =
+
x Q
n
!
ani) trei sferturi
dintre actrite au castigat premiul Fscar la o varsta mai mica sau egala cu $1 de ani, iar
restul la cel putin $1 de ani&
o +baterea intercuartilica este
11
1 3
= = Q Q A
Q ani si arata lungimea intervalului in care se gasesc
/umatate dintre valorile din mi/locul seriei de date&
1 b)
o 5 , 13 5 , 1
1
= IQR Q
o 5 , 5" 5 , 1
3
= + IQR Q
5aloarea x este outlier pentru seria de date statistice numerice daca x se gaseste in afara
intervalului
[ ] [ ] 5 , 5" ) 5 , 13 5 , 1 ) 5 , 1
3 1
= +
Q Q
A Q A Q
, x
(35)
66!, x
(3)
661, x
(3")
661, x
(3%)
674, x
(32)
68! sunt
outliers&
c) *ispersia de selectie (sample variance) pentru o serie simpla de date numerice asupra variabilei X este
1!
( ) ( )
( )
1 1
&&&
1
#
# #
1 #

+ +
=

=
n
x x
n
x x x x
s
n
i
i
n
,
adica
( )
"#! , 1"%
1 32
5%2" , "21
1 32
32
1
#
#
=

= i
i
x x
s
,
abaterea standard (standard deviation) este
3%% , 13
#
= = s s
ani&
=oeficientul de variatie este 0 35 0 !2 , 35 1!! > = =
x
s
v , ceea ce indica faptul ca seria de date este
mai putin omogena, iar media este mai putin reprezentativa pentru colectivitate, ca indicator al tendintei
centrale&
Nr' rt'
(arsta atritelor
i
x
x x
i

( )
#
x x
i

1
x
1
65! 11,8%74 141,548%
2
x
#
644 5,8%74 34,77%7
3
x
3
635 $3,1!26 %,625%
4
x
$
68! 41,8%74 1755,3%51
5
x
5
626 $12,1!26 146,472!
6 28 $1!,1!26 1!2,!618
7 41
2,8%74 8,3%51
8 21 $17,1!26 2%2,4%77
% 61
22,8%74 524,2%25
1! 38
$!,1!26 !,!1!5
11 4% 1!,8%74 118,7541
12 33 $5,1!25 26,!361
13 74 35,8%74 1288,625%
14 3!
$8,1!25 65,6515
15 33 $5,1!25 26,!361
16 41
2,8%74 8,3%51
17 31 $7,1!25 5!,4464
18 35
$3,1!25 %,625%
1% 41
2,8%74 8,3%51
2! 42 3,8%74 15,1%!!
21 37
$1,1!25 1,2156
22 26 $12,1!25 146,472!
23 34
$4,1!25 16,831!
24 34 $4,1!25 16,831!
25 35
$3,1!25 %,625%
26 26
$12,1!25 146,472!
27 61 22,8%74 524,2%25
28 6!
21,8%74 47%,4%77
2% 34 $4,1!256 16,831!
3! 24
$14,1!25 1%8,8823
31 3! $8,1!25 65,6515
32 37
$1,1!25 1,2156
33 31 $7,1!25 5!,4464
34 27
$11,1!25 123,266%
35 3% !,8%74 !,8!53
36 34
$4,1!25 16,831!
37 26 $12,1!25 146,472!
38 25
$13,1!25 171,6771
3%
x
32
633 $5,1!25 26,!361
11

=
=
32
1 i
i
x 1486
( )

=
=
32
1 i
i
x x
!
( )

=
=
32
1
#
i
i
x x 67%1,58%
7
= x 38,1!25
=
#
s
178,726!
= =
#
s s 13,3688
= v
35,!%)
d) +simetria unei serii de distribuie de frecvene se poate stabili:
1 prin compararea indicatorilor tendintei centrale,
1 prin analiza distantei intre mediana si cele doua cuartile inferioara si superioara,
1 prin calculul si interpretarea valorii unui indicator specific, coeficientul de asimetrie,
1 se observ din reprezentarea grafic prin Distogram sau poligonul frecvenelor&
1 =um
x Me = < = 1!#5 , 3% 3$
, atunci concluzionam ca seria de date prezinta asimetrie pozitiva&
1 =um mediana este mai apropiata de Q
1
decat de Q
#
, adica
Me Q Q Me <
3 1
, atunci concluzionam
ca seria prezinta asimetrie pozitiva, in seria de date predominand valorile mici&
1 <ndicatorul asimetriei este coeficientul de asimetrie (Skeness)
( )
( )
3
1
3
s n
x x
CAS
n
i
i

= , al carui semn si
marime arata tipul asimetriei (pozitiva sau negativa), iar marimea arata gradul mai putin accentuat sau
mai accentuat al asimetriei seriei de date sau al distributiei& <n cazul acestei serii de date,
5"3$ , 1 = CAS
, o
valoare pozitiva si mai mare ca 1, ceea ce arata ca seria de date prezinta o asimetrie pozitiva pronuntata&
1 'istematizarea printr1o serie de distributie de frecvente pe = r intervale de variatie de marime
egala a dat urmatoarea distributie a celor n632 de actrite din esantion dupa varsta la momentul obtinerii
premiului Fscar:
Nr' rt'
*nter&alul i de
&ariatie
(lasa de &arsta)
+re&enta absoluta
i
n
a inter&alului i de &ariatie
(numarul de atrite din "ieare lasa de &arsta)
,entrul
i
x
al inter&alului i de &ariatie
1
2!$3! ani
11
25
2 3!$4! ani 16 35
3
4!$5! ani
7
45
4 5!$6! ani 1 55
5
6!$7! ani
2
65
6 7!$8! ani 2 75

=
=

1 i
i
n 3%-n
Eeprezentarea grafica seriei de distributie de frecvente pe intervale, adica Distograma si poligonul
frecventelor sugereaza ca aceasta prezinta asimetrie pronuntata la dreapta sau asimetrie pozitiva, adica
predomina valorile mai mici ale variabilei de interes, cu coada mai lung a distribuiei spre valorile mari,
care apar cu frecventa mai mica& <ntre cele 32 de actrite castigatoare ale premiului Fscar, predomina cele
cu varste relativ mai mici&
1#
Histograma - distributia celor n!" de actrite dupa
variabila ce arata varsta la momentul castigarii premiului
#scar
11
16
7
1
2 2
!
2
4
6
8
1!
12
14
16
18
2!$3!
ani
3!$4!
ani
4!$5!
ani
5!$6!
ani
6!$7!
ani
7!$8!
ani
Varsta $intervalele sau clasele de varsta%
&
r
e
c
v
e
n
t
a

a
b
s
o
l
u
t
a

$
n
u
m
a
r
u
l

d
e

a
c
t
r
i
t
e
%
'oligonul (recventelor pentru seria de distributie de (recvente
11
16
7
1
2 2
!
2
4
6
8
1!
12
14
16
18
! 1! 2! 3! 4! 5! 6! 7! 8!
Varsta) in ani $centrele intervalelor%
*
u
m
a
r
u
l

d
e

a
c
t
r
i
t
e
e) <ndicatorii tendintei centrale, principalii indicatori ai variatiei si ai formei distributiei pentru o serie
simpla de date numerice pot fi calculati in !xcel si in '4'', output1urile fiind de forma:
Futput1ul "escriptive Statistics in !xcel
Futput1ul "escriptive Statistics in '4''
13
Fbservatie: Analiza boltirii/aplatizrii
Boltirea"kurtosis, 3n engl&) e.prim 3nlimea curbei (Jcocoa(eiK) comparativ cu distribuia normal
teoretic& :ntlnim, astfel distri#u$ii leptocurtice, ascuite (cu Jcocoa(aK 3nalt) (i distri#u$ii platicurtice,
aplatizate& #oeficie$t%l de boltire sa% aplatizare (kurtosis) este o msur a 3mpr(tierii fiecrei
observaii 3n /urul unei valori centrale (i se determin, pe e(antion, cu formula:
( )
( )
3
#
#
1
$

=
s n
x x
CBA
n
i
i
, unde
( )
1
1
#
#

=
n
x x
s
n
i
i
&
<nterpretarea valorii coeficientului de aplatizare si boltire:
*ac ! > CBA , avem distribuie leptocurtic, valorile varibilei fiind mai co$ce$trate &$ '%r%l
i$dicatorilor te$di$(ei ce$trale decat i$ distrib%tia $ormala.
1$
Varsta actritelor
.ean (media)
= x 38'1!25
/tandard 0rror
2'14!7
.edian Me634
.ode Mo626
/tandard 1e&iation
(abaterea standard)
= =
#
x x
s s 13'3688
/ample (ariane
(dispersia de seletie)
=
#
x
s 178'726!
2urtosis 2'383!
/3e4ness
(oe"iientul de asimetrie) = CAS 1'5734
5an6e
(Amplitudinea)
= =
min ma.
x x A
x
5%
.inimum =
min
x 21
.aximum =
ma.
x 8!
/um

=
=
32
1 i
i
x 1486
,ount
n-3%
Statistics
(arsta atritelor 7sar
N (alid 3%
.issin6 !
.ean
= x 38'1!
/td' 0rror o" .ean 2'141
.edian Me634'!!
.ode Mo626
a
/td' 1e&iation = =
#
x x
s s 13'36%
(ariane
=
#
x
s 178'726
/3e4ness
= CAS 1'573
/td' 0rror o" /3e4ness '378
2urtosis 2'383
/td' 0rror o" 2urtosis '741
5an6e
= =
min ma.
x x A
x
5
%
.inimum
=
min
x 21
.aximum
=
ma.
x 8!
/um

=
=
32
1 i
i
x 1486
8erentiles 25
=
1
Q 3!'!!
5!
= = Me Q
#
34'!!
75
=
3
Q 41'!!
a' .ultiple modes exist' 9:e smallest &alue is s:o4n
*ac ! < CBA , avem distribuie platicurtica, valorile varibilei fiind mai dispersate &$ raport c%
i$dicatorii te$di$(ei ce$trale decat i$ distrib%tia $ormala.
*ac ! = CBA , avem distribuie mezocurtic, adic distribuia normal&
<n cazul acestei serii de date statistice,
! 3%3 , # > = CAB
, ceea ce indica o distributie leptocurtica
(cu cocoasa, asa cum se poate vedea si din Distograma sau poligonul frecventelor)&
Pb. 3. Un agent al companiei de asigurari % vinde contracte de asigurare de locuinte& <n luna iulie a
incDeiat: # contracte cu prime anuale de 5! -ur, 3 contracte cu prime anuale de ! -ur, contracte cu
prime de "! -ur, 2 contracte cu prime de 2! -ur, 1 contracte cu prime anuale de 1#! -ur, % contracte cu
prime anuale de 13! -ur si contracte cu prime de 1$! -ur& 'e cere:
a) =onstruii seria de distribuie de frecvene (i analizai grafic tendina de normalitate a acesteia&
b) =aracterizai omogenitatea (i asimetria distribuiei contractelor 3n funcie de valoarea primelor
anuale&
c) =alculati media si abaterea standard a variabilei alternative care evidentiaza contractele cu prime
anuale de valoare mai mica sau egala cu 2! -ur&
Rezolvare: a)
o 4opulatia statistica este multimea contractelor de asigurare de locuinte din portofoliul companiei %&
o Unitatea statistica este un contract de asigurare de locuinta&
o 5ariabila statistica sau caracteristica de interes, notata X, este variabila ce arata marimei primei
anuale, in -ur, pentru un contract de asigurare de locuinta incDeiat de un agent al companiei) variabila
numerica, continua&
o +gentul a incDeiat intr1o luna n65! de contracte, seria de date statistice referitoare la primele anuale
ale acestor contracte fiind sistematizata intr1o serie de distributie de frecvente pe r6" variante
distincte& +stfel distributia celor n65! de contracte dupa valoarea primei anuale, in -ur, este:
Nr'
rt'
(aloarea
i
x 0ur
a unei prime anuale
Numarul de ontrate,
i
n ,
("re&enta absoluta)
1
=
1
x 5! 0ur =
1
n 2 ontrate
2
=
#
x 6! 0ur =
#
n 3
3
=
3
x
7! 0ur
=
3
n
6
4
=
$
x %! 0ur =
$
n %
5
=
5
x
12! 0ur
=
5
n
16
6
=

x 13! 0ur =

n 8
7
=
"
x
14! 0ur
=
"
n
6

=
= =
"
1
5!
i
i
n n ontrate
sau

= = = = = = =
= = = = = = =
% 1 2 3 contracte #
1#! 13! 1#! 2! "! ! -ur 5!
:
" 5 $ 3 # 1
" 5 $ 3 # 1
n n n n n n n
x x x x x x x
X
,
unde

=
= =
"
1
5!
i
i
n n
contracte&
o Eeprezentarea grafica a acestei serii de distributie este poligonul frecventelor absolute&
15
'oligonul (recventelor absolute - distributia celor +, de contracte
inc-eiate de agentul de asigurari dupa valoarea primei anuale
!
2
4
6
8
1!
12
14
16
18
! 1! 2! 3! 4! 5! 6! 7! 8! %! 1!! 11! 12! 13! 14! 15!
'rima anuala de asigurare a unui contract) in Eur
&
r
e
c
v
e
n
t
a

a
b
s
o
l
u
t
a

$
n
u
m
a
r
u
l

d
e

c
o
n
t
r
a
c
t
e
%
o 4oligonul frecventelor sugereaza ca distributia are tendinta de normalitate, dar prezinta asimetrie la
stanga, coada poligonului freventelor absolute fiind mai alungita spre stanga&
o 4oligonul frecventelor se mai poate reprezenta si cu a/utorul frecventelor relative
Nr'
rt'
(aloarea
i
x 0ur
a unei prime anuale
Numarul de ontrate,
i
n ,
("re&enta absoluta)
+re&enta relati&a [ ] 1 , !
L
=
n
n
n
i
i
1
=
1
x 5! 0ur =
1
n 2 ontrate =
L
1
n !,!4
2
=
#
x 6! 0ur =
#
n 3 =
L
#
n !,!6
3
=
3
x 7! 0ur =
3
n 6 =
L
3
n !,12
4
=
$
x %! 0ur =
$
n % =
L
$
n !,18
5
=
5
x 12! 0ur =
5
n 16 =
L
5
n !,32
6
=

x 13! 0ur =

n 8 =
L

n !,16
7
=
"
x 14! 0ur =
"
n 6
=
L
"
n !,12

=
= =
"
1
5!
i
i
n n ontrate

=
=
"
1
L
1
i
i
n
1
'oligonul (recventelor relative
!
!,!5
!,1
!,15
!,2
!,25
!,3
!,35
! 1! 2! 3! 4! 5! 6! 7! 8! %! 1!! 11! 12! 13! 14! 15!
'rima anuala) in Eur) pentru un contract de asigurare
&
r
e
c
v
e
n
t
a

r
e
l
a
t
i
v
a
b)
o Media pentru o serie de distributie de frecvente pe r variante distincte ale variabilei de interes este

=
=

=
r
i
i
r
i
i i
n
n x
x
1
1
,
unde { } r i x
i
, 1 , = sunt variantele distincte observate ale variabilei, iar

=
=
r
i
i
n n
1
volumul
esantionului&
<n cazul nostru,
# , 1!
5!
531!
5!
"
1
= =

= i
i i
n x
x
-ur este valoarea medie a unei prime anuala
corespunzatoare unui contract de asigurare de locuinta incDeiat de respectivul agent de vanzari&
o Mediana pentru o serie de distributie de frecvente pe r variante distincte se calculeaza parcurgand
urmatorii pasi:
=ele r variante distincte sunt ordonate crescator
r
x x x < < < &&&
# 1
&
'e determina locul medianei, adica
5 , #5
#
1
=
+ n
&
'e calculeaza frecventele absolute cumulate crescator ale celor r variante distincte
k ck
n n & + + = &&&
1
,
r k , 1 =
&
;ediana este acea valoare distincta cu proprietatea ca frecventa sa absoluta cumulata
crescator este prima care depaseste locul medianei
5 , #5 #!
5 , #5 11
5 , #5 5
5 , #5 #
$
3
#
1
< =
< =
< =
< =
c
c
c
c
&
&
&
&
si
5 , #5 3
5
=
c
&
, deci a 51a varianta sau valoare distincta,
5
x
, este mediana sau
valoarea mediana:
1#!
5
= =x Me
-ur, adica /umatate dintre contractele incDeiat de
agentul de vanzari au o prima anuala de valoare mai cica sau egala cu 1#! -ur&
1"
Nr'
rt'
(aloarea
distinta,
i
x 0ur
i
n ,
("re&enta
absoluta)
i i
n x
k ck
n n & + + = &&&
1
( )
i i
n x x
#
1
=
1
x 5! =
1
n 2 =
1 1
n x 1!! = =
1 1
n &
c
2 ( ) =
1
#
#
n x x
6316,88
2
=
#
x 6! =
#
n 3 =
# #
n x 18! = + =
# 1 #
n n &
c
5 ( ) =
#
#
#
n x x
64!3,32
3
=
3
x 7! =
3
n 6
42!
= + + =
3 # 1 3
n n n &
c
11
7862,64
4
=
$
x %! =
$
n %
81!
= + + =
$ 1 $
&&& n n &
c
2!
2361,%6
5
=
5
x 12! =
5
n 16
1%2!
= + + =
5 1 5
&&& n n &
c
36
3!47,!4
6
=

x 13! =

n 8
1!4!
= + + =
1
&&& n n &
c
44
4531,52
7
=
"
x 14! =
"
n 6
84!
= = + + = n n n &
c " 1 "
&&& 5
!
( ) =
"
#
"
n x x 6854,64

=
= =
"
1
5!
i
i
n n

=
=
"
1 i
i i
n x 531! ( )

=
=
"
1
#
i
i i
n x x 37378
= x 1!6,2
=
#
s
762,8163265
= =
#
s s 27,61%12%72
= v
26,!1)
o Modul sau valoarea modala pentru o serie de distributie de frecvente pe r variante distincte este acea
varianta sau valoare care apare cu frecventa absoluta sau relativa cea mai mare:
Brecventa absoluta cea mai mare este:
{ } r i n n
i
, 1 , ma. 1
5
= = = &
valoarea modala este deci a 51a varianta sau valoare distincta de raspuns a
variabilei de interes,
1#!
5
= =x Mo
-ur, aceasta fiind valoarea cea mai des intalnita a unei
prime anuale pentru contractele incDeiate de respectivul agent&
o Eelatia in care se gasesc indicatorii tendintei centrale, Mo Me x = < , ca si reprezentatrea grafica
pentru poligonul frecventelor absolute sau relative, arata ca distributia contractelor dupa valoarea
primelor anuale prezinta asimetrie negativa, in serie predominand valorile mai mari ale primelor
anuale, iar coada distributiei este alungita spre stanga&
o *ispersia in esantion (de selectie) pentru o serie de distributie de frecvente pe r intervale de variatie
este
( ) ( )
( )
( )
1 1 &&&
&&&
1
#
1
#
1
#
1 #


=
+ +
+ +
=

=
n
n x x
n n
n x x n x x
s
r
i
i i
r
r r
,
unde { } r i x
i
, 1 , = sunt variantele distincte observate ale variabilei,

=
=
r
i
i
n n
1
volumul esantionului&
<n cazul nostru,
( )
%13 , "#
1 5!
3"3"%
1 5!
"
1
#
#
=

= i
i i
n x x
s
, iar abaterea standard sau abaterea medie
patratica este
121 , #"
#
= = s s
-ur, care arata cu cat se abat, in medie, valorile observate fata de
nivelul mediu in esantion al primelor anuale&
o =oeficientul de variatie in esantion este 0 3! 0 !1 , # 1!!
# , 1!
121 , #"
1!! < = = =
x
s
v , ceea ce arata ca
distributia este omogena si media este reprezentativa pentru colectivitate&
1%
c) *efinim Mevenimentul favorabilK ca evenimentul ca un contract de asigurare are o prima anuala de
valoare mai mica sau egala cu 2! -ur& 5ariabila alternativa care evidentiaza contractele ale caror prime
anuale sunt de valoare mai mica sau egala cu 2! -ur este

m m n
'
1 !
:
,
unde 1 = ' pentru unitatile statistice din esantion care verifica evenimentul favorabil, iar m este
numarul de unitati statistice din esantion care verifica evenimentul favorabil,
#!
$ 3 # 1
= + + + = n n n n m
contracte,
iar ! = ' pentru unitatile statistice din esantion care nu verifica evenimentul favorabil,
m n
este
numarul de unitati statistice din esantion pentru care nu se verifica evenimentul favorabil,
3! = m n de contracte cu prime anuale mai mari de 2! -ur&
;edia variabilei alternative este
$ , !
5!
#!
= = =
n
m
f
, adica $!0 dintre contracte au valori ale
primelor anuale mai mici sau egale cu 2! -ur&
*ispersia variabilei alternative este
( ) #$ , ! 1 1
#
=

= =
n
m
n
m
f f s
alt
, iar abaterea standard
$% , ! 1

=
n
m
n
m
s
alt
Pb. 4. *istributia a 11!! de absolventi ai Universitatii din Blorida dupa salariul castigat, in N, in primul an
dupa terminarea studiilor este urmatoarea serie de distributie de frecvente pe intervale de variatie:
9r& crt& <ntervalul de variatie al salariului, N 9umarul de absolventi
1 ;72!!< 125!!= 3!
2 (125!!< 178!!= 6%
3 (178!!< 231!!= 3!2
4 (231!!< 284!!= 3!8
5 (284!!< 337!!= 263
6 (337!!< 3%!!!= %5
7 (3%!!!< 443!!= 2!
8 (443!!< 4%6!!= 6
% (4%6!!< 54%!!= 5
1! (54%!!< 6!2!!= 1
11 (6!2!!< 655!!= 1
'e cere:
a) sa se reprezinte grafic aceasta serie de distributie)
b) sa se determine si sa se interpreteze indicatorii tendintei centrale)
c) sa se stabileasca daca media este reprezentativa pentru colectivitate)
d) sa se analizeze asimetria acestei distributii&
Rezolvare: a)
4opulatia statistica este multimea absolventilor Universitatii din Blorida, promotiile anilor 12%2 si
122!, asa cum se specifica in fisierul (niversit) of &lorida *raduate salaries&sav al programului
'4''&
Unitatea statistica este un absolvent&
5ariabila sau caracteristica de interes, notata X, este variabila ce arata salariul unui absolvent, in N, din
primul an de dupa finalizarea studiilor, variabila numerica, continua&
4entru un esantion de volum
11!! = n
de absolventi s1au inregistrat valorile variabilei, iar setul de
date s1a sistematizat intr1o serie de distributie de frecvente pe 11 = r intervale de variatie de marime
egala, data in enuntul problemei&
Eeprezentarea grafica a acestei serii de distributie de frecvente pe intervale de variatie se poate realiza
prin Distograma si poligonul frecventelor absolute&
12
Nr'
rt'
*nter&alul i de &ariatie
(/alariul anual al unui
absol&ent, in >)
+re&enta absoluta
i
n a inter&alului i
(numarul de absol&enti)
?imita in"erioara
( ) inf i
x
a inter&alului i
?imita superioara
( ) sup i
x
a inter&alului i
,entrul
i
x
al inter&alului i
1 ;72!!< 125!!= 3! 72!! 125!! %85!
2 (125!!< 178!!= 6% 125!! 178!! 1515!
3 (178!!< 231!!= 3!2 178!! 231!! 2!45!
4 (231!!< 284!!= 3!8 231!! 284!! 2575!
5 (284!!< 337!!= 263 284!! 337!! 31!5!
6 (337!!< 3%!!!= %5 337!! 3%!!! 3635!
7 (3%!!!< 443!!= 2! 3%!!! 443!! 4165!
8 (443!!< 4%6!!= 6 443!! 4%6!! 46%5!
% (4%6!!< 54%!!= 5 4%6!! 54%!! 5225!
1! (54%!!< 6!2!!= 1 54%!! 6!2!! 5755!
11 (6!2!!< 655!!= 1 6!2!! 655!! 6285!

=
= =
11
1 i
i
n n 11!!
Histograma
3!
6%
3!2
3!8
263
%5
2!
6 5
1 1
!
5!
1!!
15!
2!!
25!
3!!
35!
;
7
2
!
!
<

1
2
5
!
!
=
(
1
2
5
!
!
<

1
7
8
!
!
=
(
1
7
8
!
!
<

2
3
1
!
!
=
(
2
3
1
!
!
<

2
8
4
!
!
=
(
2
8
4
!
!
<

3
3
7
!
!
=
(
3
3
7
!
!
<

3
%
!
!
!
=
(
3
%
!
!
!
<

4
4
3
!
!
=
(
4
4
3
!
!
<

4
%
6
!
!
=
(
4
%
6
!
!
<

5
4
%
!
!
=
(
5
4
%
!
!
<

6
!
2
!
!
=
(
6
!
2
!
!
<

6
5
5
!
!
=
Salariul) in . $intervalele de variatie%
&
r
e
c
v
e
n
t
a

a
b
s
o
l
u
t
a

$
n
u
m
a
r
u
l

d
e

a
b
s
o
l
v
e
n
t
i
%
Big& &&&&& Oistograma > *istributia celor 11!! de absolventi ai Universitatii din Blorida dupa salariul
castigat in primul an de dupa finalizarea studiilor&
#!
8oli6onul "re&entelor absolute
3!
6%
263
%5
3!2
3!8
2!
6
5
1
1
!
5!
1!!
15!
2!!
25!
3!!
35!
! 1!!!! 2!!!! 3!!!! 4!!!! 5!!!! 6!!!! 7!!!!
Salariul) in . $centrele intervalelor de variatie%
&
r
e
c
v
e
n
t
a

a
b
s
o
l
u
t
a

$
n
u
m
a
r
u
l

d
e

a
b
s
o
l
v
e
n
t
i
%
Big& &&&&& 4oligonul frecventelor absolute > *istributia celor 11!! de absolventi ai Universitatii din
Blorida dupa salariul castigat in primul an de dupa finalizarea studiilor&
b) <ndicatorii tendintei centrale: media, mediana si modul&
Nr'
rt'
*nter&alul i
(/alariul anual al
unui
absol&ent, in >)
,entrul
i
x
+re&enta absoluta
i
n
(numarul de absol&enti)
i i
n x
+re&enta absoluta
umulata resator
a inter&alului 3,
k ck
n n & + + = &&&
1
1 ;72!!< 125!!= %85! 3! 2%55!! 3!
2 (125!!< 178!!= 1515! 6% 1!4535! %%
3 (178!!< 231!!= 2!45! 3!2 6175%!! 4!1
4 (231!!< 284!!= 2575! 3!8 7%31!!! 7!%
5 (284!!< 337!!= 31!5! 263 816615! %72
6 (337!!< 3%!!!= 3635! %5 345325! 1!67
7 (3%!!!< 443!!= 4165! 2! 833!!! 1!87
8 (443!!< 4%6!!= 46%5! 6 2817!! 1!%3
% (4%6!!< 54%!!= 5225! 5 26125! 1!%8
1! (54%!!< 6!2!!= 5755! 1 5755! 1!%%
11 (6!2!!< 655!!= 6285! 1 6285! 11!!

=
= =
11
1 i
i
n n 11!!

=
=
11
1 i
i i
n x 285635!!
= x 25%66,82
o Media pentru o serie de distributie de frecvente pe r intervale de variatie este
n
n x
n n
n x n x
x
r
i
i i
r
r r

=

=
+ +
+ +
=
1
1
1 1
&&&
&&&
,
unde { } r i x
i
, 1 , = sunt centrele celor r intervale, iar

=
=
r
i
i
n n
1
volumul esantionului&
#1
%# , #52
11!!
#%535!!
11!!
11
1
= =

= i
i i
n x
x
N a castigat, in medie, un absolvent in primul an&
o Mediana pentru o serie de distributie de frecvente pe r intervale de variatie se calculeaza parcurgand
urmatorii pasi:
'e determina locul medianei, adica
5 , 55!
#
1
=
+ n
&
'e calculeaza frecventele absolute cumulate crescator ale intervalelor de variatie
k ck
n n & + + = &&&
1
,
r k , 1 =
&
<ntervalul median este primul interval cu proprietatea ca frecventa sa absoluta cumulata
crescator depaseste locul medianei
5 , 55! $!1
5 , 55! 22
5 , 55! 3!
3
#
1
< =
< =
< =
c
c
c
&
&
&
si
5 , 55! "!2
$
=
c
&
, deci al $1lea interval de variatie (231!!< 284!!= > este intervalul
median&

+
+ =

Me
Me c
Me Me
n
&
n
+ x Me
1
inf
#
1

5 , #5"#
3!%
$!1 5 , 55!
53!! #31!! =

+ =
N, adica /umatate dintre absolventi au
castigat cel mult #5"#,5N in primul an sau /umatate au castigat cel putin #5"#,5 N&
o Modul sau valoarea modala pentru o serie de distributie de frecvente pe r intervale de variatie se
calculeaza astfel:
'e determina intervalul cu frecventa absoluta cea mai mare:
{ } r i n n
i
, 1 , ma. 3!%
$
= = = ,
deci al $1lea interval de variatie (231!!< 284!!= > este intervalul modal&

=
+

+ =
# 1
1
inf Mo Mo
+ x Mo

( ) ( )
5# , #3"#3
#3 3!% 3!# 3!%
3!# 3!%
53!! #31!! =
+

+ =
N, aceasta este valoarea cea mai
des intalnita a castigului salarial al unui absolvent intr1un an&
c) ;edia variabilei de interes in esantion este = x 25%66,82 >'
Nr'
rt'
*nter&alul i
(/alariul anual al
unui
absol&ent, in >)
,entrul
i
x
+re&enta absoluta
i
n
(numarul de absol&enti)
( )
i i
n x x
#
1 ;72!!< 125!!= %85! 3!
( ) =
1
#
1
n x x 77%25566!7
2 (125!!< 178!!= 1515! 6% 8!73248!4%
3 (178!!< 231!!= 2!45! 3!2 %1%146148!
4 (231!!< 284!!= 2575! 3!8 1447%361,!2
5 (284!!< 337!!= 31!5! 263 67%5583!74
6 (337!!< 3%!!!= 3635! %5 1!241%%!557
7 (3%!!!< 443!!= 4165! 2! 4%1%2426%8
8 (443!!< 4%6!!= 46%5! 6 2641763!57
% (4%6!!< 54%!!= 5225! 5 3454!27755
1! (54%!!< 6!2!!= 5755! 1 %%74%7258,%
##
11 (6!2!!< 655!!= 6285! 1 136!368%67

=
= =
11
1 i
i
n n 11!! ( )

=
=
11
1
#
i
i i
n x x 55482218864
=
#
s
5!484275,58
= s
71!5,2287
*ispersia in esantion (de selectie) pentru o serie de distributie de frecvente pe r intervale de
variatie este
( ) ( )
( )
( )
1 1 &&&
&&&
1
#
1
#
1
#
1 #


=
+ +
+ +
=

=
n
n x x
n n
n x x n x x
s
r
i
i i
r
r r
,
unde { } r i x
i
, 1 , = sunt centrele celor r intervale,

=
=
r
i
i
n n
1
volumul esantionului&
( )
5% , 5!$%$#"5
1 11!!
$ 55$%##1%%
1 11!!
11
1
#
#
=

= i
i i
n x x
s
, iar abaterea standard este
##%" , "1!5 = s
N, care
arata cu cat se abat, in medie, valorile observate fata de nivelul mediu al salariului din esantion&
=oeficientul de variatie in esantion este
0 3! 0 3 , #" 1!!
%# , #52
##%" , "1!5
1!! < = = =
x
s
v
, ceea ce arata
ca media este reprezentativa pentru colectivitate&
d) +simetria unei serii de distribuie de frecvene se observ din reprezentarea grafic prin
Distogram sau poligonul frecvenelor, si prin modalitatea 3n care sunt situai, unul fa de cellalt,
indicatorii tendinei centrale&
Histograma
3!
6%
3!2
3!8
263
%5
2!
6 5
1 1
!
5!
1!!
15!
2!!
25!
3!!
35!
;
7
2
!
!
<

1
2
5
!
!
=
(
1
2
5
!
!
<

1
7
8
!
!
=
(
1
7
8
!
!
<

2
3
1
!
!
=
(
2
3
1
!
!
<

2
8
4
!
!
=
(
2
8
4
!
!
<

3
3
7
!
!
=
(
3
3
7
!
!
<

3
%
!
!
!
=
(
3
%
!
!
!
<

4
4
3
!
!
=
(
4
4
3
!
!
<

4
%
6
!
!
=
(
4
%
6
!
!
<

5
4
%
!
!
=
(
5
4
%
!
!
<

6
!
2
!
!
=
(
6
!
2
!
!
<

6
5
5
!
!
=
Salariul) in . $intervalele de variatie%
&
r
e
c
v
e
n
t
a

a
b
s
o
l
u
t
a

$
n
u
m
a
r
u
l

d
e

a
b
s
o
l
v
e
n
t
i
%
8oli6onul "re&entelor absolute
3!
6%
263
%5
3!2
3!8
2!
6 5
1 1
!
5!
1!!
15!
2!!
25!
3!!
35!
! 1!!!! 2!!!! 3!!!! 4!!!! 5!!!! 6!!!! 7!!!!
Salariul) in . $centrele intervalelor de variatie%
&
r
e
c
v
e
n
t
a

a
b
s
o
l
u
t
a

$
n
u
m
a
r
u
l

d
e

a
b
s
o
l
v
e
n
t
i
%
Eeprezentarea grafica seriei de distributie sugereaza ca aceasta are tendinta de normalitate si ca in
seria de date predomina valorile mai mici ale variabilei de interes, castigul salarial intr1un an, adica este
asimetrica spre dreapta (cu coada mai lung a distribuiei spre valorile mari, care apar cu frecventa mai
mica)&
<ndicatorii tendintei centrale se gasesc in urmatoarea relatie x Me Mo < < , ceea ce indica faptul ca
distributia de frecvente prezinta asimetrie pozitiva, in serie predominand valorile mici&
Pradul de asimetrie prezent 3n serie poate s fie (i msurat printr1un indicator specific, numit
coeficient de asimetrie (Skeness), care in cazul unei serii de distributii de frecvente pe r intervale de
variatie se calculeaza dupa
( )
( )
3
1
3
s n
n x x
CAS
r
i
i i

= ,
#3
unde { } r i x
i
, 1 , = sunt centrele celor r intervale,

=
=
r
i
i
n n
1
volumul esantionului&
Nr'
rt'
*nter&alul i
(/alariul anual al unui
absol&ent, in >)
,entrul
i
x
+re&enta absoluta
i
n
(numarul de absol&enti)
( )
i i
n x x
3
1 ;72!!< 125!!= %85! 3! $1,255%10@14
2 (125!!< 178!!= 1515! 6% $8,7326%0@13
3 (178!!< 231!!= 2!45! 3!2 $5,!7!760@13
4 (231!!< 284!!= 2575! 3!8 $313%415!56
5 (284!!< 337!!= 31!5! 263 3,454320@13
6 (337!!< 3%!!!= 3635! %5 1,!63440@14
7 (3%!!!< 443!!= 4165! 2! 7,714%40@13
8 (443!!< 4%6!!= 46%5! 6 5,543260@13
% (4%6!!< 54%!!= 5225! 5 %,!78280@13
1! (54%!!< 6!2!!= 5755! 1 3,15!410@13
11 (6!2!!< 655!!= 6285! 1 5,!17470@13

=
= =
11
1 i
i
n n 11!! ( )

=
=
11
1
3
i
i i
n x x 1,823!20@14
= CAS !,462
=um 1 ! < <CAS , avem asimetrie pozitiv, coada distribuiei este mai alungit la dreapta, 3n serie
predominnd valorile mici (modul ? mediana ? media)&
Pb. 5. Qa o banca se analizeaza distributia a 5!! de debitori restantieri dupa situatia datelor de intarziere a
rambursarii creditelor& *atele au fost sistematizate astfel:
<ntervale de variatie
a numarului de zile de intarziere a platii
4onderea cumulata
a debitorilor (0)
mai putin #5 de zile #5
#5135 de zile "5
351$5 de zile %5
$5155 de zile 23
5515 de zile 2%
peste 5 de zile 1!!
'e cere:
a) sa se scrie distributia de frecvente pe intervale de variatie)
b) sa se reprezinte grafic distributia de frecvente absolute)
c) sa se calculeze si sa se analizeze indicatorii tendintei centrale si sa se stabileasca daca durata
medie de intarziere a platilor este reprezentativa)
d) sa se calculeze media si abaterea standard pentru variabila alternativa care evidentiaza debitorii ce
au intarziat mai mult de $5 de zile cu efectuarea platilor&
Rezolvare: a)
o 4opulatia statistica > mutimea debitorilor cu intarziere in efectuarea platilor pentru rambursarea unor
credite&
o Unitatea statistica > un debitor&
o 5ariabila sau caracteristica de interes, R, este variabila ce arata numarul de zile de intarziere a
efectuarii platii catre banca de catre un deitor) variabila numerica, discreta&
o '1a realizat o selectie de volum 5!! = n de debitori restantieri pentru care s1a inregistrat numarul de
zile de intarziere, datele obtinute fiind sistematizate intr1o serie de distributie de frecvente pe = r
intervale de variatie de marime egala&
9otam cu:
#$

r i n
i
, 1 , =
, frecventa absoluta a intervalului i de variatie (numarul de debitori restantiei pentru care
numarul de zile de intarziere apartine intervalului i de variatie),
n n n
r
= + +&&&
1
)
[ ] r i
n
n
n
i
i
, 1 , 1 ) !
L
= = , frecventa relativa a intervalului i de variatie, 1 &&&
L L
1
= + +
r
n n )
r i
n
n
n
i
i
, 1 , 1!! 0
L
= = , frecventa relativa e.primata procentual a intervalului i de variatie sau
ponderea debitorilor cu numarul de zile de intarziere din intervalul sau clasa i, 0 1!! 0 &&& 0
L L
1
= + +
r
n n )

r k n n &
k ck
, 1 , &&&
1
= + + =
, este frecventa absoluta cumulata crescator a intervalului k)

r k n n &
k ck
, 1 , &&&
L L
1
L
= + + =
, este frecventa relativa cumulata crescator a intervalului k)

r k n n &
k ck
, 1 0, &&& 0 0
L L
1
L
= + + =
, este frecventa relativa e.primata procentual cumulata crescator a
intervalului k (ponderea cumulata a intervalului k)&
9r&
crt&
<ntervalul i de
variatie a
numarului de zile
de intarziere a
platii
4onderea cumulata
a debitorilor (0)
0 &&& 0 0
L L
1
L
k ck
n n & + + =
4onderea
intervalului i,
0
L
i
n
Brecventa
relativa,
1!!
0
L
L i
i
n
n =
Brecventa
absoluta,
L
L
5!!
i
i i
n
n n n
=
= =
1 151#5 de zile
= = 0 0
L
1
L
n &
ck
#50 = 0
L
1
n #50
=
L
1
n !,#5
=
1
n
1#5
# #5135 de zile
= + = 0 0 0
L
#
L
1
L
#
n n &
c
"50 = 0
L
#
n 5!0 =
L
#
n !,5!
=
#
n
#5!
3 351$5 de zile
= + + = 0 &&& 0 0
L
3
L
1
L
3
n n &
c
%50
= 0
L
3
n
1!0
=
L
3
n
!,1!
=
3
n
5!
$ $5155 de zile
= + + = 0 &&& 0 0
L
$
L
1
L
$
n n &
c
230 = 0
L
$
n %0 =
L
$
n !,!%
=
$
n
$!
5 5515 de zile
= + + = 0 &&& 0 0
L
5
L
1
L
5
n n &
c
2%0
= 0
L
5
n
50
=
L
5
n
!,!5
=
5
n
#5
51"5 de zile
= + + = 0 &&& 0 0
L

L
1
L

n n &
c
1!!0
= 0
L

n
#0
=
L

n
!,!#
=

n
1!

=
=

1
L
0
i
i
n
1!!0

=
=

1
L
i
i
n
1

=
= =

1
5!!
i
i
n n
*istributia celor 5!! de debitori dupa numarul de zile de intarziere a platii este urmatoarea serie
de distributie de frecvente pe intervale:
9r&
crt&
<ntervalul i de variatie
a numarului de zile
de intarziere a platii
9umarul de debitori
(frecventa absoluta),
i
n
=entrul
i
x
al
intervalului i de
variatie
1 151#5 de zile
=
1
n
1#5 debitori
=
1
x
#!
# #5135 de zile
=
#
n
#5!
=
#
x
3!
3 351$5 de zile
=
3
n
5!
=
3
x
$!
$ $5155 de zile
=
$
n
$!
=
$
x
5!
5 5515 de zile
=
5
n
#5
=
5
x
!
51"5 de zile
=

n
1!
=

x
"!

=
= =

1
5!!
i
i
n n
debitori
b)
#5
Histograma
125
25!
5!
4!
25
1!
!
5!
1!!
15!
2!!
25!
3!!
15$25
de #ile
25$35
de #ile
35$45
de #ile
45$55
de #ile
55$65
de #ile
65$75
de #ile
*umarul de /ile de intar/iere
*
u
m
a
r
u
l

d
e

d
e
b
i
t
o
r
i
Big& &&&&& *istributia celor 5!! de debitori dupa numarul de zile de
intarziere a platii
'oligonul (recventelor absolute
!
5!
1!!
15!
2!!
25!
3!!
! 1! 2! 3! 4! 5! 6! 7! 8!
*umarul /ilelor de intar/iere
*
u
m
a
r
u
l

d
e

d
e
b
i
t
o
r
i
Big& &&&& 4oligonul frecventelor absolute pentru distributia celor
5!! de debitori dupa numarul de zile de intarziere a platilor
c)
9r&
crt&
<ntervalul i
9umarul de
debitori,
i
n
=entrul
i
x
i i
n x
ck
&
( )
i i
n x x
#
1 151#5 de zile
=
1
n 1#5
=
1
x #!
=
1 1
n x 25!!
=
1 c
& 12
5
( ) =
1
#
1
n x x
1%22!
# #5135 de zile
=
#
n #5!
=
#
x 3!
75!!
=
# c
& 37
5 144!
3 351$5 de zile
=
3
n 5!
=
3
x $!
2!!!
=
3 c
& 42
5 2888
$ $5155 de zile
=
$
n $! =
$
x 5!
2!!! 465 123%!,4
5 5515 de zile
=
5
n #5 =
5
x !
15!! 4%! 1%!44
51"5 de zile
=

n 1!
=

x "!
=

n x 7!!
=
c
& 5!
!
( ) =

n x x 14137,6

=
= =

1
5!!
i
i
n n

=
=

1 i
i i
n x 162!! ( )

=
=

1
#
i
i i
n x x -6%12!
= x 32,4
=
#
s
138,517!
= =
#
s s 11,76%3
= v
36,33)
o Media este
5!!
1#!!
&&&
&&&

1
1
1 1
=

=
+ +
+ +
=

=
n
n x
n n
n x n x
x
i
i i
r
, deci
$ , 3# = x
zile este numarul mediu de zile
de intarziere a platilor pentru un debitor restantier&
o Qocul medianei este 5 , #5!
#
1
=
+ n
) primul interval cu proprietatea ca
#
1 +

n
&
ck
este intervalul #51
35 de zile, deoarece
5 , #5! 1#5
1
< =
c
&
, dar
5 , #5! 3"5
#
=
c
&
, deci:
=

+
+ =

Me
Me c
Me Me
n
&
n
+ x Me
1
inf
#
1
#
!# , 3!
#5!
1#5 5 , #5!
1! #5 =

+ =
zile, adica /umatate dintre debitorii restantieri au intarziat
cel putin 3! de zile cu efectuarea platilor&
o <ntervalul modal este intervalul #5135 de zile deoarece are frecventa absoluta cea mai mare
{ } , 1 , ma. #5!
#
= = = i n n
i
, atunci
=
+

+ =
# 1
1
inf Mo Mo
+ x Mo
( ) ( )
%$ , #%
5! #5! 1#5 #5!
1#5 #5!
1! #5 =
+

+ =
zile) numarul cel mai intalnit de zile de
intarziere a platilor celor 5!! de debitori restantieri este de apro.imativ #2 de zile&
o Eelatia in care se gasesc cei trei indicatori ai tendintei centrale este x Me Mo < < , ceea ce indica o
asimetrie pozitiva&
o *ispersia in esantion este ( ) ( )
( )
( )
1 5!!
21#!
1 5!! 1 &&&
&&&

1
#
1

#
1
#
1 #


=
+ +
+ +
=

= i
i i
n x x
n n
n x x n x x
s
, deci
51"! , 13%
#
= s
, iar abaterea standard
"23 , 11
#
= = s s
zile, care arata cu cate zile se abat, in
medie, valorile observate ale seriei de date fata de numarul mediu de zile de intarziere&
o =oeficientul de variatie in esantion este
0 35 0 33 , 3 1!!
$ , 3#
"23 , 11
1!! > = = =
x
s
v
, ceea ce arata ca
distributia nu este omogena si media, ca indicatot al tendintei centrale, nu este reprezentativa pentru
colectivitate&
d) *efinim Mevenimentul favorabilK ca evenimentul ca un debitor intarzie cu platile mai mult de $5 de
zile& 5ariabila alternativa care evidentiaza debitorii ce au intarziat mai mult de $5 de zile cu efectuarea
platilor este

m m n
'
1 !
:
,
unde 1 = ' pentru unitatile statistice din esantion care verifica evenimentul favorabil, iar m este
numarul de unitati statistice din esantion pentru care se verifica evenimentul favorabil,
"5
5 $
= + + = n n n m
debitori,
iar ! = ' pentru unitatile statistice din esantion care nu verifica evenimentul favorabil,
m n
este
numarul de unitati statistice din esantion pentru care nu se verifica evenimentul favorabil,
$#5 = m n debitori&
;edia variabilei alternative este
15 , !
5!!
"5
= = =
n
m
f
, adica 150 dintre debitori au intarziat mai
mult de $5 de zile&
*ispersia variabilei alternative este
( ) 1#"5 , ! 1 1
#
=

= =
n
m
n
m
f f s
alt
, iar abaterea standard
3 , ! 1

=
n
m
n
m
s
alt
&
#"