Sunteți pe pagina 1din 31

Anul I, CSIE 2011-2012

Statistica I
Exercitii pregatitoare pentru testul de la seminar si pentru examen partea I
Ex. 1. Urmtoarea serie de date arat preul de vnzare sute lei! pentru 1" lucrri de #ra$ic la o licitaie
de o%iecte de art& '1, (0, )2, "', "2, '), (", (1, *+, "", (), '*, "),
Sta%ilii valoarea de adevr a urmtoarelor a$irmaii, -usti$icnd rspunsurile&
a) 2' . dintre lucrarile licitate s-au vandut pentru un pret mai mic de *+ sute de lei/
b) -umatate dintre lucrarile licitate au un pret mai mic sau e#al cu '* sute lei/
c) 2' . dintre lucrari s-au vandut cu cel putin (2 sute de lei/
d) pentru )'. dintre o%iecte s-a o%tinut un pret de cel putin "( sute lei/
e) precizati care dintre urmatoarele valori& 2', 20, 1(, *0, 12*, +', 00,+ sute lei sunt outliers in
raport cu datele initiale,
Rezolvare:
Cele n11" valori ale seriei de date se ordoneaz cresctor&
x
1!
1"2, x
2!
1"", x
"!
1"', x
*!
1"), x
'!
1*+, x
(!
1'1, x
)!
1'*, x
+!
1'), x
0!
1(0, x
10!
1(1, x
11!
1(", x
12!
1(), x
1"!
1)2,
Q
1
2 cuartila de ordinul 1 sau cuartila in$erioara
3ocul lui Q
1
este =
+
=
+
'0 , " 1
*
1 1"
1
*
1 n
N, dar " 4 ",'0 4 *
( ) ( ) * 1 "
x Q x
si
( ) ( )
"(
2
") "'
2
* "
1
=
+
=
+
=
x x
Q sute lei,
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

. )'
1" 12 11 10 0 + ) ( ' *
"(
. 2'
" 2 1
1
x x x x x x x x x x x x x
Q

Cu interpretarea&
2' . dintre termenii seriei au valori mai mici decat "( sute lei Q
1
este percentila de ordinul 2'!,
iar )'. dintre termenii seriei au valori mai mari ca "( sute lei/
sau
2'. dintre lucrarile de #ra$ica licitate s-au vandut pentru un pret mai mic decat "( sute lei, iar
restul de )'. dintre ele s-au vandut cu un pret mai mare de "( sute lei,
Q
2
1Me 2 cuartila de ordinul 2 sau mediana seriei de date statistice,
3ocul lui Q
2
1Me este =
+
=
+
)
2
1 1"
2
1 n
N ( )
'*
)
= = x Me
sute lei
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

. '0
'*
. '0
1" 12 11 10 0 + ) ( ' * " 2 1
Me
x x x x x x x x x x x x x


Cu interpretarea&
-umatate dintre termenii seriei au valori mai mici ca '* sute lei Me este percentila de ordinul '0!,
iar restul au valori mai mari ca '* sute lei/
sau
-umatate dintre lucrarile de #ra$ica licitate s-au vandut cu mai putin de '* sute lei, iar restul s-au
vandut cu un pret mai mare de '* sute lei,
Q
"
2 cuartila de ordinul " sau cuartila superioara
3ocul lui Q
"
este =
+
=
+
'0 , 10 "
*
1 1"
"
*
1 n
N, dar 10 4 10,'0 4 11
( ) ( ) 11 " 10
x Q x
si
( ) ( )
(2
2
(" (1
2
11 10
"
=
+
=
+
=
x x
Q sute lei,
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

. )'
1" 12 11
(2
. 2'
10 0 + ) ( ' * " 2 1
"
x x x x x x x x x x x x x
Q

Cu interpretarea&
)' . dintre termenii seriei au valori mai mici decat (2 sute lei Q
"
este percentila de ordinul )'!,
iar 2'. dintre termenii seriei au valori mai mari ca (2 sute lei/
sau
)'. dintre lucrarile de #ra$ica licitate s-au vandut pentru un pret mai mic decat (2 sute lei, iar
restul de 2'. dintre ele s-au vandut cu un pret mai mare de (2 sute lei,
2
( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( ) ( )

. 2'
1" 12 11
(2
. '0
10 0 + ) ( ' *
"(
. 2'
" 2 1
" 1
x x x x x x x x x x x x x
Q Q


5umatate din termenii din mi-locul seriei au valori cuprinse intre Q
1
1"( sute lei si Q
"
1(2 sute lei,
A%aterea intercuatilica este IQR1Q
"
-Q
1
12( sute lei,
Definitie& Spunem ca o valoare x este outlier pentru un set de date statistice numerice daca&
IQR Q x < ' , 1
1
sau
IQR Q x + > ' , 1
"
sau
valoarea x este outlier pentru un set de date statistice daca daca se #aseste in a$ara intervalului
[ ] IQR Q IQR Q + ' , 1 / ' , 1
" 1
,
In cazul nostru,
[ ] [ ] 101 / " ' , 1 / ' , 1
" 1
= + IQR Q IQR Q
, deci numai valoarea 12* este outlier in
raport cu setul initial de date statistice,
In concluzie, a) $als/ b) adevarat/ c) adevarat/ d) adevarat/ e) numai valoarea 12* sute lei este
outlier in raport cu seria initiala de date,
Ex. 2. Se considera urmatoarea serie, reprezentand valoarea inre#istrata a 0 $acturi emise de o societate
comerciala in ultima luna& *)/ '+/ *1/ "(/ '*/ *2/ ('/ *"/ ") mil, lei!,
Ale#eti a$irmatiile $alse&
a) Cuartilele in$erioara si superioara sunt *" si respectiv '+ mil, lei,
b) A%aterea intercuartilica este de 10 mil, lei/
c) 5umatate dintre termenii seriei, plasati pe mi-ocul distri%utiei, se re#asesc intre "0 si '(,
d) 6ercentilele de ordinul 2' si )' sunt "0 si respectiv '( mil, lei
e) In raport cu datele initiale, valorile& )", 20, 1+, )", 2" sunt toate outliers,
f) 7aca $iecare valoare s-ar mari intai cu *,2' lei, apoi de 2 ori, dispersia noilor valori ar $i "0(,
Ex. . Structura unui esantion de 00 de copii dupa nivelul ma8im atins al unui -oc pe calculator este&
"
A
11%
B
13%
C
20%
D
34%
E
22%
Ex. !. 6entru "0 de actrite care au o%tinut premiul 9scar se cunoaste varsta, in ani impliniti, la momentul
casti#arii premiului&
'0, **, "', +0, 2(, 2+, *1, 21, (1, "+, *0, "", )*, "0, "", *1, "1, "', *1, *2,
"), 2(, "*, "*, "', 2(, (1, (0, "*, 2*, "0, "), "1, 2), "0, "*, 2(, 2', "" ani,
Se cere&
a) sa se determine si sa se interpreteze indicatorii tendintei centrale si cuartilele acestei serii de date/
b) sa se construiasca dia#rama %o8-plot sau dia#rama cu mustati %o8-and-:;is<er!, punand in
evidenta daca seria are valori e8treme/
c) sa se calculeze indicatorii variatiei si sa se sta%ileasca daca seria este omo#ena/
d) analizati asimetria/
e) 7escriptive Statistics,
Rezolvare& a)
o 6opulatia statistica este multimea actritelor care au casti#at premiul 9scar,
o Unitatea statistica este o actrita,
o =aria%ila sau caracteristica de interes, notata X, este varia%ila ce arata varsta unei actrite la momentul
o%tinerii premiului/ varia%ila numerica, discreta,
o 6entru un esantion de volum "0 = n de actrite se cunosc valorile varia%ilei X, adica >x
1
1'0, x
2
1**,
x
"
1"', x
*
1+0, ,,,, x
n
1x
"0
1"" ani?, care reprezinta o serie simpla sau nesistematizata de date statistice
numerice,
o @edia unei serii simple de date numerice { }
n
x x x ,,,, , ,
2 1
este
n
x
n
x x x
x
n
i
i
n

=
=
+ + +
=
1 2 1
,,, ,
In cazul acestei serii, varsta medie a unei actrite din esantion care a casti#at premiul 9scar este
102' , "+
"0
1*+(
"0 "0
,,,
"0
1 "0 2 1
= = =
+ + +
=

= i
i
x
x x x
x
ani,
Unde A 2 nivelul cel mai sla%, E 2 nivelul cel mai
inalt,
Construiti distri%utia de $recvente a%solute si
reprezentati-o #ra$ic,
Studiati tendinta centrala a distri%utiei $olosind
indicatori adecvati,
Calculati media si dispersia unei varia%ile
alternative, a carei stare $avora%ila este data de
copiii care au atins cel mult nivelul C al -ocului,
*
o 6entru a determina mediana, vom proceda ast$el&
- seria simpla de date se ordoneaza crescator ( ) ( ) ( ) n
x x x ,,,
2 1 , unde ( )
n i x
i
, 1 , =
este
elementul cu ran#ul i din seria ordonata crescator,
- locul medianei este
( )
"* 20
2
1
20
= = =
+
x Me
n
N
ani,
5umatate dintre actritele din selectie au o%tunut premiul 9scar la o varsta de cel mult "* de ani
-umatate dintre actritele din esantion au casti#at premiul 9scar la o varsta de peste "* de ani!,
o E8ista doua valori care au $recventa ma8ima si anume valorile 2( ani si "* ani, care apar pentru *
actrite $iecare,
Nr. crt. Varsta actritelor
i
x Varsta actritelor, in ordine crescatoare
( ) i
x
1
x
1
150 x
1!
121
2
x
2
144 x
2!
124
3
x
"
135 x
"!
125
4
x
*
180 x
*!
126
5
x
'
126 x
'!
126
6 28 26
7 41 26
8 21 27
61 28
10 38
x
10!
1301Q
1
11 4 30
12 33 31
13 74 31
14 30 33
15 33 33
16 41 33
17 31 34
18 35 34
1 41 34
20 42
x
20!
1341Me
21 37 35
22 26 35
23 34 35
24 34 37
25 35 37
26 26 38
27 61 3
28 60 41
2 34 41
30 24
x
"0!
1411Q
"
31 30 42
32 37 44
33 31 4
34 27
x
"*!
150
35 3
x
"'!
160
36 34
x
"(!
161
37 26
x
")!
161
38 25
x
"+!
174
3
x
"0
133 x
"0!
180
o 6entru determinarea cuartilelor procedam ast$el&
'
- locul cuartilei de ordinul 1, Q
1
, este
( )
"0 10 1
*
1
10 1
= = =
+
x Q
n
N
ani/ un s$ert dintre
actrite au casti#at premiul 9scar la o varsta mai mica sau e#ala cu "0 de ani, iar restul
la cel putin "0 de ani/
- locul cuartilei de ordinul ", Q
"
, este
( )
*1 "0 "
*
1
"0 "
= = =
+
x Q
n
N
ani/ trei s$erturi
dintre actrite au casti#at premiul 9scar la o varsta mai mica sau e#ala cu *1 de ani, iar
restul la cel putin *1 de ani,
o A%aterea intercuartilica este
11
1 "
= = Q Q IQR
ani si arata lun#imea intervalului in care se #asesc
-umatate dintre valorile din mi-locul seriei de date,
b) 7ia#rama cu mustati %o8-and-:;is<er! sau dia#rama %o8-plot pentru o serie de date statistice
numerice se construieste punand in evidenta urmatoarele cinci elemente si eventualele valori e8treme sau
outliers&
- cuartila in$erioara sau de ordinul 1, Q
1
1"0 ani/
- mediana sau cuartila de ordinul al 2-lea, Q
2
1Me1"* ani/
- cuartila superioara sau de ordinul al "-lea, A
"
1*1 ani/
- limita sau mar#inea in$erioara a dia#ramei %o8-plot este cea mai mica dintre valorile
seriei de date cu proprietatea ca este mai mare sau e#ala cu
IQR Q ' , 1
1
, adica
( ) ( )
{ } IQR Q x n i x
i i plot box
= =

' , 1 , 1 , min in$ lim


1 &
o ' , 1" ' , 1
1
= IQR Q
o cea mai mica dintre valorile seriei de date, cu proprietatea ca este
' , 1"
, este
x
1!
121 ani, deci mar#inea in$erioara este e#ala cu 21 ani,
( ) 1
21 in$ lim x
plot box
= =
/
- limita sau mar#inea superioara a dia#ramei %o8-plot este cea mai mare dintre valorile
seriei de date cu proprietatea ca este mai mica sau e#ala cu
IQR Q + ' , 1
"
, adica
( ) ( )
{ } IQR Q x n i x
i i plot box
+ = =

' , 1 , 1 , ma8 sup lim


" &
o ' , ') ' , 1
"
= + IQR Q
o cea mai mare dintre valorile seriei de date, cu proprietatea ca este
' , ')
, este
x
"*!
1'0 ani, deci mar#inea superioara este e#ala cu '0 ani,
( ) "*
'0 sup lim x
plot box
= =
,
Se o%serva ca intervalul cuprins intre mar#inea in$erioara si cea superioara dia#ramei %o8-plot,
adica intervalul de numere reale B21/ '0C nu contine toate valorile o%servate, in a$ara lui ramanand
valorile x
"'!
160, x
"(!
161, x
")!
161, x
"+!
174, x
"0!
180 ani,
=aloarea x este outlier pentru seria de date statistice numerice daca x se #aseste in a$ara
intervalului
[ ] [ ] ' , ') / ' , 1" ' , 1 / ' , 1
" 1
= + IQR Q IQR Q
, x
"'!
160, x
"(!
161, x
")!
161, x
"+!
174, x
"0!
180
sunt outliers si vor $i reprezentate distinct in dia#rama %o8-plot,
(
Di#, E, 7ia#rama %o8-plot sau dia#rama cu mustati %o8-and-:;is<er!,
Di#, E, 7ia#rama %o8-plot in S6SS,
c) 7ispersia de selectie sample variance! pentru o serie simpla de date numerice asupra varia%ilei X este
( ) ( )
( )
1 1
,,,
1
2
2 2
1 2

+ +
=

=
n
x x
n
x x x x
s
n
i
i
n
x
,
adica
( )
)2(0 , 1)+
1 "0
'+0) , ()01
1 "0
"0
1
2
2
=

= i
i
x
x x
s
,
"0
Q
1
!
"*
Me!
*1
Q
"
!
'0 (0 (1 )* +0
" " " "
"
)
21
a%aterea standard standard deviation! este "(++ , 1"
2
= =
x x
s s ani,
Coe$icientul de variatie este . "' . 00 , "' 100 > = =
x
s
v
x
x
, ceea ce indica $aptul ca seria de date nu
este omo#ena, iar media nu este reprezentativa pentru colectivitate, ca indicator al tendintei centrale,
Nr. crt.
Varsta actritelor
i
x
x x
i

( )
2
x x
i

1
x
1
150 11,874 141,548
2
x
2
144 5,874 34,777
3
x
"
135 !3,1026 ,625
4
x
*
180 41,874 1755,351
5
x
'
126 !12,1026 146,4720
6 28 !10,1026 102,0618
7 41
2,874 8,351
8 21 !17,1026 22,477
61
22,874 524,225
10 38
!0,1026 0,0105
11 4 10,874 118,7541
12 33 !5,1025 26,0361
13 74 35,874 1288,625
14 30
!8,1025 65,6515
15 33 !5,1025 26,0361
16 41
2,874 8,351
17 31 !7,1025 50,4464
18 35
!3,1025 ,625
1 41
2,874 8,351
20 42 3,874 15,100
21 37
!1,1025 1,2156
22 26 !12,1025 146,4720
23 34
!4,1025 16,8310
24 34 !4,1025 16,8310
25 35
!3,1025 ,625
26 26
!12,1025 146,4720
27 61 22,874 524,225
28 60
21,874 47,477
2 34 !4,10256 16,8310
30 24
!14,1025 18,8823
31 30 !8,1025 65,6515
32 37
!1,1025 1,2156
33 31 !7,1025 50,4464
+
34 27
!11,1025 123,266
35 3 0,874 0,8053
36 34
!4,1025 16,8310
37 26 !12,1025 146,4720
38 25
!13,1025 171,6771
3
x
"0
133 !5,1025 26,0361

=
=
"0
1 i
i
x 1486
( )

=
=
"0
1 i
i
x x
0
( )

=
=
"0
1
2
i
i
x x 671,58
7
= x 38,1025 =
2
x
s 178,7260
= =
2
x x
s s 13,3688
=
x
v 35,0%
d) Asimetria unei serii de distri%uie de $recvene se poate sta%ili&
- prin compararea indicatorilor tendintei centrale,
- prin analiza distantei intre mediana si cele doua cuartile in$erioara si superioara,
- prin calculul si interpretarea valorii unui indicator speci$ic, coe$icientul de asimetrie,
- se o%serv din reprezentarea #ra$ic prin ;isto#ram sau poli#onul $recvenelor,
- Cum
x Me = < = 102' , "+ "*
, atunci concluzionam ca seria de date prezinta asimetrie pozitiva,
- Cum mediana este mai apropiata de Q
1
decat de Q
2
, adica
Me Q Q Me <
" 1
, asa cum se poate
vedea din dia#rama %o8-plot, atunci concluzionam ca seria prezinta asimetrie pozitiva, in seria de date
predominand valorile mici,
- Indicatorul asimetriei este coe$icientul de asimetrie Skewness!
( )
( )
"
1
"
x
n
i
i
s n
x x
CAS

=
, al carui semn si
marime arata tipul asimetriei pozitiva sau ne#ativa!, iar marimea arata #radul mai putin accentuat sau
mai accentuat al asimetriei seriei de date sau al distri%utiei, In cazul acestei serii de date,
')"* , 1 = CAS
, o
valoare pozitiva si mai mare ca 1, ceea ce arata ca seria de date prezinta o asimetrie pozitiva pronuntata,
- Sistematizarea printr-o serie de distri%utie de $recvente pe ( = r intervale de variatie de marime
e#ala a dat urmatoarea distri%utie a celor n1"0 de actrite din esantion dupa varsta la momentul o%tinerii
premiului 9scar&
Nr. crt.
"nter#al$l k de #ariatie
%clasa de #arsta&
'rec#enta a(sol$ta
k
n
a inter#al$l$i k de #ariatie
%n$)ar$l de actrite
din *iecare clasa de #arsta&
Centr$l
k
x
al inter#al$l$i + de
#ariatie
1 20!30 ani 11 25
2 30!40 ani 16 35
3 40!50 ani 7 45
4 50!60 ani 1 55
5 60!70 ani 2 65
6 70!80 ani 2 75

=
=
(
1 k
k
n 3,n
Feprezentarea #ra$ica seriei de distri%utie de $recvente pe intervale, adica ;isto#rama si poli#onul
$recventelor su#ereaza ca aceasta prezinta asimetrie pronuntata la dreapta sau asimetrie pozitiva, adica
predomina valorile mai mici ale varia%ilei de interes, cu coada mai lun# a distri%uiei spre valorile mari,
0
care apar cu $recventa mai mica, Intre cele "0 de actrite casti#atoare ale premiului 9scar, predomina cele
cu varste relativ mai mici,
Histograma - distributia celor n=39 de actrite dupa
variabila ce arata varsta la momentul castigarii premiului
Oscar
11
16
7
1
2 2
0
2
4
6
8
10
12
14
16
18
20!30
ani
30!40
ani
40!50
ani
50!60
ani
60!70
ani
70!80
ani
Varsta (intervalele sau clasele de varsta)
F
r
e
c
v
e
n
t
a

a
b
s
o
l
u
t
a

(
n
u
m
a
r
u
l

d
e

a
c
t
r
i
t
e
)
Poligonul frecventelor pentru seria de distributie de frecvente
11
16
7
1
2 2
0
2
4
6
8
10
12
14
16
18
0 10 20 30 40 50 60 70 80
Varsta, in ani (centrele intervalelor)

u
m
a
r
u
l

d
e

a
c
t
r
i
t
e
e) Indicatorii tendintei centrale, principalii indicatori ai variatiei si ai $ormei distri%utiei pentru o serie
simpla de date numerice pot $i calculati in Excel si in S6SS, output-urile $iind de $orma&
9utput-ul #escriptive $tatistics in Excel
9utput-ul #escriptive $tatistics in S6SS
10
9%servatie& Analiza boltirii/aplatizrii
Boltireakurtosis, Gn en#l,! e8prim Gnlimea cur%ei HcocoaIeiJ! comparativ cu distri%uia normal
teoretic, Kntlnim, ast$el distribu!ii leptocurtice, ascuite cu HcocoaIaJ Gnalt! Ii distribu!ii platicurtice,
aplatizate, %oeficientul de boltire sau aplatizare kurtosis! este o msur a GmprItierii $iecrei
o%servaii Gn -urul unei valori centrale Ii se determin, pe eIantion, cu $ormula&
( )
( )
"
2
2
1
*

=
x
n
i
i
s n
x x
C"A
, unde
( )
1
1
2
2

=
n
x x
s
n
i
i
x
,
Defini!ia este ba#at$ pe momentul centrat de ordinul %&
Interpretarea valorii coe$icientului de aplatizare si %oltire&
7ac 0 > C"A , avem distri%uie leptocurtic, valorile vari%ilei $iind concentrate &n 'urul
indicatorilor tendin(ei centrale
11
Varsta actritelor
-ean %)edia&
= x 38.1025
.tandard Error
2.1407
-edian Me134
-ode Mo126
.tandard De#iation
%a(aterea standard&
= =
2
x x
s s 13.3688
.a)/le Variance
%dis/ersia de selectie&
=
2
x
s 178.7260
0$rtosis 2.3830
.+e1ness
%coe*icient$l de asi)etrie& = CAS 1.5734
2an3e
%A)/lit$dinea&
= =
min ma8
x x A
x
5
-ini)$) =
min
x 21
-a4i)$) =
ma8
x 80
.$)

=
=
"0
1 i
i
x 1486
Co$nt
n,3
!tatistics
Varsta actritelor 5scar
N Valid 3
-issin3 0
-ean
= x 38.10
.td. Error o* -ean 2.141
-edian Me134.00
-ode Mo126
a
.td. De#iation = =
2
x x
s s 13.36
Variance
=
2
x
s 178.726
.+e1ness
= CAS 1.573
.td. Error o* .+e1ness .378
0$rtosis 2.383
.td. Error o* 0$rtosis .741
2an3e
= =
min ma8
x x A
x
5

-ini)$)
=
min
x 21
-a4i)$)
=
ma8
x 80
.$)

=
=
"0
1 i
i
x 1486
6ercentiles 25
=
1
Q 30.00
50
= = Me Q
2
34.00
75
=
"
Q 41.00
a. -$lti/le )odes e4ist. 78e s)allest #al$e is s8o1n
7ac 0 < C"A , avem distri%uie platicurtica, valorile vari%ilei $iind dispersate &n raport cu
indicatorii tendin(ei centrale
7ac 0 = C"A , avem distri%uie mezocurtic, adic distri%uia normal,
In cazul acestei serii de date statistice,
0 "+" , 2 > = CA"
, ceea ce indica o distri%utie leptocurtica
cu cocoasa, asa cum se poate vedea si din ;isto#rama sau poli#onul $recventelor!,
Ex. ). Un a#ent al companiei de asi#urari ' vinde contracte de asi#urare de locuinte, In luna iulie a
inc;eiat& 2 contracte cu prime anuale de '0 Eur, " contracte cu prime anuale de (0 Eur, ( contracte cu
prime de )0 Eur, 0 contracte cu prime de 00 Eur, 1( contracte cu prime anuale de 120 Eur, + contracte cu
prime anuale de 1"0 Eur si ( contracte cu prime de 1*0 Eur, Se cere&
a) Construii seria de distri%uie de $recvene Ii analizai #ra$ic tendina de normalitate a acesteia,
b) Caracterizai omo#enitatea Ii asimetria distri%uiei contractelor Gn $uncie de valoarea primelor
anuale,
c) Calculati media si a%aterea standard a varia%ilei alternative care evidentiaza contractele cu prime
anuale de valoare mai mica sau e#ala cu 00 Eur,
Rezolvare& a)
o 6opulatia statistica este multimea contractelor de asi#urare de locuinte din porto$oliul companiei ',
o Unitatea statistica este un contract de asi#urare de locuinta,
o =aria%ila statistica sau caracteristica de interes, notata X, este varia%ila ce arata marimei primei
anuale, in Eur, pentru un contract de asi#urare de locuinta inc;eiat de un a#ent al companiei/ varia%ila
numerica, continua,
o A#entul a inc;eiat intr-o luna n1'0 de contracte, seria de date statistice re$eritoare la primele anuale
ale acestor contracte $iind sistematizata intr-o serie de distri%utie de $recvente pe r1) variante
distincte, Ast$el distri%utia celor n1'0 de contracte dupa valoarea primei anuale, in Eur, este&
Nr.
crt.
Valoarea
k
x E$r
a $nei /ri)e an$ale
N$)ar$l de contracte,
k
n ,
%*rec#enta a(sol$ta&
1
=
1
x 50 E$r =
1
n 2 contracte
2
=
2
x 60 E$r =
2
n 3
3
=
"
x
70 E$r
=
"
n
6
4
=
*
x 0 E$r =
*
n
5
=
'
x
120 E$r
=
'
n
16
6
=
(
x 130 E$r =
(
n 8
7
=
)
x
140 E$r
=
)
n
6

=
= =
)
1
'0
k
k
n n contracte
sau

= = = = = = =
= = = = = = =
( + 1( 0 ( " contracte 2
120 1"0 120 00 )0 (0 Eur '0
&
) ( ' * " 2 1
) ( ' * " 2 1
n n n n n n n
x x x x x x x
X
,
unde

=
= =
)
1
'0
k
k
n n
contracte,
o Feprezentarea #ra$ica a acestei serii de distri%utie este poli#onul $recventelor a%solute,
12
Poligonul frecventelor absolute - distributia celor "# de contracte
inc$eiate de agentul de asigurari dupa valoarea primei anuale
0
2
4
6
8
10
12
14
16
18
0 10 20 30 40 50 60 70 80 0 100 110 120 130 140 150
Prima anuala de asigurare a unui contract, in %ur
F
r
e
c
v
e
n
t
a

a
b
s
o
l
u
t
a

(
n
u
m
a
r
u
l

d
e

c
o
n
t
r
a
c
t
e
)
o 6oli#onul $recventelor su#ereaza ca distri%utia are tendinta de normalitate, dar prezinta asimetrie la
stan#a, coada poli#onului $reventelor a%solute $iind mai alun#ita spre stan#a,
o 6oli#onul $recventelor se mai poate reprezenta si cu a-utorul $recventelor relative
Nr.
crt.
Valoarea
k
x E$r
a $nei /ri)e an$ale
N$)ar$l de contracte,
k
n ,
%*rec#enta a(sol$ta&
'rec#enta relati#a [ ] 1 , 0
L
=
n
n
n
k
k
1
=
1
x 50 E$r =
1
n 2 contracte =
L
1
n 0,04
2
=
2
x 60 E$r =
2
n 3 =
L
2
n 0,06
3
=
"
x 70 E$r =
"
n 6 =
L
"
n 0,12
4
=
*
x 0 E$r =
*
n =
L
*
n 0,18
5
=
'
x 120 E$r =
'
n 16 =
L
'
n 0,32
6
=
(
x 130 E$r =
(
n 8 =
L
(
n 0,16
7
=
)
x 140 E$r =
)
n 6
=
L
)
n 0,12

=
= =
)
1
'0
k
k
n n contracte

=
=
)
1
L
1
k
k
n
1"
Poligonul frecventelor relative
0
0,05
0,1
0,15
0,2
0,25
0,3
0,35
0 10 20 30 40 50 60 70 80 0 100 110 120 130 140 150
Prima anuala, in %ur, pentru un contract de asigurare
F
r
e
c
v
e
n
t
a

r
e
l
a
t
i
v
a
b)
o Media pentru o serie de distri%utie de $recvente pe r variante distincte ale varia%ilei de interes este
n
n x
n n
n x n x
x
r
k
k k
r
r r

=

=
+ +
+ +
=
1
1
1 1
,,,
,,,
,
unde { } r k x
k
, 1 , = sunt variantele distincte o%servate ale varia%ilei, iar

=
=
r
k
k
n n
1
volumul
esantionului,
In cazul nostru,
2 , 10(
'0
'"10
'0
)
1
= =

= k
k k
n x
x
Eur este valoarea medie a unei prime anuala
corespunzatoare unui contract de asi#urare de locuinta inc;eiat de respectivul a#ent de vanzari,
o Mediana pentru o serie de distri%utie de $recvente pe r variante distincte se calculeaza parcur#and
urmatorii pasi&
Cele r variante distincte sunt ordonate crescator
r
x x x < < < ,,,
2 1
,
Se determina locul medianei, adica
' , 2'
2
1
=
+ n
,
Se calculeaza $recventele a%solute cumulate crescator ale celor r variante distincte
k ck
n n ( + + = ,,,
1
,
r k , 1 =
,
@ediana este acea valoare distincta cu proprietatea ca $recventa sa a%soluta cumulata
crescator este prima care depaseste locul medianei
' , 2' 20
' , 2' 11
' , 2' '
' , 2' 2
*
"
2
1
< =
< =
< =
< =
c
c
c
c
(
(
(
(
si
' , 2' "(
'
=
c
(
, deci a '-a varianta sau valoare distincta,
'
x
, este mediana sau
valoarea mediana&
120
'
= =x Me
Eur, adica -umatate dintre contractele inc;eiat de
a#entul de vanzari au o prima anuala de valoare mai cica sau e#ala cu 120 Eur,
1*
Nr.
crt.
Valoarea
distincta,
k
x E$r
k
n ,
%*rec#enta
a(sol$ta&
k k
n x
k ck
n n ( + + = ,,,
1
( )
k k
n x x
2
1
=
1
x 50 =
1
n 2 =
1 1
n x 100 = =
1 1
n (
c
2 ( ) =
1
2
2
n x x
6316,88
2
=
2
x 60 =
2
n 3 =
2 2
n x 180 = + =
2 1 2
n n (
c
5 ( ) =
2
2
2
n x x
6403,32
3
=
"
x 70 =
"
n 6
420
= + + =
" 2 1 "
n n n (
c
11
7862,64
4
=
*
x 0 =
*
n
810
= + + =
* 1 *
,,, n n (
c
20
2361,6
5
=
'
x 120 =
'
n 16
120
= + + =
' 1 '
,,, n n (
c
36
3047,04
6
=
(
x 130 =
(
n 8
1040
= + + =
( 1 (
,,, n n (
c
44
4531,52
7
=
)
x 140 =
)
n 6
840
= = + + = n n n (
c ) 1 )
,,, 5
0
( ) =
)
2
)
n x x 6854,64

=
= =
)
1
'0
k
k
n n

=
=
)
1 k
k k
n x 531
0
( )

=
=
)
1
2
k
k k
n x x 3737
8
= x 106,2
=
2
x
s 762,8163265
= =
2
x x
s s 27,611272
=
x
v 26,01%
o Modul sau valoarea modala pentru o serie de distri%utie de $recvente pe r variante distincte este acea
varianta sau valoare care apare cu $recventa a%soluta sau relativa cea mai mare&
Drecventa a%soluta cea mai mare este&
{ } r k n n
k
, 1 , ma8 1(
'
= = = ,
valoarea modala este deci a '-a varianta sau valoare distincta de raspuns a
varia%ilei de interes,
120
'
= =x Mo
Eur, aceasta $iind valoarea cea mai des intalnita a unei
prime anuale pentru contractele inc;eiate de respectivul a#ent,
o Felatia in care se #asesc indicatorii tendintei centrale, Mo Me x = < , ca si reprezentatrea #ra$ica
pentru poli#onul $recventelor a%solute sau relative, arata ca distri%utia contractelor dupa valoarea
primelor anuale prezinta asimetrie ne#ativa, in serie predominand valorile mai mari ale primelor
anuale, iar coada distri%utiei este alun#ita spre stan#a,
o 7ispersia in esantion de selectie! pentru o serie de distri%utie de $recvente pe r intervale de variatie
este
( ) ( )
( )
( )
1 1 ,,,
,,,
1
2
1
2
1
2
1 2


=
+ +
+ +
=

=
n
n x x
n n
n x x n x x
s
r
k
k k
r
r r
x
,
unde { } r k x
k
, 1 , = sunt variantele distincte o%servate ale varia%ilei,

=
=
r
k
k
n n
1
volumul esantionului,
In cazul nostru,
( )
+1(" , )(2
1 '0
")")+
1 '0
)
1
2
2
=

= k
k k
x
n x x
s
, iar a%aterea standard sau a%aterea medie
patratica este (101 , 2)
2
= =
x x
s s Eur, care arata cu cat se a%at, in medie, valorile o%servate $ata de
nivelul mediu in esantion al primelor anuale,
o Coe$icientul de variatie in esantion este
. "0 . 01 , 2( 100
2 , 10(
(101 , 2)
100 < = = =
x
s
v
x
x
, ceea ce arata ca
distri%utia este omo#ena si media este reprezentativa pentru colectivitate,
1'
c) 7e$inim Mevenimentul $avora%ilJ ca evenimentul ca un contract de asi#urare are o prima anuala de
valoare mai mica sau e#ala cu 00 Eur, =aria%ila alternativa care evidentiaza contractele ale caror prime
anuale sunt de valoare mai mica sau e#ala cu 00 Eur este

m m n
)
1 0
&
,
unde 1 = ) pentru unitatile statistice din esantion care veri$ica evenimentul $avora%il, iar m este
numarul de unitati statistice din esantion care veri$ica evenimentul $avora%il,
20
* " 2 1
= + + + = n n n n m
contracte,
iar 0 = ) pentru unitatile statistice din esantion care nu veri$ica evenimentul $avora%il,
m n
este
numarul de unitati statistice din esantion pentru care nu se veri$ica evenimentul $avora%il,
"0 = m n de contracte cu prime anuale mai mari de 00 Eur,
@edia varia%ilei alternative este
* , 0
'0
20
= = =
n
m
*
, adica *0. dintre contracte au valori ale
primelor anuale mai mici sau e#ale cu 00 Eur,
7ispersia varia%ilei alternative este
2* , 0 1
2
=

=
n
m
n
m
s
*
, iar a%aterea standard
*+ , 0 1

=
n
m
n
m
s
*
Ex. *. 7istri%utia a 1100 de a%solventi ai Universitatii din Dlorida dupa salariul casti#at, in N, in primul an
dupa terminarea studiilor este urmatoarea serie de distri%utie de $recvente pe intervale de variatie&
Or, crt, Intervalul de variatie al salariului, N Oumarul de a%solventi
1 97200: 12500; 30
2 %12500: 17800; 6
3 %17800: 23100; 302
4 %23100: 28400; 308
5 %28400: 33700; 263
6 %33700: 3000; 5
7 %3000: 44300; 20
8 %44300: 4600; 6
%4600: 5400; 5
10 %5400: 60200; 1
11 %60200: 65500; 1
Se cere&
a) sa se reprezinte #ra$ic aceasta serie de distri%utie/
b) sa se determine si sa se interpreteze indicatorii tendintei centrale/
c) sa se reprezinte #ra$ic poli#onul $recventelor a%solute cumulate crescator si sa se estimeze
proportia a%solventilor care&
i) au o%tinut un salariu mai mic de 21000 N in primul an de dupa $inalizarea studiilor,
ii) au o%tinut un salariu mai mic decat media in primul an de dupa $inalizarea studiilor,
iii) au casti#at in primul an intre 2'000 N si *0000 N,
iv) au casti#at mai mult de '2000 N/
d) sa se sta%ileasca daca media este reprezentativa pentru colectivitate/
e) sa se analizeze asimetria acestei distri%utii,
Rezolvare& a)
6opulatia statistica este multimea a%solventilor Universitatii din Dlorida, promotiile anilor 10+0 si
1000, asa cum se speci$ica in $isierul +niversit* of (lorida ,raduate salaries,sav al pro#ramului
S6SS,
Unitatea statistica este un a%solvent,
=aria%ila sau caracteristica de interes, notata X, este varia%ila ce arata salariul unui a%solvent, in N, din
primul an de dupa $inalizarea studiilor, varia%ila numerica, continua,
1(
6entru un esantion de volum
1100 = n
de a%solventi s-au inre#istrat valorile varia%ilei, iar setul de
date s-a sistematizat intr-o serie de distri%utie de $recvente pe 11 = r intervale de variatie de marime
e#ala, data in enuntul pro%lemei,
Feprezentarea #ra$ica a acestei serii de distri%utie de $recvente pe intervale de variatie se poate realiza
prin ;isto#rama si poli#onul $recventelor a%solute,
Nr.
crt.
"nter#al$l k de #ariatie
%.alari$l an$al al $n$i
a(sol#ent, in <&
'rec#enta a(sol$ta
k
n a inter#al$l$i k
%n$)ar$l de a(sol#enti&
=i)ita in*erioara
( ) in$ k
x
a inter#al$l$i k
=i)ita s$/erioara
( ) sup k
x
a inter#al$l$i k
Centr$l
k
x
al inter#al$l$i k
1 97200: 12500; 30 7200 12500 850
2 %12500: 17800; 6 12500 17800 15150
3 %17800: 23100; 302 17800 23100 20450
4 %23100: 28400; 308 23100 28400 25750
5 %28400: 33700; 263 28400 33700 31050
6 %33700: 3000; 5 33700 3000 36350
7 %3000: 44300; 20 3000 44300 41650
8 %44300: 4600; 6 44300 4600 4650
%4600: 5400; 5 4600 5400 52250
10 %5400: 60200; 1 5400 60200 57550
11 %60200: 65500; 1 60200 65500 62850

=
= =
11
1 k
k
n n 1100
Histograma
30
6
302
308
263
5
20
6 5
1 1
0
50
100
150
200
250
300
350
9
7
2
0
0
:

1
2
5
0
0
;
%
1
2
5
0
0
:

1
7
8
0
0
;
%
1
7
8
0
0
:

2
3
1
0
0
;
%
2
3
1
0
0
:

2
8
4
0
0
;
%
2
8
4
0
0
:

3
3
7
0
0
;
%
3
3
7
0
0
:

3

0
0
0
;
%
3

0
0
0
:

4
4
3
0
0
;
%
4
4
3
0
0
:

4

6
0
0
;
%
4

6
0
0
:

5
4

0
0
;
%
5
4

0
0
:

6
0
2
0
0
;
%
6
0
2
0
0
:

6
5
5
0
0
;
!alariul, in & (intervalele de variatie)
F
r
e
c
v
e
n
t
a

a
b
s
o
l
u
t
a

(
n
u
m
a
r
u
l

d
e

a
b
s
o
l
v
e
n
t
i
)
Di#, ,,,,, Pisto#rama 2 7istri%utia celor 1100 de a%solventi ai Universitatii din Dlorida dupa salariul
casti#at in primul an de dupa $inalizarea studiilor,
1)
6oli3on$l *rec#entelor a(sol$te
30
6
263
5
302
308
20
6
5
1
1
0
50
100
150
200
250
300
350
0 10000 20000 30000 40000 50000 60000 70000
!alariul, in & (centrele intervalelor de variatie)
F
r
e
c
v
e
n
t
a

a
b
s
o
l
u
t
a

(
n
u
m
a
r
u
l

d
e

a
b
s
o
l
v
e
n
t
i
)
Di#, ,,,,, 6oli#onul $recventelor a%solute 2 7istri%utia celor 1100 de a%solventi ai Universitatii din
Dlorida dupa salariul casti#at in primul an de dupa $inalizarea studiilor,
b) Indicatorii tendintei centrale& media, mediana si modul,
Nr.
crt.
"nter#al$l k
%.alari$l an$al al
$n$i
a(sol#ent, in <&
Centr$l
k
x
'rec#enta a(sol$ta
k
n
%n$)ar$l de a(sol#enti&
k k
n x
'rec#enta a(sol$ta
c$)$lata crescator
a inter#al$l$i +,
k ck
n n ( + + = ,,,
1
1 97200: 12500; 850 30 25500 30
2 %12500: 17800; 15150 6 1045350
3 %17800: 23100; 20450 302 617500 401
4 %23100: 28400; 25750 308 731000 70
5 %28400: 33700; 31050 263 8166150 72
6 %33700: 3000; 36350 5 3453250 1067
7 %3000: 44300; 41650 20 833000 1087
8 %44300: 4600; 4650 6 281700 103
%4600: 5400; 52250 5 261250 108
10 %5400: 60200; 57550 1 57550 10
11 %60200: 65500; 62850 1 62850 1100

=
= =
11
1 k
k
n n 1100

=
=
11
1 k
k k
n x 2856350
0
= x 2566,82
o Media pentru o serie de distri%utie de $recvente pe r intervale de variatie este
n
n x
n n
n x n x
x
r
k
k k
r
r r

=

=
+ +
+ +
=
1
1
1 1
,,,
,,,
,
unde { } r k x
k
, 1 , = sunt centrele celor r intervale, iar

=
=
r
k
k
n n
1
volumul esantionului,
1+
+2 , 2'0((
1100
2+'("'00
1100
11
1
= =

= k
k k
n x
x
N a casti#at, in medie, un a%solvent in primul an,
o Mediana pentru o serie de distri%utie de $recvente pe r intervale de variatie se calculeaza parcur#and
urmatorii pasi&
Se determina locul medianei, adica
' , ''0
2
1
=
+ n
,
Se calculeaza $recventele a%solute cumulate crescator ale intervalelor de variatie
k ck
n n ( + + = ,,,
1
,
r k , 1 =
,
Intervalul median este primul interval cu proprietatea ca $recventa sa a%soluta cumulata
crescator depaseste locul medianei
' , ''0 *01
' , ''0 00
' , ''0 "0
"
2
1
< =
< =
< =
c
c
c
(
(
(
si
' , ''0 )00
*
=
c
(
, deci al *-lea interval de variatie %23100: 28400; < este intervalul
median,

+
+ =

Me
Me c
Me Me
n
(
n
- x Me
1
in$
2
1

'( , 2'()2
"0+
*01 ' , ''0
'"00 2"100 =

+ =
N, adica -umatate dintre a%solventi au
casti#at cel mult 2'()2,'(N in primul an sau -umatate au casti#at cel putin 2'()2,'( N,
o Modul sau valoarea modala pentru o serie de distri%utie de $recvente pe r intervale de variatie se
calculeaza ast$el&
Se determina intervalul cu $recventa a%soluta cea mai mare&
{ } r k n n
k
, 1 , ma8 "0+
*
= = = ,
deci al *-lea interval de variatie %23100: 28400; < este intervalul modal,

=
+

+ =
2 1
1
in$ Mo Mo
- x Mo

( ) ( )
'2 , 2")2"
2(" "0+ "02 "0+
"02 "0+
'"00 2"100 =
+

+ =
N, aceasta este valoarea cea mai
des intalnita a casti#ului salarial al unui a%solvent intr-un an,
c) Introducem $unctia
+
R R &
c
(
de$inita ast$el
( ) = x (
c
numarul de unitati statistice din esantion pentru care valoarea o%servata a caracteristicii
de interes X este mai mica sau e#ala cu x
sau
$recventa cumulata a lui x,
Drecventa a%soluta cumulata crescator a intervalului k de variatie,
k ck
n n ( + + = ,,,
1
,
r k , 1 =
,
reprezinta numarul de unitati statistice din esantion pentru care valoarea o%servata a varia%ilei de interes
X este mai mica sau e#ala decat limita superioara ( ) sup k
x
a intervalului k de variatie, adica
( )
( )
sup k c ck
x ( ( =
,
r k , 1 =
.
6entru reprezentarea #ra$ica a poli#onului $reventelor a%solute cumulate crescator vom pune in
evidenta limitele superioare ( )sup k
x
ale intervalelor de variatie si $recventele lor a%solute cumulate,
impreuna cu limita in$erioara a primului interval de variatie ( ) in$ 1
x
, in cazul nostru )200 N, a carui
10
$recventa a%soluta cumulata este 0,
( )
( ) ( ) 0 )200
in$ 1
= =
c c
( x (
, deoarece pentru nicio unitate statistica din
esantion, nivelul varia%ilei nu este mai mic decat ( ) in$ 1
x
,
3imitele superioare ale
intervalelor de variatie,
( ) sup k
x
( )
( )
k ck k c
n n ( x ( + + = = ,,,
1 sup
, adica
numarul de a%solventi din esantion
care au casti#at un salariu mai mic sau e#al cu ( ) sup k
x
N
( ) in$ 1
x
,7200
( )
( ) ( ) )200
in$ 1 c c
( x ( =
10
( )sup 1
x
112500
( )
( ) ( ) 12'00
sup 1 c c
( x ( =
130
( ) sup 2
x
117800
( )
( ) ( ) 1)+00
sup 2 c c
( x ( =
1
( )sup "
x
123100
( )
( ) ( ) 2"100
sup " c c
( x ( =
,401
( ) sup *
x
128400
( )
( ) ( ) 2+*00
sup * c c
( x ( =
,70
( ) sup '
x
133700
( )
( ) ( ) "")00
sup ' c c
( x ( =
172
( ) sup (
x
13000
( )
( ) ( ) "0000
sup ( c c
( x ( =
,1067
( ) sup )
x
144300
( )
( ) ( ) **"00
sup ) c c
( x ( =
,1087
( )sup +
x
14600
( )
( ) ( ) *0(00
sup + c c
( x ( =
,103
( ) sup 0
x
15400
( )
( ) ( ) '*000
sup 0 c c
( x ( =
,108
( )sup 10
x
160200
( )
( ) ( ) (0200
sup 10 c c
( x ( =
,10
( )sup 11
x
165500
( )
( ) ( ) (''00
sup 11 c c
( x ( =
11100
Poligonul freventelor absolute cumulate crescator

70
72
1100
10
108 103 1087
1067
401
30
0
0
200
400
600
800
1000
1200
0 10000 20000 30000 40000 50000 60000 70000
!alariul, in & (limitele superioare ale intervalelor de variatie)
F
r
e
c
v
e
n
t
e
l
e

a
b
s
o
l
u
t
e

c
u
m
u
l
a
t
e
(
n
u
m
a
r
u
l

c
u
m
u
l
a
t

d
e

a
b
s
o
l
v
e
n
t
i
)
i)
( ) 21000
c
(
este numarul de a%solventi care au o%tinut un salariu mai mic de 21000 N in primul an
de dupa $inalizarea studiilor,
20
=aloarea 21000 N se #aseste in intervalul de variatie %17800: 23100; N, iar
( ) 21000
c
(
se determina
prin interpolare liniara, utilizand urmatoarea e#alitate de rapoarte, asa cum se poate o%serva in $i#ura
de mai -os&
( ) ( )
( ) ( ) 1)+00 2"100
1)+00 21000
1)+00 2"100
1)+00 21000
c c
c c
( (
( (

( )
00 *01
00 21000
'"00
"200

=
c
(
( ) 2+1 "" , 2+1 21000 =
c
(
a%solventi, adica o proportie de
. '* , 2' 100
1100
2+1
=
dintre cei 1100
de a%solventi din esantionul considerat au avut un salariu anual mai mic de 21000 N,
Di#, ,,,, Interpolare liniara - detaliu din $i#ura reprezentand poli#onul $recventelor a%solute cumulate
crescator, pentru intervalul %17800: 23100; N in care se #aseste 21000 N.
ii)
( ) +2 , 2'0((
c
(
este numarul de a%solventi care au o%tinut un salariu mai mic decat nivelul mediu
= x 2'0((,+2 N al salariului in esantion,
7in relatia
( ) ( )
( ) ( ) 2"100 2+*00
2"100 +2 , 2'0((
2"100 2+*00
2"100 +2 , 2'0((
c c
c c
( (
( (

,
o%tinem ca
( ) '(+ + , '() +2 , 2'0(( =
c
(
a%solventi,
21
adica o proportie de
. (" , '1 100
1100
'(+
=
dintre cei 1100 de a%solventi din esantionul considerat au
avut un salariu anual mai mic de nivelul mediu,
iii)
( ) ( ) ''0 "' , ''0 2'000 *0000 =
c c
( (
este numarul de a%solventi care au casti#at in primul an
intre 2'000 N si *0000 N, adica '0,+1. dintre cei 1100 de a%solventi,
iv)
( ) ( ) ' )" , * '2000 1100 '2000 = =
c c
( ( n
a%solventi au casti#at mai mult de '2000 N, adica o
proportie de 0,*'.,
d) @edia varia%ilei de interes in esantion este = x 2566,82 <.
Nr.
crt.
"nter#al$l k
%.alari$l an$al al
$n$i
a(sol#ent, in <&
Centr$l
k
x
'rec#enta a(sol$ta
k
n
%n$)ar$l de a(sol#enti&
( )
k k
n x x
2
1 97200: 12500; 850 30
( ) =
1
2
1
n x x 772556607
2 %12500: 17800; 15150 6 807324804
3 %17800: 23100; 20450 302 11461480
4 %23100: 28400; 25750 308 1447361,02
5 %28400: 33700; 31050 263 675583074
6 %33700: 3000; 36350 5 102410557
7 %3000: 44300; 41650 20 4124268
8 %44300: 4600; 4650 6 2641763057
%4600: 5400; 52250 5 3454027755
10 %5400: 60200; 57550 1 747258,
11 %60200: 65500; 62850 1 136036867

=
= =
11
1 k
k
n n 1100
( )

=
=
11
1
2
k
k k
n x x 5548221886
4
=
2
x
s 50484275,58
=
x
s
7105,2287
7ispersia in esantion de selectie! pentru o serie de distri%utie de $recvente pe r intervale de
variatie este
( ) ( )
( )
( )
1 1 ,,,
,,,
1
2
1
2
1
2
1 2


=
+ +
+ +
=

=
n
n x x
n n
n x x n x x
s
r
k
k k
r
r r
x
,
unde { } r k x
k
, 1 , = sunt centrele celor r intervale,

=
=
r
k
k
n n
1
volumul esantionului,
( )
'+ , '0*+*2)'
1 1100
* ''*+221++(
1 1100
11
1
2
2
=

= k
k k
x
n x x
s
, iar a%aterea standard este
22+) , )10' =
x
s
N,
care arata cu cat se a%at, in medie, valorile o%servate $ata de nivelul mediu al salariului din esantion,
Coe$icientul de variatie in esantion este
. "0 . "( , 2) 100
+2 , 2'0((
22+) , )10'
100 < = = =
x
s
v
x
x , ceea ce
arata ca media este reprezentativa pentru colectivitate,
22
e) Asimetria unei serii de distri%uie de $recvene se o%serv din reprezentarea #ra$ic prin
;isto#ram sau poli#onul $recvenelor, si prin modalitatea Gn care sunt situai, unul $a de cellalt,
indicatorii tendinei centrale,
Histograma
30
6
302
308
263
5
20
6 5
1 1
0
50
100
150
200
250
300
350
9
7
2
0
0
:

1
2
5
0
0
;
%
1
2
5
0
0
:

1
7
8
0
0
;
%
1
7
8
0
0
:

2
3
1
0
0
;
%
2
3
1
0
0
:

2
8
4
0
0
;
%
2
8
4
0
0
:

3
3
7
0
0
;
%
3
3
7
0
0
:

3

0
0
0
;
%
3

0
0
0
:

4
4
3
0
0
;
%
4
4
3
0
0
:

4

6
0
0
;
%
4

6
0
0
:

5
4

0
0
;
%
5
4

0
0
:

6
0
2
0
0
;
%
6
0
2
0
0
:

6
5
5
0
0
;
!alariul, in & (intervalele de variatie)
F
r
e
c
v
e
n
t
a

a
b
s
o
l
u
t
a

(
n
u
m
a
r
u
l

d
e

a
b
s
o
l
v
e
n
t
i
)
6oli3on$l *rec#entelor a(sol$te
30
6
263
5
302
308
20
6 5
1 1
0
50
100
150
200
250
300
350
0 10000 20000 30000 40000 50000 60000 70000
!alariul, in & (centrele intervalelor de variatie)
F
r
e
c
v
e
n
t
a

a
b
s
o
l
u
t
a

(
n
u
m
a
r
u
l

d
e

a
b
s
o
l
v
e
n
t
i
)
Feprezentarea #ra$ica seriei de distri%utie su#ereaza ca aceasta are tendinta de normalitate si ca in
seria de date predomina valorile mai mici ale varia%ilei de interes, casti#ul salarial intr-un an, adica este
asimetrica spre dreapta cu coada mai lun# a distri%uiei spre valorile mari, care apar cu $recventa mai
mica!,
Indicatorii tendintei centrale se #asesc in urmatoarea relatie x Me Mo < < , ceea ce indica $aptul ca
distri%utia de $recvente prezinta asimetrie pozitiva, in serie predominand valorile mici,
Qradul de asimetrie prezent Gn serie poate s $ie Ii msurat printr-un indicator speci$ic, numit
coe$icient de asimetrie Skewness!, care in cazul unei serii de distri%utii de $recvente pe r intervale de
variatie se calculeaza dupa
( )
( )
"
1
"
x
r
k
k k
x
s n
n x x
CAS

=
,
unde { } r k x
k
, 1 , = sunt centrele celor r intervale,

=
=
r
k
k
n n
1
volumul esantionului,
Nr.
crt.
"nter#al$l k
%.alari$l an$al al $n$i
a(sol#ent, in <&
Centr$l
k
x
'rec#enta a(sol$ta
k
n
%n$)ar$l de a(sol#enti&
( )
k k
n x x
"
1 97200: 12500; 850 30 !1,2551E>14
2 %12500: 17800; 15150 6 !8,7326E>13
3 %17800: 23100; 20450 302 !5,07076E>13
4 %23100: 28400; 25750 308 !313415056
5 %28400: 33700; 31050 263 3,45432E>13
6 %33700: 3000; 36350 5 1,06344E>14
7 %3000: 44300; 41650 20 7,7144E>13
8 %44300: 4600; 4650 6 5,54326E>13
%4600: 5400; 52250 5 ,07828E>13
10 %5400: 60200; 57550 1 3,15041E>13
11 %60200: 65500; 62850 1 5,01747E>13

=
= =
11
1 k
k
n n 1100 ( )

=
=
11
1
"
k
k k
n x x 1,82302E>14
= CAS 0,462
Cum 1 0 < < CAS , avem asimetrie pozitiv, coada distri%uiei este mai alun#it la dreapta, Gn serie
predominnd valorile mici modul 4 mediana 4 media!,
2"
Ex. +. 3a o %anca se analizeaza distri%utia a '00 de de%itori restantieri dupa situatia datelor de intarziere a
ram%ursarii creditelor, 7atele au $ost sistematizate ast$el&
Intervale de variatie
a numarului de zile de intarziere a platii
6onderea cumulata
a de%itorilor .!
mai putin 2' de zile 2'
2'-"' de zile )'
"'-*' de zile +'
*'-'' de zile 0"
''-(' de zile 0+
peste (' de zile 100
Se cere&
a) sa se scrie distri%utia de $recvente pe intervale de variatie/
b) sa se reprezinte #ra$ic distri%utia de $recvente a%solute/
c) sa se calculeze si sa se analizeze indicatorii tendintei centrale si sa se sta%ileasca daca durata
medie de intarziere a platilor este reprezentativa/
d) sa se calculeze media si a%aterea standard pentru varia%ila alternativa care evidentiaza de%itorii ce
au intarziat mai mult de *' de zile cu e$ectuarea platilor,
Rezolvare& a)
o 6opulatia statistica 2 mutimea de%itorilor cu intarziere in e$ectuarea platilor pentru ram%ursarea unor
credite,
o Unitatea statistica 2 un de%itor,
o =aria%ila sau caracteristica de interes, R, este varia%ila ce arata numarul de zile de intarziere a
e$ectuarii platii catre %anca de catre un deitor/ varia%ila numerica, discreta,
o S-a realizat o selectie de volum '00 = n de de%itori restantieri pentru care s-a inre#istrat numarul de
zile de intarziere, datele o%tinute $iind sistematizate intr-o serie de distri%utie de $recvente pe ( = r
intervale de variatie de marime e#ala,
Ootam cu&

r k n
k
, 1 , =
, $recventa a%soluta a intervalului k de variatie numarul de de%itori restantiei pentru
care numarul de zile de intarziere apartine intervalului k de variatie!,
n n n
r
= + +,,,
1
/
[ ] r k
n
n
n
k
k
, 1 , 1 / 0
L
= = , $recventa relativa a intervalului k de variatie, 1 ,,,
L L
1
= + +
r
n n /
r k
n
n
n
k
k
, 1 , 100 .
L
= = , $recventa relativa e8primata procentual a intervalului k de variatie sau
ponderea de%itorilor cu numarul de zile de intarziere din intervalul sau clasa k, . 100 . ,,, .
L L
1
= + +
r
n n /

r k n n (
k ck
, 1 , ,,,
1
= + + =
, este $recventa a%soluta cumulata crescator a intervalului k/

r k n n (
k ck
, 1 , ,,,
L L
1
L
= + + =
, este $recventa relativa cumulata crescator a intervalului k/

r k n n (
k ck
, 1 ., ,,, . .
L L
1
L
= + + =
, este $recventa relativa e8primata procentual cumulata crescator a
intervalului k ponderea cumulata a intervalului k!,
Or,
crt,
Intervalul k de
variatie a
6onderea cumulata
a de%itorilor .!
6onderea
intervalului k,
Drecventa
relativa,
Drecventa
a%soluta,
2*
numarului de zile
de intarziere a
platii
. ,,, . .
L L
1
L
k ck
n n ( + + = .
L
k
n
100
.
L
L k
k
n
n =
L
L
'00
k
k k
n
n n n
=
= =
1 1'-2' de zile
= = . .
L
1
L
n (
ck
2'. = .
L
1
n 2'.
=
L
1
n 0,2'
=
1
n
12'
2 2'-"' de zile
= + = . . .
L
2
L
1
L
2
n n (
c
)'. = .
L
2
n '0. =
L
2
n 0,'0
=
2
n
2'0
" "'-*' de zile
= + + = . ,,, . .
L
"
L
1
L
"
n n (
c
+'.
= .
L
"
n
10.
=
L
"
n
0,10
=
"
n
'0
* *'-'' de zile
= + + = . ,,, . .
L
*
L
1
L
*
n n (
c
0". = .
L
*
n +. =
L
*
n 0,0+
=
*
n
*0
' ''-(' de zile
= + + = . ,,, . .
L
'
L
1
L
'
n n (
c
0+.
= .
L
'
n
'.
=
L
'
n
0,0'
=
'
n
2'
( ('-)' de zile
= + + = . ,,, . .
L
(
L
1
L
(
n n (
c
100.
= .
L
(
n
2.
=
L
(
n
0,02
=
(
n
10

=
=
(
1
L
.
k
k
n
100.

=
=
(
1
L
k
k
n
1

=
= =
(
1
'00
k
k
n n
7istri%utia celor '00 de de%itori dupa numarul de zile de intarziere a platii este urmatoarea serie
de distri%utie de $recvente pe intervale&
Or,
crt,
Intervalul k de variatie
a numarului de zile
de intarziere a platii
Oumarul de de%itori
$recventa a%soluta!,
k
n
Centrul
k
x
al
intervalului k
de variatie
1 1'-2' de zile
=
1
n
12' de%itori
=
1
x
20
2 2'-"' de zile
=
2
n
2'0
=
2
x
"0
" "'-*' de zile
=
"
n
'0
=
"
x
*0
* *'-'' de zile
=
*
n
*0
=
*
x
'0
' ''-(' de zile
=
'
n
2'
=
'
x
(0
( ('-)' de zile
=
(
n
10
=
(
x
)0

=
= =
(
1
'00
k
k
n n
de%itori
b)
Histograma
125
250
50
40
25
10
0
50
100
150
200
250
300
15!25
de ?ile
25!35
de ?ile
35!45
de ?ile
45!55
de ?ile
55!65
de ?ile
65!75
de ?ile
umarul de 'ile de intar'iere

u
m
a
r
u
l

d
e

d
e
b
i
t
o
r
i
Di#, ,,,,, 7istri%utia celor '00 de de%itori dupa numarul de zile de
intarziere a platii
Poligonul frecventelor absolute
0
50
100
150
200
250
300
0 10 20 30 40 50 60 70 80
umarul 'ilelor de intar'iere

u
m
a
r
u
l

d
e

d
e
b
i
t
o
r
i
Di#, ,,,, 6oli#onul $recventelor a%solute pentru distri%utia celor
'00 de de%itori dupa numarul de zile de intarziere a platilor
c)
Or,
crt,
Intervalul k
Oumarul de
de%itori,
k
n
Centrul
k
x
k k
n x
ck
(
( )
k k
n x x
2
2'
1 1'-2' de zile
=
1
n 12'
=
1
x 20
=
1 1
n x 2500
=
1 c
( 12
5
( ) =
1
2
1
n x x
1220
2 2'-"' de zile
=
2
n 2'0
=
2
x "0
7500
=
2 c
( 37
5 1440
" "'-*' de zile
=
"
n '0
=
"
x *0
2000
=
" c
( 42
5 2888
* *'-'' de zile
=
*
n *0 =
*
x '0
2000 465 1230,4
' ''-(' de zile
=
'
n 2' =
'
x (0
1500 40 1044
( ('-)' de zile
=
(
n 10
=
(
x )0
=
( (
n x 700
=
( c
( 50
0
( ) =
(
2
(
n x x 14137,6

=
= =
(
1
'00
k
k
n n

=
=
(
1 k
k k
n x 162
00
( )

=
=
(
1
2
k
k k
n x x ,612
0
= x 32,4
=
2
x
s 138,5170
= =
2
x x
s s 11,763
=
x
v 36,33%
o Media este
'00
1(200
,,,
,,,
(
1
( 1
( 1 1
=

=
+ +
+ +
=

=
n
n x
n n
n x n x
x
k
k k
r
, deci
* , "2 = x
zile este numarul mediu de zile
de intarziere a platilor pentru un de%itor restantier,
o 3ocul medianei este ' , 2'0
2
1
=
+ n
/ primul interval cu proprietatea ca
2
1 +

n
(
ck
este intervalul 2'-
"' de zile, deoarece
' , 2'0 12'
1
< =
c
(
, dar
' , 2'0 ")'
2
=
c
(
, deci&
=

+
+ =

Me
Me c
Me Me
n
(
n
- x Me
1
in$
2
1
02 , "0
2'0
12' ' , 2'0
10 2' =

+ =
zile, adica -umatate dintre de%itorii restantieri au intarziat
cel putin "0 de zile cu e$ectuarea platilor,
o Intervalul modal este intervalul 2'-"' de zile deoarece are $recventa a%soluta cea mai mare
{ } ( , 1 , ma8 2'0
2
= = = k n n
k
, atunci
=
+

+ =
2 1
1
in$ Mo Mo
- x Mo
( ) ( )
+* , 2+
'0 2'0 12' 2'0
12' 2'0
10 2' =
+

+ =
zile/ numarul cel mai intalnit de zile de
intarziere a platilor celor '00 de de%itori restantieri este de apro8imativ 20 de zile,
o Felatia in care se #asesc cei trei indicatori ai tendintei centrale este x Me Mo < < , ceea ce indica o
asimetrie pozitiva,
2(
o 7ispersia in esantion este ( ) ( )
( )
( )
1 '00
(0120
1 '00 1 ,,,
,,,
(
1
2
( 1
(
2
( 1
2
1 2


=
+ +
+ +
=

= k
k k
x
n x x
n n
n x x n x x
s
, deci
'1)0 , 1"+
2
=
x
s
, iar a%aterea standard )(0" , 11
2
= =
x x
s s zile, care arata cu cate zile se a%at, in
medie, valorile o%servate ale seriei de date $ata de numarul mediu de zile de intarziere,
o Coe$icientul de variatie in esantion este
. "' . "" , "( 100
* , "2
)(0" , 11
100 > = = =
x
s
v
x
x
, ceea ce arata ca
distri%utia nu este omo#ena si media, ca indicatot al tendintei centrale, nu este reprezentativa pentru
colectivitate,
d) 7e$inim Mevenimentul $avora%ilJ ca evenimentul ca un de%itor intarzie cu platile mai mult de *' de
zile, =aria%ila alternativa care evidentiaza de%itorii ce au intarziat mai mult de *' de zile cu e$ectuarea
platilor este

m m n
)
1 0
&
,
unde 1 = ) pentru unitatile statistice din esantion care veri$ica evenimentul $avora%il, iar m este
numarul de unitati statistice din esantion pentru care se veri$ica evenimentul $avora%il,
)'
( ' *
= + + = n n n m
de%itori,
iar 0 = ) pentru unitatile statistice din esantion care nu veri$ica evenimentul $avora%il,
m n
este
numarul de unitati statistice din esantion pentru care nu se veri$ica evenimentul $avora%il,
*2' = m n de%itori,
@edia varia%ilei alternative este
1' , 0
'00
)'
= = =
n
m
*
, adica 1'. dintre de%itori au intarziat mai
mult de *' de zile,
7ispersia varia%ilei alternative este
12)' , 0 1
2
=

=
n
m
n
m
s
*
, iar a%aterea standard
"( , 0 1

=
n
m
n
m
s
*
,
Ex. ,. Un cercettor $ace un studiu asupra unor $irme, privind Iansele pe care acestea le o$er tinerilor
an#a-ai de a promova repede Ii de a avansa Gn carier, 6entru aceasta el a cuprins Gn studiu un numr de
20 de companii productoare de te;nolo#ie de vr$ Ii a Gnre#istrat timpul scurs de la an#a-area iniial a
unui salariat Gn $irm pn la prima promovare a acestuia, Dirmele au $ost #rupate dup mrime, iar datele
Gnre#istrate sunt&
-.rimea firmelor Num.r de s.pt.m/ni de la anga'are p/n. la prima promovare
@ici "0/ 2(/ "0/ "2/ "+/ 2*/ "2/ 2+/
@edii "*/ "2/ 2'/ "(/ ""
@ari *)/ *1/ *"/ *+/ *0/ *0/ *0,
Se cere&
a) s seprecizeze care este #rupa de $irme cu un #rad mai ridicat de omo#enitate/
b) sa se determine in ce proportie marimea companiei in$luenteaza variatia timpului pana la prima
promovare a unui salariat,
Rezolvare& a)
o 6opulatia statistica este multimea companiilor producatoare de te;nolo#ie de var$,
o Unitatea statistica este o companie $irma!,
o Caracteristicile urmarite sunt&
2)
X - varia%ila ce arata marimea unei $irme/
- varia%ila nenumerica avand r1" cate#orii sau variante de raspuns& $irme mici, $irme mi-locii si
$irme mari&
aceste cate#orii ale varia%ilei R vor determina impartirea populatiei statistice in r 1" #rupe
si anume&
.rupa / #rupa $irmelor mici!,
.rupa 0 #rupa $irmelor mi-locii!,
.rupa 1 #rupa $irmelor mari!/
- ast$el, varia%ila X, marimea $irmei, se mai numeste si $actor de #rupare,
si
Y - varia%ila ce arata durata de timp, in saptamani, de la an#a-are la prima promovare a unui salariat
al unei $irme producatoare de te;nolo#ie de var$/
- varia%ila numerica de interes,
7in .rupa / #rupa $irmelor mici! se selecteaza un su%esantion de volum
+
1
= n
$irme pentru care se
inre#istreaza valorile varia%ilei )&
? 2+ / "2 / 2* / "+ / "2 / "0 / 2( / "0 >
1
, 1 + , 1 ) , 1 ( , 1 ' , 1 * , 1 " , 1 2 , 1 1 , 1
= = = = = = = = =
n
* * * * * * * * *
saptamani,
@edia de selectie de #rupa este
"0
+
2*0
,,,
1
1
, 1
1
, 1 2 , 1 1 , 1
1
1
1
= = =
+ + +
=

=
n
*
n
* * *
*
n
2
2
n saptamani,
dispersia de selectie de #rupa este
( ) ( ) ( )
( )
2+') , 1+
1 1
,,,
1
1
2
1 , 1
1
2
1 , 1
2
1 2 , 1
2
1 1 , 1
2
1
1
1
=

+ + +
=

=
n
* *
n
* * * * * *
s
n
2
2
n ,
a%aterea standard de selectie de #rupa este 2)(2 , * 2+') , 1+
2
1 1
= = = s s saptamani,
iar coe$icientul de variatie al acestei #rupe este
. 2' , 1* 100
"0
2)(2 , *
100
1
1
1
= = =
*
s
v
,
7in .rupa 0 #rupa $irmelor mi-locii! se selecteaza un su%esantion de volum
'
2
= n
$irme pentru care
se inre#istreaza valorile varia%ilei )&
? "" , "( , 2' , "2 , "* >
2
, 2 ' , 2 * , 2 " , 2 2 , 2 1 , 2
= = = = = =
n
* * * * * *
saptamani,
@edia de selectie de #rupa este
"2
'
1(0
,,,
2
1
, 2
2
, 2 2 , 2 1 , 2
2
2
2
= = =
+ + +
=

=
n
*
n
* * *
*
n
2
2
n saptamani,
dispersia de selectie de #rupa este
( ) ( ) ( )
( )
' , 1)
1 1
,,,
2
1
2
2 , 2
2
2
2 , 2
2
2 2 , 2
2
2 1 , 2 2
2
2
2
=

+ + +
=

=
n
* *
n
* * * * * *
s
n
2
2
n ,
a%aterea standard de selectie de #rupa este 1+"" , * ' , 1)
2
2 2
= = = s s saptamani,
iar coe$icientul de variatie al acestei #rupe este
. 0) , 1" 100
"2
1+"" , *
100
2
2
2
= = =
*
s
v
,
7in .rupa 1 #rupa $irmelor mari! se selecteaza un su%esantion de volum
)
"
= n
$irme pentru care se
inre#istreaza valorile varia%ilei )&
? *0 / *0 / *0 / *+ / *" / *1 / *) >
2
, " ) , " ( , " ' , " * , " " , " 2 , " 1 , "
= = = = = = = =
n
* * * * * * * *
saptamani,
2+
@edia de selectie de #rupa este
**
)
"0+
,,,
"
1
, "
"
, " 2 , " 1 , "
"
"
"
= = =
+ + +
=

=
n
*
n
* * *
*
n
2
2
n saptamani,
dispersia de selectie de #rupa este
( ) ( ) ( )
( )
"""" , 1'
1 1
,,,
"
1
2
" , "
"
2
" , "
2
" 2 , "
2
" 1 , "
2
"
"
"
=

+ + +
=

=
n
* *
n
* * * * * *
s
n
2
2
n ,
a%aterea standard de selectie de #rupa este 01'+ , " """" , 1'
2
" "
= = = s s saptamani,
iar coe$icientul de variatie al acestei #rupe este
. +0 , + 100
**
01'+ , "
100
"
"
"
= = =
*
s
v
,
Cum coe$icientii de variatie pentru cele trei #rupe sunt mai mici ca "0.-"'., atunci toate #rupele
sunt omo#ene, .rupa 1 #rupa $irmelor mari! este mai omo#ena in privinta duratei de timp de la an#a-are
la prima promovare a unui salariat deoarece are cel mai mic coe$icient de variatie
1 2 "
v v v < <
,
6ro%lema poate $i rezolvata in Excel dupa cum urmeaza&
Intr-o $oaie de lucru se introduc datele din cele trei su%esantioane pe coloane, asa cum apare in
Di#ura 1/
In Excel 0331, din meniul principal Tools, su%meniul Data Analysis, se ale#e #escriptive
$tatistics/
In Excel 0334, din meniul principal Data, su%meniul Data Analysis, se ale#e #escriptive
$tatistics/
Di#ura 1, Introducerea datelor si ale#erea #escriptive $tatistics
din su%meniul Data Analysis,
Dereastra de dialo# este prezentata in Di#ura 2,
20
Di#ura 2, Dereastra de dialo# pentru #escriptive $tatistics,
9utput-ul consta din urmatorul ta%el, corepunzator prelucrarii datelor din cele trei #rupe&
Grupa 1
(firme mici)
Grupa 2
(firme mijlocii)
Grupa 3
(firme mari)
-ean 30,
1
* 32,
2
* 44,
"
*
.tandard Error 1,511 1,8708 1,4800
-edian 30 33 43
-ode 30 @NAA 40
.tandard De#iation 4,2762,
2
1 1
s s = 4,1833,
2
2 2
s s = 3,158,
2
" "
s s =
.a)/le Variance 18,2857,
2
1
s 17,5,
2
2
s 15,3333,
2
"
s
0$rtosis 0,406 2,143 !2,3115
.+e1ness 0,5846 !1,5367 0,2332
2an3e 14 11
-ini)$) 24 25 40
-a4i)$) 38 36 4
.$) 240,

=
1
1
, 1
n
2
2
* 160,

=
2
1
, 2
n
2
2
* 308,

=
"
1
, "
n
2
2
*
Co$nt 8,
1
n 5,
2
n 7,
"
n
b)
o @edia totala la nivelul intre#ului esantion de volum
20
" 2 1
= + + = n n n n
$irme este
20
) ** ' "2 + "0
" 2 1
" " 2 2 1 1
+ +
=
+ +
+ +
=
n n n
n * n * n *
*
* , "' = *
saptamani,
o 6e %aza datelor de selectie calculam&
=ariatia dintre #rupe Sum of S5uares Between .roups!
"0
( ) ( ) ( )
( ) ( ) ( ) ) * , "' ** ' * , "' "2 + * , "' "0
2 2 2
"
2
" 2
2
2 1
2
1
+ + =
= + + = n * * n * * n * * SS"
+ , +0+ = SS"
=ariatia din interiorul #rupelor Sum of S5uares Wit-in .roups!
( ) ( ) ( )
( ) ( ) ( ) """" , 1' 1 ) ' , 1) 1 ' 2+') , 1+ 1 +
1 1 1
2
" "
2
2 2
2
1 1
+ + =
= + + = s n s n s n SS'
200 = SS'
=ariatia totala
200 + , +0+ + =
+ = SS' SS" SS6
+ , 100+ = SS6
Coe$icientul de determinatie este
"(+ , 0
+ , 100+
* , *0*
2
= = =
SS6
SS"
R
sau, e8primat procentual,
. + , "( 100
+ , 100+
* , *0*
100
2
.
= = =
SS6
SS"
R
arata ca $actorul de #rupare, tipul
companiei, e8plica variatia totala a duratei de timp pana la prima promovare in proportie de
"(,+., restul de (",2. din variatia totala a timpului se datoreaza altor $actori care nu au $ost
considerati de cercetator,
o 7ispersia de selectie la nivelul intre#ului esantion de volum 20 = n de $irme este
+"1' , ')
1 20
+ , 100+
1 1
esantion intre#ului nivelul la totala =ariatia
2
=

=
n
SS6
n
s
*
cu o a%atere standard
(0*) , ) +"1' , ')
2
= = =
* *
s s
saptamani,
iar coe$icientul de variatie este
. *+ , 21 100
* , "'
(0*) , )
100 = = =
*
s
v
*
*
,
Ex. 0. @ana#erul unei a#entii imo%iliare doreste sa e$ectueze o analiza re$eritoare la pretul de vanzare
zeci mii euro! al caselor din doua zone ale Sucurestiului& zona Cotroceni si zona 6iata =ictoriei, 7atele
inre#istrate au $ost prelucrate cu E8cel si s-au o%tinut urmatoarele rezultate&
Cotroceni Piata Victoriei
-ean 38,8 -ean 5,45
-edian 36,18 -edian 5,8
-ode 36 -ode 5
.tandard De#iation 12,04 .tandard De#iation 17,23
.a)/le Variance 144,3 .a)/le Variance 26,88
0$rtosis 1,1 0$rtosis !1,01
.+e1ness 1,30 .+e1ness 0,0
2an3e 53,20 2an3e 61,37
-ini)$) 21,77 -ini)$) 2,
-a4i)$) 74,7 -a4i)$) 1,27
.$) 116,50 .$) 1783,37
Co$nt 30 Co$nt 30
a! Caracterizati comparativ cele doua
su%colectivitati pe %aza output-ului
prezentat in particular, caracterizai
omo#enitatea Ii asimetria $iecrei
#rupe!/
%! 7eterminati in ce proportie zona
in$luenteaza pretul de vanzare al
caselor,
"1

S-ar putea să vă placă și