Sunteți pe pagina 1din 22

Exercitii pregatitoare pentru testul de la seminar si pentru examen

1. Urmtoarea serie de date arat preul de vnzare (sute lei) pentru 13 lucrri de grafic la o licitaie de
obiecte de art: 51, 60, 72, 35, 32, 57, 63, 61, 48, 33, 67, 54, 37.
Stabilii valoarea de adevr a urmtoarelor afirmaii, justificnd rspunsurile:
a) 25 % dintre lucrarile licitate s-au vandut pentru un pret mai mic de 48 sute de lei;
b) jumatate dintre lucrarile licitate au un pret mai mic sau egal cu 54 sute lei;
c) 25 % dintr lucrari s-au vandut cu cel putin 62 sute de lei;
d) pentru 75% dintre obiecte s-a obtinut un pret de cel putin 36 sute lei;
e) precizati care dintre urmatoarele valori: 25, 29, 16, 40, 124, 85, 99,8 sute lei sunt outliers in
raport cu datele initiale.
Rezolvare:
Cele n=13 valori ale seriei de date se ordoneaz cresctor:
x(1)=32, x(2)=33, x(3)=35, x(4)=37, x(5)=48, x(6)=51, x(7)=54, x(8)=57, x(9)=60, x(10)=61, x(11)=63, x(12)=67, x(13)=72.

Q1 cuartila de ordinul 1 sau cuartila inferioara


Locul lui Q1 este

n 1
13 1
1
1 3,50 N , dar 3 < 3,50 < 4
4
4

x x 4 35 37
x 3 Q1 x 4 si Q1 3

36 sute lei.
2

x1 x 2 x 3 x 4 x5 x 6 x 7 x8 x9 x10 x11 x12 x13



25%

Q1

75%

36
Cu interpretarea:
25 % dintre termenii seriei au valori mai mici decat 36 sute lei (Q1 este percentila de ordinul 25),
iar 75% dintre termenii seriei au valori mai mari ca 36 sute lei;
sau
25% dintre lucrarile de grafica licitate s-au vandut pentru un pret mai mic decat 36 sute lei, iar
restul de 75% dintre ele s-au vandut cu un pret mai mare de 36 sute lei.
Q2=Me cuartila de ordinul 2 sau mediana seriei de date statistice
Locul lui Q2=Me este

n 1 13 1

7 N Me x 7 54 sute lei
2
2

x1 x 2 x 3 x 4 x 5 x 6 x 7 x 8 x 9 x10 x11 x12 x13



50%

Me
54


50%

Cu interpretarea:
jumatate dintre termenii seriei au valori mai mici ca 54 sute lei (Me este percentila de ordinul 50),
iar restul au valori mai mari ca 54 sute lei;
sau
jumatate dintre lucrarile de grafica licitate s-au vandut cu mai putin de 54 sute lei, iar restul s-au
vandut cu un pret mai mare de 54 sute lei.
Q3 cuartila de ordinul 3 sau cuartila superioara
Locul lui Q3 este

n 1
13 1
3
3 10,50 N, dar 10 < 10,50 < 11
4
4

x x 11 61 63
x 10 Q3 x11 si Q3 10

62 sute lei.
2

x1 x 2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13


Q3

25%

75%

62
Cu interpretarea:
75 % dintre termenii seriei au valori mai mici decat 62 sute lei (Q3 este percentila de ordinul 75),
iar 25% dintre termenii seriei au valori mai mari ca 62 sute lei;
sau
75% dintre lucrarile de grafica licitate s-au vandut pentru un pret mai mic decat 62 sute lei, iar
restul de 25% dintre ele s-au vandut cu un pret mai mare de 62 sute lei.

x1 x2 x3 x4 x5 x6 x7 x8 x9 x10 x11 x12 x13



25%

Q1

36

50%

Q3

25%

62

Jumatate dintre termenii din mijlocul seriei au valori cuprinse intre Q1=36 sute lei si Q3=62 sute lei.
Abaterea intercuatilica este IQR=Q3-Q1=26 sute lei.
Spunem ca o valoare x este outlier pentru un set de date statistice numerice daca:
2

x Q1 1,5 IQR sau x Q3 1,5 IQR

sau
valoarea x este outlier pentru un set de date statistice daca daca se gaseste in afara intervalului
Q1 1,5 IQR; Q3 1,5 IQR .
In cazul nostru, Q1 1,5 IQR 3 , iar Q3 1,5 IQR 101 ,
deci numai valoarea 124 este outlier in raport cu setul initial de date statistice.
2. Se considera urmatoarea serie, reprezentand valoarea inregistrata a 9 facturi emise de o societate
comerciala in ultima luna: 47; 58; 41; 36; 54; 42; 65; 43; 37 (mil. lei).
Alegeti afirmatiile false:
a) Cuartilele inferioara si superioara sunt 43 si respectiv 58 mil. lei.
b) Abaterea intercuartilica este de 10 mil. lei;
c) Jumatate dintre termenii seriei, plasati pe mijocul distributiei, se regasesc intre 39 si 56.
d) Percentilele de ordinul 25 si 75 sunt 39 si respectiv 56 mil. lei
e) In raport cu datele initiale, valorile: 73, 29, 18, 73, 23 sunt toate outliers.

Ex. 3. Structura unui esantion de 90 de copii dupa nivelul maxim atins al unui joc pe calculator este:

Unde A nivelul cel mai slab, E nivelul cel mai


inalt.
Construiti distributia de frecvente absolute si
reprezentati-o grafic.
Studiati tendinta centrala a distributiei folosind
indicatori adecvati.
Calculati media si dispersia unei variabile
alternative, a carei stare favorabila este data de
copiii care au atins cel mult nivelul C al jocului.
4. Pentru 39 de actrite care au obtinut premiul Oscar se cunoaste varsta, in ani impliniti, la momentul
castigarii premiului:
50, 44, 35, 80, 26, 28, 41, 21, 61, 38, 49, 33, 74, 30, 33, 41, 31, 35, 41, 42,
37, 26, 34, 34, 35, 26, 61, 60, 34, 24, 30, 37, 31, 27, 39, 34, 26, 25, 33 ani.
3

Se cere:
a) sa se determine si sa se interpreteze indicatorii tendintei centrale si cuartilele acestei serii de date;
b) sa se construiasca diagrama box-plot (sau diagrama cu mustati box-and-whisker), punand in
evidenta daca seria are valori extreme;
c) sa se calculeze indicatorii variatiei si sa se stabileasca daca seria este omogena;
d) analizati asimetria;
Utilizati Descriptive Statistics.
Rezolvare: a)
o Populatia statistica este multimea actritelor care au castigat premiul Oscar.
o Unitatea statistica este o actrita.
o Variabila sau caracteristica de interes, notata X, este variabila ce arata varsta unei actrite la momentul
obtinerii premiului; variabila numerica, discreta.
o Pentru un esantion de volum n 39 de actrite se cunosc valorile variabilei X, adica {x1=50, x2=44,
x3=35, x4=80, ..., xn=x39=33 ani}, care reprezinta o serie simpla sau nesistematizata de date statistice
numerice.
n

xi
.
x1 x2 ... xn
i 1
x

n
n
In cazul acestei serii, varsta medie a unei actrite din esantion care a castigat premiul Oscar este

o Media unei serii simple de date numerice x1 , x2 , ..., xn este

39

x1 x2 ... x39 i 1 i 1486


ani.
x

38,1025
39
39
39
o Pentru a determina mediana, vom proceda astfel:
- seria simpla de date se ordoneaza crescator x 1 x 2 ... x n , unde
elementul cu rangul i din seria ordonata crescator,
-

locul medianei este

x i , i 1, n

este

n 1
20 N Me x 20 34 ani.
2

Jumatate dintre actritele din selectie au obtunut premiul Oscar la o varsta de cel mult 34 de ani
(jumatate dintre actritele din esantion au castigat premiul Oscar la o varsta de peste 34 de ani).
o Exista doua valori care au frecventa maxima si anume valorile 26 ani si 34 ani care apar pentru 4
actrite fiecare.

Nr. crt.

Varsta actritelor xi

Varsta actritelor, in ordine crescatoare x i

x1=50
x2=44
x3=35
x4=80
x5=26

x(1)=21
x(2)=24
x(3)=25
x(4)=26
x(5)=26

28
41

26
26

8
9
10

21
61
38

27
28

x(10)=30=Q1

11
12
13
14
15

49
33
74
30
33

30
31
31
33
33

2
3
4
5
6
7

16
17
18
19
20
21
22
23
24
25
26
27
28
29
30

41
31
35
41
42
37
26
34
34
35
26
61
60
34
24

31
32
33
34

30
37
31
27

35

39

36

34

37

26

38

25

39

x39=33

o Pentru determinarea cuartilelor procedam astfel:


-

locul cuartilei de ordinul 1, Q1, este

33
34
34
34

x(20)=34=Me
35
35
35
37
37
38
39
41
41

x(30)=41=Q3
42
44
49

x(34)=50
x(35)=60
x(36)=61
x(37)=61
x(38)=74
x(39)=80
n 1
1 10 N Q1 x 10 30 ani; un sfert dintre
4

actrite au castigat premiul Oscar la o varsta mai mica sau egala cu 30 de ani, iar restul
la cel putin 30 de ani;
-

locul cuartilei de ordinul 3, Q3, este

n 1
3 30 N Q3 x 30 41 ani; trei sferturi
4

dintre actrite au castigat premiul Oscar la o varsta mai mica sau egala cu 41 de ani, iar
restul la cel putin 41 de ani.
o Abaterea intercuartilica este IQR Q3 Q1 11 ani si arata lungimea intervalului in care se gasesc
jumatate dintre valorile din mijlocul seriei de date.
b)
Diagrama cu mustati (box-and-whisker) sau diagrama box-plot pentru o serie de date statistice
numerice se construieste punand in evidenta urmatoarele cinci elemente si eventualele valori extreme sau
outliers:
- cuartila inferioara sau de ordinul 1, Q1=30 ani
- mediana sau cuartila de ordinul al 2-lea, Q2=Me=34 ani
- cuartila superioara sau de ordinul al 3-lea, Q3=41 ani
- limita sau marginea inferioara a diagramei box-plot este cea mai mica dintre valorile
seriei de date cu proprietatea ca este mai mare sau egala cu Q1 1,5 IQR :
o Q1 1,5 IQR 13,5
o cea mai mica dintre valorile seriei de date, cu proprietatea ca este 13,5 , este
x(1)=21 ani, deci marginea inferioara este egala cu 21 ani;
- limita sau marginea superioara a diagramei box-plot este cea mai mare dintre valorile
seriei de date cu proprietatea ca este mai mica sau egala cu Q3 1,5 IQR :
o Q3 1,5 IQR 57,5

o cea mai mare dintre valorile seriei de date, cu proprietatea ca este 57,5 , este
x(34)=50 ani, deci marginea superioara este egala cu 50 ani.
Se observa ca intervalul cuprins intre marginea inferioara si cea superioara diagramei box-plot,
adica intervalul de numere reale [21; 50] nu contine toate valorile observate, in afara lui ramanand
valorile x(35)=60, x(36)=61, x(37)=61, x(38)=74, x(39)=80.
Valoarea x este outlier pentru un set de date statistice numerice daca x se gaseste in afara
intervalului Q1 1,5 IQR; Q3 1,5 IQR .
Pentru aceasta serie de date Q1 1,5 IQR; Q3 1,5 IQR 13,5; 57,5 , deci x(35)=60, x(36)=61,
x(37)=61, x(38)=74, x(39)=80 sunt outliers si vor fi reprezentate distinct in diagrama box-plot.

21

30
(Q1)

34
(Me)

41
(Q3)

50

*
* *

60 61

74

80

Fig. . Diagrama box-plot sau diagrama cu mustati (box-and-whisker).

Fig. . Diagrama box-plot in SPSS.


c) Dispersia de selectie (sample variance) pentru o serie simpla de date numerice asupra variabilei X este
n

x x 2 ... xn x 2
i 1
s2 1
x

39

adica

n 1

xi x 2

n 1

,
6791,5897
178,7260
39 1
39 1
abaterea standard (standard deviation) este s x s x2 13,3688 ani.
s
Coeficientul de variatie este v x x 100 35,09% 35% , ceea ce indica faptul ca seria de date nu
x
este omogena, iar media nu este reprezentativa pentru colectivitate, ca indicator al tendintei centrale.

s x2

i 1

Nr. crt.

Varsta actritelor

xi

xi x

xi x 2

x1=50
x2=44
x3=35
x4=80
x5=26

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39

141,5489

5,8974

34,7797

-3,1026

9,6259

41,8974

1755,3951

28
41
21
61
38
49
33
74
30
33
41
31
35
41
42
37
26
34
34
35
26
61
60
34
24
30
37
31
27
39
34
26
25

-12,1026
-10,1026
2,8974
-17,1026
22,8974
-0,1026
10,8974
-5,1025
35,8974
-8,1025
-5,1025
2,8974
-7,1025
-3,1025
2,8974
3,8974
-1,1025
-12,1025
-4,1025
-4,1025
-3,1025
-12,1025
22,8974
21,8974
-4,10256
-14,1025
-8,1025
-1,1025
-7,1025
-11,1025
0,8974
-4,1025
-12,1025
-13,1025

146,4720
102,0618
8,3951
292,4977
524,2925
0,0105
118,7541
26,0361
1288,6259
65,6515
26,0361
8,3951
50,4464
9,6259
8,3951
15,1900
1,2156
146,4720
16,8310
16,8310
9,6259
146,4720
524,2925
479,4977
16,8310
198,8823
65,6515
1,2156
50,4464
123,2669
0,8053
16,8310
146,4720
171,6771

x39=33

-5,1025

26,0361

39

39

x
i 1

11,8974

1486

xi x
i 1

39

x
i 1

x 6791,589
2

x 38,1025

s 178,7260
2
x

sx

s x2 13,3688

v x 35,09%

d)

Asimetria unei serii de distribuie de frecvene se poate stabili:


- prin compararea indicatorilor tendintei centrale,
- prin analiza distantei intre mediana si cele doua cuartile inferioara si superioara,
- prin calculul si interpretarea valorii unui indicator specific, coeficientul de asimetrie,
9

- se observ din reprezentarea grafic prin histogram sau poligonul frecvenelor.


- Cum Me 34 38,1025 x , atunci concluzionam ca seria de date prezinta asimetrie pozitiva.
- Cum mediana este mai apropiata de Q1 decat de Q2, adica Me Q1 Q3 Me , asa cum se poate
vedea din diagrama box-plot, atunci concluzionam ca seria prezinta asimetrie pozitiva, in seria de date
predominand valorile mici.
n

- Indicatorul asimetriei este coeficientul de asimetrie (Skewness)

CAS

x
i 1

, al carui semn si

n sx
marime arata tipul asimetriei (pozitiva sau negativa), iar marimea arata gradul mai putin accentuat saumai
accentuat al asimetriei seriei de date sau al distributiei. In cazul acestei serii de date, CAS 1,5734 , o
valoare pozitiva si mai mare ca 1, ceea ce arata ca seria de date prezinta o asimetrie pozitiva pronuntata.
- Sistematizarea printr-o serie de distributie de frecvente pe r 6 intervale de variatie de marime
egala a dat urmatoarea distributie a celor n=39 de actrite din esantion dupa varsta la momentul obtinerii
premiului Oscar:

Nr. crt.

1
2
3
4
5
6

Intervalul k de variatie
(clasa de varsta)

Frecventa absoluta nk
a intervalului k de variatie
(numarul de actrite
din fiecare clasa de varsta)

20-30 ani
30-40 ani
40-50 ani
50-60 ani
60-70 ani
70-80 ani

11
16
7
1
2
2
6

n
k 1

Centrul x k
al intervalului k de
variatie
25
35
45
55
65
75

39=n

Reprezentarea grafica seriei de distributie de frecvente pe intervale, adica histograma si poligonul


frecventelor sugereaza ca aceasta prezinta asimetrie pronuntata la dreapta sau asimetrie pozitiva, adica
predomina valorile mai mici ale variabilei de interes, cu coada mai lung a distribuiei spre valorile mari,
care apar cu frecventa mai mica. Intre cele 39 de actrite castigatoare ale premiului Oscar, predomina cele
cu varste relativ mai mici.

10

11

e) Indicatorii tendintei centrale, principalii indicatori ai variatiei si ai formei distributiei pentru o serie
simpla de date numerice pot fi calculati in Excel si in SPSS, output-urile fiind de forma:
Varsta actritelor

Standard Error
Median
Mode
Standard Deviation
(abaterea standard)
Sample Variance
(dispersia de selectie)
Kurtosis
Skewness
(coeficientul de asimetrie)
Range
(Amplitudinea)

sx

2.1407
Me=34
Mo=26

Varsta actritelor Oscar


Valid

39

s x2 13.3688

Missing

s x2 178.7260
2.3830

CAS 1.5734
Ax x max xmin 59

x min 21

Minimum

xmax 80

Maximum
39

Sum

x
i 1

Count

Statistics

x 38.1025

Mean (media)

1486
n=39

Mean

x 38.10

Std. Error of Mean

2.141

Median

Me=34.00

Mode

Mo=26a

Std. Deviation

sx

s x2 13.369

Variance

s x2 178.726

Skewness

CAS 1.573

Std. Error of Skewness

.378

Kurtosis

2.383

Std. Error of Kurtosis

.741

Range

Ax x max xmin 5
9

Minimum

xmin 21

Maximum

xmax 80
39

Sum

i 1

Percentiles

1486

25

Q1 30.00

50

Q2 Me 34.00

75

Q3 41.00

a. Multiple modes exist. The smallest value is shown

12

5. Distributia a 1100 de absolventi ai Universitatii din Florida dupa salariul castigat, in mii $, in primul an
dupa terminarea studiilor este urmatoarea serie de distributie de frecvente pe intervale de variatie:
Nr. crt. Intervalul de variatie al salariului, $ Numarul de absolventi
1
2
3
4
5
6
7
8
9

Sub 9
9-11
11-13
13-15
15-17
17-19
19-21
21-23
23 si peste

30
69
302
308
263
95
20
6
5

Se cere:
a) sa se reprezinte grafic aceasta serie de distributie;
b) sa se determine si sa se interpreteze indicatorii tendintei centrale;
d) sa se stabileasca daca media este reprezentativa pentru esantion;
e) sa se analizeze asimetria acestei distributii.
6. Un cercettor face un studiu asupra unor firme, privind ansele pe care acestea le ofer tinerilor
angajai de a promova repede i de a avansa n carier. Pentru aceasta el a cuprins n studiu un numr de
20 de companii productoare de tehnologie de vrf i a nregistrat timpul scurs de la angajarea iniial a
unui salariat n firm pn la prima promovare a acestuia. Firmele au fost grupate dup mrime, iar datele
nregistrate sunt:
Mrimea firmelor
Mici
Medii
Mari

Numr de sptmni de la angajare pn la prima promovare


30; 26; 30; 32; 38; 24; 32; 28;
34; 32; 25; 36; 33
47; 41; 43; 48; 40; 49; 40.

Se cere:
a) s seprecizeze care este grupa de firme cu un grad mai ridicat de omogenitate;
b) sa se determine in ce proportie marimea companiei influenteaza variatia timpului pana la prima
promovare a unui salariat.
Rezolvare:
a)
o
Populatia statistica este multimea companiilor producatoare de tehnologie de varf.
o
Unitatea statistica este o companie (firma).
o
Caracteristicile urmarite sunt:
X

- variabila ce arata marimea unei firme;


- variabila nenumerica avand r=3 categorii sau variante de raspuns: firme mici, firme mijlocii si
firme mari:
aceste categorii ale variabilei X vor determina impartirea populatiei statistice in r =3 grupe
si anume:
Grupa 1 (grupa firmelor mici),
Grupa 2 (grupa firmelor mijlocii),
Grupa 3 (grupa firmelor mari);
- astfel, variabila X, marimea firmei, se mai numeste si factor de grupare.

si
Y

- variabila ce arata durata de timp, in saptamani, de la angajare la prima promovare a unui salariat
al unei firme producatoare de tehnologie de varf;
- variabila numerica de interes.
13

Din Grupa 1 (grupa firmelor mici) se selecteaza un subesantion de volum n1 8 firme pentru care se
inregistreaza valorile variabilei Y:
{ y1, 1 30; y1, 2 26; y1, 3 30; y1, 4 32; y1, 5 38; y1, 6 24; y1, 7 32; y1, 8 y1, n 28 } saptamani.
1

n1

Media de selectie de grupa este

y1

y1, 1 y1, 2 ... y1, n1


n1

1, j

j 1

n1

240
saptamani,
30
8

dispersia de selectie de grupa este


s12

1, 1

y1 y1, 2 y1 ... y1, n1 y1


2

y
n1

n1 1

1, j

j 1

y1

18,2857

n1 1

abaterea standard de selectie de grupa este s1 s12 18,2857 4,2762 saptamani,


s1
4,2762
100 14,25% .
iar coeficientul de variatie al acestei grupe este v1 100
y1
30

Din Grupa 2 (grupa firmelor mijlocii) se selecteaza un subesantion de volum n2 5 firme pentru care
se inregistreaza valorile variabilei Y:
{ y2 , 1 34, y2, 2 32, y2 , 3 25, y2, 4 36, y2 , 5 y2, n 33} saptamani.
2

n2

Media de selectie de grupa este

y2

y2, 1 y 2, 2 ... y2, n2


n2

y
j 1

2, j

n2

160
saptamani,
32
5

dispersia de selectie de grupa este


s22

2, 1

y 2 y 2, 2 y 2 ... y 2, n2 y2
2

y
n2

n2 1

j 1

2, j

y2

17,5

n2 1

abaterea standard de selectie de grupa este s2 s 17,5 4,1833 saptamani,


s2
4,1833
100 13,07% .
iar coeficientul de variatie al acestei grupe este v2 100
y2
32
2
2

Din Grupa 3 (grupa firmelor mari) se selecteaza un subesantion de volum n3 7 firme pentru care se
inregistreaza valorile variabilei Y:
{ y3, 1 47; y3, 2 41; y3, 3 43; y3, 4 48; y3, 5 40; y3, 6 49; y3, 7 y3, n 40 } saptamani.
2

n3

Media de selectie de grupa este

y3

y3, 1 y3, 2 ... y3, n3


n3

y
j 1

n3

3, j

308
saptamani,
44
7

dispersia de selectie de grupa este


s32

3, 1 y 3 y 3, 2 y3 ... y 3, n3 y 3
2

n3 1

y
n3

j 1

3, j

y3

n3 1

15,3333

abaterea standard de selectie de grupa este s3 s 15,3333 3,9158 saptamani,


s3
3,9158
100 8,89% .
iar coeficientul de variatie al acestei grupe este v3 100
y3
44
2
3

14

Cum coeficientii de variatie pentru cele trei grupe sunt mai mici ca 30%-35%, atunci toate grupele
sunt omogene. Grupa 3 (grupa firmelor mari) este mai omogena in privinta duratei de timp de la angajare
la prima promovare a unui salariat deoarece are cel mai mic coeficient de variatie v3 v2 v1 .
Problema poate fi rezolvata in Excel dupa cum urmeaza:
Intr-o foaie de lucru se introduc datele din cele trei subesantioane pe coloane, asa cum apare in
Figura 1;
In Excel 2003, din meniul principal Tools, submeniul Data Analysis, se alege Descriptive
Statistics;
In Excel 2007, din meniul principal Data, submeniul Data Analysis, se alege Descriptive
Statistics;

Figura 1. Introducerea datelor si alegerea Descriptive Statistics


din submeniul Data Analysis.
Fereastra de dialog este prezentata in Figura 2.

15

Figura 2. Fereastra de dialog pentru Descriptive Statistics.


Output-ul consta din urmatorul tabel, corepunzator prelucrarii datelor din cele trei grupe:
Grupa 1
(firme mici)
30= y1
1,5119
30
30

Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance

Grupa 2
(firme mijlocii)

4,2762= s1

s12

4,1833= s 2

0,9406
0,5846
14
24
38

2,9143
-1,5367
11
25
36

240=

y
j 1

Count

s 22

17,5= s 22

n1

Sum

1, j

3,9158= s3

160=

y
j 1

-2,3115
0,2332
9
40
49
n3

2, j

5= n2

de

s32

15,3333= s3

n2

8= n1

b)
o Media totala la nivelul intregului esantion
y n y n y3 n3 30 8 32 5 44 7
y 1 1 2 2

n1 n2 n3
20
y 35,4 saptamani.
o Pe baza datelor de selectie calculam:

44= y 3
1,4800
43
40

32= y 2
1,8708
33
#N/A

18,2857= s12

Kurtosis
Skewness
Range
Minimum
Maximum

Grupa 3
(firme mari)

volum

308=

y
j 1

3, j

7= n3

n n1 n 2 n3 20

firme

este

16

Variatia dintre grupe (Sum of Squares Between Groups)

SSB y1 y n1 y 2 y n2 y 3 y n3
2

30 35,4 2 8 32 35,4 2 5 44 35,4 2 7


SSB 808,8

Variatia din interiorul grupelor (Sum of Squares Within Groups)

SSW n1 1 s12 n2 1 s 22 n3 1 s32

8 1 18,2857 5 1 17,5 7 1 15,3333


SSW 290

Variatia totala

Coeficientul de determinatie este

SST SSB SSW


808,8 290
SST 1098,8

R2

SSB
404,4

0,368
SST 1098,8
SSB

404,4

2
sau, exprimat procentual, R% SST 100 1098,8 100 36,8% arata ca factorul de grupare, tipul
companiei, explica variatia totala a duratei de timp pana la prima promovare in proportie de
36,8%, restul de 63,2% din variatia totala a timpului se datoreaza altor factori care nu au fost
considerati de cercetator.

o Dispersia de selectie la nivelul intregului esantion de volum n 20 de firme este


s y2

Variatia totala la nivelul intregului esantion SST 1098,8

57,8315
n 1
n 1 20 1

cu o abatere standard

sy

s y2

57,8315 7,6047

iar coeficientul de variatie este v y

sy
y

100

saptamani,

7,6047
100 21,48% .
35,4

7. Managerul unei agentii imobiliare doreste sa efectueze o analiza referitoare la pretul de vanzare (zeci
mii euro) al caselor din doua zone ale Bucurestiului: zona Cotroceni si zona Piata Victoriei. Datele
inregistrate au fost prelucrate cu Excel si s-au obtinut urmatoarele rezultate:
Cotroceni
Mean
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count

Piata Victoriei
38,98
36,18
36
12,04
144,93
1,91
1,30
53,20
21,77
74,97
1169,50
30

Mean
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count

59,45
59,8
59
17,23
296,88
-1,01
0,09
61,37
29,9
91,27
1783,37
30

a) Caracterizati comparativ cele doua subcolectivitati pe baza output-ului prezentat;


b) Determinati in ce proportie zona influenteaza pretul de vanzare al caselor.

17

8. Pentru opt judee ale Romniei se cunosc date referitoare la suprafaa cultivat (mii hectare) i
producia agricol (milioane lei, preuri curente) pentru anul 1996:
Judetul

Suprafata cultivat (mii ha)

Producia agricol (mil.lei)

Alba

127

75,1

Arad

342

112,4

Bistria Nsud

98

64,4

Botoani

286

89,4

Braov

111

80,4

Buzu

252

84,3

Cara Severin

124

62

Clrai

404

96,5

a) S se studieze existena, direcia i intensitatea legturii dintre cele dou variabile cu ajutorul
coeficienilor de corelaie a rangurilor Spearman i Kendall.
b) Analizati sensul si intensitatea legaturii dintre cele doua variabile, presupunand o dependenta
liniara intre acestea (coeficientul de corelatie liniara Pearson).
Rezolvare:
a) Pentru calculul coeficientului de corelaie a rangurilor Spearman, se determina rangurile R xi si
R yi pentru valorile xi , respectiv yi ale celor doua variabile considerate, acordand rangul 1

pentru varianta cea mai performanta (valoarea cea mai mare din seria de date), pana la rangul n=8
pentru variant cea mai putin performanta (valoarea cea mai mica din seria de date).
Nr.
crt.

Judetul

Suprafata
(xi)

Producia
(yi)

R xi

R yi

Di R xi R yi

Di2

Alba

x1=127

y1=75,1

R x1 =5

R y1 =6

-1

Arad

x2=342

y2=112,4

R x2 =2

R y2

=1

Bistria Nsud

x3=98

y3=64,4

R x3 =8

R y3 =7

Botoani

x4=286

y4=89,4

R x4 =3

R y4

=3

Braov

x5=111

y5=80,4

R x5 =7

R y5 =5

Buzu

x6=252

y6=84,3

R x6 =4

R y6 =4

Cara Severin

x7=124

y7=62

R x7 =6

R y7 =8

-2

Clrai

x8=404

y8=96,5

R x8 =1

R y8 =2

-1

1
8

Di2 12
i 1

Coeficientul de corelatie a rangurilor Spearman este


n

6 Di2

6 12
0,8571 ,
2
n n 1
8 8 1
valoare ce indica o legatura directa, puternica intre cele doua variabile.
rS 1

i 1
2

Pentru calculul coeficientului de corelatie a rangurilor Kendall, mai intai, se ordoneaza crescator
unitatile statistice dupa rangurile acordate variabilei X si se inscriu in paralel rangurile dupa cealalta
variabila Y.
Pentru fiecare R yi se calculeaza, luand in considerare rangurile care se gasesc sub el in coloana, doi
indicatori:
pi - numarul de ranguri superioare lui
qi - numarul de ranguri inferioare lui R yi

18

R xi ordonate crescator

corespunzator

pi

qi

1
2
3
4
5
6
7
8

2
1
3
4
6
8
5
7

6
6
5
4
2
0
1
0

1
0
0
0
1
2
0
0

P pi 24

Q qi 4

i 1

i 1

Coeficientul de corelatie a rangurilor Kendall este


2 P Q 2 24 4
rK

0,7142 ,
n n 1
8 8 1
valoare ce indica o legatura directa, puternica intre cele doua variabile.
9. Pentru un eantion de 80 de persoane au fost nregistrate date referitoare la numrul de carduri bancare
deinute. Datele sistematizate arat c 5 pers. nu dein niciun card, 25 de pers. detin doar un card, 30
dintre pers. dein dou carduri, 10 pers. dein 3 carduri, doar 7 pers. au 4 carduri, iar restul pers. din
eantion dein 5 carduri bancare. Se cere:
a) Construii seria de distribuie de frecvene i analizai grafic tendina de normalitate a acesteia.
b) Caracterizai omogenitatea i asimetria distribuiei persoanelor n funcie de numrul de carduri
bancare deinute.
10. Pentru un eantion de 9 firme de construcie au fost nregistrate date referitoare la rata profitului (%)
nregistrat n anul 2010. Datele nregistrate sunt: 8, 7, 9, 15, 12, 4, 7, 6, 5.
Precizai care dintre variante este adevrat:
a) 25% din firme au nregistrat o rat a profitului mai mare de 5,5%
b) abaterea intercuartilic este de 5%
c) trei sferturi din firme au nregistrat o rat a profitului mai mare de 5,5%
d) jumtate din firme au nregistrat o rat a profitului mai mic de 5,5%
e) 25% din firme nregistrat o rat a profitului mai mare de 10,5%
n raport cu setul de date iniial, precizai care dintre valorile 1, 17, 2, 20, 25, 19, 4, 3, 48 sunt outliers.
11. Un psihopedagog face un studiu referitor la nivelul de inteligen pe un eantion de 13 studeni ce au
obinut burse de excelen. Rezultatele testului IQ sunt: 95, 110, 97, 100, 115, 105, 120, 118, 127, 130,
108, 109, 98.
Precizai care dintre variante este adevrat:
a) 25% dintre studenti au un IQ mai mare de 99.
b) abaterea intercuartilic este de 20
c) trei sferturi dintre studenti detin un IQ mai mare de 99
d) jumtate dintre studenti au un IQ mai mare de 109
e) 25% dintre studenti au un IQ mai mare de 119
n raport cu setul de date iniial, precizai care dintre valorile 65, 75, 85, 90, 140, 135, 145, 150 sunt
outliers.
12.Pentru adecvarea politicii de personal, o firm realizeaz un studiu referitor la fidelitatea angajailor
si. Pentru aceasta se nregistreaz, pe un eantion selectat aleator dintre salariaii firmei, vechimea la
actualul serviciu (n ani). n urma sistematizrii datelor s-a obinut urmtoarea situaie: 4 salariai au o
vechime de 2 ani, 14 salariai au o vechime de 5 ani, 16 salariati au vechime de 8 ani, 23 de salariai
au vechime de 14, 11 salariai au vechime de 16 ani si 2 salariati au vechime de 20 ani la actualul
serviciu. Se cere:
19

a) Construii seria de distribuie de frecvene i analizai grafic tendina de normalitate a acesteia


b) Caracterizai omogenitatea i asimetria distribuiei salariailor firmei n funcie de numrul de ani de
vechime.
13. Pentru cei 15 angajai ai departamentului IT ai unei firme au fost nregistrate date referitoare la vrst.
15

n urma prelucrrii datelor s-a obinut: xi 480 ani


i 1

15

(x

i 1

x ) 2 1124 . Alegei variantele corecte:

a) media nu este reprezentativ


b) coeficientul de variaie este 2,34%
c) colectivitatea este omogen
d) coeficientul de variaie este 28%
e) colectivitatea este eterogen
14. O serie de date statistice univariate are media x 20 ; Mo=17,8; Me= 19 i dispersia s 2 25 . Alegei
variantele corecte:
a. seria este simetric i omogen
b. seria prezint asimetrie negativ
c. seria prezint asimetrie pozitiv i grad mare de omogenitate
d. seria este eterogen
e. media este reprezentativ
15. Se consider seria de valori referitoare la vrsta angajailor departamentului de statistic i previziune
al Citi Bank: 28, 35, 24, 40, 22, 44, 29, 52, 30. Precizai care dintre variante nu este adevrat:
a) x 33,7 Mo 0 Me 30
b) seria prezint asimetria negativ
c) x 33,7 ani
d) seria nu are valoare modal
e) seria este perfect simetric
Calculati scorurile Z pentru seria de date referitoare la vrsta angajailor.
16. 150 de elevi din 2 orase participa la un concurs de cultura generala. Cei 90 de elevi din primul poras
obtin un punctaj mediu de 16 puncte cu un coeficient de variatie de 10% iar cei din al doilea oras obtin un
puncatj mediu de 18 puncte cu o abatere medie patratica de 1,9 puncte. Factorul de grupare (orasul)
contriubuie la variatia punctajelor obtinute de elevi in proportie de: a. 23,46%, b. 10,28%, c. 76,54%, d.
48,44% e. 24,37%
17.Un analist de marketing urmrete n 5 luni efectul reclamelor asupra veniturilor din vnzri. El
nregistreaz cheltuielile cu reclama (X) (miloane RON) i veniturile din vnzri (Y) (sute milioane
RON). n urma prelucrrii datelor obine:

xi
i

15; y i 10; x i2 55; x i y i 37;


i

2
i

30 i

. n ipoteza unei dependene

1,5

liniare, determinati si interpretati valoarea coeficientului de corelaie liniara Pearson.


18.Despre recolta medie la hectar la o anumit cultur i suprafaa cultivat, pentru 30 de judee se
cunosc datele:
Suprafaa cultivat (ha)
Sub 20.000

Recolta medie la hectar (q/ha)


Sub 13
13 i peste 13
10
5
20

20.000 i peste 20.000


3
Calculati si interpretati valoarea coeficientului de asociere.

12

19.Pentru un mare magazin alimentar s-au cules date privind vnzrile (mil. RON) i profitul (mil. RON)
realizate n 9 luni ale anului 2011:
Luna
Ian.
Valoarea vnzarilor 7
(mil. RON)
Profit (mil. RON)
0,15

Feb.
2

Mar.
6

Apr.
4

Mai
14

Iun.
15

Iul.
16

Aug.
12

Sept.
14

0,1

0,13

0,15

0,25

0,27

0,24

0,20

0,27

S se determine intensitate si sensul legaturii dintre variabilele valoarea vanzarilor i profit folosind un
indicator al corelatiei adecvat.
20.Pentru dou centre comerciale cu 12, respectiv 10 magazine, se cunosc datele:
Centrul
Nr. magazine
Valoarea medie a vnzrilor
Dispersia vnzrilor
comercial
pe un magazin (mil. RON)
A
12
18
10,24
B
10
27
20,25
a) Sa se determine in ce proportie centrul comercial in care este amplasat magazinul influeneaz
variaia vnzrilor.
b) Pentru care dintre cele doua centre comerciale (grupe) valoarea medie a vnzrilor este mai
reprezentativ (datele sunt mai omogene)?
c) Valoarea medie a vnzrilor la nivelul celor 22 de magazine este reprezentativ pentru eantionul
studiat?
21.ntr-o societate comercial salariul mediu este de 8,2 mii RON, iar cel modal 9,7 mii RON Pentru un
coeficient de asimetrie Pearson de -0,69, al distribuiei dup salariu care este valoarea coeficientului de
variaie?
22.n dou secii de producie ale unui agent economic cu profil industrial, s-au inregistrat urmatoarele
rezultate: in prima sectie, in care lucreaza 6 echipe de muncitori, s-a realizat o productie medie de 21
buc./echipa, cu o dispersie de 8,67; in a doua sectie, in care lucreaza 8 echipe, s-a inregistrat o productie
medie de 34 buc./echipa, cu o abatere standard de 17,36 buc. Care din urmtoarele afirmaii sunt
adevrate: a) secia A este mai omogen din punct de vedere al produciei dect secia B; b) secia B este
mai omogen din punct de vedere al produciei dect secia A; c) producia medie a seciei A este
reprezentativ, iar a seciei B nu; d) producia medie a seciei B este reprezentativ, iar a seciei A nu;
e) ambele secii sunt la fel de omogene din punctul de vedere al produciei.
23. Distribuia a 150 de studeni ai unei faculti dup numrul examenelor promovate se prezint astfel:
Nr. examene promovate
0
1
2
3
4
5
6
Nr. studeni
2
5
10
22
39
45
27
a) Analizati grafic tendinta de normalitate a distributiei studentilor in functie de numarul
examenelor promovate.
b) Calculati si interpretati valorile indicatorilor tendintei centrale.
c) Analizai omogenitatea si asimetria distributiei studenilor n funcie de numrul examenelor
promovate folosind indicatorii adecvati.
24.Se cunoate numrul de contracte ncheiate ntr-o perioad, pentru 27 de ageni economici:
12

16

13

1
21

9
10
15
6

9
11
3
12
8
11
7
10
2
9
26
18
11
10
7
6
a) Calculati si interpretati valorile cuartilelor.
b) Construiti diagrama Box-Plot.
c) Indentificati daca in setul de date exista valori de tip outliers.

25. Pentru 15 magazine situate n zona central i periferic a unui ora, se cunosc valorile vnzrilor
(mil. RON):
Zona
Valoarea vnzrilor (mil. RON)
Nr. magazine
Central
17; 20; 21; 20; 18; 19; 22; 20; 16
9
Periferic
9; 15; 13; 18; 12; 10
6
S se determine n ce proportie zona de amplasare a magazinelor a influenat variaia vnzrilor?
26. Distribuia celor 54 de ageni comerciali ai unei firme ce comercializeaz produse cosmetice de dup
numrul de zile lucrate n luna iulie este urmtoarea:
Zile lucrate

Numr vnztori

21
22
23
24
25
26
27
Total

6
7
14
11
9
4
3
54

S se analizeze omogenitatea si asimetria distribuiei.


27. O mare companie productoare de produse electrocasnice are 200 de magazine de desfacere.
Pentru aceste magazine s-au nregistrat vnzrile sptmnale de combine frigorifice (n buci). Datele
sistematizate se prezint astfel:
Grupe de magazine dup vnzrile
Ponderea magazinelor (%)
sptmnale de combine frigorifice
(buc.)
0-4
100
4-8
93
8-12
73
12-16
41
16-20
15
20-24
5
Se cere: S se analizeze omogenitatea si asimetria distribuiei.

22

S-ar putea să vă placă și