Documente Academic
Documente Profesional
Documente Cultură
Aplicatii Rezolvate Date Univariate
Aplicatii Rezolvate Date Univariate
6,1;
11,7;
Se cere:
a) S se determine durata medie a unei convorbiri telefonice i s se studieze dac valoarea obinut este
reprezentativ;
b) S se analizeze asimetria distribuiei;
c) Calculai cuartilele acestui set de date i interpretai rezultatele obinute;
d) S se grupeze datele pe 6 intervale de mrime egal i s se reprezinte grafic rezultatul gruprii;
e) S se determine ponderea cazurilor care se gsesc n intervalul:
x s; x s
x 2s; x 2s
x 3s; x 3s i s se stabileasc dac valorile gsite corespund regulii empirice.
Rezolvare:
a) Notm cu X variabila durata unei convorbiri telefonice, iar xi reprezint valorile variabilei X pentru
cele n=30 observaii.
Pentru calculul mediei se va utiliza formula mediei aritmetice simple:
30
xi
x i 1 10,26 minute.
n
Verificarea reprezentativitii mediei se face cu ajutorul coeficientului de variaie:
s
v x 100
x
Calculm abaterea medie ptratic:
xi x
30
s x s x2 i 1
4 ,29 minute.
2,3
8,9
14,5
6,8
11,4
7,2
11,7
7,7
11,8
8
12,1
8,3
12,3
8,5
13,5
0 ,25
sx
4 ,29
Observaie: Cas1 3,3 .
Valoarea coeficientului arat o uoar asimetrie pozitiv, n serie predominnd valorile mici.
c) Cuartilele sunt indicatori de poziie care impart seria n patru pri egale. Din categoria acestor
indicatori face parte i mediana determinat la punctul b).
n mod similar vom determina Q1 i Q3.
n 1 31
locQ1
7 ,75 .
4
4
Deci Q1 este o valoare cuprins ntre termenii al 7-lea i al 8-lea ai seriei, adic ntre 6,8 i 7,2. Determinm
prima cuartil ca fiind media aritmetic simpl a celor dou valori:
6 ,8 7 ,2
Q1
7 minute.
2
Aceasta nseamn c 75% dintre convorbirile telefonice au o durat mai mare de 7 minute.
3n 1 93
23,25 .
4
4
Deci Q3 este o valoare cuprins ntre termenii al 23-lea i al 24-lea ai seriei, adic ntre 12,3 i 13,5.
Determinm cuartila a treia ca fiind media aritmetic simpl a celor dou valori:
12,3 13,5
Q3
12,9 minute.
2
Aceasta nseamn c 25% dintre convorbirile telefonice au o durat mai mare de 12,9 minute.
a) Ax = xmax - xmin = 19,1 - 2,3 = 16,8 minute
r=6
h Ax r 16,8 6 2,8 3 minute
Rezultatele gruprii sunt prezentate n tabelul urmator:
locQ3
Convorbiri
2-5
5-8
8-11
Durata
d)
Tabelul 3.2
Interval
x s; x s = (5,97; 14,55)
x 2s; x 2s = (1,68; 18,84)
Regula empiric
68%
95%
Se observ c procentele calculate pe baza datelor iniiale sunt foarte apropiate de cele corespunztoare
regulii empirice. n ultimul interval, x 3s; x 3s se gsesc practic toate convorbirile telefonice.
2. Distribuia celor 54 de ageni comerciali ai unei firme ce comercializeaz produse cosmetice de dup
numrul de zile lucrate n luna iulie este urmtoarea:
Tabelul 3.3
Zile lucrate
21
22
23
24
25
26
27
Total
Numr vnztori
6
7
14
11
9
4
3
54
Se cere:
a) S se reprezinte grafic distribuia vnztorilor dup numrul de zile lucrate;
b) S se determine numrul mediu de zile lucrate i s se studieze dac valoarea obinut este
reprezentativ;
c) Care este numrul de zile lucrate peste care se situeaz:
nr.lucratori
12
10
8
6
4
2
0
21
22
23
24
25
26
27
zile lucrate
xi ni
ni
1276
23,6 zile.
54
Tabelul 3.4
Numr vnztori
(ni)
1
6
7
14
11
9
4
3
54
Zile lucrate
(xi)
0
21
22
23
24
25
26
27
Total
xi ni
xi x 2 ni
Fci
2
126
154
322
264
225
104
81
1276
3
40,56
17,92
5,04
1,76
17,64
23,04
34,68
140,64
4
6
13
27
38
47
51
54
-
Aadar, un vnztor din cei 54 luai n studiu a lucrat, n medie, aproximativ 23 de zile i jumtate.
Pentru a verifica reprezentativitatea mediei obinute, trebuie calculat coeficientul de variaie, pe baza
abaterii medii ptratice:
s
v x 100
x
s x s x2
Dispersia variabilei este:
xi x ni 140,64 2,6044 .
54
ni
2
s x2
Calculele intermediare necesare n determinarea dispersiei sunt prezentate n coloana 3 a tabelului 3.4.
13,75
4
4
Q1 este acea valoare a variabilei corespunztoare primei frecvene cumulate cresctor mai mare dect locQ1,
deci Q1=23 zile.
Aadar, 75% dintre vnztori au lucrat mai mult de 23 de zile n luna iulie.
c2) Mediana (Me)
ni 1 55
locMe
27 ,5
2
2
Me = 24 zile.
Deci, 50% din vnztori au lucrat mai mult de 24 de zile, iar 50% mai puin.
41,25
4
4
Q3 = 25 zile.
Aadar, 25% din vnztori au lucrat mai mult de 25 de zile.
0 ,37
sx
1,61
Mo = 23 zile (nivelul variabilei cu frecvena cea mai mare).
Valoarea coeficientului de asimetrie indic fapul c seria este moderat asimetric la dreapta (predomin
valorile mici ale variabilei).
3. Procentul din profit cheltuit de 70 de firme pentru reclam i publicitate n anul 2005 a avut urmtoarea
distribuie:
Tabelul 3.5
% pentru reclam i publicitate
0,6-1,0
1,0-1,4
1,4-1,8
1,8-2,2
2,2-2,6
2,6-3,0
Total
Se cere:
a) S se reprezinte grafic distribuia de frecvene absolute;
b) S se determine procentul mediu cheltuit pentru reclam i publicitate i s se studieze dac valoarea
obinut este reprezentativ;
c) Care este procentul din profit cheltuit pentru reclam i publicitate peste care se situeaz:
c1) trei sferturi dintre firme?
c2) 50% din firme?
c3) o ptrime din firme?
d) S se analizeze asimetria.
e) S se calculeze media i dispersia firmelor care au cheltuit mai mult de 2,2% din profit pentru reclam
i publicitate.
Rezolvare:
a) Se observ c n tabelul 3.5 sunt date frecvenele absolute cumulate cresctor. Pentru a determina
frecvenele absolute, trebuie s decumulm frecvenele date n tabelul iniial (coloana 2). Rezultatele
prelucrrilor intermediare necesare pentru calcularea indicatorilor solicitai vor fi redate n tabelul 3.6.
Tabelul 3.6
% cheltuit
pentru
reclam i
publicitate
0
0,6-1,0
1,0-1,4
1,4-1,8
1,8-2,2
2,2-2,6
2,6-3,0
Total
Frecvenele
absolute
cumulate
cresctor
1
14
32
56
64
68
70
-
Frecvene
absolute
(nr. firme)
(ni)
2
14
18
24
8
4
2
70
Centre de
interval
(xi)
3
0,8
1,2
1,6
2,0
2,4
2,8
-
xi ni
xi x
4
11,2
21,6
38,4
16
9,6
5,6
102,4
5
-0,66
-0,26
0,14
0,54
0,94
1,34
xi x2 ni xi x4 ni
6
6,098
1,217
0,470
2,333
3,534
3,591
17,244
7
2,656
0,082
0,009
0,680
3,123
6,448
13,000
Distribuia de frecvene absolute este reprezentat grafic n figura 3.3, prin histogram.
Numr de firme
30
25
20
15
10
5
0
0,6-1,0 1,0-1,4 1,4-1,8 1,8-2,2 2,2-2,6 2,6-3,0
procentul pt. reclama si publicitate
Figura 3.3 Distribuia firmelor dup procentul cheltuit pentru reclam i publicitate
b) Se calculeaz media aritmetic ponderat a procentului cheltuit pentru reclam i publicitate, pe baza
frecvenelor absolute (coloana 4):
xi ni
ni
102,4
1,4628 1,46 %
70
Aadar, o firm din cele 70 luate n studiu a cheltuit, n medie, 1,46% din profit pentru reclam i
publicitate.
Pentru a verifica reprezentativitatea mediei obinute, trebuie calculat coeficientul de variaie, pe baza
abaterii medii ptratice:
s
v x 100
x
s x s x2
Dispersia variabilei n eantion este:
xi x ni 17,244 0 ,2463
70
ni
2
s x2
se gsete intervalul n care se afl prima cuartil (primul interval a crui frecven cumulat cresctor
depete locul primei cuartile), acesta este 1,0-1,4;
se calculeaz prima cuartil, cu formula:
loc Q1 FcQ1 1
17 ,75 14
Q1 x0 k
1 0 ,4
1,08 %.
nQ1
18
unde:
x0 = limita inferioar a intervalului primei cuartile;
k = mrimea intervalului cuartilic;
FcQ1-1 = frecvena cumulat a intervalului anterior celui cuartilic;
nQ1 = frecvena absolut a intervalului primei cuartile.
Aadar, 75% dintre firme au cheltuit pentru reclam i publicitate mai mult de 1,08 % din profit.
c2) Mediana (Me)
ni 1 71
locMe
35,5
2
2
Mediana se gsete n intervalul 1,4-1,8.
Me x0 k
loc Me FcMe1
35,5 32
1,4 0 ,4
1,458 %.
nMe
24
Deci, 50% din firme au cheltuit pentru reclam i publicitate mai mult de 1,458 % din profit, iar 50% mai
puin.
c3) Cuartila a treia (Q3)
3( ni 1 )
locQ3
53,25
4
A treia cuartil se gsete tot n intervalul 1,4-1,8.
loc Q3 FcQ3 1
53,25 32
Q3 x0 k
1,4 0 ,4
1,754 %.
nQ3
24
Aadar, 25% din firme au cheltuit pentru reclam i publicitate mai mult de 1,754 % din profit, iar 75% mai
puin.
d) Analizm asimetria distribuiei cu ajutorul coeficientului de asimetrie al lui Pearson.
x Mo
Cas
sx
1
Mo x0 k
1 2
unde:
x0 = limita inferioar a intervalului modal;
k = mrimea intervalului modal;
Intervalul modal este intervalul cu frecvena maxim: [1,4-1,8)
1 = nMo nMo-1 = frecvena intervalului modal minus frecvena intervalului anterior celui modal;
2 = nMo - nMo+1 = frecvena intervalului modal minus frecvena intervalului urmtor celui modal;
24 18
Se obine Mo 1,4 0 ,44
1,52%.
( 24 18 ) ( 24 8 )
Cele mai multe firme au cheltuit pentru reclam i publicitate 1,52% din profit.
Cas
1,46 1,52
0 ,12 <0 ceea ce arat o asimetrie uoar, negativ, n serie predomin valorile mici.
0 ,4963
d) Se creeaz o caracteristic alternativ cu o stare favorabil (firmele care au cheltuit peste 2,2%) i o stare
nefavorabil (firmele care au cheltuit mai puin de 2,2%).
Media caracteristicii alternative este:
m 6
w
0 ,086 0 ,09 (n medie, 9% din firme au cheltuit peste 2,2%)
n 70
iar dispersia: s 2 w1 w 0 ,09 0 ,91 0 ,08 .
4. Se cunosc urmtoarele date referitoare la distribuia celor 3569 structuri de primire turistic cu funciuni de
cazare turistic, pe categorii de confort n anul 2003:
Categorii de confort
Neclasificate
1 stea
2 stele
3 stele
4 stele
5 stele
TOTAL
Sursa: www.insse.ro
Categorii de confort
0
Neclasificate
1 stea
2 stele
3 stele
4 stele
5 stele
TOTAL
1
448
1080
1479
427
125
10
3569
ni 1
locMe i 1
n 1 3570
1785
2
2
2
Determinm mediana:
Mediana reprezint acel nivel al variabilei analizate corespunztor primei frecvene cumulate cresctor mai
mare dect locMe. Deci i nivelul Me este 2 stele (Fc3=3007>locMe=1785).
n2 = 32
Atunci: x
x n
n
i
, x
x 1 7 ,8
x 2 8 ,4
x 1 n1 x 2 n2 7 ,8 25 8 ,4 32 195 268 ,8
8 ,14 puncte.
n1 n 2
25 32
57
b) nlocuii valoarea 20 cu valoarea 8 i recalculai cei doi indicatori ai tendinei centrale. Explicai
modificrile survenite.
c) Adugai 50 fiecrei valori iniiale. Cum se va modifica media?
Rspuns:
x 7 ,28
Pentru determinarea medianei, datele se ordoneaz: 4, 4, 5, 5, 6, 7, 20. Se determin locul medianei n serie:
ni 1 7 1
Loc Me
4.
2
2
Seria avnd un numr impar de termeni, mediana este egal cu valoarea termenului central (al patrulea), deci
Me = 5.
Mediana este un indicator potrivit pentru a studia tendina central n acest set de date, deoarece valoarea 20
este o valoare extrem, ce afecteaz, prin magnitudine, nivelul total al variabilei i deci valoarea mediei. ase
dintre cele apte valori se situeaz sub valoarea mediei aritmetice, ceea ce face ca indicatorul median s
exprime mai corect tendina central.
b) Noile valori sunt: 4, 4, 5, 5, 6, 7, 8.
x 5 ,57 , Me = 5.
Valoarea medianei rmne neschimbat, ea innd cont numai de numrul valorilor mari, nu i de valoarea lor
efectiv.
c) Valorile sunt: 55, 57, 54, 55, 70, 56, 54.
x'
n
7
Se verific proprietatea mediei aritmetice de a se modifica () cu a uniti, dac fiecare valoare se modific
() cu cte a uniti.
10