Sunteți pe pagina 1din 4

APLICATII SEMINAR 3 + SEMINAR 4

Un analist doreste sa elaboreze un studiu asupra activitatii magazinelor online. Pentru aceasta, el selecteaza aleator
100 de astfel de magazine si inregistreaza valoarea vanzarilor online realizate de acestea in luna precedenta (zeci mii
lei), prin intermediul site-urilor de profil. Datele se prezinta astfel:
Magazin

Valoarea vanzarilor
online (zeci mii lei)

2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
29.
30.
31.
32.
33.
34.
35.
36.
37.
38.
39.
40.
41.
42.
43.
44.
45.
46.
47.
48.
49.
50.
51.

10,1
11,4
11,5
10,4
7,3
9,2
11
10,6
9,5
11,1
10
11,4
11,6
11,8
10,3
10,3
10,4
10,4
11,4
10,3
5,4
12
5,4
11
8,5
6,2
6,3
6,8
9,2
11,9
10,4
7,1
9,5
10,9
5,8
9,1
11,5
11
8,4
9,7
9,7
11,7
7,9
10,6
5
9,3
10,1
10,1
8,6
10,7

Magazin

Valoarea vanzarilor
online (zeci mii lei)

51.
52.
53.
54.
55.
56.
57.
58.
59.
60.
61.
62.
63.
64.
65.
66.
67.
68.
69.
70.
71.
72.
73.
74.
75.
76.
77.
78.
79.
80.
81.
82.
83.
84.
85.
86.
87.
88.
89.
90.
91.
92.
93.
94.
95.
96.
97.
98.
99.
100.

Se cere:
a. Sa se sistematizeze datele

11,2
disponibile si sa se reprezinte
11,3
grafic.
9
b. Sa se calculeze frecventele
6,8
relative si sa se reprezinte grafic.
8,9
c. Sa se analizeze seria de date
10,3
individuale cu ajutorul
8,9
indicatorilor descriptivi, sub
7,7
urmatoarele aspecte:
10,2
i.
Tendinta centrala
11,6 ii.
Variabilitatea
7,5 iii.
Forma distributiei
11
d. Sa se estimeze valoarea medie a
5,9
vanzarilor online a unui magazin
11,3
din populatia generala, pe interval
8,5
de incredere garantat cu o
6,1
probabilitate de 95% (z=1,9842).
8,6
e. Cate magazine online ar trebui
11,5
incluse in esantion, daca dorim sa
10,8
obtinem o eroare limita mai mica
11,9
de 1,5 ori decat cea de la punctul
10,9
anterior?
4,5
f. Analistul emite ipoteza ca
11,8
valoarea medie a vanzarilor
9,3
online a unui magazin, obtinuta
9,3
anul trecut este mai mica decat
11,9
cea de acum 2 ani (in valoare de
10,5
10 zeci mii lei), datorita
9,1
manifestarii crizei economico3,1
financiare globale. Se poate spune
10,5
ca analistul are dreptate, cu un
10,3
nivel de incredere de 95%?
10,4
(valoare critica:1,645).
8,4
g. Estimati ponderea magazinelor
8,1
online din populatia totala care au
10,5
obtinut o valoarea a vanzarilor
5,7
online de peste 11 zeci mii lei, pe
5,8
interval de incredere (z=1,9842).
10,8
h. Se poate afirma cu o probabilitate
11,3
de 95% ca ponderea magazinelor
9,6
online din populatia totala care au
11,6
obtinut vanzari de peste 11 zeci
3,8
mii lei este de 25%?
7
3,6
9,9
9,8
11,1
11,6
11,4
9,4

a). Pentru gruparea datelor pe intervale egale de variatie, se parcurg urmatorii pasi:
- se determina amplitudinea: A=x_max-x_min=12-3,1=8,9 zeci mii lei.
- se calculeaza nr. de grupe: r = 1 + 3,322 * log(100)=7,64 8 grupe
- se determina marimea intervalelor: k = A / r = 8,9 / 8 = 1,11 1,2 zeci mii lei.
- se alcatuiesc intervalele, plecand de la valoarea 3,0:
Intervale de variatie a valorii
Nr. magazine (frecvente absolute ni)
vanzarilor online (zeci mii lei)
3,0 4,2
3
4,2 5,4
4
5,4 6,6
7
6,6 7,8
7
7,8 9,0
11
9,0 10,2
20
10,2 11,4
34
11,4 12,6
14
Total
100
Pentru efectuare gruparii si determinarea frecventelor grupelor se utilizeaza Excel, astfel:
Data Data Analysis Histogram.

Se apasa pe OK si se obtine rezultatul din tabelul urmator:


Bin (limite superioare)
4,2
5,4
6,6
7,8
9
10,2
11,4
12,6
More

Frequenc
y
3
4
7
7
11
20
34
14
0

Din histograma se observa ca distributia este puternic asimetrica spre dreapta (prezinta asimetrie negativa si ca in
serie predomina valorile mari).
*
b). Frecventele relative se determina dupa relatia: ni

deoarece volumul esantionului este n = 100.


c)
Rezolvare folosind EXCEL:

ni
100 . Ele coincid ca valori cu frecventele absolute,
ni

1. Apsai Data/Data Analysis i Descriptive Statistics.


2. Introducei Input Range (A1:A101) coninnd i numele variabilei. Selectai Labels in First Row.

3. Bifai Summary Statistics i Confidence Level for mean i apoi OK.


Se obin rezultatele:
Val.vanz.online (zeci mii lei)
Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
Largest(3)
Smallest(3)
Confidence Level(95,0%)

9,398= x (media aritmetica)


0,215022 = x (eroarea medie
de reprezentativitate)
10,1 = Me (Mediana)
10,4 = Mo (Modul)
2,150216 = sx (Abaterea
standard)
4,62343 = s2 (Dispersia)
0,393661 = KURT (coefficient de
boltire sau aplatizare)
-1,0731 = SKEW (coefficient de
asimetrie)
8,9 = A (amplitudinea)
3,1 = x_minim
12 = x_maxim
939,8 (suma termenilor)
100 = n (volumul esantionului)
11,9 (cea mai mare a treia
valoare)
3,8 (cea mai mica a treia
valoare)
0,42665 = x (eroarea limita)

Tendinta centrala:
Media (Mean): Un magazn din esantion a realizat vanzari in valoare medie de 9,398 zeci mii lei.
Mediana (Median): 50% din magazine au avut vanzari mai mari de 10,1 zeci mii lei, si 50% - mai mici.
Modul (Mode): Cele mai multe magazine au avut vanzari in valoare de 10,4 zeci mii lei. Acesta este posibil s nu fie
singurul, deoarece EXCEL nu afieaz dect o singur valoare.
Variabilitatea:
Dispersia (Variance): >0, deci seria prezinta un grad de variatie.
Abaterea standard (Standard Deviation): vanzarile unui magazin se abat, in medie, de la media seriei cu 2,15 zeci mii lei.
Coeficientul de variatie:

s
2,15
100
100 22,88% <35%, deci seria este omogena, media este
9,398
x

reprezentativa.
Forma distributiei:
Asimetria (Skewness): SKEW<0, seria are deci o asimetrie negativa, in serie predomina valoarile mari. SKEW 1
deci asimetria este puternica, pronuntata.
Boltirea/aplatizarea (Kurtosis): KURT>0, deci distributia este leptocurtica (ascutita), gradul de concentrare a termenilor
seriei in jurul mediei este mai mare decat in distributia normala.
Alti indicatori:
Cea mai mic valoare a vanzarilor a fost 3,1 (Minimum) iar cea mai mare Maximum = 12. Amplitudinea (diferena ntre
valoarea minim i cea maxim) este 8,9 (Range).
d) Se determina:
Eroarea medie de reprezentativitate (in tabelul Excel se numeste Standard Error): x

sx
n

2,15
0,215 zeci mii lei
10

Eroarea limita (in tabelul Excel apare la Confidence level): x z / 2 x 1,9842 0,215 0,426 zeci mii lei.

Intervalul de incredere pentru punctajul mediu este:


X x X x

Media populatiei apartine intervalului [8,97; 9,82] (garantat cu o probabilitate de 95%).

e) ' x

x
1,5

0,284 ; n'

z2 s2
225 magazine.
'2x

H0: 0 10 (unde 0 este valoarea ipotetica)


H1: 10 (Test unilateral stanga)
Cun n=100>30, avem esantion de volum mare, se aplica testul z:
x 0
x 0
9,398 10
z calc

2,8
x
0,215
sx / n
Valoarea se poate obtine cu functia in Excel: standardize(9,398;10;0,215) ce returneaza scorul z.
z critic z 1,645 .
f)

Cum zcalc<-z, zcalc se afla in Regiunea critica (de respingere), se respinge H0, se accepta H1 si deci analistul are dreptate.

1, dacax 11
.
0, dacax 11
m nr.cazuri. favorabile
24

0,24
Media variabilei este: f
n
nr.total .de.cazuri
100
2
Dispersia variabilei alternative: s alt f 1 f 0,1824
g) Se creeaza variabila alternativa: w

Eroarea medie: f

s alt
n

Eroarea limita: f z / 2

f 1 f

0,1824
0,0427
100

1,9842 0,0427 0,084

Intervalul de incredere: x f p x f , adica [0,16; 0,32] (ponderea magazinelor a caror vanzare este de peste 11 zeci mii lei,
din populatia totala, este cuprinsa intre 16% si 32%)

H0: p p 0 0,25 (unde p0 este ponderea ipotetica)


H1: p 0,25 (Test bilateral).
Cun n=100>30, avem esantion de volum mare, se aplica testul z:
f p 0 0,24 0,25
z calc

0,23
f
0,0427
Valoarea se poate obtine cu functia in Excel: standardize(0,24;0,25;0,0427) ce returneaza scorul z.
z critic z / 2 1,9842 .
h)

Cum -z/2 < zcalc < z/2,


zcalc se afla in Regiunea de acceptare, deci se accepta H0 si deci ponderea magazinelor din populatia totala
care au avut vanzari de peste 11 zeci mii lei este de 25%.

S-ar putea să vă placă și