Sunteți pe pagina 1din 4

Aplicaţie curs

Despre 21 Agenţii de turism se cunosc datele privind numărul de bilete


vândute și zona de amplasare a fiecăreia
Nr. crt.
1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 20 21
Ag.T
Nr. bilete
20 24 26 25 23 24 28 28 30 26 28 28 25 24 27 25 25 20 26 25 80
vândute
Zona P S C S P S C C C P C S S P C C C P C S C

a) Aplicând funcţia “Descriptiv Statistics” să se determine şisă se


interpretezeindicatorii de bazăaiseriei;

Utilizarea funcţiei “Descriptiv Statistics”din EXCEL, necesită parcurgerea


următoarelor etape (vezi Excel):
- se introduc datele de la A1 la A22;
- din meniu se selectează: Data -- Data Analysis -- Descriptive
Statistics
- La Input Range: se selectează datele sunt pe coloana de la A1 pana la
A22, atunci se selectează: $A$1:$A$22
- se specifică Grouped Bay Columns (deoarece datele sunt pe coloană)
- Se bifeazăLabels in first row (fiindcă a fost selectat capul de tabel)
- Se bifeaza Output Range (se bifeaza o căsuţă din Excel în care să se
poziţioneze rezultatele): $C$2
- Se bifeazăSummary Statistics
- Se bifeazăConfidence Level for Mean
- Ok
Nr. bilete vândute
Mean 27,95
Standard Error 2,66
Median 25
Mode 25
Standard Deviation 12,18
Sample Variance 148,35
Kurtosis 19,04
Skewness 4,27
Range 60
Minimum 20
Maximum 80
Sum 587
Count 21
Confidence Level(95,0%) 5,54
b) Aplicând funcţia “Anova Single Factor” să se precizeze dacă
zona de amplasare influenţează semnificativ vânzarea de bilete.

Zona Nr. bilete vândute Nr. Agenții Turism


C 26 28 28 30 28 27 25 25 26 80 10
S 24 25 24 28 25 25 6
P 20 23 26 24 20 5

Utilizarea funcţieiANOVA: Single Factor (analiză de varianţă cu un singur


factor) din EXCEL, necesită parcurgerea următoarelor etape (vezi Excel):
1- se introduc datele cu zonele în capul de tabel, pe linii începând cu F2,
F3, F4, până la P2, L3, K4 (se introduce numai partea colorată cu
galben);
2- se selectează toate datele din coloane, inclusive capul de tabel (prima
coloană cu zonele: C,S,P), de la F2 la P4;
3- din meniu se selectează:
Data --Data Analysis – ANOVA: Single Factor
4- în fereastra deschisă:
 la Input Range se selectează toate datele de la F2 la P4 (inclusive
zonele): $F$2:$P$4
 se activează Labels in First
 se specific Grouped by Rows
 se activează Output Range şi se selectează o căsuţă în care se
doreşte să se poziţioneze rezultatele ($S$1)
 OK

Anova: Single Factor


SUMMARY
Groups Count Sum Average Variance
C 10 323 32,3 283,34
S 6 151 25,17 2,17
P 5 113 22,6 6,8
ANOVA
Source of
Variation SS df MS F P-value F crit
Between
378,82 2 189,41 1,32 0,29 3,55
Groups
Within
2588,13 18 143,79
Groups
Total 2966,95 20
Rezolvarea aplicaţiei

Rezultatul = f (factorul de influenţă, împărţit pe grupe) + alţI factori


Nr. Bilete vândute = f (zona de amplasare, împărţită pe cele trei grupe:C, S, P) + alţI factori
SSB
Coeficientul de determinaţie, R 
2
, indică ponderea de influenţă a factorului în variaţia rezultatului
SST
Factorul NU influenţează semnificativ rezultatul
R 2  50%
Coeficientul de determinaţie NU este semnificativ statistic
Factorul influenţează semnificativ rezultatul
R 2  50%
Coeficientul de determinaţie este semnificativ statistic

r
SSB   xi  x   ni  ???
2

i 1

xi este media fiecărei grupe, reprezentată de xC , x S , xP (Average --- vezi rezultate tabel SUMMARY)
26  28  28  30  28  27  25  25  26  80 323
xC    32,3 bilete / agentie
10 10
24  25  24  28  25  25 151
xS    25,17 bilete / agentie
6 6
20  23  26  24  20 113
xP    22,6 bilete / agentie
5 5
x este media generală a eşantionului format din cele 20 agenţii de turism (n = 20 agenţii turism), care
se determină ca medie aritmetică ponderată a mediilor fiecărei grupe:
r

x n i i
xC nC  xS nS  x P nP 32,3 10  25,17  6  22,6  5
x i 1
   29,35 bilete / agentie
r
nC  nS  nP 10  6  5
n
i 1
i

r
SSB    xi  x   ni  xC  x  nC  xS  x  nS  x P  x  nP
2 2 2 2

i 1

SSB  32,3  29,35  10  25,17  29,35  6  22,60  29,35  5  378,82 vezi rezultate tabel ANOVA
2 2 2

SST  ????
SST  SSB  SSW
r
SSW   si2  (ni  1)  sC2 nC  1  s S2 nS  1  s P2 (nP  1)
i 1

si2 este dispersia fiecărei grupe, reprezentată de s C2 , s S2 , s P2 (Variance --- vezi rezultate tabel SUMMARY)

(26  32,3) 2  (28  32,3) 2  (28  32,3) 2  ...  (80  32,3) 2


s 
2
 283,34
10  1
C

(24  25,17) 2  (25  25,17) 2  (24  25,17) 2  ....  (25  25,17) 2


s 
2
 2,17
6 1
S

(20  22,6) 2  (23  22,6) 2  ....  (20  22,6) 2


s P2   6,8
5 1
SSW  sC2 nC  1  s S2 nS  1  s P2 (nP  1)  283,3410  1  2,176  1  6,85  1  2588,13 vezi rezultate tabel
ANOVA
SST  SSB  SSW  378,82  2588,13  2966,95 vezi rezultate tabel ANOVA

SSB 378,82
R2    0,1277 , ceea ce înseamnă că, 12,77% reprezintă influenţa zonei de amplasare în
SST 2966,95
variaţia vânzării de bilete. Fiind mai mic de 50% se precizează că, acest coeficient de determinaţie calculat
NU este semnificativ statistic

OBSERVAŢIE!!!
SSW
Coeficientul de nedeterminaţie, K 
2
, indică ponderea de influenţă a altor factori
SST
SSW 2588,13
K2    0,8723 , deci 87,23% este influenţa altor factori
SST 2966,96

S-ar putea să vă placă și