Proiect Statistica
Haita Sonia-Ioana
Grupa 1506
Seria B
Facultate de Finante, Asigurari, Banci si Burse de Valori
Tema I. In fisierul Excel sunt inregistrate informatii legate de domeniul de
activitate, judetul, Cifra de afaceri si nr de salariati pentru 1287 companii
Folosind datele din Excel fila=sursa si repartizarea disponibila sa se rspunda la
urmtoarele cerinte:
-s se grupeze corespunzator datele pe intervale egale;
-s se calculeze indicatorii tendintei centrale,variatiei i asimetriei ;
-Presupunnd c datele pe care le aveti reprezint un e antion. Care este eroarea
maxim admisibila n acest caz. Construiti un interval de incredere pentru media din
populaia general.
Interpretati rezultatele obinute.
DA = domeniul de activitate
CA=cifra de afaceri
Min DA=373,65 [ =MIN(C2:C40) ]
Max DA=503,41 [ =MAX(C2:C40) ]
1. Stabilirea numrului de intervale (ng). Se recomand formula lui
Sturges:
ng= 1+3,322*lg(N), unde N= Volumul seriei.
Cum N=39, rezulta ca lg(N)=1,591064607.
Ng= [=1+3,322*I4] = 6,29
Din cele de mai sus rezulta ca trebuie sa facem 6 grupe pt ca ng = 6,29
Am folosit Sturges pt ca ni se cere sa facem o tabela statistica cu intervale de grupare
egale.
2. Stabilirea mrimii intervalului de grupare (k)
Se calculeaz amplitudinea: A=xmax-xmin
k=A/ng
A=max DA-min DA [=F3-F2]= 129,76
Stabilim marimea intervalului de grupare:
k=A/ng=129,76/6 [=G8/I6]= 21,62693885
3. Se construiesc grupele (intervalele)
Alegem valoarea rotunjita in sus ( adica 22 ) si vom porni de la 373 ca sa fim putin
sub minimul de 373.65 si vom tot adauga 22.
Grupam datele pe intervale egale, intr-o tabela statistica simpla cu intervale de grupare
egale:
Nr grupe
1
2
3
4
5
6
CA
[373,395)
[395,417)
[417,439)
[439,461)
[461,483)
[483,505]
Total
Frecventa, Nj
4
3
15
10
6
1
39
Inceput interval: 373, 395, 417, 439, 461, 483
Sfarsit interval: 395, 417, 439, 461, 483, 505
Pentru frecventa se foloseste COUNTIFS
(range C2:C40, >=373,<395), unde 373 si 395
reprezinta limitele intervalului pentru fiecare
din cele 6 linii.
Indicatorii tendintei centrale
Val centrala a clasei, xi
384
406
428
450
472
494
xi*N
(373+395)/2=384
(417+439)/2=428
(395+417)/=406
(439+461)/2=450
(461+483)/2=471
(483+505)/2=494
(xi^2)*N
589824
494508
2747760
2025000
1336704
244036
7437832
Ni*xi
0,01041667
0,00738916
0,03504673
0,02222222
0,01271186
0,00202429
0,08981094
Xi^2
1536
1218
6420
4500
2832
494
17000
147456
164836
183184
202500
222784
244036
1/xi
0,00260417
0,00246305
0,00233645
0,00222222
0,00211864
0,00202429
Total CA= [=SUM(C2:C40) ] =16957,72
Media aritmetica
x
xn
n
i i
i
= [=L23/H23]= 435,90
4
xi^Ni
2,1743E+10
66923416
2,9625E+39
3,4051E+26
1,1057E+16
494
2,9625E+39
Media patratica
xp
x n
n
2
i i
i
= [=SQRT(N24), unde N24 = =N23/H23 ] =436,71
Media armonica
xh
n
1
x n
i
= [=H23/P23]= 434,25
Media geometrica
x g ni xini
= radical de ordinul 39 din 2,9625E+39
Mediana
Mod de calcul:
1. Se ordoneaz cresctor seria de date
2. Se calculeaz poziia (locul) Medianei
locMe
1
( ni ) 1
2
locMe = 1/2(39+1) = 1/2 din 40 = 20
Dar 20 apartine clasei mediane 3, cea care incepe la 7 si se termina la 22 cumulat:
Pentru o serie de date grupate pe intervale: Se calculeaz frecvene cumulate cresctor
(Fi) :
Fi locMe
Se alege intervalul ce conine mediana ca fiind primul interval pentru care
este valabil relaia:
n interiorul intervalului ce conine mediana, formula de calcul este:
Me x0 k
locMe Fi 1
nMe
= [=M40+((M41-O42)/M43)*M44 ] = 436,07
x0 = limita inferioara a clasei mediane = 417
locMe = cota medianei = 20
Frecv absoluta cumulata
4
7
22
32
38
39
Fi-1 = frecventa absoluta cumulata crescatoare pana la clasa mediana = 7
K = amplitudinea clasei mediane = 22
nMe = frecventa clasei mediane = 15
Valoarea modala
Pentru o serie de date grupate pe intervale:
1. Se alege intervalul modal ca fiind intervalul cu frecvena maxim
2. n interiorul intervalului modal, valoarea modal se determin cu
ajutorul formulei:
Mo x0 k
1
1 2
= 410,53
Intervalul modal este tot 3 pt care are frecventa cea mai mare = 15
D1 = diferenta dintre frecventa clasei modale si a clasei anterioare ei = 12
D2 = diferenta dintre frecventa clasei modale si a clasei ulterioare ei = 5
K = amplitudinea clasei modale = 22
x0 = limita inferioara a clasei mediane = 417
Indicatorii variatiei
Abaterea medie liniara
Pentru o serie de frecvene sau pentru o serie de date grupate pe intervale de grupare:
x x n
n
i
= 21,3
Dispersia sau momentul centrat de ordin 2
Pentru o serie de frecvene sau pentru o serie de date grupate pe intervale de grupare:
x x
n
i
ni
Formula alternativ de calcul a dispersiei:
2 x p2 x 2
| xi-media aritmetica |
51,9
29,9
7,9
14,1
36,1
58,1
(Xi-med aritm)*Nj
207,6
89,7
118,5
141,0
216,6
58,1
831,5
(xi-med
aritm)^2
2693,3
893,9
62,4
198,9
1303,4
3375,9
[(xi-medaritm)^2]*Ni
10773,4
2681,6
935,5
1988,8
7820,4
3375,9
27575,6
= 27575,5/39=707,1
Abaterea standard sau abaterea medie ptratic
Abaterea:
(xi-med
aritm)^4
7254101
798980
3890
39554
1698839
11396755
(xi-med
ar)^4*Nj
29016404
2396939
58349
395542
10193033
11396755
53457023
= 26,6
De obicei, ntre abaterea medie ptratic i abaterea medie liniar exist
urmtoarea relaie:
4
d
5
= 0,8*707,1=565,68
Coeficientul de variatie / omogenitate
pentru a considera o serie omogen, teoria recomand, ca valoarea CV sa fie
cel mult 30-35%
CV
100
x
= [=(F70/C67)*100 ] = 6,10 %
Valoare mica care arata ca avem o serie omogena (media, mediana, valoarea
modala sunt reprezentative).
Indicatorii imprastierii / asimetria
Metoda vizuala
16
14
12
10
8
Frecventa, Nj
6
4
2
0
[373,395)
[395,417)
[417,439)
[439,461)
Mo=410,5
Media Aritmetica=436,1
Me=435,9
Mo<Media Aritmetica<Me, pare o asimetrie de stanga.
Metode analitice de abordare
Coeficienii de asimetrie ai lui Pearson
Cas
x Mo
= 0,95
10
[461,483)
[483,505]
Valoare mare care indica o asimetrie cu intensitate foarte mare;
Semnul pozitiv din fata rezultatului Cas indica directia asimetriei spre stanga.
interval de valori [-1;+1 ]
semnul arat direcia asimetriei
valori mici (apropiate de 0) indic o asimetrie de mic intensitate
valori mari (apropiate de 1) indic o asimetrie cu intensitate foarte mare
Eroarea maxim admisibila
Interval de ncredere pentru media ntregii populaii
Din teorie intervalul de ncredere este:
X x X0 X x
Eroarea limit:
x x Z
Eroarea medie de reprezentativitate:
x
S2
n
1
n
N
= 4,26
Dispersia/n= 18,13
11
Eroarea interferentei statistice Z, calculata in Excel cu functia NORMSINV pt o
distributie de 0.95 = 1,645
Eroarea maxim admisibila sau limita = eroarea medie de reprezentativitate*Z =7
Intervalul de incredere va fi:
X0= 417
417-7< X0<417+7
In concluzie, utilizand un sondaj cu o probabilitate de 95% putem afirma ca cifra
de afaceri a unei companii pe domeniul de activitate constructii civile se situeaza
intre : 410 si 424.
410= 417 - Eroarea maxim admisibila (7)
424=417 + Eroarea maxim admisibila (7)
12
Tema II. Fiecare student are repartizat o tara si un indicator. Pentru a crea
seria de timp se cauta date la Eurostat sau Banca Monidala pe cel putin 7 ani
consecutivi.
Folosind seria de date sa se :
-reprezinte grafic seria de timp
-sa se calculeze indicatorii absolu i, relativi,cu baza fixa i baza n lan precum si
indicatorii medii. Sa se interpreteze cele mai relevante valori.
GDP and main components - Current prices [nama_gdp_c]
Source of data: Eurostat
UNIT: Millions of euro (from 1.1.1999)/Millions of ECU (up to 31.12.1998)
INDIC_NA: Gross domestic product at market prices
GEO/TIME
Bulgaria
2011
38.504,9
2004
2005
20.387,9
23.255,8
2012
2013
39.927,0
39.940,3
2006
26.476,7
13
2007
30.772,4
2008
35.430,5
2009
2010
34.932,8
36.052,4
I.
Grafic
Evolutia PIB Bulgaria
45,000.0
40,000.0
35,000.0
30,000.0
25,000.0
milioane euro
20.387,9
20,000.0
15,000.0
10,000.0
5,000.0
0.0
2005
2006
2007
2008
2009
2010
2011
2012
2013
Graficul indica o tendinta de crestere cu o usoara intarziere la mijlocul perioadei
analizate. Trendul este pozitiv.
II.
Prelucrarea seriilor cronologice de momente egal distantate se face
asemanator seriilor cronologice de intervale.
Indicatorii absoluti si relativi ai acestei serii cronologice se trec in tabelul de mai
jos si pot fi determinati astfel:
Indicatori absoluti
Nivelul absolut (Yi) este reprezentat de termenii seriei cronologice (tabel coloana
2)
14
Modificarea absoluta cu baza fixa arata cu cat a crescut PIB in fiecare an,
comparativ cu anul 2005
t /1 yt y1
Cea mai mare valoare inregistrata a fost in anul 2013, 19,55 mld euro.
Modificarea absoluta cu baza in lant (baza mobila) masoara cresterea PIB de la
un an la altul:
t / t 1 yt yt 1
Cea mai mica valoare inregistrata a fost in anul 2009, cand PIB ul a scazut cu 0,50
fata de anul precedent.
Anul
Yi
(mld
euro)
Modificarea Indicele de
absoluta (mld dinamica
euro)
(%)
1
2004
2005
2
20,39
23,26
3
1
2
Baza Baza
fixa mobil
a
4
5
0
0
2,87 2,87
Baz
a
fixa
6
1,00
1,14
2006
26,48
6,09
3,22
1,29 1,13
2007
30,77
4,30
1,50 1,16
2008
35,43
4,66
1,73 1,15
2009
34,93
10,3
8
15,0
4
14,5
-0,50
1,71 0,98
15
Baza
mobil
a
7
1,00
1,14
Ritmul de
Ai
dinamica (%) (mld
euro
)
Baza Baza
fixa mobil
a
8
9
10
0,00 0,00
14,0 14,07 0,20
7
29,8 13,85 0,20
6
50,9 16,22 0,20
3
73,7 15,14 0,20
8
71,3 -1,40 0,20
Ai, i1(ml
d
euro)
11
0,20
0,23
0,26
0,31
0,35
2010
36,05
2011
38,50
2012
39,93
2013
39,94
10
4
15,6
6
18,1
2
19,5
4
19,5
5
1,12
1,76 1,03
2,45
1,88 1,06
1,42
1,95 1,03
0,01
1,95 1,00
4
76,8
3
88,8
6
95,8
4
95,9
0
3,21
0,20
0,35
6,80
0,20
0,36
3,69
0,20
0,39
0,03
0,20
0,40
Indicatori relativi
yt
I t /1
y1
Indicele de dinamica cu baza fixa
Iio=(yi/yo)*100=(yi/20,4)*100
S-a modificat de 1,95 de ori in anul 2013 fata de perioada de baza, anul 2004.
Indicele de dinamica cu baza in lant
I t / t 1
yt
yt 1
,i-1=(yi/yi-1)*100
Produsul indicilor cu baza in lant este 1,959 sau 195.9%
16
Ritmul de dinamica cu baza fixa reprezint ratele (ritmurile de
modificare) asociate indicilor cu baz fix.
Rt /1 It /1 1[00]
Rio=Iio-100
Ritmul de dinamica cu baza in lant reprezint ratele (ritmurile de
modificare) asociate indicilor cu baz mobil sau n lan.
Rt / t 1 I t / t 1 1[00]
Ri,i-1=Ii,i-1 100
S-au inregistrat valori cu 95,90% mai mari ca in perioada de baza, aproape de
100%.
y0
100
Valoarea absoluta a unui procent din ritmul de baza fixa are aceeasi
marime pentru fiecare moment t (fiecare an)
Ai=col4/col8=0,20 mld euro
Acest rezultat arata ca marirea cu 1% a PIB in orice an in comparatie cu 2004, este
echivalenta cu un spor absolut de 0,2 miliarde de euro.
Valoarea absoluta a unui procent din ritmul de baza in lant este o marime
variabila
17
Ai,i-1=col5/col9
Indicatori medii
Nivelul mediu se calculeaza aplicand formula mediei cronologice simple deoarece
aceasta este o serie cronologica de momente situate la distante egale de timp.
y
y1
2
y2 y3 ... yn 2 yn 1
n 1
yn
2
Pentru serii de momente (stoc) folosim media
cronologic
Ycr=(y1/2+y2+....+yn-1+yn/2)/n-1
Ycr=(20,39/2+23,26+....+39,93+39,94/2)/(10-1)= 32,84
In medie, PIB s-a modificat de 32,84 pe an.
Modificarea medie absoluta reprezint media aritmetic a modificrilor
absolute cu baz n lan.
n
y y
n 1 n /1
n 1
n 1
t 2
t / t 1
n 1
delta=(y10-y1)/(n-1)=(39,94-20,39)/9=2,17
PIB ul se modifica, in medie, cu 2,17 mld euro de la un an la altul.
18
n 1
yn
y1
n 1
I t / t 1
n 1 I n / 1 I
t 2
Indicele mediu de dinamica, I,
reprezint media geometric a indicilor cu baz n lan.
I=1,40
139,96%
R I 1[00]
Ritmul mediu reprezint rata (ritmul) asociat indicelui
mediu de dinamic.
R=I-100=39,96%
In medie, PIB ul creste cu 39,96%.
Reprezentarea grafica a acestei serii cronologice, precum si indicatorii absoluti si
relativi calculati anterior arata o tendinta de crestere a PIB.
III.
Metoda mecanica indicata in acest caz este metoda modificarii medii
absolute, iar ca metoda analitica este recomandabila ajustarea pe baza
unei functii liniare.
Se aplic atunci cnd ntre termenii seriei exist o tendin de progresie
geometric. Se studiaza indicii sau ritmurile cu baz n lan (It/t-1 sau Rt/t-1) i
dac se constat valori aproximativ egale se alege aceast metod.
Formula de ajustare:
y t y1 I t 1 , t 1, n
19
Valorile ajustate Yi=yi+delta(t-1)=20,39+2,17*(t-1)
Abaterile =|Yi-Valori ajustate|
Valorile
reale yi
20,39
23,26
26,48
30,77
35,43
34,93
36,05
38,50
39,93
39,94
Metoda modificarii
absolute medii
t Valorile
Abaterile
ajustate
1 20,39
0,00
2 25,43
2,17
3 30,82
4,34
4 37,29
6,52
5 44,12
8,69
6 45,80
10,86
7 49,09
13,03
8 53,71
15,21
9 57,31
17,38
1 59,49
19,55
0
20