Documente Academic
Documente Profesional
Documente Cultură
PROIECT
PRACTICA IN STATISTICA
IASI, 2016
Obiectivul proiectului
Analiza statistic, folosind metode descriptive i infereniale, a unei serii de date nregistrate la
un moment dat i analiza statistic descriptiv a unei serii de timp.
Proiectul de practic a fost realizat pe baza datelor reale din: statistica oficial BAZA DE DATE
TEMPO ONLINE
Structura proiectului:
1 Introducere
Se va enuna obiectivul specific al cercetarii
2 Analiza statistic a unei serii de date nregistrate la un moment dat
2.1 Se vor identifica dou variabile statistice, o variabil cantitativ i o variabil
calitativ.Datele vor fi introduse in Excel.
2.2 Analiza statistic univariat a variabilelor statistice
2.2.1 Analiza statistic univariat a variabilei cantitative
2.2.2 Analiza statistic univariat a variabilei calitative
2.3 Analiza statistic bivariat (variabila numeric i variabila calitativ; medii i abateri
standard condiionate)
2.4 Estimarea prin interval de ncredere a mediei si a proporiei
2.5 Testarea statistic
2.5.1 Testarea ipotezelor asupra unui eantion
2.5.2 Testarea ipotezelor asupra a dou eantioane independente
2.5.3 Testarea ipotezelor asupra a trei i mai multe eantioane independente
3
Analiza statistic descriptiv a unei serii de timp
3.1 Alegerea variabilei statistice.
Se va alege o variabil cantitativ, pentru care se vor nregistra valorile pentru 7 perioade de
timp(mii hectare, semestre, trimestre, luni sau zile).
3.2Analiza statistica folosind indici statistici simpli
3.2.1 Indici absolui
3.2.2 Indici relativi
3
Indici exprimai prin valori medii
4
Concluzii
Bibliografie
1 Introducere
ntr-o prim concepie, statistica echivala cu descrierea statului, expunerea situaiei geografice,
economice i politice. Acest gen de statistic a fost cultivat mai nti de italieni. nc din sec.
XIII - XIV n Republica Veneia se elaborau diferite rapoarte care conineau informaii privitoare
la partenerii si comerciali i au fost utilizate n politica comercial oficial.
Curentul "descrierea statului" a atins apogeul n sec. XVII- XVII cnd, n Germmii hectarea, s-a
constituit o adevrat coal cunoscut sub denumirea de coala descriptiv german.
Descrierea statului a devenit disciplin de predare acadamic, ncadrat ntr-un sistem construit
dup norme teoretice i practice, care s-au elaborat i dezvoltat n univeritile germane. Noua
disciplin (Staatskunde), a primit numele de statistic (Statistik).
Pe vremea constituirii statisticii ca disciplin descriptiv a statului, se ntea n Anglia, n afara
universitilor, o statistic cunoscut sub numele de aritmetica politic, a crui scop era: analiza
datelor de observaie prin procedee matematice, desprinderea regularitilor n fenomenul social
i chiar formularea de previziuni. Studiile demografice lsau s se ntrevad c previziunea
fenomenelor colective ar putea avea o nsemntate practic; dealtfel tabelele de mortalitate,
ntocmite n sec. XVIII au constituit punctul de plecare al nfloritoarei industrii de asigurri.
Folosirea metodei statistice, recurgerea la instrumentul matematic i cutarea legitilor marcau
un substanial progres, prefigurnd statistica modern.
Este dificil s se dea o definiie satisfctoare statisticii. n limbaj uzual termenul este
folosit pentru a desemna o colecie de numere referitoare la un anumit domeniu (demografie,
precipitaii, debite). n sens tehnic (mai precis matematic) statistica este un instrument al
matematicii utilizat pentru prelucrarea i interpretarea informaiilor numerice.
Principalul obiectiv urmrit in cadrul acestui proiect este redarea anumitor informaii,
cu scopul evidenierii legturilor statistice intre variabile , acestea din urm
reprezentnd insuiri, trsturi eseniale purtate de unitile statisticeale unei
colectiviti. Scopul acestei lucrri este de a realiza o cercetare asupra suprafetei
fondului cultivat de livezi din fiecare jude, dar i asupra nivelului acesteia.
N
r Macroregiune
1 Macroregiunea unu
Judet
Bihor
Suprafata fondului
Nivelul suprafetei
cultivata
fondului cultivat
4005 mai mare decat media
2
3
4
5
6
7
8
9
1
0
1
1
1
2
1
3
1
4
1
5
1
6
1
7
1
8
1
9
2
0
2
1
2
2
2
3
2
4
2
5
2
6
2
7
2
8
2
9
Macroregiunea
Macroregiunea
Macroregiunea
Macroregiunea
Macroregiunea
Macroregiunea
Macroregiunea
Macroregiunea
unu
unu
unu
unu
unu
unu
unu
unu
Macroregiunea unu
Macroregiunea unu
Macroregiunea unu
Macroregiunea doi
Macroregiunea doi
Macroregiunea doi
Macroregiunea doi
Macroregiunea doi
Macroregiunea doi
Macroregiunea doi
Macroregiunea doi
Macroregiunea doi
Macroregiunea doi
Macroregiunea doi
Macroregiunea doi
Macroregiunea trei
Macroregiunea trei
Macroregiunea trei
Macroregiunea trei
Macroregiunea trei
BistritaNasaud
Cluj
Maramures
Satu Mare
Salaj
Alba
Brasov
Covasna
Harghita
Mures
Sibiu
Bacau
Botosani
Iasi
Neamt
Suceava
Vaslui
Braila
Buzau
Constanta
Galati
Tulcea
Vrancea
Arges
Calarasi
Dambovita
Giurgiu
Ialomita
7409
1028
6544
3166
3558
813
1004
569
mai
mai
mai
mai
mai
mai
mai
mai
3
0
3
1
3
2
3
3
3
4
3
5
3
6
3
7
3
8
3
9
4
0
4
1
4
2
Macroregiunea trei
Macroregiunea trei
Macroregiunea trei
Macroregiunea trei
Macroregiunea
patru
Macroregiunea
patru
Macroregiunea
patru
Macroregiunea
patru
Macroregiunea
patru
Macroregiunea
patru
Macroregiunea
patru
Macroregiunea
patru
Macroregiunea
patru
Prahova
Teleorman
Ilfov
Municipiul
Bucuresti
Dolj
Gorj
Mehedinti
Olt
Valcea
Arad
CarasSeverin
Hunedoara
Timis
Distributia judetelor din Romania dupa suprafata fondului cultivat de livezi in anul
2015.
Suprafata cultivata
Mean
Standard Error
Median
Mode
Standard
Deviation
Sample Variance
3297,666
667
620,9821
682
1799,5
#N/A
4024,424
411
1619599
1,84
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
Confidence
Level(95,0%)
8,392732
994
2,505867
826
21040
14
21054
138502
42
1254,098
931
Media
Mediile sunt mrimi statistice care exprim, n mod sintetic i generalizant, ceea ce este
normal, esenial, tipic pentru unitaile unei colectivitai distribuite dup o anumit caracteristic
x =
x 1 + x 2+ + xn 1 n
= xi
n
n i=1
Mediana
Mediana reprezint acea valoare a caracteristicii unei serii ordonate, cresctor sau
descresctor, pn la care i peste care sunt distribuite n numr egal unitaile colectivitaii
observate.
Me
U =
n
2
Me
sau
U =
n+1
, n>100
2
Modul
Modul reprezint valoarea caracteristicii cea mai frecvent ntlnit ntr-o distribuie, adic
valoarea ce corespunde frecvenei dominante.
( xi x ) ni
i=1
= 2
ni
i=1
Suprafata fondului cultivat de livezi din judeele ROMNIEI, variaz n medie faa de
nivelul mediu cu 4024,424411 mii hectare
Variana (dispersia)
Variana reprezint media aritmetic a ptratelor valorilor abaterilor individuale fa de
media lor.
(xi x )ni
= i=1
ni
i=1
2
2
4
4
n
(xi x )m ni
m= i=1
ni
moment centrat.
i=1
1= 33
2
Amplitudinea varianei
Coeficientul de variaie
Coeficientul de variaie se calculeaz ca raport procentual ntre abaterea medie patratic
i media aritmetic.
v = 100
x
HISTOGRAMA
Bin
4500
1050
0
1600
0
2100
0
More
Freque
ncy
31
9
1
0
1
Histogram
40
30
Frequency
20
Frequency
10
0
4500
10500
16000
Bin
21000
More
Judet
e
13
29
42
Numar judete
Microregiunea unu
Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
Confidence
Level(95,0%)
2823,4166
67
662,32425
29
2589
#N/A
2294,3585
14
5264080,9
92
0,0827388
05
0,9709280
94
6840
569
7409
33881
12
1457,7658
52
Media
Distribuia judeelor din Romnia dup suprafata fondului cultivat de livezi pe macroregiunea doi in anul 2015
Media
Distribuia judeelor din Romnia dup suprafata fondului cultivat de livezi pe macroregiunea trei in anul 2015
Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
4603,333
333
2474,264
066
323
#N/A
7422,792
197
55097844
2,265590
197
1,675995
38
21040
14
21054
Sum
Count
Confidence
Level(95,0%)
41430
9
5705,663
167
Media
Distribuia judeelor din Romnia dup suprafata fondului cultivat de livezi pe macroregiunea patru in anul 2015
Macroregiune
Macroregiunea
patru
Macroregiunea
patru
Macroregiunea
patru
Macroregiunea
patru
Macroregiunea
patru
Macroregiunea
patru
Macroregiunea
patru
Macroregiunea
patru
Macroregiunea
patru
Judet
Dolj
Gorj
Mehedin
ti
Olt
Valcea
Arad
CarasSeverin
Hunedoa
ra
Timis
Suprafata
cultivata
Nivelul suprafetei
cultivate
1257
4819
6300
2944
10166
1513
6774
975
1977
Microregiunea patru
Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
Confidence
Level(95,0%)
4080,555
556
1052,011
95
2944
#N/A
3156,035
849
9960562,
278
0,063013
696
0,900152
859
9191
975
10166
36725
9
2425,943
906
Media
2.4
6177,9
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
Minimum
Maximum
Sum
Count
Confidence
Level(95,0%)
1957,0070
09
4715
#N/A
6188,5995
45
38298764,
32
3,4418885
45
1,7131068
66
20953
101
21054
61779
10
4427,0574
22
[ x ^ ] ,unde ^=t / 2
s'
n
t/2;n-1=t0,05/2;9=t0,025;9=2,262
IC pentru : [6177,9 2,262
4427,13]=[1750,77;10605,03]
Interpretare rezultat:
6188,59
10 ]=[6177,9
1.
Pentru estimarea proporiei judeelor care au o suprafata fondului cultivat de livezi mai mic
dect nivelul mediu nregistrat la nivel naional, egal cu 155,678 mii hectare se calculeaz
proporia acestora la nivelul eantionului, astfel:
p=
m
3
p= =0,3
n
10
Considernd un risc de 0.05 sau 5%, se citete valoarea teoretic a statisticii t Student, astfel:
t /2 ;n1=t 0,05 /2 ;101=t 0,025; 9=2,262
Intervalul de ncredere pentru proporie este;
0,3 2,262
0,3 ( 10,3 )
10
][
= 0,3 2,262
0,45
=[ 0,3 0,144 ] [0,156 ; 0,444 ]
10
Interpretare rezultat:
Suprafata cultivata
Mean
Standard Error
Median
Mode
Standard Deviation
Sample Variance
Kurtosis
Skewness
Range
6177,9
1957,0070
09
4715
#N/A
6188,5995
45
38298764,
32
3,4418885
45
1,7131068
66
20953
Minimum
Maximum
Sum
Count
Confidence
Level(95,0%)
101
21054
61779
10
4427,0574
22
Testarea mediei
Etapele testrii:
1
Formularea ipotezelor
H 0 : =0
H 1 : 0
0=3352,85
2
x 0
s'
n
Alegerea unui prag de semnificaie
t
=t
=t
=t
=2.262
Alegem =5 ; teoretic / 2 ;n1 0.5/ 2 ;101 0.025 ;9
4
t calculat=
5
x 0
3297,663352,85
55,19
t calculat =
t caculat =
=0,0433
1272,74
s '/ n
4024,42/ 10
Decizie i interpretare
t teoretic =2.262
t calculat=0,0433
|t calc|<t /2 se accepta H 0
Interpretare:
Testarea proporiei
Formularea ipotezelor
H 0 : = 0
H0: 0
0=0,5336
2
p 0
p(1p)/ n
Alegem
4
2,262
p 0
0,30,5336
0,2336
=
=
=1,622
p(1 p)/ n 0,3 (10,3)/ 10 0,144
t calculat=
Decizie i interpretare
t teoretic =2,262
t calculat=1,622
Macroregiune
Macroregiunea
unu
Macroregiunea
unu
Macroregiunea
doi
Macroregiunea
doi
Judet
Suprafata
cultivata
Bihor
BistritaNasaud
Iasi
Nivelul suprafetei
cultivate
4005
7409
4611
Bacau
795
Mean
Variance
Observations
Pooled Variance
Hypothesized Mean Difference
df
t Stat
P(T<=t) one-tail
t Critical one-tail
P(T<=t) two-tail
t Critical two-tail
Variabila 1
4205
7366184
4
14560048
0
5
-0,532539611
0,308579595
2,015048373
0,617159191
2,570581836
Variabila 2
5757
25350844
3
Etapele testarii:
1
Formularea ipotezelor
H 0 : 1=2
H 0: 1 2
2
x1 x2
s ' 21 s ' 22
+
n 1 n2
Alegerea unui prag de semnificaie al testului i citirea valorii critice din tabel
=5 ; t teoretic=t /2 ;n +n 2=t 0,5/2 ;72=t 0,025 ;5=2.571
Alegem
4
t calculat=
x 1x 2
s '21 s' 22
+
n 1 n2
42055757
=0,765
7366184 25350844
+
4
3
Decizie i interpretare
t teoretic = 2,571
t calculat=0,765
2.5.3 Testarea ipotezelor asupra a trei sau mai multe eantioane independente
Analiza dispersional ANOVA const n descompunerea variaiei totale a unui ansamblu de date,
nregistrate pentru o variabil x, n componente definite dup sursa variaiei i compararea
acestora pentru a stabili dac factorii considerai cauz au influen semnificativ asupra
variabilei x.
Macroregiune
Macroregiunea
doi
Macroregiunea
doi
Macroregiunea
doi
Judet
Bacau
Botosani
Iasi
Nivelul
suprafetei
cultivate
mai mic decat
795 media
mai mic decat
2416 media
mai mare decat
4611 media
Suprafata
cultivata
4005
795
21054
7409
2416
101
1028
4611
6544
ANOVA
Source of
Variation
Within Groups
SS
7867313
7,39
2515469
22,2
Total
3302200
59,6
Between Groups
Etapele testrii:
1
Formularea ipotezelor
H 0 : 1=2==9
Count
df
2
6
Sum
18986
7822
21155
MS
39336
569
41924
487
Averag
e
4746,5
2607,3
33
10577,
5
Variance
8232325
,67
3667920
,33
2195141
05
PF
value
0,93827 0,4420
191
25
F crit
5,1432
53
H 0 : 1 j i j, i , j=1,9
2
Pentru verificarea ipotezei nule, in ANOVA se folosete statistica test F (raportul Fisher),
calculat ca raport ntre doi estimatori ai varianei:
F=
ESS / k1
RSS / nk
ESS= (x j x )
i=1
RSS= ( xij x j )2
i=1 j=1
Variaia total
n
TSS= (x ix )
en
3
Alegem
, 2
=F 0.05,6,2=5,14
Fcalculat =
5
=0,938
RSS/nk RSS k 1
Stabilirea regulilor de decizi
Fcal c F ,
6
, 2
: se accept H 0
Decizie i interpretare
F , , =5,14
1
Fcalculat =0,938
Fcalc F , , : seaccepta H 0
1
Interpretare:
perioad de 7 ani. Seriile de timp, de intervale descriu nivelul unui fenomen n diferite intervale
de timp, cum este i cazul distribuiei suprafetei fondului cultivat de livezi la nivelul rii, pe o
perioada de 7 ani.
Anul
2008
2009
2010
2011
2012
2013
2014
yt
t /0
t / t 1
it /0
it / t 1
%
2009
3553,97
3459,33
2010
3448,67
2011
3334,47
2008
1
2
-94,64
-94,64
-105,3
-10,66
-219,5
-114,2
0,970371
162
0,970371
162
0,938238
083
0,973370
625
0,996918
478
0,966885
785
2012
3386,71
2013
3510,35
2014
3352,85
TOTAL
24046,35
-167,26
52,24
-43,62
123,64
-201,12
-157,5
-201,12
0,952937
138
0,987726
402
0,943409
764
-
1,015666
658
1,036507
407
0,955132
679
-
yt
Volumul absolut
n cazul seriilor de timp de intervale, volumul absolut se obine prin nsumarea nivelurilor
absolute.
n
Interpretare: Suprafata fondului forestier total n perioada 20082014 a fost de 24046,35mii hectare .
Sporul absolut
Modificarea absolut (creterea sau decresterea absolut) arat cu ct s-a modificat un
fenomen ntr-o perioad, fa de o alt perioad considerat baz de comparare.
- cu baza fixa -se calculeaz ca diferen ntre oricare termen al seriei i termenul iniial
t /0 yt y0
considerm ca baz valoarea suprafetei fondului forestier din anul
2008,
y 0=
6/ 0= y 6 y 0=3510,353553,97= -43,62
Interpretare:
t / t 1 yt yt 1
4 /3= y 4 y 3=3334,473447,67= -113,2
Interpretare:
it /0
yt
x100
y0
- cu baz fix:
i 6/ 0=
3510,36
=0,98
3553,97
Interpretare:
it / t 1
- cu baz n lan:
yt
x100
yt 1
i 5/ 4=
3386,71
=1,0 1
3334,47
Interpretare:
Rata sporului
Rata de cretere arat cu ct s-a modificat, n mrime relativ, nivelul fenomenului n
perioada raportat fa de nivelul din perioada de raportare.
- cu baz fix:
rt /0
t /0
y y
x100 t 0 x100 it /0 1 x100
y0
y0
r 5 /0=
3386,713553,97
=0,04
3553,97
Interpretare:
- cu baz n lan:
rt / t 1
t /t 1
y y
x100 t t 1 x100 it / t 1 1 x100
yt 1
yt 1
r 3 /2=
3448,673459,33
=0,003
3459,33
Interpretare:
Interpretare:
Sporul mediu
y t = 24046,35 =3435,19
n
n/ 0 = y n y 0 = 3352,853553,97 =33,52
=
.
n1
n1
71
Interpretare:
i n 1
yn
y0
i= 6 3352,85 = 6 0,94=0,99
3553,97
Interpretare:
4. Concluzii
Scopul acestei lucrri practice a fost cel de realizare a unor cercetri asupra suprafetei
fondului cultivat de livezi i nivelul acesteia. n urma prelucrarii datelor culese de pe Institutul
Naional de Statistic a Romniei, s-a ajuns la urmatoarele cteva concluzii: Media suprafetei
fondului cultivat de livezi era de 3553,97 mii hectare ,avea o distribuie asimetric la dreapta,
macroregiunile nu influenau suprafata fondului cultivat de livezi de pe teritoriul rii, iar datele
nregistrate n acele 7 perioade ne arat c n perioada 2008-2014 aveam o scadere a suprafetei
fondului cultivat de livezi cu 1%. Majoritatea calculelor i analizelor au fost realizate cu ajutorul
programului de calcul tabelar Excel din pachetul Microsoft Office.
Bibliografie
Jaba, Elisabeta, Statistica , ed. a3-a rev., Bucureti, Editura Economic, 2002
Jaba,Elisabeta, Pintilescu, Statistic.Teste gril si probleme , ed. a2-a rev., Iai, Editura Sedcom
Libris,2007
Andrei,T.,Statistic si econometrie, Ed.Economic,2003.
www.insse.ro , Institutul National de Statistica