Documente Academic
Documente Profesional
Documente Cultură
PROIECT
PRACTICĂ ÎN STATISTICĂ
IAŞI,2017
Obiectivul proiectului
Analiza statistică, folosind metode descriptive şi inferenţiale, a unei serii de date înregistrate la
un moment dat şi analiza statistică descriptivă a unei serii de timp.
Proiectul de practică a fost realizat pe baza datelor reale din: statistica oficială BAZA DE DATE
TEMPO ONLINE
Structura proiectului
1. Introducere
Se va enunţa obiectivul specific al cercetarii
4 Concluzii
Bibliografie
1.Introducere
Statistica este, conform definitiei date de matematicianul roman Grigore Constantin Moisil
(1906-1973), „mijlocul cel mai puternic de cercetare a faptelor sociale”, iar Herbert George
Wells (1866-1946), un celebru scriitor englez, spunea despre aceasta: „Intr-o zi gandirea
statistica va fi la fel de necesara, oricarui cetatean folositor societatii, ca si scrisul si cititul.”.
Principalul obiectiv urmarit in cadrul acestui proiect este redarea anumitor informatii din
domeniul educatiei, din Anuarul statistic al Romaniei, cu scopul evidentierii legaturilor statistice
intre variabile , acestea din urma reprezentand insusiri, trasaturi esentiale purtate de unitatile
statistice ale unei colectivitati. Scopul acestei lucrari este de a realiza o cercetare asupra
resurselor de muncă existente pe macroregiuni, regiuni de dezvoltare din fiecare judet, dar si a
nivelului acesteia.. Rezultatul numeric al numararii, al masurarii statistice a fenomenelor si
proceselor de masa sau al calculelor asupra datelor obtinute prin inregistrarea statistica poarta
denumirea de indicator statistic. Dupa modul de determinare, indicatorii statistici pot fi primari
sau derivati, dupa gradul de cuprindere acestia se clasifica in indicatori statistici sintetici si
indicatori statistici analitici, iar dupaforma de exprimare, ei pot fi sub forma de marimi absolute,
relative sau medii. Indicatorii statistici au un continut real, adica reflecta fenomene si procese
concrete.
Mean 297,1690476
Standard Error 27,93106798
Median 254,15
Mode 205,8
Standard 181,014009
Deviation
Sample Variance 32766,07146
Kurtosis 17,29302884
Skewness 3,537117145
Range 1106,9
Minimum 127,1
Maximum 1234
Sum 12481,1
Count 42
Media
Mediile sunt mărimi statistice care exprimă, în mod sintetic şi generalizant, ceea ce este
normal, esenţial, tipic pentru unitaţile unei colectivitaţi distribuite după o anumită caracteristică.
x 1+ x 2 +⋯+ xn 1 n
x́= = ∑ xi = 297,1690476
n n i=1
În medie, resursele de munca existente sunt de 297 mii persoane in fiecare judeţ al Romaniei,
conform datelor culese.
Mediana
Mediana reprezintă acea valoare a caracteristicii unei serii ordonate, crescător sau
descrescător, până la care şi peste care sunt distribuite în număr egal unitaţile colectivitaţii
observate.
n+ 1
U Me = =254,15 ,n< 100
2
Jumătate dintre judeţele României au resurse de munca până în 254,15 mii persoane, iar
jumătate au peste 254,15 mii persoane .
Modulul
Modul reprezintă valoarea caracteristicii cea mai frecvent întâlnită într-o distribuţie,
adică valoarea ce corespunde frecvenţei dominante.
Mo=205,8
σ=
√ ∑ ( x i− x́) ni
i=1
n
∑ ni
i=1
=√ σ 2=181,014009
Resursele de munca in functiune din judeţele Romaniei, variază în medie faţa de nivelul mediu
cu 181,014009 mii persoane.
Varianţa (dispersia)
Varianţa reprezintă media aritmetică a pătratelor valorilor abaterilor individuale faţă de
media lor.
∑ ( x i−x́) ni
σ = i=1
2
n =32766,07146
∑ ni
i=1
μ4 μ4
β 2= =
μ22 σ 4
n
∑ ( x i−x́)❑mni
μm = i=1 n moment centrat.
∑ ni
i=1
μ 23
β 1=
μ 32
15
Sursă: http://www.insse.ro/cms/ Frequency
10
5
0 Histograma
250 500 750 1000 1250 More
Bin
Bin Frequency
250 19
500 21
750 1
1000 0
1250 1
More 0
Figura 1: Distribuția județelor din România după resursele de muncă în funcțiune din anul 2015,
grupată pe 5 intervale
2.2.2 Analiza statistică univariată a variabilei calitative
64%
Figura 2: Distribuția județelor din România după nivelul resurselor de muncă în funcțiune
din anul 2015.
Analizând graficul de mai sus se observă că nivelul resurselor de muncă în functiune din
anul 2015 cu un nivel mai mic decat valoarea de 300 mii persoane are un procentaj de 64%, iar
pe partea opusă având un nivel mai mare decât aceeași valoare, procentajul fiind mai mic adică
de 36%
Unități Resurse
de Macroregiune Județ de Nivelul resurselor de muncă
eșantion muncă
20 MACROREGIUNEA DOI Buzău 258,4 mai mic decât 300 mii persoane
22 MACROREGIUNEA DOI Galați 330,4 mai mare decât 300 mii persoane
35 MACROREGIUNEA PATRU Gorj 211,5 mai mic decât 300 mii persoane
30 MACROREGIUNEA TREI Prahova 463,7 mai mare decât 300 mii persoane
34 MACROREGIUNEA PATRU Dolj 406,7 mai mare decât 300 mii persoane
17 MACROREGIUNEA DOI Suceava 381,1 mai mare decât 300 mii persoane
25 MACROREGIUNEA TREI Argeș 373,8 mai mare decât 300 mii persoane
39 MACROREGIUNEA PATRU Arad 268,3 mai mic decât 300 mii persoane
6 MACROREGIUNEA UNU Sălaj 132,2 mai mic decât 300 mii persoane
4 MACROREGIUNEA UNU Maramure 296,9 mai mic decât 300 mii persoane
ș
Mean 312,3
Standard Error 31,33185103
Median 313,65
Mode #N/A
Standard Deviation 99,08001256
Sample Variance 9816,848889
Kurtosis -0,241866025
Skewness -0,319219688
Range 331,5
Minimum 132,2
Maximum 463,7
Sum 3123
Count 10
Confidence 70,87757123
Level(95,0%)
Sursă: programul excel
s'
[ x́ ± ∆ ^μ ] , unde ∆ ^μ=t α / 2 ∙
√n
Considerând un risc de 0.05, intervalul de încredere pentru media populaţiei este:
tα/2;n-1=t0,05/2;9=t0,025;9=2,262
99,08
IC pentru µ : [312,3 ± 2,262 * ] = [312,3 ± 70,874 ] = [241,426; 383,174]
√ 10
2. Estimarea proporţiei prin interval de încredere:
√ p (1−p )
[ p±tα ∙
2 √n ]
Pentru proportia resurselor de munca cu o valoare mai mica decat 300 mii personae:
m 5
p 1= → p= =0,5
n 10
Tabel 7: Determinarea indicatorilor statistici descriptivi pentru eșantionul extras (preluat din
programul excel)
Mean 312,3
Standard Error 31,33185103
Median 313,65
Mode #N/A
Standard Deviation 99,08001256
Sample Variance 9816,848889
Kurtosis -0,241866025
Skewness -0,319219688
Range 331,5
Minimum 132,2
Maximum 463,7
Sum 3123
Count 10
Confidence 70,87757123
Level(95,0%)
Sursă: programul excel
a) Testarea mediei
Se verifica dacă există diferenţe semnificative între resursele de munca in functiune la nivelul
eşantionului şi resursele de munca in functiune la nivelul întregii ţarii din anul 2015 egala cu 380
mii persoane.
Etapele testarii
1) Formularea ipotezelor
H 0 :μ=μ0
H 1 : μ ≠ μ0
Alegemα =5 %;
x́ −μ 0
¿
Deoareace n¿ 10(¿ 30) volumul eşantionului, vom alege statistica t s'
√n
4) Regula de decizie
5) Decizia
b) Testarea proportiei
Etapele testarii:
1) Formularea ipotezelor
H 0 :π =π 0
H 0 :π ≠ π 0
π 0=0,614
p−π 0
t=
√ p( 1− p)/ √n
p−π 0 0,5−0,614 −0,114
t calculat = = = =−0,7206
√ p(1−p)/ √ n √ 0,5(1−0,5)/ √ 10 0,1582
4) Regula de decizie
5) Decizia
t teoretic=t α /2 ;n−1=t 0,5;10−9=t 0,025; 9=¿2,262
|t calc|=|−0,7206|≤t α / 2; n−1=2,262, se accepta H 0
Cu o probabilitate de 95%, se poate afirma că nu exista diferenţe semnificative între ponderea
resurselor de munca in functiune mai mare decât media acesteia şi ponderea resurselor de munca
in functiune la nivelul tuturor judeţelor României in anul 2015.
Resurse
Macroregiune Unități de eșantion Județ de Nivelul resurselor de munca
muncă
MACROREGIUNEA 20 Buzău 258,4 mai mic decât 300 mii
DOI persoane
MACROREGIUNEA 22 Galați 330,4 mai mare decât 300 mii
DOI persoane
MACROREGIUNEA 17 Suceava 381,1 mai mare decât 300 mii
DOI persoane
Resurse
Macroregiune Unități de eșantion Județ de Nivelul resurselor de munca
muncă
MACROREGIUNEA 35 Gorj 211,5 mai mic decât 300 mii
PATRU persoane
MACROREGIUNEA 34 Variable Variable 2
Dolj 406,7 mai mare decât 300 mii
PATRU 1 persoane
Mean
MACROREGIUNEA 39 323,3 295,5
Arad 268,3 mai mic decât 300 mii
Variance
PATRU 3801,63 10080,64 persoane
Observations 3 3
Pooled Variance 6941,135
Hypothesized Mean Difference 0 Tabelul nr 10: Rezultatele
df 4 obținute cu ajutorul
t Stat 0,408672279 programului excel pentru cele
P(T<=t) one-tail 0,351856445 doua eșantioane
t Critical one-tail 2,131846786
P(T<=t) two-tail 0,70371289
t Critical two-tail 2,776445105
Sursa: programul excel
Etapele testarii:
1) Formularea ipotezelor
H 0 :μ 1=μ2
H 0 :μ 1 ≠ μ2
x́ 1−x́ 2
t=
s ' 21 s ' 22
√ n1 n2
+
4) Regula de decizie
5) Decizia
2.4.3 Testarea ipotezelor asupra a trei sau mai multe eşantioane independente
Tabelele nr. 11, 12, 13: Extragerea din eșantionul format din 10 județe a trei eșantioane
independente
Total 55981,62875 7
Etapele testării:
1) Formularea ipotezelor
H 0 :μ 1=μ2=μ3
14654,04375/ 2
F= = 0,88
41327,585/5
4) Regula de decizie
Daca F calc > F α ,k−1 ,n−k :cu o probabilitate de 1−α se respinge H 0 , se accepta H 1
5) Decizia
Din tabel, se observă că P-value =0,85 este mai mare ca α=0,05 , rezultând, deasemenea, decizia
de acceptare a ipotezei nule.
Tabelul nr. 16: Distribuţia resurselor de muncă în funțtiune din România, în perioada 2009-2015
Sursă: http://www.insse.ro/cms/
Anul t
2009 13875,9 1 0 0 0 0
2010 14047,6 2 171,7 171,7 1,012373972 1,012373972
2011 14047,7 3 171,8 0,1 1,012381179 1,000007119
2012 14033,7 4 157,8 -14 1,011372235 0,999003396
2013 13997,9 5 122 -35,8 1,008792222 0,997448998
2014 12597,7 6 -1278,2 -1400 0,907883453 0,89997071
2015 12481,1 7 -1394,8 -116,6 0,899480394 0,990744342
Studierea seriilor cronologice presupune caracterizarea variaţiei în timp a unui fenomen, prin
măsurarea creşterilor sau deşcresterilor de nivel
1) Nivelul absolut
y 1=¿ 13875,9
Interpretare: Resursele de munca in functiune au fost în anul 2009 de 13875,9 mii persoane.
2) Volumul absolut
y=95091,6
Arată cu cât s-a modificat un fenomen într-o perioadă, faţă de o altă perioadă considerată bază de
comparare.
-cu baza fixa: se calculează ca diferenţă între oricare termen al seriei şi termenul iniţial
t /0 yt y0
Unde y 0= 13875,9
∆ 3/ 0= y 3− y 0=14047,7−¿13875,9¿171,8
Interpretare: Resursele de munca in functiune au crescut în anul 2011 cu 171,8 faţă de anul
2010.
t / t 1 yt yt 1
∆ 4 /3= y 4− y 3 =¿14033,7-14047,7= - 14
Arata de cate ori sa modificat nivelul unui fenomen intr.o anumita perioada fata de
nivelul aceluiasi fenomen dintr.o alta perioada,considerata ca baza
yt
it /0 x100
- cu bază fixă: y0
14033,7
i 4 /0 = =1,011
13875,9
Interpretare: Resursele de munca in functiune au crescut de 1,011 ori în anul 2012 faţă de
anul 2009.
yt
it / t 1 x100
- cu bază în lanţ: yt 1
13997,9
i 5/ 4 = =0,997
14033,7
Interpretare: Resurselor de munca au crescut de 0,997 ori în anul 2013 faţă de anul 2012
2) Ritmul sporului
Arată cu cât s-a modificat, în mărime relativă, nivelul fenomenului în perioada raportată faţă de
nivelul din perioada de raportare.
- cu bază fixă:
t /0 y y
rt /0 x100 t 0 x100 it /0 1 x100
y0 y0
122
r 5 /0 = =¿ 0,00879
13875,9
Interpretare: Resursele de munca in functiune a scazut în anul 2013 cu 8,79% faţă de anul 2009.
- cu bază în lanţ:
t / t 1 y y
rt / t 1 x100 t t 1 x100 it / t 1 1 x100
yt 1 yt 1
0,1
r 3 /2= =0,000
14047,6
Interpretare: Resursele de munca in functiune au ramas constante in anul 2011 fata de anul
2010.
ý=
∑ y t = 95091,6 =¿1358,51
n 7
2) Sporul mediu
yn
i n 1
y0
12481,1 6
í=
√
6
13875,9
= √0,899 NU STIUUU
Interpretare:.
ŕ =í−1=¿
Interpretare:
4,Concluzii
Scopul acestei lucrări practice a fost cel de realizare a unor cercetări asupra resurselor de munca
in functiune şi nivelul acestora
În urma prelucrarii datelor culese de pe Institutul Naţional de Statistică a României, s-a ajuns la
urmatoarele câteva concluzii: Media este de 297,1690476 ,are o distribuţie asimetrică la dreapta,
macroregiunile nu influenţează resursele de munca in functiune de pe teritoriul ţării, iar datele
înregistrate în acele 7 perioade ne arată că în perioada 2009-2015 avem o !!!!!!!!! a resurselor
de munca in functiune cu aproximativ !!!!!!!!!.
5. Bibliografie
Jaba, Elisabeta, Statistica , ed. a3-a rev., Bucureşti, Editura Economică, 2002