Documente Academic
Documente Profesional
Documente Cultură
Proiect
Proiect
Coordonatori:
Conf. univ. dr. Danut Jemna
Lect. univ. dr. Dana Viorica
Studenta:
Ciridariu Andreea-Catalina
Anul I, Stiinte Economice
Grupa 1315
IASI, 2012
Structura proiectului
1. Introducere
Se va enunta obiectivul specific al cercetarii.
2. Analiza statistica a unei serii de date inregistrate la un moment dat
2.1 Alegerea variabilelor statistice
Se vor identifica patru variabile statistice, doua variabile cantitative si doua variabile
calitative.
Datele vor fi introduse in Excel.
2.2 Analiza statistica univariata a variabilelor statistice
2.2.1 Analiza statistica univariata a variabilelor cantitative
2.2.2 Analiza statistica univariata a variabilelor calitative
2.3 Analiza statistica bivariata a varibilelor statistice
2.3.1 Analiza statistica bivariata pentru doua variabile cantitative
2.3.2 Analiza statistica bivariata pentru doua variabile calitative
2.4 Estimarea prin interval de incredere a mediei
2.5 Testarea statistica
2.5.1 Testarea ipotezelor asupra unui esantion
2.5.2 Testarea ipotezelor asupra a doua esantioane independente
2.5.3 Testarea ipotezelor asupra a trei si mai multe esantioane independente
3. Analiza statistica descriptiva a unei serii de timp
3.1 Alegerea variabilei statistice
Se va alege o variabila cantitativa, pentru care se vor inregistra valorile pentru 10 perioade de timp
(ani, semestre, trimestre, luni sau zile).
3.2 Analiza statistica folosind indici statistici simpli
3.2.1 Indici absoluti
3.2.2 Indici relativi
3.2.3 Indici exprimati prin valori medii
4. Concluzii
Bibliografie
1. Introducere
Statistica este, conform definitiei date de matematicianul roman Grigore Constantin Moisil (1906-
1973), mijlocul cel mai puternic de cercetare a faptelor sociale, iar Herbert George Wells (1866-
1946), un celebru scriitor englez, spunea despre aceasta: Intr-o zi gandirea statistica va fi la fel de
necesara, oricarui cetatean folositor societatii, ca si scrisul si cititul..
Principalul obiectiv urmarit in cadrul acestui proiect este redarea anumitor informatii din domeniul
educatiei, din Anuarul statistic 2010 al Romaniei, cu scopul evidentierii legaturilor statistice intre
variabile , acestea din urma reprezentand insusiri, trasaturi esentiale purtate de unitatile statistice
ale unei colectivitati.
Scopul acestei lucrari este de a realiza o cercetare asupra facultatilor si studentilor din fiecare judet,
dar si asupra absolventilor pe nivel de invatamant.
Rezultatul numeric al numararii, al masurarii statistice a fenomenelor si proceselor de masa sau al
calculelor asupra datelor obtinute prin inregistrarea statistica poarta denumirea de indicator statistic.
Dupa modul de determinare, indicatorii statistici pot fi primari sau derivati, dupa gradul de
cuprindere acestia se clasifica in indicatori statistici sintetici si indicatori statistici analitici, iar dupa
forma de exprimare, ei pot fi sub forma de marimi absolute, relative sau medii. Indicatorii statistici au
un continut real, adica reflecta fenomene si procese concrete.
2. Analiza statistica a unei serii de date inregistrate la un
moment dat
2.1 Alegerea variabilelor statistice
In sprijinul cercetarii am ales distributia judetelor Romaniei, inclusiv Municipiul Bucuresti, dupa
numarul facultatilor si numarul studentilor inscrisi (cele doua variabile cantitative) si distributia
absolventilor din Romania dupa sex si dupa nivelul de educatie (cele doua variabile calitative).
2.2 Analiza statistica univariata a variabilelor statistice
2.2.1 Analiza statistica univariata a variabilelor cantitative
Distributia judetelor din Romania dupa numarul de facultati, in anul universitar 2009-2010
Nr. Crt Judet Facultati
1 Alba 9
2 Arad 25
3 Arges 16
4 Bacau 9
5 Bihor 25
6 Bistrita-Nasaud 3
7 Botosani 1
8 Braila 3
9 Brasov 23
10 Bucuresti 165
11 Buzau 1
12 Calarasi 1
13 Caras-Severin 2
14 Cluj 50
15 Constanta 29
16 Covasna 2
17 Dambovita 10
18 Dolj 23
19 Galati 19
20 Giurgiu 0
21 Gorj 7
22 Harghita 4
23 Hunedoara 5
24 Ialomita 2
25 Iasi 51
26 Ilfov 1
27 Maramures 11
28 Mehedinti 5
29 Mures 16
30 Neamt 4
31 Olt 2
32 Prahova 5
33 Salaj 2
34 Satu Mare 6
35 Sibiu 21
36 Suceava 10
37 Teleorman 3
38 Timis 47
39 Tulcea 0
40 Valcea 5
41 Vaslui 0
42 Vrancea 1
Descriptive Statistics
Mean 14,85714286
Median 5
Mode 1
Standard Deviation 27,26524763
Sample Variance 743,3937282
Kurtosis 22,98669017
Skewness 4,381519106
Range 165
Minimum 0
Maximum 165
Sum 624
Count 42
Media
Mediile sunt marimi statistice care exprima, in mod sintetic si generalizant, ceea ce este normal,
esential, tipic pentru unitatile unei colectivitati distribuite dupa o anumita caracteristica.
In medie, aproximativ 15 facultati sunt distribuite in fiecare judet al Romaniei, conform datelor
culese din Anuarul statistic 2010.
Mediana
Mediana reprezinta acea valoare a caracteristicii unei serii ordonate, crescator sau descrescator,
pana la care si peste care sunt distribuite in numar egal unitatile colectivitatii observate.
sau
, n<100
50% dintre judetele Romaniei au pana in 5 facultati inclusiv, iar 50% au peste 5 facultati inclusiv.
Modul
Modul reprezinta valoarea caracteristicii cea mai frecvent intalnita intr-o distributie, adica valoarea
ce corespunde frecventei dominante.
Cel mai frecvent, numarul facultatilor din Romania, distribuite pe judet, este egal cu 1.
Deviatia standard (abaterea medie patratica)
Deviatia standard reprezinta media patratica a abaterilor individuale.
(
In medie, numarul de facultati distribuite pe judete se abate de la medie cu 27,26.
Varianta (dispersia)
Varianta reprezinta media aritmetica a patratelor valorilor abaterilor individuale fata de media lor.
Coeficientul de boltire Pearson
Coeficientul de boltire masoara excesul fata de boltirea unei distributii normale Gauss-Laplace.
moment centrat
Distributia judetelor dupa numarul de facultati este leptocurtica, deoarece coeficientul de boltire
Pearson depaseste valoarea 3, iar astfel curba frecventelor prezinta boltire in jurul valorii medii.
Coeficientul de asimetrie Pearson
Indicatorii de asimetrie dau informatii asupra modului de repartizare a frecventelor de o parte sau
alta a valorii centrale a unei serii, asimetria reprezentand deviatia de la forma simetrica de
distribuitie.
Coeficientul de asimetrie Pearson are valoare pozitiva, de unde reiese faptul ca distributia facultatilor
pe judete este o distributie asimetrica.
Valoarea mediei depaseste valoarea medianei, care la randul ei este mai mare decat valoarea
modului, rezultand o asimetrie la dreapta.
Amplitudinea variantei
Amplitudinea variantei reprezinta diferenta dintre valoarea maxima si valoarea minima in care se
incadreaza numarul facultatilor distribuite pe judet.
Numarul minim de facultati distribuite pe judetele Romaniei este 0, in timp ce numarul maxim de
facultati este de 165, iar in total, pe teritoriul tarii s-au inregistrat ca fiind 624 facultati.
Coeficientul de variatie
Coeficientul de variatie se calculeaza ca raport procentual intre abaterea medie patratica si media
aritmetica.
183,56% , de unde rezulta ca media facultatilor pe judet este nereprezentativa.
Distributia judetelor din Romania dupa numarul de studenti inscrisi, in anul universitar 2009-2010
Nr. Crt Judet Studenti inscrisi
1 Alba 7259
2 Arad 19537
3 Arges 17982
4 Bacau 7468
5 Bihor 19182
6 Bistrita-Nasaud 1651
7 Botosani 293
8 Braila 1830
9 Brasov 58976
10 Bucuresti 285720
11 Buzau 224
12 Calarasi 467
13 Caras-Severin 3415
14 Cluj 60371
15 Constanta 36860
16 Covasna 870
17 Dambovita 8214
18 Dolj 35667
19 Galati 20117
20 Giurgiu 0
21 Gorj 5749
22 Harghita 1388
23 Hunedoara 5907
24 Ialomita 315
25 Iasi 58418
26 Ilfov 251
27 Maramures 5883
28 Mehedinti 2960
29 Mures 11682
30 Neamt 969
31 Olt 557
32 Prahova 8569
33 Salaj 428
34 Satu Mare 1939
35 Sibiu 24211
36 Suceava 9917
37 Teleorman 607
38 Timis 43265
39 Tulcea 0
40 Valcea 6060
41 Vaslui 0
42 Vrancea 141
Descriptive Statistics
Mean 18459,97619
Median 5816
Mode 0
Standard Deviation 45554,65417
Sample Variance 2075226516
Kurtosis 30,29080983
Skewness 5,20069816
Range 285720
Minimum 0
Maximum 285720
Sum 775319
Count 42
Media
In medie, aproximativ 18.460 de studenti au fost inscrisi in fiecare judet al Romaniei, conform datelor
culese din Anuarul statistic 2010.
Mediana
50% dintre judetele Romaniei au pana in 5.816 studenti inscrisi inclusiv, iar 50% au peste 5.816
studenti inscrisi inclusiv.
Modul
Cel mai frecvent, numarul studentilor inscrisi in Romania, distribuiti pe judet, este egal cu 0.
Deviatia standard
In medie, numarul de studenti inscrisi pe judete se abate de la medie cu aproximativ 45.554 .
Coeficientul de boltire Pearson
Distributia judetelor dupa numarul de studenti inscrisi este leptocurtica, deoarece coeficientul de
boltire Pearson depaseste valoarea 3, iar astfel curba frecventelor prezinta boltire in jurul valorii
medii.
Coeficientul de asimetrie Pearson
Coeficientul de asimetrie Pearson are valoare pozitiva, de unde reiese faptul ca distributia studentilor
inscrisi pe judete este o distributie asimetrica.
Valoarea mediei depaseste valoarea medianei, care la randul ei este mai mare decat valoarea
modului, rezultand o asimetrie la dreapta.
Numarul minim de studenti inscrisi pe judetele Romaniei este 0, in timp ce numarul maxim de
studenti inscrisi este de 285.720, iar in total, pe teritoriul tarii s-au inregistrat ca fiind inscrisi 775.319
studenti in anul universitar 2009-2010.
Coeficientul de variatie
246,77% , de unde rezulta ca media studentilor inscrisi pe judet este nereprezentativa.
2.2.2 Analiza statistica univariata a variabilelor calitative
Distributia absolventilor din Romania, in anul scolar / universitar 2008-2009, dupa sex
Sex Absolventi
Feminin 381.639
Masculin 357.793
TOTAL 739.432
52%
48%
Absolventi in anul
scolar/universitar 2008-2009
Feminin
Masculin
Distributia absolventilor din Romania, in anul scolar / universitar 2008-2009, dupa nivelul de
educatie
Nivelul educatiei Absolventi
Invatamant gimnazial 204.018
Invatamant liceal 202.113
Invatamant profesional si de ucenici 100.901
Invatamant postliceal si de maistri 17.574
Invatamant superior 214.826
2.3 Analiza statistica bivariata a varibilelor statistice
2.3.1 Analiza statistica bivariata pentru doua variabile cantitative
.0
50000.0
100000.0
150000.0
200000.0
250000.0
Invatamant gimnazial
Invatamant liceal
Invatamant profesional si
de ucenici
Invatamant postliceal si
de maistri
Invatamant superior
Distributia judetelor din Romania dupa numarul de facultati si dupa numarul de studenti inscrisi,
in anul universitar 2009-2010
Nr. Crt Judet Facultati Studenti inscrisi
1 Alba 9 7259
2 Arad 25 19537
3 Arges 16 17982
4 Bacau 9 7468
5 Bihor 25 19182
6 Bistrita-Nasaud 3 1651
7 Botosani 1 293
8 Braila 3 1830
9 Brasov 23 58976
10 Bucuresti 165 285720
11 Buzau 1 224
12 Calarasi 1 467
13 Caras-Severin 2 3415
14 Cluj 50 60371
15 Constanta 29 36860
16 Covasna 2 870
17 Dambovita 10 8214
18 Dolj 23 35667
19 Galati 19 20117
20 Giurgiu 0 0
21 Gorj 7 5749
22 Harghita 4 1388
23 Hunedoara 5 5907
24 Ialomita 2 315
25 Iasi 51 58418
26 Ilfov 1 251
27 Maramures 11 5883
28 Mehedinti 5 2960
29 Mures 16 11682
30 Neamt 4 969
31 Olt 2 557
32 Prahova 5 8569
33 Salaj 2 428
34 Satu Mare 6 1939
35 Sibiu 21 24211
36 Suceava 10 9917
37 Teleorman 3 607
38 Timis 47 43265
39 Tulcea 0 0
40 Valcea 5 6060
41 Vaslui 0 0
42 Vrancea 1 141
Coeficientul de corelatie Pearson
( )
)(
dispersia
-1 < r < 1
Coeficientul de corelatie Pearson este egal cu 0,978 , de unde rezulta ca exista o legatura directa
intre x (numarul de facultati) si y (numarul studentilor inscrisi), deoarece r>0, iar pentru ca r>0,7 si
tinde spre 1, x are o influenta pozitiva asupra lui y, existand o corelatie intre cele doua variabile
cantitative.
0
50000
100000
150000
200000
250000
300000
350000
0 20 40 60 80 100 120 140 160 180
Legatura dintre numarul de facultati si numarul de
studenti inscrisi, pe judete, in anul universitar 2009-2010
2.3.2 Analiza statistica bivariata pentru doua variabile calitative
Distributia absolventilor din Romania, in anul scolar / universitar 2008-2009, dupa sex si dupa
nivelul de educatie
Sex Invatamant
gimnazial
Invatamant
liceal
Invatamant
profesional si de
ucenici
Invatamant
postliceal si de
maistri
Invatamant
superior
Feminin 100346 103574 38303 11406 128010
Masculin 103672 98539 62598 6168 86816
TOTAL 204018 202113 100901 17574 214826
0
50000
100000
150000
200000
250000
Absolventi in anul scolar/universitar
2008-2009
Masculin
Feminin
2.4 Estimarea prin interval de incredere a mediei
Inferenta statistica permite trecerea de la o valoare statistica calculate pe baza datelor dintr-un
esantion, la valoarea adevarata necunoscuta.
Esantionul este un subansamblu de unitati extrase dintr-o colectivitate pe care dorim sa o
cunoastem, observarea fiind partial in cazul cand volumul esantionului este mai mic decat volumul
colectivitatii totale, aceasta din urma purtand numele si de populatie mama.
Estimarea reprezinta procedeul prin care se afla valoarea unui paramtru al populatiei, pe baza
datelor inregistrate la nivelul unui esantion extras din aceasta.
Estimatorul este statistica utilizata pentru a estima un parametru al populatiei.
Estimatia este valoarea unui estimator al unui parametru, si este calculate pe baza a n observatii
obtinute la nivelul esantionului, purtand si numele de valoare tipica de sondaj.
Estimarea prin interval de incredere inseamna aflarea limitelor de incredere ale unui interval care
acopera valoarea adevarata a unui parametru al populatiei, tinand seama de fluctuatiile distributiei
de selectie a estimatorului parametrului considerat.
O reprezentativitate satisfacatoare a esantionului pentru populatie presupune asumarea unui risc de
cel mult .
Din totalul judetelor Romaniei se extrage un esantion de volum mic n=21 de judete, care au fost
observate dupa numarul de facultati. Folosind procedeul esantionarii aleatoare mecanice cu pas de
numarare, rezulta fractia de selectie
253,
( )
]
Cu o incredere de 95%, se poate afirma ca numarul mediu de facultati la nivelul tuturor judetelor
Romaniei este acoperit de intervalul [ ].
2.5 Testarea statistica
2.5.1 Testarea ipotezelor asupra unui esantion
Ne propunem sa aflam, la nivelul aceluiasi esantion , daca numarul mediu de facultati este egal cu
valoarea numarului mediu de facultati din totalul judetelor Romaniei, si daca ponderea numarului de
facultati mai mare decat media acestora este egala cu ponderea numarului de facultati mai mare
decat media la nivelul tuturor judetelor.
a) Testarea mediei
Pentru aceleasi date de la problema estimarii prin interval de incredere a mediei, se cere sa se
verifice daca exista diferente semnificative intre numarul mediu de facultati la nivelul esantionului si
numarul mediu de facultati la nivelul intregii tarii, egal cu 14,85.
Etapele testarii:
1) Formularea ipotezelor
2) Alegerea statisticii test
Deoarece ( ) volumul esantionului, vom alege statistica t.
3) Alegerea unui prag de semnificatie pentru test
Alegem
4) Stabilirea regulilor de decizie
|
se respinge
se accepta
5) Calcularea valorii statisticii test
6) Aflarea valorii teoretice a statisticii test
7) Comparare, decizie si interpretare
|
2) Alegerea statisticii test
Deoarece ( ) volumul esantionului, vom alege statistica t.
( )
3) Alegerea unui prag de semnificatie pentru test
Alegem
4) Stabilirea regulilor de decizie
|
se respinge
se accepta
5) Calcularea valorii statisticii test
6) Aflarea valorii teoretice a statisticii test
7) Comparare, decizie si interpretare
|
iar
Etapele testarii:
1) Formularea ipotezelor
2) Alegerea statisticii test
Deoarece ( ) volumul esantionului, vom alege statistica t.
3) Alegerea unui prag de semnificatie pentru test
Alegem
4) Stabilirea regulilor de decizie
|
se respinge
se accepta
5) Calcularea valorii statisticii test
6) Aflarea valorii teoretice a statisticii test
7) Comparare, decizie si interpretare
|
2) Alegerea statisticii test
Pentru verificarea ipotezei nule, in ANOVA se foloseste statistica test F (raportul Fisher), calculat ca
raport intre doi estimatori ai variantei:
( )
grade de libertate
variatia intergrupe (masoara variatia mediilor grupelor fata de media lor) componenta efect
variatia totala
se respinge
se accepta
5) Calcularea valorii statisticii test
6) Aflarea valorii teoretice a statisticii test
7) Comparare, decizie si interpretare
14.677
Sporul absolut
Modificarea absoluta (cresterea sau descresterea absoluta) arata cu cat s-a modificat un fenomen
intr-o perioada, fata de o alta perioada considerata baza de comparare.
Sporul cu baza fixa se calculeaza ca diferenta intre oricare termen al seriei si termenul initial.
Sporul absolut cu baza fixa
0
12
21
30
46
43
54
60
80
271
Din tabel reiese faptul ca, fata de anul scolar 2000-2001, luat ca baza comparabila, in toti ceilalti s-a
inregistrat o crestere a numarului de licee la nivelul Romaniei.
Sporul cu baza mobila se calculeaza ca diferenta intre doi termeni consecutivi.
Sporul absolut cu baza in lant
-
12
9
9
16
-3
11
6
20
191
Din tabel se observa ca exista un singur spor negativ, calculat pentru perioada anilor scolari 2004-
2005, 2005-2006. De aici rezulta ca numarul de licee de pe teriroriul tarii a fost intr-o continua
crestere, dar de la anul scolar 2004-2005 la anul scolar 2005-2006 s-a inregistrat o scadere a
acestora, egala cu 3. Tot din tabel reiese faptul ca cea mai mare crestere inregistrata la nivelul tarii, a
fost in perioada anilor scolari 2008-2009 si 2009-2010, cu un numar de 191 de licee.
3.2.2 Indici relativi
Indicatorii relativi se obtin prin raportarea a doua nivele comparate si se exprima sub forma de
coeficient sau procente.
Ritmul de variatie
Indicele de variatie arata de cate ori a crescut sau a scazut nivelul unui fenomen intr-o anumita
perioada, fata de nivelul aceluiasi fenomen dintr-o alta perioada considerata ca baza.
Ritmul variatiei cu baza fixa :
Ritmul variatiei cu baza fixa
1
1,008535
1,014936
1,021337
1,032717
1,030583
1,038407
1,042674
1,056899
1,192745
In toti anii scolari, fata de cel luat ca baza comparabila 2000-2001, s-a inregistrat o crestere a
numarului de licee pe teritoriul Romaniei, cea mai mare crestere fiind in anul scolar 2009-2010.
Ritmul variatiei cu baza mobila :
Ritmul variatiei cu baza mobila
-
1,008535
1,006347
1,006307
1,011142
0,997934
1,007591
1,00411
1,013643
1,128533
Singura valoare mai mica decat 1 corespunde perioadei dintre anii scolari 2004-2005 si 2005-2006,
ceea ce inseamna ca atunci s-a inregistrat o scadere a numarului de licee la nivelul tarii.
Ritmul sporului
Rata de crestere arata cu cat s-a modificat, in marime relativa, nivelul fenomenului in perioada
raportata fata de nivelul din perioada de raportare.
Ritmul sporului cu baza fixa :
Ritmul sporului cu baza fixa
0
0,008535
0,014936
0,021337
0,032717
0,030583
0,038407
0,042674
0,056899
0,192745
Fata de anul scolar 2000-2001 luat ca baza de comparare, anul scolar 2009-2010 inregistreaza cea
mai mare rata de crestere a numarului de licee la nivelul Romaniei, de 19,27%.
Ritmul sporului cu baza mobila :
Ritmul sporului cu baza mobila
-
0,008535
0,006347
0,006307
0,011142
-0,00207
0,007591
0,00411
0,013643
0,128533
Fata de anul scolar 2004-2005, in anul scolar 2005-2006 se inregistreaza o scadere a numarului de
licee din Romania, cu 0,207%. Cea mai mare rata de crestere a liceelor la nivelul tarii s-a inregistrat
intre anii scolari 2008-2009 si 2009-2010, de 12,85%.
3.2.3 Indici exprimati prin valori medii
Nivelul mediu
In cazul seriilor de timp de intervale, nivelul mediu este calculat ca medie aritmetica a termenilor
seriei.
1467,7
La nivelul tarii, pe o perioada de 10 ani scolari, nivelul mediu de licee inregistrat este de aproximativ
1.468 .
Sporul mediu
Sporul mediu reflecta modificarea medie pe unitate de timp inregistrata de un fenomen, intr-o
perioada. El se calculeaza ca medie aritmetica a sporului cu baza mobila
30,11
In medie, in fiecare an scolar s-a inregistrat o crestere a numarului de licee fata de anul precedent
scolar, de aproximativ 30 de licee.
Ritmul mediu al variatiei
Ritmul mediu arata de cate ori s-a modificat in medie pe o perioada de timp, nivelul unui fenomen. El
se calculeaza ca medie geometrica a indicilor de variatie cu baza mobila.
1,0197
In medie, in fiecare an scolar s-a inregistrat o crestere a numarului de licee fata de anul precedent de
aproximativ 1,02 ori.
4. Concluzii
Scopul acestei lucrari practice a fost cel de realizare a unor cercetari asupra numarului de facultati si
a numarului de studenti din fiecare judet din anul universitar 2009-2010, asupra absolventilor pe
nivel de invatamant si sex de pe intreg teritoriul tarii in anul scolar/universitar 2008-2009, dar si
asupra numarului de licee din Romania, pe o perioada de 10 ani scolari.
In urma prelucrarii datelor culese din Anuarul statistic 2010 al Romaniei, s-a ajuns la urmatoarele
cateva concluzii: exista o legatura directa si pozitiva intre numarul de facultati si numarul d studenti
inscrisi la nivelul judetelor Romaniei, regiunea influenteaza numarul facultatilor de pe teritoriul tarii,
iar numarul de licee din Romania a cunoscut o crestere semnificativa in ultimii 10 ani, mai ales in anul
scolar 2009-1010.
Majoritatea calculelor si analizelor au fost realizate cu ajutorul programului de calcul tabelar Excel
din pachetul Microsoft Office, folosindu-se chiar programul de completare Pachet de instrumente
pentru analiza -VBA, in scopul finalizarii cu usurinta a acestui proiect.
Bibliografie
Jaba, Elisabeta, Statistica, ed. a3-a rev., Bucuresti, Editura Economica, 2002
Jaba,Elisabeta, Pintilescu, Statistica:teste grila si probleme, ed. a2-a rev., Iasi, Editura Sedcom Libris,
2007
www.insse.ro , Institutul National de Statistica