Documente Academic
Documente Profesional
Documente Cultură
In sprijinul cercetarii am ales distributia judetelor Romaniei, inclusiv Municipiul Bucuresti, dupa
numarul facultatilor si numarul studentilor inscrisi (cele doua variabile cantitative) si distributia
absolventilor din Romania dupa sex si dupa nivelul de educatie (cele doua variabile calitative).
Mediile sunt marimi statistice care exprima, in mod sintetic si generalizant, ceea ce este normal,
esential, tipic pentru unitatile unei colectivitati distribuite dupa o anumita caracteristica.
𝑛
𝑥1 + 𝑥2 + ⋯ + 𝑥𝑛 1
𝑥̅ = = ∑ 𝑥𝑖
𝑛 𝑛
𝑖=1
In medie, aproximativ 15 facultati sunt distribuite in fiecare judet al Romaniei, conform datelor
culese din Anuarul statistic 2010.
Mediana
Mediana reprezinta acea valoare a caracteristicii unei serii ordonate, crescator sau descrescator,
pana la care si peste care sunt distribuite in numar egal unitatile colectivitatii observate.
𝑛 𝑛+1
𝑈 𝑀𝑒 = sau 𝑈 𝑀𝑒 = , n<100
2 2
50% dintre judetele Romaniei au pana in 5 facultati inclusiv, iar 50% au peste 5 facultati inclusiv.
Modul
Modul reprezinta valoarea caracteristicii cea mai frecvent intalnita intr-o distributie, adica valoarea
ce corespunde frecventei dominante.
Cel mai frecvent, numarul facultatilor din Romania, distribuite pe judet, este egal cu 1.
∑𝑛 (𝑥𝑖 − 𝑥̅ )𝑛𝑖
𝜎 = √ 𝑖=1 𝑛 = √𝜎 2
∑𝑖=1 𝑛𝑖
Varianta (dispersia)
Varianta reprezinta media aritmetica a patratelor valorilor abaterilor individuale fata de media lor.
∑𝑛𝑖=1(𝑥𝑖 − 𝑥̅ )𝑛𝑖
𝜎2 =
∑𝑛𝑖=1 𝑛𝑖
Coeficientul de boltire masoara excesul fata de boltirea unei distributii normale Gauss-Laplace.
𝜇4 𝜇4
𝛽2 = =
𝜇22 𝜎 4
∑𝑛 𝑚
𝑖=1(𝑥𝑖 −𝑥̅ ) 𝑛𝑖
𝜇𝑚 = ∑𝑛
moment centrat
𝑖=1 𝑛𝑖
Distributia judetelor dupa numarul de facultati este leptocurtica, deoarece coeficientul de boltire
Pearson depaseste valoarea 3, iar astfel curba frecventelor prezinta boltire in jurul valorii medii.
Indicatorii de asimetrie dau informatii asupra modului de repartizare a frecventelor de o parte sau
alta a valorii centrale a unei serii, asimetria reprezentand deviatia de la forma simetrica de
distribuitie.
𝜇32
𝛽1 =
𝜇23
Coeficientul de asimetrie Pearson are valoare pozitiva, de unde reiese faptul ca distributia facultatilor
pe judete este o distributie asimetrica.
Valoarea mediei depaseste valoarea medianei, care la randul ei este mai mare decat valoarea
modului, rezultand o asimetrie la dreapta.
Amplitudinea variantei
Amplitudinea variantei reprezinta diferenta dintre valoarea maxima si valoarea minima in care se
incadreaza numarul facultatilor distribuite pe judet.
Numarul minim de facultati distribuite pe judetele Romaniei este 0, in timp ce numarul maxim de
facultati este de 165, iar in total, pe teritoriul tarii s-au inregistrat ca fiind 624 facultati.
Coeficientul de variatie
Coeficientul de variatie se calculeaza ca raport procentual intre abaterea medie patratica si media
aritmetica.
𝜎
𝑣= ∙ 100
𝑥̅
Media
In medie, aproximativ 18.460 de studenti au fost inscrisi in fiecare judet al Romaniei, conform datelor
culese din Anuarul statistic 2010.
Mediana
50% dintre judetele Romaniei au pana in 5.816 studenti inscrisi inclusiv, iar 50% au peste 5.816
studenti inscrisi inclusiv.
Modul
Cel mai frecvent, numarul studentilor inscrisi in Romania, distribuiti pe judet, este egal cu 0.
Deviatia standard
Distributia judetelor dupa numarul de studenti inscrisi este leptocurtica, deoarece coeficientul de
boltire Pearson depaseste valoarea 3, iar astfel curba frecventelor prezinta boltire in jurul valorii
medii.
Coeficientul de asimetrie Pearson are valoare pozitiva, de unde reiese faptul ca distributia studentilor
inscrisi pe judete este o distributie asimetrica.
Valoarea mediei depaseste valoarea medianei, care la randul ei este mai mare decat valoarea
modului, rezultand o asimetrie la dreapta.
Numarul minim de studenti inscrisi pe judetele Romaniei este 0, in timp ce numarul maxim de
studenti inscrisi este de 285.720, iar in total, pe teritoriul tarii s-au inregistrat ca fiind inscrisi 775.319
studenti in anul universitar 2009-2010.
Coeficientul de variatie
Inferenta statistica permite trecerea de la o valoare statistica calculate pe baza datelor dintr-un
esantion, la valoarea adevarata necunoscuta.
Estimarea reprezinta procedeul prin care se afla valoarea unui paramtru al populatiei, pe baza
datelor inregistrate la nivelul unui esantion extras din aceasta.
Estimatia este valoarea unui estimator al unui parametru, si este calculate pe baza a n observatii
obtinute la nivelul esantionului, purtand si numele de valoare tipica de sondaj.
Estimarea prin interval de incredere inseamna aflarea limitelor de incredere ale unui interval care
acopera valoarea adevarata a unui parametru al populatiei, tinand seama de fluctuatiile distributiei
de selectie a estimatorului parametrului considerat.
Din totalul judetelor Romaniei se extrage un esantion de volum mic n=21 de judete, care au fost
observate dupa numarul de facultati. Folosind procedeul esantionarii aleatoare mecanice cu pas de
𝑁 42
numarare, rezulta fractia de selectie 𝑛 = 21 = 2, pasul de numarare putand lua valoarea 1 sau 2. In
continuare, alegem pasul de numarare egal cu 1, de unde va rezulta urmatorul tabel:
La nivelul esantionului s-au obtinut ∑ 𝑥𝑖 = 253, 𝑥̅ = 12,04 , 𝑠 2 = 163. Se cere sa se estimeze prin
interval de incredere numarul mediu de facultati la nivelul tuturor judetelor din Romania, pentru un
risc asumat 𝛼 = 5%.
Cand varianta la nivelul populatiei nu este cunoscuta, folosim statistica Student (t) in scopul
determinarii intervalului de incredere al mediei, t fiind recomandat si in cazul esantioanelor de volum
mic (n<30).
𝜇̂ − 𝜇
𝑡= ~ 𝑡(𝑛 − 1)
𝜎̂′
√𝑛
𝑥̅ − 𝜇
𝑡=
𝑠′
√𝑛
𝑠′
𝐼𝐶 = [𝑥̅ ± 𝑡𝛼,𝑛−1 ∙ ]
2 √𝑛
Cu o incredere de 95%, se poate afirma ca numarul mediu de facultati la nivelul tuturor judetelor
Romaniei este acoperit de intervalul [6,25 ; 17,83].
Ne propunem sa aflam, la nivelul aceluiasi esantion , daca numarul mediu de facultati este egal cu
valoarea numarului mediu de facultati din totalul judetelor Romaniei, si daca ponderea numarului de
facultati mai mare decat media acestora este egala cu ponderea numarului de facultati mai mare
decat media la nivelul tuturor judetelor.
a) Testarea mediei
Pentru aceleasi date de la problema estimarii prin interval de incredere a mediei, se cere sa se
verifice daca exista diferente semnificative intre numarul mediu de facultati la nivelul esantionului si
numarul mediu de facultati la nivelul intregii tarii, egal cu 14,85.
Etapele testarii:
1) Formularea ipotezelor
𝐻1 : 𝜇 ≠ 𝜇0
𝜇0 = 14,85
𝑥̅ − 𝜇0
𝑡=
𝑠′
√𝑛
Alegem 𝛼 = 5% .
4) Stabilirea regulilor de decizie
𝑡𝑐𝑎𝑙𝑐 = −1,01
𝑡𝛼,𝑛−1 = 2,086
2
Cu o incredere de 95%, se poate afirma ca nu exista diferente semnificative intre numarul mediu de
facultati la nivelul esantionului si numarul mediu de facultati la nivelul intregii tari.
b) Testarea proportiei
La nivelul esantionului, se observa ca proportia judetelor cu un numar de facultati mai mare decat
media aritmetica este de 38,09%. Pentru un risc asumat de 5%, se cere sa se testeze daca exista
diferente semnificative intre ponderea numarului de facultati mai mare decat media acestora si
ponderea numarului de facultati mai mare decat media la nivelul tuturor judetelor, de 30,95%.
Etapele testarii:
1) Formularea ipotezelor
𝐻1 : 𝜋 ≠ 𝜋0
𝜋0 = 0,31
Alegem 𝛼 = 5% .
4) Stabilirea regulilor de decizie
𝑡𝑐𝑎𝑙𝑐 = 0,33
𝑡𝛼,𝑛−1 = 2,086
2
Ne propunem sa aflam, la nivelul celor doua esantioane de volum egal, rezultate in urma folosirii
procedeului esantionarii aleatoare mecanice cu pas de numarare, daca exista dieferente
semnificative intre numarul mediu de facultati din primul esantion de judete si valoarea numarului
mediu de facultati din cel de-al doilea esantion de judete, pe teritoriul Romaniei.
Se cunosc 𝑛1 = 𝑛2 = 𝑛 = 21, ̅̅̅ 𝑥2 = 17,66 , 𝑠′12 = 163, 𝑠′22 = 1344,33 , iar 𝜎12 ≠ 𝜎22 .
𝑥1 = 12,04 , ̅̅̅
Etapele testarii:
1) Formularea ipotezelor
𝐻1 : 𝜇1 ≠ 𝜇2
Alegem 𝛼 = 5% .
𝑡𝑐𝑎𝑙𝑐 = 0,66
𝑡𝛼,𝑛−1 = 2,086
2
Cu o incredere de 95%, se poate afirma ca nu exista diferente semnificative intre mediile facultatilor
celor doua esantioane de judete, la nivelul Romaniei.
Analiza dispersionala ANOVA consta in descompunerea variatiei totale a unui ansamblu de date,
inregistrate pentru o variabila x, in componente definite dupa sursa variatiei si compararea acestora
pentru a stabili daca factorii considerati cauza au influenta semnificativa asupra variabilei x.
Pentru un esantion de 42 de judete din totalul judetelor Romaniei, observate dupa regiuni si dupa
numarul de facultati, s-au inregistrat datele de mai jos. Pentru un risc asumat de 5%, sa se testeze
daca numarul de facultati este influentat de regiune.
Etapele testarii:
1) Formularea ipotezelor
Pentru verificarea ipotezei nule, in ANOVA se foloseste statistica test F (raportul Fisher), calculat ca
raport intre doi estimatori ai variantei:
𝑆𝐸2
𝐹= ~𝐹(𝑘 − 1, 𝑛 − 𝑘)
𝑆𝑅2
𝜗1 = 𝑘 − 1, 𝜗2 = 𝑛 − 𝑘 grade de libertate
𝑘 − numarul de grupe
𝑛 − volumul esantionului
𝑉𝐸
𝑆𝐸2 =
𝑘−1
𝑘
𝑉𝐸 = ∑(𝑥̅𝑗 − 𝑥̅ )2 𝑛𝑗
𝑗=1
𝑉𝐸 − variatia intergrupe (masoara variatia mediilor grupelor fata de media lor) – componenta efect
𝑉𝑅
𝑆𝑅2 =
𝑛−1
𝑛𝑗 𝑘
𝑉𝑅 = ∑ ∑(𝑥𝑖𝑗 − 𝑥̅𝑗 )2
𝑖=1 𝑗=1
𝑉𝑇 = 𝑉𝐸 + 𝑉𝑅
𝑛
𝑉𝑇 = ∑(𝑥𝑖 − 𝑥̅ )2
𝑖=1
𝑉𝑇 − variatia totala
𝑉𝑇
𝑆𝑇2 =
𝑛−1
Alegem 𝛼 = 5% .
4) Stabilirea regulilor de decizie
𝐹𝑐𝑎𝑙𝑐 = 2,56
𝐹𝛼,𝑘−1,𝑛−𝑘 = 2,29
Studierea seriilor cronologice presupune caracterizarea variatiei in timp a unui fenomen, prin
masurarea cresterilor sau descresterilor de nivel si a modificarilor de structura si prin determinarea
influentei factorilor sub incidenta carora are loc evolutia fenomenelor.
O metoda specifica pentru observarea si analiza seriilor cronologice este cea a indicatorilor statistici
ai dinamicii, in marimi absolute, relative si medii, folosita si in cadrul acestui proiect, in scopul redarii
nivelului si a modificarii de nivel in timp a unui fenomen.
Din Anuarul statistic 2010 al Romaniei, au fost extrase date cu privire la numarul de licee pe profiluri,
pe o perioada de 10 ani scolari.
Seriile de timp de intervale descriu nivelul unui fenomen in diferite interval de timp, cum este si cazul
distributiei liceelor la nivelul tarii, pe o perioada de 10 ani scolari.
Indicatorii absoluti exprima in unitati concrete de masura, nivelul sau modificarile de nivel ale unui
fenomen privit in evolutia sa in timp.
Nivelul absolut
Nivelul absolut
1406
1418
1427
1436
1452
1449
1460
1466
1486
1677
Volumul absolut
In cazul seriilor de timp de intervale, volumul absolut se obtine prin insumarea nivelurilor absolute.
𝑛 𝑛
𝑦 = ∑ 𝑦𝑖 = ∑ 𝑦1 + 𝑦2 + ⋯ 𝑦𝑛
𝑖=1 𝑖=1
𝑦 = 14.677
Sporul absolut
Modificarea absoluta (cresterea sau descresterea absoluta) arata cu cat s-a modificat un fenomen
intr-o perioada, fata de o alta perioada considerata baza de comparare.
Sporul cu baza fixa se calculeaza ca diferenta intre oricare termen al seriei si termenul initial.
𝑦
∆𝑡/0 = 𝑦𝑡 − 𝑦0
Sporul absolut cu baza fixa
0
12
21
30
46
43
54
60
80
271
Din tabel reiese faptul ca, fata de anul scolar 2000-2001, luat ca baza comparabila, in toti ceilalti s-a
inregistrat o crestere a numarului de licee la nivelul Romaniei.
Din tabel se observa ca exista un singur spor negativ, calculat pentru perioada anilor scolari 2004-
2005, 2005-2006. De aici rezulta ca numarul de licee de pe teriroriul tarii a fost intr-o continua
crestere, dar de la anul scolar 2004-2005 la anul scolar 2005-2006 s-a inregistrat o scadere a
acestora, egala cu 3. Tot din tabel reiese faptul ca cea mai mare crestere inregistrata la nivelul tarii, a
fost in perioada anilor scolari 2008-2009 si 2009-2010, cu un numar de 191 de licee.
Ritmul de variatie
Indicele de variatie arata de cate ori a crescut sau a scazut nivelul unui fenomen intr-o anumita
perioada, fata de nivelul aceluiasi fenomen dintr-o alta perioada considerata ca baza.
𝑦 𝑦𝑡 𝑦 𝑦𝑡
𝑖𝑡/0 = sau 𝑖𝑡/0 = ∙ 100
𝑦0 𝑦0
In toti anii scolari, fata de cel luat ca baza comparabila 2000-2001, s-a inregistrat o crestere a
numarului de licee pe teritoriul Romaniei, cea mai mare crestere fiind in anul scolar 2009-2010.
𝑦 𝑦𝑡 𝑦 𝑦𝑡
𝑖𝑡⁄𝑡−1 = sau 𝑖𝑡⁄𝑡−1 = ∙ 100
𝑦𝑡−1 𝑦𝑡−1
Singura valoare mai mica decat 1 corespunde perioadei dintre anii scolari 2004-2005 si 2005-2006,
ceea ce inseamna ca atunci s-a inregistrat o scadere a numarului de licee la nivelul tarii.
Ritmul sporului
Rata de crestere arata cu cat s-a modificat, in marime relativa, nivelul fenomenului in perioada
raportata fata de nivelul din perioada de raportare.
Fata de anul scolar 2000-2001 luat ca baza de comparare, anul scolar 2009-2010 inregistreaza cea
mai mare rata de crestere a numarului de licee la nivelul Romaniei, de 19,27%.
𝑦
𝑦
∆𝑡⁄𝑡−1 𝑦𝑡 − 𝑦𝑡−1 𝑦𝑡 𝑦
𝑟𝑡⁄𝑡−1 = ∙ 100 = ∙ 100 = ∙ 100 − 100 = 𝑖𝑡⁄𝑡−1 − 100
𝑦𝑡−1 𝑦𝑡−1 𝑦𝑡−1
Fata de anul scolar 2004-2005, in anul scolar 2005-2006 se inregistreaza o scadere a numarului de
licee din Romania, cu 0,207%. Cea mai mare rata de crestere a liceelor la nivelul tarii s-a inregistrat
intre anii scolari 2008-2009 si 2009-2010, de 12,85%.
Nivelul mediu
In cazul seriilor de timp de intervale, nivelul mediu este calculat ca medie aritmetica a termenilor
seriei.
∑𝑛𝑖=1 𝑦𝑖
𝑦̅ =
𝑛
𝑦̅ = 1467,7
La nivelul tarii, pe o perioada de 10 ani scolari, nivelul mediu de licee inregistrat este de aproximativ
1.468 .
Sporul mediu
Sporul mediu reflecta modificarea medie pe unitate de timp inregistrata de un fenomen, intr-o
perioada. El se calculeaza ca medie aritmetica a sporului cu baza mobila
∑𝑛𝑡=2 ∆𝑡𝑦⁄𝑡−1
̅̅
∆̅̅
𝑦=
𝑛−1
̅̅
∆̅̅
𝑦 = 30,11
In medie, in fiecare an scolar s-a inregistrat o crestere a numarului de licee fata de anul precedent
scolar, de aproximativ 30 de licee.
Ritmul mediu arata de cate ori s-a modificat in medie pe o perioada de timp, nivelul unui fenomen. El
se calculeaza ca medie geometrica a indicilor de variatie cu baza mobila.
𝑛
𝑛−1
𝑖̅𝑦 = √∏ 𝑖𝑡𝑦⁄𝑡−1
𝑡=2
𝑖̅𝑦 = 1,0197
In medie, in fiecare an scolar s-a inregistrat o crestere a numarului de licee fata de anul precedent de
aproximativ 1,02 ori.
1. Concluzii
Scopul acestei lucrari practice a fost cel de realizare a unor cercetari asupra numarului de facultati si
a numarului de studenti din fiecare judet din anul universitar 2009-2010, asupra absolventilor pe
nivel de invatamant si sex de pe intreg teritoriul tarii in anul scolar/universitar 2008-2009, dar si
asupra numarului de licee din Romania, pe o perioada de 10 ani scolari.
In urma prelucrarii datelor culese din Anuarul statistic 2010 al Romaniei, s-a ajuns la urmatoarele
cateva concluzii: exista o legatura directa si pozitiva intre numarul de facultati si numarul d studenti
inscrisi la nivelul judetelor Romaniei, regiunea influenteaza numarul facultatilor de pe teritoriul tarii,
iar numarul de licee din Romania a cunoscut o crestere semnificativa in ultimii 10 ani, mai ales in anul
scolar 2009-1010.
Majoritatea calculelor si analizelor au fost realizate cu ajutorul programului de calcul tabelar Excel
din pachetul Microsoft Office, folosindu-se chiar programul de completare “Pachet de instrumente
pentru analiza -VBA”, in scopul finalizarii cu usurinta a acestui proiect.