Documente Academic
Documente Profesional
Documente Cultură
Scala nominal presupune acordarea de numere (coduri) fiecrei categorii a unei populaii (doi
indivizi care aparin unor categorii distincte au valori diferite).
b. Scala ordinal presupune ca atribuirea de coduri numerice pentru fiecare categorie s se
realizeze n ordine descresctoare, dup importana lor.
2. Variabile cantitative
a. Scala interval are ca proprieti identitatea, ordinea i faptul c intervalul ntre numere are un
sens.
1.4. Scale de msurare
se poate, astfel, compara diferena dintre dou valori ale aceleiai variabile.
Exemplu:
temperatura n sistemul Celsius i n sistemul Fahrenheit: diferena dintre dou temperaturi are
un sens;
scorurile obinute la testele de evaluare.
1.4. Scale de msurare
b. Scala raport
are aceleai proprieti ca scala interval i, n plus, posed un zero absolut (considerat punct de
referin).
diferena i raportul dintre dou valori au un sens.
Exemplu:
Rata omajului, PIB/locuitor, rata natalitii, vrsta, nlimea, greutatea ...
1.5. Metode de culegere a datelor
Surse de date statistice
Anuarul Statistic al Romniei (INS).
Sursa de date statistice la nivel european: Oficiul Statistic al Comunitii Europene EUROSTAT.
Adresa: http://europa.eu.int/comm/eurostat
2. Lucrri de nregistrare statistic
a. Recensmntul reprezint o lucrare de nregistrare exhaustiv, la un moment dat, a unei
populaii.
nregistrarea surprinde starea populaiei la un moment dat, numit moment critic.
b. Rapoarte statistice
reprezint lucrri de nregistrare total (evenimente, fapte).
c. Anchete prin sondaj
d. Monografia statistic
are ca obiectiv cunoaterea unei singure uniti complexe sau a unei singure probleme.
Aplicaii:
I. Pentru ansamblul firmelor din judeul Iai care desfoar activitate de producie se
nregistreaz valoarea cifrei de afaceri (mld. lei) la 31 decembrie 2010. Se cere:
s se precizeze dac nregistrarea statistic realizat asupra firmelor observate presupune o
cercetare exhaustiv.
s se defineasc unitatea statistic i variabila de grupare .
Variabil discret
a. Definire:
mediile sunt acele valori n jurul crora se repartizeaz unitile unei populaii.
cele mai importante mrimi medii sunt media aritmetic, modul i mediana .
A.2. Analiza seriei folosind metode numerice
b. Media aritmetic (
)
Media aritmetic este valoarea pe care am observa-o dac unitile statistice ar
nregistra aceleai valori ale variabilei (dac nu ar exista variaii ale valorilor
nregistrate de unitile statistice).
Mod de calcul n cazul seriilor simple i seriilor cu frecvene diferite (variabil discret)
Media simpl:
Media ponderat:
Sau
Observaie:
Media aritmetic este sensibil la prezena valorilor extreme (outliers).
Cele mai importante proprieti ale mediei aritmetice:
1. Media unei distribuii este o valoare intern:
2. Media este o mrime normal: suma abaterilor valorilor individuale ale unei variabile X de la
media lor este egal cu zero.
Exemplu: S considerm distribuia membrilor unei familii dup numrul de litri de Coca-Cola
consumai ntr-o sptmn:
1, 1, 4, 6, 8.
c. Modul (Mo)
este valoarea variabilei cea mai frecvent observat ntr-o distribuie, adic valoarea x i care
corespunde frecvenei maxime (nimax).
Observaie:
modul poate fi aflat doar n cazul seriilor cu frecvene diferite.
o distribuie poate avea una, dou sau mai multe valori modale (serii unimodale, bimodale sau
plurimodale).
Interpretare: Cele mai multe uniti nregistreaz valoarea modal.
d. Mediana (Me)
este acea valoare a variabilei unei serii ordonate, cresctor sau descresctor, pn la care
i peste care sunt distribuite n numr egal unitile colectivitii: jumtate din uniti au
valori mai mici dect mediana, iar jumtate au valori mai mari dect mediana.
corespunde locului unitii mediane calculate astfel:
Observaie:
mediana nu este influenat de valorile extreme.
Exemplu: 1, 1, 2, 4, 4, 80
f. Quartilele
- sunt valori ale variabilei care mpart volumul eantionului n 4 pri egale.
- reprezentare grafic i mod de calcul ( Q1, Q2, Q3).
g. Decile
- sunt valori ale variabilei care mpart volumul eantionului n 4 pri egale.
- decila unu (D1) i decila 9 (D9).
A.2.2. Indicatori ai dispersiei (variaiei)
Definire:
- dispersia exprim gradul de variaie a valorilor individuale ale unei variabile fa de
nivelul mediu.
- aprecierea fenomenului de dispersie al unei distribuii permite identificarea gradului de
reprezentativitate a mediei unei distribuii.
Indicatori sintetici ai dispersiei:
1. Abaterea medie liniar
1. Variana
, respectiv
Variana este ntotdeauna pozitiv, nu are unitate de msur i nu se interpreteaz.
Prin ridicarea la ptrat a abaterilor valorilor xi fa de medie crete influena valorilor
extreme asupra nivelului varianei.
3. Abaterea standard (s)
arat cu ct variaz, n medie, valorile x i ale variabilei fa de nivelul mediu al
distribuiei, n sens pozitiv i negativ.
Se calculeaz ca radical din varian
se exprim n aceeai unitate de msur cu cea a variabilei.
s2
(x x)
n
i
ni
s2
2
(
x
x
)
i
i
se exprim n procente.
valori ridicate ale acestui coeficient (v>50%) arat o distribuie eterogen, care se
caracterizeaz printr-o variaie mare a valorilor x i fa de nivelul mediu i o medie
nereprezentativ.
este sensibil fa de valoarea mediei: cu ct media este mai apropiat de zero, cu att
coeficientul de variaie este mai dificil de folosit (tinde spre infinit).
5. Intervalul interquartilic
IQ=Q3-Q1.
- cuprinde 50% din volumul eantionului.
n mod sintetic, cele mai importante caracteristici numerice ale unei distribuii pot fi cuplate
astfel:
media - abaterea standard - coeficientul de variaie
mediana - intervalul interquartilic
media - mediana
A.2.3. Indicatori ai formei
Asimetria:
reprezint o deviere de la forma simetric a unei distribuii.
Asimetria poate fi apreciat:
- pe cale grafic: curba frecvenelor, diagrama box-plot.
- pe cale numeric: - prin calculul indicatorilor de asimetrie (Skewness).
Me Me
Mo
xx Mo
x Me Mo
2. Boltirea
este definit prin compararea distribuiei empirice cu distribuia normal din punctul de
vedere al variaiei variabilei X i a frecvenei n i.
Boltirea poate fi apreciat:
pe cale grafic: curba frecvenelor.
- numeric: prin calculul indicatorilor boltirii (kurtosis).
Coeficientul de boltire Fisher:
NOTA
10
11
NOTA_1
NOTA_2
10
11
Mean
8.6
Standard Error
0.347735
Median
Mode
10
Standard Deviation
1.904622
Sample Variance
3.627586
Kurtosis
-0.14315
Skewness
-0.40554
Range
Minimum
Maximum
12
Sum
258
Count
30
B. Variabil continu
B.1 Prezentarea seriei statistice
- gruparea unitilor statistice este realizat pe intervale de variaie.
Observaie:
- Gruparea pe intervale de variaie duce la pierderea unei pri a informaiei iniiale.
B.2. Indicatori ai statisticii descriptive
se calculeaz n mod identic, prin discretizarea variabilei (calculul mijlocului intervalelor
de variaie).
B.3. Prelucrarea seriei statistice folosind metode grafice
Histograma
Poligonul frecvenelor
Curba frecvenelor
Box-plot
Distribuia unui eantion de firme dup valoarea profitului (mil. lei), n anul 2012
2. Analiza unei serii univariate
2.1. Variabil cantitativ
Variabil discret
Variabil continu
Religie
ni
Budism
fi (%)
7
6,80
41
39,81
Hinduism
0,97
Iudaism
0,97
27
26,21
7,77
16
15,53
1,94
103
100
Catolic
Islam
Ortodox
Protestantism
Taoism
Total
a) Variabile nominale:
Pentru a reprezenta structura pe categorii la nivelul unui eantion se calculeaz
frecvene relative;
Reprezentarea structurii unui eantion se realizeaz folosind diagrame de structur:
dreptunghiul, ptratul i cercul de structur (Pie Chart) sau folosing diagrame prin
coloane (Bar Chart).
b) Variabile ordinale:
1. Mrimi relative
3. Reprezentare grafica
Histograma
Poligonul frecvenelor
Box-plot