Documente Academic
Documente Profesional
Documente Cultură
A. Variabil discret
i
N i = N i 1 + ni = n h
h =1
m
N i = N i +1 + ni = nh
h =i
Frecvene relative cumulate cresctor (Fi )
sau descresctor (Fi )
i
Fi = Fi 1 + f i = f h
h =1
m
Fi = Fi +1 + f i = f h
h =i
A.2. Analiza seriei folosind metode numerice
Presupune calculul indicatorilor statisticii descriptive,
cunoscui i sub denumirea de caracteristici numerice ale
unei distribuii.
a. Definire:
- mediile sunt acele valori n jurul crora se repartizeaz
unitile unei populaii.
- cele mai importante mrimi medii sunt media aritmetic,
modul i mediana.
A.2. Analiza seriei folosind metode numerice
b. Media aritmetic ( x )
- Media aritmetic este valoarea pe care am observa-o dac
unitile statistice ar nregistra aceleai valori ale variabilei
(dac nu ar exista variaii ale valorilor nregistrate de
unitile statistice).
Mod de calcul n cazul seriilor simple i seriilor cu frecvene
diferite (variabil discret).
Media simpl: xi
x= i
n
Media ponderat.
x i ni
x= i sau x = xi f i
ni i
i
Observaie:
Media aritmetic este sensibil la prezena valorilor extreme
(outliers).
Cele mai importante proprieti ale mediei aritmetice:
1. Media unei distribuii este o valoare intern:
xmin x xmax.
n+1
U Me
=
2
Aflarea medianei se face diferit n funcie de tipul seriei:
1. Serii simple:
- numr impar de termeni.
- numr par de termeni.
Observaie:
mediana nu este influenat de valorile extreme.
f. Quartilele
- sunt valori ale variabilei care mpart volumul eantionului n 4 pri
egale.
- reprezentare grafic i mod de calcul ( Q1, Q2, Q3).
g. Decile
- sunt valori ale variabilei care mpart volumul eantionului n 10 pri
egale.
- decila unu (D1) i decila 9 (D9).
A.2.2. Indicatori ai dispersiei (variaiei)
Definire:
- dispersia exprim gradul de variaie a valorilor individuale
ale unei variabile fa de nivelul mediu.
- aprecierea fenomenului de dispersie al unei distribuii
permite identificarea gradului de reprezentativitate a mediei
unei distribuii.
Indicatori sintetici ai dispersiei:
1. Abaterea medie liniar
x i x x x n
i i
d = i d = i
n , respectiv n i
i
( x x2
) (x x) n
i
2
i
i
s =
2 i
s =
2 i
n
, respectiv n i
i
( xi x ) 2 (x x)
i
2
ni
s= i
, s= i
n n i
i
4. Coeficientul de variaie (v)
s
v = 100
x
se exprim n procente.
valori ridicate ale acestui coeficient (v>50%) arat o
distribuie eterogen, care se caracterizeaz printr-o
variaie mare a valorilor xi fa de nivelul mediu i o medie
nereprezentativ.
este sensibil fa de valoarea mediei: cu ct media este mai
apropiat de zero, cu att coeficientul de variaie este mai
dificil de folosit (tinde spre infinit).
5. Amplitudinea intervalului interquartilic
IQ=Q3-Q1.
- cuprinde 50% din volumul eantionului.
3 (x i x)3
Coeficientul de asimetrie Fisher: 1 = , cu 3 = i
s3 n
Relaii ntre cele trei mrimi medii
Arat forma unei distribuii:
1. Atunci cnd cele 3 mrimi medii sunt egale,
distribuia este simetric.
2. Atunci cnd media este mrimea medie cea mai mare
distribuia este asimetric la dreapta (asimetrie pozitiv).
3. Atunci cnd media este mrimea medie cea mai mic,
distribuia este asimetric la stnga (asimetrie negativ).
2. Boltirea
- este definit prin compararea distribuiei empirice cu
distribuia normal din punctul de vedere al variaiei
variabilei X i a frecvenei ni.
Boltirea poate fi apreciat:
pe cale grafic: curba frecvenelor.
- numeric: prin calculul indicatorilor boltirii (kurtosis).
Coeficientul de boltire Fisher:
4 4 (x x)4
2 = 2 3 = 4 3
i
4 = i
2 s , cu n
A.3. Analiza seriei folosind metode grafice
a. Poligonul frecvenelor:
- construirea acestuia presupune gsirea locului geometric al
punctelor Ai de coordonate (xi,ni) sau (xi,fi) i unirea
acestora prin segmente de dreapt.
- aproximeaz forma unei distribuii.
b. Histograma
c. Curba frecvenelor
- presupune ajustarea printr-o linie curb, continu a
histogramei.
- aproximeaz mai bine forma de distribuie a colectivitii
dup variabila considerat, comparativ cu histograma.
d. Reprezentarea diagramei box-plot sau box-and-whiskers
Forma diagramei (D1, Q1, Q2, Q3, D9);
Avantaje:
- permite aprecierea nivelului mediu (Me), dispersiei i
asimetriei unei distribuiei;
- faciliteaz compararea mai multor distribuii (prin
reprezentarea simultan a diagramelor).
Diagrama box-plot
1
NOTA
3 4 5 6 7 8 9 10 11
I. Tipuri de variabile
a) Variabile nominale
b) Variabile ordinale
II. Indicatori specifici si reprezentare grafic
a) Variabile nominale:
Pentru a reprezenta structura pe categorii la nivelul unui
eantion se calculeaz frecvene relative.
Reprezentarea frecvenelor pentru un eantion se realizeaz
folosind diagramele: Bar Chart sau Pie Chart.
Indicatori specifici: modul.
b) Variabile ordinale:
Reprezentarea frecvenelor pentru un eantion se realizeaz
folosind diagramele: Bar Chart sau Pie Chart.
Frecvene absolute i relative.
Indicatori specifici: modul i quartilele.