Documente Academic
Documente Profesional
Documente Cultură
Curs2 3 4 Serii Univariate 2016
Curs2 3 4 Serii Univariate 2016
Programa analitic
1.
2.
3.
Noiuni introductive
Analiza unei serii statistice unidimensionale, folosind
metode grafice i numerice (variabile numerice sau
cantitative: indicatori ai tendinei centrale, indicatori ai
dispersiei i indicatori ai formei; variabile nenumerice
sau calitative).
Analiza unei serii statistice bidimensionale.
Programa analitic
5.
6.
7.
8.
2.
Analiza
unei
unidimensionale
serii
statistice
Variabil discret
xi
ni
, cnd ninj.
X:
xi
fi
, cu fi=ni/n.
N i = N i 1 + ni = n h
h =1
N i = N i +1 + ni = nh
h =i
Frecvene
Fi = Fi 1 + f i = f h
h =1
Fi = Fi +1 + f i = f h
h =i
Media simpl:
x=
xi
i
Media ponderat.
x=
x i ni
i
ni
i
sau
x = xi f i
i
Observaie:
Media aritmetic este sensibil la prezena valorilor extreme
(outliers).
c. Modul (Mo)
este valoarea variabilei cea mai frecvent observat ntr-o
distribuie, adic valoarea xi care corespunde frecvenei
maxime (nimax).
Observaie:
modul poate fi aflat doar n cazul seriilor cu frecvene
diferite.
o distribuie poate avea una, dou sau mai multe valori
modale (serii unimodale, bimodale sau plurimodale).
Interpretare: Cele mai multe uniti nregistreaz valoarea
modal.
d. Mediana (Me)
este acea valoare a variabilei unei serii ordonate, cresctor sau
descresctor, pn la care i peste care sunt distribuite n
numr egal unitile colectivitii: jumtate din uniti (50%)
au valori mai mici dect mediana, iar jumtate (50%) au valori
mai mari dect mediana.
corespunde locului unitii mediane calculate astfel:
Me
n+1
=
2
f. Quartilele
sunt valori ale variabilei care mpart volumul eantionului n 4 pri
egale.
reprezentare grafic i mod de calcul ( Q1, Q2, Q3).
g. Decile
sunt valori ale variabilei care mpart volumul eantionului n 10 pri
egale.
decila unu (D1) i decila 9 (D9).
x x n
d =
n
i
, respectiv
2. Variana
s =
2
( xi x )
i
(x x)
=
n
i
s2
ni
, respectiv
Variana este ntotdeauna pozitiv, nu are unitate de
msur i nu se interpreteaz.
Prin ridicarea la ptrat a abaterilor valorilor xi fa
de medie crete influena valorilor extreme
asupra nivelului varianei.
n
s=
( xi x ) 2
i
s=
(x x)
n
i
ni
se exprim n procente.
valori ridicate ale acestui coeficient (v>50%) arat o
distribuie eterogen, care se caracterizeaz printr-o
variaie mare a valorilor xi fa de nivelul mediu i o medie
nereprezentativ.
este sensibil fa de valoarea mediei: cu ct media este mai
apropiat de zero, cu att coeficientul de variaie este mai
dificil de folosit (tinde spre infinit).
5. Intervalul interquartilic
IQ=Q3-Q1.
- cuprinde 50% din volumul eantionului.
Asimetria:
reprezint o deviere de la forma simetric a unei distribuii.
1 =
3
s3
, cu
3 =
(x
x)3
2. Boltirea
, cu
4 =
(x
x)4
b.
c.
-
Poligonul frecvenelor:
construirea acestuia presupune gsirea locului geometric al
punctelor Ai de coordonate (xi,ni) sau (xi,fi) i unirea
acestora prin segmente de dreapt.
aproximeaz forma unei distribuii.
Histograma
Curba frecvenelor
presupune ajustarea printr-o linie curb, continu a
histogramei.
aproximeaz mai bine forma de distribuie a colectivitii
dup variabila considerat, comparativ cu histograma.
Avantaje:
- permite aprecierea nivelului mediu (Me), dispersiei i
asimetriei unei distribuiei;
- faciliteaz compararea mai multor distribuii (prin
reprezentarea simultan a diagramelor).
Diagrama box-plot
NOTA
10
11
8.6
0.347735
Median
Mode
10
Standard Deviation
1.904622
Sample Variance
3.627586
Kurtosis
-0.14315
Skewness
-0.40554
Range
Minimum
Maximum
12
Sum
258
Count
30
B. Variabil continu
B.1. Prezentarea seriei statistice
gruparea unitilor statistice este realizat pe intervale de
variaie.
Observaie:
Gruparea pe intervale de variaie duce la pierderea unei pri
a informaiei iniiale.
B.2. Prelucrarea seriei statistice folosind metode grafice
a. Histograma
b. Poligonul frecvenelor
c. Curba frecvenelor
B.3. Indicatori ai statisticii descriptive
- se calculeaz n mod identic, prin discretizarea variabilei
(calculul mijlocului intervalelor de variaie).