Sunteți pe pagina 1din 33

BAZELE STATISTICII

- anul universitar 2012-2013-

statisticafeaa.weebly.com

Programa analitic
1. 2.

3. 4.

Noiuni introductive Analiza unei serii statistice unidimensionale, folosind metode grafice i numerice (variabile numerice sau cantitative: indicatori ai tendinei centrale, indicatori ai dispersiei i indicatori ai formei; variabile nenumerice sau calitative). Analiza unei serii statistice bidimensionale. Indicatori ai seriilor de timp.

statisticafeaa.weebly.com

Programa analitic
5. 6. 7.

Probabiliti i distribuii teoretice Estimarea parametrilor unei populaii Testarea statistic

statisticafeaa.weebly.com

2. Analiza unei unidimensionale


2.1. Variabile cantitative
A.

serii

statistice

Variabil discret

A.1. Prezentarea seriei (distribuiei) statistice


-

seria simpl X:(xi), cu i=1,m , cnd n1=n2= =ni. seria cu frecvene diferite X: X:
xi n i xi f i

, cnd ninj. , cu fi=ni/n.

statisticafeaa.weebly.com

sau descresctor (Ni )


-

Frecvene absolute cumulate cresctor (Ni )


exprim numrul de uniti statistice cumulate pn la sau peste nivelul considerat al caracteristicii, adic valori xi, respectiv xi.
N i = N i 1 + ni = nh
h =1 i

N i = N i +1 + ni = nh
h =i
statisticafeaa.weebly.com

relative cumulate cresctor (Fi sau descresctor (Fi )


-

Frecvene

exprim ponderea unitilor statistice cumulate pn la sau peste nivelul considerat al caracteristicii, adic valori xi, respectiv xi.
Fi = Fi 1 + f i = f h
h =1 i

Fi = Fi +1 + f i = f h
h =i

statisticafeaa.weebly.com

A.2. Analiza seriei folosind metode numerice


Presupune calculul indicatorilor statisticii descriptive, cunoscui i sub denumirea de caracteristici numerice ale unei distribuii. A.2.1. Indicatori ai tendinei centrale (mrimi medii) a. Definire: mediile sunt acele valori n jurul crora se repartizeaz unitile unei populaii. cele mai importante mrimi medii sunt media aritmetic, modul i mediana.
statisticafeaa.weebly.com

A.2. Analiza seriei folosind metode numerice


b. Media aritmetic ( x ) Media aritmetic este valoarea pe care am observa-o dac unitile statistice ar nregistra aceleai valori ale variabilei (dac nu ar exista variaii ale valorilor nregistrate de unitile statistice).

statisticafeaa.weebly.com

Mod de calcul n cazul seriilor simple i seriilor cu frecvene diferite (variabil discret).

Media simpl:

x=

xi
i

n
x = xi f i
i

Media ponderat.
x= x i ni
i

ni
i

sau

Observaie: Media aritmetic este sensibil la prezena valorilor extreme (outliers).


statisticafeaa.weebly.com

Cele mai importante proprieti ale mediei aritmetice: 1. Media unei distribuii este o valoare intern: xmin x xmax. 2. Media este o mrime normal: suma abaterilor valorilor individuale ale unei variabile X de la media lor este egal cu zero.

statisticafeaa.weebly.com

c. Modul (Mo) este valoarea variabilei cea mai frecvent observat ntr-o distribuie, adic valoarea xi care corespunde frecvenei maxime (nimax). Observaie: modul poate fi aflat doar n cazul seriilor cu frecvene diferite. o distribuie poate avea una, dou sau mai multe valori modale (serii unimodale, bimodale sau plurimodale). Interpretare: Cele mai multe uniti nregistreaz valoarea modal.
statisticafeaa.weebly.com

d. Mediana (Me) este acea valoare a variabilei unei serii ordonate, cresctor sau descresctor, pn la care i peste care sunt distribuite n numr egal unitile colectivitii: jumtate din uniti (50%) au valori mai mici dect mediana, iar jumtate (50%) au valori mai mari dect mediana. corespunde locului unitii mediane calculate astfel:

Me

n+1 = 2

statisticafeaa.weebly.com

Aflarea medianei se face diferit n funcie de tipul seriei: 1. Serii simple: numr impar de termeni. numr par de termeni. 2. Serii cu frecvene diferite se calculeaz unitatea median (UMe). se calculeaz N i se afl prima valoare N i U Me valoarea xi corespunztoare acesteia este Me. Observaie: mediana nu este influenat de valorile extreme.
statisticafeaa.weebly.com

f. Quartilele sunt valori ale variabilei care mpart volumul eantionului n 4 pri egale. reprezentare grafic i mod de calcul ( Q1, Q2, Q3). g. Decile sunt valori ale variabilei care mpart volumul eantionului n 10 pri egale. decila unu (D1) i decila 9 (D9).

statisticafeaa.weebly.com

A.2.2. Indicatori ai dispersiei (variaiei)


Definire: dispersia exprim gradul de variaie a valorilor individuale ale unei variabile fa de nivelul mediu. aprecierea fenomenului de dispersie al unei distribuii permite identificarea gradului de reprezentativitate a mediei unei distribuii.

statisticafeaa.weebly.com

Indicatori sintetici ai dispersiei: 1. Abaterea medie liniar


d =

x
i

, respectiv

x x n d = n
i i i i

arat cu ct variaz, n medie, valorile xi ale variabilei fa de nivelul mediu al distribuiei, n sens pozitiv i negativ.

statisticafeaa.weebly.com

2. Variana , respectiv Variana este ntotdeauna pozitiv, nu are unitate de msur i nu se interpreteaz. Prin ridicarea la ptrat a abaterilor valorilor xi fa de medie crete influena valorilor extreme asupra nivelului varianei.
n
i i

s =
2

( xi x )
i

s2

(x x) = n
i i

ni

statisticafeaa.weebly.com

3. Abaterea standard (s) arat cu ct variaz, n medie, valorile xi ale variabilei fa de nivelul mediu al distribuiei, n sens pozitiv i negativ. se calculeaz ca radical din varian. se exprim n aceeai unitate de msur cu cea a variabilei.
2 ( ) x x i i

s=

s=

(x
i

x ) 2 ni
i i

statisticafeaa.weebly.com

4. Coeficientul de variaie (v)


s v = 100 x

se exprim n procente. valori ridicate ale acestui coeficient (v>50%) arat o distribuie eterogen, care se caracterizeaz printr-o variaie mare a valorilor xi fa de nivelul mediu i o medie nereprezentativ. este sensibil fa de valoarea mediei: cu ct media este mai apropiat de zero, cu att coeficientul de variaie este mai dificil de folosit (tinde spre infinit).

statisticafeaa.weebly.com

5. Intervalul interquartilic IQ=Q3-Q1. - cuprinde 50% din volumul eantionului.


n mod sintetic, cele mai importante caracteristici numerice ale unei distribuii pot fi cuplate astfel: media - abaterea standard - coeficientul de variaie; mediana - intervalul interquartilic.

statisticafeaa.weebly.com

A.2.3. Indicatori ai formei


1.

Asimetria: reprezint o deviere de la forma simetric a unei distribuii.

Asimetria poate fi apreciat: pe cale grafic: curba frecvenelor, diagrama box-plot. pe cale numeric: - prin calculul indicatorilor de asimetrie (Skewness). Coeficientul de asimetrie Fisher:
statisticafeaa.weebly.com

1 =

3
s3

, cu

3 =

(x
i

x)3

Relaii ntre cele trei mrimi medii Arat forma unei distribuii: 1. Cnd distribuia este simetric. x = Mo = Me 2. Cnd distribuia este asimetric la x > Me > Mo dreapta (asimetrie pozitiv). 3. Cnd x < Me < Mo distribuia este asimetric la stnga (asimetrie negativ).

statisticafeaa.weebly.com

2. Boltirea

- este definit prin compararea distribuiei empirice cu


distribuia normal din punctul de vedere al variaiei variabilei X i a frecvenei ni. Boltirea poate fi apreciat: pe cale grafic: curba frecvenelor. numeric: prin calculul indicatorilor boltirii (kurtosis). Coeficientul de boltire Fisher:
4 2 = 4 3 = 3 2 4 2 s
statisticafeaa.weebly.com

, cu

4 =

(x
i

x)4

A.3. Analiza seriei folosind metode grafice


a. -

b. c.
-

Poligonul frecvenelor: construirea acestuia presupune gsirea locului geometric al punctelor Ai de coordonate (xi,ni) sau (xi,fi) i unirea acestora prin segmente de dreapt. aproximeaz forma unei distribuii. Histograma Curba frecvenelor presupune ajustarea printr-o linie curb, continu a histogramei. aproximeaz mai bine forma de distribuie a colectivitii dup variabila considerat, comparativ cu histograma.

statisticafeaa.weebly.com

statisticafeaa.weebly.com

d. Reprezentarea diagramei box-plot sau box-and-whiskers Forma diagramei (D1, Q1, Q2, Q3, D9);

Avantaje: - permite aprecierea nivelului mediu (Me), dispersiei i asimetriei unei distribuiei; - faciliteaz compararea mai multor distribuii (prin reprezentarea simultan a diagramelor).

statisticafeaa.weebly.com

Diagrama box-plot

NOTA

10

11

Analysis weighted by NRSTUD

statisticafeaa.weebly.com

identificarea valorilor extreme i analiza influenei lor asupra rezultatelor statistice (diagrama box-plot).

statisticafeaa.weebly.com

Indicatorii statisticii descriptive n Excel


Column1 Mean Standard Error Median Mode Standard Deviation Sample Variance Kurtosis Skewness Range Minimum Maximum Sum
statisticafeaa.weebly.com Count

8.6 0.347735 8 10 1.904622 3.627586 -0.14315 -0.40554 8 4 12 258 30

B. Variabil continu
B.1. Prezentarea seriei statistice gruparea unitilor statistice este realizat pe intervale de variaie. Observaie: Gruparea pe intervale de variaie duce la pierderea unei pri a informaiei iniiale. B.2. Prelucrarea seriei statistice folosind metode grafice a. Histograma
statisticafeaa.weebly.com

b. Poligonul frecvenelor c. Curba frecvenelor B.3. Indicatori ai statisticii descriptive - se calculeaz n mod identic, prin discretizarea variabilei (calculul mijlocului intervalelor de variaie).

statisticafeaa.weebly.com

2. Analiza unei serii univariate


2.2. Variabil calitativ I. Tipuri de variabile A. Variabile nominale B. Variabile ordinale

statisticafeaa.weebly.com

II. Indicatori specifici si reprezentare grafic


a) Variabile nominale: Pentru a reprezenta structura pe categorii la nivelul unui eantion se calculeaz frecvene relative. Reprezentarea frecvenelor pentru un eantion se realizeaz folosind diagramele: Bar Chart sau Pie Chart. Indicatori specifici: modul. b) Variabile ordinale: Reprezentarea frecvenelor pentru un eantion se realizeaz folosind diagramele: Bar Chart sau Pie Chart. Frecvene absolute i relative. Indicatori specifici: modul i quartilele.
statisticafeaa.weebly.com

S-ar putea să vă placă și