Sunteți pe pagina 1din 24

Capitolul 1.

Statistica
descriptivǎ
1.1 Obiectul statisticii descriptive

Conform dicţionarelor, putem formula o definiţie de tipul:


”statistica este o ştiinţǎ care are drept obiect studiul
numeric şi/sau grafic a unui numǎr foarte mare de
elemente similare, indiferent de natura lor”. In acest sens,
obiectul satisticii este cel de a colecţiona, organiza,
analiza şi interpreta observaţiile.

Observatiile se referǎ la o multime ce poarta numele de


populatie sau masa statisticǎ,

Fiecare element al acestei multimi este o unitate statisticǎ


sau un element.
Colectarea datelor

Observatiile se referǎ la o multime ce poarta numele de


populatie sau masa statisticǎ,.
Fiecare element al acestei multimi este o unitate statisticǎ
sau un element.

Dacǎ acest caracter este cantitativ, (putându-i-se asocia un


numǎr real ce reprezintǎ mǎsura lui) el se mai numeşte
variabila statistica discreta, daca nu poate lua decât
anumite valori, sau variabila statistica continuǎ dacǎ poate
lua orice valoare într-un interval dat.

Obseravatii: exhaustive (intreaga populatie) sau


selectii
Organizarea datelor
Tabelele statistice si reprezentarile grafice.

Analiza datelor
Pentru a reflecta informaţia într-un mod sintetic se
utilizeazǎ un numar relativ mic de valori numerice
numite caracteristici. Aceste marimi poarta şi numele de
“statisticǎ”.
Mǎrimile caracteristice cele mai importante sunt media,
care este o masurǎ a localizarii valorilor seriei statistice
si dispersia ce furnizeazǎ informaţii asupra împrǎştierii
observaţiilor în jurul mediei.
Interpretare

Interpretarea rezultatelor analizei poate avea diverse forme


printre care şi generalizarea rezultatelor obtinute pentru o
selectie la întreaga populatie; aceastǎ directie este numitǎ
statistica inferentialǎ.
1.2 Serii statistice cu o variabilǎ reala

1.2.1 Tabloul statistic :simpla enumerare a valorilor


variabilei statistice

Atunci când numǎrul de date este foarte mare este mai comod
sǎ se grupeze formand SERIA STATISTICA
Număr de reparaţii, xi 0 1 2 3 4

Numar de pompe, ni 40 33 15 10 2
1.2.2 Reprezentare graficǎ

ni k
fi = Frecventa relativa N = ∑ ni
N
i =1

Număr de reparaţii, xi 0 1 2 3 4 k= nr de
valori
Frecvenţe, ni 40 33 15 10 2 distincte ale
caracterului
statistic
Frecvenţe relative , fi 0, 0, 0, 0, 0,
40 33 15 10 02

50

40

ni
30 Diagrama cu bastoane
20

10

0 1 2 3 4 5

xi
1.2.3 Functia de repartiţie
Fie seria stastistică definite de perechile (xi, ni).

Definiţie
Se numeste funcţie de repartiţie a seriei statistice,
funcţia F care asociază oricarei valori reale x, numarul
total de unităţi statistice (elemente ale seriei) a caror
valoare este xi este mai mică sau cel mult egală cut x.

Notaţia este:
F ( x ) = ∑ ni
xi ≤ x

Intr-o reprezentare ortogonală funţia F(x) este o funcţie în


trepte, crescătoare pe mulţimea numerelor reale. Aceasta
funcţie este numită şi funcţia cumulativă a frecvenţelor
seriei.
Număr de reparaţii, xi 0 1 2 3 4

Numar de pompe, ni 40 33 15 10 2

Frecvenţe relative, fi 0,40 0,33 0,15 0,10 0,02

Frecvente relative 0,40 0,73 0,88 0,98 1,00


cumulative

Frecvenţă cumulativă 40 73 88 98 100


Serii statistie de variabila continua
O variabila continuă poate lua orice valoare într-un
interval şi atunci nu mai este smnificativ calculul
frecvenţei valorilor izolate, in special in cazul seriilor
mari. In aceasta situaţie se considera clase
caracterizate de o valoare minima si o valoare maxima
variabilei statistice. Clasa « i » se defineste prin limita
ei inferioara xi-1 şi limita superioară xi (xi-1 < xi). Numărul
“xi - xi-1 ” este amplitudinea clasei iar valoarea este
centrul clasei.
Pentru valorile de la limita dintre clase se alege o
convenţie de includere în una dintre clase. De
exemplu valoare xi-1 face parte din clasa “i” iar vlaloare
xi nu face parte (este inclusa in clasa ”i+1”).
Ex: O masină fabrica tije cilindrice de fier pentru betonul armat, cu diametrul
teoretic de 25 mm. Dintr-un eşantion de 100 piese luat la intâmplare s-au
verificat diametrele.

Diametru, [24,2- [24,4- [24,6- [24,8- [25,0- [25,2- [25,4- [25,6- [25,8-
mm 24,4) 24,6) 24,8) 25,0) 25,2) 25,4) 25,6) 25,8) 26,0]

Efectiv, 5 13 24 19 14 10 8 5 2
ni
Clase de amplitudini neegale
Dupa cum se observă suprafeţele dreptunghiurilor
sunt proporţionale cu efectivul claselor.
Ordonatele se vor modifica pentru a obtine
efectivul clasei ca produs dintre valoarea
ordonatei si largimea clasei citită pe abscisa.
Practic se imparte efectivul la largimea clasei
pentru a afla inaltimea acesteia in histograma.
Exemplul
Distribuţia granulometrică în baza masă a carbonatului de calciu precipitat este
măsurata cu un granulometru cu laser. Rezultatele sunt prezentate pe clase
granulometrice în care diametrul particulelor este măsurat in micrometri şi
reprezintă caracterul statistic studiat, iar frecvenţa claselor reprezinta procente de
masă din masa totală de particule care au diametre cuprinse în acea clasă:
d, µ m <1,4 [1,4-2,3) [2,3-4,0) [4,0-5,7) [5,7-7,4) [7,4-9,6) [9,6-12,5) [12,5-16,2)

Frecv, %2,1 3,2 3,3 3,4 4,9 8,3 12,2 14,5


masă

d, µ m [16,2- [21,1- [27,4- [35,6- [46,2- [16,2- [21,1- [27,4-35,6)


21,1) 27,4) 35,6) 46,2) 60,0) 21,1) 27,4)

Frecv., %14,5 12,9 10,1 6,9 3,7 14,5 12,9 10,1


masă
FUNCTIA DE REPARTITIE

Dacă X este o variabilă statistica continuă, funcţia F care


asociază oricărei valori reale x un numar de valori ale
varibilei statistice care sunt strict mai mici decât x, este
numita functie de repartiţie a seriei statistice.

Diam. [24,2 [24,4 [24,6 [24,8 [25,0 [25,2 [25,4 [25,6 [25,8
mm - - - - - - - - -
24,4) 24,6) 24,8) 25,0) 25,2) 25,4) 25,6) 25,8) 26,0)

Frecve 5 13 24 19 14 10 8 5 2
nta

Frecve 5 18 42 61 75 85 93 98 100
nta
cumul
ata
Media Aritmetica (MEDIE)

X
1 k

∑x
k
N = ∑ ni X = i ⋅ ni
i =1
N i =1

Pentru serii de variabila continua


1 k
X =
N
∑c
i =1
i ⋅ ni

Daca datele sunt colectate in tabele (nu grupate in serii), media si dispersia
se calculeaza cu relatiile:
N

∑x i
X= i =1

N
Modul
Daca variabila statistica este discretă, se numeşte
mod al serie statistice valoare (valorile) pentru care
efectivul este cel mai mare.
În cazul unei serii statistice asociată unei variabile
continue pentru care observaţiile au fost grupate în
clase, numim clasa modală clasa in care efectivul
este cel mai mare.
Conform acestei definiţii în exemplul prezentat clasa
modala este [24,6 24,8].
Mediana
Se numeşte mediana unei serii statistice numarul real,
notata Me pentru care jumatate din unităţile statistice au
o valoare a caracterului studiat mai mica sau egală cu
Me iar jumatate din unitatile satistice au o valoare mai
mare decat Me.

Pentru o variabilă continuă mediana se derermiă direct


din reprezentarea grafică a funcţiei de repartiţie citind
valoarea abscisei ce corespunde unui efectiv cumulativ
N/2.
Dispersia
Cel mai important parametru ce caracterizează
împrăştierea este dispersia. Aceasta este o măsură a
abaterii valorilor seriei statistice faţă de medie.
Se numeste dispersie a unei serii statistice (xi, ni) media
pătratelor abaterilor faţă de medie, notata cu σ2 :
k

∑ n (x − x)
i i
2

σ2 = i =1
k σ = σ2
∑n i =1
i

Pentru o variabila statistică definită prin clase, valorile xi


se inlocuiesc cu centrle claselor, ci.

Se numeşte abatere medie pătratică radacina pătrată din


dispersie
Daca datele sunt colectate in tabel, nu sunt grupate in serii:

∑ (x − X ) i
2

σ2 = i =1

Daca este vorba despre o colectie exhaustiva, N fiind numarul de date

∑ (x − X )i
2

σ2 = i =1

N −1

Daca este vorba despre o SELECTIE dintr-o populatie, N fiind numarul de date al
selectiei. In acest caz media utilizata este doar o estimatie a mediei reale a
populatiei, medie ce este necunoscuta.
Serii cronologioce

Seriile cronologice reprezinta seriile statistice


ce se obtin prin sistematizarea datelor dupa
variabila de timp.
Reprezentarea grafica: Cronograma
Serii de distributie de frecvente dupa o
variabila calitativa
- serii homograde-