Documente Academic
Documente Profesional
Documente Cultură
Statistica
descriptivǎ
1.1 Obiectul statisticii descriptive
Analiza datelor
Pentru a reflecta informaţia într-un mod sintetic se
utilizeazǎ un numar relativ mic de valori numerice
numite caracteristici. Aceste marimi poarta şi numele de
“statisticǎ”.
Mǎrimile caracteristice cele mai importante sunt media,
care este o masurǎ a localizarii valorilor seriei statistice
si dispersia ce furnizeazǎ informaţii asupra împrǎştierii
observaţiilor în jurul mediei.
Interpretare
Atunci când numǎrul de date este foarte mare este mai comod
sǎ se grupeze formand SERIA STATISTICA
Număr de reparaţii, xi 0 1 2 3 4
Numar de pompe, ni 40 33 15 10 2
1.2.2 Reprezentare graficǎ
ni k
fi = Frecventa relativa N = ∑ ni
N
i =1
Număr de reparaţii, xi 0 1 2 3 4 k= nr de
valori
Frecvenţe, ni 40 33 15 10 2 distincte ale
caracterului
statistic
Frecvenţe relative , fi 0, 0, 0, 0, 0,
40 33 15 10 02
50
40
ni
30 Diagrama cu bastoane
20
10
0 1 2 3 4 5
xi
1.2.3 Functia de repartiţie
Fie seria stastistică definite de perechile (xi, ni).
Definiţie
Se numeste funcţie de repartiţie a seriei statistice,
funcţia F care asociază oricarei valori reale x, numarul
total de unităţi statistice (elemente ale seriei) a caror
valoare este xi este mai mică sau cel mult egală cut x.
Notaţia este:
F ( x ) = ∑ ni
xi ≤ x
Numar de pompe, ni 40 33 15 10 2
Diametru, [24,2- [24,4- [24,6- [24,8- [25,0- [25,2- [25,4- [25,6- [25,8-
mm 24,4) 24,6) 24,8) 25,0) 25,2) 25,4) 25,6) 25,8) 26,0]
Efectiv, 5 13 24 19 14 10 8 5 2
ni
Clase de amplitudini neegale
Dupa cum se observă suprafeţele dreptunghiurilor
sunt proporţionale cu efectivul claselor.
Ordonatele se vor modifica pentru a obtine
efectivul clasei ca produs dintre valoarea
ordonatei si largimea clasei citită pe abscisa.
Practic se imparte efectivul la largimea clasei
pentru a afla inaltimea acesteia in histograma.
Exemplul
Distribuţia granulometrică în baza masă a carbonatului de calciu precipitat este
măsurata cu un granulometru cu laser. Rezultatele sunt prezentate pe clase
granulometrice în care diametrul particulelor este măsurat in micrometri şi
reprezintă caracterul statistic studiat, iar frecvenţa claselor reprezinta procente de
masă din masa totală de particule care au diametre cuprinse în acea clasă:
d, µ m <1,4 [1,4-2,3) [2,3-4,0) [4,0-5,7) [5,7-7,4) [7,4-9,6) [9,6-12,5) [12,5-16,2)
Diam. [24,2 [24,4 [24,6 [24,8 [25,0 [25,2 [25,4 [25,6 [25,8
mm - - - - - - - - -
24,4) 24,6) 24,8) 25,0) 25,2) 25,4) 25,6) 25,8) 26,0)
Frecve 5 13 24 19 14 10 8 5 2
nta
Frecve 5 18 42 61 75 85 93 98 100
nta
cumul
ata
Media Aritmetica (MEDIE)
X
1 k
∑x
k
N = ∑ ni X = i ⋅ ni
i =1
N i =1
Daca datele sunt colectate in tabele (nu grupate in serii), media si dispersia
se calculeaza cu relatiile:
N
∑x i
X= i =1
N
Modul
Daca variabila statistica este discretă, se numeşte
mod al serie statistice valoare (valorile) pentru care
efectivul este cel mai mare.
În cazul unei serii statistice asociată unei variabile
continue pentru care observaţiile au fost grupate în
clase, numim clasa modală clasa in care efectivul
este cel mai mare.
Conform acestei definiţii în exemplul prezentat clasa
modala este [24,6 24,8].
Mediana
Se numeşte mediana unei serii statistice numarul real,
notata Me pentru care jumatate din unităţile statistice au
o valoare a caracterului studiat mai mica sau egală cu
Me iar jumatate din unitatile satistice au o valoare mai
mare decat Me.
∑ n (x − x)
i i
2
σ2 = i =1
k σ = σ2
∑n i =1
i
∑ (x − X ) i
2
σ2 = i =1
∑ (x − X )i
2
σ2 = i =1
N −1
Daca este vorba despre o SELECTIE dintr-o populatie, N fiind numarul de date al
selectiei. In acest caz media utilizata este doar o estimatie a mediei reale a
populatiei, medie ce este necunoscuta.
Serii cronologioce