Sunteți pe pagina 1din 19

Prelucrarea primara a datelor

experimentale:
Statistica descriptiv

Colectarea datelor
Observaiile se refer la o mulime ce poart numele de
populaie sau mas statistic.
Fiecare element al acestei mulimi este o unitate statistic
sau un element.
Dac acest caracter este cantitativ (putndu-i-se asocia un
numr real ce reprezint msura lui) el se mai numete
variabil statistic discret, dac nu poate lua dect
anumite valori, sau variabil statistic continu dac
poate lua orice valoare ntr-un interval dat.
Observaii: exhaustive (ntreaga populaie) sau selecii

Organizarea datelor
Tabelele statistice i reprezentrile grafice.

Analiza datelor
Pentru a reflecta informaia ntr-un mod sintetic se
utilizeaz un numr relativ mic de valori numerice numite
caracteristici. Aceste mrimi poart i numele de
statistic.
Mrimile caracteristice cele mai importante sunt media,
care este o msur a localizrii valorilor seriei statistice, i
dispersia, ce furnizeaz informaii asupra mprtierii
observaiilor n jurul mediei.

Interpretare
Interpretarea rezultatelor analizei poate avea diverse forme
printre care i generalizarea rezultatelor obinute pentru o
selecie la ntreaga populaie; aceast direcie este numit
statistic inferenial.
Serii statistice cu o variabil discret
Tabloul statistic: simpla enumerare a valorilor variabilei
statistice
Atunci cnd numrul de date este foarte mare este mai
comod s se grupeze formnd SERIA STATISTIC
Numr de reparaii, xi

Numr de pompe, ni

40

33

15

10

Reprezentare grafic
fi

ni
N

N ni

Frecvena relativ

i 1

Numr de reparaii, xi

Frecvene, ni

40

33

15

10

0,40

0,33

0,15

0,10

0,02

Frecvene relative, fi

k= nr. de
valori
distincte ale
caracterului
statistic

50
40
ni

30

Diagrama cu
bastoane

20
10
0

3
xi

Funcia de repartiie
Fie seria statistic definit de perechile (xi, ni).
Definiie
Se numete funcie de repartiie a seriei statistice,
funcia F care asociaz oricrei valori reale x, numrul
total de uniti statistice (elemente ale seriei) a cror
valoare xi este mai mic sau cel mult egal cu x.
Notaia este:

F ( x ) ni
xi x

ntr-o reprezentare ortogonal funcia F(x) este o funcie n


trepte, cresctoare pe mulimea numerelor reale. Aceasta
funcie este numit i funcia cumulativ a frecvenelor
seriei.

Numr de reparaii, xi

Frecvene, ni

40

33

15

10

Frecvene relative, fi

0,40

0,33

0,15

0,10

0,02

Frecvene relative
cumulative

0,40

0,73

0,88

0,98

1,00

40

73

88

98

100

Frecven cumulativ

Serii statistice de variabile continue


O variabil continu poate lua orice valoare ntr-un interval
i atunci nu mai este semnificativ calculul frecvenei
valorilor izolate, n special n cazul seriilor mari. n aceasta
situaie se consider clase caracterizate de o valoare
minim i o valoare maxim ale variabilei statistice. Clasa
i se definete prin limita ei inferioar xi-1 i limita
superioar xi (xi-1 < xi). Intervalul xi - xi-1 este amplitudinea
clasei, iar valoarea ci =(xi-1 + xi)/2 este centrul clasei.
xi-1

ci

xi

Pentru valorile de la limita dintre clase se alege o


convenie de includere n una dintre clase. De exemplu
valoarea xi-1 face parte din clasa i, iar valoarea xi nu
face parte (este inclus n clasa i+1).

Ex: O main fabric tije cilindrice de fier pentru betonul armat, cu diametrul
teoretic de 25 mm. Dintr-un eantion de 100 piese luat la ntmplare s-au
verificat diametrele.
Diametru, mm

Efectiv, ni

[24,224,4)

[24,424,6)

[24,624,8)

[24,825,0)

[25,025,2)

[25,225,4)

[25,425,6)

[25,625,8)

[25,826,0]

13

24

19

14

10

Clase de amplitudini neegale


Dup cum se observ, suprafeele dreptunghiurilor sunt
proporionale cu efectivul claselor. Ordonatele se vor
modifica pentru a obine efectivul clasei ca produs dintre
valoarea ordonatei i lrgimea clasei citit pe abscis.
Practic se mparte efectivul la lrgimea clasei pentru a
afla nlimea acesteia n histogram.

Exemplu
Distribuia granulometric n baza mas a carbonatului de calciu precipitat este
msurat cu un granulometru cu laser. Rezultatele sunt prezentate pe clase
granulometrice n care diametrul particulelor este msurat n micrometri i
reprezint caracterul statistic studiat, iar frecvena claselor reprezint procente
de mas din masa total de particule care au diametre cuprinse n acea clas:
d, m

<1,4

[1,42,3)

[2,34,0)

[4,05,7)

[5,77,4)

[7,49,6)

[9,612,5)

[12,5-16,2)

Frecv, %
mas

2,1

3,2

3,3

3,4

4,9

8,3

12,2

14,5

d, m

[16,221,1)

[21,127,4)

[27,435,6)

[35,646,2)

[46,260,0)

[16,221,1)

[21,127,4)

[27,4-35,6)

Frecv., %
mas

14,5

12,9

10,1

6,9

3,7

14,5

12,9

10,1

FUNCIA DE REPARTIIE
Dac X este o variabil statistic continu, funcia F care
asociaz oricrei valori reale x un numr de valori ale
variabilei statistice care sunt strict mai mici dect x, este
numit funcie de repartiie a seriei statistice.
Diametru, mm

[24,224,4)

[24,424,6)

[24,624,8)

[24,825,0)

[25,025,2)

[25,225,4)

[25,425,6)

[25,625,8)

[25,826,0]

Frecvena

13

24

19

14

10

Frecvena
cumulat

18

42

61

75

85

93

98

100

Media Aritmetic (MEDIE)


1
X
N

N ni
i 1

X
k

ni

i 1

Pentru serii de variabil continu


1
X
N

ni

i 1

Dac datele sunt colectate n tabele (nu grupate n serii), media i


dispersia se calculeaz cu relaiile:
N

x
i 1

Media armonic (pt. date n tabel)


xarmonic

N
1 / x1 1 / x2 ... 1 / x N

Media armonic (pt. date serie cu k valori)

xarmonic

n1 / x1 n2 / x2 ... nk / xk

Pentru o variabil statistic definit prin clase, valorile


xi se nlocuiesc cu centrele claselor, ci.

Mediana
Se numete mediana unei serii statistice numrul real, notat
Me pentru care jumtate din unitile statistice au o valoare a
caracterului studiat mai mic sau egal cu Me, iar jumtate
din unitile statistice au o valoare mai mare dect Me.
Pentru o variabil continu, mediana se determin direct din
reprezentarea grafic a funciei de repartiie, citind valoarea
abscisei ce corespunde unui efectiv cumulativ N/2.

Mod
Daca variabila statistic este discret, se numete mod al
serie statistice, valoarea (valorile) pentru care efectivul este
cel mai mare.
n cazul unei serii statistice asociat unei variabile continue
pentru care observaiile au fost grupate n clase, numim
clasa modal clasa n care efectivul este cel mai mare.
Conform acestei definiii n exemplul prezentat clasa
modal este [24,6 24,8].

Dispersia
Cel mai important parametru ce caracterizeaz mprtierea este dispersia.
Aceasta este o msur a abaterii valorilor seriei statistice fa de medie.
Se numete dispersie a unei serii statistice (xi, ni) media ptratelor abaterilor fa
de medie, notata cu 2 :

2
n
(
x

x
)
i i
i 1

n
i 1

Pentru o variabil statistic definit prin clase, valorile xi se nlocuiesc cu centrele


claselor, ci.
Se numete abatere medie ptratic rdcina ptrat din dispersie

S-ar putea să vă placă și