Sunteți pe pagina 1din 37

Bazele cercetrii experimentale i controlul de calitate al produselor

3. Erori de determinare n tiina materialelor


3.1. Erori sistematice i erori ntmpltoare
Orice determinare, prin orice metoda de analiza, n general orice msurtoare, prin
orice mijloc, este supusa erorilor.

Erorile pot fi sistematice i accidentale1


In afara de erori n sensul menionat, care se produc normal n msurtori, analiza
etc., exista i greeli grosolane, cauzate de neatenie, intervenie exterioara nedorit etc.
Acestea nu fac obiectul discuiei de faa.
Erori sistematice sunt acele erori care se produc ntotdeauna intr-un anumit sens. De
exemplu, valorile gsite la msurtorile repetate sunt ntotdeauna mai mari (sau mai mici)
dect valoarea reala.
Erorile accidentale se produc n ambele sensuri i sunt inerente i inevitabile.
Efectund msurtori repetate, rezultatele gsite sunt apropiate intre ele dar nu sunt identice,
unele sunt mai mici altele mai mari.
Principalele categorii de erori care pot afecta analizele chimice sunt:
a) erori legate de neomogenitatea materialului de analizat;
b) erori de msur, respectiv erori legate de balana analitica, de aparatele indicatoare
optice, electrochimice, sau de alta natura etc.
c) erori legate de natura procedeului folosit.
Din toate aceste trei categorii se pot produce att erori sistematice cit i erori
accidentale.
Erorile sistematice se datoreaz unor cauze care pot fi descoperite i pe aceasta baza
pot fi eliminate. Ele pot fi cauzate de prelevarea unor probe nereprezentative din materialul
analizat neomogen2, imperfeciunea sau dereglarea unui aparat, prezenta unor impuriti n
reactivi, concentraia incorect stabilita a etalonului etc.
Erorile accidentale se datoreaz faptului ca, daca este posibila meninerea constanta a
unui anumit numr de factori care acioneaz asupra rezultatului operaiei avuta n vedere, o
infinitate de ali factori scap posibilitii de a fi stpnii i provoac diferenele constatate intre
msurtori. Erorile accidentale se produc i intr-un sens i n celalalt. Fiecrei erori produsa
n afar de erori n sensul menionat, care se produc normal n msurtori, analiz etc., exist i greeli
grosolane, cauzate de neatenie, intervenia exterioar nedorit etc. Acestea nu fac obiectul acestei discuii.
2 Pentru prelevare s-au instituit tehnici speciale stabilite pe criterii statistice. Ele se bazeaz pe
omogenizarea cit mai buna a materialului de analizat, luarea de mici probe din diferitele poriuni ale
acestuia i unirea lor intr-o proba globala.

Mihai Buzatu

intr-un sens, n cazul unui numr foarte mare de msurtori, ii corespunde o eroare egala i de
semn contrar. Deci n cazul unui numr foarte mare de determinri repetate erorile accidentale
se anuleaz.
n timp ce erorile sistematice sunt relativ mai mari, erorile accidentale, sunt relativ mai
mici. Erorile accidentale nu depesc, practic, o anumita valoare, rmnnd cuprinse intre
anumite limite, n funcie de natura materialului cercetat, aparatura i utilajul folosite, procedeu,
operator etc. Erorile accidentale mai mici sunt i cele mai multe, cele mai des ntlnite. Cu cit o
eroare are o valoare mai mare cu att ea apare mai rar. Cele doua nsuiri menionate sunt de
o mare nsemntate practica. Putem evalua, pe baza unei serii de msurtori repetate, limitele
n care variaz practic erorile, respectiv domeniul de mprtiere al rezultatelor individuale, la
care ne putem atepta. De asemenea putem decela (pune n evidenta) msurtorile cu valori
anormale, adic cele care au valori n afara limitelor practice ale domeniului de mprtiere al
procedeului i putem interveni spre a elimina cauzele care le produc (oboseala, dereglarea
unui aparat, greeli ale analistului etc).
La o analiza mai atenta ne dam seama ca exista o anumita ntreptrundere intre erorile
sistematice i cele accidentale i trebuie precizate condiiile n care se face definirea situaiei.
s ne referim de pilda la un mare numr de laboratoare care fac analiza aceluiai component,
n acelai material, prin aceeai metoda. Limitele domeniului de mprtiere al rezultatelor
tuturor laboratoarelor vor fi desigur mai largi dect limitele de mprtiere ale rezultatelor unui
singur laborator. Intervin n acest caz n plus ca surse ale variabilitii: diversitatea operatorilor
analiti, a condiiilor de lucru n diferitele laboratoare, a preparrii i etalonrii etc. Referindu-ne
la un numr mare de laboratoare, diferenele dintre ele se manifesta sub forma de erori
accidentale mai mari ale ansamblului. Daca ne vom referi insa la numai doua laboratoare, unul
fiind de exemplu laboratorul central de control i celalalt laboratorul la care am observat
rezultate constant mai mari (sau mai mici), diferena se datorez unei erori sistematice fcute
n laboratorul respectiv. Mai menionm de asemenea faptul ca nu arareori, prin simpla
schimbare a domeniului de lucru (concentraie, temperatura etc.), restul condiiilor fiind pstrate
strict aceleai, se poate ntmpla ca o eroare de natura sistematica s treac n accidentala
sau invers.

3.2. Exactitatea i precizia determinrilor


Se spune despre o serie de determinri repetate (selecie) ca aceasta este exact,
daca diferena dintre media aritmetica a determinrilor i valoarea reala este ct mai mica
posibil.

Se spune ca seria de determinri repetate este precis, daca diferena dintre valorile
gsite este cit mai mica posibil.
Exactitatea este data deci de apropierea dintre media aritmetica a determinrilor i
valoarea reala, iar precizia de gruparea strnsa, mprtierea mica a valorilor. Precizia se
apreciaz prin abaterea standard.
Exemplul 3.1.

n tabelul 3.1 se dau rezultatele, n %, a patru serii de cte ase

determinri repetate ale aceluiai compus, prin patru metode diferite. Fig.3.1 ilustreaz situaia.
Metoda A este exacta i precisa. Metoda

B este exacta dar neprecis, din cauza

etalonului. Metoda C este neexact dar precisa din cauza ca titrul soluiei de titrare a fost
stabilit greit. Metoda D este neprecisa i neexact.

Tabelul 3.1.
x = ml reactiv
Metoda A

Metoda B

Metoda C

Metoda D

18,00

18,55

17,65

19,10

18,05

17,60

17,70

18,40

17,95

18,00

17,90

18,10

18,15

18,30

17,65

18,70

17,95

18,25

17,85

18,80

18,20

17,90

17,75

18,50

x = 18,05

x =18,10

x = 17,75

x = 18,60

s2 = 0,011

s2 = 0,113

s2 = 0,011

s2 = 0,12

= 18,10

Fig. 3.1. Exactitatea i precizia metodelor de analiza

3.3. EROAREA ABSOLUTA i EROAREA RELATIVA


Compararea rezultatului gsit (o singura determinare, sau media mai multor
determinri) cu valoarea reala, se face n mod uzual exprimnd eroarea absoluta i eroarea
relativa.
Eroarea absoluta A este diferena dintre valoarea adevrata a unei mrimi i
valoarea obinuta prin msurare (determinare) respectiv x (sau x ).

A = - x

(3.1)

Eroarea relativa R este raportul dintre eroarea absoluta i valoarea adevrata :

R = ( - x) /

(3.2)

Pentru o metoda data, eroarea absoluta poate rmne neschimbata, eroarea relativa va
fi insa cu att mai mica cu cit cantitatea de determinat este mai mare. Semimicro- i
micrometodele au erori relative mai mari ca macrometodele.
Eroarea relativa are avantajul ca nu depinde de unitatea de msura i permite
compararea unor rezultate obinute prin msurarea unor mrimi diferite.
Exemplul 3.2. Eroarea absoluta n cazul metodei A din exemplul 3.1 este
18,1- 18,05 = + 0,05, iar eroarea relativa n procente 0,05 100 / 18,1 = 0,28%. n cazul
metodei C eroarea absoluta este + 0,35, iar cea relativa 0,35 100 / 18,1 = 1,9%.

4. Distribuia normal de frecvene


4.1. Curba normal
Distribuia aa numit normal a variabilei aleatoare X se exprima prin funcia de
frecvente:
f(x)=

1 e 2

( x )2
2

(4.1)

in care parametrii distribuiei sunt media i abaterea standard (fig. 4.1,a).


Funcia de distribuie a distribuiei normale
(fig. 4.1,b) este:
2
( x )

F(x)
=

f (x)dx

2 2

dx 1

(4.2)

Fig. 4.1. Distribuia normala de frecvente.

Modul cum rezulta funcia integrala dintr-o funcie de frecventa a fost artat intuitiv n fig.
1.1. Problema este reluata n fig. 4.2, n care totodat este artata i anamorfozarea funciei
ogivale F(x) (curba a) intr-o dreapt (b). Gradarea scrii ordonatelor (scara de probabilitate P)
este fcuta n aa fel nct pentru abscisele - 3 ; - 2 ; - ; ; + ; +2 ;
+3 ordonatele punctelor corespunztoare de pe dreapta b s fie: 0,13%; 2,27%; 15,87%;
50%; 84,13%; 97,72% i 99,87%. Completnd gradarea cu valori intermediare se obine
reeaua de

Fig. 4.2. Anamorfozarea funciei F(x) intr-o dreapta

probabilitate. Ea este folosita pentru verificarea normalitii

distribuiilor

(punctele

corespunznd frecventelor cumulate trebuie s se nscrie pe o dreapta) i pentru calculul grafic


al mediei aritmetice i abaterii standard n cazul seleciilor mai mari (a se vedea exemplul 7.7).
Valoarea maxima a funciei f(x) se obine pentru x = i este

0.399 . Pe

msura ce variabila ia valori ce se ndeprteaz de x = - intr-o parte i n alta ordonata


corespunztoare descrete. Curba are ca asimptota axa absciselor. Punctele de inflexiune ale
curbei se gsesc la o distanta egala cu de o parte i de alta a axei de simetrie care trece
prin

. Cu cit abaterea standard este mai mica, cu att ordonata maxima este mai mare. Cu cit
abaterea standard este mai mare, cu att curba se turtete, suprafaa de sub curba rmnnd
aceeai (fig. 4.3).
S consideram de pe fig. 4.3 curba normala I cu = 1, de ordonata maxima
0.4

1
1

0.4 . Pstrnd aceleai uniti de lungime pentru cele doua axe s mrim pn la

valoarea = 1,5. Ordonata maxima devine

0.4
1.5

0.267 . S-a obinut astfel curba II mai turtita.

Pentru = 3 ordonata maxima a curbei corespunztoare este


i mai turtita. Curba IV care are = 7 i ordonata
maxima

0.4
7

0.4
3

0.134 . Rezulta curba III

0.057 este cea mai turtita.

Fig. 4.3. Curba normala pentru diferite valori ale lui

O reprezentare rapida i satisfctor de exacta a curbei normale poate fi fcut pe baza


valorilor date n tabelul 4.1 .

Tabelul 4.1.
abscisa

ordonata

ymax

0,5
7
ymax
8

1,0
5
ymax
8

1,5
2,5
ymax
8

2
1

3
1

ymax

ymax

80

4.2. Curba normal normat


Daca se face o micare de translaie a originii coordonatelor n punctul x = , se
obine distribuia normal normat. Variabila aleatoare X devine variabila normata Z.
z =( x - ) /

(4.3)

Funcia de frecventa a variabilei aleatoare normale normate Z va fi


f(z) =

(4.4)

z
2

iar funcia de distribuie va fi :


1

F(z)=P(Z z )
e
=
2 dz

(4.5)

Media i abaterea standard a distribuiei normale normate sunt:


Media = 0 ;

Abaterea standard = 1

(4.6)

n fig. 4.4 se dau graficul funciei de frecventa i funciei de distribuie a distribuiei


normate normale.

Fig. 4.4. Distribuia normala normata

Ordonata maxima este aproape 0,4


1

1 e2
f(0)=
2

(4.7)

0,3989
2

Derivata a II-a:
f(z)=(z2 1)f(z)
se anuleaz pentru z = 1 i z = -1. Deci curba reprezentnd distribuia normala normata are
punctele de inflexiune de o parte i de alta a originii la o distanta egala cu 1.
n tabelul I din anexe se dau ordonatele curbei normale normate f(z).
Exemplul 4.1. S se gseasc ordonata corespunztoare abscisei z = 0,87. Se
urmrete n jos coloana z i se gsete 0,8 apoi se urmrete pe orizontala rndul n care se
afla aceasta valoare pn se ajunge la coloana 0,07. Se citete f(z) = 0,2732.
Ordonata unui punct oarecare de pe curba F(x) este egala cu ordonata punctului
corespunztor de pe curba F(z). Abscisa punctului respectiv se obine cu relaia:
x=z+

(4.8)

4.3. Funcia Laplace


Integrala definita
(z)

(4.9)

2 dz
0

reprezint aria mrginita de curba f(z) n intervalul de la 0 la z, adic aria haurat n fig. 4.5 i
se numete funcia normata a lui Laplace.

Fig. 4.5. Funcia lui Laplace

n tabelul II din anexe sunt date valorile funciei (z) pentru z cuprins intre 0 i 3,9.
Exemplul 4.2. S se gseasc suprafaa sub curba normala a funciei lui Laplace
corespunztoare abscisei z = 1,96. Se caut z = 1,9 apoi pe rndul respectiv la intersecia cu
coloana 0,06 se gsete (z) = 0,475. Aceasta suprafaa reprezint probabilitatea ca valoarea
s se gseasc intre z = 0 i z = +1,96.
Cu ajutorul funciei lui Laplace putem calcula probabilitatea unei abateri fata de medie
intr-o distribuie normala data i invers cunoscnd abaterea unei valori putem calcula
probabilitatea ca aceasta valoare s fac parte dintr-o distribuie cu o medie i o abatere
standard date. Aceste doua genuri de probleme sunt de o foarte mare nsemntate statistica.
Funcia de distribuie F(z) se mai poate scrie
F(z) = 0,5 + (z)

(4.10)

Exemplul 4.3. S se gseasc probabilitatea ca o valoare z s se afle intre z = i


z = +1,96. n exemplul 4.2 s-a gsit probabilitatea ca o valoare s se afle intre z = 0 i
z = 1,96. Pe aceasta baza probabilitatea cutata este F(z) = 0,5 + (z) = 0,5 + 0,475 =
= 0,975.
Exemplul 4.4. Care este probabilitatea ca o valoare s se afle intre z = -1.96 i
z = + 1,96? ntruct (z) = (-z) vom avea probabilitatea = 0,475 + 0,475 = 0,950 respectiv
95%.

4.4. Importana distribuiei normale


Gauss a ajuns la stabilirea legii normale cutnd legea la care se supun erorile de
observaie.
Din studiile i din verificrile fcute ulterior reiese ca distribuia erorilor accidentale
urmeaz n general n cele mai multe cazuri, cu o anumita exactitate, legea normala.
O mare nsemntate are curba normala deoarece proprietile sale matematice sunt
simple i calculele aferente sunt uoare. Multe distribuii ntlnite n practica sunt de tip
convex i se pot considera n prima aproximaie normale. Teoria curbei normale poate fi
folosita la ajustarea curbelor de alte tipuri, multe distribuii pot fi aduse la forma aproximativ
normala prin schimbri convenabile de variabila. Astfel o distribuie asimetrica n raport cu
variabila X poate fi simetrica n raport cu X

sau cu lg X.

n ceea ce privete analiza chimica, n general, erorile diferitelor procedee au o


distribuie normala. n unele cazuri rezultatele analitice se distribuie logonormal3.
O deosebita importanta prezint faptul ca oricare ar fi legea de distribuie a unei
variabile aleatoare X, mediile seleciilor de volum mai mare ca 30 de valori au o distribuie
normala. Aceasta ultima nsuire cu care ne ocupam n subcapitolul 6.2, arata n toata
plintatea ei marea importanta a curbei normale.

4.5.
4.5.1.

DISTRIBUTII N LEGATURA CU DISTRIBUTIA NORMALA4


DISTRIBUTIA

S consideram funcia de frecventa exprimata prin relaia (4.4). Notam suma ptratelor
variabilei aleatoare normale normate cu 2:
2
2 = z12+ z2 22+ z3 +z
f (in total f valori)

(4.11)

Se demonstreaz ca variabila 2 are o distribuie 2 cu f grade de libertate (cele f


valori independente nefiind supuse nici unei restricii liniare).

Fig. 4.6. Distribuia funciei de frecvente a distribuiei 2

Domeniul de variaie al funciei de frecventa f( 2) cuprinde mulimea valorilor lui 2


care satisface inegalitile

Mentionam astfel cazurile: a) un interval foarte larg de concentraii, b) metodele semicantitative, c) un coninut n
apropiere de 0% sau 100%, d) msurtorile de timp.

Aceste distribuii sunt utilizate la testarea (verificarea) ipotezelor statistice. Deosebit de importante n practica
statistica sunt distribuiile t i F. Faptul este bogat ilustrat n exemplele din capitolele urmtoare.

0 < 2 <+

(4.12)

adic numai valori pozitive. n fig. 4.6 se dau curbele reprezentnd f( 2) n raport cu numrul
gradelor de libertate f.
Distribuia variabilei aleatoare 2 se vede ca tinde lent ctre distribuia normala, cnd
numrul gradelor de libertate tinde ctre .
Integrarea funciei de distribuie intre limitele 0 2 duce la formarea unei fraciuni P
din suprafaa totala. Aceasta fraciune P exprima probabilitatea ca o valoare

s se

gaseasca n intervalul 0P . Pentru utilizarea n practica se dau n tabelul III (anexe), valorile
lui 2 n funcie de P i f.

4.5.2. Distribuia dispersiei


Sa consideram o selecie de n valori distribuita
normal: x1,x2,,xn
Daca cunoatem media colectivitii generale i nu cunoatem dispersia 2, atunci
estimata dispersiei s2 este:

(x )
s 2=

(4.13)

nmulind i mprind partea dreapta a egalitarii cu 2, obinem:


s 2 =

( x )2 2

x 2

(4.14)

Se vede ca (x - / )2 nu este altceva dect z2, care este o variabila 2 cu f = n


grade de libertate. Rezulta ca se mai poate scrie
s2 =2

(4.15)

n
Daca nu cunoatem nici media colectivitii generale, atunci dispersia colectivitii
generale se estimeaz prin relaia
s =
2

( x x)
n1

n1

x x

in care x este

n1

(4.16)

n . n acest caz numarul gradelor de libertate al marimii 2 exprimata n


raport de x este f = n 1.

Deviatiile x x nu sunt independente, suma lor trebuind s fie zero (1.20). Aceasta
echivaleaza cu impunerea unei restrictii liniare celor n observatii. De unde f = n 1.
Reiese ca distributia variabilelor s2 i s2 poate fi obtinuta din distributia 2 printr-o
transformare convenabila.

* A se

vedea subcapitolul 6.3.2, relaia (6.15). Daca abaterile se exprima fata de x, numitorul

este n 1.

4.5.3.DISTRIBUTIA t
Analog cu distribuia 2, distribuia t a fost propusa de Student (pseudonimul lui
W.S.Gosset, chimist statistician englez), pentru statistica seleciilor mici:
t=

x
s

(4.17)

n
i exprim deviaiile mediilor de selecie x , fata de media ntregii populaii , msurate n
s
abaterea standard a mediilor de selecie, v. (6.8) .
n
Daca nmulim fracia de la numitor cu

obinem:

x z
t= s

(4.18)

s
n

Pe baza relaiilor (4.19), (4,15) i (4.16) avem:


s2

atunci t devine:
t=
z x
f

(4.20)
2

Dup cum se vede, mrimea t nu depinde dect de numrul gradelor de libertate f.


Pe baza funciilor de frecventa a variabilelor z[f(z)] i 2[f( 2)], independente, se
poate obine funcia de frecvente a variabilei t, respectiv f(t). n fig. 4.7 sunt reprezentate
funciile de frecvente ale variabilei t pentru numrul gradelor de libertate f=1;5 i .

Curbele t sunt simetrice fata de t=0 i se ntind de la t= - pn la t= =+. Pentru


valori mari ale lui f curba se apropie de normala. Pentru f = se obine curba normala. Funcia
f(t) se apropie mai ncet de axa absciselor dect curba normala, mai ales pentru valori f mici.

Fig. 4.7. Funcia de frecvente a distribuiei t

In fig. 4.8 sunt date valorile lui t n funcie de probabilitate i numrul gradelor de
libertate. Pentru P = 95% de exemplu o valoare x nu se va afla n domeniul 1,96 ci intrun interval cu att mai larg cu cit numrul de msurtori este mai mic. Cnd numrul de
msurtori este peste 30, intervalul tinde vizibil spre 1,96 .
Valorile lui t n funcie de probabilitatea P i numrul gradelor de libertate, pentru
distribuia normata, =1, sunt date n tabelul IV din anexe.

Fig. 4.8. Limitele de integrare ale lui t(P,f) n funcie de numarul gradelor de libertate

4.5.4. Distribuia raportului a dou dispersii sau distribuia F


Este vorba despre raportul a doua dispersii considerate ca estimeaz aceeai
dispersie generala a ntregii colectiviti.
2 doua dispersii
Dintr-o colectivitate generala se extrag doua selectii. Fie s 1 i s2 cele

corespunztor acestor selecii5:


x x 2
x x 2

i
1

j
2
2
2
s1 =
s2 =
n2 1
n1 1

(4.21)

Raportul lor este


F=

s 12
s 22

(4.22)

Conform relaiei (4.19) dispersiile se pot scrie:


s12

s22 =

2 x

2
1

f1

2 x

n care f1 = n1 1

(4.23)

n care f2 = n2 1

(4.24)

2
2

f2

nlocuind vom avea:

F=

s1 2
2

s2

x1 f 2

(4.25)

x2 f1

Examinnd acest raport vedem ca el nu conine dispersia colectivitii generale 2, de


unde rezulta ca distribuia acestui raport nu depinde dect de numrul gradelor de libertate f 1 i
f2 ale celor doua dispersii.
Pe baza faptului ca dispersiile s12 is2 sunt independente, i pe baza expresiei funciei
de frecventa a acestora, se obine funcia de frecventa a variabilei F respectiv f(F).
In fig. 4.9 sunt reprezentate funciile de frecventa ale variabilei F pentru f1 = 10 i f2 =
40;50;. Curbele sunt de forma oblica avnd un maxim. Cu creterea lui f2 se ridica maximul,
insa nu se tinde ctre curba normala.
Pe msura creterii numrului de grade de libertate, estimaiile s 2 tind spre 2. De aici
rezulta ca, ambele marini s12i s2 22tinznd spre , raportul F tinde spre 1.

A se vedea subcapitolul 6.3.2

Figura 4.9. Funciile de frecven ale distribuiei F pentru cteva


cazuri de f1 constant i f2 variabil

Din distribuia f(F) se vede ca valorile F, care sunt ntotdeauna pozitive, pot varia intre
F = 0 i F = , la integrarea intre F = 0 i FP obinndu-se o poriune P din ntreaga suprafaa.
Acesta poriune reprezint probabilitatea ca valoarea gsit F =

s 12 sa fie intre 0 i F . Aceste


P
s 22

limite ale integrrii F(P,f1,f2), sunt date de tabelele V i VI din anexe, pentru P=95% i 99%, n
dependenta de f1 i f2. Raportul F este astfel formulat incit dispersia cea mai mare s fie luata
la numrtor. n cazul nostru s12avnd f1 grade de libertate > s2 . Interpolarea pentru valorile F
care nu se gsesc (de exemplu cum ar fi intre 24 i 50) se fac pe baza faptului ca F este
funcie de 1 / f .
Curbele au simetrie reciproca, astfel F se poate nlocui cu 1/ F nlocuind n acelai timp
f1 cu f2 i P cu 1- P.
Se poate demonstra ca distribuiile 2, t i z sunt cazuri particulare ale distribuiei F
pentru f2 = , f1 = 1 i respectiv f1 = i f2 = 1.

F(P, f1,)=

x 2 P, 1
; F(P,1,f2)=t2 P, ; F P, ,1
f f1

Relaiile date se obin din relaiile (4.25) i (4.20).

1
2
z

(4.26)

Exemplul 4.5. s se verifice relaiile (4.26) prin cte un exemplu.


2
x 95%,8 15,5 1,94

a) F(95%,8,) = 1,94;
8
8

b) F(95%,1,8) = 5,32; t2( 95 %,8) = 2,3062 = 5,32


1
1
1

c) F(95%,,1) =254; 2
2
z z 0,025
z 95%

254

0,063

Valorile necesare calculului s-au luat din tabelele V,III,IV i II din anexe.

5. Alte distribuii de frecvene importante


Se vor trata doua distribuii discrete importante pentru chimia analitica: distribuia
binomiala i distribuia Poisson.

5.1.Distribuia binomoal
O prezentare a distribuiei binomiale a fost fcuta n subcapitolul 2.1.2. expresia (2.7)
este termenul general al dezvoltrii binomului.

(p + q)n

(5.1)

Daca se fac n total N serii de cte n determinri vom avea:

N( p + q)n

(5.2)

Termenul general al dezvoltrii binomului (q + p)n fiind

n x

Pn x C n q

nn 1n 2 n x 1
1 2 3 x

n x

(5.3)

Daca nmulim numrtorul i numitorul cu produsul


(n x)(n x 1)(n x 2)1 = (n x)! vom avea:
Pn(x)= n!
x!p

xn!

(5.4)

q n x

in care variabila x, care reprezint frecventa evenimentului dorit n cadrul fiecrei serii, poate
lua valorile x = 0;1;2;3;kn.
Suma valorilor Pn(x) este 1:

P (x)
1

x0

x0

n!

p q

(n x)

P (0) P (1) ... P (n)


n

x!(n x)!

(5.5)

Pentru calculul diferitelor valori este foarte utila o relaie de recurenta. s consideram
doua valori succesive x i x+1 ale variabilei aleatoare X i Pn(x) i Pn(x+1) probabilitile
corespunztoare. Vom avea:
n!
(x 1)!n (x 1)!
Pn (x 1) p

Pn (x)

( x1)

n(

x1)

n!
x
(n
x!(n x)! x) p q

nx

x1

p
(5.6)

Parametrii distribuiei binomiale (p + q) n sint:


Media = np

(5.7)

Abaterea standard = npq

(5.8)

Ajungem la aceste relaii pe baza momentelor de ordinul 1 i 2.


Media, respectiv cantitatea np reprezint numrul ateptat al producerii
evenimentului n cazul celor n observaii.
La exprimarea relativa (o exprimare relativa este i cea procentuala) vom avea :

=p

pq

=n

(5.9)

(5.10)

adic media este independenta de mrimea seriei, dar abaterea standard este cu att mai
mica cu cit n este mai mare.
Forma distribuiei binomiale depinde de valorile p i q i de valoarea exponentului n.
Daca p = q, distribuia este evident simetrica deoarece termenii echidistante la cele doua
capete ale dezvoltrii sunt egale. Daca p i q nu sunt egali distribuia este asimetrica. Daca p

= q, efectul creterii lui n este mrirea dispersiei i a mediei. Daca p nu este egal cu q,
creterea lui n n afara de efectele menionate micoreaz asimetria. Tendina spre simetrie
poate fi observata n fig. 5.1, n care se dau poligoanele de frecvenele repartiiei binomiale (0,9
+ 0,1)n pentru n egal cu 10, 50, 100. Se demonstreaz (si faptul reiese clar din fig. 5.1) ca
distribuia binomiala are ca limita distribuia normala, daca n este suficient de mare pentru a
face

p q mic n comparaie cu abaterea standard npq .


Pentru o valoare p data, numrul minim de observaii (ncercri) n, ca distribuia s
aib aspectul normal se obine prin relaia:
9
n=
pq
De exemplu pentru p = 0,1 vom avea n =

(5.11)
9
0,1
0,9

=100.

Distribuia normala care aproximeaz distribuia binomiala are media = np i


dispersia 2 = npq.

Fig. 5.1. Poligoane de frecventa ale repartiiei binomiale

In analiza chimica tratarea cantitativa a unor observaii calitative reprezint distribuii


binomiale. Daca numrul observaiilor este suficient de mare, distribuia poate fi tratata ca
normala. Se fac ncercri calitative i rezultatele se noteaz pozitiv sau negativ. Daca se are n
vedere numrul de ncercri fcute i n cadrul acestora numrul de rezultate pozitive, operaia
este o tratare cantitativa.

Exemplul 5.1. Intr-un laborator uzinal, la determinarea n serie n decursul timpului a unui
anumit component, pentru sigurana se fac cte doua determinri paralele. Intr-o perioada fixa
n care se urmrete calcularea stabilitii procesului analitic, s-a gsit ca n 200 de determinri
duble (paralele), n 14 cazuri a fost necesara o a treia repetare pentru a avea doua valori
apropiate. Se cere s se calculeze media i abaterea standard . Vom avea:

p 100

p q 100
7 93 100
14
n
200
100 7%;
18%
200

5.2. DISTRIBUTIA POISSON


Distribuia Poisson este distribuia evenimentelor rare:
lim P (x)
n

x!

(5.12)

Se ajunge la aceasta relaie daca n relaia (5.1) nlocuim p cu / n i q cu 1 ( - n)


n care este o valoare constanta pozitiva si-l facem pe n s creasc nelimitat.
In relaia (5.12) este totodat media distribuiei (frecventa medie ateptata a apariiei
evenimentului rar intr-o serie de ncercri), x = 0,1,2 n este numrul cazurilor favorabile intro serie de ncercri, iar e este baza logaritmilor neperieni.
Dup cum se vede n nu reiese explicit n relaia (5.12).
Termenii succesivi ai binomului corespunztori lui x = 0, 1, sunt:

e ;

e ;

0!

1!

;
2

2!

etc.

3!

Limita lui (p + q)n va fi deci:

e (1

(5.13)

...)
1!

2!

3!

Pentru calculul termenilor se poate folosi formula de recurenta:

Pn (x 1)
P (x)

( x1)

(x 1)!e

x!e

xn 1

P (x 1) P (x)

(5.14)

x1

Media i abaterea standard - care se obtin pe baza momentelor sint:

(5.15)

(5.16)

Forma distribuiei Poisson pentru diferite valori ale lui poate fi vzuta n fig. 5.2.
pn la = 4 asimetria este foarte pronunata dup care descrete treptat. Pentru valori mari

ale lui , distribuia Poisson poate fi aproximata prin distribuia normala cu accesai medie =
i cu dispersia

2 = . Din punct de vedere practic daca 9 distribuia Poisson poate fi tratata ca normala.
Fig. 5.2. Poligoane de frecventa ale distribuiei Poisson

O serie de procedee ale chimiei analitice moderne se bazeaz pe msurarea unor


marii discrete. Exemple: numrarea impulsurilor n radiochimie, msurarea cuantelor Rontgen
n analiza spectrala Rontgen, numrarea elementelor de structura la integrarea seciunilor etc.
n toate aceste procedee, numrul evenimentelor posibile (de exemplu numrul nucleelor de
atomi) este foarte mare, n timp ce numrul evenimentelor ce se produc (descompunerea unor
nuclee) este foarte mic. Datorita producerii rare compoziia probei nu se modifica vizibil n
intervalul de timp observat.
Daca aceeai ncercare se repeta de mai multe ori, mrimea valorilor n dependenta de
frecventa se supun distribuiei Poisson.

Exemplul 5.2. Rutheford i Geiger au msurat emisia a unei substane radioactive.


S-au nregistrat numrul de particule observate intr-o unitate de timp
(7,5 s). Se noteaz cu ni numrul de intervale de timp n care s-au observat x particule ..
n total s-a observat

n n

intervale de timp. Calculul valorii medii a dat = 3,8779. Se

cere s se calculeze frecventele observate i probabilitile teoretice considernd ca distribuia


este o distribuie Poisson. Datele sunt trecute n tabelul 5.1.
Calculul mediei:

57 0 203 1 383 2 525 3 10 10 11 4 12 0 13 1 14 1

3,877871

2612

Calculul probabilitilor teoretice conform relaiei (5.14)

pentru x = 0 avem n Pn(0) = n e- = 2612 e- 3,877871 = 54,1:

pentru x = 1 avem n Pn(0 +1) = Pn(0)


54,1 3,877871 209,8
01

3,877871
pentru x = 2 avem n P (2) P (1)
209,8
406,8
n
n
11
2

3,877871
pentru x = 3 avem n P (3) P (2)
406,8
525,8
n
n
21
3

3.877871
pentru x = 4 avem n P (4) P (3)
525,8
508,8

31

Celelalte valori sunt trecute direct n tabelul 5.1. Concordanta intre valorile observate
i cele calculate apare ca foarte buna.
Tabelul 5.1
x

f (x) Pn (x) 2612


Numrul
produceri

de
a

evenimentului
n unitatea de
timp x

3,877871

Numrul
de unitari de
timp
(frecventa
observata)

x!

3,877871

Pn(x)

Numrul

calculata

produceri

Pentru

evenimentului

=3,877871

n unitatea de

timp x

n =2612

ni
57

54,1

203

de
a

Numrul
de unitari de
timp
(frecventa
observata)

Pn(x)
calculata
Pentru

=3,877871
i

n =2612

ni
49

69,0

209,8

27

29,7

383

406,8

10

10

11,5

525

525,8

11

3,8

532

508,8

12

1,2

408

394,8

13

0,3

273

255,2

14

0,0

139

141,9

n =2612
i

(x) =

=2612,7

ESTIMAREA PARAMETRILOR
6. Selecii
6.1. Estimarea parametrilor populaiei pe baza seleciilor
Neputndu-se studia ntreaga populaie a unei variabile, caracteristicile sale se obin
prin intermediul caracteristicilor analoge ale variabilei de selecie. Corectitudinea datelor
obinute depinde de corectitudinea efecturii seleciei. n timp ce media, mediana, modul,
abaterea standard ale ntregii populaii sunt valori constante, valorile respective estimate pe
baza seleciilor sunt variabile aleatoare. Spunem ca valorile ce le stabilim pe baza seleciilor

sunt estimate ale caracteristicilor ntregii populaii daca ele converg n probabilitate ctre
acestea, cnd volumul de selecie n tinde ctre volumul ntregii popularii. Estimarea este
calculul aproximativ al caracteristicilor n sensul ca valorile obinute reprezint cu o anumita
probabilitate caracteristicile ntregii popularii. De reinut este ca problema se pune intr-un mod
aparte: noi nu cunoatem a priori distribuia populaiei (teoretica) ci pornim de la variabila de
selecie, determinam caracteristicile ei i cercetam n ce condiii valorile obinute aproximeaz
suficient caracteristicile corespunztoare ale variabilei teoretice. Operaia de stabilire a
corespondentei unei distribuii teoretice cu scara valorilor concrete ale unei distribuii empirice
(selecie) se numete ajustare. Valorile numerice ale variabilei, prin care descriem o selecie,
reflecta pe de o parte nsuirile proprii, izolate, ale indivizilor ce alctuiesc selecia, nespecifice
populaiei, iar pe de alta, n mod necesar, reflecta i acele proprieti care determina
caracteristica studiata. n condiiile unei operaii de masa care asigura omogenitatea practic a
ntregii colectiviti i a unei stabiliti statistice ale caracteristicilor urmrite, valorile numerice
privind indivizii care alctuiesc selecia, reflecta i aceste caracteristici eseniale, ele punndusi amprenta pe legea distribuiei seleciei. Seleciile trebuie s fie constituite sau cum se mai
spune extrase reprezentativ. Precizia estimaiilor ce se fac pe baza lor depinde de modul cum
sunt constituite, de volum, de expresia statistica (relaia) ce se formuleaz pe baza datelor
seleciilor. Principalele moduri de a constitui o selecie din populaii omogene sunt: selecie non
- exhaustiva (sau repetata, adic dup cercetare selecia este napoiata populaiei) 6

exhaustiv. Daca colectivitatea nu este omogena se mparte n subcolectiviti omogene (se


stratifica), care se caracterizeaz prin selecii, apoi se pondereaz cu nsemntatea
subcolectivitii n cadrul colectivitii.
Se nelege ca seleciile, prin fora lucrurilor nu pot fi dect discrete, fie ca exprima o
caracteristica discreta, fie ca exprima o caracteristica continua.

6.2. Legea numerelor mari

n cazul cnd populaia este infinit, cum ese situaia n analizele repetate din tiina
materialelor, dei selecia nu se mai ntoarce n populaia din care provine ea este

considerat non exhaustiv. n populaiile finite nentoarcerea seleciilor duce la o uoar


micorare a dispersiilor de selecie.

S-ar putea să vă placă și