Mihai Buzatu
intr-un sens, n cazul unui numr foarte mare de msurtori, ii corespunde o eroare egala i de
semn contrar. Deci n cazul unui numr foarte mare de determinri repetate erorile accidentale
se anuleaz.
n timp ce erorile sistematice sunt relativ mai mari, erorile accidentale, sunt relativ mai
mici. Erorile accidentale nu depesc, practic, o anumita valoare, rmnnd cuprinse intre
anumite limite, n funcie de natura materialului cercetat, aparatura i utilajul folosite, procedeu,
operator etc. Erorile accidentale mai mici sunt i cele mai multe, cele mai des ntlnite. Cu cit o
eroare are o valoare mai mare cu att ea apare mai rar. Cele doua nsuiri menionate sunt de
o mare nsemntate practica. Putem evalua, pe baza unei serii de msurtori repetate, limitele
n care variaz practic erorile, respectiv domeniul de mprtiere al rezultatelor individuale, la
care ne putem atepta. De asemenea putem decela (pune n evidenta) msurtorile cu valori
anormale, adic cele care au valori n afara limitelor practice ale domeniului de mprtiere al
procedeului i putem interveni spre a elimina cauzele care le produc (oboseala, dereglarea
unui aparat, greeli ale analistului etc).
La o analiza mai atenta ne dam seama ca exista o anumita ntreptrundere intre erorile
sistematice i cele accidentale i trebuie precizate condiiile n care se face definirea situaiei.
s ne referim de pilda la un mare numr de laboratoare care fac analiza aceluiai component,
n acelai material, prin aceeai metoda. Limitele domeniului de mprtiere al rezultatelor
tuturor laboratoarelor vor fi desigur mai largi dect limitele de mprtiere ale rezultatelor unui
singur laborator. Intervin n acest caz n plus ca surse ale variabilitii: diversitatea operatorilor
analiti, a condiiilor de lucru n diferitele laboratoare, a preparrii i etalonrii etc. Referindu-ne
la un numr mare de laboratoare, diferenele dintre ele se manifesta sub forma de erori
accidentale mai mari ale ansamblului. Daca ne vom referi insa la numai doua laboratoare, unul
fiind de exemplu laboratorul central de control i celalalt laboratorul la care am observat
rezultate constant mai mari (sau mai mici), diferena se datorez unei erori sistematice fcute
n laboratorul respectiv. Mai menionm de asemenea faptul ca nu arareori, prin simpla
schimbare a domeniului de lucru (concentraie, temperatura etc.), restul condiiilor fiind pstrate
strict aceleai, se poate ntmpla ca o eroare de natura sistematica s treac n accidentala
sau invers.
Se spune ca seria de determinri repetate este precis, daca diferena dintre valorile
gsite este cit mai mica posibil.
Exactitatea este data deci de apropierea dintre media aritmetica a determinrilor i
valoarea reala, iar precizia de gruparea strnsa, mprtierea mica a valorilor. Precizia se
apreciaz prin abaterea standard.
Exemplul 3.1.
determinri repetate ale aceluiai compus, prin patru metode diferite. Fig.3.1 ilustreaz situaia.
Metoda A este exacta i precisa. Metoda
etalonului. Metoda C este neexact dar precisa din cauza ca titrul soluiei de titrare a fost
stabilit greit. Metoda D este neprecisa i neexact.
Tabelul 3.1.
x = ml reactiv
Metoda A
Metoda B
Metoda C
Metoda D
18,00
18,55
17,65
19,10
18,05
17,60
17,70
18,40
17,95
18,00
17,90
18,10
18,15
18,30
17,65
18,70
17,95
18,25
17,85
18,80
18,20
17,90
17,75
18,50
x = 18,05
x =18,10
x = 17,75
x = 18,60
s2 = 0,011
s2 = 0,113
s2 = 0,011
s2 = 0,12
= 18,10
A = - x
(3.1)
R = ( - x) /
(3.2)
Pentru o metoda data, eroarea absoluta poate rmne neschimbata, eroarea relativa va
fi insa cu att mai mica cu cit cantitatea de determinat este mai mare. Semimicro- i
micrometodele au erori relative mai mari ca macrometodele.
Eroarea relativa are avantajul ca nu depinde de unitatea de msura i permite
compararea unor rezultate obinute prin msurarea unor mrimi diferite.
Exemplul 3.2. Eroarea absoluta n cazul metodei A din exemplul 3.1 este
18,1- 18,05 = + 0,05, iar eroarea relativa n procente 0,05 100 / 18,1 = 0,28%. n cazul
metodei C eroarea absoluta este + 0,35, iar cea relativa 0,35 100 / 18,1 = 1,9%.
1 e 2
( x )2
2
(4.1)
F(x)
=
f (x)dx
2 2
dx 1
(4.2)
Modul cum rezulta funcia integrala dintr-o funcie de frecventa a fost artat intuitiv n fig.
1.1. Problema este reluata n fig. 4.2, n care totodat este artata i anamorfozarea funciei
ogivale F(x) (curba a) intr-o dreapt (b). Gradarea scrii ordonatelor (scara de probabilitate P)
este fcuta n aa fel nct pentru abscisele - 3 ; - 2 ; - ; ; + ; +2 ;
+3 ordonatele punctelor corespunztoare de pe dreapta b s fie: 0,13%; 2,27%; 15,87%;
50%; 84,13%; 97,72% i 99,87%. Completnd gradarea cu valori intermediare se obine
reeaua de
distribuiilor
(punctele
0.399 . Pe
. Cu cit abaterea standard este mai mica, cu att ordonata maxima este mai mare. Cu cit
abaterea standard este mai mare, cu att curba se turtete, suprafaa de sub curba rmnnd
aceeai (fig. 4.3).
S consideram de pe fig. 4.3 curba normala I cu = 1, de ordonata maxima
0.4
1
1
0.4 . Pstrnd aceleai uniti de lungime pentru cele doua axe s mrim pn la
0.4
1.5
0.4
7
0.4
3
Tabelul 4.1.
abscisa
ordonata
ymax
0,5
7
ymax
8
1,0
5
ymax
8
1,5
2,5
ymax
8
2
1
3
1
ymax
ymax
80
(4.3)
(4.4)
z
2
F(z)=P(Z z )
e
=
2 dz
(4.5)
Abaterea standard = 1
(4.6)
1 e2
f(0)=
2
(4.7)
0,3989
2
Derivata a II-a:
f(z)=(z2 1)f(z)
se anuleaz pentru z = 1 i z = -1. Deci curba reprezentnd distribuia normala normata are
punctele de inflexiune de o parte i de alta a originii la o distanta egala cu 1.
n tabelul I din anexe se dau ordonatele curbei normale normate f(z).
Exemplul 4.1. S se gseasc ordonata corespunztoare abscisei z = 0,87. Se
urmrete n jos coloana z i se gsete 0,8 apoi se urmrete pe orizontala rndul n care se
afla aceasta valoare pn se ajunge la coloana 0,07. Se citete f(z) = 0,2732.
Ordonata unui punct oarecare de pe curba F(x) este egala cu ordonata punctului
corespunztor de pe curba F(z). Abscisa punctului respectiv se obine cu relaia:
x=z+
(4.8)
(4.9)
2 dz
0
reprezint aria mrginita de curba f(z) n intervalul de la 0 la z, adic aria haurat n fig. 4.5 i
se numete funcia normata a lui Laplace.
n tabelul II din anexe sunt date valorile funciei (z) pentru z cuprins intre 0 i 3,9.
Exemplul 4.2. S se gseasc suprafaa sub curba normala a funciei lui Laplace
corespunztoare abscisei z = 1,96. Se caut z = 1,9 apoi pe rndul respectiv la intersecia cu
coloana 0,06 se gsete (z) = 0,475. Aceasta suprafaa reprezint probabilitatea ca valoarea
s se gseasc intre z = 0 i z = +1,96.
Cu ajutorul funciei lui Laplace putem calcula probabilitatea unei abateri fata de medie
intr-o distribuie normala data i invers cunoscnd abaterea unei valori putem calcula
probabilitatea ca aceasta valoare s fac parte dintr-o distribuie cu o medie i o abatere
standard date. Aceste doua genuri de probleme sunt de o foarte mare nsemntate statistica.
Funcia de distribuie F(z) se mai poate scrie
F(z) = 0,5 + (z)
(4.10)
sau cu lg X.
4.5.
4.5.1.
S consideram funcia de frecventa exprimata prin relaia (4.4). Notam suma ptratelor
variabilei aleatoare normale normate cu 2:
2
2 = z12+ z2 22+ z3 +z
f (in total f valori)
(4.11)
Mentionam astfel cazurile: a) un interval foarte larg de concentraii, b) metodele semicantitative, c) un coninut n
apropiere de 0% sau 100%, d) msurtorile de timp.
Aceste distribuii sunt utilizate la testarea (verificarea) ipotezelor statistice. Deosebit de importante n practica
statistica sunt distribuiile t i F. Faptul este bogat ilustrat n exemplele din capitolele urmtoare.
0 < 2 <+
(4.12)
adic numai valori pozitive. n fig. 4.6 se dau curbele reprezentnd f( 2) n raport cu numrul
gradelor de libertate f.
Distribuia variabilei aleatoare 2 se vede ca tinde lent ctre distribuia normala, cnd
numrul gradelor de libertate tinde ctre .
Integrarea funciei de distribuie intre limitele 0 2 duce la formarea unei fraciuni P
din suprafaa totala. Aceasta fraciune P exprima probabilitatea ca o valoare
s se
gaseasca n intervalul 0P . Pentru utilizarea n practica se dau n tabelul III (anexe), valorile
lui 2 n funcie de P i f.
(x )
s 2=
(4.13)
( x )2 2
x 2
(4.14)
(4.15)
n
Daca nu cunoatem nici media colectivitii generale, atunci dispersia colectivitii
generale se estimeaz prin relaia
s =
2
( x x)
n1
n1
x x
in care x este
n1
(4.16)
Deviatiile x x nu sunt independente, suma lor trebuind s fie zero (1.20). Aceasta
echivaleaza cu impunerea unei restrictii liniare celor n observatii. De unde f = n 1.
Reiese ca distributia variabilelor s2 i s2 poate fi obtinuta din distributia 2 printr-o
transformare convenabila.
* A se
vedea subcapitolul 6.3.2, relaia (6.15). Daca abaterile se exprima fata de x, numitorul
este n 1.
4.5.3.DISTRIBUTIA t
Analog cu distribuia 2, distribuia t a fost propusa de Student (pseudonimul lui
W.S.Gosset, chimist statistician englez), pentru statistica seleciilor mici:
t=
x
s
(4.17)
n
i exprim deviaiile mediilor de selecie x , fata de media ntregii populaii , msurate n
s
abaterea standard a mediilor de selecie, v. (6.8) .
n
Daca nmulim fracia de la numitor cu
obinem:
x z
t= s
(4.18)
s
n
atunci t devine:
t=
z x
f
(4.20)
2
In fig. 4.8 sunt date valorile lui t n funcie de probabilitate i numrul gradelor de
libertate. Pentru P = 95% de exemplu o valoare x nu se va afla n domeniul 1,96 ci intrun interval cu att mai larg cu cit numrul de msurtori este mai mic. Cnd numrul de
msurtori este peste 30, intervalul tinde vizibil spre 1,96 .
Valorile lui t n funcie de probabilitatea P i numrul gradelor de libertate, pentru
distribuia normata, =1, sunt date n tabelul IV din anexe.
Fig. 4.8. Limitele de integrare ale lui t(P,f) n funcie de numarul gradelor de libertate
i
1
j
2
2
2
s1 =
s2 =
n2 1
n1 1
(4.21)
s 12
s 22
(4.22)
s22 =
2 x
2
1
f1
2 x
n care f1 = n1 1
(4.23)
n care f2 = n2 1
(4.24)
2
2
f2
F=
s1 2
2
s2
x1 f 2
(4.25)
x2 f1
Din distribuia f(F) se vede ca valorile F, care sunt ntotdeauna pozitive, pot varia intre
F = 0 i F = , la integrarea intre F = 0 i FP obinndu-se o poriune P din ntreaga suprafaa.
Acesta poriune reprezint probabilitatea ca valoarea gsit F =
limite ale integrrii F(P,f1,f2), sunt date de tabelele V i VI din anexe, pentru P=95% i 99%, n
dependenta de f1 i f2. Raportul F este astfel formulat incit dispersia cea mai mare s fie luata
la numrtor. n cazul nostru s12avnd f1 grade de libertate > s2 . Interpolarea pentru valorile F
care nu se gsesc (de exemplu cum ar fi intre 24 i 50) se fac pe baza faptului ca F este
funcie de 1 / f .
Curbele au simetrie reciproca, astfel F se poate nlocui cu 1/ F nlocuind n acelai timp
f1 cu f2 i P cu 1- P.
Se poate demonstra ca distribuiile 2, t i z sunt cazuri particulare ale distribuiei F
pentru f2 = , f1 = 1 i respectiv f1 = i f2 = 1.
F(P, f1,)=
x 2 P, 1
; F(P,1,f2)=t2 P, ; F P, ,1
f f1
1
2
z
(4.26)
a) F(95%,8,) = 1,94;
8
8
c) F(95%,,1) =254; 2
2
z z 0,025
z 95%
254
0,063
Valorile necesare calculului s-au luat din tabelele V,III,IV i II din anexe.
5.1.Distribuia binomoal
O prezentare a distribuiei binomiale a fost fcuta n subcapitolul 2.1.2. expresia (2.7)
este termenul general al dezvoltrii binomului.
(p + q)n
(5.1)
N( p + q)n
(5.2)
n x
Pn x C n q
nn 1n 2 n x 1
1 2 3 x
n x
(5.3)
xn!
(5.4)
q n x
in care variabila x, care reprezint frecventa evenimentului dorit n cadrul fiecrei serii, poate
lua valorile x = 0;1;2;3;kn.
Suma valorilor Pn(x) este 1:
P (x)
1
x0
x0
n!
p q
(n x)
x!(n x)!
(5.5)
Pentru calculul diferitelor valori este foarte utila o relaie de recurenta. s consideram
doua valori succesive x i x+1 ale variabilei aleatoare X i Pn(x) i Pn(x+1) probabilitile
corespunztoare. Vom avea:
n!
(x 1)!n (x 1)!
Pn (x 1) p
Pn (x)
( x1)
n(
x1)
n!
x
(n
x!(n x)! x) p q
nx
x1
p
(5.6)
(5.7)
(5.8)
=p
pq
=n
(5.9)
(5.10)
adic media este independenta de mrimea seriei, dar abaterea standard este cu att mai
mica cu cit n este mai mare.
Forma distribuiei binomiale depinde de valorile p i q i de valoarea exponentului n.
Daca p = q, distribuia este evident simetrica deoarece termenii echidistante la cele doua
capete ale dezvoltrii sunt egale. Daca p i q nu sunt egali distribuia este asimetrica. Daca p
= q, efectul creterii lui n este mrirea dispersiei i a mediei. Daca p nu este egal cu q,
creterea lui n n afara de efectele menionate micoreaz asimetria. Tendina spre simetrie
poate fi observata n fig. 5.1, n care se dau poligoanele de frecvenele repartiiei binomiale (0,9
+ 0,1)n pentru n egal cu 10, 50, 100. Se demonstreaz (si faptul reiese clar din fig. 5.1) ca
distribuia binomiala are ca limita distribuia normala, daca n este suficient de mare pentru a
face
(5.11)
9
0,1
0,9
=100.
Exemplul 5.1. Intr-un laborator uzinal, la determinarea n serie n decursul timpului a unui
anumit component, pentru sigurana se fac cte doua determinri paralele. Intr-o perioada fixa
n care se urmrete calcularea stabilitii procesului analitic, s-a gsit ca n 200 de determinri
duble (paralele), n 14 cazuri a fost necesara o a treia repetare pentru a avea doua valori
apropiate. Se cere s se calculeze media i abaterea standard . Vom avea:
p 100
p q 100
7 93 100
14
n
200
100 7%;
18%
200
x!
(5.12)
e ;
e ;
0!
1!
;
2
2!
etc.
3!
e (1
(5.13)
...)
1!
2!
3!
Pn (x 1)
P (x)
( x1)
(x 1)!e
x!e
xn 1
P (x 1) P (x)
(5.14)
x1
(5.15)
(5.16)
Forma distribuiei Poisson pentru diferite valori ale lui poate fi vzuta n fig. 5.2.
pn la = 4 asimetria este foarte pronunata dup care descrete treptat. Pentru valori mari
ale lui , distribuia Poisson poate fi aproximata prin distribuia normala cu accesai medie =
i cu dispersia
2 = . Din punct de vedere practic daca 9 distribuia Poisson poate fi tratata ca normala.
Fig. 5.2. Poligoane de frecventa ale distribuiei Poisson
n n
3,877871
2612
3,877871
pentru x = 2 avem n P (2) P (1)
209,8
406,8
n
n
11
2
3,877871
pentru x = 3 avem n P (3) P (2)
406,8
525,8
n
n
21
3
3.877871
pentru x = 4 avem n P (4) P (3)
525,8
508,8
31
Celelalte valori sunt trecute direct n tabelul 5.1. Concordanta intre valorile observate
i cele calculate apare ca foarte buna.
Tabelul 5.1
x
de
a
evenimentului
n unitatea de
timp x
3,877871
Numrul
de unitari de
timp
(frecventa
observata)
x!
3,877871
Pn(x)
Numrul
calculata
produceri
Pentru
evenimentului
=3,877871
n unitatea de
timp x
n =2612
ni
57
54,1
203
de
a
Numrul
de unitari de
timp
(frecventa
observata)
Pn(x)
calculata
Pentru
=3,877871
i
n =2612
ni
49
69,0
209,8
27
29,7
383
406,8
10
10
11,5
525
525,8
11
3,8
532
508,8
12
1,2
408
394,8
13
0,3
273
255,2
14
0,0
139
141,9
n =2612
i
(x) =
=2612,7
ESTIMAREA PARAMETRILOR
6. Selecii
6.1. Estimarea parametrilor populaiei pe baza seleciilor
Neputndu-se studia ntreaga populaie a unei variabile, caracteristicile sale se obin
prin intermediul caracteristicilor analoge ale variabilei de selecie. Corectitudinea datelor
obinute depinde de corectitudinea efecturii seleciei. n timp ce media, mediana, modul,
abaterea standard ale ntregii populaii sunt valori constante, valorile respective estimate pe
baza seleciilor sunt variabile aleatoare. Spunem ca valorile ce le stabilim pe baza seleciilor
sunt estimate ale caracteristicilor ntregii populaii daca ele converg n probabilitate ctre
acestea, cnd volumul de selecie n tinde ctre volumul ntregii popularii. Estimarea este
calculul aproximativ al caracteristicilor n sensul ca valorile obinute reprezint cu o anumita
probabilitate caracteristicile ntregii popularii. De reinut este ca problema se pune intr-un mod
aparte: noi nu cunoatem a priori distribuia populaiei (teoretica) ci pornim de la variabila de
selecie, determinam caracteristicile ei i cercetam n ce condiii valorile obinute aproximeaz
suficient caracteristicile corespunztoare ale variabilei teoretice. Operaia de stabilire a
corespondentei unei distribuii teoretice cu scara valorilor concrete ale unei distribuii empirice
(selecie) se numete ajustare. Valorile numerice ale variabilei, prin care descriem o selecie,
reflecta pe de o parte nsuirile proprii, izolate, ale indivizilor ce alctuiesc selecia, nespecifice
populaiei, iar pe de alta, n mod necesar, reflecta i acele proprieti care determina
caracteristica studiata. n condiiile unei operaii de masa care asigura omogenitatea practic a
ntregii colectiviti i a unei stabiliti statistice ale caracteristicilor urmrite, valorile numerice
privind indivizii care alctuiesc selecia, reflecta i aceste caracteristici eseniale, ele punndusi amprenta pe legea distribuiei seleciei. Seleciile trebuie s fie constituite sau cum se mai
spune extrase reprezentativ. Precizia estimaiilor ce se fac pe baza lor depinde de modul cum
sunt constituite, de volum, de expresia statistica (relaia) ce se formuleaz pe baza datelor
seleciilor. Principalele moduri de a constitui o selecie din populaii omogene sunt: selecie non
- exhaustiva (sau repetata, adic dup cercetare selecia este napoiata populaiei) 6
n cazul cnd populaia este infinit, cum ese situaia n analizele repetate din tiina
materialelor, dei selecia nu se mai ntoarce n populaia din care provine ea este