Sunteți pe pagina 1din 19

1.

Elemente generale de statistic matematic aplicat


n prelucrarea datelor experimentale
1.1 Populaia i probele statistice
In fiecare societate comercial cu profil chimic exist un disponibil practic nelimitat de
date, care se refer la: producie, cercetare, randamente, calitate sau la activiti cu
caracter economic.
Pentru a studia fenomenul tehnic sau economic cercetat ne putem referi la
numrul total de date sau la un numr limitat de date extrase din numrul total de date
disponibile. Din acest punct de vedere statistica matematic deosebete dou noiuni
de baz :
populaia sau colectivitatea statistic;
proba luat din populaie.
O populaie statistic defininete totalitatea fenomenelor sau obiectelor calitativ
omogene avnd una sau mai multe caracteristici comune. Iat cteva exemple:
a) un lot de 10 000 dopuri de plastic (au toate acelai scop);
b) rezultatele unei serii de analize (toate sunt obinute prin aceeai metod de analiz);
c) parametrii unui proces tehnologic elaborat n faz experimental.
Trebuie fcut distincia ntre o populaie statistic finit (ex. a) infinit (ex. b dac seria
determinrilor continu) sau ipotetic (ex. c dac metoda va fi aplicat n condiii
industriale)
Pentru cunoaterea unei anumite proprieti a unei populaii statistice este
necesar s se cunoasc aceea proprietate pentru toate elementele din care este ea
compus? Evident nu se poate determina proprietatea respectiv pentru fiecare
element al populaiei (mai ales c unele determinri sunt destructive, de ex. verificarea
la rupere pentru fiecare dop al populaiei a).
Din aceste motive, proprietatea populaiei statistice se apreciaz pe baza unei
pri din colectivitate, denumit prob care trebuie s ndeplineasc condiia s fie luat
din populaie n aa fel nct fiecare element din populaie s aib aceeai probabilitate
de a face parte din prob. Astfel de probe se numesc probe reprezentative.
Variabile independente sunt cele care sunt manipulate iar cele dependente sunt
cele a caror valoare este masurata, determinata.
Scri de msur Variabilele difer ntre ele si prin Ct de bine pot fi ele msurate. Este
clar c n orice msurtoare este implicat o anumit eroare, aceasta determina
cantitatea de informatie pe care o putem obine. Exista mai multe tipuri de scri de
msur ceea ce determina si tipuri de variabile:
nominale permit doar clasificarea calitativ. Putem sa spunem ca termenul respectiv
apartine unei anumite categorii dar nu putem spune cit de mult apartine. (ex. gen:
masculin feminin; rasa, oras, etc.);
ordinale permit clasificarea calitativa si o ordonare a claselor fara insa o masura
precisa. Ex. de astfel de variabila este nivelul socioeconomic al unei familii. Daca o
incadram in clasa mjlocie-inalta stim ca este o clasa deasupra clasei mijlocii dar nu

putem spune ca este cu 18% mai mult (de ex.). Putem spune ca variabilele ordinale
asigura mai multa informatie dect variabilele nominale.
Variabile tip interval permit nu numai ordonarea variabilelor masurate dar si
cuantificarea diferentelor dintre ele. Pentru aceasta se defineste o scala si apoi se
realizeaza masuratoare in raport cu aceasta scala. De ex. scara temperaturilor Celsius.
Putem spune ca o temp. de 400C este mai mare decit una de 300C si mai putem spune
ca o crestere de temp. de la 20 la 40 0C este de doua ori mai mare decit o crestere de
temperatura de la 30 la 400C.
Variabile tip raport sunt foarte similare cu cel tip interval dar implica in mod
suplimentar un punct de zero absolut. Exemple de astfel de scri sunt temp Kelvin,
spatiu, timpul. Pe o astfel de scara putem stabili si corelatii intre valorile absolute ale
variabilelor.

1.2 Mrimi fizice, uniti de msur


Procesele, fenomenele fizice sau chimice pot fi descrise numai cu ajutorul unor
mrimi fizice. O mrime fizic trebuie sa fie definit calitativ (prin natura ei) i cantitativ
(prin valoarea numeric) pentru a fi msurabil. Valoarea numeric a unei mrimi fizice
se determin ca raport ntre mrimea ei i o alt mrime considerat drept referin(
unitatea de msur). Pe baza unitii de msur i a valorilor pe care le poate lua o
mrime fizic se poate construi o scar de msurare. Exist mrimi fizice aditive (masa)
i mrimi fizice neaditive (pH, presiunea, temperatura). Pentru mrimile fizice neaditive,
scara de msur este aleas prin convenie, de obicei prin definirea unui interval ntre
dou valori.
Identificarea calitativ a unei mrimi fizice se face prin senzaii vizuale, auditive,
tactile, termice sau kinestezice i conduce la stabilirea naturii ei (ex.: timp, masa,
lungime).
n funcie de proprieti, se poate face urmatoarea clasificare a mrimilor fizice:
- extensive - prezint proprieti de ordonare i sumabilitate
- intensive - prezint doar proprieti de ordonare
- scalare - sunt determinate doar de valoarea lor numeric
- vectoriale - care asociaz fiecrei coordonate cte un vector (fora)
Mrimile fizice de baz numite i mrimi fizice fundamentale sunt mrimi
independente alese ntr-un mod convenional. Ele sunt (conform Sistemului
Internaional de Uniti):
1. Lungimea (simbol l, unitate de msur un metru, 1 m)
2. Masa (simbol m, unitate de msur un kilogram, 1 kg)
3. Timpul (simbol t, unitate de msur o secund, 1 s)
4. Temperatura absolut (simbol T, unitate de msur un Kelvin, 1 K)
5. Intensitatea radiat a fluxului de lumin (simbol J, unitate de masur o candel, 1 cd)
6. Intensitatea curentului electric (simbol I, unitate de masur un Amper, 1 A)
7. Cantitatea de substan (simbol N, unitate de masur un mol, 1 mol)

Mrimile fizice derivate se definesc pe baza celor fundamentale i se obin cu


ajutorul mrimilor fundamentale.

1.3 Tipuri de erori


Dintr-o experienta oarecare nu se obtine valoarea matematic precisa a marimii
masurate, ci numai un interval mai larg sau mai ingust, in interiorul caruia se gaseste
valoarea reala masurata. Cunoasterea acestui interval este necesara pentru a aplica
cu suficienta siguranta datele experimentale in calculele numerice si a compara intre ele
diferite metode si procese.
n funcie de natura lor, erorile pot fi:


Determinate (sistematice)
erori personale (grosolane);
erori ale metodei;
erori instrumentale;
erori de procedura.

Nedeterminate (ntmpltoare)
 erori personale (subiective);

Erorile determinate (sistematice) de obicei sunt datorate metodei sau aparatului


dar pot fi i datorate personalului, dac acesta nu are calificarea necesar, ele sunt n
acest caz denumite erori grosolane i duc la obinerea unor rezultate care nu au nimic
de-a face cu analiza urmrit i cauzeaz costuri suplimentare legate de consumul inutil
de resurse. Erorile sistematice determinate de metoda sau de aparat deplaseaz
valorile obinute ntr-un singur sens, fie spre valori mai mari fie spre valori mai mici
dect valoarea real.
Erorile ntmpltoare pot fi de tipul erorilor datorate factorului uman i constau n
erori de citire sau de apreciere a volumului de echivalent, de realizare a diluiilor, etc.
Erorile metodei pot aprea n cazul n care se utilizeaz o procedur de analiz cu un
principiu corect dar nu se asigur respectarea condiiilor de lucru care s asigure
ndeprtarea interferenelor. Iat cteva exemple de erori ale metodei:
- realizarea dezagregrii incomplete a unei probe solide are ca urmare trecerea
parial n soluie a elementului urmrit genernd erori sistematice cu obinerea
unor rezultate totdeauna mai mici dect valorile reale.
- lipsa de puritate a unui reactiv utilizat pe parcursul analizei.
- trasarea unei curbe de calibrare cu pant mai mare (sau mai mic) dect cea
optim genereaz apariia unor erori sistematice dependente de concentraie
elementului.
Erorile instrumentale apar n cazul utilizrii necorespunztoare a aparatului de msur
(acesta nu a fost calibrat sau nu lucreaz n condiii optime)

Erorile de procedur sunt erorile care apar datorit neaplicarii sau a aplicrii incorecte
normelor i standardelor legate de recoltarea probei i de pregtirea ei n vederea
analizrii.
n analiza chimic evidenierea erorilor ntmpltoare se poate realiza prin utilizarea
metodelor statistice de analiz a datelor. Deasemenea se pot aplica diferite teste de
eliminare a datelor necorespunztoare care ar vicia valoarea mediei. Aici intervine
chemometria: n scopul de a obine cele mai bune rezultate att prin interpretarea
datelor dar i prin optimizarea procesului analitic.

1.4 Parametrii statistici


Avnd la dispoziie un numr de date nregistrate, denumite date primare, pentru a
putea trage concluzii valabile asupra problemei cercetate, datele trebuie caracterizate.
Pentru caracterizarea populaiei se folosesc parametrii statistici care:
- caracterizeaz distribuia datelor (media aritmetic, mediana, modulul);
- indic tendina de mpratiere a datelor (intervalul de variaie a datelor, deviaia
standard, dispersia, deviaia medie, variabilitatea);
Media aritmetic ( x )
Media ( x ) unui set de msurtori repetate, reprezint tendina valorii msurate de
a se apropia de o valoare central i poate fi determinat ca medie aritmetic:
suma _ rezultatelor
(1)
x=
n
Unde n este numarul de elemente msurate.
O anumit valoare individual din prob poate fi desemnat cu simbolul xi , unde i
poate avea orice valoare de la 1 la n. Deci formula pentru calculul mediei va fi:
n

x=

x1 + x2 + x3 + ... + xi + ... xn
=
n

x
i =1

(2)

Exemplu:
Se dau urmatoarele date: 4, 1, 5, 9, 2, 4, 7, 3, 12, 4, 6. Sa se calculeze media aritmetica
a acestor date.
Rezolvare:
Se calculeaz media aritmetic a acestor date ca fiind: x = 57 / 11 = 5,18
FUNCIA EXCEL ce poate fi folosita pentru calculul mediei unui set de date este:
AVERAGE (numar1, numar2, N.)
Calculeaza media aritmetica a unei probe formate din: numar1, numar2, N.

Argumentele sunt de la 1 la 30 de numere, acestea pot fi precizate ca atare sau se pot


da pentru ele adresele la care sunt stocate numerele. Adresele pot fi date una cte una
(A1;A2;A3;A4;A5) sau sub forma de vector (A1:A5) sau matrice (A1:B5).

Mediana (Me)
Mediana sau valoarea de mijloc se obine prin ordonarea cresctoare a datelor i
identificarea datei situate la mijlocul seriei.

x1 x2 ................... xm ....... xn
n cazul n care aceast serie conine un numr impar de date, mediana va fi
considerat valoarea situat la mijlocul seriei:
x1, x2,.............xm,...........xn
daca n este impar n=2k+1 i m=(n+1)/2 iar Me = xm
n cazul n care aceast serie conine un numr par de date, mediana va fi
considerat media aritmetic a celor dou date situate la mijlocul seriei:
x1, x2,.............xm, xm+1,...........xn
daca n este par n=2k i m = n/2 iar Me = (xm + xm+1)/2
Exemplu:
Se dau aceleai date utilizate la calculul mediei: 4, 1, 5, 9, 2, 4, 7, 3, 12, 4, 6. Sa se
indice mediana acestui set de date.
Rezolvare:
Se ordoneaz cresctor datele: 1 2 3 4 4 4 5 6 7 9 12
Se identific valoarea din mijlocul seriei ordonate ca fiind mediana seriei: Me = 4
Se poate observa c mediana nu mai este influenat de ctre valorile extreme.
FUNCIA EXCEL ce poate fi folosita pentru calculul medianei unui set de date este:
MEDIAN (numar1, numar2, N.)
Calculeaza mediana unei probe formate din: numar1, numar2, N.
Argumentele sunt de la 1 la 30 de numere, acestea pot fi precizate ca atare sau se pot
da pentru ele adresele la care sunt stocate numerele. Adresele pot fi date una cte una
(A1;A2;A3;A4;A5) sau sub forma de vector (A1:A5) sau matrice (A1:B5).
Modulul (Mo)
Modulul reprezint valoarea care apare cu frecvena cea mai mare. Funcie de
acest parametru populaia de date poate fi clasificat n unimodal sau polimodal. O
funcie polimodal arat neomogenitatea datelor, adic arat faptul c datele obinute
nu fac parte din aceeai populatie.

Exemplu:

Sa se determine modulele pentru urmatoarele seturi de date si sa se reprezinte grafic


frecventa de aparitie a datelor:
a) 1, 4, 3, 7, 4, 9, 2, 4, 8, 6, 4
b) 1, 6, 3, 4, 9, 5, 6, 2, 6, 8, 7, 4, 6
Rezolvare:
a) se ordoneaza crescator irul de date: 1,2,3,4,4,4,5,6,7,8,9;
modulul este valoarea care se repeta cu frecventa cea mai mare: Mo = 4
b) se ordoneaza crescator irul de date:: 1,2,3,4,4,5,6,6,6,6,7,8,9
cele dou module sunt: Mo1 = 6 i Mo2 = 4
Mo = 4

2
1
0

Mo1 = 6

3
frecventa

frecventa

1 2 3 4 5 6 7 8 9
date

A. Populaie unimodal

Mo2 = 4

1
0

1 2 3 4 5 6 7 8 9
date

B. Polpulaie bimodal (polimodal)

FUNCIA EXCEL ce poate fi folosita pentru calculul modulului unui set de date este:
MODE (numar1, numar2, N.)
Calculeaza modulul unei probe formate din: numar1, numar2, N.
Argumentele sunt de la 1 la 30 de numere, acestea pot fi precizate ca atare sau se pot
da pentru ele adresele la care sunt stocate numerele. Adresele pot fi date una cte una
(A1;A2;A3;A4;A5) sau sub forma de vector (A1:A5) sau matrice (A1:B5).

Intervalul de variaie al datelor (sau amplitudinea) (A)


Intervalul de variaie al datelor reprezint diferena dintre cea mai mare i cea
mai mic valoare. Cu ct intervalul de variaie va fi mai mic cu att valorile vor fi mai
apropiate i frecvena de apariie a unei valori individuale mai mare:

A = xmax xmin
Exemplu:
Sa se determine intervalul de variatie pentru urmatorul set de date:
1, 4, 3, 7, 4, 9, 2, 4, 8, 6, 4
Rezolvare:
-

se ordoneaza crescator irul de date: 1,2,3,4,4,4,5,6,7,8,9;

intervalul de variatie va fi; A = xmax xmin= 9 1 = 8

FUNCIA EXCEL ce poate fi folosita pentru calculul intervalului de variatie al unui set
de date este:
MAX (numar1, numar2, N.) - MIN (numar1, numar2, N.)
Calculeaza intervalul de variatie al unei probe formate din: numar1, numar2, N.
Argumentele sunt de la 1 la 30 de numere, acestea pot fi precizate ca atare sau se pot
da pentru ele adresele la care sunt stocate numerele. Adresele pot fi date una cte una
(A1;A2;A3;A4;A5) sau sub forma de vector (A1:A5) sau matrice (A1:B5).
Deviaia standard (abaterea medie ptratic) (s)
Deviaia standard este parametrul principal care exprim mprtierea
rezultatelor n jurul valorii medii, fiind un indicator al preciziei (al reproductibilitii
rezultatelor). Deasemenea, deviaia standard este un indicator de punere n eviden a
erorilor ntmpltoare care afecteaz procesul de analiz. n cazul unei distribuii
normale a datelor, se calculeaz cu formula:

s=

1 n
( xi x ) 2

n 1 i =1

(3)

Exemplu:
Sa se determine deviatia standard pentru urmatorul set de date: 2, 4, 3, 6
Rezolvare:
Se calculeaza mai intai media aritmetica a setului de date: x = (2+4+3+6) / 4= 3,75
Se calculeaza deviatia standard a setului de date cu ajutorul mediei aritmetice calculata
anterior:

s=

1 n
( xi x ) 2 =

n 1 i =1

(2 3.75) 2 + ( 4 3.75) 2 + (3 3.75) 2 + (6 3.75) 2


= 1.71
3

FUNCIA EXCEL ce poate fi folosita pentru calculul deviatiei standard a unui set de
date este:
STDEV (numar1, numar2, N)
Calculeaza deviatia standard a unei probe formate din: numar1, numar2,N.
Argumentele sunt de la 1 la 30 de numere, acestea pot fi precizate ca atare sau se pot
da pentru ele adresele la care sunt stocate numerele. Adresele pot fi date una cte una
(A1;A2;A3;A4;A5) sau sub forma de vector (A1:A5) sau matrice (A1:B5).
Dispersia (variana) (s2)
Dispersia sau variana reprezint ptratul deviaiei standard i msoar gradul de
mprtiere a eantionului n jurul mediei de sondaj. Presupunnd c exist n elemente
n eantion, cu valorile {x1, x2, . . . , xn}, avnd media:

x + x2 + x3 + ... + xi + ... xn
x= 1
=
n

i =1

atunci dispersia este:


n
1 n
1
1 n
2
2
(4)
s2 =
(
x

x
)
=
[
x

( xi ) 2 ]

i
i
n 1 i =1
n 1 i =1
n i =1
Exemplu:
Sa se determine dispersia pentru urmatorul set de date: 2, 4, 3, 6
Rezolvare:
Se calculeaza mai intai media aritmetica a setului de date: x = (2+4+3+6) / 4= 3,75
Se calculeaza dispersia setului de date cu ajutorul mediei aritmetice calculata anterior:
(2 3.75) 2 + ( 4 3.75) 2 + (3 3.75) 2 + (6 3.75) 2
1 n
2
s2 =
(
x

x
)
=
= 2.92
i
n 1 i =1
4

FUNCIA EXCEL ce poate fi folosita pentru calculul dispersiei unui set de date este:
VAR (numar1, numar2, N)
Calculeaza dispersia unei probe formate din: numar1, numar2,N.
Argumentele sunt de la 1 la 30 de numere, acestea pot fi precizate ca atare sau se pot
da pentru ele adresele la care sunt stocate numerele. Adresele pot fi date una cte una
(A1;A2;A3;A4;A5) sau sub forma de vector (A1:A5) sau matrice (A1:B5).
Deviaia medie a datelor (dm)
Deviaia medie a datelor reprezint media aritmetic a valorilor absolute a
deviaiilor individuale a datelor n jurul valorii medii. Deviaia individual reprezint
valoarea absolut a diferenei ntre valoarea individual (xi) i valoarea mediei
aritmetic ( x ) a acestor valori.
n

x
dm =

i =1

(5)

Exemplu:
Sa se determine deviatia medie pentru urmatorul set de date: 2, 4, 3, 6
Rezolvare:
Se calculeaza mai intai media aritmetica a setului de date: x = (2+4+3+6) / 4= 3,75
Se calculeaza deviatia standard a setului de date cu ajutorul mediei aritmetice calculata
n

x
anterior: d m =

i =1

x
=

2 3.75 + 4 3.75 + 3 3.75 + 6 3.75


4

= 1.25

FUNCIA EXCEL ce poate fi folosita pentru calculul deviatiei medie a unui set de date
este:
AVEDEV (numar1, numar2, N)
Calculeaza deviatia medie a unei probe formate din: numar1, numar2,N.
Argumentele sunt de la 1 la 30 de numere, acestea pot fi precizate ca atare sau se pot
da pentru ele adresele la care sunt stocate numerele. Adresele pot fi date una cte una
(A1;A2;A3;A4;A5) sau sub forma de vector (A1:A5) sau matrice (A1:B5).

Variabilitatea (coeficientul de variaie al lui Pearson) (V)


Variabilitatea este utilizat n scopul stabilirii gradului de omogenitate a unei probe
i se obine prin raportarea procentuala a deviaiei standard la media probei:
s
%
(6)
V = 100
x
Exemplu:
Se dau urmatorele 3 seturi de date:
set 1
set 2
set 3
82.35
68.67
35.67
80.24
75.34 124.358
78.38
62.59
118.63
77.78
95.84
46.38
83.59
91.27
106.56
80.83
75.85
58.93
79.58
92.59
69.58
80.56
66.59
86.59

Sa se calculeze media, deviatia standard si variabilitatea pentru fiecare set si sa se


interpreteze valorile obtinute.
Rezolvare:
set 1
set 2
set 3
media
80.25
80.25
80.25
deviatia standard
1.86
13.08
31.38
variabilitatea
2.32
16.30
39.10

Interpretarea variabilitii se face n funcie de valorile obinute:


V(set 1) = 2.32% - este cuprins ntre 0 i 15%, nseamn c mprtierea datelor
este foarte mic, iar media este reprezentativ, deoarece proba msurat este
omogen;

V(set 2) = 16.30% - este ntre 15 i 30%, mprtierea datelor este mijlocie, media fiind
nc suficient de reprezentativ;
V(set 3) = 39.10% - depete 30%, media aritmetic nu este reprezentativ pentru
proba n cauz, fiind recomandat utilizarea medianei din cauza lipsei de omogenitate a
grupului de valori.
Exemplu:
Un student utilizeaz o pipet automat pentru a preleva 3 probe de cte 50,000
mL dintr-o soluie. Masele celor trei probe sunt 50,0122g; 50,0119g i 50,0123g. S se
calculeze media, dispersia, deviaia standard i variabilitatea acestor valori. S se
reprezinte grafic valorile obinute.
Rezolvare:
Calculul mediei: x = (50,0122 g + 50,0119 g + 50,0123g ) / 3 = 50,01213 g
(utiliznd regulile cifrelor semnificative, acest rezultat trebuie rotunjit la 50,0121g, dar este mai bine s se
menin i ultima zecimal dintr-un motiv ce va fi explicat ulterior)

Calculul dispersiei:
(50,0122 50,0121) 2 + (50,0119 50,0121) 2 + (50,0123 50,0121) 2
s2 =
= 4,3 * 10 8 g 2
2
Calculul deviaiei standard:
s = 2,1 * 10 4 g

50.0125
50.0124
50.0123

Greutate, g

50.0122
50.0121
50.0120
50.0119
50.0118
50.0117
50.0116
50.0115

Nr. proba
4

Calculul Variabilitatii: V =

2,1 * 10 g
100 = 0.001%
50.01213

1.5 Acurateea
ntr-un laborator chimic obinuit multe din rezultatele experimentale sunt
cantitative. Valorile numerice pentru experimentari repetate sunt obinute prin proceduri
analitice pentru care un experimentator atent trebuie sa aibe informaii despre acuratee
i precizie.
Acurateea este o msur a apropierii determinrilor experimentale de valoarea
adevarat. n anumite experimente, studenii primesc o prob de compoziie
necunoscut. De fapt compoziia este necunoscut doar de ctre student, cel mai
adesea instructorul are aceasta informatie. n alte cazuri exist probe cu compoziie
precis cunoscut care sunt livrate de companii care furnizeaza tabele cu valori
adevarate ale compoziie probei ce urmeaz a fi analizat. Aceste rezultate au fost
obinute de ctre chimiti experimentai ce au utilizat metode de ncredere i un numr
mare de experimentri repetate.
n continuare, ne vom referi la o valoare adevarat cum este media populaiei ().
Presupunerea de adevarat nseamn c aceast valoare a fost obinut printr-un
numr foarte mare de experimentri (250 sau mai multe). Valoarea absolut a diferenei
dintre media populaiei () i media unei probe de doar cteva experimentri ( x ) se
numete eroare absolut (EA) i este o msur a acurateii experimentului.
EA = x
(5)

Exemplu:
Un student obine, la analiza concentraiei unei soluii de sulfat, urmtoarele
rezultate: 14,78%; 14,86% i 14,69%. Profesorul i spune c valoarea real a probei
de analizat este 14,81%. Care este eroarea absolut ?
Rezolvare:
Media valoarilor studentului este: x = (14,78 + 14,86 + 14,69)/3 = 14,78;
Eroarea absoluta este: EA = | 14,81% - 14,78| = 0,03%
Reacia intuitiv a studentului fa de aceast valoare este s spun c rezultatul
su este bun; dar n continuare, el nu are nici un mijloc de a dovedi aceasta.
n continuare, vom descrie posibilitile de a folosi statistica pentru a estima
acurateea rezultatului i a prezice dac este ceva gresit cu un rezultat. Erorile
determinate care fac ca valoarea practic obinut s difere de valoarea absolut sunt
clasificate n trei tipuri: erori personale, erori ale metodei i erori instrumentale. O
anumit eroare face ca rezultatul experimental sa fie mai mic sau mai mare dect cel
obinut n absena ei.
n analiza continutului de sulfat, precipitatul nu a avut suficient tip pentru formare i
n consecinta cristalele de sulfat de bariu au fost prea mici pentru a putea fi separate
prin filtrarea pe hrtie de filtru. Ce tip de eroare este acesta i ce efect va avea asupra
concentratiei calculate de sulfat ?

Eroarea este mai degrab cauzat de neglijen dect de un defect al procedurii


de lucru, deci este o eroare personal. Dac o anumita parte din precipitat se pierde,
valoarea determinat a sulfatului de bariu va fi mai mic dect ar trebui sa fie i n
consecin valoarea determinat va fi mai mic.
Din punctul de vedere al chimistului ncepator, acesta se ateapt ca erorile lui
personale sa fie mai mari dect ale unui chimist profesionist care analizeaz probe
necunoscute pentru a obine valori adevarate ale compoziiei. De asemenea, acesta
se ateapt ca metodele utilizate de chimistul profesionist s fie metode de ncredere
iar aparatele de masur s fie bine calibrate i toate acestea s conduc la obinerea
unor valori de ncredere, foarte apropiate de media . n teorie, reprezint o colecie a
tuturor rezultatelor posibile n condiiile n care nu apar erori, dar aici noi vom presupune
c am obinut o aproximaie bun a acestei valori ideale.

1.6 Precizia
Precizia este raspndirea unui set de rezultate obinute n acelai experiment. n
primul exemplu din seciunea precedent, rezultatele celor trei probe variaz putin
unele fa de altele. Aceasta este de asteptat. Ar trebui s fii mult mai surprins dac ai
obine rezultate identice deoarece orict de grijuliu ai fi nu se poate repeta experimentul
n mod identic de fiecare dat. S ne imaginam un chimist perfect care folosete o
metod de ncredere absolut i nite aparate perfecte. Daca acesta repet analiza de
300 de ori va putea el obine pentru toate rezultatele sale o valoare unic de 14,81% ?
Intuiia noastr despre msurtori repetate ne spune c nici n aceast situaie ideal,
acest lucru nu este posibil. Chiar i n absena unor erori determinate ne ateptm s
gsim o valoare medie apropiat de 14,81% i numere egale de masurtori deasupra i
dedesuptul acestei valori. Tipul de eroare care cauzeaz o astfel de distribuie se
numete eroare nedeterminat sau ntmplatoare. Ea este ntotdeauna prezent n
orice experiment i nu poate fi atribuit unei cauze specifice. Mrimea erorii
ntmplatoare este o estimare a preciziei experimentului.
n cazul (descris mai sus) al chimistului profesionist care face sute de
experimentari ale aceleiai probe, parametrul statistic care msoar precizia
msuratorilor se numete deviaia standard (). O estimare a acestui parametru poate
fi obinut dintr-un numr redus de experimentri ( se noteaz cu s).
Intervalul de variaie (diferena dintre cea mai mare i cea mai mic valoare) este
o alt masur a preciziei unui set de date, dar el este mai puin folosit n tratamentul
statistic al datelor.
Noiunile de medie universal i de deviaie standard menionate n paragraful de
mai sus sunt foarte importante. Un set de rezultate al unui experiment perfect repetat
de sute de ori produce o populaie de rezultate. Aceast populaie conine toate
rezultatele teoretic posibile pentru valoarea masurat cu presupunerea c apar doar
erori ntamplatoare. Cu ct este mai mare numrul de msurtori (n) cu att distribuia
rezultatelor va fi mai aproape de distribuia teoretic.
Estimari ale mediei i deviaiei standard pot fi obinute din orice numr de valori.
Pentru un numr mic de valori ele vor fi denumite media probei ( x) deviaia standard a
probei (s) i asta deoarece setul de valori (xi) utilizat pentru calcul este doar o prob

oarecare din toate rezultatele care ar fi teoretic posibil s fie obinute. Pe msur ce n
crete valorile calculate ale mediei ( x ) i deviatiei standard (s) se apropie de valorile
populaiei i . Unul din scopurile acestui curs este de a utiliza valorile x i s obinute
din rezultate experimentale i chiar valorile i (dac se cunosc) pentru a estima
probabilitatea prezenei erorilor determinate n rezultatele noastre.

1.7 Determinarea numrului de cifre semnificative (eroarea standard)


Parametrii statistici ai unei probe ( x i s) se bazeaz pe un numr mic de valori
din mulimea rezultatelor posibile (acestea formeaz o populaie) i deci sunt doar o
estimare brut a valorilor populaiei i care reprezint ntreaga distribuie.
S ne imaginm c fiecare student dintr-o grup de 15 studeni repet
experimentul utiliznd aceeai pipet automat. S presupunem de asemenea c
echipamentul este curat i n stare bun de funcionare i nu apar erori determinate n
rezultatele studenilor. Ne asteptm oare ca mediile lor individuale s fie identice? Este
posibil ca mediile s fie foarte aproape unele fa de altele dar dac utilizm o
reprezentare tip histogram vom observa distribuia datelor experimentale. S ne
imaginm c un numr n de 300 de studeni fac fiecare cte un numr de 3 experiene.
Oare cum va arta distribuia celor 300 de valori medii ( x )? Dac avem de-a face cu o
distribuie normal a valorilor la care sunt prezente doar erori nedeterminate atunci
valorile mediilor vor forma i ele o distribuie normal.

Figura 1. Distribuia valorilor medii i individuale.


Ce se obine dac se calculeaz deviaia standard a valorilor medii? Aceasta va
reprezenta precizia valorilor medii i va fi o caracteristic a curbei (fig. 1) determinat
de limea distribuiei. Aceast deviaie standard a grupului de medii este denumit
eroarea standard a mediilor (ES ( x )) i este de folos n estimarea preciziei mediilor sau
n decizia referitoare la numrul de cifre semnificative ce trebuie reinute n valoarea
medie obinut din cele n valori.
Se poate dovedi c eroarea standard a mediilor se poate calcula n funcie de deviaia
standard a tuturor probelor:
ES ( x ) =

s
n

(6)

Nedeterminarea n media x este exprimat de aceast eroare standard, adic poziia


primei cifre diferit de zero a ES ne va preciza unde este ultima cifr semnificativ n
valoarea mediei.
Exemplu:
Utiliznd datele din exemplul 1, s se calculeze ES ( x ) i s se rotunjeasc
valoarea medie la numrul potrivit de cifre semnificative.
Rezolvare:
s = 2,1 * 10 4 g i N = 3, deci:
ES ( X ) =

2,1 * 10 4 g
= 1,2 * 10 4 g = 0,00012 g
3

Deci media calculat va fi prezentat cu 4 zecimale.


1 Se poate adopta convenia c deviaia standard i eroarea standard se vor raporta
cu 2 cifre zecimale;
2 Dac se cunoate valoarea a populaiei atunci aceasta trebuie folosit n locul
valorii s a probei.

1.8 Propagarea erorilor.


Pentru a obine rezultatul dorit este adesea necesar s efectum calcule cu
valorile datelor experimentale obinute n laborator. n mod obinuit cunoatem deviaia
standard a valorilor datelor experimentale (sau o putem estima) dar avem nevoie de o
metod pentru a afla deviaia standard a unui rezultat obinut prin aplicarea unor
operaii aritmetice asupra valorilor datelor experimentale.
Exist dou cazuri distincte care trebuie considerate:
Rezultat obinut prin scderea sau adunarea valorilor datelor experimentale;
Rezultat obinut prin nmulirea sau mprirea valorilor datelor experimentale;
1.8.1 Rezultat obinut prin adunare i scdere
Exist metode uor diferite pentru calcularea erorii standard a rezultatului n
fiecare caz. Eroarea standard a unei singure valori se calculeaz pe baza deviaiei
standard a populatiei din care provine valoarea:
s
ES =
(14)
n
n cazul n care rezultatul este obinut doar prin adunarea i scderea valorilor
datelor experimentale atunci eroarea sa standard este calculat n funcie de deviaiile
standard (s) ale valorilor implicate:

ES rezultat adunare scadere = ( s1 ) 2 + ( s 2 ) 2 + ... + ( s n ) 2


(15)
(n aceast relaie, deviaiile standard pot aparine datelor direct msurate sau
datelor calculate)
Exemplu Cntrirea prin diferen:
S se calculeze ES a masei unei probe de carbonat de sodiu cntrit prin
diferen. Se cunosc:
masa fiolei nainte de a lua proba: 16,7328g;
deviaia standard a balanei: 0,00013g;
masa fiolei dup ce s-a luat proba: 16,0865g
deviaia standard a balanei: 0,00013g;
Rezolvare:
n aceste condiii eroarea standard a rezultatului (masa de prob, exprimata in g)
este:
ES rezultat (masa carbonat) = (0,00013) 2 + (0,00013) 2 = 0,00018

Deviaia standard a balanei apare de dou ori deoarece se fac dou cntriri
succesive. Masa probei trebuie rotunjit la a patra zecimal i trebuie raportat ca fiind:
0,6463g cu ES 0,00018g. Se observ c erorile nu sunt aditive, dar ES a rezultatului
este mai mare dect erorile rezultatelor individuale.
Exemplu Calculul masei moleculare:
S presupunem c dorim s calculm masa molecular a Na2CO3.
n cazurile n care nu se cunoate deviaia standard a unei valori individuale se poate
estima ca fiind 1 * 10-n , n fiind numrul de zecimale considerate.
Se cunosc datele:
MNa = 22,9898 g/mol ; ES = 0,0001 g/mol;
MC = 12,011 g/mol; ES = 0,001 g/mol;
MO = 15,9994 g/mol; ES = 0,0001 g/mol.
Rezolvare:
Masa molecular va fi:
MNa2CO3 = 2*22,9898 + 12,011 + 3 * 15,9994 = 105,9888 g/mol
iar eroarea standard a rezultatului va fi:
g 2
g 2
g 2
g
ES masa moleculara = 2 * (0,0001
) + (0,001
) + 3 * (0,0001
) = 1.02 * 10 3
mol
mol
mol
mol
Deci, masa molecular trebuie raportat ca fiind egal cu 105,989 g/mol cu ES 0,001
g/mol.
Se observ c erorile standard mici (de ex. 0,0001) au o contribuie neglijabil, de
aceea se poate folosi o regul aproximativ care estimeaz eroarea standard a unui
rezultat ca fiind egal cu cea mai mare dintre erorile standard ale datelor primare.

1.8.2 Rezultat obinut prin nmulire sau mprire


Metoda utilizat pentru determinarea erorii standard (ES) a unui rezultat obinut
prin nmulirea sau mprirea unor date experimentale este similar cu cea folosit n
cazul unui rezultat obinut prin scderea i adunarea valorilor datelor experimentale, dar
relaia de legtur se stabilete ntre ES relative i nu ntre cele absolute.
Valorile relative ale ES (sau ale deviaiei standard s) se obin prin mprirea
valorii absolute a ES la valoarea datei. Valorile relative vor fi adimensionale:

( ES ) rel = ( s1 ) 2rel + ( s2 ) 2rel + ... + ( sn ) 2rel

(16)

Exemplu:
Masa unei probe este egal cu 0,1763 g iar DS = 0,00013g. Volumul aceleiai probe
este 0,100 mL iar DS = 0,00005 mL. Calculai densitatea i ES a densitii pentru
aceast prob.
Rezolvare:
Se calculeaz densitatea probei:
0,1763g
d=
= 1,763g / ml
0,100mL
Se calculeaz deviaiile standard relative pentru masa i volumul probei:
0,00013g
( DS ) relativa a masei =
= 0,00074
0,1763g
0,00005mL
( DS ) relativa a volumului =
= 0,0005
0,100mL
Ecuaia de calcul pentru aflarea eroarea standard relativ a densitatii (care se
calculeaz prin mprirea valorilor experimentale volum i masa) este:

( ES ) relativa a densitatii = ( DS ) 2 relativa a masei + ( DS ) 2relativa a volumului


( ES ) relativa a densitatii = (7,4 * 10 4 ) 2 + (5,0 * 10 4 ) 2 = 8,9 * 10 4
Se calculeaz eroarea standard absolut a densitii:
( ES ) absoluta a densitatii = ( ES ) relativa a densitatii d = 8,9 * 10 4 * 1,763g / mL = 0,0016 g / mL
Rezultatul trebuie raportat ca fiind: densitatea = 1,763 g/mL; ES = 0,0016 g/mL

Exemplu:
S se calculeze ES a numrului de moli de carbonat de sodiu folosind urmtoarele
date:
- masa de carbonat: m Na 2CO 3 = 0,6463 g; ES = 0,0018 g;
- masa molecular a carbonatului de sodiu: M Na 2CO 3 = 105,989 g/mol ; ES= 0,001
g/mol
Rezolvare:
Se calculeaz numrul de moli de carbonat de sodiu:

m Na 2CO 3
0,6463g
=
= 0,0060978moli
M Na 2CO 3 105,989 g
mol
Se calculeaz deviaiile standard relative a masei de prob i a masei moleculare a
carbonatului de sodiu:
0,00018 g
( DS ) relativa a masei de Na 2Co 3 =
= 0,00028
0,6463g
n Na 2CO 3 =

( DS ) relativa a masei moleculare N a 2Co 3 =

0,001g / mol
= 0,0000094
105,989 g / mol

Se calculeaz eroarea standard relativ a numrului de moli:


( ES ) relativa a numarului de moli de Na 2CO 3 = ( 2,8 * 10 4 ) 2 + (9,4 * 10 6 ) 2 = 2,8016 * 10 4

Se calculeaz eroarea standard absolut a densitii:


( ES ) absoluta a numarului de moli de Na 2CO 3 = 2,8 * 10 4 * 0,0060978moli = 1,7 * 10 6 moli

Rezultatul final trebuie raportat ca fiind: numar moli carbonat de sodiu = 0,006098 moli;
ES = 0,00000017 moli.

1.9 Criterii de respingere ale datelor


1.9.1 Testul Q pentru probe mici (3-12 rezultate)
Una din cele mai ntlnite probleme n prelucrarea datelor experimentale este
aceea de a lua o decizie referitoare la eliminarea unor date dubioase. Dac n timpul
unui experiment apare o eroare care este observat la timp i este notat n caietul de
experimentri atunci exist un motiv ntemeiat pentru a respinge acea data. Dac ns
exist doar impresia c o dat nu se ncadreaz n experiment, dar nu exista o dovada
a aparitiei unei erori determinate, atunci ai nevoie de criterii statistice pentru a putea
decide daca acea data va fi eliminata sau nu. Chiar i n cazul n care nu se cunosc
media sau deviatia standard a populaiei din care face parte valoarea respectiva exista
unele teste standard care pot fi aplicate.
Valorile calculate pentru media i deviaia standard ale unor astfel de probe mici
nu sunt nite estimri de ncredere ale valorilor i , deci testele bazate pe aceste
valori nu sunt potrivite. n schimb, se poate aplica testul Q care utilizeaz intervalul de
variaie al valorilor. Valorile tabelate ale parametrului Q se refer, de obicei la o
ncredere de 90%. Pentru aplicarea testului Q se vor realiza urmatoarele etape:
1. Se aranjeaz rezultatele n ordine cresctoare i se determin limitele de variaie.
Valorile susceptibile a fi aberante sunt cele de la extremitile irului.

2. Pentru verificarea valorii suspecte se calculeaz valoarea:


Qcalc =

xn xn 1
intervalul de variatie

sau Qcalc =

x2 x1
intervalul de variatie

(7)

3. Dac Qcalc depete valoarea tabelat Q (care este funcie de numrul de


msurtori), rezultatul suspect poate fi eliminat
Exemplu:
La determinarea prin titrare a concentraiei unei soluii de NaOH se obin urmtoarele
patru valori: 0,1072N; 0,1068N; 0,1073N i 0,1074N. Aplicai testul Q.
Rezolvare:
Puse n ordine, valorile sunt: 0,1068N; 0,1072N; 0,1073N i 0,1074N
Qcalc=|0,1072-0,1068|/0,0006 = 0,67
Valoarea tabelat pentru Q (referitor la 4 rezultate) este 0,76. Valoarea suspect nu
poate fi eliminat deoarece valoarea calculat nu depete aceast limit.
Dac se elimin o valoare prin testul Q, se recalculeaz intervalul de variaie i testul Q
se repet pn ce nu se mai elimin nici o valoare.
Tabel 7. Coeficientii de respingere Q pentru un nivel de ncredere de 90%
N
3
4
5
6
7
8
9
10
11
12
Q
0,94 0,76 0,64 0,56 0,51 0,47 0,44 0,41
0,39
0,37

1.9.2 Respingerea rezultatelor pentru probe cu numr mare de


elemente
Probe cu 11 - 30 de valori
n astfel de situaii se pot folosi media i deviaia standard a probei pentru a calcula
urmatoarele valori:

u=

X valoarea suspecta
s

(8)

Rezultatul poate fi eliminat funcie de nivelul de ncredere propus (tabelul 8).


Tabel 7. Valori limit ale u funcie de nivelul de ncredere propus
pentru probe cu 11-30 elemente
Nivel incredere propus
95%
98%
99%
99,5%
Valoare limit u
2,1
2,4
2,6
3,3

Exemplu:
n acelai laborator i prin aceeai metod, 20 de studeni analizeaz coninutul de Fe
al unui aliaj. Media celor 20 de valori obinute este de 13,66%. Deviaia standard pentru
aceast prob este de 0,83%. Cel de-al douzeci i unulea student efectueaz
acelai experiment o saptamn mai trziu i obine o valoare de 13,91%. Rezultatul lui
poate fi respins sau nu?
Rezolvare:
Se calculeaz raportul: u = |13,66-13,91|/0,83 = 0,30
Deoarece valoarea raportului nu depete 2,1, putem trage concluzia c rezultatul
ultimului student se ncadreaz n distribuia normal a probei i nu poate fi respins.
Probe cu 31-100 de valori
n cazul unor astfel de probe mai mari, valorile calculate pentru medie i
dispersie sunt mai apropiate de valorile "adevarate" ale populaiei deci criteriile de
respingere vor putea fi aplicate mai sigur.
Se determin acelai raport ca mai sus, dar valoarea limit peste care se aplic
respingerea rezultatului suspect este diferit, funcie de nivelul de ncredere propus:
Tabel 8. Valori limit ale u funcie de nivelul de ncredere propus
pentru probe cu 11-30 elemente
95%
98%
99%
99,5%
Nivel incredere propus
Valoare limita u
2,0
2,34
2,59
3,0

Exemplu:
Un numr de 15 studeni analizeaz aceeai soluie de HCl, fiecare realiznd un numar
de 3 experimentri. Valorile caracteristice ale probei de 45 de rezultate sunt: media
0,1011N i deviaia standard 0,0008N. Valoarea suspect (cea mai diferit de
celelate) este de 0,0996N, poate ea fi respins sau nu?
Rezolvare:
Se calculeaz raportul: |0,1011-0,0995|/0,0008 = 1,9
Valoarea acestui raport nu depete valoarea tabelat de 2,0 i n concluzie valoarea
suspect nu poate fi respins.
Probe foarte mari (cu mai mult de 100 de valori)
Pentru astfel de probe valorile calculate ale mediei i deviaiei standard se
consider a fi estimri foarte bune ale valorilor "adevarate" i . n consecin, se pot
aplica valorile tabelate ale distribuiei normale standard.

S-ar putea să vă placă și