Sunteți pe pagina 1din 11

Prelucrare date experimentale in tehnologia chimica

organica

1. Scopul cursului

- S v familiarizeze cu procedeele matematice cele mai uzuale de prelucrare a datelor
experimentale pentru caracterizarea si compararea probelor si populatiilor;
- Se acord o atenie deosebit metodelor oferite de statistica matematic pentru
mbuntirea lucrrilor de cercetare. Legat de aceast cerin vom trata att procedeele de
raionalizare a lucrrilor de cercetare ct i optimizarea proceselor tehnologice prin modelarea
legturilor ntre parametrii variabili ai proceselor chimice i rezultatul urmrit prin lucrrile de
cercetare.

2. Noiuni generale de statistic matematic

Statistica matematic este tiina care urmrete explicarea fenomenelor de mas
printr-un numr relativ redus de observaii. Ea folosete deci metode inductive de cercetare,
plecnd de la particular la general.
Firete, concluziile obinute prin inducie statistic nu sunt legiti absolut sigure, ns
gradul de incertitudine al concluziilor trase se poate calcula. Cunoscnd acest grad de
incertitudine al concluziilor trase putem considera metoda statistic de cercetare ca pe o
metod matematic exact.

Te poi ntreba: de ce este statistica important ntr-un laborator de chimie?.
Principalul motiv este acela c omul de tiin care experimenteaza are nevoie s tie
care este nivelul de ncredere al datelor pe care le obine. Cu alte cuvinte el are nevoie sa tie
dac un anumit rezultat poate fi socotit eroare experimentala sau este chiar ce trebuia sa se
obin.
Al doilea motiv este nevoia de a analiza rezultatele si de a le prezenta astfel nct s fie
vizibil i mrimea erorii experimentale prezente.
Uneltele statisticii pot realiza aceste sarcini ntr-o manier standard i universal
acceptat.
Cursul este strucurat pe cteva pri. Este de dorit parcurgerea lui n succesiunea
prezentat dar unele capitole pot fi nelese i dac sunt scoase din context (de ex. capitolul
referitor la eliminarea datelor eronate poate fi prezentat n orice punct al cursului).
2
2.1.Populaia si probele statistice.

In fiecare societate comercial cu profil chimic exist un disponibil practic nelimitat
de date, care se refer la: producie, cercetare, randamente, calitate sau la activiti cu caracter
economic.
Pentru a studia fenomenul tehnic sau economic cercetat ne putem referi la numrul
total de date sau la un numr limitat de date extrase din numrul total de date disponibile. Din
acest punct de vedere statistica matematic deosebete dou noiuni de baz :
- populaia sau colectivitatea statistic;
- proba luat din populaie.

O populaie statistic defininete totalitatea fenomenelor sau obiectelor calitativ
omogene avnd una sau mai multe caracteristici comune. Iat cteva exemple :
a - un lot de 10 000 dopuri de plastic (au toate acelai scop);
b - rezultatele unei serii de analize (toate sunt obinute prin aceeai metod de
analiz);
c - parametrii unui proces tehnologic elaborat n faz experimental.
Trebuie fcut distincia ntre o populaie statistic finit (ex. a) infinit (ex. b dac
seria determinrilor continu) sau ipotetic (ex. c dac metoda va fi aplicat n condiii
industriale)

Pentru cunoaterea unei anumite proprieti a unei populaii statistice este necesar s
se cunoasc aceea proprietate pentru toate elementele din care este ea compus? Evident nu se
poate determina proprietatea respectiv pentru fiecare element al populaiei (mai ales c unele
determinri sunt destructive, de ex. verificarea la rupere pentru fiecare dop al populaiei a).
Din aceste motive, proprietatea populaiei statistice se apreciaz pe baza unei pri din
colectivitate, denumit prob care trebuie s ndeplineasc condiia s fie luat din populaie
n aa fel nct fiecare element din populaie s aib aceeai probabilitate de a face parte din
prob. Astfel de probe se numesc probe reprezentative.

3
2.2. Parametri statistici

Avnd la dispoziie un numr de date nregistrate denumite date primare pentru a
putea trage concluzii valabile asupra problemei cercetate, datele trebuie caracterizate.
Pentru caracterizarea populaiei se folosesc n special :
- Media aritmetic;
- Deviaia standard (abaterea medie ptratic);
- Dispersia;
Calculul mediei, deviaiei standard i dispersiei

Media unui set de msurtori repetate, reprezint tendina valorii msurate de a se
apropia de o valoare centrala i poate fi determinat ca medie aritmetic:



O anumit valoare individual din prob poate fi desemnat cu simbolul x
i
, unde i poate
avea orice valoare de la 1 la N. Deci formula pentru calculul mediei va fi:




Msura preciziei este deviaia standard (s). Un parametru nrudit este dispersia (s
2
).
Pentru a calcula aceste valori este nevoie mai nti s determinm media. Dispersia unei probe
se calculeaza cu formula:
] ) (
1
[
1
1
) (
1
1
2
1 1
2 2
1
2

= = =

=
n
i
i
n
i
i
n
i
i
x
n
x
n
x x
n
s

Iar deviatia standard:


2
1
) (
1
1

=
n
i
i
x x
n
s

x
N
or rezultatel suma
x
_
=
N
x
N
x x x x x
x
N
i
i
N i

=
=
+ + + + +
=
1 3 2 1
... ...
4
Exemplul 1
Un student utilizeaza o pipet automat pentru a preleva 3 probe de cte 50,000 mL
dintr-o soluie. Masele celor trei probe sunt 50,0122 g; 50,0119g i 50,0123g. S se calculeze
media, dispersia i deviaia standard a acestor valori.

(utiliznd regulile cifrelor semnificative, acest rezultat trebuie rotunjit la 50,0121g, dar
este mai bine s se menin i ultima zecimal dintr-un motiv ce va fi explicat ulterior).



g g g g x 01213 , 50 3 / ) 0123 , 50 0119 , 50 0122 , 50 ( = + + =
2 8
2 2 2
2
10 * 3 , 4
2
) 0121 , 50 0123 , 50 ( ) 0121 , 50 0119 , 50 ( ) 0121 , 50 0122 , 50 (
g s

=
+ +
=
g s
4
10 * 1 , 2

=
1 2 3
50,0115
50,0116
50,0117
50,0118
50,0119
50,0120
50,0121
50,0122
50,0123
50,0124
50,0125
G
r
e
u
t
a
t
e
,

g
N r . p r o b a
5
2.3. Acuratete, precizie si tipuri de erori
A. Acurateea
Intr-un laborator chimic obisnuit multe din rezultatele experimentale sunt cantitative.
Valorile numerice pentru experimentari repetate sunt obtinute prin proceduri analitice pentru
care un experimentator atent trebuie sa aibe informatii despre acuratete si precizie.
Acuratetea este o masura a apropierii determinarilor experimentale de valoarea
adevarata. In anumite experimente studentii primesc o proba de compozitie necunoscuta.
De fapt compozitia este necunoscuta doar de catre student, cel mai adesea instructorul are
aceasta informatie. In alte cazuri exista probe cu compozitie precis cunoscuta care sunt livrate
de companii care furnizeaza tabele cu valori adevarate ale compozitie probei ce urmeaza a fi
analizata. Aceste rezultate au fost obtinute de catre chimisti experimentati ce au utilizat
metode de incredere si un numar mare de experimentari repetate.
In continuare ne vom referi la o valoare adevarata cum este - media populatiei.
Presupunerea de adevarata inseamna ca aceasta valoare a fost obtinuta printr-un numar
foarte mare de experimentari (250 sau mai multe). Valoarea absoluta a diferentei dintre media
populatiei () si media unei probe de doar cteva experimentari ( ) se numeste eroare
absoluta (EA) si este o masura a acuratetii experimentului.


Exemplul 2 Un student obtine la analiza concentratiei unei solutii de sulfat urmatoarele
rezultate: 14,78%; 14,86% si 14,69%. Profesorul i spune ca valoarea reala a probei de
analizat este 14,81%. Care este eroarea absoluta?
Valoarea media a studentului este (14,78 + 14,86 + 14,69)/3 = 14,78 , deci eroarea
absoluta este:
EA = | 14,81% - 14,78| = 0,03%

Reactia intuitiva a studentului fata de aceasta valoare este sa spuna ca rezultatul sau
este bun, dar in continuare el nu are nici un mijloc de a dovedi aceasta. In continuare vom
descrie posibilitatile de a folosi statistica pentru a estima acuratetea rezultatului si a prezice
daca este ceva gresit cu un rezultat. Erorile determinate care fac ca valoarea practic obtinuta sa
difere de valoarea absoluta sunt clasificate in trei tipuri: erori personale, erori ale metodei si
erori instrumentale. O anumita eroare face ca rezultatul experimental sa fie mai mic sau mai
mare dect cel obtinut n absenta ei.
x
x EA =
6

Exemplul 3 In analiza continutului de sulfat, precipitatul nu a avut suficient tip pentru
formare si in consecinta cristalele de sulfat de bariu au fost prea mici pentru a putea fi separate
prin filtrarea pe hrtie de filtru. Ce tip de eroare este acesta si ce efect va avea asupra
concentratiei calculate de sulfat ?

Eroarea este mai degraba cauzata de neglijenta dect de un defect al procedurii de lucru,
deci este o eroare personala. Daca o anumita parte din precipitat se pierde, valoarea
determinata a sulfatului de bariu va fi mai mica dect ar trebui sa fie si in consecinta valoarea
determinata va fi mai mica.

Din punctul de vedere al chimistului incepator, acesta se asteapta ca erorile lui personale
sa fie mai mari dect ale unui chimist profesionist care analizeaza probe necunoscute pentru a
obtine valori adevarate ale compozitiei. De asemenea acesta se asteapta ca metodele
utilizate de chimistul profesionist sa fie metode de incredere iar aparatele de masura sa fie
bine calibrate. Si toate acestea sa conduca la obtinerea unor valori de incredere, foarte
apropiate de media . In teorie, reprezinta o colectie a tuturor rezultatelor posibile n
conditiile n care nu apar erori, dar aici noi vom presupune ca am obtinut o aproximatie buna a
acestei valori ideale.

B Precizia.

Precizia este raspndirea unui set de rezultate obtinute in acelasi experiment. In primul
exemplu din sectiunea precedenta, rezultatele celor trei probe variaza putin unele fata de
altele. Aceasta este de asteptat. Ar trebui sa fii mult mai surprins daca ai obtine rezultate
identice deoarece orict de grijuliu ai fi nu se poate repeta experimentul n mod identic de
fiecare data. Sa ne imaginam un chimist perfect care foloseste o metoda de incredere absoluta
si niste aparate perfecte. Daca acesta repeta analiza de 300 de ori va putea el obtine pentru
toate rezultatele sale o valoare unica de 14.81% ? Intuitia noastra despre masuratori repetate
ne spune ca nici in aceasta situatie ideala, acest lucru nu este posibil. Chiar si in absenta unor
erori determinate ne asteptam sa gasim o valoare medie apropiata de 14.81% si numere egale
de masuratori deasupra si dedesuptul acestei valori. Tipul de eroare care cauzeaza o astfel de
distributie se numeste eroare nedeterminata sau ntmplatoare. Ea este ntotdeauna prezenta
n orice experiment si nu poate fi atribuita unei cauze specifice. Marimea erorii ntmplatoare
este o estimare a preciziei experimentului.
7
In cazul (descris mai sus) al chimistului profesionist care face sute de experimentari ale
aceleasi probe, parametrul statistic care masoara precizia masuratorilor se numeste -
deviatia standard. O estimare a acestui parametru poate fi obtinuta dintr-un numar redus de
experimentari ( se noteaza cu s).
Intervalul de variatie (diferenta dintre cea mai mare si cea mai mica valoare) este o alta
masura a preciziei unui set de date dar el este mai putin folosit in tratamentul statistic al
datelor.
Notiunile de medie universala si de deviatie standard mentionate in paragraful de mai
sus sunt foarte importante. Un set de rezultate al unui experiment perfect repetat de sute de
ori produce o populatie de rezultate. Aceasta populatie contine toate rezultatele teoretic
posibile pentru valoarea masurata cu presupunerea ca apar doar erori intamplatoare. Cu ct
este mai mare numarul de masuratori (N) cu att distributia rezultatelor va fi mai aproape de
distributia teoretica.
Estimari ale mediei si deviatiei standard pot fi obtinute din orice numar de valori. Pentru
un numar mic de valori ele vor fi denumite media probei ( ) deviatia standard a probei (s) si
asta deoarece setul de valori (x
i
) utilizat pentru calcul este doar o proba oarecare din toate
rezultatele care ar fi teoretic posibil sa fie obtinute. Pe masura ce N creste valorile calculate
ale mediei ( ) si deviatiei standard (s) se apropie de valorile populatiei si . Unul din
scopurile cursului nostru este de a utiliza valorile si s obtinute din rezultate experimentale si
chiar valorile si (daca se cunosc) pentru a estima probabilitatea prezentei erorilor
determinate in rezultatele noastre.

Tipuri de erori:
determinate

erori personale;
erori ale metodei;
erori instrumentale;

nedeterminate ( ntmpltoare)


x
x
x
8

C. Eroarea standard

Parametrii statistici ai unei probe ( si s) se bazeaza pe un numr mic de valori din
mulimea rezultatelor posibile (acestea formeaza o populaie) si deci sunt doar o estimare
brut a valorilor populaiei si care reprezint ntreaga distribuie.
S ne imaginm c fiecare student dintr-o grup de 15 studeni repet experimentul
utiliznd aceeai pipet automat. S presupunem de asemenea c echipamentul este curat i
n stare bun de funcionare i nu apar erori determinate n rezultatele studenilor. Ne asteptam
oare ca mediile lor individuale s fie identice? Este posibil ca mediile vor fi foarte aproape
unele fa de altele dar dac utilizm o reprezentare tip histogram vom observa distribuia
datelor experimentale. S ne imaginm c un numr N de 300 de studeni fac fiecare cte un
numr de 3 experiene. Oare cum va arta distribuia celor 300 de valori medii ( )? Dac
avem de-a face cu o distribuie normal a valorilor la care sunt prezente doar erori
nedeterminate atunci valorile mediilor vor forma si ele o distribuie normal.

Fig. 1.1 Distribuia valorilor medii si individuale.

Ce se obine dac se calculeaz deviaia standard a valorilor medii? Aceasta va
reprezenta precizia valorilor medii i va fi o caracteristic a curbei (1) determinat de limea
distribuiei. Aceast deviaie standard a grupului de medii este denumit eroarea standard a
mediilor (ES ( )) i este de folos n estimarea preciziei mediilor sau n decizia referitoare la
numrul de cifre semnificative ce trebuie reinute n valoarea medie obinut din cele N valori.
Se poate dovedi c eroarea standard a mediilor se poate calcula n funcie de
deviaia standard a tuturor probelor:


x
N
s
ES
x
=
) (
i x
i x
i x
i x
9
Nedeterminarea n media este exprimat de aceast eroare standard, adic poziia
primei cifre diferit de zero a ES ne va preciza unde este ultima cifr semnificativ n valoarea
mediei .

Exemplul 4
Utiliznd datele din exemplul (1), s se calculeze ES ( ) i s se rotunjeasc valoarea
medie la numrul potrivit de cifre semnificative.

s = 2,1 * 10
4
g i N = 3, deci:

Deci media calculata va fi prezentata cu 4 zecimale.
1 Se poate adopta convenia c deviaia standard i eroarea standard se vor raporta cu 2 cifre
zecimale;
2 Dac se cunoate valoarea a populaiei atunci aceasta trebuie folosit n locul valorii s a
probei.

FUNCTII EXCEL ce pot fi folosite in prelucrarea unor astfel de date:

AVERAGE (numar1, numar2, .)
Calculeaza media aritmetica a unei probe formate din: numar1, numar2, .

STDEV (numar1, numar2, )
Calculeaza deviatia standard a unei probe formate din: numar1, numar2, .

Argumentele sunt 1 la 30 de numere, acestea pot fi precizate ca atare sau se poate da
pentru ele adresele la care sunt stocate numerele. Adresele pot fi date una cite una
(A1;A2;A3;A4;A5) sau sub forma de vector (A1:A5) sau matrice (A1:B5).

x
g g
g
ES
X
00012 , 0 10 * 2 , 1
3
10 * 1 , 2
4
4
) (
= =

x
x
x
10




Breviar curs 1

Media Dispersia Deviatia standard




2
1
2
) (
1
1

=
n
i
i
x x
n
s
2
1
) (
1
1

=
n
i
i
x x
n
s
Proba




2
1
2
) (
1

=
=
n
i
i
x
n

2
1
) (
1

=
=
n
i
i
x
n

Populatie
AVERAGE STDEV Functii
Excel


Acuratete - eroarea absoluta:

Precizie - eroarea standard:




Tipuri de erori:
determinate

erori personale;
erori ale metodei;
erori instrumentale;

nedeterminate ( ntmpltoare)

N
s
ES
x
=
) (
x EA =
N
x
N
x x x x x
X
N
i
i
N i

=
=
+ + + + +
=
1 3 2 1
... ...
n
x
n
x x x x x
n
i
i
n i

=
=
+ + + + +
=
1 3 2 1
... ...

11

S presupunem c la o uzin de fenol-aceton, la oxidare cumenului la hidropexid s-au nregistrat, ntr-o sptmn, pe schimburi,
urmtoarele concentraii n hidroperoxid :

[hidroperoxid] (%g)
ziua schimbul I schimbul II schimbul III
1 30.7 31.2 33.5
2 31.4 30.9 32.0
3 29.8 28.7 30.4
4 31.6 27.5 29.8
5 32.2 32.4 28.4
6 30.1 30.1 30.6
7 31.9 33.2 29.3

Cifrele din tabel nu permit s se trag rapid o concluzie asupra funcionrii instalaiei deoarece ele variaz aparent fr nici o
legitate. Exist ns posibilitatea ca datele s fie exprimate printr-o singur cifr, i anume prin media lor, ceea ce ne permite s avem o
prim privire de ansamblu asupra nivelului tehnic al produciei.

Media aritmetic.

x
n
x x x
n
x
n i
i
n
= + + + =
=

1 1
1 2
1
( ... )
Pentru datele din tabel obinem :
x = + + + =
1
21
30 7 31 4 29 3 30 74762 ( . . ... . ) .

Media artitmetic nu caracterizeaz ns suficient de bine proprietatea populaiei statistice. Cu totul alte concluzii se pot trage
asupra funcionrii instalaiei dac de exemplu media 30 este obinut din valorile : 30.1; 30.05; 29.85 sau dac este obinut din valorile :
32; 30.5; 27.5. In primul caz se pare c instalaia funcioneaz normal pe cnd n al doilea caz oscilaia concentraiei de hidroperoxid indic
o desfurare anormal a procesului. Prin urmare avem nevoie de un criteriu care s ne arate n ce msur valorile individuale se abat de la
media lor. Acest criteriu este dispersia (s
2
)

=
= + + =
n
i
i n
x x
n
x x x x x x
n
s
1
2 2 2
2
2
1
2
) (
1
) ) ( ... ) ( ) ((
1

se mai poate folosi relaia :

=
=
n
i
i
x x
n
s
1
2
2 2
) (
1

care este mai simpl i este dedus din prima relaie.

Pentru datele din tabel obinem :
391619 . 2 )) 74762 . 30 3 . 29 ( ... ) 74762 . 30 7 . 30 ((
21
1
2 2 2 2 2
= + + = s

Dipersia (s
2
) este o unitate de msur a abaterii valorilor individuale de la media lor aritmetic. Cu ct dispersia este mai mare cu
att difer mai mult datele individuale de media lor aritmetic i cu ct este mai mic, cu att valorile observate vor fi mai apropiate de
valoarea medie. In cazul extrem cnd s
2
=0 , toate valorile observate sunt egale.
Trebuie fcut o deosebire ntre media aritmetic i dispersia unei populaii i ntre media aritmetic i dispersia unei probe luate
din populaie. Primele sunt valori constante i poart denumirea de parametri statistici, n timp ce media aritmetic i dispersia unei probe
sunt valori variabile, n funcie de elementele populaiei care au intrat n probe. In notaia matematic se ine seama de aceast deosebire .
Parametrii populaiei se noteaz cu litere greceti (,
2
) n timp ce media i dispersia probelor se noteaz cu litere latine (x i s
2
).
Dispersia probei se poate calcula mai comod cu ajutorul formulei :
s
n
x x
n
x
n
x
i
i
n
i
i
n
i
i
n
2
1
2 2
1 1
2
1
1
1
1
1
=


= = =

( ) [ ( ) ]
sau :


s
n x
n
x
n n
i
i
n
i
i
n
2
2
1 1
2
1
1
=

= =

( )
( )

unde = n-1 reprezint gradul de libertate, adic numrul de comparaii independente care se pot face ntre valorile x
i-1
cu una
din valorile din prob.

S-ar putea să vă placă și