Documente Academic
Documente Profesional
Documente Cultură
putem spune ca este cu 18% mai mult (de ex.). Putem spune ca variabilele ordinale
asigura mai multa informatie dect variabilele nominale.
Variabile tip interval permit nu numai ordonarea variabilelor masurate dar si
cuantificarea diferentelor dintre ele. Pentru aceasta se defineste o scala si apoi se
realizeaza masuratoare in raport cu aceasta scala. De ex. scara temperaturilor Celsius.
Putem spune ca o temp. de 400C este mai mare decit una de 300C si mai putem spune
ca o crestere de temp. de la 20 la 40 0C este de doua ori mai mare decit o crestere de
temperatura de la 30 la 400C.
Variabile tip raport sunt foarte similare cu cel tip interval dar implica in mod
suplimentar un punct de zero absolut. Exemple de astfel de scri sunt temp Kelvin,
spatiu, timpul. Pe o astfel de scara putem stabili si corelatii intre valorile absolute ale
variabilelor.
Determinate (sistematice)
erori personale (grosolane);
erori ale metodei;
erori instrumentale;
erori de procedura.
Nedeterminate (ntmpltoare)
erori personale (subiective);
Erorile de procedur sunt erorile care apar datorit neaplicarii sau a aplicrii incorecte
normelor i standardelor legate de recoltarea probei i de pregtirea ei n vederea
analizrii.
n analiza chimic evidenierea erorilor ntmpltoare se poate realiza prin utilizarea
metodelor statistice de analiz a datelor. Deasemenea se pot aplica diferite teste de
eliminare a datelor necorespunztoare care ar vicia valoarea mediei. Aici intervine
chemometria: n scopul de a obine cele mai bune rezultate att prin interpretarea
datelor dar i prin optimizarea procesului analitic.
x=
x1 + x2 + x3 + ... + xi + ... xn
=
n
x
i =1
(2)
Exemplu:
Se dau urmatoarele date: 4, 1, 5, 9, 2, 4, 7, 3, 12, 4, 6. Sa se calculeze media aritmetica
a acestor date.
Rezolvare:
Se calculeaz media aritmetic a acestor date ca fiind: x = 57 / 11 = 5,18
FUNCIA EXCEL ce poate fi folosita pentru calculul mediei unui set de date este:
AVERAGE (numar1, numar2, N.)
Calculeaza media aritmetica a unei probe formate din: numar1, numar2, N.
Mediana (Me)
Mediana sau valoarea de mijloc se obine prin ordonarea cresctoare a datelor i
identificarea datei situate la mijlocul seriei.
x1 x2 ................... xm ....... xn
n cazul n care aceast serie conine un numr impar de date, mediana va fi
considerat valoarea situat la mijlocul seriei:
x1, x2,.............xm,...........xn
daca n este impar n=2k+1 i m=(n+1)/2 iar Me = xm
n cazul n care aceast serie conine un numr par de date, mediana va fi
considerat media aritmetic a celor dou date situate la mijlocul seriei:
x1, x2,.............xm, xm+1,...........xn
daca n este par n=2k i m = n/2 iar Me = (xm + xm+1)/2
Exemplu:
Se dau aceleai date utilizate la calculul mediei: 4, 1, 5, 9, 2, 4, 7, 3, 12, 4, 6. Sa se
indice mediana acestui set de date.
Rezolvare:
Se ordoneaz cresctor datele: 1 2 3 4 4 4 5 6 7 9 12
Se identific valoarea din mijlocul seriei ordonate ca fiind mediana seriei: Me = 4
Se poate observa c mediana nu mai este influenat de ctre valorile extreme.
FUNCIA EXCEL ce poate fi folosita pentru calculul medianei unui set de date este:
MEDIAN (numar1, numar2, N.)
Calculeaza mediana unei probe formate din: numar1, numar2, N.
Argumentele sunt de la 1 la 30 de numere, acestea pot fi precizate ca atare sau se pot
da pentru ele adresele la care sunt stocate numerele. Adresele pot fi date una cte una
(A1;A2;A3;A4;A5) sau sub forma de vector (A1:A5) sau matrice (A1:B5).
Modulul (Mo)
Modulul reprezint valoarea care apare cu frecvena cea mai mare. Funcie de
acest parametru populaia de date poate fi clasificat n unimodal sau polimodal. O
funcie polimodal arat neomogenitatea datelor, adic arat faptul c datele obinute
nu fac parte din aceeai populatie.
Exemplu:
2
1
0
Mo1 = 6
3
frecventa
frecventa
1 2 3 4 5 6 7 8 9
date
A. Populaie unimodal
Mo2 = 4
1
0
1 2 3 4 5 6 7 8 9
date
FUNCIA EXCEL ce poate fi folosita pentru calculul modulului unui set de date este:
MODE (numar1, numar2, N.)
Calculeaza modulul unei probe formate din: numar1, numar2, N.
Argumentele sunt de la 1 la 30 de numere, acestea pot fi precizate ca atare sau se pot
da pentru ele adresele la care sunt stocate numerele. Adresele pot fi date una cte una
(A1;A2;A3;A4;A5) sau sub forma de vector (A1:A5) sau matrice (A1:B5).
A = xmax xmin
Exemplu:
Sa se determine intervalul de variatie pentru urmatorul set de date:
1, 4, 3, 7, 4, 9, 2, 4, 8, 6, 4
Rezolvare:
-
FUNCIA EXCEL ce poate fi folosita pentru calculul intervalului de variatie al unui set
de date este:
MAX (numar1, numar2, N.) - MIN (numar1, numar2, N.)
Calculeaza intervalul de variatie al unei probe formate din: numar1, numar2, N.
Argumentele sunt de la 1 la 30 de numere, acestea pot fi precizate ca atare sau se pot
da pentru ele adresele la care sunt stocate numerele. Adresele pot fi date una cte una
(A1;A2;A3;A4;A5) sau sub forma de vector (A1:A5) sau matrice (A1:B5).
Deviaia standard (abaterea medie ptratic) (s)
Deviaia standard este parametrul principal care exprim mprtierea
rezultatelor n jurul valorii medii, fiind un indicator al preciziei (al reproductibilitii
rezultatelor). Deasemenea, deviaia standard este un indicator de punere n eviden a
erorilor ntmpltoare care afecteaz procesul de analiz. n cazul unei distribuii
normale a datelor, se calculeaz cu formula:
s=
1 n
( xi x ) 2
n 1 i =1
(3)
Exemplu:
Sa se determine deviatia standard pentru urmatorul set de date: 2, 4, 3, 6
Rezolvare:
Se calculeaza mai intai media aritmetica a setului de date: x = (2+4+3+6) / 4= 3,75
Se calculeaza deviatia standard a setului de date cu ajutorul mediei aritmetice calculata
anterior:
s=
1 n
( xi x ) 2 =
n 1 i =1
FUNCIA EXCEL ce poate fi folosita pentru calculul deviatiei standard a unui set de
date este:
STDEV (numar1, numar2, N)
Calculeaza deviatia standard a unei probe formate din: numar1, numar2,N.
Argumentele sunt de la 1 la 30 de numere, acestea pot fi precizate ca atare sau se pot
da pentru ele adresele la care sunt stocate numerele. Adresele pot fi date una cte una
(A1;A2;A3;A4;A5) sau sub forma de vector (A1:A5) sau matrice (A1:B5).
Dispersia (variana) (s2)
Dispersia sau variana reprezint ptratul deviaiei standard i msoar gradul de
mprtiere a eantionului n jurul mediei de sondaj. Presupunnd c exist n elemente
n eantion, cu valorile {x1, x2, . . . , xn}, avnd media:
x + x2 + x3 + ... + xi + ... xn
x= 1
=
n
i =1
x
)
=
[
x
( xi ) 2 ]
i
i
n 1 i =1
n 1 i =1
n i =1
Exemplu:
Sa se determine dispersia pentru urmatorul set de date: 2, 4, 3, 6
Rezolvare:
Se calculeaza mai intai media aritmetica a setului de date: x = (2+4+3+6) / 4= 3,75
Se calculeaza dispersia setului de date cu ajutorul mediei aritmetice calculata anterior:
(2 3.75) 2 + ( 4 3.75) 2 + (3 3.75) 2 + (6 3.75) 2
1 n
2
s2 =
(
x
x
)
=
= 2.92
i
n 1 i =1
4
FUNCIA EXCEL ce poate fi folosita pentru calculul dispersiei unui set de date este:
VAR (numar1, numar2, N)
Calculeaza dispersia unei probe formate din: numar1, numar2,N.
Argumentele sunt de la 1 la 30 de numere, acestea pot fi precizate ca atare sau se pot
da pentru ele adresele la care sunt stocate numerele. Adresele pot fi date una cte una
(A1;A2;A3;A4;A5) sau sub forma de vector (A1:A5) sau matrice (A1:B5).
Deviaia medie a datelor (dm)
Deviaia medie a datelor reprezint media aritmetic a valorilor absolute a
deviaiilor individuale a datelor n jurul valorii medii. Deviaia individual reprezint
valoarea absolut a diferenei ntre valoarea individual (xi) i valoarea mediei
aritmetic ( x ) a acestor valori.
n
x
dm =
i =1
(5)
Exemplu:
Sa se determine deviatia medie pentru urmatorul set de date: 2, 4, 3, 6
Rezolvare:
Se calculeaza mai intai media aritmetica a setului de date: x = (2+4+3+6) / 4= 3,75
Se calculeaza deviatia standard a setului de date cu ajutorul mediei aritmetice calculata
n
x
anterior: d m =
i =1
x
=
= 1.25
FUNCIA EXCEL ce poate fi folosita pentru calculul deviatiei medie a unui set de date
este:
AVEDEV (numar1, numar2, N)
Calculeaza deviatia medie a unei probe formate din: numar1, numar2,N.
Argumentele sunt de la 1 la 30 de numere, acestea pot fi precizate ca atare sau se pot
da pentru ele adresele la care sunt stocate numerele. Adresele pot fi date una cte una
(A1;A2;A3;A4;A5) sau sub forma de vector (A1:A5) sau matrice (A1:B5).
V(set 2) = 16.30% - este ntre 15 i 30%, mprtierea datelor este mijlocie, media fiind
nc suficient de reprezentativ;
V(set 3) = 39.10% - depete 30%, media aritmetic nu este reprezentativ pentru
proba n cauz, fiind recomandat utilizarea medianei din cauza lipsei de omogenitate a
grupului de valori.
Exemplu:
Un student utilizeaz o pipet automat pentru a preleva 3 probe de cte 50,000
mL dintr-o soluie. Masele celor trei probe sunt 50,0122g; 50,0119g i 50,0123g. S se
calculeze media, dispersia, deviaia standard i variabilitatea acestor valori. S se
reprezinte grafic valorile obinute.
Rezolvare:
Calculul mediei: x = (50,0122 g + 50,0119 g + 50,0123g ) / 3 = 50,01213 g
(utiliznd regulile cifrelor semnificative, acest rezultat trebuie rotunjit la 50,0121g, dar este mai bine s se
menin i ultima zecimal dintr-un motiv ce va fi explicat ulterior)
Calculul dispersiei:
(50,0122 50,0121) 2 + (50,0119 50,0121) 2 + (50,0123 50,0121) 2
s2 =
= 4,3 * 10 8 g 2
2
Calculul deviaiei standard:
s = 2,1 * 10 4 g
50.0125
50.0124
50.0123
Greutate, g
50.0122
50.0121
50.0120
50.0119
50.0118
50.0117
50.0116
50.0115
Nr. proba
4
Calculul Variabilitatii: V =
2,1 * 10 g
100 = 0.001%
50.01213
1.5 Acurateea
ntr-un laborator chimic obinuit multe din rezultatele experimentale sunt
cantitative. Valorile numerice pentru experimentari repetate sunt obinute prin proceduri
analitice pentru care un experimentator atent trebuie sa aibe informaii despre acuratee
i precizie.
Acurateea este o msur a apropierii determinrilor experimentale de valoarea
adevarat. n anumite experimente, studenii primesc o prob de compoziie
necunoscut. De fapt compoziia este necunoscut doar de ctre student, cel mai
adesea instructorul are aceasta informatie. n alte cazuri exist probe cu compoziie
precis cunoscut care sunt livrate de companii care furnizeaza tabele cu valori
adevarate ale compoziie probei ce urmeaz a fi analizat. Aceste rezultate au fost
obinute de ctre chimiti experimentai ce au utilizat metode de ncredere i un numr
mare de experimentri repetate.
n continuare, ne vom referi la o valoare adevarat cum este media populaiei ().
Presupunerea de adevarat nseamn c aceast valoare a fost obinut printr-un
numr foarte mare de experimentri (250 sau mai multe). Valoarea absolut a diferenei
dintre media populaiei () i media unei probe de doar cteva experimentri ( x ) se
numete eroare absolut (EA) i este o msur a acurateii experimentului.
EA = x
(5)
Exemplu:
Un student obine, la analiza concentraiei unei soluii de sulfat, urmtoarele
rezultate: 14,78%; 14,86% i 14,69%. Profesorul i spune c valoarea real a probei
de analizat este 14,81%. Care este eroarea absolut ?
Rezolvare:
Media valoarilor studentului este: x = (14,78 + 14,86 + 14,69)/3 = 14,78;
Eroarea absoluta este: EA = | 14,81% - 14,78| = 0,03%
Reacia intuitiv a studentului fa de aceast valoare este s spun c rezultatul
su este bun; dar n continuare, el nu are nici un mijloc de a dovedi aceasta.
n continuare, vom descrie posibilitile de a folosi statistica pentru a estima
acurateea rezultatului i a prezice dac este ceva gresit cu un rezultat. Erorile
determinate care fac ca valoarea practic obinut s difere de valoarea absolut sunt
clasificate n trei tipuri: erori personale, erori ale metodei i erori instrumentale. O
anumit eroare face ca rezultatul experimental sa fie mai mic sau mai mare dect cel
obinut n absena ei.
n analiza continutului de sulfat, precipitatul nu a avut suficient tip pentru formare i
n consecinta cristalele de sulfat de bariu au fost prea mici pentru a putea fi separate
prin filtrarea pe hrtie de filtru. Ce tip de eroare este acesta i ce efect va avea asupra
concentratiei calculate de sulfat ?
1.6 Precizia
Precizia este raspndirea unui set de rezultate obinute n acelai experiment. n
primul exemplu din seciunea precedent, rezultatele celor trei probe variaz putin
unele fa de altele. Aceasta este de asteptat. Ar trebui s fii mult mai surprins dac ai
obine rezultate identice deoarece orict de grijuliu ai fi nu se poate repeta experimentul
n mod identic de fiecare dat. S ne imaginam un chimist perfect care folosete o
metod de ncredere absolut i nite aparate perfecte. Daca acesta repet analiza de
300 de ori va putea el obine pentru toate rezultatele sale o valoare unic de 14,81% ?
Intuiia noastr despre msurtori repetate ne spune c nici n aceast situaie ideal,
acest lucru nu este posibil. Chiar i n absena unor erori determinate ne ateptm s
gsim o valoare medie apropiat de 14,81% i numere egale de masurtori deasupra i
dedesuptul acestei valori. Tipul de eroare care cauzeaz o astfel de distribuie se
numete eroare nedeterminat sau ntmplatoare. Ea este ntotdeauna prezent n
orice experiment i nu poate fi atribuit unei cauze specifice. Mrimea erorii
ntmplatoare este o estimare a preciziei experimentului.
n cazul (descris mai sus) al chimistului profesionist care face sute de
experimentari ale aceleiai probe, parametrul statistic care msoar precizia
msuratorilor se numete deviaia standard (). O estimare a acestui parametru poate
fi obinut dintr-un numr redus de experimentri ( se noteaz cu s).
Intervalul de variaie (diferena dintre cea mai mare i cea mai mic valoare) este
o alt masur a preciziei unui set de date, dar el este mai puin folosit n tratamentul
statistic al datelor.
Noiunile de medie universal i de deviaie standard menionate n paragraful de
mai sus sunt foarte importante. Un set de rezultate al unui experiment perfect repetat
de sute de ori produce o populaie de rezultate. Aceast populaie conine toate
rezultatele teoretic posibile pentru valoarea masurat cu presupunerea c apar doar
erori ntamplatoare. Cu ct este mai mare numrul de msurtori (n) cu att distribuia
rezultatelor va fi mai aproape de distribuia teoretic.
Estimari ale mediei i deviaiei standard pot fi obinute din orice numr de valori.
Pentru un numr mic de valori ele vor fi denumite media probei ( x) deviaia standard a
probei (s) i asta deoarece setul de valori (xi) utilizat pentru calcul este doar o prob
oarecare din toate rezultatele care ar fi teoretic posibil s fie obinute. Pe msur ce n
crete valorile calculate ale mediei ( x ) i deviatiei standard (s) se apropie de valorile
populaiei i . Unul din scopurile acestui curs este de a utiliza valorile x i s obinute
din rezultate experimentale i chiar valorile i (dac se cunosc) pentru a estima
probabilitatea prezenei erorilor determinate n rezultatele noastre.
s
n
(6)
2,1 * 10 4 g
= 1,2 * 10 4 g = 0,00012 g
3
Deviaia standard a balanei apare de dou ori deoarece se fac dou cntriri
succesive. Masa probei trebuie rotunjit la a patra zecimal i trebuie raportat ca fiind:
0,6463g cu ES 0,00018g. Se observ c erorile nu sunt aditive, dar ES a rezultatului
este mai mare dect erorile rezultatelor individuale.
Exemplu Calculul masei moleculare:
S presupunem c dorim s calculm masa molecular a Na2CO3.
n cazurile n care nu se cunoate deviaia standard a unei valori individuale se poate
estima ca fiind 1 * 10-n , n fiind numrul de zecimale considerate.
Se cunosc datele:
MNa = 22,9898 g/mol ; ES = 0,0001 g/mol;
MC = 12,011 g/mol; ES = 0,001 g/mol;
MO = 15,9994 g/mol; ES = 0,0001 g/mol.
Rezolvare:
Masa molecular va fi:
MNa2CO3 = 2*22,9898 + 12,011 + 3 * 15,9994 = 105,9888 g/mol
iar eroarea standard a rezultatului va fi:
g 2
g 2
g 2
g
ES masa moleculara = 2 * (0,0001
) + (0,001
) + 3 * (0,0001
) = 1.02 * 10 3
mol
mol
mol
mol
Deci, masa molecular trebuie raportat ca fiind egal cu 105,989 g/mol cu ES 0,001
g/mol.
Se observ c erorile standard mici (de ex. 0,0001) au o contribuie neglijabil, de
aceea se poate folosi o regul aproximativ care estimeaz eroarea standard a unui
rezultat ca fiind egal cu cea mai mare dintre erorile standard ale datelor primare.
(16)
Exemplu:
Masa unei probe este egal cu 0,1763 g iar DS = 0,00013g. Volumul aceleiai probe
este 0,100 mL iar DS = 0,00005 mL. Calculai densitatea i ES a densitii pentru
aceast prob.
Rezolvare:
Se calculeaz densitatea probei:
0,1763g
d=
= 1,763g / ml
0,100mL
Se calculeaz deviaiile standard relative pentru masa i volumul probei:
0,00013g
( DS ) relativa a masei =
= 0,00074
0,1763g
0,00005mL
( DS ) relativa a volumului =
= 0,0005
0,100mL
Ecuaia de calcul pentru aflarea eroarea standard relativ a densitatii (care se
calculeaz prin mprirea valorilor experimentale volum i masa) este:
Exemplu:
S se calculeze ES a numrului de moli de carbonat de sodiu folosind urmtoarele
date:
- masa de carbonat: m Na 2CO 3 = 0,6463 g; ES = 0,0018 g;
- masa molecular a carbonatului de sodiu: M Na 2CO 3 = 105,989 g/mol ; ES= 0,001
g/mol
Rezolvare:
Se calculeaz numrul de moli de carbonat de sodiu:
m Na 2CO 3
0,6463g
=
= 0,0060978moli
M Na 2CO 3 105,989 g
mol
Se calculeaz deviaiile standard relative a masei de prob i a masei moleculare a
carbonatului de sodiu:
0,00018 g
( DS ) relativa a masei de Na 2Co 3 =
= 0,00028
0,6463g
n Na 2CO 3 =
0,001g / mol
= 0,0000094
105,989 g / mol
Rezultatul final trebuie raportat ca fiind: numar moli carbonat de sodiu = 0,006098 moli;
ES = 0,00000017 moli.
xn xn 1
intervalul de variatie
sau Qcalc =
x2 x1
intervalul de variatie
(7)
u=
X valoarea suspecta
s
(8)
Exemplu:
n acelai laborator i prin aceeai metod, 20 de studeni analizeaz coninutul de Fe
al unui aliaj. Media celor 20 de valori obinute este de 13,66%. Deviaia standard pentru
aceast prob este de 0,83%. Cel de-al douzeci i unulea student efectueaz
acelai experiment o saptamn mai trziu i obine o valoare de 13,91%. Rezultatul lui
poate fi respins sau nu?
Rezolvare:
Se calculeaz raportul: u = |13,66-13,91|/0,83 = 0,30
Deoarece valoarea raportului nu depete 2,1, putem trage concluzia c rezultatul
ultimului student se ncadreaz n distribuia normal a probei i nu poate fi respins.
Probe cu 31-100 de valori
n cazul unor astfel de probe mai mari, valorile calculate pentru medie i
dispersie sunt mai apropiate de valorile "adevarate" ale populaiei deci criteriile de
respingere vor putea fi aplicate mai sigur.
Se determin acelai raport ca mai sus, dar valoarea limit peste care se aplic
respingerea rezultatului suspect este diferit, funcie de nivelul de ncredere propus:
Tabel 8. Valori limit ale u funcie de nivelul de ncredere propus
pentru probe cu 11-30 elemente
95%
98%
99%
99,5%
Nivel incredere propus
Valoare limita u
2,0
2,34
2,59
3,0
Exemplu:
Un numr de 15 studeni analizeaz aceeai soluie de HCl, fiecare realiznd un numar
de 3 experimentri. Valorile caracteristice ale probei de 45 de rezultate sunt: media
0,1011N i deviaia standard 0,0008N. Valoarea suspect (cea mai diferit de
celelate) este de 0,0996N, poate ea fi respins sau nu?
Rezolvare:
Se calculeaz raportul: |0,1011-0,0995|/0,0008 = 1,9
Valoarea acestui raport nu depete valoarea tabelat de 2,0 i n concluzie valoarea
suspect nu poate fi respins.
Probe foarte mari (cu mai mult de 100 de valori)
Pentru astfel de probe valorile calculate ale mediei i deviaiei standard se
consider a fi estimri foarte bune ale valorilor "adevarate" i . n consecin, se pot
aplica valorile tabelate ale distribuiei normale standard.