Sunteți pe pagina 1din 22

CONTROLUL STATISTIC

AL ALIMENTELOR

Curs 1

Elemente generale de statistic


matematic aplicat

1.1 Populaia i probele statistice


O populaie statistic defininete totalitatea fenomenelor sau obiectelor
calitativ omogene avnd una sau mai multe caracteristici comune.
Iat cteva exemple:
a) un lot de 10 000 dopuri de plastic (au toate acelai scop);
b) rezultatele unei serii de analize (toate sunt obinute prin aceeai
metod de analiz);
c) parametrii unui proces tehnologic elaborat n faz experimental.
O proprietate a unei populaii statistice se apreciaz pe baza unei pri din
colectivitate, denumit prob.
PROBA trebuie s ndeplineasc condiia s fie luat din populaie n aa fel
nct fiecare element din populaie s aib aceeai probabilitate de a face
parte din prob. Astfel de probe se numesc probe reprezentative.

Variabile - independente sunt cele care sunt manipulate;


- dependente sunt cele a caror valoare este masurata, determinata.

Scri de msur
Variabilele difer ntre ele si prin Ct de bine pot fi ele msurate.
Este clar c n orice msurtoare este implicat o anumit eroare, aceasta determina
cantitatea de informatie pe care o putem obine.
Exista mai multe tipuri de scri de msur ceea ce determina si tipuri de variabile:
nominale permit doar clasificarea calitativ. Putem sa spunem ca termenul respectiv
apartine unei anumite categorii dar nu putem spune cit de mult apartine. (ex. gen: masculin
feminin; rasa, oras, etc.);
ordinale permit clasificarea calitativa si o ordonare a claselor fara insa o masura precisa. Ex.
de astfel de variabila este nivelul socioeconomic al unei familii. Daca o incadram in clasa
mjlocie-inalta stim ca este o clasa deasupra clasei mijlocii dar nu putem spune ca este cu 18%
mai mult (de ex.). Putem spune ca variabilele ordinale asigura mai multa informatie dect
variabilele nominale.
Variabile tip interval permit nu numai ordonarea variabilelor masurate dar si cuantificarea
diferentelor dintre ele. Pentru aceasta se defineste o scala si apoi se realizeaza masuratoare in
raport cu aceasta scala. De ex. scara temperaturilor Celsius. Putem spune ca o temp. de 400C
este mai mare decit una de 300C si mai putem spune ca o crestere de temp. de la 20 la 40 0C
este de doua ori mai mare decit o crestere de temperatura de la 30 la 400C.
Variabile tip raport sunt foarte similare cu cel tip interval dar implica in mod suplimentar un
punct de zero absolut. Exemple de astfel de scri sunt temp Kelvin, spatiu, timpul. Pe o astfel
de scara putem stabili si corelatii intre valorile absolute ale variabilelor.

1.2 Mrimi fizice, uniti de msur


O mrime fizic trebuie sa fie definit
- calitativ (prin natura ei)
Identificarea calitativ a unei mrimi fizice se face prin senzaii
vizuale, auditive, tactile, termice sau kinestezice i conduce la
stabilirea naturii ei (ex.: timp, masa, lungime).
- cantitativ (prin valoarea numeric) pentru a fi msurabil.
Valoarea numeric a unei mrimi fizice se determin ca raport ntre
mrimea ei i o alt mrime considerat drept referin( unitatea de
msur). Pe baza unitii de msur i a valorilor pe care le poate lua o
mrime fizic se poate construi o scar de msurare. Exist mrimi fizice
aditive (masa) i mrimi fizice neaditive (pH, presiunea, temperatura).
Pentru mrimile fizice neaditive, scara de msur este aleas prin
convenie, de obicei prin definirea unui interval ntre dou valori.
n funcie de proprieti, se poate face urmatoarea clasificare a mrimilor fizice:
- extensive - prezint proprieti de ordonare i sumabilitate
- intensive - prezint doar proprieti de ordonare
- scalare - sunt determinate doar de valoarea lor numeric
- vectoriale - care asociaz fiecrei coordonate cte un vector (fora)

Mrimile fizice de baz numite i mrimi fizice fundamentale sunt mrimi


independente alese ntr-un mod convenional.

Ele sunt (conform Sistemului Internaional de Uniti):


1. Lungimea (simbol l, unitate de msur un metru, 1 m)
2. Masa (simbol m, unitate de msur un kilogram, 1 kg)
3. Timpul (simbol t, unitate de msur o secund, 1 s)
4. Temperatura absolut (simbol T, unitate de msur un Kelvin, 1 K)
5. Intensitatea radiat a fluxului de lumin (simbol J, unitate de masur o
candel, 1 cd)
6. Intensitatea curentului electric (simbol I, unitate de masur un Amper, 1 A)
7. Cantitatea de substan (simbol N, unitate de masur un mol, 1 mol)

Mrimile fizice derivate se definesc pe baza celor fundamentale i se obin cu


ajutorul mrimilor fundamentale

1.3 Tipuri de erori


Dintr-o experienta oarecare nu se obtine valoarea matematic
precisa a marimii masurate, ci numai un interval mai larg sau mai
ingust, in interiorul caruia se gaseste valoarea reala masurata.
Cunoasterea acestui interval este necesara pentru a aplica cu
suficienta siguranta datele experimentale in calculele numerice si a
compara intre ele diferite metode si procese.

Determinate (sistematice)
n funcie de natura lor,
erorile pot fi:

erori personale (grosolane);


erori ale metodei;
erori instrumentale;
erori de procedura.

Nedeterminate (ntmpltoare)

erori personale
(subiective);

1.4 Parametrii statistici


Avnd la dispoziie un numr de date nregistrate, denumite date primare,
pentru a putea trage concluzii valabile asupra problemei cercetate, datele
trebuie caracterizate.
Pentru caracterizarea populaiei se folosesc parametrii statistici care:
media aritmetic,
- caracterizeaz distribuia datelor mediana,
modulul;

indic tendina de
mpratiere a datelor

intervalul de variaie al datelor,


deviaia standard,
dispersia,
deviaia medie,
variabilitatea;

Media aritmetic ( x )
Media aritmetica a unui set de msurtori
repetate, reprezint tendina valorii msurate
de a se apropia de o valoare central i poate fi
determinat ca medie aritmetic:

x=

suma _ rezultatelor
n
n

xi
x1 + x2 + x3 + ... + xi + ...xn
i =1
x=
=
n
n

Exemplu:
x se calculeze media aritmetica a
Se dau urmatoarele date: 4, 1, 5, 9, 2, 4, 7, 3, 12, 4, 6. Sa
acestor date.
Rezolvare:
Se calculeaz media aritmetic a acestor date ca fiind = 57 / 11 = 5,18
FUNCIA EXCEL ce poate fi folosita pentru calculul mediei unui set de date este:
AVERAGE (numar1, numar2, .)
Calculeaza media aritmetica a unei probe formate din: numar1, numar2, .

Mediana (Me)
Mediana sau valoarea de mijloc se obine prin ordonarea cresctoare a datelor i
identificarea datei situate la mijlocul seriei.
x1 x2 ................... xm ....... xn
n cazul n care aceast serie conine
un numr impar de date, mediana va fi
considerat valoarea situat la mijlocul
seriei:
x1, x2,.............xm,...........xn
daca n este impar n=2k+1 i
m=(n+1)/2 iar Me = xm

n cazul n care aceast serie conine


un numr par de date, mediana va fi
considerat media aritmetic a celor
dou date situate la mijlocul seriei:
x1, x2,.............xm, xm+1,...........xn
daca n este par n=2k i m = n/2
iar Me = (xm + xm+1)/2

Exemplu:
Se dau aceleai date utilizate la calculul mediei: 4, 1, 5, 9, 2, 4, 7, 3, 12, 4, 6. Sa se
indice mediana acestui set de date.
Rezolvare:
Se ordoneaz cresctor datele: 1 2 3 4 4 4 5 6 7 9 12
Se identific valoarea din mijlocul seriei ordonate ca fiind mediana seriei: Me = 4
Se poate observa c mediana nu mai este influenat de ctre valorile extreme.
EXCEL: MEDIAN (numar1, numar2, .)
Calculeaza mediana unei probe formate din: numar1, numar2, .

Modulul (Mo)
Modulul reprezint valoarea care apare cu frecvena cea mai mare. Funcie de
acest parametru populaia de date poate fi clasificat n unimodal sau polimodal.
O funcie polimodal arat neomogenitatea datelor, adic arat faptul c datele
obinute nu fac parte din aceeai populatie

EXCEL:

Mo = 4

frecventa

3
2
1
0
1 2 3 4 5 6 7 8 9
date
Mo1 = 6
3
frecventa

Exemplu:
Sa se determine modulele pentru urmatoarele seturi de
date si sa se reprezinte grafic frecventa de aparitie a
datelor:
a) 1, 4, 3, 7, 4, 9, 2, 4, 8, 6, 4
b) 1, 6, 3, 4, 9, 5, 6, 2, 6, 8, 7, 4, 6
Rezolvare:
a) se ordoneaza crescator irul de date:
1,2,3,4,4,4,5,6,7,8,9;
modulul este valoarea care se repeta cu frecventa cea mai
mare: Mo = 4
b) se ordoneaza crescator irul de date::
1,2,3,4,4,5,6,6,6,6,7,8,9
cele dou module sunt: Mo1 = 6 i Mo2 = 4

Mo2 = 4

2
1
0

1 2 3 4 5 6 7 8 9
date

MODE (numar1, numar2, .)


Calculeaza modulul unei probe formate din: numar1, numar2, .

Intervalul de variaie al datelor (sau amplitudinea) (A)


Intervalul de variaie al datelor reprezint diferena dintre cea mai mare i cea mai
mic valoare. Cu ct intervalul de variaie va fi mai mic cu att valorile vor fi mai
apropiate i frecvena de apariie a unei valori individuale mai mare:
A = xmax xmin
Exemplu:
Sa se determine intervalul de variatie pentru urmatorul set de date:
1, 4, 3, 7, 4, 9, 2, 4, 8, 6, 4
Rezolvare:
se ordoneaza crescator irul de date: 1,2,3,4,4,4,5,6,7,8,9;
intervalul de variatie va fi; A = xmax xmin= 9 1 = 8
FUNCIA EXCEL ce poate fi folosita pentru calculul intervalului de variatie al unui set
de date este:
MAX (numar1, numar2, .) - MIN (numar1, numar2, .)
Calculeaza intervalul de variatie al unei probe formate din: numar1, numar2, .

Deviaia standard (abaterea medie ptratic) (s)


Deviaia standard este parametrul principal care exprim mprtierea rezultatelor
n jurul valorii medii, fiind un indicator al preciziei (al reproductibilitii
rezultatelor). Deasemenea, deviaia standard este un indicator de punere n
eviden a erorilor ntmpltoare care afecteaz procesul de analiz. n cazul unei
distribuii normale a datelor, se calculeaz cu formula:

s=

1 n
2
(
x

x
)
i
n 1 i =1

Exemplu:
Sa se determine deviatia standard pentru urmatorul set de date: 2, 4, 3, 6
Rezolvare:
Se calculeaza mai intai media aritmetica a setului de date: x= (2+4+3+6) / 4= 3,75
Se calculeaza deviatia standard a setului de date cu ajutorul mediei aritmetice
calculata anterior:
s=

1 n
( xi x ) 2 =

n 1 i =1

( 2 3.75) 2 + ( 4 3.75) 2 + (3 3.75) 2 + (6 3.75) 2


= 1.71
3

EXCEL: STDEV (numar1, numar2, )


Calculeaza deviatia standard a unei probe formate din: numar1, numar2,.

Dispersia (variana) (s2)


Dispersia sau variana reprezint ptratul deviaiei standard i msoar gradul de
mprtiere a eantionului n jurul mediei de sondaj. Presupunnd c exist n
elemente n eantion, cu valorile x1, x2, . . . , xn avnd media:
n

x + x2 + x3 + ... + xi + ... xn
x= 1
=
n

atunci dispersia este:

i =1

n
1 n
1
1 n
2
2
s =
( xi x ) =
[ xi ( xi ) 2 ]

n 1 i =1
n 1 i =1
n i =1
2

Exemplu:
Sa se determine dispersia pentru urmatorul set de date: 2, 4, 3, 6
Rezolvare:
Se calculeaza mai intai media aritmetica a setului de date: x = (2+4+3+6) / 4= 3,75
Se calculeaza dispersia setului de date cu ajutorul mediei aritmetice calculata
anterior: 2
1 n
( 2 3.75) 2 + ( 4 3.75) 2 + (3 3.75) 2 + (6 3.75) 2
2
s =

EXCEL:

(x

n 1 i =1

x) =

VAR (numar1, numar2, )


Calculeaza dispersia unei probe formate din: numar1, numar2,.

= 2.92

Deviaia medie a datelor (dm)


Deviaia medie a datelor reprezint media aritmetic a valorilor absolute a
deviaiilor individuale a datelor n jurul valorii medii. Deviaia individual
reprezint valoarea absolut a diferenei ntre valoarea individual (xi) i valoarea
mediei aritmetic ( x ) a acestor valori.
n

x
dm =

i =1

Exemplu:
Sa se determine deviatia medie pentru urmatorul set de date: 2, 4, 3, 6
Rezolvare:
Se calculeaza mai intai media aritmetica a setului de date: = (2+4+3+6) / 4= 3,75
Se calculeaza deviatia standard a setului de date cu ajutorul mediei aritmetice
n
calculata anterior:

dm =

EXCEL:

i =1

2 3.75 + 4 3.75 + 3 3.75 + 6 3.75


4

= 1.25

AVEDEV (numar1, numar2, )


Calculeaza deviatia medie a unei probe formate din: numar1, numar2,.

Variabilitatea (coeficientul de variaie al lui Pearson) (V)


Variabilitatea este utilizat n scopul stabilirii
gradului de omogenitate a unei probe i se
obine prin raportarea procentuala a deviaiei
standard la media probei:
Exemplu:
Se dau urmatorele 3 seturi de date:
set 1
set 2
set 3
82.35
68.67
35.67
80.24
75.34 124.358
78.38
62.59
118.63
77.78
95.84
46.38
83.59
91.27
106.56
80.83
75.85
58.93
79.58
92.59
69.58
80.56
66.59
86.59

Sa se calculeze media, deviatia standard


si variabilitatea pentru fiecare set si sa
se interpreteze valorile obtinute.

EXCEL:

s
V = 100 %
x

Rezolvare:
set 1
set 2
set 3
media
80.25
80.25
80.25
deviatia standard
1.86
13.08
31.38
variabilitatea
2.32
16.30
39.10

Interpretarea variabilitii se face n funcie


de valorile obinute:
V(set 1) = 2.32% - este cuprins ntre 0 i 15%, nseamn c
mprtierea datelor este foarte mic, iar media este
reprezentativ, deoarece proba msurat este omogen;
V(set 2) = 16.30% - este ntre 15 i 30%, mprtierea
datelor este mijlocie, media fiind nc suficient de
reprezentativ;
V(set 3) = 39.10% - depete 30%, media aritmetic nu
este reprezentativ pentru proba n cauz, fiind
recomandat utilizarea medianei din cauza lipsei de
omogenitate a grupului de valori.

STDEV (numar1, numar2, ) / AVERAGE (numar1, numar2, ) * 100

1.5 Acurateea
ntr-un laborator chimic obinuit multe din rezultatele experimentale sunt cantitative.
Valorile numerice pentru experimentari repetate sunt obinute prin proceduri analitice
pentru care un experimentator atent trebuie sa aibe informaii despre acuratee i
precizie.
Acurateea este o msur a apropierii determinrilor experimentale de valoarea
adevarat. n anumite experimente, studenii primesc o prob de compoziie
necunoscut. De fapt compoziia este necunoscut doar de ctre student, cel mai
adesea instructorul are aceasta informatie. n alte cazuri exist probe cu compoziie
precis cunoscut care sunt livrate de companii care furnizeaza tabele cu valori
adevarate ale compoziie probei ce urmeaz a fi analizat. Aceste rezultate au fost
obinute de ctre chimiti experimentai ce au utilizat metode de ncredere i un
numr mare de experimentri repetate.
n continuare, ne vom referi la o valoare adevarat cum este media populaiei ().
Presupunerea de adevarat nseamn c aceast valoare a fost obinut printr-un
numr foarte mare de experimentri (250 sau mai multe). Valoarea absolut a
diferenei dintre media populaiei () i media unei probe de doar cteva
experimentri ( )x se numete eroare absolut (EA) i este o msur a acurateii
experimentului.

EA = x

Exemplu:
Un student obine, la analiza concentraiei unei soluii de sulfat, urmtoarele
rezultate: 14,78%; 14,86% i 14,69%. Profesorul i spune c valoarea real a probei de
analizat este 14,81%. Care este eroarea absolut ?
Rezolvare:
Media valoarilor studentului este: x = (14,78 + 14,86 + 14,69)/3 = 14,78;
Eroarea absoluta este: EA = | 14,81% - 14,78| = 0,03%

Reacia intuitiv a studentului fa de aceast valoare este s spun c rezultatul su


este bun; dar n continuare, el nu are nici un mijloc de a dovedi aceasta.
n continuare, vom descrie posibilitile de a folosi statistica pentru a estima
acurateea rezultatului i a prezice dac este ceva gresit cu un rezultat. Erorile
determinate care fac ca valoarea practic obinut s difere de valoarea absolut
sunt clasificate n trei tipuri: erori personale, erori ale metodei i erori instrumentale.
O anumit eroare face ca rezultatul experimental sa fie mai mic sau mai mare dect
cel obinut n absena ei.

1.6 Precizia
Precizia este raspndirea unui set de rezultate obinute n acelai experiment
n primul exemplu din seciunea precedent, rezultatele celor trei probe variaz putin
unele fa de altele. Aceasta este de asteptat. Ar trebui s fii mult mai surprins dac ai
obine rezultate identice deoarece orict de grijuliu ai fi nu se poate repeta experimentul
n mod identic de fiecare dat. S ne imaginam un chimist perfect care folosete o
metod de ncredere absolut i nite aparate perfecte. Daca acesta repet analiza de
300 de ori va putea el obine pentru toate rezultatele sale o valoare unic de 14,81% ?
Intuiia noastr despre msurtori repetate ne spune c nici n aceast situaie ideal,
acest lucru nu este posibil. Chiar i n absena unor erori determinate ne ateptm s
gsim o valoare medie apropiat de 14,81% i numere egale de masurtori deasupra i
dedesuptul acestei valori. Tipul de eroare care cauzeaz o astfel de distribuie se
numete eroare nedeterminat sau ntmplatoare. Ea este ntotdeauna prezent n
orice experiment i nu poate fi atribuit unei cauze specifice. Mrimea erorii
ntmplatoare este o estimare a preciziei experimentului.
n cazul (descris mai sus) al chimistului profesionist care face sute de experimentari ale
aceleiai probe, parametrul statistic care msoar precizia msuratorilor se numete
deviaia standard (). O estimare a acestui parametru poate fi obinut dintr-un numr
redus de experimentri ( se noteaz cu s).

1.6 Precizia
Intervalul de variaie (diferena dintre cea mai mare i cea mai mic valoare) este o alt
masur a preciziei unui set de date, dar el este mai puin folosit n tratamentul statistic al
datelor.
Noiunile de medie universal i de deviaie standard menionate n paragraful de mai sus
sunt foarte importante. Un set de rezultate al unui experiment perfect repetat de sute de
ori produce o populaie de rezultate. Aceast populaie conine toate rezultatele teoretic
posibile pentru valoarea masurat cu presupunerea c apar doar erori ntamplatoare. Cu
ct este mai mare numrul de msurtori (n) cu att distribuia rezultatelor va fi mai
aproape de distribuia teoretic.
Estimari ale mediei i deviaiei standard pot fi obinute din orice numr de valori. Pentru un
numr mic de valori ele vor fi denumite media probei ( ) deviaia standard a probei (s) i
x
asta deoarece setul de valori (xi) utilizat pentru calcul este
doar o prob oarecare din toate
rezultatele care ar fi teoretic posibil s fie obinute. Pe msur ce n crete valorile calculate
ale mediei () i deviatiei standard (s) se apropie de valorile populaiei i . Unul din
scopurile acestui curs este de a utiliza valorile i s obinute din rezultate experimentale i
x
chiar valorile i (dac se cunosc) pentru a estima
probabilitatea prezenei erorilor
determinate n rezultatele noastre.

1.7 Determinarea numrului de cifre semnificative (eroarea

standard)

Parametrii statistici ai unei probe ( x i s) se bazeaz pe un numr mic de valori din


mulimea rezultatelor posibile (acestea formeaz o populaie) i deci sunt doar o estimare
brut a valorilor populaiei i care reprezint ntreaga distribuie.
S ne imaginm c fiecare student dintr-o grup de 15 studeni repet experimentul
utiliznd aceeai pipet automat. S presupunem de asemenea c echipamentul este
curat i n stare bun de funcionare i nu apar erori determinate n rezultatele studenilor.
Ne asteptm oare ca mediile lor individuale s fie identice? Este posibil ca mediile s fie
foarte aproape unele fa de altele dar dac utilizm o reprezentare tip histogram vom
observa distribuia datelor experimentale. S ne imaginm c un numr n de 300 de
studeni fac fiecare cte un numr de 3 experiene. Oare cum va arta distribuia celor
300 de valori medii ( x )? Dac avem de-a face cu o distribuie normal a valorilor la care
sunt prezente doar erori nedeterminate atunci valorile mediilor vor forma i ele o
distribuie normal.

Ce se obine dac se calculeaz deviaia standard a valorilor medii? Aceasta va


reprezenta precizia valorilor medii i va fi o caracteristic a curbei (fig. 1) determinat
de limea distribuiei. Aceast deviaie standard a grupului de medii este denumit
eroarea standard a mediilor (ES ( x )) i este de folos n estimarea preciziei mediilor sau
n decizia referitoare la numrul de cifre semnificative ce trebuie reinute n valoarea
medie obinut din cele n valori.
Se poate dovedi c eroarea standard a mediilor se poate calcula n funcie de deviaia
standard a tuturor probelor:
s
EXCEL: ES = STDEV(..)/SQRT(n)
ES ( x ) =

Nedeterminarea n media x este exprimat de aceast eroare standard, adic poziia


primei cifre diferit de zero a ES ne va preciza unde este ultima cifr semnificativ n
valoarea mediei.
Exemplu:
Utiliznd datele din exemplul 1, s se calculeze ES ( ) i s se rotunjeasc valoarea
x
medie la numrul potrivit de cifre semnificative.
Rezolvare:
2,1 * 10 4 g
s = 2,1 * 10

g i N = 3, deci:

ES ( X ) =

= 1,2 * 10 4 g = 0,00012 g

Deci media calculat va fi prezentat cu 4 zecimale.


1 Se poate adopta convenia c deviaia standard i eroarea standard se vor raporta
cu 2 cifre zecimale;
2 Dac se cunoate valoarea a populaiei atunci aceasta trebuie folosit n locul
valorii s a probei.

S-ar putea să vă placă și