Sunteți pe pagina 1din 6

Prelucrarea matematic a datelor experimentale

I . Noiuni teoretice
A. I ndicatori de tendin central
Indicatorii de tendin central sunt valori ce localizeaz ntr-un fel oarecare mijlocul setului de date. Dintre
indicatorii de tendin central menionm:
Modul - valoarea care apare cel mai frecvent.
Un set de date poate fi non-modal (dac toate valorile posibile au aceeai frecven), mono-modal (o singur
valoare maximal), multi-modal (cu mai multe valori ce apar cu aceeai frcven maximal).
Mijlocul - media aritmetic a valorilor extreme ale setului de date.
Mediana - valoarea ce mparte setul de date n dou grupe egal populate.
Pentru setul de date S={X
1
,..., X
n
}, ordonat cresctor, cnd n=2k+1 (numr impar de date), mediana este
M
e
=X
k+1
. n cazul aceluiai set dar pentru n=2k (numr par de date), mediana este:
2
X X
M
1 k k
e

Media - cele mai folosite sunt: media aritmetic (X
ma
), geometric (X
G
), armonic (X
H
) i cuadratic (X
Q
). Se
poate arta uor c aceste medii se afl n relaia:
Q ma G H
X X X X
B. I ndicatori de poziie
Indicatorii de poziie sunt folosii pentru localizarea unui anumit subgrup de date n relaie cu restul
eantionului. Se numesc -cuantile acei indicatori ce mpart eantionul n pri egal populate. Cele mai utilizate sunt:
cvartila (qk), decila i percentila (pk), valori ce mpart datele n pri coninnd o ptrime, o zecime, sau o sutime din
elemente.
S considerm un set de date ordonat cresctor unde L este valoarea cea mai mic din set iar H valoarea cea
mai mare.

Percentila de ordinul pk este valoarea numeric pentru care k% din date sunt mai mici dect pk iar (100-k)%
sunt mai mari. Se observ c p50 = q2.
C. I ndicatori de mprtiere (dispersie)
Indicatorii de mprtiere descriu variabilitatea datelor. Datele grupate strns au valori mici pentru indicatorii
de dispersie, n timp ce datele mprtiate au valori mari.
Principalii indicatori de mprtiere sunt: domeniul, variana, deviaia i momentele.
Domeniul reprezint intervalul de valori al datelor.
=[X
min
, X
max
]
Uneori se indic lrgimea domeniului (amplitudinea mprtierii):
x= X
max
- X
min

Toate deviaiile medii fa de un indicator de tendin central (media aritmetic, geometric, cuadratic,
armonic sau modul, mediana, notate generic prin <x>) se definesc n acelai fel, ca medii ale diferenei ntre valoarea
msurat i indicatorul respectiv.
Mai general este momentul centrat de ordin q, m
q
(x) fa de media x. n continuare vom analiza semnificaia
i utilitatea unora dintre momentele centrate:
- m
1
(x)=0, momentul centrat de ordinul 1, nu aduce nici o informaie, ntruct ia valoarea zero oricare ar fi
distribuia datelor; din aceast cauz nu este folosit.
- m
2
(x) se numete varian (V); rdcina ptrat a varianei se numete deviaie ptratic, notat cu .
Ambele mrimi arat mprtierea datelor.
Orice rezultat experimental trebuie prezentat prin media aritmetic deviaia. Intervalul (<x>- , <x>+ ) se
numete interval de ncredere sau confiden.
ntruct n biologie i medicin sunt n general puine date de procesat, trebuie s se nlocuiasc variana V cu
variana standard SV i deviaia
n
cu deviaie standard
n-1
sau SD (se utilizeaz indicatorii standard
n-1
i SV
cnd n<30, adic setul are mai puin de 30 de valori).
- m
3
(x) este numit nclinaresau oblicitatei se utilizeaz la definirea coeficientului de asimetrie, ac (numit
n englez skewness i notat SKEW)
) x ( SKEW
m
ac
3
3

Funcie de valorile acestui coeficient exist trei tipuri de distribuii: cu nclinare pozitiv, nul i negativ, aa
cum reiese din cazurile prezentate mai jos, unde Mo=modul, Me=mediana, <x>=media.



- m
4
(x) se numete exces i arat ct de aplatizat este distribuia. Se folosete la definirea coeficientului de
aplatizare sau boltire, (numit n englez kurtosis, notat prin KURT):
) x ( KURT 3
m
4
4



I I . Parte experimental
A. Determinarea intervalului de confiden
S presupunem c n urma unui experiment se obin n date experimentale: x
1
, x
2
, ...., x
n
. Pentru acest set de
date putem defini urmtoarele valori:
- media aritmetic:
n
x ... x
X
n 1
med

- eroarea absolut:
med i i
X x
- deviaia standard:
2
n
2
1 1 n
...
1 n
1

Rezultatul determinrilor (R) n urma prelucrrilor statistice a datelor, se prezint sub forma:
1 n med
X R
Dup efectuarea acestor calcule, putem trage concluzia c valoarea real X a mrimii ctuate se afl n
intervalul:
) X , X ( I
1 n med 1 n med

Acest interval se numete interval de confiden sau interval de ncredere.
Problem: Pentru etalonarea unui colorimetru s-au realizat un numr de n = 5 determinri, iar valorile
transmisiei au fost urmtoarele: 50.2, 49.1, 49.6, 50.3, 48.9. S se calculeze rezultatul determinrilor (R) i intervalul
de confiden (I).
B. Reprezentarea grafic a datelor
Procesele fizice, chimice, biologice, etc., procese ce depind de mai muli parametrii, pot fi reprezentate
folosind un sistemde referin format din dou drepte concurente n plan, sau trei drepte concurente n spaiu, numite
axe. Dac axele sunt perpendiculare cte dou, atunci sistemul se numete rectangular.
Coordonatele (x
a,
y
a
) ale unui punct A ntr-un sitem rectangular avnd originea O msoar proieciile
segmentului OA pe ax.

Figura 1.1. Legtura dintre sistemul de referin rectangular i cel polar.

n practic se mai utilizeaz i sistemul de coordonate polare. n acest caz coordonatele punctului A se
definesc prin mrimile: r = OA (raz polar) i unghiul dintre OA i axa OX. Aceast reprezentare se utilizeaz n
momentul cnd funcia reprezentat depinde de unghi.
Legtura ntre cele dou sisteme de coordonate este urmtoarea:
cos r x , sin r y
2 2
y x r ,
y
x
arctg
Pentru ca reprezentarea grafic a datelor n coordonate rectangulare s fie ct mai clar, se recomand s se
in cont de urmtoatele indicaii:
-asigurarea unei reprezentri grafice ct mai intuitive const n alegerea scrii corespunztoare att pe scara
absciselor ct i pe scara ordonatelor (atunci cnd valorile variabilelor x sau y ncep de la un numr oarecare, acest
numr se recomand s fie reprezentat ct mai aproape de originea axei respective).
-indicaiile de pe axele x i y trebuie s fie ct mai simple, adic cu ct mai puine cifre (de regul indicaiile
de pe axe nu trebuie s conin numere cu mai mult de dou cifre; dac numerele sunt mai mari trebuie indicat un
factor de multiplicare la sfritul axei alturi de unitile de msur).
-pe fiecare ax trebuie s se indice denumirea sau simbolul mrimii reprezentate pe axa respectiv i n mod
obligatoriu unitile de msur.
S urmrim n continuare un exemplu simplu: presupunem c la anumite intervale de timp msurm
temperatura unui bolnav (datele obinute se regsesc n tabelul de mai jos) i dorim s reprezentm grafic acest proces:
temperatura = f (timp).

Tabelul 1
Timp
(ore)
1 2 3 4 5 6 7 8 9 10
Temp.
(C
0
)
37,1 37,5 37,9 38 38,2 38,4 38,8 39 39,2 39,5

innd cont de precizrile de mai sus se traseaz graficul prin puncte (dar far a le uni), avnd grij s
reprezentm numai zona de interes (figura 1.2).

Figura 1.2. Reprezentarea grafic a datelor din tabelul 1.

Privind graficul de mai sus, ne putem pune urmtoarea ntrebare: care este valoarea de temperatur a
pacientului la un moment de timp la care nu a fost fcut msurtoarea efectiv?
n aceast situaie suntem nevoii s determinm, pornind de la datele noastre, curba ce se potrivete cel mai
bine cu punctele experi-mentale. n cazul graficului reprezentat n figura 1.2, putem presupune o dependen de tip
liniar: x a a y
1 0
, unde coeficienii
1 0
a , a sunt necunoscute.
Cea mai simpl variant de determinare a coeficienilor, o ofer programul de calcul tabelar Microsoft Excel.
Dup introducerea datelor n foaia de lucru i trasarea graficului se utilizeaz opiunea Insert Trendline. Din
fereastra de dialog (figura 1.3) se alege de la grupul Type tipul de Trend dorit (n cazul nostru liniar), iar de la grupul
Options se selecteaz Display Equation on Chart. Rezultatul este prezentat n figura 1.4.

Figura 1.3. Fereastra de dialog Format Trendline a programului Microsoft Excel.

Facem meniunea c utilizatorul este lsat s aleag, innd cont de distribuia punctelor, tipul funciei cu care
urmeaz s fie fcut fittarea: liniar, logaritmic, exponenial, putere i polinomial (pn la gradul 6).

Figura 1.4. Determinarea coeficienilor a
0
i a
1
cu ajutorul programului Microsoft Excel.

36,5
37
37,5
38
38,5
39
39,5
40
0 1 2 3 4 5 6 7 8 9 10 11
Timp (ore)
T
e
m
p
e
r
a
t
u
r
a

(
g
r
d

C
)
y = 0,2521x + 36,973
36,5
37
37,5
38
38,5
39
39,5
40
0 1 2 3 4 5 6 7 8 9 10 11
Timp (ore)
T
e
m
p
e
r
a
t
u
r
a

(
g
r
d

C
)
Revenind la exemplul nostru, rezultatul este:
x 2521 . 0 973 . 36 y
Aa cum se poate vedea din graficul prezentat n figura 1.4, punctele experimentale sunt apropiate de dreapa
trasat. n cazul n care exist puncte deprtate de drept, atunci n acea regiune putem avea o alt dependena i este
necesar reluarea procedeului cu alegerea unui trend adecvat.
Problem: S se reprezinte grafic datele din tabelul de mai jos y=f(x) i apoi utiliznd programul Microsoft
Excel s se traseze curba ce se potrivete cel mai bine cu punctele experimentale.
x 1 2 3 4 5 6 7 8 9 10
y 37.1 37.5 37.9 38.33 38.4 38.4 38.2 37.85 37.43 36.93