Sunteți pe pagina 1din 9

Prelucrarea matematic a datelor experimentale

I. Noiuni teoretice
A. Indicatori de tendin central
Indicatorii de tendin central sunt valori ce localizeaz ntr-un fel oarecare
mijlocul setului de date. Dintre indicatorii de tendin central menionm:
Modul - valoarea care apare cel mai frecvent.
Un set de date poate fi non-modal (dac toate valorile posibile au aceeai
frecven), mono-modal (o singur valoare maximal), multi-modal (cu mai multe valori
ce apar cu aceeai frcven maximal).
Mijlocul - media aritmetic a valorilor extreme ale setului de date.
Mediana - valoarea ce mparte setul de date n dou grupe egal populate.
Pentru setul de date S={X
1
,..., X
n
}, ordonat cresctor, cnd n=2k+1 (numr impar
de date), mediana este M
e
=X
k+1
. n cazul aceluiai set dar pentru n=2k (numr par de
date), mediana este:
2
X X
M
1 k k
e
+
+
=
Media - cele mai folosite sunt: media aritmetic (X
ma
), geometric (X
G
), armonic
(X
H
) i cuadratic (X
Q
). Se poate arta uor c aceste medii se afl n relaia:
Q ma G H
X X X X s s s
B. Indicatori de poziie
Indicatorii de poziie sunt folosii pentru localizarea unui anumit subgrup de date
n relaie cu restul eantionului. Se numesc o-cuantile acei indicatori ce mpart
eantionul n pri egal populate. Cele mai utilizate sunt: cvartila (qk), decila i
percentila (pk), valori ce mpart datele n pri coninnd o ptrime, o zecime, sau o
sutime din elemente.
S considerm un set de date ordonat cresctor unde L este valoarea cea mai
mic din set iar H valoarea cea mai mare.

Percentila de ordinul pk este valoarea numeric pentru care k% din date sunt
mai mici dect pk iar (100-k)% sunt mai mari. Se observ c p50 = q2.
C. Indicatori de mprtiere (dispersie)
Indicatorii de mprtiere descriu variabilitatea datelor. Datele grupate strns au
valori mici pentru indicatorii de dispersie, n timp ce datele mprtiate au valori mari.
Principalii indicatori de mprtiere sunt: domeniul, variana, deviaia i
momentele.
Domeniul reprezint intervalul de valori al datelor.
A=[X
min
, X
max
]
Uneori se indic lrgimea domeniului (amplitudinea mprtierii):
Ax= X
max
- X
min

Toate deviaiile medii fa de un indicator de tendin central (media aritmetic,
geometric, cuadratic, armonic sau modul, mediana, notate generic prin <x>) se
definesc n acelai fel, ca medii ale diferenei ntre valoarea msurat i indicatorul
respectiv.
Mai general este momentul centrat de ordin q, m
q
(x) fa de media x. n
continuare vom analiza semnificaia i utilitatea unora dintre momentele centrate:
- m
1
(x)=0, momentul centrat de ordinul 1, nu aduce nici o informaie, ntruct ia
valoarea zero oricare ar fi distribuia datelor; din aceast cauz nu este folosit.
- m
2
(x) se numete varian (V); rdcina ptrat a varianei se numete
deviaie ptratic, notat cu o. Ambele mrimi arat mprtierea datelor.
Orice rezultat experimental trebuie prezentat prin media aritmetic deviaia.
Intervalul (<x>-o, <x>+o) se numete interval de ncredere sau confiden.
ntruct n biologie i medicin sunt n general puine date de procesat, trebuie
s se nlocuiasc variana V cu variana standard SV i deviaia o
n
cu deviaie
standard o
n-1
sau SD (se utilizeaz indicatorii standard o
n-1
i SV cnd n<30, adic
setul are mai puin de 30 de valori).
- m
3
(x) este numit nclinare sau oblicitate i se utilizeaz la definirea
coeficientului de asimetrie, ac (numit n englez skewness i notat SKEW)
) x ( SKEW
m
ac
3
3
=
o
=
Funcie de valorile acestui coeficient exist trei tipuri de distribuii: cu nclinare
pozitiv, nul i negativ, aa cum reiese din cazurile prezentate mai jos, unde
Mo=modul, Me=mediana, <x>=media.



- m
4
(x) se numete exces i arat ct de aplatizat este distribuia. Se folosete
la definirea coeficientului de aplatizare sau boltire, t (numit n englez kurtosis, notat
prin KURT):
) x ( KURT 3
m
4
4
=
o
= t


II. Parte experimental
A. Determinarea intervalului de confiden
S presupunem c n urma unui experiment se obin n date experimentale: x
1
,
x
2
, ...., x
n
. Pentru acest set de date putem defini urmtoarele valori:
- media aritmetic:
n
x ... x
X
n 1
med
+ +
=
- eroarea absolut:
med i i
X x = o
- deviaia standard: | |
2
n
2
1 1 n
...
1 n
1
o + + o

= o


Rezultatul determinrilor (R) n urma prelucrrilor statistice a datelor, se prezint
sub forma:
1 n med
X R

o =
Dup efectuarea acestor calcule, putem trage concluzia c valoarea real X a
mrimii ctuate se afl n intervalul:
) X , X ( I
1 n med 1 n med
o + o e
Acest interval se numete interval de confiden sau interval de ncredere.
Problem: Pentru etalonarea unui colorimetru s-au realizat un numr de n = 5
determinri, iar valorile transmisiei au fost urmtoarele: 50.2, 49.1, 49.6, 50.3, 48.9. S
se calculeze rezultatul determinrilor (R) i intervalul de confiden (I).
B. Reprezentarea grafic a datelor
Procesele fizice, chimice, biologice, etc., procese ce depind de mai muli
parametrii, pot fi reprezentate folosind un sistem de referin format din dou drepte
concurente n plan, sau trei drepte concurente n spaiu, numite axe. Dac axele sunt
perpendiculare cte dou, atunci sistemul se numete rectangular.
Coordonatele (x
a,
y
a
) ale unui punct A ntr-un sitem rectangular avnd originea O
msoar proieciile segmentului OA pe ax.

Figura 1.1. Legtura dintre sistemul de referin rectangular i cel polar.

n practic se mai utilizeaz i sistemul de coordonate polare. n acest caz
coordonatele punctului A se definesc prin mrimile: r = OA (raz polar) i unghiul
dintre OA i axa OX. Aceast reprezentare se utilizeaz n momentul cnd funcia
reprezentat depinde de unghi.
Legtura ntre cele dou sisteme de coordonate este urmtoarea:
= cos r x , = sin r y
2 2
y x r + = ,
y
x
arctg =
Pentru ca reprezentarea grafic a datelor n coordonate rectangulare s fie ct
mai clar, se recomand s se in cont de urmtoatele indicaii:
-asigurarea unei reprezentri grafice ct mai intuitive const n alegerea scrii
corespunztoare att pe scara absciselor ct i pe scara ordonatelor (atunci cnd
valorile variabilelor x sau y ncep de la un numr oarecare, acest numr se recomand
s fie reprezentat ct mai aproape de originea axei respective).
-indicaiile de pe axele x i y trebuie s fie ct mai simple, adic cu ct mai puine
cifre (de regul indicaiile de pe axe nu trebuie s conin numere cu mai mult de dou
cifre; dac numerele sunt mai mari trebuie indicat un factor de multiplicare la sfritul
axei alturi de unitile de msur).
-pe fiecare ax trebuie s se indice denumirea sau simbolul mrimii reprezentate
pe axa respectiv i n mod obligatoriu unitile de msur.
S urmrim n continuare un exemplu simplu: presupunem c la anumite
intervale de timp msurm temperatura unui bolnav (datele obinute se regsesc n
tabelul de mai jos) i dorim s reprezentm grafic acest proces: temperatura = f (timp).

Tabelul 1
Timp
(ore)
1 2 3 4 5 6 7 8 9 10
Temp.
(C
0
)
37,1 37,5 37,9 38 38,2 38,4 38,8 39 39,2 39,5

innd cont de precizrile de mai sus se traseaz graficul prin puncte (dar far a
le uni), avnd grij s reprezentm numai zona de interes (figura 1.2).

Figura 1.2. Reprezentarea grafic a datelor din tabelul 1.

Privind graficul de mai sus, ne putem pune urmtoarea ntrebare: care este
valoarea de temperatur a pacientului la un moment de timp la care nu a fost fcut
msurtoarea efectiv?
n aceast situaie suntem nevoii s determinm, pornind de la datele noastre,
curba ce se potrivete cel mai bine cu punctele experi-mentale. n cazul graficului
reprezentat n figura 1.2, putem presupune o dependen de tip liniar: x a a y
1 0
+ = , unde
coeficienii { }
1 0
a , a sunt necunoscute.
Cea mai simpl variant de determinare a coeficienilor, o ofer programul de
calcul tabelar Microsoft Excel.
36,5
37
37,5
38
38,5
39
39,5
40
0 1 2 3 4 5 6 7 8 9 10 11
Timp (ore)
T
e
m
p
e
r
a
t
u
r
a

(
g
r
d

C
)
Dup introducerea datelor n foaia de lucru i trasarea graficului se utilizeaz
opiunea Insert Trendline. Din fereastra de dialog (figura 1.3) se alege de la grupul Type
tipul de Trend dorit (n cazul nostru liniar), iar de la grupul Options se selecteaz
Display Equation on Chart. Rezultatul este prezentat n figura 1.4.

Figura 1.3. Fereastra de dialog Format Trendline a programului Microsoft Excel.

Facem meniunea c utilizatorul este lsat s aleag, innd cont de distribuia
punctelor, tipul funciei cu care urmeaz s fie fcut fittarea: liniar, logaritmic,
exponenial, putere i polinomial (pn la gradul 6).

Figura 1.4. Determinarea coeficienilor a
0
i a
1
cu ajutorul programului Microsoft Excel.

Revenind la exemplul nostru, rezultatul este:
x 2521 . 0 973 . 36 y + =
Aa cum se poate vedea din graficul prezentat n figura 1.4, punctele
experimentale sunt apropiate de dreapa trasat. n cazul n care exist puncte
y = 0,2521x + 36,973
36,5
37
37,5
38
38,5
39
39,5
40
0 1 2 3 4 5 6 7 8 9 10 11
Timp (ore)
T
e
m
p
e
r
a
t
u
r
a

(
g
r
d

C
)
deprtate de drept, atunci n acea regiune putem avea o alt dependena i este
necesar reluarea procedeului cu alegerea unui trend adecvat.
Problem: S se reprezinte grafic datele din tabelul de mai jos y=f(x) i apoi
utiliznd programul Microsoft Excel s se traseze curba ce se potrivete cel mai bine
cu punctele experimentale.
x 1 2 3 4 5 6 7 8 9 10
y 37.1 37.5 37.9 38.33 38.4 38.4 38.2 37.85 37.43 36.93

S-ar putea să vă placă și