Sunteți pe pagina 1din 8

Prelucrarea matematic a datelor experimentale

I. Noiuni teoretice A. Indicatori de tendin central Indicatorii de tendin central sunt valori ce localizeaz ntr-un fel oarecare mijlocul setului de date. Dintre indicatorii de tendin central menionm: Modul - valoarea care apare cel mai frecvent. Un set de date poate fi non-modal (dac toate valorile posibile au aceeai frecven), mono-modal (o singur valoare maximal), multi-modal (cu mai multe valori ce apar cu aceeai frcven maximal). Mijlocul - media aritmetic a valorilor extreme ale setului de date. Mediana - valoarea ce mparte setul de date n dou grupe egal populate. Pentru setul de date S={X1,..., Xn}, ordonat cresctor, cnd n=2k+1 (numr impar de date), mediana este Me=Xk+1. n cazul aceluiai set dar pentru n=2k (numr par de date), mediana este:
Me Xk Xk 2
1

Media - cele mai folosite sunt: media aritmetic (Xma), geometric (XG), armonic (XH) i cuadratic (XQ). Se poate arta uor c aceste medii se afl n relaia:
XH XG X ma XQ

B. Indicatori de poziie Indicatorii de poziie sunt folosii pentru localizarea unui anumit subgrup de date n relaie cu restul eantionului. Se numesc -cuantile acei indicatori ce mpart eantionul n pri egal populate. Cele mai utilizate sunt: cvartila (qk), decila i percentila (pk), valori ce mpart datele n pri coninnd o ptrime, o zecime, sau o sutime din elemente. S considerm un set de date ordonat cresctor unde L este valoarea cea mai mic din set iar H valoarea cea mai mare.

Percentila de ordinul pk este valoarea numeric pentru care k% din date sunt mai mici dect pk iar (100-k)% sunt mai mari. Se observ c p50 = q2. C. Indicatori de mprtiere (dispersie) Indicatorii de mprtiere descriu variabilitatea datelor. Datele grupate strns au valori mici pentru indicatorii de dispersie, n timp ce datele mprtiate au valori mari. Principalii indicatori de mprtiere sunt: domeniul, variana, deviaia i momentele. Domeniul reprezint intervalul de valori al datelor. =[Xmin, Xmax] Uneori se indic lrgimea domeniului (amplitudinea mprtierii): x= Xmax - Xmin Toate deviaiile medii fa de un indicator de tendin central (media aritmetic, geometric, cuadratic, armonic sau modul, mediana, notate generic prin <x>) se definesc n acelai fel, ca medii ale diferenei ntre valoarea msurat i indicatorul respectiv. Mai general este momentul centrat de ordin q, mq(x) fa de media x. n continuare vom analiza semnificaia i utilitatea unora dintre momentele centrate: - m1(x)=0, momentul centrat de ordinul 1, nu aduce nici o informaie, ntruct ia valoarea zero oricare ar fi distribuia datelor; din aceast cauz nu este folosit. - m2(x) se numete varian (V); rdcina ptrat a varianei se numete deviaie ptratic, notat cu . Ambele mrimi arat mprtierea datelor. Orice rezultat experimental trebuie prezentat prin media aritmetic Intervalul (<x>- , <x>+ ) se numete interval de ncredere sau confiden. ntruct n biologie i medicin sunt n general puine date de procesat, trebuie s se nlocuiasc variana V cu variana standard SV i deviaia
n

deviaia.

cu deviaie

standard

n-1

sau SD (se utilizeaz indicatorii standard

n-1

i SV cnd n<30, adic

setul are mai puin de 30 de valori). - m3(x) este numit nclinare sau oblicitate i se utilizeaz la definirea coeficientului de asimetrie, ac (numit n englez skewness i notat SKEW)
ac m3
3

SKEW ( x )

Funcie de valorile acestui coeficient exist trei tipuri de distribuii: cu nclinare pozitiv, nul i negativ, aa cum reiese din cazurile prezentate mai jos, unde Mo=modul, Me=mediana, <x>=media.

- m4(x) se numete exces i arat ct de aplatizat este distribuia. Se folosete la definirea coeficientului de aplatizare sau boltire, prin KURT): (numit n englez kurtosis, notat

m4
4

KURT ( x )

II. Parte experimental A. Determinarea intervalului de confiden S presupunem c n urma unui experiment se obin n date experimentale: x 1, x2, ...., xn. Pentru acest set de date putem defini urmtoarele valori: - media aritmetic: X med - eroarea absolut: - deviaia standard:
i

x 1 ... x n n

xi
n 1

X med

1 n 1

2 1

...

2 n

Rezultatul determinrilor (R) n urma prelucrrilor statistice a datelor, se prezint sub forma:
R X med
n 1

Dup efectuarea acestor calcule, putem trage concluzia c valoarea real X a mrimii ctuate se afl n intervalul:
I (X med
n 1

, X med

n 1

Acest interval se numete interval de confiden sau interval de ncredere. Problem: Pentru etalonarea unui colorimetru s-au realizat un numr de n = 5 determinri, iar valorile transmisiei au fost urmtoarele: 50.2, 49.1, 49.6, 50.3, 48.9. S se calculeze rezultatul determinrilor (R) i intervalul de confiden (I). B. Reprezentarea grafic a datelor Procesele fizice, chimice, biologice, etc., procese ce depind de mai muli parametrii, pot fi reprezentate folosind un sistem de referin format din dou drepte

concurente n plan, sau trei drepte concurente n spaiu, numite axe. Dac axele sunt perpendiculare cte dou, atunci sistemul se numete rectangular. Coordonatele (xa, ya) ale unui punct A ntr-un sitem rectangular avnd originea O msoar proieciile segmentului OA pe ax.

Figura 1.1. Legtura dintre sistemul de referin rectangular i cel polar. n practic se mai utilizeaz i sistemul de coordonate polare. n acest caz coordonatele punctului A se definesc prin mrimile: r = OA (raz polar) i unghiul dintre OA i axa OX. Aceast reprezentare se utilizeaz n momentul cnd funcia reprezentat depinde de unghi. Legtura ntre cele dou sisteme de coordonate este urmtoarea:
x r cos , y

r sin
arctg x y

x2

y2 ,

Pentru ca reprezentarea grafic a datelor n coordonate rectangulare s fie ct mai clar, se recomand s se in cont de urmtoatele indicaii: -asigurarea unei reprezentri grafice ct mai intuitive const n alegerea scrii corespunztoare att pe scara absciselor ct i pe scara ordonatelor (atunci cnd valorile variabilelor x sau y ncep de la un numr oarecare, acest numr se recomand s fie reprezentat ct mai aproape de originea axei respective). -indicaiile de pe axele x i y trebuie s fie ct mai simple, adic cu ct mai puine cifre (de regul indicaiile de pe axe nu trebuie s conin numere cu mai mult de dou cifre; dac numerele sunt mai mari trebuie indicat un factor de multiplicare la sfritul axei alturi de unitile de msur). -pe fiecare ax trebuie s se indice denumirea sau simbolul mrimii reprezentate pe axa respectiv i n mod obligatoriu unitile de msur.

S urmrim n continuare un exemplu simplu: presupunem c la anumite intervale de timp msurm temperatura unui bolnav (datele obinute se regsesc n tabelul de mai jos) i dorim s reprezentm grafic acest proces: temperatura = f (timp). Tabelul 1 Timp 1 2 3 4 5 6 7 8 9 10 (ore) Temp. 37,1 37,5 37,9 38 38,2 38,4 38,8 39 39,2 39,5 (C0) innd cont de precizrile de mai sus se traseaz graficul prin puncte (dar far a le uni), avnd grij s reprezentm numai zona de interes (figura 1.2).
40

Tem peratura (grd C)

39,5 39 38,5 38 37,5 37 36,5 0 1 2 3 4 5 6 7 8 9 10 11 Tim p (ore)

Figura 1.2. Reprezentarea grafic a datelor din tabelul 1. Privind graficul de mai sus, ne putem pune urmtoarea ntrebare: care este valoarea de temperatur a pacientului la un moment de timp la care nu a fost fcut msurtoarea efectiv? n aceast situaie suntem nevoii s determinm, pornind de la datele noastre, curba ce se potrivete cel mai bine cu punctele experi-mentale. n cazul graficului reprezentat n figura 1.2, putem presupune o dependen de tip liniar: y a 0 a1x , unde coeficienii a 0 , a1 sunt necunoscute. Cea mai simpl variant de determinare a coeficienilor, o ofer programul de calcul tabelar Microsoft Excel.

Dup introducerea datelor n foaia de lucru i trasarea graficului se utilizeaz opiunea Insert Trendline. Din fereastra de dialog (figura 1.3) se alege de la grupul Type tipul de Trend dorit (n cazul nostru liniar), iar de la grupul Options se selecteaz Display Equation on Chart. Rezultatul este prezentat n figura 1.4.

Figura 1.3. Fereastra de dialog Format Trendline a programului Microsoft Excel. Facem meniunea c utilizatorul este lsat s aleag, innd cont de distribuia punctelor, tipul funciei cu care urmeaz s fie fcut fittarea: liniar, logaritmic, exponenial, putere i polinomial (pn la gradul 6).
40

Tem peratura (grd C)

39,5 39 38,5 38 37,5 37 36,5 0 1

y = 0,2521x + 36,973

9 10 11

Tim p (ore)

Figura 1.4. Determinarea coeficienilor a0 i a1 cu ajutorul programului Microsoft Excel. Revenind la exemplul nostru, rezultatul este:
y 36.973 0.2521 x

Aa cum se poate vedea din graficul prezentat n figura 1.4, punctele experimentale sunt apropiate de dreapa trasat. n cazul n care exist puncte

deprtate de drept, atunci n acea regiune putem avea o alt dependena i este necesar reluarea procedeului cu alegerea unui trend adecvat. Problem: S se reprezinte grafic datele din tabelul de mai jos y=f(x) i apoi utiliznd programul Microsoft Excel s se traseze curba ce se potrivete cel mai bine cu punctele experimentale. x y 1 2 3 4 5 6 7 8 9 10 37.1 37.5 37.9 38.33 38.4 38.4 38.2 37.85 37.43 36.93