Sunteți pe pagina 1din 6

P relu crarea m atem atic a d atelor exp erim en tale

I. N oiu n i teoretice
A . In d icatori d e ten d in cen tral
Indicatorii de tendin central sunt valori ce localizeaz ntr-un fel oarecare mijlocul setului de date. Dintre
indicatorii de tendin central m enionm :
Modul - valoarea care apare cel mai frecvent.
Un set de date poate fi non-modal (dac toate valorile posibile au aceeai frecven), mono-modal (o singur
valoare m axim al), multi-modal (cu m ai m ulte valori ce apar cu aceeai frcven m axim al).
Mijlocul - m edia aritm etic a valorilor extrem e ale setului de date.
Mediana - valoarea ce m parte setul de date n dou grupe egal populate.
Pentru setul de date S={X1,..., Xn}, ordonat cresctor, cnd n= 2k+ 1 (num r im par de date), m ediana este
Me=Xk+1. n cazul aceluiai set dar pentru n= 2k (num r par de date), m ediana este:
Me

X k X k 1
2

Media - cele m ai folosite sunt: m edia aritm etic (X

ma), geo m

etric (X G), arm onic (X H) i cuadratic (X Q). Se

poate arta uor c aceste m edii se afl n relaia:


X H X G X ma X Q

B . In d icatori d e p oziie
Indicatorii de poziie sunt folosii pentru localizarea unui anum it subgrup de date n relaie cu restul
eantionului. S e num esc -cuantile acei indicatori ce m part eantionul n pri egal populate. Cele mai utilizate sunt:
cvartila (qk), decila i percentila (pk), valori ce m part datele n pri coninnd o ptrim e, o zecim e, sau o sutim e din
elemente.
S considerm un set de date ordonat cresctor unde L este valoarea cea m ai m ic din set iar H valoarea cea
mai mare.

P ercentila de ordinul pk este valoarea num eric pentru care k% din date sunt m ai m ici dect pk iar (100 -k)%
sunt m ai m ari. S e observ c p50 = q2.
C . In d icatori d e m p rtiere (d isp ersie)
Indicatorii de m prtiere descriu variabilitatea datelor. Datele grupate strns au valori mici pentru indicatorii
de dispersie, n tim p ce datele m prtiate au valori m ari.
P rincipalii indicatori de m prtiere sunt: dom eniul, variana, deviaia i m om entele.
Domeniul reprezint intervalul de valori al datelor.
=[Xmin, Xmax]
Uneori se indic lrgim ea dom eniului (am plitudinea m prtierii):
x= Xmax - Xmin

T oate deviaiile m edii fa de un indicator de tendin central (m edia aritm etic, geom etric, cuadratic,
arm onic sau m odul, m ediana, notate generic prin < x> ) se definesc n acelai fel, ca m edii ale diferenei ntre valoarea
m surat i indicatorul respectiv.
Mai general este momentul centrat de ordin q, mq(x) fa de media x. n continuare vom analiza semnificaia
i utilitatea unora dintre m om entele centrate:
- m1(x)=0, momentul centrat de ordinul 1, nu aduce nici o inform aie, ntruct ia valoarea zero oricare ar fi
distribuia datelor; din aceast cauz nu este folosit.
- m2(x) se num ete varian (V ); rdcina ptrat a varianei se num ete d eviaie p tratic, notat cu .
A m bele m rim i arat m prtierea datelor.
Orice rezultat experimental trebuie prezentat prin m ed ia aritm etic d eviaia. Intervalul (<x>-, <x>+) se
num ete interval de ncredere sau con fid en .
ntruct n biologie i m edicin sunt n general puine date de procesat, trebuie s se nlocuiasc varian a V cu
varian a stan d ard S V i d eviaia n cu d eviaie stan d ard n-1 sau SD (se utilizeaz indicatorii standard n-1 i SV
cnd n<30, adic setul are m ai puin de 30 de valori).
- m3(x) este numit nclinare sau oblicitate i se utilizeaz la definirea coeficientului de asimetrie, ac (numit
n englez skewness i notat S K E W )

ac

m3
SKEW ( x )
3

F uncie de valorile acestui coeficient exist trei tipuri de distribuii: cu nclinare pozitiv, nul i negativ, aa
cum reiese din cazurile prezentate mai jos, unde Mo=modul, Me=mediana, <x>=media.

- m4(x) se num ete exces i arat ct de aplatizat este distribuia. S e folosete la definirea coeficientului de
aplatizare sau boltire, (num it n englez kurtosis, notat prin KURT):
m4

3 KURT( x )

II. P arte exp erim en tal


A. D eterm inarea intervalului de confiden
S presupunem c n urm a unui experim ent se ob in n date experimentale: x1, x2, ...., xn. Pentru acest set de
date putem defini urm toarele valori:
- m edia aritm etic: X med

x 1 ... x n
n

- eroarea absolut: i x i X med


- deviaia standard: n 1

1
12 ... 2n
n 1

Rezultatul determ inrilor (R ) n urm a prelucrrilor statistice a datelor, se prezint sub form a:

R X med n 1
D up efectuarea acestor calcule, putem trage concluzia c valoarea real X a m rim ii ctuate se afl n
intervalul:

I (X med n 1 , X med n 1 )
A cest interval se num ete interval de confiden sau interval de ncredere.
P roblem : Pentru etalonarea unui colorimetru s-au realizat un num r de n = 5 determ inri, iar valorile
transm isiei au fost urm toarele: 50.2, 49.1, 49.6, 50.3, 48.9. S se calculeze rezultatul determ inrilor (R ) i intervalul
de confiden (I).
B. R eprezentarea grafic a datelor
P rocesele fizice, chim ice, biologice, etc., procese ce depind de m ai m uli param etrii, pot fi reprezentate
folosind un sistem de referin form at din dou drepte concurente n plan, sau trei drepte concurente n spaiu , numite
axe. D ac axele sunt perpendiculare cte dou, atunci sistem ul se num ete rectangular.
Coordonatele (xa, ya) ale unui punct A ntr-un sitem rectangular avnd originea O m soar proieciile
segm entului O A pe ax.

Figura 1.1. L egtu ra d in tre sistem u l d e referin recta ng u la r i cel polar.

n practic se m ai utilizeaz i sistem ul de coordonate polare. n acest caz coordonatele punctului A se


definesc prin m rim ile: r = O A (raz polar) i unghiul dintre O A i axa O X . A ceast reprezentare se utilizeaz n
m o m entul cnd funcia reprezentat depinde de unghi.
L egtura ntre cele dou sistem e de coordonate este urm toarea:
x r cos , y r sin

r x 2 y 2 , arctg

x
y

P entru ca reprezentarea grafic a datelor n coordonate rectangulare s fie ct m ai clar, se recom and s se
in cont de urm toatele indicaii:
-asigurarea unei reprezentri grafice ct m ai intuitive const n alegerea scrii corespunztoare att pe scara
absciselor ct i pe scara ordonatelor (atunci cnd valorile variabilelor x sau y ncep de la un num r oarecare, acest
num r se recom and s fie reprezentat ct m ai aproape de originea axei respective).
-indicaiile de pe axele x i y trebuie s fie ct m ai sim ple, adic cu ct m ai puine cifre (de regul indicaiile
de pe axe nu trebuie s conin num ere cu m ai m ult de dou cifre; dac num erele sunt m ai m ari trebuie indicat un
factor de m ultiplicare la sfritul axei alturi de unitile de m sur).
-pe fiecare ax trebuie s se indice denum irea sau sim bolul m rim ii rep rezentate pe axa respectiv i n m od
obligatoriu unitile de m sur.
S urm rim n continuare un exemplu simplu: presupunem c la anum ite intervale de tim p m surm
tem peratura unui bolnav (datele obinute se regsesc n tabelul de m ai jos) i dorim s reprezentm grafic acest proces:
temperatura = f (timp).
Tabelul 1
Timp
(ore)
Temp.
(C0)

10

37,1

37,5

37,9

38

38,2

38,4

38,8

39

39,2

39,5

innd cont de precizrile de m ai sus se traseaz graficul prin puncte (dar far a le uni), avnd grij s
reprezentm num ai zona de interes (figura 1.2).

Tem peratura (grd C)

40
39,5
39
38,5
38
37,5
37
36,5
0

9 10 11

Tim p (ore)

Figura 1.2. R ep rezen tarea grafic a d atelo r din tab elu l 1 .

P rivind graficul de m ai sus, ne putem pune urm toarea ntrebare: care este valoarea de tem peratur a
pacientului la un moment de timp la care nu a fost fcut m surtoarea efectiv?
n aceast situaie suntem n evoii s determ inm , pornind de la datele no astre, curba ce se potrivete cel mai
bine cu punctele experi-mentale. n cazul graficului reprezentat n figura 1.2, putem presupune o dependen de tip
liniar: y a 0 a1x , unde coeficienii a 0 , a1 sunt necunoscute.
Cea mai sim pl variant de determ inare a coeficienilor, o ofer program ul de calcul tabelar Microsoft Excel.
D up introducerea datelor n foaia de lucru i trasarea graficului se utilizeaz opiunea Insert Trendline. Din
fereastra de dialog (figura 1.3) se alege de la grupul Type tipul de Trend dorit (n cazul nostru liniar), iar de la grupul
Options se selecteaz Display Equation on Chart. Rezultatul este prezentat n figura 1.4.

Figura 1.3. F ereastra d e d ialo g F o rm at T ren d lin e a p ro gram u lu i M icro so ft E xcel.

F acem m eniunea c utilizatorul este lsat s aleag, innd cont de distribuia punctelor, tipul funciei cu care
urm eaz s fie fcut fittarea: liniar, logaritm ic, exponenial, putere i polinom ial (pn la gradul 6).

Tem peratura (grd C)

40
39,5

y = 0,2521x + 36,973

39
38,5
38
37,5
37
36,5
0

9 10 11

Tim p (ore)

Figura 1.4. Determinarea co eficien ilo r a0 i a 1 cu ajutorul programului Microsoft Excel.

Revenind la exemplul nostru, rezultatul este:


y 36.973 0.2521 x

A a cum se poate vedea din graficul prezentat n figura 1.4, punctele experim entale sunt apropiate de dreapa
trasat. n cazul n care exist puncte deprtate de drept, atunci n acea regiune putem avea o alt dependena i este
necesar reluarea procedeului cu alegerea unui trend adecvat.
P roblem : S se reprezinte grafic datele din tabelul de m ai jos y= f(x) i apoi utiliznd program ul Microsoft
Excel s se traseze curba ce se potrivete cel mai bine cu punctele experimentale.
x
y

1
37.1

2
37.5

3
37.9

4
38.33

5
38.4

6
38.4

7
38.2

8
37.85

9
37.43

10
36.93

S-ar putea să vă placă și