Documente Academic
Documente Profesional
Documente Cultură
CURS 11
Biostatistic
1. Corelaia statistic
n tiinele experimentale i, n particular, n medicin i
biologie, intereseaz nu numai variaia unei singure mrimi, ci i a
dou valori, adic a dou caractere cantitative, ntr-o populaie
statistic. De exemplu, dorim s tim dac exist ntr-o grup de
subieci o relaie ntre greutate i nlime, ntre tensiunea arterial i
mrimea umoral a unei substane, etc.
Pe plan matematic problema este rezolvat prin noiunea de
funcie, care traduce relaia ntre variaia celor dou mrimi, relaie
materializat prin curba sa reprezentativ: y = f(x). n acest caz, unei
valori date a variabilei independente x i corespunde o valoare i
numai una a variabilei dependente y, relaia y = f(x) permind
calcularea cu exactitate a acestei valori. O astfel de relaie fiind
stabilit, cunoaterea unei valori ne este suficient pentru
determinarea valorii corespondente. Acest tip de relaie, numit
relaie funcional, este cea care se ntlnete n aa-zisele tiine
exacte. Dar problema se complic atunci cnd valorile care se
studiaz (cea dependent i cea independent) sunt supuse
fluctuaiilor. Fluctuaiile se manifest nu numai pentru o singur
valoare dat, ci pentru toate variabilele distribuiei.
Exemplu:
ntr-un grup de subieci crora li s-a studiat nlimea i
greutatea, pentru o valoare dat a nlimii (de exemplu 1.70 m) se va
gsi seria tuturor subiecilor avnd aceeai nlime i diferind ntre ei
prin greutate. Invers, pentru o valoare dat a greutii se va gsi seria
subiecilor cu aceeai greutate, dar cu nlimi diferite. Nu se tie, i
se pune problema dac greutatea este funcie de nlime, sau invers.
Se constat c la o nlime mic corespunde o greutate mai
mic, i invers. Prin urmare, exist o relaie sigur ntre aceste dou
mrimi, dar mai puin rigid dect relaia funcional propriu-zis.
Aceast relaie, de o natur particular, se numete corelaie
statistic, i joac un rol important n tiinele vieii, i n particular n
medicin. Cel mai simplu caz de corelaie este corelaia liniar, unde
una dintre mrimi variaz proporional cu alta.
1. Diagrama de dispersie
Un prim mod de a aborda problema const n a folosi
reprezentarea grafic. Similar cu studiul unei funcie, se merge la un
sistem de axe rectangulare Ox i Oy, pe care se vor reprezenta
valorile a dou mrimi: x (nlimea) i y (greutatea). Fiecare individ
este reprezentat printr-o pereche (x, y). Ansamblul populaiei studiate
va fi reprezentat printr-un nor de puncte, care va constitui dispersia
populaiei studiate (figura 1).
6
5
4
y3
(x,y)
2
1
0
0
4
x
4,5
4
3,5
3
2,5
3
2,5
2
1,5
2
1,5
1
1
0,5
0,5
0
0
0
0,5
1,5
0,5
2,5
Figura 3: Corelaie
6
5
4
y3
2
1
0
0
1,5
x
4
x
2,5
Deoarece
( x x)
N
( x x)( y y ) .
N
( x x)( x x)
deviaia
standard
2. Regresia liniar
Regresia este o metod de estimare a relaiei numerice
dintre variabile. Numele de regresie se datoreaz lui Galton
(1886), care a dezvoltat tehnicile de investigare a relaiei dintre
nlimea copiilor i a prinilor lor. n problemele de regresie, scopul
este s vedem ct de bine poate fi folosit o variabil pentru a o
prediciona pe cealalt.
0,7
0,8
0,6
0,5
y
0,7
0,6
y xi
0,4
0,3
0,5
0,4
yj
0,3
0,2
0,2
0,1
0,1
xi
0
0
0,2
0,4
0,6
xy j
0
0,8
0,2
0,4
0,6
0,8
unde a x
-
( x x)( y y ) .
( x x)
2
( x x)( y y )
( x x)
2
( y y)( x x)
( y y)
2
( x x)( y y)
( x x)
( x x)( y y )
N
( x x) 2
P
x2
P
P
ax 2 , a y 2 .
x
y
D
Dx
Dx
Dy
Dy
M
Figura 8: Cazul
D
Dx
Dy
M
P P
P
2 r
2
x y
x y
x y
( x x)( y y)
N x y
y
x
, ay r
x
.
y
D
D
Figura 11:
Corelaie