Documente Academic
Documente Profesional
Documente Cultură
- Note de curs -
2006
- 2006 -
Editor:
University Press, Trgu Mure, 2006
Str. Gh. Marinescu, 38,
Trgu Mure, MS, 540139
Director de editur: Prof. Dr. chiopu Alexandru
Tel: +40-265-215551/126
Fax: +40-265-210407
Cuprins
CUPRINS
I. INTRODUCERE ............................................................................................................. 6
COEFICIENTUL DE CORELAIE................................................................................ 99
COEFICIENTUL DE DETERMINARE......................................................................... 106
ECUAIA DE REGRESIE ......................................................................................... 107
Cuprins
UTILIZAREA FUNCIEI CHITEST A PROGRAMULUI EXCEL ........................................... 176
Capitolul I
I. Introducere
[ 12, 13]
Statistica matematic este tiina care urmrete explicarea
fenomenelor de mas printr-un numr relativ redus
de observaii. Ea
Introducere
Introducere
Variabilitate biologic
Factori de eroare
10
Introducere
externi:
condiii
de
ntreinere
(alimentaie,
11
12
Introducere
A valoare adevrat
Aceast valoare A a unui sistem nu poate fi cunoscut exact. n
cursul experimentului se obin valori mai mult sau mai puin apropiate de
valoarea A; problema care se pune este ns care sunt valorile ce pot fi
acceptate. Pentru c valoarea A nu poate fi cu certitudine cunoscut se
urmrete ca o valoare acceptat s se gseasc ntr-un anumit domeniu de
valori, n sarcina statisticii matematice cznd stabilirea ntinderii acestui
domeniu i, deci, a validrii rezultatelor unui experiment.
Factorii de eroare care pot fi nlturai alctuiesc aa-numitele erori
sistematice i ele afecteaz exactitatea rezultatului. Factorii care in de
reactivitatea individual, de exemplu, nu pot fi nlturai, ei determinnd
ceea ce numim erori aleatoare (ntmpltoare), care afecteaz
att
Er % =
MA
100 (I.2.)
M
13
oarecele II
Substana S1
32 secunde
33 secunde
Substana S2
6 secunde
5 secunde
x=
Xi
i =1
( I.3.), unde
14
Introducere
media
aritmetic
rezultatelor
individuale
s este valoarea abaterii rezultatelor individuale de la valoarea medie, i arat
precizia determinrilor.
n concluzie, cnd mprtierea rezultatelor individuale fa de medie
este mic, iar media rezultatelor este apropiat de valoarea real, eroarea
determinrii va fi mic, deci vom avea att exactitate ct i precizie bun.
Erori mari survin atunci cnd rezultatele sunt mult dispersate fa de
valoarea medie (precizie slab), iar media rezultatelor se ndeprteaz mult
fa de valoarea real (exactitate sczut a metodei). Pot surveni i situaii
paradoxale, cnd, de exemplu, rezultatele individuale s fie mult dispersate
fa de medie (precizie redus), dar media lor s fie totui apropiat de
valoarea real (exactitatea metodei este bun).
15
Capitolul II
II. Distribuii de frecven
[11-13]
Repartizarea datelor calitative i a celor cantitative (numerice) dintro populaie statistic sau un eantion se poate efectua dup frecvena de
apariie a caracteristicilor lor, obinndu-se structura colectivitii. De
exemplu, o mulime de date experimentale poate fi repartizat dup
calitatea efectelor observate: cu efect, fr efect sau cu efect gradat n
funcie de doz.
Datele (msurate pe ntreaga populaie statistic sau pe un eantion)
sunt de obicei organizate n aa-numitele distribuii de frecven, pentru c o
atare prezentare, reprezint formatul cel mai convenabil de sintez i
prezentare a acestora.
n cazul distribuiilor de frecven se afectueaz o descriere calitativ
sau cantitativ a observaiilor (msurtorilor) mpreun cu numrul de
apariii ale unui anumit rezultat al msurtorii respective - frecvena
absolut.
Se mai poate utiliza i frecvena relativ obinut prin mprirea
frecvenei absolute la numrul total al observaiilor.
De asemenea, pentru variabilele cantitative (numerice) continue este
util s se construiasc aa-numitele intervale de variaie. Regulile generale
de construire a acestor intervale sunt:
-
Distribuii de frecven
nu
trebuie s se suprapun)
Se obine astfel o distribuie de frecven a colectivitii respective.
Se pot obine distribuii de frecven homograde (cum este cazul
diagramelor), cu o singur scar de comparaie n sistemul cartezian, sau
distribuii heterograde.
Pentru a fi mai explicii, s lum un exemplu:
Fie o serie de 33 de date numerice obinute experimental (de
exemplu valori ale tensiunii arteriale sistolice): 180, 120, 110, 200, 140,
210, 200, 190, 150, 170, 140, 130, 150, 170, 160, 120, 160, 140, 160, 170,
180, 160, 150, 130, 160, 180, 190, 160, 170, 170, 150, 150, 130.
Cu aceast serie se poate alctui o diagram, aeznd datele, n
ordinea frecvenei, pe o singur scar a graficului cartezian (fig. 2.1.):
17
frecvena de apariie
6
5
4
3
2
1
0
160 170 140 150 130 180 120 190 200 110 210
Valorile ale TA sistolice (mmHg)
18
Distribuii de frecven
(II.1),
X max X min
(II.2),
1 + 3,22 log n
210 110
= 16,97 . Dat fiind precizia
1 + 3,22 log 33
19
Frecvena absolut
1
5
8
11
5
3
Distribuii de frecven
21
Distribuii de frecven
23
24
Distribuii de frecven
25
- Man
Whitney etc), n cazul crora verificarea unei ipoteze, aa cum vom vedea,
nu este legat de parametrul unei anumite repartiii.
Anumite fenomene biologice rar ntlnite s-a constatat c se supun
unor distribuii de tip special, cum ar fi distribuia Pearson, Neuman,
26
Distribuii de frecven
27
Capitolul III
III. Statistic descriptiv. Consideraii generale.
Indicatori statistici
[11-13, 15,16, 21, 24]
x + x 2 + ... + x n
(III.1),
Media aritmetic - notat de regul cu x = 1
n
Mediana - este acea valoare din irul de date care mparte n dou
pri egale irul ordonat de valori (atenie, irul este ordonat cresctor),
situndu-se la mijlocul seriei statistice. Dac numrul de valori n este un
numr impar, atunci mediana este valoarea
n
Me= xk (III.2), , unde k = + 1 .
2
28
Statistic descriptiv
Dac n este par, deci avem un numr par de valori, mediana este
x +x
k +1 (III.3), unde k = n/2.
definit ca fiind M = k
e
2
Modul - constituie valoarea care apare cel mai des, deci valoarea cu
numrul cel mai mare de apariii.
sx = sx2 (III.5),
29
_ 3
x x
n
(III.7), , unde S = abaterea
Skewness =
i
(n 1) (n 2) S
standard.
Aplatizarea (kurtosis) caracterizeaz gradul de aplatizare a unei
distribuii, comparativ cu distribuia normal. Valorile pozitive ale acestui
indicator indic o distribuie cu un vrf mai nalt dect distribuia
normal. Similar, valori negative ale kurtosisului indic o curb relativ
aplatizat, comparativ cu distribuia normal.
_ 4
x x
n(n + 1)
3(n 1) 2
i
Kurtosis =
(n 1)(n 2)(n + 3) S (n 2)(n 3)
Statistic descriptiv
xi f i
x=
i =1, n
fi
i =1, n
x1 f1 + x2 f 2 + ... + xn f n
f1 + f 2 + ... + f n
(III.10)
fi + 1
Dispersia (variana) :
s x2 =
k = i =1, n
2
( xi x ) 2 f i
i =1, n
fi 1
(III.12)
i =1, n
III.1. Medii
31
1 n
x i (III.13)
n i=1
Calculat dup formula de mai sus. Pentru exemplul din capitolul II,
unde suma celor 33 de rezultate individuale era 5240, media aritmetic
simpl este:
xa =
5250
= 159,09 mmHg
33
Statistic descriptiv
numerele 110 i 210 revin numai o singur dat, n timp ce 140 sau 150
revin de patru ori n irul de date exeprimenatele studiat. n acest caz, se
spune c valorile nu au pondere egal, iar numrul (frecvena) care arat de
cte ori se repet fiecare valoare va fi ponderea valorii respective. Se poate
calcula media, innd seama de aceste ponderi, dup formula:
n
xa =
pi x i
i =1
n
(III.14)
pi
i =1
f x
f
(III.15)
33
2
2
xi ( x )
(III.16)
n 1
Unitatea de abatere individual fa de medie a fost denumit
abaterea standard i a fost notat cu S ( se utilizeaz numai n cazul curbei
ideale). Ea reprezint o msur a preciziei determinrilor sau, cu alte
cuvinte, o msur a mprtierii rezultatelor individuale fa de medie.
Abaterea standard poate fi calculat dup urmtoarea formul:
S=
(x
x)
S=
(x
x)
n 1
(III.18)
Sx = S =
2
x
(x
x)
n 1
34
(III.19)
Statistic descriptiv
medie a valorilor medii obinute sau, altfel spus, media erorilor ce se pot
comite ntr-o determinare.
Aceast abatere a fost denumit eroare standard, notat cu E.
Calcularea ei se face cu ajutorul formulei:
35
E =
(x 1 x )
n (n 1)
(III.20)
S
n
(III.21)
pq
(III.22)
n
Statistic descriptiv
evident, q = 100 p
Putem spune deci c abaterea standard a unui procent de aciune
calculat cu aceast formul reprezint limitele probabile, n plus sau n
minus, ale procentajului de aciune pentru o doz dat de substan activ.
d2
n1
(III.24)
numrul
mrimilor
(animale,
determinri,
observaii)
folosite
38
Statistic descriptiv
exemplu numrul gradelor de libertate pentru dou loturi, n cazul mai sus
menionat va fi (n1+n2-2).
40
Statistic inferenial
Capitolul IV
IV. Statistic inferenial. Interpretarea statistic
a rezultatelor unui experiment
[ 1, 3, 5, 6, 10, 11-13, 15, 20, 23,24]
3. Teste de semnificaie
4. Corelaii i regresii
Noiuni introductive
Definiie: Prin teste de valabilitate se neleg testele care permit
42
Statistic inferenial
oarecum similare.
Z=
X Xi
SD
43
, unde n numrul
3
4
5
6
7
8
1.15
1.48
1.71
1.89
2.02
2.13
44
27
28
29
30
31
32
2.86
2.88
2.89
2.91
2.92
2.94
Statistic inferenial
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
2.21
2.29
2.34
2.41
2.46
2.51
2.55
2.59
2.62
2.65
2.68
2.71
2.73
2.76
2.78
2.8
2.82
2.84
33
34
35
36
37
38
39
40
50
60
70
80
90
100
110
120
130
140
2.95
2.97
2.98
2.99
3
3.01
3.03
3.04
3.13
3.2
3.26
3.31
3.35
3.38
3.42
3.44
3.47
3.49
45
Greutatea (kg)
58
60
80
77
83
75
82
79
50
35
70
160
80
65
55
Media =73,93 kg
Abaterea standard = 27,59
n = 15
73,93 160
27,59
86,07
= 3,12 , o valoare mai mare dect
27,59
valoarea critic pentru n=15, care este 2,55, deci P<0,05. n concluzie,
pentru eantionul studiat o valoarea greutii corporale de 160 kg poate fi
considerat rezultat aberant, putnd fi luat n calcul eliminarea acestuia.
46
Statistic inferenial
numrul n de rezultate;
-
eliminare
n
5
x/s
1,68
n
14
x/s
2,10
47
n
30
x/s
2,39
1,73
1,79
1,86
1,92
1,96
2,03
6
7
8
9
10
12
16
18
20
22
24
26
2,16
2,20
2,24
2,28
2,31
2,35
2,50
2,58
2,80
3,02
3,29
40
50
100
200
500
xi
(secunde)
16,1
15,5
13,4
22,8
12,1
11,3
11,6
6,3
8,8
7,1
xi = 125 ,00
2
3
4
5
6
7
8
9
10
di
d i2
3,6
12,96
3,0
0,9
10,3
-0,4
-1,2
-0,9
-6,2
-3,7
-5,4
9,00
0,81
106,09
0,16
1,44
0,81
38,44
13,69
29,16
2
d i = 212,56
s=
212 ,56
= 4 ,86
9
x/s = 1,96
x = 1,96 x 4,86 = 9,53
48
Statistic inferenial
xi
(secunde)
16,1
d i2
4,7
22,09
16,81
4,00
0,49
0,01
0,04
26,01
6,76
18,49
d i2 = 94 ,70
x = 11,4 (media aritmetica a rezultatelor)
2
3
4
5
6
7
8
9
15,5
13,4
12,1
11,3
11,6
6,3
8,8
7,1
xi = 102 ,2
di
4,1
2,0
0,7
-0,1
0,2
-5,1
-2,6
-4,3
s=
94.7
= 3 ,4
8
x/s = 1,92
x = 1,92 x 3,4 =6,5
Sx =
s
n
(IV.2)
49
Gradele de libertate
Noiuni introductive
n spe, mai ales n domeniul biostatisticii, suntem n primul rnd
interesai dac distribuia de frecven a populaiei din care sunt prelevate
eantioanele analizate de noi urmeaz sau nu modelul ideal al unei
distribuii normale (distribuie Gaussian).
Ce nelegem prin distribuie Gaussian ?
50
Statistic inferenial
51
52
Statistic inferenial
E N = n(i ) N (IV.4)
unde n(i) este numrul de puncte mai mici dect Yi, puncteleY1i fiind
ordonate n ordine cresctoare, de la cea mai mic la cea mai mare valoare.
Graficul de mai jos reprezint funcia de distribuie empiric pentru
o distribuie normal cumulativ n cazul a 100 de numere generate aleator.
Testul Kolmogorov-Smirnov (K-S) se bazeaz pe estimarea maximului
distanelor dintre cele dou curbe.
53
D = max F (Y i )
, F (Y i ) , unde F este
testului
1i N
N N
54
Statistic inferenial
55
Valoarea lui P.
n cazul unui experiment efectuat asupra a dou eantioane, o
ntrebare pertitent pe care am putea s o punem este urmtoarea:
Dac cele dou populaii statistice studiate chiar au aceeai
medie (sau media nu difer semnificativ), care este probabilitatea de a
observa o aceeai diferen sau chiar una mai mare ntre mediile unor
eantioane de aceeai mrime ntr-un viitor experiment ?
Statistic inferenial
(eantioanele) studiate.
57
dat
efectund
paralel
determinri
asupra
58
Statistic inferenial
Statistic parametric/neparametric
n practic ntlnim dou situaii, pe care le vom aborda diferit:
59
cantitative.
ii. Efecte unice (cuantale) exprimate printr-un cuantum (proces) sau
efecte cu rspuns unic, de tipul tot sau nimic. Se mai numesc i efecte
calitative.
Testele de semnificaie se mpart datorit acestui fapt n:
A. Teste de semnificaie pentru efecte gradate (de exemplu testul
X2).
A.Teste de semnificaie pentru efecte gradate
60
Statistic inferenial
S12 =
x1
( x1 )2
n1
n1 1
x2
(IV.5)
S 22 =
61
( x 2 )2
n2 1
(IV.6)
n2 1
F=
S12
S 22
Efect A
x12
Efecte B
x 22
36
15
225
16
16
10
100
49
10
100
36
25
16
11
121
81
n1=6
n2=7
x 1 = 30
x 2 = 64
x 1 = 5,0
x 2 = 9,1
x 1 = 162
S12
x 2 = 668
S 22 =
S 2 13,8
668 (64) 2 / 7 668 585
=
= 13.8 deci F = 12 =
= 5,75
2,4
7 1
6
S
62
Statistic inferenial
63
t=
x1 x 2
n1 n2
Sd
n1 + n2
(IV.8), unde
x1 , x 2
= media rezultatelor
eantionului 1, respectiv 2
n1, n2 = numrul de animale din eantionul 1, respectiv 2.
sd = eroarea standard a diferenei, care se calculeaz conform
formulei:
sd =
d 12 + d 22
n1 + n2 2
(IV.9)
unde:
d 12 , d 22 = (x1 x )2
n eantioanele 1, respectiv 2.
xi - valorile individuale n eantioanele
1 i 2.
Dac nlocuim n formula (IV.8) valoarea erorii standard conform
formulei (IV.9), obinem:
t=
x1 x 2
d 12 + d 22
n1 n2
(IV.10)
n1 + n2
n1 + n2 2
64
Statistic inferenial
t=
x1 x 2
d 12
n(n 1)
d 22
(IV.11)
t=
(d 1 d 2 )
(IV.12)
n(n 1)
d =
di
i
(IV.13)
65
Nr.crt.
di
d1 d
(d 1 d )2
1.
24
35
11
2.
20
10
-10
-19
361
3.
18
36
18
81
4.
45
50
-4
16
5.
60
74
14
25
6.
72
65
-7
-16
256
7.
65
70
-4
16
8.
54
90
36
27
729
= 1488
d1 = 9
d 1 = 72
(d 1 d )
t=
9
1488
7 8
= 1.74
66
Statistic inferenial
(IV.14)
67
=
2
(f
f exp . )
teor .
f teor .
(IV.16)
ee e t
(IV.17) unde
et
Testul 2 se aplic:
-
68
Statistic inferenial
Supravieuitori
Total
Teoretic (et)
20
20
40
50
Experimental
30
10
40
75
10
-10
(ee)
ee-et
(
30 20)2 (10 20)2
=
+
20
20
10 2 ( 10 )2
=
+
= 5 + 5 = 10,0
20
20
69
I III II IV
(IV.18)
I III + II IV
II
IV
III
70
Statistic inferenial
(IV.19)
Compus de
cercetat
Compus
martor
Total
Supravieuitori
Mori
Total
I=25
II = 14
I + II = 39
IV = 21
III = 22
I + IV = 46
II + III = 36
IV + III =
43
M = 82
%
supravieuitori
64%
49%
-
[
(
25 22 14 21) 82 / 2]2 82
=
39 43 46 36
71
Deoarece avem din nou numai dou posibiliti, animale moarte sau
supravieuitoare, vom avea N=2, respectiv N-1=1 grad de libertate. Din
tabelul Anexei 7 putem constata c statisticul lui CHI2 corespunde unei
valori p=0,20, statistic nesemnificativ. Putem afirma deci c produsul
studiat nu este mai puin toxic dect martorul, diferena dintre procentajele
obinute datorndu-se fluctuaiilor de eantionaj.
Testul Wilcoxon
Este unul dintre cele mai utilizat teste de semnificaie neparametrice,
extrem de util mai ales n cazul eantioanelor dependente (date pereche paired data).
72
Statistic inferenial
10
11-26
17-33
24-42
32-52
41-63
51-75
62-88
12-28
19-36
26-46
34-57
44-68
54-81
66-94
73
n2
13-31
20-40
28-50
36-62
46-74
57-87
69-
14-34
21-44
29-55
39-66
49-79
60-93
101
15-37
23-47
31-59
41-71
51-85
63-99
72-
16-40
24-51
33-63
43-76
54-90
66-
108
10
17-43
26-54
35-67
45-81
56-96
105
75-
11
18-46
27-58
37-71
47-86
59-
69-
115
12
19-49
28-62
38-76
49-91
101
111
79-
13
20-52
30-65
40-80
52-95
62-
72-
121
14
21-55
31-69
42-84
54-
106
117
82-
100
64-
75-
128
112
123
86-
67-
78-
134
117
129
89-
81-
141
135
92148
96154
74
Statistic inferenial
Lot tratat
Ranguri
lot Ranguri
tratat
martor
20
21
22
27
27
4,5
4,5
29
6,5
-*
29
6,5
31
31
8,5
8,5
34
34
10,5
10,5
35
12
36
13,5
36
13,5
37
15
47
16
51
17
54
18
55
19
S1 = 67,5
S2 = 122,5
lot
n tabelul de mai sus, pentru n1=10 i n2=9, corespunde intervalul 79121. Deoarece S2=122,5 este situat n afara acestui interval, se poate afirma
c p<0,05, deci cele dou eantioane studiate difer semnificativ statistic.
75
Testul Mann-Whitney U
Testul Mann-Whitney U (MWU) este cel mai utilizat test de
semnificaie neparametric pentru compararea (medianelor) a dou
eantioane independente ce conin msurtori ale unor date experimentale,
ranguri sau scoruri. De pild, n cazul existenei unor ranguri sau scoruri,
testul MWU verific dac scorurile respective sunt aleator distribuite ntre
cele dou eantioane.
Modul de calcul n cazul testului Mann-Whitney U.
S considerm dou eantioane independente A i B, fiecare avnd
mrimea eantionului n1, n2=8, pentru care studiul acord o serie de scoruri
(ranguri) de la 1 la 14 (variabile ordinale).
Tabel IV.11. Rezultatele experimentale
Nr.crt.
1
2
3
Scor pentru A
1
3
5
76
Scor pentru B
1
2
4
Statistic inferenial
4
5
6
7
8
5
6
8
9
10
7
9
11
12
14
1 1
A B
2
B
3
A
4
B
5
A
5
A
6
A
7
B
8
A
9
A
9
B
10
A
11
B
12
B
14
B
78
Analiza ANOVA
Capitolul V
V. Analiza dispersional (analiza de varian) ANOVA
[12, 13]
A. Baze teoretice
metod se verific msura n care valorile reale ale unei caracteristici se abat
de la valorile teoretice, calculate, de regul, sub forma unor mrimi medii
sau ecuaii de regresie, precum i msura n care aceste variaii sunt
dependente sau nu de factorul de grupare.
Pe baza interpretrii logice a variaiei celor dou sau mai multe
variabile luate n studiu se pot stabili relaii de tipul cauz efect. Uneori
prin analiza dispersional trebuie s fie verificat dependena variabilei
rezultative (z) de factorul (factorii) de grupare, ea putnd fi considerat, n
acest caz, ca o metod auxiliar, utilizat nainte i dup aplicarea metodelor
corelaiei i regresiei statistice. Dac, ns, trebuie verificat independena
variabilei rezultative de o variabil de sistematizare a datelor, atunci analiza
79
este
1
y ij y
n 1
)2 = S2
(V.1.)
Analiza ANOVA
B.Consideraii practice
81
cele
ase
substane
medicamentoase
drept
variabile
82
Analiza ANOVA
83
Vom aranja mai nti datele obinute sub forma unui tabel (tabelul
V.I.), n care xij (i =1, 2, ...m i j = 1, 2, ...., n) reprezint timpul de laten a
apariiei reaciei nociceptive. De exemplu x32 nseamn timpul nregistrat (n
secunde) n urma experienei nr. 2 cu substana activ nr. M3.
Tabelul V.1. Gruparea rezultatelor pentru analiza dispersional
monofactorial
Nr.
Subst.
Exp.
activ
M1
M2
M3
Mm
Experimentul 1
x11
x21
x31
xm1
Experimentul 2
x12
x22
x32
xm2
Experimentul 3
x13
x23
x33
xm3
...
Experimentul n
x1n
x2n
x3n
xmn
Total
x1
x2
x3
xm
S2 =
2
x ij
ij
x ij
n ij
n 1
84
(V.2)
Analiza ANOVA
mprit la numrul de
observaii pe coloane:
m
S2 =
xi
i =1
(V.4)
xy
y
S3 =
mn
(V.5)
85
Suma
variaiei
ptratelor
Numrul
dispersiei
libertate
S2-S3
ntre
Estimaia
gradelor de
m-1
S 12 =
coloane
S2 S3
m 1
S 12
S 22
(ntre
grupe)
S1-S2
ntre
m(n-1)
S 22 =
rnduri
S1 S 2
m( n 1 )
(n
interiorul
grupelor)
(S2-S3)+(S1-
Total
mn-1
S2) = S1-S3
S12
S 22
S 2 S3
(V.7) dispersia corectat ntre
m 1
grupe (sistematic).
86
Analiza ANOVA
S 22 =
S1 S 2
(V.8) - dispersia corectat din interiorul grupelor
m(n 1)
87
Nr.
Subst.
Exp.
activ
M1
M2
M3
M4
M5
M6
Experimentul 1
25,1
22,8
25,5
24,5
25,5
24,7
Experimentul 2
27,0
23,8
27,9
25,2
28,7
27,1
Experimentul 3
29,6
27,1
28,8
27,7
26,2
26,0
Experimentul 4
26,6
22,7
26,9
26,9
25,7
26,2
Experimentul 5
25,2
22,8
25,4
27,1
27,2
25,7
Experimentul 6
28,3
27,4
30,0
30,6
27,9
29,2
Experimentul 7
24,7
22,2
29,6
26,4
25,6
28,0
Experimentul 8
25,1
25,1
23,5
26,6
28,5
24,0
211,6
193,9
217,
215,
215,3
211,3
27,2
26,9
26,9
26,4
Total
Media
26,5
24,1
S2-S3 = 46,33
48
S1-S2 = 142,58
88
1264,7 2
= 33322,20
48
S1-S3 = 188,91
Analiza ANOVA
m-1=5
S12 =
m(n-1)=42
46,33
= 9,27
5
S 22 =
mn-1=47
142,58
= 3,16
42
F=
9,27
= 2,93
3,16
Suma
ptratelor
Gradele
de
Dispersia
F0,05
libertate
Substanele
cercetate (variaie
46,33
9,27
2,93
2,44
142,58
42
3,16
188,91
47
ntre grupe)
Erorile
experimentale
(variaie
interiorul grupei)
Total
Concluzii. Deoarece F > F0,05 (2,93 > 2,44), unde F0,05 se gsete
89
care pot fi
Analiza ANOVA
cu efect de potenare a analgeziei (P1, P2, Pn). Deci, n acest caz dispersia
total se compune din dispersia datorat diferenelor ntre coloane, plus
dispersia datorat diferenelor ntre rnduri, rmnnd i o dispersie residual,
datorat erorilor experimentale. Scopul nostru este s cunoatem separat
fiecare dintre aceste abateri medii ptratice.
Tabelul V.5. Gruparea observaiilor pe criteriul factorilor de influen
Coloana
Total
M1
M2
M3
Mm
x1
x11
x21
x31
xm1
xi1
x2
x12
x22
x32
xm2
xi2
x3
x13
x23
x33
xm3
xi3
...
...
...
xn
x1n
x2n
x3n
xmn
xin
Total
x11
x12
x13
xim
xij
91
S2 =
xi
i =1
(V.10)
S3 =
xi
j=1
(V.11)
xy
y
S3 =
mn
(V.12)
92
Analiza ANOVA
Tipul variaiei
Suma
(sursa dispersiei)
ptratelor
ntre coloane
S2-S4
Numrul
Estimaia
gradelor de
dispersiei
libertate
m-1
(primul
S 12 =
S2 S4
m 1
S 12
S r2
parametru
variabil)
ntre rnduri
S3-S4
m(n-1)
(al doilea
S 22 =
S3 S4
m( n 1 )
S 22
S r2
parametru
variabil)
Rezidual Sr
S1 + S4
S2 S3
(S2-
Total
(m-1) (n-1)
S r2 =
Sr
( m 1 )( n 1
mn-1
S4)+(S3-S4)
= S1-S4
Cu ajutorul dispersiilor calculate conform schemei de mai sus, se
face testul F, care va arta dac diferenele observate ntre coloane, respectiv
ntre rnduri, sunt reale sau sunt cauzate de factori ntmpltori.
Pentru aceasta vom calcula rapoartele F =
S12
S 2r
, respectiv F =
S 22
S 2r
Dac valorile rezultate din calcul sunt mai mici dect cele gsite n tabelul
93
Total
Substana de cercetat
xj
pentru efect de
potenare
Medi
a
xj
M1
M2
M3
M4
D1
25
28
22
24
99
24,7
D2
27
29
23
23
102
25,5
D3
30
32
26
29
117
29,2
89
71
76
29,7
23,7
25,3
Total
xi
= 82
xi = 27 ,3
94
xij
= 318
Analiza ANOVA
82 2 + 89 2 + 712 + 76 2
= 8487,3
3
S3 =
99 2 + 102 2 + 117 2
= 8473,5
4
S4 =
318 2
= 8427,0
12
4,6
46,5
60,3
= 20,1; S 22 =
= 23,3; S 2r =
= 0,7
6
2
3
i testul F:
95
S12 20,1
S 22 23,3
Fcol 2 =
; Frnd = 2 =
= 33,3
0,7
0,7
Sr
Sr
F0,05 =5,14.
Odat calculate toate aceste elemente, putem completa tabelul pentru
analiza dispersional bifactorial:
Tabel V.8. Rezultatele analizei Anova, bifactorial
Numrul
Felul variaiei
Suma
gradelor
Estimaia
(sursa dispersiei)
ptratelor
de
dispersiei
F0,05
libertate
ntre analgezice
60,3
20,1
28,7
4,76
46,5
23,3
33,3
5,14
4,2
0,7
111,0
11
ntre dozele de
s.a. cu efect de
potenare
Rezidual
Total
96
Analiza ANOVA
Similar, deoarece Fln > F0,05 vom respinge ipoteza conform creia
mediile liniilor sunt egale i vom trage concluzia c doze diferite de
substan P, influeneaz semnificativ efectul analgezic al compuilor
studiai.
Odat fcute aceste constatri, vor trebui continuate experienele,
pentru a vedea care dintre substane are cel mai puternic efect analgezic i,
respectiv, care este doza optim de substan P, pentru potenarea efectului
analgezic.
Mai trebuie studiai faptul c dispersia mic datorat factorilor
ntmpltori indic faptul c experienele s-au desfurat n condiii
satisfctoare, reproductibile.
Pn acum, la analiza dispersiilor cu doi parametri valabili am
presupus c efectul acestora este aditiv. Dac aceast condiie nu este
satisfcut, analiza dispersional
se
97
Capitolul VI
VI. Corelaie i regresie
[11-13, 15, 17]
Termenul corelaie este folosit pentru a sublinia existena unei
anumite forme de asociere ntre dou variabile studiate. De exemplu, n
domeniul medical putem spune c am observat o corelaie ntre zilele cu
cea i declanarea crizelor de astm.
Pe de alt parte n domeniul biostatisticii, termenul de corelaie este
folosit pentru a reliefa existena unei asocieri ntre dou variabile cantitative.
n mod obinuit, suntem tentai s presupunem c aceast asociere este
linear, n sensul c una dintre variabile (s o notm cu y) crete sau
descrete ntr-o anumit msur, proporional cu creterea sau
descreterea celeilalte variabile studiate (notat cu x).
Variabila y va fi considerat variabila dependent, ce prezint
un
anumit
grad
de
asociere
fa
de
variabila
x,
variabila
independent.
98
Corelaie i regresie
Coeficientul de corelaie
(VI.1)
Ce se mai poate scrie i
(VI.2)
99
100
Corelaie i regresie
101
50
40
30
20
10
0
0
10
15
20
x
25
102
Corelaie i regresie
103
nlimea (cm)
Spaiul pulmonar
variabila
mort anatomic
independent
variabila dependent
110
44
116
31
124
43
129
45
131
56
138
79
142
57
150
56
153
58
10
155
92
11
156
78
12
159
64
13
164
88
14
168
112
15
174
101
x = 144,60
y = 66,93
SD x = 19,37
SD y = 23,65
Statistic
descriptiv
(n=15)
104
Corelaie i regresie
120
Y (spaiul m ort
anatom ic - m l)
100
80
60
40
20
0
X (inlim ea - cm )
50
100
150
200
r=
105
Number of points: 15
Correlation coefficient (r) =0,8463
Confidence interval (95%): 0,5896 to 0,9477
Coeficientul de corelaie pare s indice o corelaie pozitiv puternic
ntre mrimea spaiului mort anatomic i nlimea copiilor.
Dar n interpretarea corelaiei este important s ne amintim c
existena unei corelaii ntre dou variabile nu implic n mod necesar
cauzalitatea, aceasta se poate datora unor cauze comune. Prin urmare trebuie
avut grij la interpretarea acestor coeficieni de corelaie.
Coeficientul de determinare
106
Corelaie i regresie
ct din
cu r .
Pentru exemplul studiat anterior, r2 = 0,716, astfel c putem afirma
faptul c aproximativ 72% din variaia existent ntre volumul spaiului
mort anatomic la lotul de copii studiat se datoreaz variaiilor nlimii
acestora.
Practic coeficientul de determinare r2 este extrem de util deoarece
este o msur a procentului variaiei ce poate fi explicat din totalul
variaiei observate
Coeficientul de determinare poate avea valori cuprinse ntre 0 i
1 (0<r2<1).
Ecuaia de regresie
diagrame scatter-plot, iar cel mai simplu caz este cazul n care aceast linie
este o linie dreapt, caz n care se folosete termenul de regresie liniar.
Direcia de nclinare a acestei linii de regresie depinde de faptul c
avem de-a face cu o corelaie pozitiv sau negativ. Astfel dac cele dou
seturi de observaii (x i y) cresc mpreun (corelaie pozitiv), linia de
regresie va fi ascendent de la stnga spre dreapta. Dac valorile variabilei
X cresc, iar valorile corespunztoare ale variabilei Y descresc, nclinarea
liniei de regresie va fi descendent de la stnga spre dreapta.
Din nefericire, n cazul regresiei liniare, de vreme ce avem de-a face
cu o dreapt de regresie, este foarte probabil ca ea s treac prin relativ
puine puncte reprezentate de noi n diagram.
108
Corelaie i regresie
y = x + (VI.3)
n momentul n care cunoatem ecuaia de regresie, pentru a putea
trasa corect dreapta de regresie trebuie s inem cont de cei doi coeficieni ai
ecuaiei dreptei pentru a o putea trasa corect.
120
Y (spaiul m ort
anatom ic - m l)
y = 1.0333x - 82.485
R2 = 0.7162
100
80
60
40
20
0
0
50
100
150
X (inlim ea - cm )
200
109
Semnul pantei ecuaiei de regresie liniar ne arat clar dac avem dea face cu o corelaie pozitiv sau negativ ntre cele dou variabile, X i Y.
n prezent programele de analiz statistic traseaz automat dreapta
de regresie, furniznd totodat i ecuaia dreptei de regresie, respectiv
coeficientul de determinare.
n trecut, trasarea corect adreptei de regresie se fcea cu ajutorul
metodei celor mai mici ptrate - least squares estimate (dreapta se trasa
astfel nct suma ptratelor distanelor de la punctele reprezentate n
diagram la dreapta de regresie s fie minim).
innd cont de cele afirmate mai sus, coeficientul de determinare r2
este extrem de util deoarece:
-
(fluctuaia) unei
110
Corelaie i regresie
reprezentate
diagrama
scatter,
coeficientul
de
111
Capitolul VII
VII. Alegerea unui anumit test statistic
[16, 23]
scoruri
sau
date
binomiale
bolnav/sntos,
112
Msurtori
(eantioane
prelevate dintr-o
populaie statistic
Gaussian)
Date
binomiale
Ranguri, scoruri
sau msurtori
(eantioane
prelevate dintr-o
populaie statistic
non-Gaussian)
Median
(Dou valori
posibile)
Media, Abatere
standard
Compararea unui
singur eantion cu o
serie de valori
ipotetice
Compararea a dou
eantioane
independente
(date nepereche)
Test t pentru un
singur eantion
Test Wilcoxon
Testul Chi2
Test t pentru
eantioane
independente
Testul MannWhitney U
Testul Chi2, n
special dac
eantioanele
sunt mari
Compararea a dou
eantioane dependente
(date pereche)
Compararea a trei sau
mai multe eantioane
(grupuri) independente
(unmatched groups)
Compararea a trei sau
mai multe eantioane
(grupuri) dependente
(matched groups)
Cuantificarea asocierii
ntre dou variabile
Proporii
Testul Fisher
pentru tabele
de
contingen
Testul
McNemar
Test t pentru
eantioane
independente
Analiz ANOVA
monofactorial
Testul Wilcoxon
Testul KruskalWallis
Testul Chi2
Analiz ANOVA
multifactorial
Testul Friedman
Testul
Cochrane Q
Coeficientul de
corelaie Pearson
(r)
Coeficient de
corelaie Spearman
Regresie liniar
sau
Regresie neliniar
Regresie
neparametric
RR (Riscul
relativ)
OR (rata de
ans Odds
Ratio)
Regresie
logistic
simpl
113
Regresie liniar
multipl
sau
Regresie
neliniar
multipl
114
Regresie
logistic
multipl
Capitolul VIII
VIII. Studii epidemiologice i clinice
[4, 12, 14, 15]
I.
II.
i. Incidena cumulativ
ii. Rata incidenei (sau densitatea incidenei)
115
III.
Indicatori ai diferenei:
1. Riscul atribuit/populaie
Rate i proporii
1. Raportul - este folosit pentru a compara dou cantiti (de exemplu
numrul de femei/ numrul de brbai dintr-o localitate = 900/802 =
1,122)
2. Proporia un tip special de raport, n care numrtorul este inclus i n
unde k folosit pentru uniti de populaie (cum ar fi 1 000 sau 100 000)
116
(VIII.2)
-poate fi i ea exprimat sub forma: la 1000 sau 100000 locuitori etc
Exemplu: dac ntr-un ora de 120 000 de locuitori la un moment dat exist
117
Tipuri de prevalen:
IC
numarul de cazuri noi dintr o anumit boal de a lungul unei perioade de timp
Totalul populatiei expuse la risc
(VIII.3)
-poate fi i ea exprimat sub forma: la 1000 sau 100000 locuitori etc
Exemplu: dac ntr-un ora de 120 000 de locuitori la un moment dat exist
118
IC =
30 de cazuri noi de LA
= 0,00025
120000
sau 25 de cazuri la
100000 locuitori
3. Rata de inciden (densitatea incidenei) un indicator mai puin
119
Expunere
Boal
Total
Da
Nu
Total
a+b
c+d
a+c
b+d
a+b+c+d
Da
Nu
unde:
a = numrul indivizilor din cadrul populaiei studiate expui (care au suferit
****************************************************
a + b = numrul total al indivizilor (bolnavi + sntoi) din cadrul
120
121
a (a + b)
(VIII.5)
c (c + d)
- Singura modalitate de msurarea a asocierii expunere (factor de risc)boal disponibil n cazul studiilor de tip Case-Control
122
Formula de calcul:
a c a*d
(VIII.6)
=
b d b*c
- Rata de ans (OR) poate avea, teoretic vorbind, valori ntre 0 i infinit
OR = 1 : Nu exist nici un fel de asociere ntre expunere (factorul de risc) i
boal;
OR> 1 : Expunerea reprezint un factor de risc n cazul bolii respective
123
124
rspuns.
125
126
127
Valoarea
maxim CI
95 %
Comun
Interpretare
Nu exist o asociere semnificativ
128
(relativ
apropiat
1)
(relativ
de apropiat
1)
129
expunere-boal;
Ct de apropiat de 0,05 este
valoarea lui P?
Dac P are o valoare relativ
apropiat de 0,05 atenie la
designul studiului !
Pentru a putea trage concluzii clare
este
necesar
repetarea
experimentului folosind mai muli
subieci.
Modul n care trebuie interpretate rezultatele analizei statistice n
cazul studiilor ce utilizeaz tabele de contingen de tip 2x2 este cel de mai
sus, clar prezentat ntr-un numr mare de surse bibliografice:
valoarea lui P ca prim parametru, din care rezult semnificaia
statistic a analizei
130
Cazul 1:
P < 0,05
0,05):
Cazul 3:
131
boala studiat.
Cazul 4:
boala studiat.
Exist i o a cincea situaie, cea n care OR (RR) 1, ceea ce
nseamn ntre factorul de risc (expunere) i boal nu poate fi fcut nici
un fel de asociere, factorul de risc (expunerea) nu are nici un fel de
132
de risc-boal
ASOCIERE factor de risc - boal STATISTIC SEMNIFICATIV
OR
Val.
Val.
P
Interpretare
(RR)
minim
maxim
Exist o asociere
CI 95 % CI 95 %
POZITIV,
SEMNIFICATIV
>1
>1
>> 1
< 0,05
STATISTIC
Asociere pozitiv
Statistic
ntre factorul de risc i
semnificativ
boala studiat
OR
Val.
Val.
P
Interpretare
(RR)
minim
maxim
Exist o asociere
CI 95 % CI 95 %
NEGATIV,
SEMNIFICATIV
<1
<<1
<1
< 0,05
STATISTIC
Asociere negativ
Statistic
semnificativ ntre factorul de risc i
boala studiat
ASOCIERE factor de risc - boal STATISTIC NESEMNIFICATIV
OR
Val.
Val.
P
Interpretare
(RR)
minim
maxim
Poate fi observat o
CI 95 % CI 95 %
asociere POZITIV,
NESEMNIFICATIV
>1
<1
>1
> 0,05
STATISTIC
Asociere pozitiv
Statistic
nesemnificativ ntre factorul de risc i
boala studiat
OR
Val.
Val.
P
Interpretare
(RR)
minim
maxim
Poate fi observat o
CI 95 % CI 95 %
asociere NEGATIV,
NESEMNIFICATIV
<1
<1
>1
> 0,05
STATISTIC,
ntre
Asociere negativ
Statistic
factorul
de
risc
i
nesemnificativ
boala studiat
OR (RR) 1 : ntre factorul de risc (expunere) i boal nu poate fi fcut
nici un fel de asociere(n cazul studiului nostru am considerat aceast
situaie pentru
0,950 <OR (RR) < 1,050)
133
STUDII DESCRIPTIVE
CARACTERISTICI GENERALE:
de risc-boal
134
Avantaje
Metod rapid i ieftin, poate fi utilizat ca un prim
pas n efectuarea unui studiu mai complex
Limitri
Nu poate oferi
cercettorului o modalitate de
135
136
PENTRU STUDIU:
z Ce boal va fi studiat i cum?
137
STUDII ANALITICE
CARACTERISTICI GENERALE:
Utilizeaz
138
expunerea
(de
exemplu
un
anumit
absena bolii:
Persoane care prezint boala
Grup de comparaie
140
141
concluzii asemntoare?)
- sursa loturilor control: clinici, eantioane din populaie n general, serii
factor de risc
z Populaia este urmrit pentru a determina prezena (apariia) bolii n
cadrul acesteia ;
z n funcie de modul de urmrire a prezenei bolii n cadrul populaiei
deosebim:
Studii de tip cohort prospective, respectiv retrospective
142
143
Dezavantaje:
sau martor)
- datele legate de sursa de expunere la factorul de risc
- datele legate de variabilele de ieire (apariia bolii, indicatorii folosii,
145
Costuri
Timp
146
147
148
149
150
Scurt recapitulare
151
Anexa 1
Indicatori statistici
x1 , x2 , , xn .
Indicatorii matematici mai importani ce caracterizeaz o serie de date
sunt:
Media aritmetic - notat de regul cu
x=
x1 + x2 + ... + xn
n
Mediana - este acea valoare din irul de date care mparte n dou pri
egale irul ordonat de valori (atenie, irul este ordonat cresctor), situnduse la mijlocul seriei statistice. Dac numrul de valori n este un numr
impar, atunci mediana este valoarea Me= xk , unde
k=
n
+ 1. Dac n
2
este par, deci avem un numr par de valori, mediana este definit ca fiind
Me =
xk + xk +1
2
unde
k = n/2.
152
Modul - constituie valoarea care apare cel mai des, deci valoarea cu
numrul cel mai mare de apariii.
Amplitudinea - este diferena dintre valoarea maxim i cea minim
A = Amax - Amin .
Amplitudinea relativ - notat A% este raportul dintre amplitudinea
absolut i media aritmetic a seriei de date.
Dispersia (variana) notat s2x este un indicator de mprtiere a
datelor. Formula de calcul este:
s x2
xi2 ( x ) 2
.
=
n 1
sx = sx2
C.V.% =
sx
100
x
153
Anexa 1
indic dispersie mijlocie, iar peste 30% indic dispersie mare. Dac
dispersia este mare, media nu este un indicator reprezentativ.
Atunci cnd avem foarte multe date se recomand includerea lor n
clase egale ca mrime, ceea ce uureaz mult prelucrrile statistice
ulterioare. Spre exemplu sortm pacienii pe grupe de vrst: 21-24 de ani,
25-30 ani, etc n acest caz apare noiunea de frecven a clasei.
xi f i
x=
i =1, n
fi
i =1, n
x1 f1 + x2 f 2 + ... + xn f n
f1 + f 2 + ... + f n
fi + 1
k = i =1, n
2
154
Dispersia (variana) :
s x2 =
( xi x ) 2 f i
i =1, n
fi 1
i =1, n
155
Anexa 1
156
157
Anexa 1
VARP, VARPA)
Abaterea standard - funcia STDEV( ) (cu variantele STDEV,
Exemplu.
Fie o serie de 33 de date numerice obinute experimental (de
exemplu valori ale tensiunii arteriale sistolice in mmHg): 180, 120, 110,
158
200, 140, 210, 200, 190, 150, 170, 140, 130, 150, 170, 160, 120, 160, 140,
160, 170, 180, 160, 150, 130, 160, 180, 190, 160, 170, 170, 150, 150, 130.
S se calculeze, folosind funciile din programul Excel media, mediana,
modul, varianta, abaterea standard, valoarea maxim i minim, pentru acest
set de date.
Rezolvare.
- Se introduc datele n program
159
Anexa 1
odat instalat, poate fi apelat prin alegerea opiunii Data Analysis din
meniul Tools al programului Microsoft Excel.
Valoarea
msurtoare
msurat
64
71
160
73
82
87
95
100
101
102
10
105
Frecvena
(n grame)
2800
10
2900
20
3000
40
3100
20
3200
10
161
Anexa 1
Frecvena
20
22
24
10
26
18
28
30
30
80
32
26
34
10
36
38
40
162
dou populaii.
Testul STUDENT
163
Anexa 2
2)
2. Ipoteza alternativ (H1) afirm: media 1 a caracteristicii n
populaia din care face parte grupul de test este diferit de media 2 a
caracteristicii n populaia din care face parte grupul martor (12 )
Se calculeaz valoarea statistic a testului Student dup formula:
t=
X Y
s 2p
n1
s 2p
n2
unde sp este:
164
s 2p
(n1 1) s12 + (n 2 1) s 22
n1 + n 2 2
gl= n1+ n2 2.
Se calculeaz valoarea probabilitii p. Probabilitatea p este
165
Anexa 2
166
Testul
recapitulative
STUDENT
exemple
exerciii
Grupul
Grupul de
de test
control
4,5
3,5
6,5
10,5
6,5
16
7,5
18
1,5
8,5
9,5
167
Anexa 2
Dup
Dup
subiect
4 ore
8 ore
1,3
1,3
0,9
0,7
168
0,9
0,9
0,8
1,3
1,2
1,1
10
1,3
1,2
Hemoglobina
(g./100 ml snge)
Persoana
nainte de
Dup
tratament
tratament
3,4
4,9
3,0
2,3
3,0
3,1
3,4
2,1
3,7
2,6
4,0
3,8
169
Anexa 2
2,9
5,8
2,9
7,9
3,1
3,6
10
2,8
4,1
11
2,8
3,8
12
2,4
3,3
Sn-
Bolnave de
toase
diabet
100
171
101
172
103
175
106
176
110
177
178
182
185
170
Nr.
Valoarea
Valoarea
Subiect
uremiei n
uremiei n
lotul tratat
lotul
(mg/l)
netratat
42
48
45
54
48
60
52
66
55
72
58
78
60
84
63
90
67
96
10
70
102
Anexa 2
apoi li s-a aplicat o raie alimentar hipercaloric, dup care s-a repetat
proba Tymol.
Rezultatele obinute n urma analizrii probelor sunt sintetizate n
tabelul urmtor.
Proba Tymol
Bolnavul
nainte
Dup
raie
10
16
10
12
10
14
14
10
10
10
Valoarea sistolic
Pacientul
Simptomatici
Asimptomatici
160
150
155
160
170
155
170
150
170
150
185
155
190
165
195
165
205
165
10
210
170
11
210
175
12
220
175
13
220
180
173
Anexa 2
Testul CHI2
174
Eij =
Oij Oij
i =1,n j =1,m
Oij
i =1,n
j =1,m
i =1,n
j =1,m
(Oi E )
ij
Eij
175
Anexa 2
1
2
3
4
...
176
11.2)
A
10
(F1*A4)/F4
(F1*B4)/
F4
(F1*E4)/F4
11
(F2*A4)/F4
(F2*B4)/
F4
(F2*E4)/F4
12
(F3*A4)/F4
(F3*B4)/
F4
...
(F3*E4)/F4
13
Figura 11.2
Dup calculul matricei valorilor estimate se poate aplica funcia
CHITEST i anume: =CHITEST(A1:E3;A10:E12). Rezultatul ntors de
funcia CHITEST este valoarea p.
177
Anexa 2
Cu contraceptive
Hipertensiune
Tesiune normal
Total
32
40
15
45
60
23
77
100
orale
Cu alte
contraceptive
Dup aceea aplicai testul CHI. Dac probabilitatea P obinut este mai
mic dect 0,05 , atunci exist diferen, deci exist o legtur.
Ipoteze:
H0: nu exist nici o legtur ntre utilizarea medicamentelor
contraceptive orale i hipertensiune.
H1: exist o legtur ntre utilizarea medicamentelor contraceptive
orale i hipertensiune.
Dac probabilitatea P obinut este mai mic dect 0,05 , atunci exist
o legtur, se respinge ipoteza H0 i se accept iptoteza H1.
178
30,8
13,8
46,2
362
60
141
317
880
Moderat
29
15
21
70
Sever
20
20
50
TOTAL
411
70
161
358
1000
TOTAL
179
Anexa 2
prezente
absente
bulbar
16
99
dorsal sever
77
58
dorsal uoar
76
85
neparalitic
24
26
n acest scop s-au supus observaiei 348 de copii, dintre care la 177 s-a
administrat vaccin de tip A, iar la 171 vaccin de tip B. Se dorete s se afle
dac diferenele dintre reaciile locale produse de aceste vaccinuri sunt
semnificative din punct de vedere statistic sau dac este vorba numai de o
fluctuaie de eantion.
Datele rezultate din observarea reaciilor locale sunt prezentate n
tabelul urmtor:
Tip vaccin
Reacie local
normal
12
29
intens
156
135
ulceraie
abces
180
Tip boal
tip gravid
sarcini
normale
79
96
55
negravide
4
15
25
aldosteron
cortizon
cortizol
disgravidii
tardive
24
37
33
431
291
181
Anexa 2
8.
bolnavi
sntoi
vaccinai
20
74
nevaccinai
47
59
Femei gravide
Cu avorturi
Fr
spontane
avorturi
spontane
expuse la pesticid
30
70
neexpuse
10
90
unui instructaj privind igiena oral unui numr de copii alei aleator. La 50
de copii li s-a fcut un instructaj privind igiena oral iar la 50 de copii alei
la ntmplare nu li s-a fcut acest instructaj. Peste 6 luni s-au numrat cariile
182
0-1
2-3
4-5
30
15
20
15
15
prezent
absent
10
30
12
18
15
15
AB
13
12
183
Anexa 2
Nefumtori
Stadiul 1
60
40
Stadiul 2
75
25
Stadiul 3
80
20
Nivelul de severitate al
cancerului
184
185
Anexa 3
avem nici o corelaie ntre cele dou variabile. De exemplu, nu exist nici o
legtur ntre presiunea sanguin i numrul de fire de pe cap.
Dac coeficientul de corelaie este r = +1 nseamn c avem o
corelaie pozitiv perfect, adic exist o dependen direct ntre cele dou
variabile. O persoan care are o valoare mare la prima variabil va avea o
valoare mare i la cea de a doua. De asemenea, valoarea unei variabile poate
fi prevzut exact pe baza valorii celei de a doua variabile. Un exemplu de
acest tip este corelaia dintre vrsta unui copac i numrul su de inele.
Dac coeficientul de corelaie este r = -1 atunci avem o dependen
186
187
Anexa 3
Reprezentarea grafic
188
Pentru a afla dac dou variabile studiate sunt corelate sau nu,
formulm urmtoarele ipoteze statistice:
H0: cele dou variabile studiate nu sunt corelate.
H1: cele dou variabile studiate sunt corelate.
189
Anexa 3
respectiv. Dac r este mai mare dect pragul critic pentru 0,05 atunci cele
dou variabile sunt considerate corelate cu un nivel de semnificaie de 0,05.
n general se urmrete s se obin o corelaie cu un nivel de semnificaie
ct mai mic. Cu ct nivelul de semnificaie este mai mic, cu att corelaia
este mai sigur i sunt mai puine anse s greim deoarece marja de eroare
este mai mic.
4. n toate aceste cazuri se respinge ipoteza H0 i se accept ipoteza H1
Intensitatea psihozei
10
150
30
300
20
250
15
150
45
450
35
400
50
425
15
200
40
350
10
55
475
190
Intensitatea psihozei
60
50
40
30
20
10
0
0
100
200
300
400
500
191
Anexa 3
EXERCIII
1. Studiindu-se relaia dintre doza unui medicament (exprimat n
multipli ai unei doze minime) i durata bolii (exprimat prin numrul
de zile de boal), s-a obinut urmtoarea relaie:
Nr.
doz
durat
subiect
1
1
23,5
2
2
20,0
3
3
14,9
4
4
8,1
5
5
7,5
S se reprezinte grafic datele din tabel i s se verifice dac exist o
1
2
3
4
5
6
7
8
9
10
litri de
vin
pe lun
7
8
8
10
12
13
15
15
15
16
192
Vrsta de
debut
a cirozei
56
55
58
55
52
51
50
48
45
40
11
16
47
12
16
44
13
17
40
14
17
40
15
18
38
16
18
38
17
19
40
18
20
38
19
20
35
20
20
35
S se reprezinte grafic datele din tabel, sub form de diagram scatter.
3. S se aprecieze gradul i sensul legturii dintre temperatur i puls la
un lot de 20 de bonavi. Datele studiului sunt prezentate n tabelul
urmtor.
Nr.
subiect
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
temperatur
puls
36,5
36,6
36,7
36,7
36,8
36,8
36,8
37,0
37,0
37,4
37,8
38,0
38,3
38,4
38,8
38,9
39,0
39,2
39,4
68
72
70
74
72
75
70
78
78
80
82
82
84
85
86
86
100
94
110
193
Anexa 3
20
39,6
120
S se reprezinte grafic datele din tabel, sub form de diagram scatter.
4. Urmtorul tabel conine informaii despre un lot de paciente
diagnosticate cu cancer de col uterin. Se cere s se precizeze dac exist
o legtur ntre vrsta la care a fost depistat cancerul de col uterin i
menarha (vrsta de nceput a menstruaiei) i s se reprezinte grafic
datele din tabel.
Nr.
subiect
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
vrsta
menarha
57
56
32
39
46
73
38
69
67
61
65
45
47
50
65
49
63
47
43
40
58
41
49
54
32
14
14
13
15
13
14
11
15
13
15
13
14
14
15
15
14
14
12
15
12
13
14
14
14
19
194
Nr.
vrsta
menarha
subiect
26
50
12
27
50
14
28
49
14
6. ntr-un studiu cuprinznd cazuri de stenoz, s-au msurat valorile
IMT maxim i valoarea sistolic la diveri pacieni. Se pune problema
exist o legtur ntre valoarea sistolic i valoarea IMT maxim ?
Datele colectate n urma efecturii studiului sunt prezentate n tabelul
urmtor.
Valoarea
Nr.
IMT
sistolic
subiect
maxim
a tensiunii
arteriale
1
1,6
150
2
1,7
175
3
1,5
160
4
1,5
175
5
1,5
145
6
2,1
155
7
1,9
180
8
2,1
145
9
1,6
145
10
1,6
170
11
1,9
155
12
2,3
165
13
1,8
160
S se reprezinte grafic datele din tabel.
7. O companie farmaceutic a ncercat s evalueze relaia dintre doza
ingerat a unui nou medicament hipnotic i durata somnului. Datele
culese n urma studiului sunt prezentate n tabelul de mai jos. Exist o
legtur linear ntre aceste dou variabile?
195
Anexa 3
Nr.
subiect
durata
somnului
(ore)
1
4
2
6
3
5
4
9
5
8
6
7
7
13
8
11
9
9
S se reprezinte grafic datele din tabel.
doza
(mM/kg)
3
3
3
10
10
10
15
15
15
196
greutate
1
2
3
7
6
8
10
5
9
4
sptmna
26
27
28
28
29
29
30
31
31
31
32
32
32
33
33
34
34
35
35
36
37
197
greutatea
700
1050
1200
1230
1300
1325
1500
1600
1645
1640
1900
1920
1915
2100
2160
2300
2350
2500
2550
2700
2800
Anexa 4
Studiul influenei unor factori de risc biologici infecia cu Helicobacter pylori n apariia unor limfoame
maligne (limfoame nonHodgkin LNH) n cazul populaiei
judeului Mure [22]
Ipoteza de lucru
198
199
Anexa 4
Diagnosticul
de
limfom
nonHodgkin
confirmat
clinic
Lot cu LNH
Brbai
Femei
81
44
37
100 %
54,32 %
45,68 %
45,68%
54,32%
Brbai
Femei
200
Lot cu LNH
Urban
Rural
81
35
46
100 %
43,20 %
56,80 %
56,80%
43,20%
Urban
Rural
reziden
La pacienii cu LNH infecia cronic cu Helicobacter pylori este
201
Anexa 4
Infecia cu H.pylori+
Nr.cazuri LNH
Procente
Masculin
34
59,65 %
Feminin
23
40,35 %
Urban
22
38,60 %
Rural
35
61,40 %
procent ridicat, dar valoarea acestuia este totui mai mic, de 60,49 % n
comparaie cu cea a lotului cu LNH respectiv 70,37 %. Dintre pacienii
serpozitivi ai lotului de control, 29 au fost de sex masculin, iar 20 de sex
feminin; 13 proveneau din mediul rural i 36 din urban.
Tabel A4.4. Caracteristicile cazurilor seropozitive din lotul martor
Infecia cu H.pylori+
Nr.cazuri martor
Procente
Masculin
29
59,18 %
Feminin
20
40,82 %
Urban
36
73,47 %
Rural
13
26,53 %
202
Expune
re
(Infecia
cu
57
203
49
Anexa 4
Nu
24
32
HELICOBACTER
PYLORI)
Expunere
(Infecia cu
34
29
Nu
10
15
204
HELICOBACTER
PYLORI)
Expunere
(Infecia cu
23
20
Nu
14
17
Expune
re
(Infecia
cu
22
205
36
Anexa 4
Nu
13
20
HELICOBACTER
PYLORI)
Expunere
(Infecia cu
35
13
Nu
11
12
Concluzii
207
Anexa 5
1.
2.
3.
4.
5.
6.
7.
8.
9.
10.
11.
12.
13.
14.
15.
16.
17.
18.
19.
20.
21.
22.
23.
24.
25.
26.
27.
28.
161,
4
18.5
10,1
7,71
6,61
5,99
5,58
5,32
5,12
4,96
4,84
4,75
4,67
4.60
4,51
4,49
4,45
4,41
4,38
4,35
4,32
4,30
4,28
4,26
4,24
4,22
4,21
4,20
199,
5
19,0
9,55
6,94
5,79
5,14
4,74
4,16
4,26
4,10
3,98
3,88
3,80
3,74
3,68
3,63
3,59
2,55
3,52
3,49
3,47
3,44
3,42
3,40
3,38
3,37
3.35
3,34
215,
7
19,1
9,28
6,50
6,41
4,76
4,35
4,07
3,86
3,71
3,59
3,49
3,41
3,34
3,29
3,24
3,20
3,16
3,13
3,10
3,07
;
3,03
3,01
2,09
2,98
2,96
2,95
224,
6
19,2
9,12
6,39
5,19
4,53
4,12
3,84
3,63
3,48
2,38
3,26
3,18
3,11
3,06
3,61
2,96
2,93
2,90
2,87
2,84
2,92
2,80
2,78
2,76
2,74
2,73
2,71
230,
2
19,3
9,01
6,26
5,05
4,39
3,97
3,69
3,48
3,33
3,20
3,11
3,02
2,96
2,90
2,85
2,81
2,77
2,74
2,71
2,68
2,66
2,64
2,62
2,80
2,59
2,57
2,56
234,
0
19,3
8,94
6,16
4,95
4,28
3,87
3,14
3,37
3,22
3,09
3,00
2,92
2,85
2,79
2,74
2,70
2,66
2,63
2,60
2,57
2,55
2,53
2,51
2,49
2,47
2,46
2,41
208
F corespunztoare
8
238,
9
19,3
8,84
6,04
4,82
4,15
3,73
3,28
3,23
3,07
2,95
2,85
2,77
2,70
2,74
2,59
2,55
2,51
2,48
2,45
2,42
2,40
2,38
2,36
2,34
2,32
2,30
2,29
12
24
00
213,
9
19,4
8,71
5,91
4,68
4,00
3,57
3,28
3,07
2,91
2,79
2,69
2,60
2,53
2,48
2,42
2,38
2,34
2,31
2,28
2,25
2,23
2,20
2,18
2,16
2,15
2,13
2,12
249,
0
19,4
8,64
5,77
4,53
8,84
3,41
3,12
2,90
2,74
2,61
2,50
2,42
2,35
2,29
2,24
2,19
2,15
2,11
2,08
2,05
2,03
2,00
1,98
1,96
1,95
1,93
1,91
254,
3
19,5
8,53
5,83
4,36
3,67
3,23
2,93
2,71
2,54
2,40
2,30
2,21
2,13
2,07
2,01
1,96
1,92
1,88
1,84
1,81
1,78
1,76.
1,73
1,71
1,69
1,67
1,65
Anexa 5
29.
30.
40
60
120
4,18
4,17
4,08
4,00
3,92
3,81
3,33
332
3,23
3,15
3,07
2,99
2,93
2,92
2,84
2,70
2,68
2,60
2,70
2,69
2,61
2,52
2,45
2,37
2,54
2,53
2,45
2,37
2,29
2,21
209
2,43
2,42
2,34
2,25
2,17
2,09
2,28
2,27
2,18
2,10
2,02
1,94
2,10
2,09
2,00
1,92
1,83
1,75
1,90 1,64
1,89 1,62
1,79 1,51
1,70 1,39
1,61 1,25
1,52 1,00
Anexa 6
a
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
35
40
45
50
0,50
0,20
0,10
0,05
0,02
0,01
0,002
0,001
0,0001
1,000
0,816
0,765
0,741
0,727
0,718
0,711
0.706
0,703
0,700
0,697
0,695
0,694
0,692
0,691
0,690
0,689
0,688
0,688
0,687
0,686
0,686
0,685
0,685
0,684
0,684
0,684
0,683
0,683
0,683
0,682
0,681
0,680
0,679
3,078
1,886
1,638
1,533
1,476
1,440
1,415
1,397
1,383
1,372
1,363
1,356
1,350
1,345
1,341
1,337
1,333
1,330
1,328
1,325
1,323
1,321
1,319
1,318
1,316
1,315
1,314
1,313
1,311
1,310
1,306
1,303
1,301
1,299
6,314
2,290
2,353
2,132
2,015
1,943
1,895
1,860
1,833
1,812
1,796
1,782
1,771
1,761
1,753
1,746
1,740
1,734
1,729
1,725
1,721
1,717
1,714
1,711
1,708
1,706
1,703
1,701
1,699
1,697
1,690
1,684
1,679
1,676
12,70
6
4,303
3,182
2,77
2,571
2,44
2,365
2,30
2,262
2,228
2,201
2,17
2,16
2,145
2,131
2,12
2,11
2,101
2,093
2,086
2,080
2,07
2,069
2,06
2,060
2,05
2,052
2,04
2,045
2,042
2,030
2,021
2,01
4
2,009
31,821
6,965
4,541
3,747
3,365
3,143
2,998
2,896
2,821
2,764
2,718
2,681
2,650
2,624
2,602
2,583
2,567
2,552
2,539
2,528
2,518
2,508
2,500
2,492
2,485
2,479
2,472
2,467
2,462
2,457
2,438
2,423
2,412
2,403
63,657
9,925
5,841
4,604
4,032
3,707
3,499
3,355
3,250
3,169
3,106
3,102
3,055
2,977
2,947
2,921
2,898
2,878
2,861
2,845
2,831
2,819
2,807
2,797
2,787
2,779
2,771
2,763
2,756
2,750
2,724
2,704
2,690
2,678
318,309
22,327
10,214
7,173
5,893
5,208
4,785
4,501
4,297
4,144
3,025
3,930
3,852
3,787
3,733
3,686
3,646
3,610
3,579
3,552
3,527
3,505
3,485
3,467
3,450
3,435
3,421
3,408
3,396
3,385
3,340
3,307
3,281
3,261
636,618
31,598
12,924
8,610
6,869
5,959
5,408
5,041
4,781
4,587
4,437
4,318
4,221
4,140
4,073
4,015
3,965
3,922
3,883
3,850
3,819
3,792
3,767
3,745
3,725
3,707
3,690
3,674
3,659
3,646
3,491
3,551
3,520
3,496
6366,198
99,992
28,000
15,544
11,178
9,082
7,885
7,120
6,594
6,211
5,921
5,694
5,513
5,363
5,239
5,134
5,014
4,966
4,897
4,837
4,784
4,736
4,693
4,654
4,619
4,587
4,558
4,530
4,506
4,482
4,389
4,321
4,269
4,228
210
Anexa 6
60
70
80
90
100
120
200
500
1000
oo
n
a
i
0,679
0,678
0,678
0,677
0,677
0,677
0,676
0,675
0,675
0,675
0,25
1,296
1,294
1,292
1,291
1,290
1,289
1,286
1,283
1,282
1,282
0,10
1,671
1,667
1,664
1,662
1,660
1,658
1,653
1,648
1,646
1,645
0,05
2,00
1,994
1,990
1,987
1,984
1,980
1,972
1,965
1,962
1,960
0,025
2,390
2,381
2,374
2,368
2,364
2,358
2,345
2,334
2,330
2,326
0,01
2,660
2,648
2,639
2,632
2,626
2,617
2,601
2,586
2,581
2,576
0,005
3,232
3,211
3,195
3,183
3,174
3,160
3,131
3,107
3,098
3,090
0,001
211
3,460
3,435
3,416
3,402
3,390
3,373
3,310
3,310
3,300
3,290
0,0005
4,169
4,127
4,096
4,072
4,053
4,025
3,970
3,922
3,906
3,891
0,00005
Anexa 7
a
l
0,990
0,975
0,950
0,900
0,100
0,050
9,025
0,010
0,001
2,71
3,84
5,02
6,63
10,83
2
3
0,02
0,12
0,05
0,22
0,10
0,35
0,21
0,58
4,61
6,25
5.99
7,81
7,38
9,35
9,21
11,34
13,82
16,27
0,30
0,48
0,71
1,06
7,78
9,49
11,14
13,28
18,47
5
8
0,55
0,87
0,83
1,24
1,15
1,64
1,61
2,20
9,21
10,64
11,07
12,59
12,83
14,45
15,09
16,81
20,62
22,46
1,24
1,69
2,17
2,83
12,02
14,07
16,01
18,47
24,32
1,65
2,18
2,73
3,49
13,36
15,51
17,53
20,09
26,13
9
10
2,09
2,56
2,70
3,25
2,33
3.94
4,47
4,87
14,68
15,99
16,92
18,31
19,02
20,48
21,67
23,21
27,88
29,59
11
3,05
3,82
4,57
5,58
17,27
19,67
21,92
24,72
31,26
3,57
4,40
5,23
6,30
18,55
21,03
23,34
26,22
23,91
13
4,11
5,01
5,89
7,04
19,81
22,36
24,71
27,89
34,53
14
15
16
4,66
5,23
5,81
5,63
6,26
6,91
6,57
7,26
7,96
7,79
8,55
9,31
21,06
22,31
23,54
23,6?
25,00
26,30
26,12
7,49
8,84
29,14
30,58
32,00
36,12
37,70
39,25
17
18
6,41
7,01
7,56
8,23
8,67
9,39
10,08
10,86
24,77
25,99
27,59
28,87
30,19
31,53
33,41
34,80
40.79
42,31
19
20
7,63
8,26
8,91
9,59
10,12
10,85
11,65
12,44
27,20
28,41
30,14
31,41
32,85
34,17
36,19
37,57
43,82
45,32
21
8,90
10,28
11,59
13,24
29,61
32,67
35,48
38,93
46,80
22
9,54
10,98
12,34
14,04
30,81
33,92
36,78
40,29
48,27
23
10,20
11,69
13,09
14,85
32,01
35,17
38,08
41,64
49,73
24
10,86
12,40
13,85
15,66
33,20
36,41
39,37
42,98
51,18
25
11,52
13,12
14,61
16,47
34,38
37,65
40,65
44,31
52,62
212
Anexa 7
26
12,20
13,84
15,38
17,29
.35,56
38,88
41,92
45,64
54,05
27
12,88
14,57
16,15
18,11
38,74
40,11
43,19
46,96
55,48
28
13,57
15,31
16,93
18,91
37,92
41,34
44,46
48,28
56,89
29
14,26
10,65
17/71
19,77
39,09
42,56
43,72
49,59
58,30
14,95
16,79
18,19
20,60
40,26
43,77
46,98
50,89
59,70
30
213
Anexa 8
1. p = - 0,979 - corelate
2. p= - 0,949 - corelate
3. p = 0,135 - nu difer
3. p = 0,901 - corelate
4. p = - 0,092 - necorelate
214
Anexa 8
5. p = 0,985 - corelate
6. p = - 0,0128 - necorelate
7. p = 0,900 - corelate
8. p = 0,915 - corelate
9. p = 0,994 - corelate
215
Bibliografie selectiv
Bibliografie selectiv
1. *** - NIST/SEMATECH e-Handbook of Statistical Methods, 2005,
National Institute of Standards and Technology,
http://www.itl.nist.gov/div898/handbook/
2. *** - Farmacopeea Romn, ediia a-X-a, Editura Medical Bucureti
1993
3. *** - How Grubbs' test works, articol disponibil online pe website-ul
firmei GraphPad Software,
http://www.graphpad.com/library/BiostatsSpecial/article_39.htm
4. *** - Introduction to Epi principles, Innovations in Health Education
USA website, copyright Henry Ford Health System, 2004, carte
disponibil online pe website-ul IIHE,
http://www.iihe.org/education/lectures/epidemiology/default.htm
5. *** - Normality tests use with caution, articol disponibil online pe
website-ul firmei GraphPad Software,
http://www.graphpad.com/library/BiostatsSpecial/article_197.htm
6. Baker R. J. - Basic principles of statistical analysis, carte disponibil
online pe website-ul University of Saskatchewan, Canada,
http://homepage.usask.ca/~rjb609/stats.html
7. Baron T. et al. Statistic teoretic i economic, Editura Didactic i
Pedagogic, Bucureti, 1996
8. Dallal G.E. - The Little Handbook of Statistical Practice, 2001, carte
disponibil online pe website-ul Tufts University, USA
http://www.tufts.edu/~gdallal/LHSP.HTM
216
Bibliografie selectiv
217
Bibliografie selectiv
218