Sunteți pe pagina 1din 35

n aceast seciune scurt ne concentrm pe date continue,

ilustrind subiecte ce tin de construirea histogramelor,


statistici descriptive de baz i analiza de corelaie.

Histograme Avind un tabel de frecventa, facei clic pe


pictograma ChartWizard (aceea

cu mai multe bare colorate de pe standart toolbar, n partea


de sus). O cutie

apare cu opiuni (ca atunci cnd ai nvat s formeze un


grafic cu bare sau diagram radial);

selectai tipul de diagram coloan. Apoi, facei clic pe


urmtoarea.

- Pentru gama de date, evideniai coloana de frecven.


Acest lucru poate fi realizat prin

click pe prima observaie i trgnd mouse-ul pina la ultima


observaie.

Apoi, facei clic pe urmtoarea.

- Pentru a elimina GridLines, facei clic pe tab i debifai


caseta.pentru a sterge

, putei face acelai lucru folosind tab-ul legenda. acum,


facei clic pe butonul

finalizare.

- Problema este c exist nc spatiu. Pentru a scapa de


acestea, da dublu-clic pe

Pe o bar a graficului i un nou set de opiuni trebuie sa


apara. Dati click pe tabul

Opiuni i modificai limea spaiului de la 150-0.

Statisticile descriptive
- n primul rnd, facei clic pe celula pe care dorii s o
umpleti, apoi facei clic pe pictograma insereaza functia,
f *, prin care veti deschide o baxa cu o lista a functiilor
excell disponibile pentru utilizare.

utilizare.

- Elementul de care avei nevoie din aceast list este


statistic; dup ce dati clic pe acesta, o nou list va
aparea cu nume de funcii, fiecare pentru o procedur
de statistic concret.
- Urmtoarele sunt proceduri / nume pe care le nvm
n acest capitol (n ordine alfabetic):

AVERAGE: provides the sample mean, GEOMEAN:


furnizeaz geaometric mean ,MEDIAN: ofera proba mediana,
STDEV: furnizeaza deviatia standart , i VAR: furnizeaza
variaia. n fiecare

caz putei obine doar o singur valoare statistic pentru un


moment dat. n primul rnd, trebuie s introducei

intervalul care se contine in esantionul dumneavoastra: de


exemplu, D6: D20 (putei vedea ce

introduceti daca atrageti atentie pe bara de formule).


Calculatorul calcula si va introduce intr0o celula
preselectata valoarea numerica pentru statistica solicitat.

Coeficientul de corelaie al lui Pearson

- n primul rnd, facei clic pe celula pe care dorii s o


completai, apoi facei clic pe pictograma inser funcia,
f *, care dispune de o lista a funciilor excell disponibile
pentru utilizare.
- Elementul de care avei nevoie din aceast list este
statistic; dup ce dai clic, o nou list

apare cu nume de funcii, fiecare pentru o procedur de


statistic selectat. Facei clic pe CORREL,

pentru corelare.
n noua caset, deplasai cursorul pentru a complete in
rndul X i Y marcate ca array1 si array2.Calculatorul va
calcula valoarea numeric pentru statistica selectata,
coeficientul de corelatie al lui Pearson, ntr-o celul
preselectat.

Exerciii

2.1 Tabelul E2.1 furnizeaz valorile nivelului de colesterol


pentru 1067 brbai din S.U.A. cu vrsta cuprins ntre 25 i
34 ani.

TABELUL pag
92
(a) Construii histograma,poligonul de frecven, i
graficul frecvenei cumulative
(b) Gsii, aproximativ, mediana utiliznd graficul frecvenei
cumulative
grafic.

2.2 Tabelul E2.2 furnizeaz frecvenele relative ale concentraiilor


de plumb din sange
pentru dou grupuri de muncitori din Canada, unul examinat n
1979 i cellalt n 1987.

Tabelul 2 pag 92
(a) Trasai histograma i frecvena poligonului
pentru fiecare an pe grafice separate
(B) Se traseaz dou grafice de frecven cumulative ntr-o
singur figur.
(C) Gsii i comparai medianele.
2.3 Un studiu privind efectele exerciiilor fizice asupra ciclului
menstrual furnizeaz
urmtoarele vrste (ani) ale menoree (nceputul menstruaiei)
pentru
96 nottoare care au nceput antrenarea nainte de menoree.

TABEL PAG 93 NR 1
(A) Formai o distribuie a frecvenei, inclusiva frecvenelor
relative i frecvenele relative cumulate.
(B) Traai poligonul de frecven i graficul frecvenei cumulative.
(C) Gsii mediana i percentila 95th.
2.4 Urmtoarele sunt vrstele menoreei (n ani) a 56 de nottoare
care au nceput de antrenarea dup ce au avut menoree.

Tabel pag 93 nr 2
(A) Formai o distribuie a frecvenei folosind aceleai intervale de
vrst ca i n Exercitiul 2.3. (Aceste intervale pot fi diferite de
cele din exemplul2.3.)
(B) Afiai pe acelai grafic dou grafice de frecven cumulative,
unapentru grupul instruit nainte de menoree i unul pentru grupul
instruit dup menoree. Comparai aceste dou grafice i formulai
concluzia.

(C) Gsii mediana i percentila 95 i comparai-le cu rezultatele


Exercitiului 2.3.

2.5 Urmtoarele sunt aportul zilnic de grsime (grame) a unui


grup de 150 aduli masculi.

Tabel pag 94
(A) Formai o distribuie a frecvenei, inclusiv frecvenele relative
i
frecvenele relative cumulate.
(B) Trasai poligonul de frecven i investigai simetria
distribuiei.
(C)Trasai graficul de frecven cumulativ i gsii i a 25-a i a
75-a percentila. Deasemenea calculai the midrange = percentila
75- percentila 25. (Aceasta este o alt msur bun descriptiva a
variaiei, este similar cu the range, dar este mai puin afectat de
observaii extreme.)
2.6 Referitor la datele privind aportul zilnic de grsimi n Exercitiu
2.5.
(A) Se calculeaz media folosind date brute.
(B) Se calculeaz, aproximativ, media utiliznd tabelul frecvenei
obinutn Exerciiu 2.5.
2.7 Folosind datele de venit din Exemplul 2.5:
(A) Se traseaz histograma pentru familiile albe. Are aceeai
form ca i cea pentru familiile ne-albe prezentate n Figura 2.5?
(B) Trasai i comparai acele dou grafice de frecven
cumulative, albi versus ne-albi confirmnd rezultatele prezentate
n figura 2.7.
(C) Compute, aproximativ, mediile celor dou grupuri i
compararezultatele cu medianele menionate la punctul 2.1.4.
2.8 Referitor la procentul saturaiei de bil pentru 31 de pacieni
de sex masculin n
Exemplul 2.4

(A) Calculati media, variaa i deviaia standard.


(B) Poligonul de frecven din figura 2.3 se bazeaz pe gruparea
(alegere arbitrara) prezentate n Tabelul E2.8. Trasai graficul
frecvenei cumulative i obinei, aproximativ, mediana din acest
grafic. Cum rspunsul se compara cu mediana exact (cea mai
mare, al aisprezecelea procent de saturaie)?

TABEL NR 1 PAG
95
2.9 Studiul citat n exemplul 2.4, de asemenea, furnizeaz date
(procentul de saturaie
de bil) pentru 29 de femei. Aceste procente au fost

tabelul nr2 pg 95

(A) Formai o distribuie a frecvenei folosind aceleai intervale ca i


n exemplul 2.4 i exerciiul 2.8.
(B) TRasai n acelai grafic i comparai cele dou poligoane de
frecven i graficele de frecven cumulative: brbai i femei.

(C) Calculati media, variana, abaterea standard i folosind aceste


date noi pentru femei comparai rezultatele cu cele pentru brbai n
Exercitiu 2.8.

(D) calculai i comparai cei doi coeficieni de variaie, brbai fa


de femei.

2.10 urmtoarea distribuie de frecven a fost obinut pentru


valorile preoperaionale procentuale ale hemoglobinei dintr-un grup
de subieci dintr-un sat n care a existat un program de eradicare a
malariei (MEP):

Tabel nr 2 pag 95
Rezultatele dintr-un alt grup obinute dup MEP:

Tabel nr pag 96

(A) Formai o distribuie a frecvenei folosind aceleai intervale ca i n


primul tabel.
(B) Trasai n acelai grafic i comparai cele dou grafice de frecven
cumulativ: nainte i dup programului de eradicare a malariei.
2.11 ntr-un studiu de poluare a apei, a fost luat o prob de midii i a fost
msurat concentraia de plumb (miligrame per gram/ greutate uscat)
pentru fiecare. S-au obinut urmtoarele date:
(113: 0; 140: 5; 163: 3; 185: 7; 202: 5; 207: 2g)
Calculai media x , variaia s2, i abaterea standard s.

2.12 Luai n considerare datele preluate dintr-un studiu care examineaz


rspunsul la ozon i dioxid de sulf n rndul adolescenilor care sufer de
astm. Urmtoarele sunt msurarile volumului expirator forat (litri) pentru
10 subieci:
(3: 50; 2:60; 2:75; 2:82; 04:05; 02:25; 2:68; 3:00; 04:02; 2:
85g )

Calculai media x, variana s2 i abaterea standard s.

2.13 Procentul de greutate corporal ideal a fost determinat pentru 18


diabetici insulino-dependent selectai aleator.
Rezultatele (%) sunt
Tabel nr 2 pa 96

calculai media x, variana s2 i abaterea standard s.

2.14 Un studiu privind greutatea la natere au oferit urmtoarele


date (n uncii) pentru 12 nou-nascuti:

(F112; 111; 107; 119; 92; 80; 81; 84; 118; 106; 103; 94g)

Calculai x media, variana s2 i abaterea standard s

2.15 Urmtoarele sunt valorile ale activitii (micromoli per minut per
gram de esut) a unei anumite enzime msurat n esutul gastric
normal pentru 35 pacieni cu carcinom gastric:

Tabel 1 pag 97

Calculai x media, variana s2 i abaterea standard s.


2.16 Datele prezentate n Tabelul 2.14 reprezint tensiunea
arterial sistolic a 15 femei (vezi exemplul 2.9). Calculai x
media, S2 variana, i abaterea standard pentru tensiunea
arterial sistolic si pentru varst.

2.17 vrstele (n zile) n momentul morii pentru probele a 11 fete


i 16 biei care au murit de sindromul morii infantile subite sunt
prezentate n tabelul E2.17. Calculai x media, s2 varian i
deviaia standard pentru fiecaregrup.

Tabel 2 pag 97
2.18 Un studiu a fost efectuat pentru a investiga dac cereale de
ovz ajut la reducerea colesterolului seric la brbaii cu un nivel
ridicat de colesterol. Paisprezece oamenii au urmat o dieta la
ntmplare care a inclus fie tre de ovz fie fulgi de porumb; dup
dou sptmni, au fost nregistrate nivelurile lipoproteinei cu
densitate joas (LDL). Fiecare om a trecut apoi la o cura de slabire
alternativa. Dup o a dou perioad de dou sptmni, nivelul de
colesterol LDL a fiecarei persoane a fost nregistrat din nou. Datele
sunt prezentate n Tabelul E2.18. calculati diferena LDL (porumb-
ovz) pentru fiecare dintre cei 14 brbai, apoi x media, s2 varian
i deviaia standard pentru aceast prob de diferen.

Tabel1 pag 98
2.19 Un experiment a fost efectuat la Universitatea din California-
Berkeley
pentru a studia efectul mediului psihologic asupra anatomia
creierului. Un grup de 19 obolani a fost mprii aleator n dou
grupuri. Doisprezece
animale din grupul de tratament au trit mpreun ntr-o cuc
mare, mobilat
cu playthings care au fost modificate zi de zi; animalele din
grupul de control
au trit n mod izolat, fr jucrii. Dup o lun, animalele
experimentale
au fost ucise i disecate. Tabelul E2.19 furnizeaz greutile
cortexului (partea ginditoare a creierului), n miligrame. Calculai
separat pentru fiecare grup medii x, s2 variana i abaterea
standard a greutii cortexului.

Tabel nr 2 pag 98

2.20 nivelurile de ozon n jurul Los Angeles-ului, au fost msurate ,


iar rezultatele obinute sunt la fel de mari ca 220 pri per miliard
(ppb). Concentraii att de mari pot provoca arderea ochilor i
sunt un pericol pentru viaa plantelor i animalelor. Dar ce putem
spune despre alte orae? Acestea sunt datele (ppb) a nivelului de
ozon obinut intr-o zona forestiera localizat n apropierea
or.Seattle, Washington

Tabel nr 1 pag 99
(ACalculai x, s2 i s; comparai media cu cea din Los Angeles.
(B) Calculai coeficientul de variaie.
2.21 a fost msurat tensiunea arterial sistolic (n mmHg) a 12
de femei cu vrste cuprinse ntre
20 i 35 nainte i dup administrarea unui nou contraceptiv oral
(Tabelul E2.21). Focusai-v pe coloana
Cu diferene din tabel; Se calculeaz media x, variana s2 i
standardulAbaterea s.

Tabel nr 2 pag 99

2.22 Un grup de 12 hemofilici, toi sub 41 de ani la momentul


seroconversiei HIV, au fost urmrii de incepnd cu momentul diagnosticrii
cu SIDA pn la moartea lor (n mod ideal, ar trebui s lum ca punct de
plecare momentul n care o persoan a contracte de SIDA, mai degrab
dect momentul n care pacientul este diagnosticat, dar aceast informa ie
nu este disponibil). Timpul de supravietuire (n luni) de la diagnostic pn
la moartea acestor hemofilici au fost: 2, 3, 6, 6, 7, 10, 15, 15, 16, 27, 30 i
32. Se calculeaz media, media geometric i mediana.
2.23 S presupunem c suntem interesai n studierea pacien ilor cu cancer
sistemic care dezvolta ulterior metastaze cerebrale; Scopul nostru final este
de a prelungi viaa lor prin controlul bolii. O prob de 23 astfel de pacien i
fiecare dintre ei fiind tratai cu radioterapie, au fost urmai
din prima zi a tratamentului lor pn la recurena
tumorii originale. Recurena este definit ca reapariia unei
metastaze n
exact acelai loc , sau, n cazul pacienilor a cror tumori nu au
disrut complet
niciodata , extinderea leziunii iniiale. Timpul reaparitia
(n sptmni) pentru cei 23 de pacieni au fost: 2, 2, 2, 3, 4, 5, 5,
6, 7, 8, 9, 10,
14, 14, 18, 19, 20, 22, 22, 31, 33, 39 i 195. Se calculeaz media,
media geometric, i median.

2,24 Un investigator de laborator, interesat n relaia dintre


alimentaie i
dezvoltarea tumorilor a mprit 90 obolani n trei grupe i i-a
hrnit
cu diete cu coninut sczut de grsimi, cu grsimi saturate i
respectiv cu grasimi nesaturate.
obolanii sunt de aceeai vrst si specie i in condiii fizice
similare. O cantitate identic de celule tumorale a fost injectat
pad de picior fiecrui obolan. Timpul tumoral liber este timpul de
la injectarea tumorii pn la momentul n care o tumoare se
dezvolta. Toi cei 30 de obolani din grupul de diet cu grsimi
nesaturate
a dezvoltat tumori; Timpul tumoral liber (n zile) au fost: 112, 68,
84, 109, 153, 143, 60, 70, 98, 164, 63, 63, 77, 91, 91, 66, 70, 77,
63, 66,
66, 94, 101, 105, 108, 112, 115, 126, 161 i 178. Se calculeaz
media,
media geometric i mediana.
2.25 Datele prezentate n tabelul E2.25 sunt dintr-un studiu care
compar adolesceni
care au bulimie cu adolesceni sntoi cu compoziiea corpului
i nivelurile de activitate fizic similare. Tabelul prevede msuri a
aportul caloric zilnic (kcal / kg) pentru eantioane aleatorii a 23 de
adolesceni cu bulimie
si a 15 adolesceni sntoi.

Tabel 1 pag 100


(A) Se calculeaz i se compar mediile.
(B) Se calculeaz i se compar varianele.
2.26 Dou medicamente, amantadin (A) i rimantadina (R), sunt studiate
pentru a fi utilizai n combaterea virusului gripal. O singur doz de 100 mg
este administrat oral la aduli sntoi. Variabila de rspuns este timpul
(minute) necesar pentru a atinge concentraia maxim. Rezultatele sunt
prezentate n tabelul E2.26.

Tabel nr 1 pag 101


(A) Se calculeaz i se compar mediile.
(B) Se calculeaz i se compar varianele i abaterile standard.
(C) Se calculeaz i se compar medianele.
2.27 Datele sunt prezentate n Tabelul E2.27 pentru dou grupuri
de pacieni care au murit de
leucemie mielogen acut. Pacientii au fost clasificai n dou
grupuri
n funcie de prezena sau absena unei caracteristici morfologice
a
Celulelor albe. Pacientii numiti AG pozitive au fost identificate prin
prezena
de tije Auer i / sau granulaii semnificative a celulelor leucemice
in
mduv osoas de la momentul diagnosticului. Pentru pacienii
AG-negativi, aceti factori au fost
abseni. Leucemia este un cancer caracterizat printr-o proliferare
excesiva a
celulelor albe; cu ct este mai mare numrul de globule albe
(WBC), cu att mai sever este boala

Tabel nr 2 pag 101

(A) Se calculeaz separat pentru fiecare grup (AG pozitiv i negativ AG) x
medii, s2 varian i deviaia standard pentru timpul de supravie uire.
(B) Se calculeaz separat pentru fiecare grup (AG pozitiv i negativ AG)
media, media geometric i mediana pentru Numrul de leucocite.

2.28 Consultai datele privind tensiunea arterial sistolic (mmHg) a 12


femei din Exerciiu 2.21. Calculai coeficientul de corelatie al lui Pearson,
Kendall tau, si Spearman rho rank coeficient de corela ie reprezentnd
puterea relaiei dintre tensiunea arterial sistolic msurat naintea i
dup administrarea contraceptivelor orale.

2.29 Urmtoarele sunt nlimile (msurate la cel mai apropiat de 2 cm) i


greutile (Msurat la cel mai apropiat kilogram) pentru 10 brbai i 10
femei. Pentru brbai
Tabel nr 1 pag 102
(A) Desenai o diagram de dispersie, pentru brbai i femei
separat, pentru a arta
asociaia, dac este cazul, ntre nlime i greutate.
(B) Calculati coeficientul de corelaie al lui Pearson , Kendall tau si
rho rank correlation coeficient al lui Spearman pentru e nlime
i greutate pentru brbai i femei separat.

2.30 Tabelul E2.30 furnizeaz asigurarea netp cu produse


alimentare (x, numrul de calorii per
persoan pe zi), i rata mortalitii infantile (y, numrul de sugari
Tabel nr 2 pag 102
Decedai per 1000 nou- nscui-vii) pentru anumite ri
selectate, nainte de al doilea rzboi mondial.
(A) Desenai o diagram de dispersie pentru a arta asociaia,
dac exist, ntre
ntre numrul mediu zilnic de calorii per persoan i
rata mortalitii infantile.
(B) Calculati coeficientul de corelaie al lui Pearson , Kendall tau si
rho rank correlation coeficient al lui Spearman

2.31 ntr-un test de heparin, un preparat standard, este


comparat cu un test
Preparat prin observarea timpilor de coagulare log (y, n secunde)
a sngelui
coninnd doze diferite de heparin (x este doza log) (Tabelul
E2.31).
Replicate de lectur sunt efectuate la fiecare nivel de doz.
Tabel nr 1 pag
103
(A) Desenai o diagram de dispersie pentru a arta asociaia, dac exist,
ntre ntre timpii de coagulare log i doza log separat pentru preparatul
standart i preparatul de testat. Par ei a fi liniari ?
(B) Se calculeaz coeficientul de corelare Pearson pentru timpi de
coagulare log i log doz, separat pentru preparatul standard i preparatul
de testat. Par ei a fi diferii?

2.32 Atunci cnd un pacient este diagnosticat cu cancer de prostata, o


ntrebare important cu privire la strategia de tratament, este dac cancerul
s-a extins la ganglionii limfatici vecini. Intrebarea este att de critic n
prognosticul i tratamentul pacientului inct este necesar de a performa o
laparotomie pentru simplul scopde a examina noduluii si a efectua o
biopsie a tesutului pentru a fi examinat la microscop. Cu toate acestea,
anumite variabile care poate fi msurate fr o interven ie chirurgical sunt
predictive pentru implicarea nodulilor; i scopul studiului prezentat aici a
fost de a examina date pentru pacienii cu cancer de prostat 53 care
primesc o intervenie chirurgical, pentru a determina care dintre cele cinci
variabile preoperatorii sunt predictive pentru implicarea nodulilor. Tabelul
E2.32 prezint setul complet de date. Pentru fiecare dintre cei 53 de
pacienti ,
exist dou variabile independente continue (adic, factori preoperator),
varsta la care a fost efectuata diagnoza si nivelul seric al acidului fosfatazei
(*100; fiind 'Acid) i trei variabile binare: lectura razelor X, lectura
patologiei (Grad) a unei biopsii a tumorii obinut prin ac nainte de
intervenia chirurgical, i o msur aproximativ a mrimii i localizrii
tumorii (etapa ) obinut prin palparea cu degetele prin rect. Pentru aceste
trei variabile binare independente, o valoare de 1 semnific un rezultat
pozitiv sau o etapa grav i 0 denot o constatare negativ sau mai pu in
grav. In plus a asea coloan prezint constatarea opera iei chirurgicale
rezultatul primar de interes, care este binar, o valoare de 1 ce denot
implicarea nodale, i valoarea 0 indic nici o implicare ganglionar gsit in
timpul interveniei chirurgical.

TABLE E2.32

Raz
eX X-

Gradul Stadiul Vrsta Acid Noduli ray Gradul Stadiul Vrsta Acid Noduli
0 1 1 64 40 0 0 0 0 60 78 0

0 0 1 63 40 0 0 0 0 52 83 0

1 0 0 65 46 0 0 0 1 67 95 0

0 1 0 67 47 0 0 0 0 56 98 0

0 0 0 66 48 0 0 0 1 61 102 0

0 1 1 65 48 0 0 0 0 64 187 0

0 0 0 60 49 0 1 0 1 58 48 1

0 0 0 51 49 0 0 0 1 65 49 1

0 0 0 66 50 0 1 1 1 57 51 1

0 0 0 58 50 0 0 1 0 50 56 1

0 1 0 56 50 0 1 1 0 67 67 1

0 0 1 61 50 0 0 0 1 67 67 1

0 1 1 64 50 0 0 1 1 57 67 1

0 0 0 56 52 0 0 1 1 45 70 1

0 0 0 67 52 0 0 0 1 46 70 1

1 0 0 49 55 0 1 0 1 51 72 1

0 1 1 52 55 0 1 1 1 60 76 1

0 0 0 68 56 0 1 1 1 56 78 1

0 1 1 66 59 0 1 1 1 50 81 1

1 0 0 60 62 0 0 0 0 56 82 1

0 0 0 61 62 0 0 0 1 63 82 1

1 1 1 59 63 0 1 1 1 65 84 1

0 0 0 51 65 0 1 0 1 64 89 1

0 1 1 53 66 0 0 1 0 59 99 1

0 0 0 58 71 0 1 1 1 68 126 1

0 0 0 63 75 0 1 0 0 61 136 1

0 0 1 53 76 0
Note: This is a very long data file; its electronic copy, in a Web-based form, is available from
the author upon request.

n exerciiul 1.46, am investigat efectele celor trei variabile


preoperatorii binare (raze X, grad i stadiu); n acest exerciiu, ne
vom focusa asupra efectele celor doi factori continuu (vrsta i
fosfataza acid). Cei 53 de pacieni sunt mprii n dou grupe in
dependen de constatarea dup chirurgie, un grup cu implicare
ganglionar i un grup fr (notat cu 1 sau 0 n coloana a asea).
Pentru fiecare grup i pentru fiecare dintre cei doi factori vrsta la
momentul diagnosticrii i nivelul fosfatazei acide serice, se
calculeaz x media, s2 varian i deviaia standard s.

2.33 Referii-v la datele privind cancerul de prostata din Exercitiul


2.32. Investigai relaia dintre vrsta la momentul diagnosticrii i
nivelul de fosfataza acid seric prin calcularea coeficientului de
corelaie Pearson i formulai concluzia. Repetai aceast analiz,
dar analizai datele separat pentru cele dou grupuri, grupul cu
implicare nodal i grupul fr. Are oare implicarea nodale vre-un
efect asupra acestei relaii?

2.34 Un studiu a fost ntreprins pentru a examina datele pentru 44 de


medici care lucreaz ntr-un departament de urgenta la un spital , astfel
nct s se determine care dintre factori coreleaz cu numrul de plngeri
depuse pe parcursul acestui an. n plus fa de numrul plngerilor,
datele disponibile constau n numrul de vizite, care servete ca
dimensiunea pentru unitatea de observare, medicul i ali patru
factori
sub investigatie. Tabelul E2.34 prezint setul complet de date.
Pentru fiecare dintre cele 44 de medici exist doi factori
explanatory continue,venitul( dolari pe or) i volumul de lucru la
serviciul de urgen (ore), i dou variabile binare, gen (feminin /
masculin) i formri pentru rezideniat n domeniul serviciilor de
urgen (nu / da). Se mparte numrul de plngeri la numrul de
vizite i se folosete acest raport (numr de plngeri per vizita) ca
rezultat final primar sau X.

(A) Pentru fiecare dintre cei doi factori binare, sexul (feminin /
masculin) i formarea rezidenilor n serviciile de urgen (nu /
da), care mparte cei 44 de medici n dou subgrupuri s zicem,
brbai i femei s se calculeze
x deviaia medie i deviaia standard s pentru rezultatul final X.
(B) Investigai relaia dintre rezultat, numrul de plngeri per vizit
, i fiecare dintre doi factori explanatory continue,venitul ( dolari
pe or) i volumul de lucru la serviciul de urgen (ore), prin
calcularea coeficientului de corelaie Pearson i formulai
concluzia.

(C) Desenai o diagram de dispersie pentru a arta asociaia,


dac exist, ntre numrul de plngeri pentru fiecare vizit i
volumul de munc . Este liniar?
106 DESCRIPTIVE METHODS FOR CONTINUOUS DATA

TABLE E2.34

No. of Visits Complaint Residency Gender Revenue Hours

2014 2 Y F 263.03 1287.25

3091 3 N M 334.94 1588.00

879 1 Y M 206.42 705.25

1780 1 N M 226.32 1005.50

3646 11 N M 288.91 1667.25

2690 1 N M 275.94 1517.75

1864 2 Y M 295.71 967.00

2782 6 N M 224.91 1609.25

3071 9 N F 249.32 1747.75

1502 3 Y M 269.00 906.25

2438 2 N F 225.61 1787.75

2278 2 N M 212.43 1480.50

2458 5 N M 211.05 1733.50

2269 2 N F 213.23 1847.25

2431 7 N M 257.30 1433.00

3010 2 Y M 326.49 1520.00

2234 5 Y M 290.53 1404.75


2906 4 N M 268.73 1608.50

2043 2 Y M 231.61 1220.00

3022 7 N M 241.04 1917.25

2123 5 N F 238.65 1506.25

1029 1 Y F 287.76 589.00

3003 3 Y F 280.52 1552.75

2178 2 N M 237.31 1518.00

2504 1 Y F 218.70 1793.75

2211 1 N F 250.01 1548.00

2338 6 Y M 251.54 1446.00

3060 2 Y M 270.52 1858.25

2302 1 N M 247.31 1486.25

1486 1 Y F 277.78 933.75

1863 1 Y M 259.68 1168.25

1661 0 N M 260.92 877.25

2008 2 N M 240.22 1387.25

2138 2 N M 217.49 1312.00

2556 5 N M 250.31 1551.50

1451 3 Y F 229.43 973.75

3328 3 Y M 313.48 1638.25

2927 8 N M 293.47 1668.25

2701 8 N M 275.40 1652.75

2046 1 Y M 289.56 1029.75

2548 2 Y M 305.67 1127.00

2592 1 N M 252.35 1547.25

2741 1 Y F 276.86 1499.25

3763 10 Y M 308.84 1747.50


Note: This is a very long data file; its electronic copy, in a Web-based form, is avail-able
from the author upon request.

2.35 Au fost momente cnd oraul din Londra, Anglia, a avut


perioadele de cea dens. Tabelul E2.35 prezint astfel de date
pentru o perioad foarte sever de 15-zile, inclusiv numrul de
decese n fiecare zi (y), media de fum atmosferic (x1, n mg / m3),
i valoarea medie a Coninutuui de dioxid de sulf atmosferic
(x2, n ppm)

TABLE E2.35

Number of Deaths Smoke Sulfur Dioxide

112 0.30 0.09

140 0.49 0.16

143 0.61 0.22

120 0.49 0.14

196 2.64 0.75

294 3.45 0.86

513 4.46 1.34

518 4.46 1.34

430 1.22 0.47

274 1.22 0.47

255 0.32 0.22

236 0.29 0.23

256 0.50 0.26

222 0.32 0.16

213 0.32 0.16


Calculai coeficientul de corelaie al lui Pearson pentru Y si X1

Calculai coeficientul de corelaie al lui Pearson pentru Y si X2

3
Probabilitatea i Modele de probabilitate

3.1 PROBABILITATE

O mare parte din capitolul 1 trateaz proporiile. O proporie este


definit pentru a reprezenta dimensiunea relativ a poriunii unei
populaii cu o anumit caracteristic (binar) . De exemplu,
prevalena bolii este proporia populaiei ce manifest o boala. n
mod similar, putem vorbi despre proporia de reactors pozitivi ntr-un
anumit test de screening, proporia de brbai n colegii, i aa mai
departe. Proporia este utilizat ca o msur descriptiv pentru o
populaie int n legtur cu o caracteristic binar sau dihotomic.
Aceasta este un numr ntre 0 i 1 (sau 100%); cu ct mai mare este
numrul, cu att mai mare este subpopulaia cu chacteristic [De
exemplu, 70% de sex masculin nseamn mai muli brbai (peste
50%)].
Acum, luai n considerare o populaie cu o anumit caracteristic
binar. O selecie ntmpltoare este definit ca una n care fiecare
persoan are anse egale de a fi selectat. Care este ansa ca o
persoan cu caracteristic va fi selectat (de exemplu, posibilitatea
de a selecta, s zicem, o persoan bolnav)? Rspunsul depinde de
mrimea subpopulaiei la care el sau ea aparine (adic, proporie).
Cu cat mai mare este proporia,cu att mai mare ansa (a unei astfel
de persoane s fie selectat). Aceast ans este msurat prin
proporie, un numr ntre 0 i 1, numit probabilitatea. Proporia
msoar dimensiunea; este o statistic descriptiv. Probabilitatea
msoar ansa. Cnd suntem preocupai de rezultat (nc incert la
aceast etap), cu o selecie aleatoare, o proporie (static, fr
aciune) devine o probabilitate (aciune pe cale s fie executat).
Gndii-v la acest simplu exemplu despre o cutie care conine 100
de crmizi, 90 dintre ele roii i celelalte 10 albastru. Dac
ntrebarea este: ? Sunt blocuri de crmid roie n caseta,
cineva care a vzut coninutul cutiei ar rspunde -'90%.Dar dac
ntrebarea este:Dac eu iau o crmid la ntmplare, crezi c ar fi
una roie?, rspunsul ar

fie -'90% anse Primele 90% reprezint o proporie; celelalte 90%


indic probabilitatea. n plus, dac continum s lum selecii
aleatorii (Numite eantioane repetate), frecvena relativ pe termen
lung acumulat cu care are loc un eveniment (adic caracteristic
care trebuie observat) este egal cu proporia subpopulaiilor cu
acea caracteristic. Din cauza acestei observaie, proporia i
probabilitatea sunt uneori utilizate n acelai context. n seciunea
urmtoare avem de a face cu conceptul de probabilitate i unele
aplicaii simple n luarea deciziilor de sntate.

3.1.1 Certitudinea impreciziei

Chiar i tiina este incert. Oamenii de tiin dau gre uneori. Ei


fac diferite concluzii
n multe domenii diferite: efectul unui anumit ingredient alimentar
sau a unui nivel sczut de radioactivitate, rolul grsimilor n dietele,
i aa mai departe. Multe studii nu sunt concludente. De exemplu,
mult timp chirurgii au crezut c o mastectomie radical este singurul
tratament pentru cancerul de san. Mai recent, studiile clinice atent
proiectate au aratat tratamente mai puin drastice par a fi la fel de
efective.

De ce tiina nu este ntotdeauna una sigur? Natura este complex


i plin de variabilitate biologic inexplicabil. n plus, aproape toate
metodele de observaie i experiment sunt imperfecte. Observatorii
sunt supui la erori umane. tiina este o poveste continu;
subiectele variaz; msurile fluctueaz.

tiina biomedical, n particular, conine controverse i dezacord; cu


cele mai bune intenii, datele biomedicale, examinarile fizice,
interpretri ale testelor clinice, descrieri ale simptomelor i bolilor
sunt oarecum inexacte. Dar, cel mai important dintre toate,
ntotdeauna avem de a face cu informaie incomplet:Studiul unei
populatii ntregie este fie imposibil, fie prea costisitor, fie consuma
prea mult timp; de multe ori trebuie sa ne bazm pe informa ii
dobndite dintr-o prob, care este, un subgrup din populaia sub
investigare. Deci, o oarecare incertitudine predomin aproape
ntotdeauna. tiin i oameni de tiin elimin incertitudinea prin
utilizarea conceptului de probabilitate. Prin calcularea probabilitii ei
sunt capabili s descrie ceea ce s-a ntmplat i prezic ce s-ar
putea ntmpla n viitor, n condiii similare.

3.1.2 Probabilitatea

Populaia int a unui efort de cercetare specific este ntregul set de


subieci pentru care cercetarea este facut. De exemplu, ntr-un
screening pentru cancer ntr-o comunitate, populaia int consista
din toate persoanele in acea comunitate care sunt in zona de risc.
. Pentru un singur tip de cancer, populaia int ar putea fi toate
femeile cu vrsta peste 35 de ani; pentru un alt tip, to i brba ii cu
vrsta de peste 50 de ani.

Probabilitatea unui eveniment, cum ar fi aceea ca un test de


screening s fie pozitiv, ntr-o populaie int este definit ca
frecvena relativ (adic proporia) cu care

evenimentul are loc n aceast populaie int. De exemplu,


probabilitatea de a avea o boal este prevalena bolii. Pentru un alt
exemplu, s presupunem c

din N 1/4 100, 000 de persoane dintr-o anumit populaie int, un


total de 5500 au reacionat pozitiv la un anumit test de screening;
atunci probabilitatea de a reaciona pozitiv, notat cu Prpositive,
este

5500
P (positiv) =
100;000

= 0,055 sau 5:5%


O probabilitate este astfel o msur descriptiv pentru o populaie int cu privire la un
anumit eveniment de interes. Acesta este un numr ntre 0 i 1 (sau zero, i 100%); cu
ct este mai mare numrul, cu att mai mare subpopulaie. Pentru cazul msurrii
continue, avem probabilitatea de a fi ntr-un anumi interval. De exemplu, probabilitatea
unui nivel seric de colesterol ntre 180 i 210 (mg / 100 ml) este propor ia de oameni
ntr-o anumit populaie int care au un nivel de colesterol care se ncadreaz ntre 180
i 210 (mg / 100 ml). Asta este msurat, n contextul histogramei capitolului 2, prin aria
unui bar dreptunghiular pentru clasa (180-210). Acum, de o importan critic este
Inter-pretarea probabilitii este conceptul de eantionare aleatorie, astfel nct s se
asocieze conceptul de probabilitate cu cel de incertitudine i de ans.S presupunem ca
marimea intei populaiei inte este N (de obicei, un numr foarte mare), un e antion
este orice subset-sa zicem, n n numr (n<N) a populaiei int.

O eantionare aleatorie simpl din populaia int este de prelevare a probelor, astfel
nct fiecare

posibil eantion de mrime n are anse egale de selecie. Pentru eantionarea aleatorie
simpl:

1. Fiecarl tragere la sori este incert n ceea ce privete orice eveniment sau
caracteristica sub investigare (de exemplu, avnd o boal), dar

2. La prelevarea de probe repetate din populaie, the accumulated long-run relative


frequency cu care un eveniment are loc este frecvena relativ de populatie a
evenimentului

Procesul fizic de eantionare aleatorie poate fi efectuat dup cum urmeaz (sau n un
mod logic echivalent cu urmtoarele etape).

1, Se obine o list a tuturor subiecilor N n populaie. O astfel de list este denumit


un cadru al populaiei. Subiecii sunt astfel disponibili pentru o numrtoare arbitrar
(de exemplu, de la 000 la 999 N 1/4). Cadrul se bazeaz adesea pe n director y (telefon,
ora, etc.) sau pe nregistrrile spitaliceti.

2. O etichet este pregtit pentru fiecare subiect avnd un numr de 1; 2; ...; N.

3. Etichetele sunt plasate ntr-un recipient (de exemplu, o cutie) i se amestec bine.

4. O etichet este desenat orbete. Numrul de pe eticheta identific apoi subiectul din
populaie; acest subiect devine membru al eantionului.

Etapele 2 la 4 poate fi, de asemenea, puse n aplicare cu ajutorul unui tabel de numere
aleatoare (Anexa A). n mod arbitrar se alege o coloan din trei cadrane (sau coloan
din patru cadrane n cazul n care mrimea populaiei este mare) i un numr selectat
arbitrar n acea coloan servete pentru a identifica subiectul din populaie. n practic,
acest proces este computerizat.
Putem lega acum conceptele de probabilitate i de eantionare aleatorie dup cum
urmeaz. n exemplul de depistare a cancerului intr-o comunitate de N 1/4 100; 000
persoane, probabilitatea calculat de 0,055 este interpretat ca: Probabilitatea unei
persoane aleas aleatoriu din populaia int avnd un rezultat pozitiv al testului este
0.055 sau 5,5%. Raionamentul este dup cum urmeaz. Pe o remiz ini ial,
subiectul aleas poate sau nu poate reactiona pozitiv. Cu toate acestea, n cazul n care
acest proces de

Alegere n mod aleatoriu un subiect la un moment dat dintr-o populaie dat se repet
de mai multe ori, the accumulated long-run relative frequency of positive receptors in
the sample will aproximate 0,055.

3.1.3 Relaia statistic

Datele de la testul de depistare a cancerului din Exemplul 1.4 sunt reproduse aici In
Tabelul 3.1. n acest design, fiecare membru al populaiei este caracterizat prin dou
variabile: rezultatul testului X i adevratul statut al bolii Y. Urmnd definiia de mai sus
, probabilitatea unui rezultat pozitiv al testului, notat Pr (X= +) , este

516
Pr (X= +) =
24;103

= 0:021

i propabilitatea unui rezultat negative al testului, denoted Pr (X= - ), este

23;587
PrX
24;103

0:979

i similar, probabilitatea de a avea (Y= +) i de a nu avea (Y= -) bolile sunt


date de
TABLE 3.1

Test Result, X

Disease, Y Total

154 225 379

362 23,362 23,724

Total 516 23,587 24,103

379
PrY
24;103

0:015

23;724
PrY
24;103

0:985
Atragei atenia ca suma probabilitilor pentru fiecare vriabil este
unitatea

PrX PrX 1:0

PrY PrY 1:0

Acesta este un exemplu a regulii adugrii a probabilitilor pentru


evenimente care se exclud reciproc: Unul dintre cele dou evenimente
(X=+) sau (X=-)este adevrat pentru o persoan aleas n mod aleatoriu
dintr-o pulaie.

Apoi, putem calcula probabilitile asociate. Acestea sunt probabilit ile


pentru dou evenimente cum ar fi a avea boala si un test pozitiv care apar
simultan. Cu dou variabile, X i Y, exist patru condii ale rezultatelor i
probabilitile asociate sunt
154

24;10
PrX ; Y 3

0:006
362

24;10
PrX ; Y 3

0:015
225

24;10
PrX ; Y 3

0:009

i
23;36
2

24;10
PrX ; Y 3

0:970

A doua dintre cele patru probabiliti comune, 0.015, reprezint


probabilitatea unei personae aleas aleatoriu din populaia int s aib un
rezultat pozitiv al testului, dar fiind sntos (adic un fals pozitiv). Aceste
probabiliti asociate i

TABLE 3.2

Y Total

0.006 0.009 0.015

0.015 0.970 0.985

Total 0.021 0.979 1.00

Probabilitile marginale de mai sus, calculate separat pentru X i Y, sumate


i prezentate n Tabelul 3.2. Observai c cele patru probabilit i adugate la
unitate [adic, una dintre cele patru evenimente (X=+,Y=+) sau (X=+,Y=-)
sau (X=-,Y=+) sau (X=-,Y=-) este adevrat pentru un individ selectat
aleator din populaie]. De asemenea, reinei c probabilitile asociate n
fiecare rnd (sau coloana) adugate pn la probabilitatea marginal sau
univariat la marginea acelui rnd (sau coloana). De exemplu,

PrX ; Y PrX ; Y PrY

0:015
Considerm acum un al treilea tip de probabilitate. De exemplu,
senzitivitatea este exprimabil ca

154
sensitivity 379

0:406

calculat pentru evenimentul (X=+) folosind subpopulatia care are (Y=+)


Adic din numrul total de 379 de persoane cu cancer, proporia cu un
rezultat pozitiv al testului, este 0,406 sau 40,6%. Acest numr, notat cu
Pr(X=+/Y=+), se numete o probabilitate condiionat (Y = +) fiind
condiia) i este legat de celelalte dou tipuri de probabilitate:

PrX ; Y
PrX j Y

PrY

or

PrX ; Y PrX j Y PrY

n mod evident, dorim s distingem aceast probabilitate condi ionat,


Pr(X=+/Y=+), de probabilitatea marginal, Pr(X=+). Dac acestea sunt
egale,

PrX j Y PrX
cele dou evenimente (X=+) i (Y=+)se spune c sunt independente
(deoarece starea Y= + nu schimba probabilitatea c X =+) i avem
regula de multiplicare pentru probabilitile de evenimente
independente:

PrX ; Y PrX PrY

Dac cele dou evenimente nu sunt independente, ele au o rela ie


statistic sau s spunem c acestea sunt asociate statistic. Pentru
exemplul de screening de mai sus
PrX

0:021 PrX j Y

0:406

indicnd n mod clar o relaie statistic puternic [deoarece PrX Y j


0PrX ]. Desigur, este logic s aib o relaie statistic
puternic aici; n caz contrar, screening-ul este inutil. Cu toate acestea,
trebuie subliniat faptul c o asociere statistic nu nseamn neaprat c
exist o cauz i un efect. Numai cind o relaie este att de puternic i
repetat constant inct acest caz este cople itor, o rela ie statistic, mai
ales una observat dintr-un eantion (deoarece informaii privind
totalitatea populaiei este rareori disponibil), este doar un indiciu,ce
indic c este nevoie de studii adaugtoare sau de confirmare.

Trebuie remarcat faptul c exist mai multe modaliti pentru a verifica


prezena unei relaii statistice.

Calculul odds ratio. Cnd X i Y sunt independente, sau nu sunt asociate


statistic, raportul este egal cu 1. Aici ne referim la valoarea odd ratio
pentru populaie; Aceast valoare este definit ca
PrX j Y =PrX j Y
odds ratio
PrX j Y =PrX
j Y

i poate fi expresat, n mod echivalent, n termeni de probabilitate


asociat.

PrX ; Y PrX ; Y
odds ratio
PrX ; Y PrX
; Y

Si exemplul de mai sus spune

OR
0:0060:9
70
0:0150:0
09

43:11

Indicnd clar o relaie statistic.

2. Compararea probabilitilor condiionate i necondi ionate (sau


marginale) probabilitate: de exemplu, PrX j Y versus PrX
.
Compararea probabilitilor condiionate: de exemplu, PrX j Y
versus PrX j Y . Exemplul de screening de mai sus prezint

PrX j Y 0:406

ntru
ct
PrX j Y
362
23;724

0:015

din nou, indicnd n mod clar o relaie statistic. De asemenea, trebuie


remarcat faptul cnoi ilustrm conceptele folosind datele de la un test de
depistare a cancerului, dar aceste concepte se aplic de asemena oricrei
clasificri ncruciate a doi factoribinari sau a dou variabile . Scopul
principal este de a determina dac o relaie statistic este prezent ;
Exerciiul 3.1, de exemplu, se ocup de relaiile dintre serviciile de sntate
i ras.

Urmtoarele dou seciuni prezint unele aplicaii ale regulilor


probabilitii introduse n seciunea 3.1.2: cnd s utilizm testele de
screening i modul n care s se msoare acordul.

15
4

37
PrX j Y 9
0:40
6

Astfel
15
4

51
PrY j X 6
0:29
8

n contextul evalurii testului de


screening:
TABLE 3.3

Population A Population B

X X

Y Y

45,000 5,000 9,000 1,000

5,000 45,000 9,000 81,000

PrX j Y i PrX j Y sunt sensibilitatea i respectiv-


specificitatea.

PrY j X i PrY j X sunt numite predictivitatea pozitiv


i predictivitatea negativ.

Cu predictibilitate pozitiv (sau o valoare predictiv pozitiv), ntrebarea


este: Avnd n vedere c testul X sugereaz cancerul, ceea ce este
probabilitatea ca, de fapt, cancerul este prezent? Raiunile pentru aceste
valori predictive sunt ca un test trece prin mai multe etape. Ini ial, ideea de
testare iniial are loc la un cercettor. Ea trebuie s treac apoi printr-un
stadiu de dezvoltare. Acest lucru poate avea mai multe aspecte (n bio-
chimie, microbiologie, etc.), dintre care unul este n Biostatistica: testarea
pe o populaie pilot. Din acest stadiu de dezvoltare, eficien testului se
caracterizeaz prin sensibilitatea i specificitatea acesteia. Un test de
eficient va trece apoi printr-un stadiu aplicational cu o aplica ie real a X
la o populaie int; i aici ne preocup valorile predictive. Exemplul simplu
prezentat n Tabelul 3.3 arat c, spre deosebire de sensibilitate i
specificitate, valorile predictive pozitive i negative depind nu numai de
eficien testului, dar, i de prevalena bolii n populaia int. n ambele
cazuri, testul este de 90% senzitiv i 90% specific. In orice caz:
1.Populaia A are o prevalen de 50%, ceea ce conduce la o valoare
predictiv pozitiv de 90%.

2.Populaia B are o prevalen de 10%, ceea ce conduce la o valoare


predictiv pozitiv de 50%.

Concluzia este clar: Dac un test chiar i unul foarte sensibil i foarte
specific este aplicat unei populaii int n care prevalen a bolii este sczut
(de exemplu, screening-ul populaiei pentru o boal rar), valoarea
predictiv pozitiv este sczut. (Cum acest lucru se refer la o politic
public important: Ar trebui s se efectueze teste aleatorii pentru SIDA?)

n aplicarea actual a unui test de screening pentru o populaie int (etapa d


eaplicare ), date privind starea bolii la indivizii nu sunt disponibile (n caz
contrar, nu ar fi nevoie de screening). Cu toate acestea, prevalen ele bolii
sunt adesea disponibile la ageniile naionale i studii de sntate. Valorile
predictive sunt calculate din

positive prevalencesensitivity

prevalencesensitivity 1 prevalence1
predictivity specificity

and

negative 1 prevalencespecificity

1 prevalencespecificity prevalence1
predictivity sensitivity

Aceste formule, numite teorema lui Bayes, ne permit s calculm valorile


predictive fr a fi nevoie de date de la stadiul de aplicare. Tot de ce avem
nevoie este Prevalena bolii (obinut de la agentiile de sanatate federale)
sensibilitate i specificitate; acestea au fost ob inute dup etapa de
dezvoltare. Nu este greu s dovedii aceste formule, folosind regulile de
adugare i multiplicare a probabilitii.De exemplu, avem
PrX ; Y
PrY j X
PrX
PrX ; Y


PrX ; Y PrX ; Y

PrY PrX j Y


PrY PrX j Y PrY PrX j Y

PrY PrX j Y


PrY PrX j Y 1 PrY &1
PrX j Y &

care este prima ecuaie pentru predictibilitate pozitiv. Pute i vedea, de


asemenea, n loc de a trece prin dovezi formale, ilustra ia noastr a
validitii acestora, folosind datele populaiei B de mai sus:

1. Calculul direct a predictivitii positive ne d

9000 0:5

18;000

2.Prin utilizarea prevalenei, senzitivitiisi specificit ii obinem

prevalencesensitivity
prevalencesensitivity 1 prevalence1
specificity

0:10:9

0:10:9 1 0:11 0:9

0:5
118 PROBABILITY AND PROBABILITY MODELS

TABLE 3.4

Observer 2

Observer 1 Category 1 Category 2 Total

n n n
Category 1 11 12 1

n n n
Category 2 21 22 2

n n
Total 1 2 n

3.1.5 Msurarea acordului

Multe studii de cercetare se bazeaz pe judecile observatorului, pentru a


stabili dac o boal, o trstur, sau un atribut este prezent sau absent. De
exemplu, rezultatele examinrilor urechii vor avea cu siguran efecte
asupra unei comparaii a tratamentelor ce concureaz pentru tratarea
infeciilor urechii. Desigur, preocuparea de baz este problema de
fiabilitate. Seciunile 1.1.2 i 3.1.4 au tratat un aspect important al
fiabilitii, validitatea evalurii. Cu toate acestea, pentru a judeca validitatea
unei metode, o metod exact de clasificare, sau un standard de aur, trebuie
s fie disponibil pentru calculul de sensibilitate i specificitate. Atunci cnd
o metod exact nu este disponibil, fiabilitatea poate fi judecat doar
indirect, n termeni de reproductibilitate; cel mai frecvent mod de a face
aceasta este masura acordul dintre examinatori.

Pentru simplificare, presupunem c fiecare dintre doi observatori atribuie n


mod independent, fiecare dintre elemente n sau subiecte la una din cele
dou categorii. Proba poate fi apoi enumerat ntr-un tabel 2 *2 (tabelul
3.4) sau n termeni a probabilitii celulare (Tabelul 3.5). Folosind aceste
frecvene, putem defini:

1. O proporie total de concordan:

n n
C 11 22

n
2. O proporie de concordan specific pentru
categorie:

2n11

C1 2n11 n12 n21

2n22

2n n n
C2 22 12 21

S-ar putea să vă placă și