Documente Academic
Documente Profesional
Documente Cultură
91 118
91 118
finalizare.
Statisticile descriptive
- n primul rnd, facei clic pe celula pe care dorii s o
umpleti, apoi facei clic pe pictograma insereaza functia,
f *, prin care veti deschide o baxa cu o lista a functiilor
excell disponibile pentru utilizare.
utilizare.
pentru corelare.
n noua caset, deplasai cursorul pentru a complete in
rndul X i Y marcate ca array1 si array2.Calculatorul va
calcula valoarea numeric pentru statistica selectata,
coeficientul de corelatie al lui Pearson, ntr-o celul
preselectat.
Exerciii
TABELUL pag
92
(a) Construii histograma,poligonul de frecven, i
graficul frecvenei cumulative
(b) Gsii, aproximativ, mediana utiliznd graficul frecvenei
cumulative
grafic.
Tabelul 2 pag 92
(a) Trasai histograma i frecvena poligonului
pentru fiecare an pe grafice separate
(B) Se traseaz dou grafice de frecven cumulative ntr-o
singur figur.
(C) Gsii i comparai medianele.
2.3 Un studiu privind efectele exerciiilor fizice asupra ciclului
menstrual furnizeaz
urmtoarele vrste (ani) ale menoree (nceputul menstruaiei)
pentru
96 nottoare care au nceput antrenarea nainte de menoree.
TABEL PAG 93 NR 1
(A) Formai o distribuie a frecvenei, inclusiva frecvenelor
relative i frecvenele relative cumulate.
(B) Traai poligonul de frecven i graficul frecvenei cumulative.
(C) Gsii mediana i percentila 95th.
2.4 Urmtoarele sunt vrstele menoreei (n ani) a 56 de nottoare
care au nceput de antrenarea dup ce au avut menoree.
Tabel pag 93 nr 2
(A) Formai o distribuie a frecvenei folosind aceleai intervale de
vrst ca i n Exercitiul 2.3. (Aceste intervale pot fi diferite de
cele din exemplul2.3.)
(B) Afiai pe acelai grafic dou grafice de frecven cumulative,
unapentru grupul instruit nainte de menoree i unul pentru grupul
instruit dup menoree. Comparai aceste dou grafice i formulai
concluzia.
Tabel pag 94
(A) Formai o distribuie a frecvenei, inclusiv frecvenele relative
i
frecvenele relative cumulate.
(B) Trasai poligonul de frecven i investigai simetria
distribuiei.
(C)Trasai graficul de frecven cumulativ i gsii i a 25-a i a
75-a percentila. Deasemenea calculai the midrange = percentila
75- percentila 25. (Aceasta este o alt msur bun descriptiva a
variaiei, este similar cu the range, dar este mai puin afectat de
observaii extreme.)
2.6 Referitor la datele privind aportul zilnic de grsimi n Exercitiu
2.5.
(A) Se calculeaz media folosind date brute.
(B) Se calculeaz, aproximativ, media utiliznd tabelul frecvenei
obinutn Exerciiu 2.5.
2.7 Folosind datele de venit din Exemplul 2.5:
(A) Se traseaz histograma pentru familiile albe. Are aceeai
form ca i cea pentru familiile ne-albe prezentate n Figura 2.5?
(B) Trasai i comparai acele dou grafice de frecven
cumulative, albi versus ne-albi confirmnd rezultatele prezentate
n figura 2.7.
(C) Compute, aproximativ, mediile celor dou grupuri i
compararezultatele cu medianele menionate la punctul 2.1.4.
2.8 Referitor la procentul saturaiei de bil pentru 31 de pacieni
de sex masculin n
Exemplul 2.4
TABEL NR 1 PAG
95
2.9 Studiul citat n exemplul 2.4, de asemenea, furnizeaz date
(procentul de saturaie
de bil) pentru 29 de femei. Aceste procente au fost
tabelul nr2 pg 95
Tabel nr 2 pag 95
Rezultatele dintr-un alt grup obinute dup MEP:
Tabel nr pag 96
(F112; 111; 107; 119; 92; 80; 81; 84; 118; 106; 103; 94g)
2.15 Urmtoarele sunt valorile ale activitii (micromoli per minut per
gram de esut) a unei anumite enzime msurat n esutul gastric
normal pentru 35 pacieni cu carcinom gastric:
Tabel 1 pag 97
Tabel 2 pag 97
2.18 Un studiu a fost efectuat pentru a investiga dac cereale de
ovz ajut la reducerea colesterolului seric la brbaii cu un nivel
ridicat de colesterol. Paisprezece oamenii au urmat o dieta la
ntmplare care a inclus fie tre de ovz fie fulgi de porumb; dup
dou sptmni, au fost nregistrate nivelurile lipoproteinei cu
densitate joas (LDL). Fiecare om a trecut apoi la o cura de slabire
alternativa. Dup o a dou perioad de dou sptmni, nivelul de
colesterol LDL a fiecarei persoane a fost nregistrat din nou. Datele
sunt prezentate n Tabelul E2.18. calculati diferena LDL (porumb-
ovz) pentru fiecare dintre cei 14 brbai, apoi x media, s2 varian
i deviaia standard pentru aceast prob de diferen.
Tabel1 pag 98
2.19 Un experiment a fost efectuat la Universitatea din California-
Berkeley
pentru a studia efectul mediului psihologic asupra anatomia
creierului. Un grup de 19 obolani a fost mprii aleator n dou
grupuri. Doisprezece
animale din grupul de tratament au trit mpreun ntr-o cuc
mare, mobilat
cu playthings care au fost modificate zi de zi; animalele din
grupul de control
au trit n mod izolat, fr jucrii. Dup o lun, animalele
experimentale
au fost ucise i disecate. Tabelul E2.19 furnizeaz greutile
cortexului (partea ginditoare a creierului), n miligrame. Calculai
separat pentru fiecare grup medii x, s2 variana i abaterea
standard a greutii cortexului.
Tabel nr 2 pag 98
Tabel nr 1 pag 99
(ACalculai x, s2 i s; comparai media cu cea din Los Angeles.
(B) Calculai coeficientul de variaie.
2.21 a fost msurat tensiunea arterial sistolic (n mmHg) a 12
de femei cu vrste cuprinse ntre
20 i 35 nainte i dup administrarea unui nou contraceptiv oral
(Tabelul E2.21). Focusai-v pe coloana
Cu diferene din tabel; Se calculeaz media x, variana s2 i
standardulAbaterea s.
Tabel nr 2 pag 99
(A) Se calculeaz separat pentru fiecare grup (AG pozitiv i negativ AG) x
medii, s2 varian i deviaia standard pentru timpul de supravie uire.
(B) Se calculeaz separat pentru fiecare grup (AG pozitiv i negativ AG)
media, media geometric i mediana pentru Numrul de leucocite.
TABLE E2.32
Raz
eX X-
Gradul Stadiul Vrsta Acid Noduli ray Gradul Stadiul Vrsta Acid Noduli
0 1 1 64 40 0 0 0 0 60 78 0
0 0 1 63 40 0 0 0 0 52 83 0
1 0 0 65 46 0 0 0 1 67 95 0
0 1 0 67 47 0 0 0 0 56 98 0
0 0 0 66 48 0 0 0 1 61 102 0
0 1 1 65 48 0 0 0 0 64 187 0
0 0 0 60 49 0 1 0 1 58 48 1
0 0 0 51 49 0 0 0 1 65 49 1
0 0 0 66 50 0 1 1 1 57 51 1
0 0 0 58 50 0 0 1 0 50 56 1
0 1 0 56 50 0 1 1 0 67 67 1
0 0 1 61 50 0 0 0 1 67 67 1
0 1 1 64 50 0 0 1 1 57 67 1
0 0 0 56 52 0 0 1 1 45 70 1
0 0 0 67 52 0 0 0 1 46 70 1
1 0 0 49 55 0 1 0 1 51 72 1
0 1 1 52 55 0 1 1 1 60 76 1
0 0 0 68 56 0 1 1 1 56 78 1
0 1 1 66 59 0 1 1 1 50 81 1
1 0 0 60 62 0 0 0 0 56 82 1
0 0 0 61 62 0 0 0 1 63 82 1
1 1 1 59 63 0 1 1 1 65 84 1
0 0 0 51 65 0 1 0 1 64 89 1
0 1 1 53 66 0 0 1 0 59 99 1
0 0 0 58 71 0 1 1 1 68 126 1
0 0 0 63 75 0 1 0 0 61 136 1
0 0 1 53 76 0
Note: This is a very long data file; its electronic copy, in a Web-based form, is available from
the author upon request.
(A) Pentru fiecare dintre cei doi factori binare, sexul (feminin /
masculin) i formarea rezidenilor n serviciile de urgen (nu /
da), care mparte cei 44 de medici n dou subgrupuri s zicem,
brbai i femei s se calculeze
x deviaia medie i deviaia standard s pentru rezultatul final X.
(B) Investigai relaia dintre rezultat, numrul de plngeri per vizit
, i fiecare dintre doi factori explanatory continue,venitul ( dolari
pe or) i volumul de lucru la serviciul de urgen (ore), prin
calcularea coeficientului de corelaie Pearson i formulai
concluzia.
TABLE E2.34
TABLE E2.35
3
Probabilitatea i Modele de probabilitate
3.1 PROBABILITATE
3.1.2 Probabilitatea
5500
P (positiv) =
100;000
O eantionare aleatorie simpl din populaia int este de prelevare a probelor, astfel
nct fiecare
posibil eantion de mrime n are anse egale de selecie. Pentru eantionarea aleatorie
simpl:
1. Fiecarl tragere la sori este incert n ceea ce privete orice eveniment sau
caracteristica sub investigare (de exemplu, avnd o boal), dar
Procesul fizic de eantionare aleatorie poate fi efectuat dup cum urmeaz (sau n un
mod logic echivalent cu urmtoarele etape).
3. Etichetele sunt plasate ntr-un recipient (de exemplu, o cutie) i se amestec bine.
4. O etichet este desenat orbete. Numrul de pe eticheta identific apoi subiectul din
populaie; acest subiect devine membru al eantionului.
Etapele 2 la 4 poate fi, de asemenea, puse n aplicare cu ajutorul unui tabel de numere
aleatoare (Anexa A). n mod arbitrar se alege o coloan din trei cadrane (sau coloan
din patru cadrane n cazul n care mrimea populaiei este mare) i un numr selectat
arbitrar n acea coloan servete pentru a identifica subiectul din populaie. n practic,
acest proces este computerizat.
Putem lega acum conceptele de probabilitate i de eantionare aleatorie dup cum
urmeaz. n exemplul de depistare a cancerului intr-o comunitate de N 1/4 100; 000
persoane, probabilitatea calculat de 0,055 este interpretat ca: Probabilitatea unei
persoane aleas aleatoriu din populaia int avnd un rezultat pozitiv al testului este
0.055 sau 5,5%. Raionamentul este dup cum urmeaz. Pe o remiz ini ial,
subiectul aleas poate sau nu poate reactiona pozitiv. Cu toate acestea, n cazul n care
acest proces de
Alegere n mod aleatoriu un subiect la un moment dat dintr-o populaie dat se repet
de mai multe ori, the accumulated long-run relative frequency of positive receptors in
the sample will aproximate 0,055.
Datele de la testul de depistare a cancerului din Exemplul 1.4 sunt reproduse aici In
Tabelul 3.1. n acest design, fiecare membru al populaiei este caracterizat prin dou
variabile: rezultatul testului X i adevratul statut al bolii Y. Urmnd definiia de mai sus
, probabilitatea unui rezultat pozitiv al testului, notat Pr (X= +) , este
516
Pr (X= +) =
24;103
= 0:021
23;587
PrX
24;103
0:979
Test Result, X
Disease, Y Total
379
PrY
24;103
0:015
23;724
PrY
24;103
0:985
Atragei atenia ca suma probabilitilor pentru fiecare vriabil este
unitatea
24;10
PrX ; Y 3
0:006
362
24;10
PrX ; Y 3
0:015
225
24;10
PrX ; Y 3
0:009
i
23;36
2
24;10
PrX ; Y 3
0:970
TABLE 3.2
Y Total
0:015
Considerm acum un al treilea tip de probabilitate. De exemplu,
senzitivitatea este exprimabil ca
154
sensitivity 379
0:406
PrX ; Y
PrX j Y
PrY
or
PrX j Y PrX
cele dou evenimente (X=+) i (Y=+)se spune c sunt independente
(deoarece starea Y= + nu schimba probabilitatea c X =+) i avem
regula de multiplicare pentru probabilitile de evenimente
independente:
0:021 PrX j Y
0:406
PrX ; Y PrX ; Y
odds ratio
PrX ; Y PrX
; Y
OR
0:0060:9
70
0:0150:0
09
43:11
PrX j Y 0:406
ntru
ct
PrX j Y
362
23;724
0:015
15
4
37
PrX j Y 9
0:40
6
Astfel
15
4
51
PrY j X 6
0:29
8
Population A Population B
X X
Y Y
Concluzia este clar: Dac un test chiar i unul foarte sensibil i foarte
specific este aplicat unei populaii int n care prevalen a bolii este sczut
(de exemplu, screening-ul populaiei pentru o boal rar), valoarea
predictiv pozitiv este sczut. (Cum acest lucru se refer la o politic
public important: Ar trebui s se efectueze teste aleatorii pentru SIDA?)
positive prevalencesensitivity
prevalencesensitivity 1 prevalence1
predictivity specificity
and
negative 1 prevalencespecificity
1 prevalencespecificity prevalence1
predictivity sensitivity
PrX ; Y PrX ; Y
PrY PrX j Y
PrY PrX j Y PrY PrX j Y
PrY PrX j Y
PrY PrX j Y 1 PrY &1
PrX j Y &
9000 0:5
18;000
prevalencesensitivity
prevalencesensitivity 1 prevalence1
specificity
0:10:9
0:5
118 PROBABILITY AND PROBABILITY MODELS
TABLE 3.4
Observer 2
n n n
Category 1 11 12 1
n n n
Category 2 21 22 2
n n
Total 1 2 n
n n
C 11 22
n
2. O proporie de concordan specific pentru
categorie:
2n11
2n22
2n n n
C2 22 12 21