Sunteți pe pagina 1din 15

MG - Lucrarea practic 5 2014/2015

UMF Carol Davila Informatic Medical i Biostatistic

Lucrarea practic 5
Indicaii generale:
Un important scop al lucrrii practice este crearea de fiiere de tip chestionar (sau
view-uri) pentru introducerea datelor n fiierele create n EpiInfo 2005. Acesta este un
soft specific unor prelucrri statistice de date, utilizat n special n epidemiologie.
Avantajul principal al acestui soft const n faptul c nu impune cheltuieli majore,
n condiiile n care, cu ajutorul su, se pot obine majoritatea rezultatelor prelucrrilor de
date cu care ne ntlnim n cercetarea medical.
Punctul su forte, pentru care este recomandat folosirea sa, este posibilitatea
crerii unor chestionare care s nu permit, din start, introducerea de date eronate flagrant.
Punctul su slab l constituie slaba calitate a diagramelor pe care le poate crea.
n aceast lucrare practic:
a) v vei reaminti principalele capabiliti ale unei aplicaii de calcul tabelar
(Microsoft Excel), i anume cele de creare de diagrame i cele de efectuare
rapid de calcule statistice;
b) vei aborda un prim exemplu de felul n care se formeaz opinii tiinifice,
bazate pe date puine, i de felul n care ele se pot valida statistic;
c) vei crea fiiere de tip baze de date, chestionare n interiorul lor, apoi vei
introduce nregistrri;
d) vei ncepe s folosii modulul Analyze Data al aplicaiei Epi Info;
Teme
22: controlul detaliat al diagramelor Excel
23: calculul intervalelor de ncredere n Excel
24: crearea chestionarelor n Epi Info
25: introducerea datelor n Epi Info
26: analiza statistic primar a datelor din fiiere

Softul ce va fi utilizat n lucrarea practic:


EpiInfo 2005, Excel

58

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 5 2014/2015

Tema 22: controlul detaliat al diagramelor Excel


Cercettorii unei firme farmaceutice au imaginat un unguent (bazat pe un compus chimic
nou) despre care cred c ar trebui s vindece mai rapid arsurile pielii. Unguentul a fost testat
n laborator pe un numr de 7 oareci alei aleator dintre cei 16 de care dispunea laboratorul
pentru aceste teste. (Tuturor celor 16 oareci li s-au provocat arsuri de piele, de graviti
echivalente.)
Pentru grupul celor 7 tratai au fost constatate urmtoarele durate de vindecare (n zile):
9 4 3 19 10 2 14
Pentru grupul de control al celor 9 netratai au fost constatate urmtoarele durate de
vindecare (n zile):
5 2 4 10 5 3 14 3 5
Se poate afirma c tratamentul cu noul unguent grbete vindecarea arsurii?
S utilizm aplicaia Excel pentru a-i explora posibilitile de a ne ajuta n a da
rspunsuri justificate la ntrebri de tipul celei anterioare.
Vei crea un fiier-carte de calcul denumit nume_UNGUENT.xls cu cel puin o foaie de
calcul. Se recomand ca diagramele s NU fie plasate peste celulele foii de calcul, ci n foi
separate!
Redenumii prima foaie de calcul Arsuri i, n domeniul B2:B17, plasai una sub alta
cele 16 durate de vindecare. n celula B1 vei plasa textul Durata de vindecare (n zile),
iar n celula C1 textul Grupul.
Alturat duratelor de vindecare, n domeniul C2:C17, plasai textele tratament sau
control, dup caz.
Coloana A o vei folosi pentru identificarea (numerotarea) cazurilor. Mai precis, n A1
vei plasa textul Individul nr., iar dedesubt vei plasa unul sub altul numerele 1, 2, ...,
16. (Reamintii-v cum se poate extinde, prin tragere de mner, o progresie aritmetic.)
Poate c o reprezentare grafic a
datelor ne va fi de ajutor. Cu Excel
obinem repede o asemenea reprezentare;
este suficient s selectm domeniul
A1:B17 i s apelm comanda
InserareDiagram.
Probabil c diagrama cea mai potrivit
pentru aceast situaie este cea cu bare
orizontale. n etapele de control va trebui
s prelum (n Clipboard) valorile
seriei Individul nr. posibil prin
tastarea combinaiei [Ctrl]+[C], apoi so eliminm, iar n final s plasm acele
valori n caseta etichetelor axei X (prin
lipire) a se vedea figura alturat.
Recomandm realizarea diagramei pe
o foaie separat, evitnd amestecul ntre
grafic i calcule pe aceeai foaie de
lucru. Denumii 16-1 foaia separat.

59

MG - Lucrarea practic 5 2014/2015

UMF Carol Davila Informatic Medical i Biostatistic

Durata de vindecare (n zile)


16
15
14
13

control

12
11
10
9
8
7
6
5
4
3

tratament

2
1
0

10

12

14

16

18

20

(zie)

ncercai modificarea culorilor n care sunt afiate barele, de exemplu n rou pentru
primele 7 bare (cele de jos) i n albastru pentru celelalte. Plasai de asemenea textele
tratament i control colorate corespunztor, ca n figur.
Duplicai foaia pe care ai depus diagrama, denumind 1-16 copia. ncercai, pe foaia
1-16, schimbarea ordinii de afiare a duratelor de vindecare (astfel nct barele orizontale
tratament s apar deasupra celor control.
Tema 23: calculul intervalelor de ncredere n Excel
Compararea grafic, pe diagrame, este util atunci cnd vrem s transmitem rapid
informaie privitorului, sau cazul nostru atunci cnd avem de-a face cu secvene lungi
de numere, care se citesc cu dificultate. Din punct de vedere statistic, ar trebui s
ncepem studiul nostru cu compararea mediilor celor dou grupuri. Mediile se obin uor,
cu ajutorul funciei AVERAGE.
Este ns de preferat s ncepem prin a organiza datele comparative pe foaia de calcul. De
exemplu, s plasm n celula F1 textul Tratament, n celula G1 textul Control, n celula
E2 textul Numr cazuri iar n celula E3 textul Medii.
Chiar dac numrul de cazuri ne este cunoscut, recomandm obinerea sa cu ajutorul
funciei COUNTIF. Activnd celula F2, apelai (comanda Inserare Funcie) aceast
funcie din categoria celor statistice. Are dou argumente: domeniul datelor care ar trebui
s fie C2:C17 i criteriul de selecie, care ar trebui s fie secvena de caractere tratament.
ntruct aceast valoare se afl n cteva celule, printre care i C2, al doilea argument ar
putea fi chiar C2.
Analog, celula G2 ar trebui s aib drept coninut formula
=COUNTIF(C2:C17,C17)
Pentru calculul mediei vom face apel la funcia AVERAGE, i ea din categoria funciilor
statistice. n celula F3 plasm formula (!)
=AVERAGE(B2:B8)

- 92 -

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 5 2014/2015

iar n celula G3 formula analoag.


Dup o formatare adecvat a acestor dou celule, cernd afiarea cu 2 zecimale, ar trebui
s obinem afiate valorile 8.71 respectiv 5.67.
Cercettorii nu ar avea motive de optimism: n medie, durata de vindecare este mai mare
pentru indivizii tratai cu unguent!
Situaia de mai sus este excepional, de regul nu se ntmpl aa, dar nu trebuie excluse
asemenea situaii!
Copiai acum foaia Arsuri peste foaia a doua, pe care o vei denumi Corect. Copierea
unei foi ntregi se face de asemenea cu tehnica de copiere/lipire, iar selectarea prealabil a
ntregii foi se poate face prin apsarea butonului de col (aflat n stnga butoanelor A, B,
C, ... care identific coloanele i deasupra butoanelor 1, 2, 3, ... care identific rndurile).
Prin copiere/lipire au fost preluate toate formulele!
nlocuii acum, n foaia Corect, datele din domeniul B2:B8 prin urmtoarele
5 4 3 5 8 2 6
De data aceasta durata medie de vindecare (pentru indivizii tratai) este de 4.71 zile, iar
cercettorii pot afirma c unguentul este eficace n vindecarea arsurilor.
Evident, aceast afirmaie va fi fcut la modul general, dar ea este bazat pe doar cteva
cazuri constatate n laborator! Care sunt riscurile acceptrii acestei afirmaii ca fiind
adevrat la modul general?
Statistica ne nva s enunm afirmaii de forma: durata medie de vindecare la
indivizii tratai este semnificativ mai mic dect la indivizii netratai. Dar cnd oare
suntem ndreptii s facem asemenea afirmaii?
Excel ne permite s calculm rapid ingredientele necesare justificrii unor asemenea
afirmaii. Conform teoriei, ar trebui s obinem erorile standard ale celor dou medii, s
identificm intervalele de ncredere (95%) i s constatm c cele dou intervale sunt
disjuncte.
Obinerea erorii standard a unei medii necesit mai multe calcule. Eroarea standard nu
se obine direct, ci prin intermediul abaterii standard, care n Excel este dat de funcia
STDEV. Formula este simpl:
eroarea standard = abaterea standard / (numrul de indivizi)
Odat obinut eroarea standard a mediei, intervalul de ncredere 95% pentru medie va
fi:
media eroarea standard * 1.96, media + eroarea standard * 1.96.
Aadar, avem nevoie de medii (obinute cu AVERAGE), de abateri standard (obinute
cu STDEV), i de numrul de indivizi (obinut cu COUNTIF).
S organizm calculele n felul urmtor: n celula E4 s plasm textul Abateri standard,
n celula E5 textul Erori standard, n E6 textul Extr. stng iar n E7 textul Extr.
dreapt.
Formulele de calcul pe care le vom introduce n coloana F vor fi, respectiv,
=STDEV(B2:B8)
=F4/SQRT(F2)
=F3F5*1.96
=F3+F5*1.96
n coloana G vom introduce formulele corespunztoare datelor de control, care au fost
plasate n domeniul B9:B17.

- 93 -

MG - Lucrarea practic 5 2014/2015

UMF Carol Davila Informatic Medical i Biostatistic

Ar trebui s obinei intervalele de ncredere [3.25, 6.18] respectiv [3.14, 8.20]. Ele nu
sunt disjuncte, astfel c statistica nu justific deloc afirmaia cercettorilor!
Este momentul s atragem atenia asupra unui aspect extrem de important: duratele de
vindecare nu ar trebui apreciate n medie, ntruct un singur caz aberant de lung ar
putea schimba n mod esenial concluziile. Dimpotriv, aprecierea ar trebui s fie fcut
dup mediane!
Plasai n celula E8 textul Mediane, apoi n dreapta formulele de calcul, fcnd apel la
funcia MEDIAN. Ar trebui s obinei, pentru ambele grupuri, mediana 5. Aceasta ar trebui
s constituie un semnal de alarm privind incorectitudinea afirmaiei cercettorilor!
Preluai n foaia a treia, prin copiere/lipire, coninutul foii Corect. Redenumii foaia a
treia Ultima i, pe ea, efectuai urmtoarele modificri. Schimbai coninutul domeniului
B8:B17 n urmtorul:
5 7 6 11 6 9 14 6 10
Ar trebui s constatai c mediile se modific sensibil, i c intervalele de ncredere 95%
devin [3.25, 6.18] respectiv [6.27, 10.18].
Se observ c cele dou intervale de ncredere sunt disjuncte, prin urmare pe aceste
date putem accepta cu ncredere 95% ca adevrat afirmaia cercettorilor (sau a firmei
de medicamente).
Constatm i c medianele difer n mod esenial i, reamintim, acestea ar trebui s fie
luate n consideraie n aprecierea validitii afirmaiei cercettorilor. Ar fi de dorit s
dispunem de intervale de ncredere 95% pentru cele dou mediane. Din pcate, Excel nu
ne poate ajuta n obinerea acestor intervale de ncredere; este nevoie de soft statistic
specializat, care eventual s exploateze metode speciale cum ar fi tehnicile bootstrap.
Salvai n aceast form cartea de calcul Excel, cu cele trei foi de calcul i dou
grafice.
Tema 24: crearea chestionarelor n Epi Info
Epi Info este un pachet de programe destinat prelucrrii de date organizate sub form de
chestionare i sistematizrii rezultatelor studiilor pentru a fi incluse n comunicri i
rapoarte. Conceput n primul rnd pentru aplicaii n epidemiologie, Epi Info poate fi folosit
cu succes n prelucrarea datelor din domeniul medical i din afara acestuia, pachetul
incluznd faciliti de gestiune a datelor i de statistic de tipul celor oferite de programele
SAS, SPSS, etc. faciliti cuprinse ntrun singur sistem al crui avantaj principal este faptul
c este permis copierea i libera distribuire. La lansare, pagina de ntmpinare este
urmtoarea:
Principalele componente ale programului Epi Info sunt urmtoarele:
Make View, care este un editor de text folosit pentru a defini cmpurile utilizate n
introducerea datelor pe una sau mai multe pagini ale unui chestionar (View).
Enter Data, care afieaz chestionarele construite cu Make View, controleaz procesul
de introducere a datelor utiliznd setrile i codurile specificate n Make View; are i
posibiliti de cutare a nregistrrilor.
Analyze Data, care este folosit pentru analizarea datelor nregistrate n fiierele create nu
numai cu Epi Info, dar i cu dBase, FoxPro, Excel etc. Aceste fiiere pot conine liste,
frecvene, tabele, diagrame, date specifice studiilor epidemiologice.
Create Maps, care este un instrument folosit pentru crearea hrilor epidemiologice.

- 94 -

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 5 2014/2015

Create Reports, care este folosit pentru generarea rapoartelor.

Alte componente sau utilitare ale softului, utile n diverse activiti, sunt urmtoarele:
NutStat, care este folosit pentru nregistrarea i evaluarea msurtorilor referitoare la
nlime, greutate, circumferina capului i a toracelui pentru copii i adolesceni.
StatCalc, care este folosit pentru efectuarea de calcule statistice cu date plasate n tabele.
Data Compare, care este folosit pentru identificarea diferenelor ntre dou tabele.
Table to View, care se folosete pentru a genera un chestionar (view) pe baza unui tabel
de date existent.
VisData, utilizat pentru citirea fiierelor de date i schimbarea proprietilor.
Epi Lock, care furnizeaz o criptare pentru a se proteja accesul la date i pentru a facilita
att transmisia dar i crearea cpiilor de rezerv (backup).
Compact, care este folosit la compactarea bazelor de date de tip (MS)Access.
Aplicaia Epi Info cuprinde i
un sistem de ajutorare a utilizatorului (help), care conine informaii despre
facilitile oferite,
un manual de utilizare, precum i
un program de ndrumare interactiv n crearea fiierelor folosite n epidemiologie.
Pentru crearea unui fiier-chestionar se va folosi modulul Make View, anume comanda:
File New File name (numele bazei de date: nume_EPI) Open Name the View
(Chest1 ca nume dat chestionarului)
n pagina din partea stng gsii trei opiuni referitoare la gestiunea paginilor din
chestionar (Add Page adugarea unei noi pagini la sfritul celor deja existente, Insert

- 95 -

MG - Lucrarea practic 5 2014/2015

UMF Carol Davila Informatic Medical i Biostatistic

Page adugarea unei pagini noi ntre dou deja existente, Delete Page eliminarea paginii
curente) precum i comanda Program care face posibil programarea anumitor operaii de
verificare, ducnd astfel la evitarea erorilor care pot aprea la introducerea datelor.

Introducerea de cmpuri n pagina curent a chestionarului, conform indicaiei afiate, se


efectueaz cu un clic pe butonul din dreapta la mausului, n poziia n care se dorete apariia
cmpului respectiv (pentru fixarea poziiei este util grila). Ca urmare, va aprea caseta de
dialog Field Definition n care se vor introduce caracteristicile cmpului: numele, tipul,
dimensiunea, limitrile valorilor, codificri, valorile legale etc.
Caseta de dialog Field Definition este prezentat n figura urmtoare. Se observ c tipul
cmpului este fixat implicit pe Text.

- 96 -

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 5 2014/2015

Chestionarul va conine urmtoarele 15 cmpuri:


1. Codul numeric personal. n caseta text Question or Prompt vom introduce textul
Codul Numeric Personal:, n grupul Field or Variable vom alege pentru Type valoarea
Number, iar pentru Pattern valoarea ############# (adic 13 cifre); n sfrit, n
caseta text Field Name vom introduce textul CNP.
(De menionat c secvena de caractere CNP va servi drept nume al cmpului, iar
secvena mai lung Codul Numeric Personal: va servi drept etichet pentru explicaii pe
ecran.)
2. Numele pacientului va fi de tip text i va avea cel mult 30 de caractere. De data
aceasta n caseta text Question or Prompt vom introduce Numele:, pentru Type vom
alege valoarea Text, iar Size va fi stabilit la 30. Numele cmpului poate fi lsat cel
propus n caseta text Field Name.
3. Prenumele pacientului va fi tratat similar ca i numele su.
4. Sexul pacientului va avea dou valori posibile: F sau M. De data aceasta, n caseta
text Question or Prompt vom introduce Sexul:, pentru Type vom alege valoarea Text,
iar n grupul Code Tables vom apsa butonul Legal Values, apoi butonul Create New, i
vom tasta valorile legale F, apoi M (vezi figura urmtoare). i n acest caz numele
cmpului poate fi lsat cel propus n caseta text Field Name.
5. Data naterii pacientului va fi evident de tip dat calendaristic. Pentru a putea
preleva aceast dat, n caseta text Question or Prompt vom introduce Data naterii:,
pentru Type vom alege valoarea Date, iar pentru Pattern valoarea aleas va fi DD-MMYYYY. De data aceasta vom interveni n caseta text Field Name pentru a modifica numele
cmpului n DataNast.

6. Data internrii pacientului va fi tratat similar ca i data naterii.


7. Edeme va fi o variabil cu dou valori posibile Yes/No. De data aceasta, n caseta text
Question or Prompt vom introduce Edeme?, pentru Type vom alege valoarea Yes/No.
n acest caz numele cmpului, n caseta text Field Name, va fi modificat n Edeme.
n mod asemntor se procedeaz pentru urmtoarele 3 cmpuri:
8. Pleurezie.
9. Palpitaii (numele cmpului Palpitatii).

- 97 -

MG - Lucrarea practic 5 2014/2015

UMF Carol Davila Informatic Medical i Biostatistic

10. Tuse.
11. Temperatura va fi o variabil de tip numeric i va lua valori numai ntre 35 i 43.
Pentru stabilirea valorilor limit se bifeaz caseta de validare Range i se aleg pentru Lower
i Upper valorile 35, respectiv 43.
Ultimele 5 cmpuri (Edeme, Pleurezie, Palpitatii, Tuse i Temperatura) vor fi grupate
ntrun grup numit Manifestari. Pentru crearea unui grup se procedeaz n felul urmtor: se
selecteaz cmpurile prin tragere cu mausul deasupra, apoi din meniul Insert se alege
comanda Group.
Pagina construit poate s aib urmtoarea form:

Cu ajutorul comenzii Add Page (din meniul din pagina din stnga) se va aduga o nou
pagin n care vor fi plasate ultimele trei cmpuri:
12. Salariat, de tipul Yes/No,
13. Numrul copiilor, de tip numeric cu valori ntre 0 i 14,
14. Copii, o list-tabel care va conine numele i vrsta copiilor. Pentru aceasta n caseta
text Question or Prompt vom introduce Copii:, iar n grupul Code Tables vom apsa
butonul Grid. n caseta combinat Enter Column Name for Grid se va introduce textul
Numele copilului, dup care se apas butonul Save Column i se procedeaz la fel pentru
Vrsta copilului.
15. Vrsta pacientului n momentul internrii, de tip numeric.
Evident, odat ce cunoatem data naterii i data internrii, vrsta pacientului ar trebui s
fie calculat automat! Pentru asemenea operaiuni se poate folosi comanda Program din
pagina din stnga!
Ca urmare a comenzii Program pe ecran va aprea o cu totul alt organizare: pagina din
stnga va fi intitulat Check, iar cea din dreapta Check Commands.
Vei alege Varsta drept cmp n care se va calcula valoarea, apoi vei comanda Assign,
ncercnd s introducei expresia de calcul
=YEARS(DataNast, DataIntern)
(ca n figura de mai jos).
Probabil c nu vei reui. Motivul: cmpurile DataIntern i DataNast sunt plasate pe
alt pagin dect Varsta i valorile lor nu sunt disponibile pentru calcule! ncercai, ca

- 98 -

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 5 2014/2015

soluie extrem, mutarea cmpului Varsta de pe pagina 2 pe pagina 1. Evident, vei face apel
la comenzile Cut/Paste din meniul Edit. Dup mutare nu ar mai trebui s ntmpinai
dificulti. (Atenie, nu se recomand tastarea expresiei, ci formarea ei din componente
selectate!)

Tema 25: introducerea datelor n Epi Info


Se poate realiza direct din meniul File, comandnd Enter Data. Alte posibiliti, dup
prsirea modulului Make View, din pagina principal Epi Info fie se alege direct modulul

- 99 -

MG - Lucrarea practic 5 2014/2015

UMF Carol Davila Informatic Medical i Biostatistic

Enter Data, fie se comand Enter Data din meniul Programs. n acest caz se deschide
chestionarul creat, alegndu-se proiectul i view-ul corespunztor.
Se vor introduce cel puin 4 nregistrri (adic se completeaz cmpurile cu date pentru
cel puin 4 persoane, pe ambele pagini!). Dup care salvai fiierul nume_EPI.mdb i
transferai-l n cminul d-voastr.
n figura de mai jos este prezentat momentul completrii datei internrii, pe pagina 1
pentru nregistrarea a 3-a. De menionat c pentru toate inscripiile legate de valorile
cmpurilor a fost ales un font standard de afiare (MS Sans Serif) de mrime 14 p.t.
Se impune o observaie. n datele pe care le introducem apar redundante sexul i data
naterii. Este posibil ca valoarea din cmpul DataNast s fie calculat automat odat ce a
fost introdus codul numeric personal, la fel valoarea din cmpul Sexul. Putei realiza
aceasta?
Tema 26: analiza statistic primar a datelor din fiiere
Pentru a efectua calcule statistice vom folosi modului Analyze Data. n cadrul acestui
modul vom folosi mai multe comenzi pe care le putem alege din fereastra de comenzi din
partea stng. Rezultatele execuiei comenzilor sunt afiate n fereastra din dreapta sus
(intitulat Analysis Output). n fereastra din dreapta jos (intitulat Program Editor) se vor
afia comenzile/seturile de comenzi care au fost executate anterior; de asemenea, se pot
introduce noi comenzi, n regim de linie de comand.
Comenzile pe care le putem alege sunt grupate, n fereastra din stnga, n cteva grupe.
Distingem astfel comenzile de lucru cu datele (grupate n Data), cele ce opereaz asupra
variabilelor (grupate evident n Variables), comenzile de selecie (grupate n Select/If),
comenzile de analiz statistic primar (grupate n Statistics) etc.
Read (Import) este comanda utilizat la nceputul oricrei sesiuni de lucru n modulul
Analysis. Este folosit pentru preluarea datelor dintr-un fiier, date ce vor fi folosite pentru
prelucrrile ulterioare (pn la o nou comand Read (Import).). Formatul implicit al
datelor este Epi 2000, dar acesta poate fi schimbat astfel nct este posibil s se preia date i
din alte tipuri de fiiere (de exemplu diverse versiuni de Excel, diverse versiuni de Fox Pro,
Paradox sau chiar documente hipertext).
Softul Epi Info este nsoit de mai multe proiecte pentru exemplificare i auto-nvare,
dintre care cel mai simplu este Sample.mdb.
Lansai n execuie comanda:
Read (Import) Data Formats: Epi 2000
Data Source: Sample.mdb
Show: Views
Views: viewBabyBloodPressure
Vei constata c aceasta este de fapt comanda:
READ 'C:\...\Epi_Info\Sample.mdb':viewBabyBloodPressure
List, din grupul Statistics, este comanda de afiare sub form tabelar (Grid sau HTML)
a valorilor unor variabile din fiierul activ de date. Implicit, pentru valoarea * n lista
Variables, vor fi afiate valorile pentru toate variabilele. Dac ns vor fi selectate doar unele
variabile, afiarea valorilor se va efectua doar pentru aceste variabile. Aceast comand
permite i modificarea valorilor variabilelor din fiierul activ de date (Allow Updates).

- 100 -

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 5 2014/2015

Ca exemplu, vom afia doar valorile variabilelor (cmpurilor) Birthweight,


SystolicBlood, AgeInDays sub form tabelar (Display Mode: Grid) dup ce aceste
cmpuri au fost selectate din lista derulant Variables.
Comanda efectiv este:
LIST Birthweight SystolicBlood AgeInDays GRIDTABLE

Frequencies, din grupul Statistics, este comanda cu care de obicei se ncepe analiza
unui nou set de date, pentru c nainte de a face prelucrri statistice mai complicate, vrem s
aflm cteva informaii de baz, legate de distribuiia datelor. Comanda se poate folosi att
pentru variabile calitative, ct i pentru variabile cantitative, i conduce la obinerea unui
tabel-sintez care conine toate valorile variabilelor specificate n lista Frequency of:,
mpreun cu frecvenele absolute (numrul de apariii), procentele i procentele cumulate
pentru fiecare valoare a variabilei.
De asemenea, n tabel este trecut i o schi de reprezentare grafic de tip cu bare.
n figura de mai jos este prezentat efectul comenzii
FREQ Birthweight
Birthweight in Oz (X1)

Frequency

Percent

90

6.3%

6.3%

95

6.3%

12.5%

100

6.3%

18.8%

105

12.5%

31.3%

120

25.0%

56.3%

125

18.8%

75.0%

130

6.3%

81.3%

135

6.3%

87.5%

150

6.3%

93.8%

160

6.3%

100.0%

Total

16

100.0%

100.0%

- 101 -

Cum Percent

MG - Lucrarea practic 5 2014/2015

UMF Carol Davila Informatic Medical i Biostatistic

95% Conf Limits


90
0.2%
30.2%
95
0.2%
30.2%
100
0.2%
30.2%
105
1.6%
38.3%
120
7.3%
52.4%
125
4.0%
45.6%
130
0.2%
30.2%
135
0.2%
30.2%
150
0.2%
30.2%
160
0.2%
30.2%
Se observ c sunt afiate i intervalele de ncredere 95% (95% Confidence Limits)
pentru fiecare valoare a variabilei. Ele trebuie citite n felul urmtor: avem ncredere 95% c
procentul celor care la natere cntresc 90 oz se situeaz undeva ntre 0.2% i 30.2%. Acest
rezultat este bazat pe nregistrarea unui caz din 16! La cursurile de biostatistic din anul al IIlea se va explica modul n care se obin aceste evaluri.
n cazul n care se specific o variabil de stratificare, se obin mai multe tabele de
frecven, cte unul pentru fiecare valoare a variabilei de stratificare.
Comanda Means conduce, n plus fa de datele pe care le-am obinut deja cu comanda
Frequencies, la obinerea unor indicatori statistici de centrare i mprtiere: media (Mean),
mediana (Median), cuartilele (de 25% i de 75%), valoarea minim (Minimum) i maxim
(Maximum), modul = valoarea avnd frecvena maxim (Mode), variana (Variance) i
abaterea standard (Std Dev). Evident, Obs este numrul total de valori ale variabilei, iar Total
este suma tuturor valorilor variabilei.
n figura de mai jos este prezentat efectul comenzii
Age in Days(X2)

MEANS AgeInDays
Frequency
Percent
Cum Percent

18.8%

18.8%

43.8%

62.5%

25.0%

87.5%

12.5%

100.0%

Total

16

100.0%

100.0%

Obs Total
16 53.0000
Minimum
2.0000

Mean Variance
3.3125
.8958

25%
Median
3.0000 3.0000

Std Dev
.9465

75%
Maximum
4.0000
5.0000

Mode
3.0000

Comanda Means poate fi folosit ns numai pentru variabile cantitative; pentru cele
calitative trebuie s ne mulumim cu rezultatele comenzii Frequencies.
Comanda Select, din grupul Select/If, este folosit pentru selectarea unui grup de
nregistrri care ndeplinesc un anumit criteriu. Dup selectarea grupului de nregistrri, n

- 102 -

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 5 2014/2015

prelucrare vor fi luate n calcul doar acestea. Comanda Select rmne activ pna la anularea
ei (Cancel select).
Ca exemplu, s selectm noii nscui cu vrsta (exprimat n zile) mai mare de 3. n
caseta Select Criteria: formai expresia AgeInDays>3. n urma unei comenzi List se va
obine urmtorul rezultat:
Observation Birthweight in
Number
Ounces (X1)
2
120

Age in
Days(X2)
4

Systolic Blood PresUniqueKey RecStatus


sure (mm Hg)(Y)
90
2
1

130

92

125

98

120

96

10

90

95

10

14

150

97

14

Ultimele dou coloane, intitulate UniqueKey i RecStatus, sunt cmpuri speciale


pentru tabele create cu Epi Info. n cmpul RecStatus se pstreaz starea nregistrrii.
Anume, pentru nregistrrile care au fost marcate pentru tergere valoarea va fi 0, iar pentru
restul valoarea va fi 1. Cmpul UniqueKey este folosit pentru numrarea automat a
nregistrrilor din tabel.
Comanda Header, din grupul Output, poate fi folosit pentru a stabili un text ca titlu
pentru rezultate, de asemenea pot fi precizate caracteristicile de redare (fontul, mrimea,
etc.). Un exemplu:
HEADER 2 "Rezultate pentru nou nascuti" (BOLD) TEXTFONT +4
Comanda Type, din acelai grup Output, este analoag celei anterioare; evident, este
folosit pentru inserarea unei secvene de caractere sau a coninutului unui fiier-text n
fluxul de ieire (fie cel implicit monitorul , sau cel specificat cu comanda RouteOut).
Comanda RouteOut redirecteaz ieirea (fluxul de rezultate) ctre coninutul unui fiier
cu numele specificat; acest proces va fi terminat prin comanda CloseOut. Rezultatele
obinute n urma unor comenzi precum Frequencies, List etc. vor fi inserate n coninutul
fiierului cu numele specificat prin RouteOut.
Deschidei (din Sample.mdb) cu ajutorul comenzii Read (Import) tabelul
viewEstriolAndBirthweight. Folosii comanda RouteOut pentru a redireciona rezultatele
obinute spre fiierul cu numele nume_EBW (evident, n folderul C:\Anul_2). Ce extensie
va avea acest fiier?
Introducei titlul Estriolul i greutatea la natere cu ajutorul comenzii Header bifnd
opiunile Bold i Italic i alegnd mrimea fontului de 7. Introducei apoi textul
Coninutul fiierului cu ajutorul comenzii Type bifnd i acum opiunile Bold i Italic,
ns alegnd mrimea fontului de 5. Folosii comanda List pentru a lista valorile celor dou
variabile Birthweight i Estriol, alegnd modul de afiare Web (HTML). Introducei un
nou text: Prelucrri statistice pstrnd parametrii de la textul anterior. Cu ajutorul
comenzii Means calculai indicatorii statistici pentru variabila Birthweight, apoi pentru
Estriol. nchidei fiierul de rezultate cu ajutorul comenzii CloseOut.
Probabil c suntem de acord cu toii c informaia prezentat grafic este mai uor de
neles. Cele mai utilizate moduri de prezentare grafic sunt diagramele cu dreptunghiuri

- 103 -

MG - Lucrarea practic 5 2014/2015

UMF Carol Davila Informatic Medical i Biostatistic

(Bar sau Rotated Bar), diagramele de tip rozet (Pie) i histogramele (Histogram). Primele
dou tipuri sunt potrivite pentru afiarea informaiei despre variabilele care au un numr
mic de valori (n special variabile calitative). Ultimul tip este adecvat prezentrii
sumarizate a variabilelor care au un numr mare de valori numerice (aa cum este cazul
greutii exprimat n grame, sau a nlimii exprimat n centimetri), bineneles dup ce se
realizeaz gruparea valorilor n cteva intervale de valori.
Comanda Graph, din grupul Statistics, este folosit pentru a realiza reprezentri
grafice ale variabilelor din fiierul activ de date. Ca un exemplu, s deschidem (din sursa
Sample.mdb) cu ajutorul comenzii Read (Import) tabelul viewSmoke. Cu ajutorul
comenzii Graph vom prezenta valorile variabilei Sex ntro diagram cu bare
(dreptunghiuri). Pentru aceasta n fereastra obinut prin lansarea comenzii, alegem Bar n
lista Graph Type: i Sex n X-AXIS Main_Variable(s):. n Y-AXIS Show values of: va
fi pstrat valoarea implicit Count. Titlul diagramei va fi: Repartitia pe sexe a
persoanelor fumatoare | creat de ... (numele d-voastr). Dup afiare, diagrama obinut va
fi exportat (File Export...) n format jpg dup care va fi redenumit nume_DISX.jpg
alegnd i calea de acces prin opiunea Export Destination: File
Browse.
n mod asemntor se procedeaz pentru variabila Race pentru care vom alege tipul de
diagram Rotated Bar, apoi pentru variabila Marital pentru care alegem tipul de grafic
Pie. Salvai cele dou diagrame, dup ce ai ales titluri adecvate, n fiiere cu denumirile
nume_DIRACE.jpg respectiv nume_DIMAR.jpg. Pentru variabila cantitativ Age tipul de
diagram adecvat va fi Histogram, pentru care vei stabili lungimea intervalului de grupare
la 10, iar prima valoare va fi 0. Diagrama obinut va fi salvat n fiierul
nume_DIAGE.jpg. Ce titlu i-ai stabili?
n continuare, dorim s reprezentm grafic variabila Weight separat pentru fiecare
valoare a variabilei Sex. Pentru aceasta, alegem tipul de diagram Histogram, variabila
principal Main_Variable(s): va fi aleas Weight, lungimea intervalului de grupare va fi
15, titlul principal va fi: Repartitia greutatii in functie de sex | creat de ... (numele dvoastr), la opiunea One Graph for Each Value of alegem variabila Sex, vom bifa
opiunea Multiple Graph per Page i vom introduce valorile 2 pentru No
Across/Horizontal respectiv 1 pentru No Down/Vertical. Vom salva diagramele obinute
sub numele nume_DIAGESX1.jpg respectiv nume_DIAGESX2.jpg.
Ca un exerciiu de control, deschidei tabelul viewOswego din proiectul Sample.mdb.
Redirectai rezultatele prelucrrilor urmtoare spre fiierul nume_OSW. Fiecare comand va
fi nsoit de un text explicativ, n care vei specifica ce se obine cu comanda respectiv.
Listai coninutul fiierului. Pentru variabila Age vei calcula media pentru persoanele
sntoase (criteriul ill=No) i separat pentru persoanele bolnave (ill=Yes).
Reprezentai grafic adecvat variabilele Age, Sex, Ill, salvai diagramele obinute n
format JPG i inserai-le, nsoite de comentariile d-voastr referitoare la ceea ce dorii s
prezentai n diagramele respective, ntr-un document denumit nume_DIOSWEGO.doc.

- 104 -

S-ar putea să vă placă și