Documente Academic
Documente Profesional
Documente Cultură
Lucrarea practic 5
Indicaii generale:
Un important scop al lucrrii practice este crearea de fiiere de tip chestionar (sau
view-uri) pentru introducerea datelor n fiierele create n EpiInfo 2005. Acesta este un
soft specific unor prelucrri statistice de date, utilizat n special n epidemiologie.
Avantajul principal al acestui soft const n faptul c nu impune cheltuieli majore,
n condiiile n care, cu ajutorul su, se pot obine majoritatea rezultatelor prelucrrilor de
date cu care ne ntlnim n cercetarea medical.
Punctul su forte, pentru care este recomandat folosirea sa, este posibilitatea
crerii unor chestionare care s nu permit, din start, introducerea de date eronate flagrant.
Punctul su slab l constituie slaba calitate a diagramelor pe care le poate crea.
n aceast lucrare practic:
a) v vei reaminti principalele capabiliti ale unei aplicaii de calcul tabelar
(Microsoft Excel), i anume cele de creare de diagrame i cele de efectuare
rapid de calcule statistice;
b) vei aborda un prim exemplu de felul n care se formeaz opinii tiinifice,
bazate pe date puine, i de felul n care ele se pot valida statistic;
c) vei crea fiiere de tip baze de date, chestionare n interiorul lor, apoi vei
introduce nregistrri;
d) vei ncepe s folosii modulul Analyze Data al aplicaiei Epi Info;
Teme
22: controlul detaliat al diagramelor Excel
23: calculul intervalelor de ncredere n Excel
24: crearea chestionarelor n Epi Info
25: introducerea datelor n Epi Info
26: analiza statistic primar a datelor din fiiere
58
59
control
12
11
10
9
8
7
6
5
4
3
tratament
2
1
0
10
12
14
16
18
20
(zie)
ncercai modificarea culorilor n care sunt afiate barele, de exemplu n rou pentru
primele 7 bare (cele de jos) i n albastru pentru celelalte. Plasai de asemenea textele
tratament i control colorate corespunztor, ca n figur.
Duplicai foaia pe care ai depus diagrama, denumind 1-16 copia. ncercai, pe foaia
1-16, schimbarea ordinii de afiare a duratelor de vindecare (astfel nct barele orizontale
tratament s apar deasupra celor control.
Tema 23: calculul intervalelor de ncredere n Excel
Compararea grafic, pe diagrame, este util atunci cnd vrem s transmitem rapid
informaie privitorului, sau cazul nostru atunci cnd avem de-a face cu secvene lungi
de numere, care se citesc cu dificultate. Din punct de vedere statistic, ar trebui s
ncepem studiul nostru cu compararea mediilor celor dou grupuri. Mediile se obin uor,
cu ajutorul funciei AVERAGE.
Este ns de preferat s ncepem prin a organiza datele comparative pe foaia de calcul. De
exemplu, s plasm n celula F1 textul Tratament, n celula G1 textul Control, n celula
E2 textul Numr cazuri iar n celula E3 textul Medii.
Chiar dac numrul de cazuri ne este cunoscut, recomandm obinerea sa cu ajutorul
funciei COUNTIF. Activnd celula F2, apelai (comanda Inserare Funcie) aceast
funcie din categoria celor statistice. Are dou argumente: domeniul datelor care ar trebui
s fie C2:C17 i criteriul de selecie, care ar trebui s fie secvena de caractere tratament.
ntruct aceast valoare se afl n cteva celule, printre care i C2, al doilea argument ar
putea fi chiar C2.
Analog, celula G2 ar trebui s aib drept coninut formula
=COUNTIF(C2:C17,C17)
Pentru calculul mediei vom face apel la funcia AVERAGE, i ea din categoria funciilor
statistice. n celula F3 plasm formula (!)
=AVERAGE(B2:B8)
- 92 -
- 93 -
Ar trebui s obinei intervalele de ncredere [3.25, 6.18] respectiv [3.14, 8.20]. Ele nu
sunt disjuncte, astfel c statistica nu justific deloc afirmaia cercettorilor!
Este momentul s atragem atenia asupra unui aspect extrem de important: duratele de
vindecare nu ar trebui apreciate n medie, ntruct un singur caz aberant de lung ar
putea schimba n mod esenial concluziile. Dimpotriv, aprecierea ar trebui s fie fcut
dup mediane!
Plasai n celula E8 textul Mediane, apoi n dreapta formulele de calcul, fcnd apel la
funcia MEDIAN. Ar trebui s obinei, pentru ambele grupuri, mediana 5. Aceasta ar trebui
s constituie un semnal de alarm privind incorectitudinea afirmaiei cercettorilor!
Preluai n foaia a treia, prin copiere/lipire, coninutul foii Corect. Redenumii foaia a
treia Ultima i, pe ea, efectuai urmtoarele modificri. Schimbai coninutul domeniului
B8:B17 n urmtorul:
5 7 6 11 6 9 14 6 10
Ar trebui s constatai c mediile se modific sensibil, i c intervalele de ncredere 95%
devin [3.25, 6.18] respectiv [6.27, 10.18].
Se observ c cele dou intervale de ncredere sunt disjuncte, prin urmare pe aceste
date putem accepta cu ncredere 95% ca adevrat afirmaia cercettorilor (sau a firmei
de medicamente).
Constatm i c medianele difer n mod esenial i, reamintim, acestea ar trebui s fie
luate n consideraie n aprecierea validitii afirmaiei cercettorilor. Ar fi de dorit s
dispunem de intervale de ncredere 95% pentru cele dou mediane. Din pcate, Excel nu
ne poate ajuta n obinerea acestor intervale de ncredere; este nevoie de soft statistic
specializat, care eventual s exploateze metode speciale cum ar fi tehnicile bootstrap.
Salvai n aceast form cartea de calcul Excel, cu cele trei foi de calcul i dou
grafice.
Tema 24: crearea chestionarelor n Epi Info
Epi Info este un pachet de programe destinat prelucrrii de date organizate sub form de
chestionare i sistematizrii rezultatelor studiilor pentru a fi incluse n comunicri i
rapoarte. Conceput n primul rnd pentru aplicaii n epidemiologie, Epi Info poate fi folosit
cu succes n prelucrarea datelor din domeniul medical i din afara acestuia, pachetul
incluznd faciliti de gestiune a datelor i de statistic de tipul celor oferite de programele
SAS, SPSS, etc. faciliti cuprinse ntrun singur sistem al crui avantaj principal este faptul
c este permis copierea i libera distribuire. La lansare, pagina de ntmpinare este
urmtoarea:
Principalele componente ale programului Epi Info sunt urmtoarele:
Make View, care este un editor de text folosit pentru a defini cmpurile utilizate n
introducerea datelor pe una sau mai multe pagini ale unui chestionar (View).
Enter Data, care afieaz chestionarele construite cu Make View, controleaz procesul
de introducere a datelor utiliznd setrile i codurile specificate n Make View; are i
posibiliti de cutare a nregistrrilor.
Analyze Data, care este folosit pentru analizarea datelor nregistrate n fiierele create nu
numai cu Epi Info, dar i cu dBase, FoxPro, Excel etc. Aceste fiiere pot conine liste,
frecvene, tabele, diagrame, date specifice studiilor epidemiologice.
Create Maps, care este un instrument folosit pentru crearea hrilor epidemiologice.
- 94 -
Alte componente sau utilitare ale softului, utile n diverse activiti, sunt urmtoarele:
NutStat, care este folosit pentru nregistrarea i evaluarea msurtorilor referitoare la
nlime, greutate, circumferina capului i a toracelui pentru copii i adolesceni.
StatCalc, care este folosit pentru efectuarea de calcule statistice cu date plasate n tabele.
Data Compare, care este folosit pentru identificarea diferenelor ntre dou tabele.
Table to View, care se folosete pentru a genera un chestionar (view) pe baza unui tabel
de date existent.
VisData, utilizat pentru citirea fiierelor de date i schimbarea proprietilor.
Epi Lock, care furnizeaz o criptare pentru a se proteja accesul la date i pentru a facilita
att transmisia dar i crearea cpiilor de rezerv (backup).
Compact, care este folosit la compactarea bazelor de date de tip (MS)Access.
Aplicaia Epi Info cuprinde i
un sistem de ajutorare a utilizatorului (help), care conine informaii despre
facilitile oferite,
un manual de utilizare, precum i
un program de ndrumare interactiv n crearea fiierelor folosite n epidemiologie.
Pentru crearea unui fiier-chestionar se va folosi modulul Make View, anume comanda:
File New File name (numele bazei de date: nume_EPI) Open Name the View
(Chest1 ca nume dat chestionarului)
n pagina din partea stng gsii trei opiuni referitoare la gestiunea paginilor din
chestionar (Add Page adugarea unei noi pagini la sfritul celor deja existente, Insert
- 95 -
Page adugarea unei pagini noi ntre dou deja existente, Delete Page eliminarea paginii
curente) precum i comanda Program care face posibil programarea anumitor operaii de
verificare, ducnd astfel la evitarea erorilor care pot aprea la introducerea datelor.
- 96 -
- 97 -
10. Tuse.
11. Temperatura va fi o variabil de tip numeric i va lua valori numai ntre 35 i 43.
Pentru stabilirea valorilor limit se bifeaz caseta de validare Range i se aleg pentru Lower
i Upper valorile 35, respectiv 43.
Ultimele 5 cmpuri (Edeme, Pleurezie, Palpitatii, Tuse i Temperatura) vor fi grupate
ntrun grup numit Manifestari. Pentru crearea unui grup se procedeaz n felul urmtor: se
selecteaz cmpurile prin tragere cu mausul deasupra, apoi din meniul Insert se alege
comanda Group.
Pagina construit poate s aib urmtoarea form:
Cu ajutorul comenzii Add Page (din meniul din pagina din stnga) se va aduga o nou
pagin n care vor fi plasate ultimele trei cmpuri:
12. Salariat, de tipul Yes/No,
13. Numrul copiilor, de tip numeric cu valori ntre 0 i 14,
14. Copii, o list-tabel care va conine numele i vrsta copiilor. Pentru aceasta n caseta
text Question or Prompt vom introduce Copii:, iar n grupul Code Tables vom apsa
butonul Grid. n caseta combinat Enter Column Name for Grid se va introduce textul
Numele copilului, dup care se apas butonul Save Column i se procedeaz la fel pentru
Vrsta copilului.
15. Vrsta pacientului n momentul internrii, de tip numeric.
Evident, odat ce cunoatem data naterii i data internrii, vrsta pacientului ar trebui s
fie calculat automat! Pentru asemenea operaiuni se poate folosi comanda Program din
pagina din stnga!
Ca urmare a comenzii Program pe ecran va aprea o cu totul alt organizare: pagina din
stnga va fi intitulat Check, iar cea din dreapta Check Commands.
Vei alege Varsta drept cmp n care se va calcula valoarea, apoi vei comanda Assign,
ncercnd s introducei expresia de calcul
=YEARS(DataNast, DataIntern)
(ca n figura de mai jos).
Probabil c nu vei reui. Motivul: cmpurile DataIntern i DataNast sunt plasate pe
alt pagin dect Varsta i valorile lor nu sunt disponibile pentru calcule! ncercai, ca
- 98 -
soluie extrem, mutarea cmpului Varsta de pe pagina 2 pe pagina 1. Evident, vei face apel
la comenzile Cut/Paste din meniul Edit. Dup mutare nu ar mai trebui s ntmpinai
dificulti. (Atenie, nu se recomand tastarea expresiei, ci formarea ei din componente
selectate!)
- 99 -
Enter Data, fie se comand Enter Data din meniul Programs. n acest caz se deschide
chestionarul creat, alegndu-se proiectul i view-ul corespunztor.
Se vor introduce cel puin 4 nregistrri (adic se completeaz cmpurile cu date pentru
cel puin 4 persoane, pe ambele pagini!). Dup care salvai fiierul nume_EPI.mdb i
transferai-l n cminul d-voastr.
n figura de mai jos este prezentat momentul completrii datei internrii, pe pagina 1
pentru nregistrarea a 3-a. De menionat c pentru toate inscripiile legate de valorile
cmpurilor a fost ales un font standard de afiare (MS Sans Serif) de mrime 14 p.t.
Se impune o observaie. n datele pe care le introducem apar redundante sexul i data
naterii. Este posibil ca valoarea din cmpul DataNast s fie calculat automat odat ce a
fost introdus codul numeric personal, la fel valoarea din cmpul Sexul. Putei realiza
aceasta?
Tema 26: analiza statistic primar a datelor din fiiere
Pentru a efectua calcule statistice vom folosi modului Analyze Data. n cadrul acestui
modul vom folosi mai multe comenzi pe care le putem alege din fereastra de comenzi din
partea stng. Rezultatele execuiei comenzilor sunt afiate n fereastra din dreapta sus
(intitulat Analysis Output). n fereastra din dreapta jos (intitulat Program Editor) se vor
afia comenzile/seturile de comenzi care au fost executate anterior; de asemenea, se pot
introduce noi comenzi, n regim de linie de comand.
Comenzile pe care le putem alege sunt grupate, n fereastra din stnga, n cteva grupe.
Distingem astfel comenzile de lucru cu datele (grupate n Data), cele ce opereaz asupra
variabilelor (grupate evident n Variables), comenzile de selecie (grupate n Select/If),
comenzile de analiz statistic primar (grupate n Statistics) etc.
Read (Import) este comanda utilizat la nceputul oricrei sesiuni de lucru n modulul
Analysis. Este folosit pentru preluarea datelor dintr-un fiier, date ce vor fi folosite pentru
prelucrrile ulterioare (pn la o nou comand Read (Import).). Formatul implicit al
datelor este Epi 2000, dar acesta poate fi schimbat astfel nct este posibil s se preia date i
din alte tipuri de fiiere (de exemplu diverse versiuni de Excel, diverse versiuni de Fox Pro,
Paradox sau chiar documente hipertext).
Softul Epi Info este nsoit de mai multe proiecte pentru exemplificare i auto-nvare,
dintre care cel mai simplu este Sample.mdb.
Lansai n execuie comanda:
Read (Import) Data Formats: Epi 2000
Data Source: Sample.mdb
Show: Views
Views: viewBabyBloodPressure
Vei constata c aceasta este de fapt comanda:
READ 'C:\...\Epi_Info\Sample.mdb':viewBabyBloodPressure
List, din grupul Statistics, este comanda de afiare sub form tabelar (Grid sau HTML)
a valorilor unor variabile din fiierul activ de date. Implicit, pentru valoarea * n lista
Variables, vor fi afiate valorile pentru toate variabilele. Dac ns vor fi selectate doar unele
variabile, afiarea valorilor se va efectua doar pentru aceste variabile. Aceast comand
permite i modificarea valorilor variabilelor din fiierul activ de date (Allow Updates).
- 100 -
Frequencies, din grupul Statistics, este comanda cu care de obicei se ncepe analiza
unui nou set de date, pentru c nainte de a face prelucrri statistice mai complicate, vrem s
aflm cteva informaii de baz, legate de distribuiia datelor. Comanda se poate folosi att
pentru variabile calitative, ct i pentru variabile cantitative, i conduce la obinerea unui
tabel-sintez care conine toate valorile variabilelor specificate n lista Frequency of:,
mpreun cu frecvenele absolute (numrul de apariii), procentele i procentele cumulate
pentru fiecare valoare a variabilei.
De asemenea, n tabel este trecut i o schi de reprezentare grafic de tip cu bare.
n figura de mai jos este prezentat efectul comenzii
FREQ Birthweight
Birthweight in Oz (X1)
Frequency
Percent
90
6.3%
6.3%
95
6.3%
12.5%
100
6.3%
18.8%
105
12.5%
31.3%
120
25.0%
56.3%
125
18.8%
75.0%
130
6.3%
81.3%
135
6.3%
87.5%
150
6.3%
93.8%
160
6.3%
100.0%
Total
16
100.0%
100.0%
- 101 -
Cum Percent
MEANS AgeInDays
Frequency
Percent
Cum Percent
18.8%
18.8%
43.8%
62.5%
25.0%
87.5%
12.5%
100.0%
Total
16
100.0%
100.0%
Obs Total
16 53.0000
Minimum
2.0000
Mean Variance
3.3125
.8958
25%
Median
3.0000 3.0000
Std Dev
.9465
75%
Maximum
4.0000
5.0000
Mode
3.0000
Comanda Means poate fi folosit ns numai pentru variabile cantitative; pentru cele
calitative trebuie s ne mulumim cu rezultatele comenzii Frequencies.
Comanda Select, din grupul Select/If, este folosit pentru selectarea unui grup de
nregistrri care ndeplinesc un anumit criteriu. Dup selectarea grupului de nregistrri, n
- 102 -
prelucrare vor fi luate n calcul doar acestea. Comanda Select rmne activ pna la anularea
ei (Cancel select).
Ca exemplu, s selectm noii nscui cu vrsta (exprimat n zile) mai mare de 3. n
caseta Select Criteria: formai expresia AgeInDays>3. n urma unei comenzi List se va
obine urmtorul rezultat:
Observation Birthweight in
Number
Ounces (X1)
2
120
Age in
Days(X2)
4
130
92
125
98
120
96
10
90
95
10
14
150
97
14
- 103 -
(Bar sau Rotated Bar), diagramele de tip rozet (Pie) i histogramele (Histogram). Primele
dou tipuri sunt potrivite pentru afiarea informaiei despre variabilele care au un numr
mic de valori (n special variabile calitative). Ultimul tip este adecvat prezentrii
sumarizate a variabilelor care au un numr mare de valori numerice (aa cum este cazul
greutii exprimat n grame, sau a nlimii exprimat n centimetri), bineneles dup ce se
realizeaz gruparea valorilor n cteva intervale de valori.
Comanda Graph, din grupul Statistics, este folosit pentru a realiza reprezentri
grafice ale variabilelor din fiierul activ de date. Ca un exemplu, s deschidem (din sursa
Sample.mdb) cu ajutorul comenzii Read (Import) tabelul viewSmoke. Cu ajutorul
comenzii Graph vom prezenta valorile variabilei Sex ntro diagram cu bare
(dreptunghiuri). Pentru aceasta n fereastra obinut prin lansarea comenzii, alegem Bar n
lista Graph Type: i Sex n X-AXIS Main_Variable(s):. n Y-AXIS Show values of: va
fi pstrat valoarea implicit Count. Titlul diagramei va fi: Repartitia pe sexe a
persoanelor fumatoare | creat de ... (numele d-voastr). Dup afiare, diagrama obinut va
fi exportat (File Export...) n format jpg dup care va fi redenumit nume_DISX.jpg
alegnd i calea de acces prin opiunea Export Destination: File
Browse.
n mod asemntor se procedeaz pentru variabila Race pentru care vom alege tipul de
diagram Rotated Bar, apoi pentru variabila Marital pentru care alegem tipul de grafic
Pie. Salvai cele dou diagrame, dup ce ai ales titluri adecvate, n fiiere cu denumirile
nume_DIRACE.jpg respectiv nume_DIMAR.jpg. Pentru variabila cantitativ Age tipul de
diagram adecvat va fi Histogram, pentru care vei stabili lungimea intervalului de grupare
la 10, iar prima valoare va fi 0. Diagrama obinut va fi salvat n fiierul
nume_DIAGE.jpg. Ce titlu i-ai stabili?
n continuare, dorim s reprezentm grafic variabila Weight separat pentru fiecare
valoare a variabilei Sex. Pentru aceasta, alegem tipul de diagram Histogram, variabila
principal Main_Variable(s): va fi aleas Weight, lungimea intervalului de grupare va fi
15, titlul principal va fi: Repartitia greutatii in functie de sex | creat de ... (numele dvoastr), la opiunea One Graph for Each Value of alegem variabila Sex, vom bifa
opiunea Multiple Graph per Page i vom introduce valorile 2 pentru No
Across/Horizontal respectiv 1 pentru No Down/Vertical. Vom salva diagramele obinute
sub numele nume_DIAGESX1.jpg respectiv nume_DIAGESX2.jpg.
Ca un exerciiu de control, deschidei tabelul viewOswego din proiectul Sample.mdb.
Redirectai rezultatele prelucrrilor urmtoare spre fiierul nume_OSW. Fiecare comand va
fi nsoit de un text explicativ, n care vei specifica ce se obine cu comanda respectiv.
Listai coninutul fiierului. Pentru variabila Age vei calcula media pentru persoanele
sntoase (criteriul ill=No) i separat pentru persoanele bolnave (ill=Yes).
Reprezentai grafic adecvat variabilele Age, Sex, Ill, salvai diagramele obinute n
format JPG i inserai-le, nsoite de comentariile d-voastr referitoare la ceea ce dorii s
prezentai n diagramele respective, ntr-un document denumit nume_DIOSWEGO.doc.
- 104 -