Documente Academic
Documente Profesional
Documente Cultură
Indicaii generale:
n decursul fiecrei lucrri practice vei aborda i efectua, n laborator, cteva
aciuni ca exemplificare a unor cunotine teoretice prezentate la curs. Aceste aciuni pot fi
nelese pe deplin NUMAI n conexiune cu cunotinele teoretice respective. Pentru fiecare
lucrare practic a fost pregtit un text, n medie de 15 pagini, coninnd indicaii detaliate
asupra temei sau temelor abordate. Textul conine uneori i explicaii teoretice minimale
necesare nelegerii relevanei temelor respective. Totui, fr parcurgerea anterioar a
notelor de curs de regul este dificil nelegerea coninutului lucrrilor practice.
(Microsoft) Word este poate cel mai folosit editor de documente clasice. Dei
ofer posibiliti de editare extrem de complexe, el rmne pn la un punct destul de
uor de utilizat. Acest lucru se datoreaz n special meniurilor i comenzilor care i stau la
dispoziie utilizatorului, utile att pentru cei care tiu s lucreze cu acest soft, ct i pentru
cei mai puin iniiai. n plus, de la varianta 2000, Word se prezint i cu comenzile n
limba romn.
Menionm c avei la dispoziie o variant mai veche a aplicaiei. Pentru
nceptori, chiar i varianta coninut n suita Office 2007 este foarte dificil (ca s nu mai
vorbim despre varianta coninut n Office 2010), de aceea preferm s lucrm cu o
variant mai simpl; dup familiarizarea cu aceast variant, adaptarea la Word 2007 sau
la Word 2010 va fi mult mai uoar.
Scopul lucrrii este familiarizarea cu opiunile Word, cu comenzile sale. Vom intra
n amnuntele editrii cu aplicaia Word, descoperind diverse modaliti particulare de
editare, inserare i manevrare a obiectelor create de aceast aplicaie. Pe scurt, ar trebui s
vedem ce vrem noi de la Word i ce vrea el de la noi.
n aceast prim lucrare practic:
a) v vei familiariza cu contextul n care se desfoar activitatea de laborator i
v vei nsui protocolul de lucru;
b) v vei familiariza cu sistemul de operare Windows XP i cu modalitile de
stocare i transfer de date pe care le ofer;
c) Vei exersa diverse faciliti ale softului n crearea documentelor;
d) V vei familiariza cu controlul corectitudinii gramaticale.
e) vei accesa baza de documentare Medline.
Teme:
1: accesul n site-ul disciplinei
2: controlul biroului de lucru i al cminului
3: startarea aplicaiei Word
4: setarea paginii i folosirea tastelor speciale
5: formatarea paragrafelor i stiluri
6: explorarea Internetului; MEDLINE
Softul ce va fi utilizat n lucrarea practic:
Notepad, Paint, Windows Explorer, Internet Explorer
-1-
Ecranul este
stins?
Da
Asigurai-v c
monitorul este
alimentat cu curent
electric. Apsai
comutatorul
monitorului. Un LED
aprins va indica starea
de funcionare.
Da
Nu
Calculatorul este
n funciune?
Nu
Da
Nu
-2-
UpArrow
MultiDrag
Cross
HourGlass
SQLWait
IBeam
Drag
No
SizeNESW
NoDrop
AppStart
SizeNS
HSplit
Help
SizeWE
VSplit
HandPoint
Mausul are trei butoane: cel din stnga, cel din dreapta i cel din mijloc (dar ar
putea avea doar dou,eventual i o rozet!). Cel mai des folosit este cel din stnga; de
obicei, atunci cnd se vorbete despre un clic sau un dublu-clic, se presupune c aceast
aciune este efectuat asupra BUTONULUI DIN STNGA.
Vei obine un DUBLU-CLIC numai dac timpul ntre cele dou clic-uri
consecutive este foarte scurt (de ordinul unei zecimi de secund) i dac n acest timp nu
deplasai mausul. O alt posibilitate de a obine acelai efect (ca al unui dublu-clic) este
cea de a efectua un clic urmat de apsarea tastei Enter.
Observai c butonul OK din caseta de dialog Logon Information are chenarul ceva
mai gros. Aceasta nseamn c apsarea butonului poate fi obinut i prin tastarea lui
Enter, nu numai printr-un clic cu mausul. De regul, un efect oarecare va putea fi obinut
ca urmare a mai multor evenimente: aciuni asupra mausului, apsri pe taste, modificri
ale unei imagini de control dat de o camer video, apariia unui anumit sunet etc.
Odat cu apsarea butonului OK din caseta de dialog Logon Information pe ecran
se va afia biroul de lucru (desktop) vezi figura urmtoare.
Cele cteva iconie (pictograme) care se afl pe biroul de lucru, n partea stng,
reprezint principalele instrumente care v sunt puse la dispoziie. Cu un dublu-clic
deasupra lor vei putea:
explora calculatorul d-voastr (My Computer);
explora calculatoarele din reelele locale din cldirea facultii (Network
Neighborhood);
accesa resursele Internetului (Internet Explorer);
vizualiza sau chiar recupera fiierele terse (Recycle Bin);
declana direct cteva aplicaii (Word, Excel, PowerPoint, EpiInfo).
-3-
Poziia iconielor pe ecran poate fi modificat prin simpl tragere cu mausul, dar v
recomandm s nu le mutai n partea dreapt.
La baza desktop-ului se afl bara activitilor (taskbar), avnd n marginea stng
butonul Start. Un clic (cu butonul stng al mausului) deasupra acestuia va avea ca efect
deschiderea meniului Start, n care
se prezint lista aplicaiilor instalate pe calculator, eventual se pot lansa n
execuie aceste aplicaii (Programs);
se prezint de obicei lista ultimelor documente create (Documents);
se poate cuta ceva (Find);
se poate cere ajutor (Help) etc.
Explorai lista aplicaiilor instalate pe calculatorul la care vei lucra. Notai-le n
caiet i, n timp, aflai la ce pot fi ele folosite i n ce condiii. Dar acum este momentul s
trecei la capitolul Aciuni.
B Utilizatorul anterior al calculatorului d-voastr NU A NCHEIAT CORECT
sesiunea de lucru. n aceast situaie vei apsa butonul Start (colul din stnga-jos) apoi
n meniul Start vei alege comanda Shut Down, opiunea Close all programs and log
on as a different user. La apariia casetei de dialog Welcome to Windows continuai cu
situaia A de mai sus.
C Vei starta calculatorul apsnd pe comutatorul Power de declanare a
alimentrii cu curent electric. Imediat ncepe iniializarea sa, care poate dura de la cteva
secunde pn la cteva minute. La nceput se prezint pe ecran n mod text, cu litere
albe pe fond negru rezultatele etapei de testare a componentelor calculatorului. Dac
aceast etap se termin corect, va urma ncrcarea sistemului de operare.
Pe calculatoarele din laborator a fost instalat sistemul de operare Windows XP.
Vei putea observa sigla firmei Microsoft, n cadrul casetei de dialog Welcome to
Windows.
Odat cu apariia casetei de dialog continuai cu situaia A de mai sus.
-4-
Aciuni
Tema 1: accesul n site-ul disciplinei. Ai observat pe biroul de lucru o iconi
sub care se afl inscripia Internet Explorer; ea corespunde unei aplicaii care poart
acelai nume. Cu un dublu-clic deasupra iconiei (sau inscripiei) vei declana aceast
aplicaie. Aplicaia este DE TIP CLIENT i a fost configurat (pe calculatorul pe care
lucrai) n aa fel nct s fac apel la aplicaia-server de pe calculatorul principal al
catedrei noastre, calculator care este identificat n Internet prin adresa (IP address)
10.0.1.126. Aceast aplicaie-server va trimite spre calculatorul d-voastr pagina de
ntmpinare din figura urmtoare.
Dac nu se ntmpl acest lucru, atunci fie aplicaia-server nu este activ (cerei
administratorului s o activeze), fie aplicaiei-client Internet Explorer de pe calculatorul
d-voastr i-a fost modificat configuraia iniial. n acest din urm caz vei tasta n
caseta-text Address localizatorul:
http://10.0.1.126
dup care, eventual, vei apsa butonul Refresh.
Reinei c aplicaia-server v identific dup numrul matricol acordat de ctre
secretariatul facultii, aadar va trebui s aflai care este acesta. Parola iniial a fost
creat automat, din cifrele numrului matricol urmate de o liter. Exemplu: studentul
Andrian A. Mihai Alexandru (numr matricol 10167) avea identificatorul mg10167 i
avea parola iniial 10167q.
Regulile de formare a parolei iniiale sunt stabilite de ctre administratorul de
sistem. Respectai indicaiile acestuia!
Atenie, nceptori, la tastele-liter! Apsnd o asemenea tast, de exemplu tasta A,
putem obine fie caracterul 'A', fie caracterul 'a'. Starea LED-ului Caps Lock de pe
tastatur determin care dintre aceste dou caractere va fi obinut; mai precis, dac LEDul este stins se va obine 'a', iar dac LED-ul este aprins se va obine 'A'. Modificarea
strii LED-ului se poate obine prin apsarea tastei Caps Lock. Obinuii-v s folosii
tastatura avnd LED-ul Caps Lock STINS.
Prin tradiie (de la maina de scris!) combinaia de taste Shift+A inverseaz efectul
apsrii tastei A. (Atenie ns la starea LED-ului Caps Lock!)
Odat ce ai fost acceptai de ctre aplicaia-server, observai coninutul site-ului
catedrei. Dispunei acolo de toate informaiile necesare pentru elaborarea strategiei de
abordare a disciplinei. Reinei c:
a) va trebui s avei n decursul anului universitar activiti totaliznd cel puin
-5-
-6-
Vom discuta ulterior despre coninutul acestor dou bare. Deocamdat s trecem la
tastarea unui text, ntruct documentele au n principal coninutul sub form de text (dar
nu se reduc numai la acesta!). ncercai s RENUNAI la folosirea sintagmei scriu la
calculator pe care o enun, eronat, mult lume!.
Dac vom introduce un text n limba romn, este bine s ne asigurm, de la
nceput, c folosim tastatura romneasc. Schimbm tastaturile cu ajutorul combinaiei
de taste Alt+Shift urmrind ca pe bara de stare s fie afiat, n dreapta, mesajul RO.
Literele romneti , , , , se obin cu ajutorul tastelor din jurul tastei Enter. (Vei
constata destule neconcordane tast-caracter dac folosii o tastatur american
standard, german sau francez pentru a introduce text n limba romn! Reinei c
tastatura este un dispozitiv CONTROLAT DE CTRE SISTEMUL DE OPERARE
Windows NT i nu de ctre aplicaia Word!).
Folosii comanda FiierNou (New) pentru a deschide un document nou. Trebuie
s nelegem c, pn la prima salvare, coninutul acestuia este creat n memoria intern.
Volatilitatea memoriei interne face ca s pierdem acest coninut la orice defeciune n
alimentarea cu curent electric a sistemului. De aceea se recomand salvarea imediat a
oricrui document nou creat, dup care salvarea la fiecare dou-trei minute.
Denumirea noului fiier pe care-l creai va fi nume_WINNTS4.DOC (atenie nceptori,
nu tastai extensia!), iar coninutul pe care-l tastai este urmtorul:
Totul despre Microsoft Windows NT Server 4.0 Enter
Toate crile scrise despre un nou sistem de operare ncep
cu declaraia c acesta deschide o er nou.Enter
n lumea calculatoarelor, tot ce dateaz de dinainte de 1981
ine de pleistocen i la fiecare cteva luni ncepe o nou er.
Tot ceea ce nvai sptmna aceasta poate fi complet depit
sptmna viitoare! Enter
Una dintre principalele ocupaii ale celor care studiaz
industria calculatoarelor este s dezbat care dintre nouti sunt
originale i care au fost doar experiene fr viitor!Enter
Microsoft Windows NT Server versiunea 4.0, chiar dac nu n
ntregime revoluionar, a fost un pas mare n cutarea unui
software de reea puternic i solid, care s poat asigura
interconectarea sistemelor de diferite tipuri.Enter.
Dup cum vedei, textul de mai sus nu este aliniat, nu apare nici un fel de aranjament
grafic. (Se spune, prin abuz de limbaj, c NU ESTE EDITAT.)
Vei ncerca acum s salvai documentul nou creat. Reamintim c salvare
nseamn crearea unui fiier pe suport magnetic, al crui coninut este documentul. Pentru
aceasta avei la dispoziie dou comenzi n meniul Fiier (File), anume Salvare (Save) i
Salvare ca (Save As).
Pentru o prim salvare a documentului se poate aciona oricare dintre cele dou
comenzi, rezultatul va fi acelai: apariia casetei de dialog Salvare ca din figura de mai jos.
Apsai deci FiierSalvare (de exemplu). n caseta de dialog se poate observa jos
caseta combinat derulant Nume fiier. Introducei aici, PRIN TASTARE, numele
noului fiier, anume nume_WINNTS4. (Amintii-v c nume reprezint numele d-
-7-
voastr, nu i prenumele!)
Dedesubt, ntr-o list derulant Tip fiier se poate ALEGE tipul documentului.
(Atenie, ntr-o list derulant nu putei tasta!) Deocamdat tipul va rmne, implicit,
Document Word. n stnga sus, ntr-o alt list derulant se va stabili volumul de date i
dosarul n care va fi salvat documentul. Vei ALEGE n lista derulant Salvare n volumul
de date C: (adic prima partiie a discului fix local) iar dosarul Anul2. Apsai n
final butonul Salvare (din dreapta jos), iar textul introdus de d-voastr va fi salvat.
Dup salvare prsii aplicaia Word. Avei patru posibiliti de a face aceasta:
a) comanda Ieire (Exit) din meniul Fiier;
b) comanda Close din caseta de control (n colul din stnga-sus al ferestrei/n
stnga barei de titlu),
c) butonul Close, simbolizat cu X (n colul din dreapta-sus al ferestrei/n dreapta
barei de titlu),
d) comanda rapid Alt+F4.
Introducerea prin tastare a unui text nu este deloc cea mai important activitate de
editare ce poate fi realizat cu Word! Dup cum tim, aceast activitate poate fi realizat
cu aplicaii-accesoriu nesofisticate, cum este de exemplu WordPad, sau chiar elementarul
Notepad. Avantajul folosirii Word-ului const n posibilitile de formatare mult mai
ample, precum i n posibiliti de inserare de obiecte de alt natur dect textul (formule
matematice, imagini, sunete, filme).
Vom ncepe prin a ncerca s formatm textul introdus anterior. Evident, comenzile
pe care le vom utiliza se vor afla, n majoritate, n meniul Format.
S ne imaginm coninutul documentului nostru (oricare ar fi acesta) ca o secven
de caractere (ASCII) pe care le interpreteaz aplicaia Word. n cea mai mare parte, dar nu
toate, aceste caractere au fost introduse prin tastare! De exemplu, prin apsarea tastei
Enter introducem perechea de caractere 13, 10. Aceast pereche de caractere este
interpretat de ctre Word ca o comand de ncheiere a unui paragraf i ncepere a unui
paragraf nou.
Ne putem imagina c i alte caractere din secven vor fi interpretate ntr-un mod
-8-
aparte de ctre Word, anume ca nite comenzi de formatare a blocului de text delimitat.
Pentru a nelege perfect efectul comenzilor de formatare, trebuie s ne dm seama
de modul logic de organizare a documentelor. Trebuie s tim c orice document este
organizat n seciuni, fiecare seciune este compus dintr-o succesiune de paragrafe, iar
fiecare paragraf este compus dintr-o succesiune de cuvinte. (Terminarea unui cuvnt este
semnalat de caracterul 32, iar terminarea unei seciuni prin caracterul 12.)
Evident, fiecare cuvnt este compus din litere, fiecare liter fiind de fapt un
grafem dintr-un anumit font. (Literele vor putea fi i semne de punctuaie, cifre sau alte
semne.)
Pe de alt parte, va trebui s inem seama de faptul c documentul nostru ar putea fi
imprimat pe hrtie. Prin tradiie imprimarea are loc pe pagini succesive, cu lsarea de
margini albe de mrime controlabil. Pe fiecare pagin putem avea mai multe cadre care
se pot suprapune parial (fie transparent, fie opac) etc.
Tradiia tipografic impune mai multe tipuri de aliniere posibile, mai multe mrimi
de liter, mai multe spaieri posibile ntr-un paragraf sau chiar ntre rndurile unui
paragraf. Sunt permise de asemenea indentrile (care sunt abateri n plus sau n minus fa
de margini) precum i alinierile prin folosirea tabulatoarelor.
Toate acestea ne dau o idee global despre coninutul unui document ca succesiune
de blocuri de text intercalate cu secvene de control.
Tema 4: setarea paginii i folosirea tastelor speciale. Lansai aplicaia Word.
Deschidei documentul (creat anterior) nume_WINNTS4. Tot ce avei de fcut este s
urmai calea comenzii Deschidere (Open) din meniul Fiier (File) i s alegei fiierul
din dosarul n care acesta a fost depus anterior, prin intermediul unei casete de dialog
asemntoare cu cea de mai sus.
(Trebuie menionat aici c Word reine lista ultimelor fiiere-document cu care s-a
lucrat; gsii aceast list n partea inferioar a meniului Fiier.)
Personalizai-v documentul cu ajutorul comenzii Proprieti din meniul Fiier.
Alegei aadar FiierProprieti, apoi alegei tableta Rezumat. La rubrica Titlul
declarai un titlu pentru acest document. Titlul documentului poate diferi de numele
fiierului i poate fi folosit ulterior, atunci cnd cutai acest fiier. La rubrica Subiectul
precizai un subiect pentru acest document. Fiierele similare pot fi grupate mpreun dup
subiect, astfel nct s putei cuta ulterior printr-o singur operaiune toate fiierele
similare (care au acelai subiect). La rubrica Autorul introducei prin tastare numele i
prenumele d-voastr, iar la rubrica Societate introducei Facultatea de Medicin. Putei
s completai i alte rubrici; recomandm s analizai cu atenie posibilitatea plasrii unor
cuvinte-cheie, n scopul uurrii regsirii ulterioare a documentului. TOATE
DOCUMENTELE PE CARE LE VEI CREA N CADRUL LUCRRILOR PRACTICE
VOR TREBUI PERSONALIZATE CU NUMELE I PRENUMELE D-VOASTR la
rubrica Autorul.
Una dintre primele aciuni pe care ar fi trebuit s le fi urmat este aceea de setare a
paginii de hrtie, n ideea imprimrii documentului. S o facem acum. Deci, Fiier
Iniializare pagin. n caseta de dialog aprut sunt mai multe tablete, anume:
a) Margini, pentru fixarea mrimii marginilor paginii de hrtie;
b) Dimensiune hrtie, pentru stabilirea tipului de pagin de hrtie i a orientrii ei;
c) Surs hrtie, pentru a fixa modul de antrenare a hrtiei ctre imprimant;
-9-
- 10 -
- 11 -
- 12 -
- 13 -
- 14 -
cursorului de editare.
Tema 6: explorarea Internetului; MEDLINE. Continuai activitatea cu Internet
Explorer. Tastai n caseta text Address localizatorul paginii de ntmpinare a instituiei
americane National Library of Medicine
http://www.nlm.nih.gov
ncercai s identificai o cale de acces spre baza de documentare MEDLINE, prin
intermediul serviciului PubMed. Notai-v paii pe care i-ai urmat. Dac nu ai reuit,
atunci privii figura de mai jos. Vi se ofer dou posibiliti:
una direct, prin intermediul legturii (evideniat cu litere nclinate, albastre)
din dreapta ferestrei;
cealalt indirect, prin inter-mediul legturii spre grupul de informaii privind
sntatea (HEALTH INFORMATION).
Ce putei gsi n MEDLINE? Poate, pentru moment, nimic interesant: MEDLINE
este o baz de date bibliografic, n care se indexeaz (aproape) toate articolele cu
coninut medical aprute n reviste, n ntreaga lume. NU APARE CONINUTUL, CI
DOAR REZUMATUL fiecrui articol. V vei reconsidera interesul peste civa ani.
- 15 -
Indicaii generale:
Tradiia activitilor contabile cere ca datele privind veniturile i cheltuielile unei
firme sau gospodrii s fie aranjate sub forma unui tabel. Modul tabelar de aranjare a
datelor este adecvat i pentru alte activiti, n general tuturor activitilor n care datele
primare urmeaz a fi prelucrate. Evident, i n domeniul medical ntlnim deseori situaii
n care aranjarea tabelar a datelor prezint avantaje considerabile, i aceasta nu doar n
gestiunea spitalului sau a cabinetului medical. Pentru asemenea activiti pentru care
aplicaia Word nu este adecvat, ne vom familiariza cu aplicaia Excel.
Un prim scop al lucrrii const n exemplificarea obinerii unor indicatori statistici
i a efecturii calculelor simple n Excel. Apoi se exploreaz colaborarea ntre Word i
Excel n domeniul conversiei tabelelor, foarte util pentru efectuarea unor operaiuni de
separare; urmeaz explorarea n Excel a funciilor statistice i a celor dedicate prelucrrii
textelor, precum i grafica n Excel.
Se va constata c exist destule compatibiliti ntre organizrile tabelare n cele
dou softuri; cu toate acestea, Excel este net superior n ceea ce privete calculele, dar mai
greoi n operaiunile de aranjare estetic.
Alt scop al lucrrii l constituie repetarea felului n care se reprezint diagramatic,
cu Excel, anumite date de sintez.
n continuare se vor folosi unele funcii implementate n Excel pentru a se efectua
diverse calcule statistice simple, dar nu numai.
n aceast lucrare practic:
a) V vei familiariza cu calculul tabelar.
b) Vei exersa obinerea rapid a indicatorilor statistici uzuali;
c) Vei explora posibilitile de colaborare ntre aplicaii;
d) V vei familiariza cu folosirea funciilor ncastrate.
Teme:
7: aplicaia Excel
8: frecvene, mediane i cuartile n Excel
9: calcule simple n Excel
10: diagrame cu Excel
11: funcii n Excel (COUNTIF, CONCATENATE, AVERAGE, STDEV)
special: diagrame cu coloane
- 16 -
- 17 -
- 18 -
De la 1 la 4 sptmni
De la 4 sptmni la 1 an
2007 (prog.)
1987
1967
1947
1927
0%
10%
20%
30%
40%
50%
60%
70%
80%
90%
100%
112
523
1715
3371
5906
8655
11214
11628
10338
8228
5789
3356
1828
685
224
18
- 19 -
11628
12000
11214
10338
10000
8655
8228
8000
5906
6000
4000
5789
3371
3356
1828
1715
2000
685
523
224
112
18
0
Sub 150
150 cm
152.5 cm
152.5 155 cm
155 157.5 cm
157.5 160 cm
160 162.5 cm
162.5 165 cm
165 167.5 cm
167.5 170 cm
- 20 -
170 172.5 cm
172.5 175 cm
175 177.5 cm
177.5 180 cm
180 182.5 cm
182.5 185 cm
Peste
185 cm
0%
0%
0%
1%
1%
2%
2%
5%
5%
8%
8%
11%
12%
14%
15%
Sub 150 cm
150 - 152.5 cm
152.5 - 155 cm
155 - 157.5 cm
157.5 - 160 cm
160 - 162.5 cm
162.5 - 165 cm
165 - 167.5 cm
167.5 - 170 cm
170 - 172.5 cm
172.5 - 175 cm
175 - 177.5 cm
177.5 - 180 cm
180 - 182.5 cm
182.5 - 185 cm
Peste 185 cm
16%
- 21 -
Aparent, cele dou distribuii cumulate difer ntre ele! Dar, pentru a rspunde
statistic corect la ntrebare, va trebui s adoptm un limbaj adecvat. Vom reveni.
n studiile privind obezitatea cercettorii au opinii mprite: cei americani consider
important percentila a 95-a, iar cei francezi percentila a 97-a. Mai precis, aceste percentile
ar constitui grania ntre supraponderal i obez.
Obinerea medianei, cuartilelor i percentilelor este mult uurat n situaiile n care
dispunem de datele primare i nu de prezentri sintetice.
De exemplu, dispunem de datele primare din fiierul LP02_1.xls. Pentru biei
greutile sunt trecute aici, pe singura foaie Greutati, n domeniul A2:A98; pentru fete
gsim datele n domeniul B2:B151. Medianele respective vor putea fi obinute imediat, cu
formulele
=MEDIAN(A2:A98)
=MEDIAN(B2:B151)
=MEDIAN(A2:A98,B2:B151)
Informai-v asupra utilizrii funciilor QUARTILE() i PERCENTILE() n Excel.
(Fiierele MG_LP... trebuie preluate prin copiere; nu se lucreaz direct cu Excel
asupra originalului. Reamintim c ele pot fi preluate:
a) Din dosarul special al reelei locale, sau
b) Prin ftp, din site-ul 10.0.1.126.)
- 22 -
Tema 9: calcule simple n Excel. Riscul apariiei unei forme oarecare de cancer la
fumtori (sunt fumtori cei care fumeaz pip sau mai mult de o igar pe zi) a fost evaluat
la 0.085. n acelai studiu de tip caz-control au mai fost evaluate urmtoarele riscuri:
- Riscul apariiei unei maladii cardiovasculare la fumtori, la 0.143;
- Riscul apariiei unei forme de cancer la nefumtori, la 0.032;
- Riscul apariiei unei maladii cardiovasculare la nefumtori, la 0.048.
Pentru o evaluare comparativ se folosete noiunea de risc relativ (RR). Astfel, pentru
formele de cancer
0.085
RR cancer
2.66
0.032
exprim faptul c un fumtor este de peste 2.6 ori mai expus apariiei unei forme de cancer
dect un nefumtor. Pentru maladiile cardiovasculare, calculm i interpretm analog
0.143
RR cardiovascular
2.98 .
0.048
Asemenea calcule simple sunt uor programabile n Excel. Creai o carte de calcul
nume_RISCURI.xls, cu o foaie denumit Calcule. Aici, n celula A2 introducei textul
riscul pentru fumtori, iar n celula A3 textul riscul pentru nefumtori. Cu condiia
completrii ulterioare a celulelor B2 i B3, putei plasa n celula B4 formula
=B2/B3
(Expresia #DIV/0! n-ar trebui s ne surprind. Celula B3 este goal, valoarea ei este
asimilat cu 0, aadar formula ne indic o mprire la 0.)
S plasm n celula B1 textul cancer, iar n celula C1 textul maladii
cardiovasculare. De ndat ce completm celulele B2 i B3 cu valorile 0.085 respectiv
0.032, vom observa apariia valorii riscului relativ n celula B4. Dar dup completarea
celulelor C2 i C3 cu valorile 0.143 respectiv 0.048, riscul relativ pentru maladii
cardiovasculare nu se completeaz automat! Va trebui s introducem formula de calcul i n
celula C4!
Nu este nevoie de tastarea unei noi formule. Vom putea selecta celula B4 n care se
gsete vechea formul i o vom putea extinde, prin tragere de mner, spre dreapta!
Riscul pentru fumtori este o ESTIMARE a probabilitii ca unui fumtor s-i apar o
form oarecare de cancer, respectiv o maladie cardiovascular. Aceste estimri sunt obinute
n urma unor studii bine controlate.
O alt noiune des ntlnit n special n epidemiologie este cea de cot (odds n
englez), provenit din limbajul pariorilor; ea exprim raportul unor anse.
n cazul formelor de cancer, cota pentru fumtori se calculeaz astfel
0.085
Oddsf
0.093
1 0.085
iar pentru nefumtori
0.032
Oddsnf
0.033
1 0.032
Raportul celor dou cote este notat de obicei OR (iniialele de la odds ratio.)
Pare simplu s programm calculul unei cote. S plasm n celula A5 textul cota
pentru fumtori, iar n celula A6 textul cota pentru nefumtori.
- 23 -
Numr pacieni
stenoz mitral
boal mit al
insuficien mitral
stenoz aortic
boal aortic
8
24
4
11
4
Total pacieni
51
Frecvena relativ
Datele din primele dou coloane sunt suficiente pentru a putea crea o diagram de tip
histogram, mult mai adecvat prezentrii acestui tip de informaie dect secvena de
numere din tabel. Obinerea unei asemenea diagrame se face cu ajutorul accesoriului
Graph Chart. (folosim opiunea Obiect din meniul Inserare)
Acum vom ncerca s exploatm colaborarea ntre Word i Excel care, dup cum
tim, fac parte din acelai pachet de aplicaii (Microsoft Office). Minimizai fereastra
aplicaiei Word.
- 24 -
- 25 -
Nu
i
lorurlp
ma c ie n
30
24
25
8%
20
16%
22%
te n
s
m
itraol z
bo
m
itraal l
15
in s
um
fictra ie
l n
11
10
te n
s
a o zrtic
bo
aa
o lrtic
8%
46%
0
stenoz mitral
boal mitral
insuficien mitral
stenoz aortic
boal aortic
De unde provin frecvenele absolute din tabelul iniial? Rspunsul este imediat: din
nregistrrile primare.
nregistrrile primare au fost stocate n fiierul denumit LP02_2.xls. Pentru a-l
prelua, identificai pe desktop (biroul de lucru) n ce fel avei acces la Reeaua din
vecintate (Network neighborhood). De fapt trebuie s identificai reeaua INFOMED n
cadrul creia se afl calculatorul Infomedcd-pdc. Coninutul dosarului MG2 este accesibil
tuturor utilizatorilor care s-au identificat cu numele de acces mg......
Preluai (prin copiere/lipire) fiierul LP02_2.xls n memoria calculatorului local,
mai precis n dosarul Anul2. Deschidei ACEST exemplar cu un dublu-clic.
Extensia XLS este specific registrelor create de aplicaia Excel, de aceea nu este de
mirare c fiierul va fi deschis de ctre Excel.
Vei constata c registrul are o
singur foaie de calcul, pe care sunt
plasate cteva date pentru 51 de pacieni:
numele i prenumele, sexul, vrsta i
diagnosticul.
Fiecrui pacient i este rezervat un
rnd, ncepnd cu rndul nr. 2.
Diagnosticului i este rezervat coloana F.
Putem obine frecvenele absolute ale
celor cinci diagnostice printr-o simpl
operaiune de sortare. Selectm coloanele
A-F (prin tragere cu mausul deasupra
inscripiilor) dup care comandm
Sortare din meniul Date. Caseta de dialog Sortare ne ofer posibilitatea de a
- 26 -
- 27 -
- 28 -
n continuare vei apela comenzi din meniul Tabel. Mai nti vei selecta tabelul,
plasnd cursorul de editare undeva n interiorul su i apoi apelnd SelectareTabel.
Odat selectat, vei face apel la comanda ConversieTabel n text; n caseta de dialog
vei alege ca separator n paragrafe sfritul de paragraf (format din secvena de caractere
13, 10).
Rezultatul este simplu: nlocuirea tabelului cu o list de 25 de componente. Aceast
list fiind selectat (dac nu, selectai-o!), vei comanda acum ConversieText n tabel.
De aceast dat, n caseta de dialog vei alege blancul (caracterul 32) ca separator al
textului n coloane.
Rmne acum doar s selectai cele dou coloane (care conin numele i prenumele),
s le copiai, apoi s le lipii ncepnd cu celula J2 a foii de calcul Excel.
Valorile din coloana D sunt binare (0, respectiv 1). Ne dm seama c valoarea 0
reprezint sexul masculin (i nu invers). Pentru a nu da posibilitatea unei interpretri
greite, ar fi bine s nlocuim valorile 0/1 prin masculin/ feminin/
n acest scop, n celula J2 vei plasa (prin Lipire Funcie) funcia IF(). Cele trei
argumente ale acestei funcii sunt clare:
a) testul logic, ca expresie logic de referine la celule sau domenii; n cazul nostru
se refer doar la coninutul celulei D2;
b) valoarea funciei pentru cazul n care expresia logic test este adevrat (1);
c) valoarea funciei pentru cazul n care dac expresia logic test este fals (0).
Preluai (prin Copiere/Lipire special) valorile din coloana J n coloana K. Modificarea
valorilor text poate fi fcut prin intermediul funciilor de prelucrare de text, cum sunt
PROPER(), UPPER(), LOWER(), SUBSTITUTE() etc. Verificai modul de aciune i
efectul fiecreia.
Valorile coloanei E reprezint vrstele, exprimate n ani. Vei calcula vrsta medie, precum
i abaterea standard (deviaia standard) a vrstelor pacienilor de la medie. n acest scop se
pot folosi funciile statistice AVERAGE(), respectiv STDEV().
Plasai n celula E27 (prin tastare sau apelnd la Lipire Funcie; dac tastai, nu
uitai caracterul = naintea formulelor!) formula
=AVERAGE(E2:E26)
iar n celula E28 formula
=STDEV(E2:E26)
Ar trebui s obinei rezultatele 48.68, respectiv 10.40. Folosii comanda Celule din
meniul Format pentru a stabili ca n afiarea rezultatelor s se foloseasc numai dou cifre
- 29 -
- 30 -
d)
plasai desenul ca foaie nou a registrului, cu denumirea diagrama
frecvenelor. Eliminai din registru cele dou foi de calcul, Foaie1 i Foaie2, care nu
conin nimic. (Probabil c va vei da seama de ce nu putei acorda denumiri lungi foilor
registrului! Recomandm s alegei denumiri scurte dar sugestive.)
Codificarea maladiilor prin coduri le numerice 111, 222, 333, 444, 555 este complet
artificial. n crearea codurilor se obinuiete combinarea cifrelor cu litere. Modificai aceste
coduri (ar fi de preferat s-o facei pe o copie a foii de calcul, fie aceasta Coduri) prin A1, A2,
B1, C1, C2. Putei observa c funcia FREQUENCY() nu mai d rezultatele dorite!
Aceste rezultate pot fi obinute ns cu COUNTIF(). Plasai n celula M2 formula
=COUNTIF(F$2:F$26,L2)
apoi extindei-o la toate cele cinci celule ale domeniului M2:M6. Repetai crearea diagramei
cu coloane; ar trebui s observai c Excel o creeaz automat, fr a mai fi nevoie de
eliminarea de serii!
Ar fi de dorit ca s plasai valorile seriei de date deasupra coloanelor, eventual
evideniate prin bolduire i mrime 18.
Nu uitai c pentru validarea lucrrii practice fiierele depuse trebuie s fie complete i
s aib declarat autorul.
Tema special: diagrame cu coloane. Datele din tabelul urmtor sunt preluate din
Anuarul Statistic al Populaiei (2005). n tabel se prezint numrul de familii cu N copii.
Nr. copii n familie Numrul de familii
0
11204
1
114992
2
67712
3
19609
4
8369
5
4284
6
2329
7
1478
>7
2247
De la un eantion investigat de 46 de familii s-au obinut urmtoarele rezultate:
Nr. copii n familie Numrul de familii
0
3
1
20
2
15
3
5
4
3
>4
0
Reprezentarea diagramatic ne permite o percepere mai rapid a seturilor de date
(comparativ cu citirea numerelor din tabele).
Vom ntocmi n Excel o diagram cu coloane, dup ce vom plasa datele pe o foaie de
calcul (denumit, ca de obicei, Datele), n domeniul A1:C10. Vom selecta acest domeniu,
dup care vom folosi casetele de dialog Inserare diagram. n final diagrama ar trebui s arate
ca n figura urmtoare.
- 31 -
Putem
afirma
c
eantionul nostru este
reprezentativ? Aparent
da,
dac
reprezentativitatea este
considerat relativ la
numrul de copii.
Totui,
afirmaia
ar
trebui s se bazeze pe
ceva obiectiv, nu doar
pe o examinare vizual a
diagramei!
De exemplu, s-ar putea
baza pe faptul c
distana
dintre setul de date din eantion i setul de date din Anuarul Statistic este mic, mai mic
dect un prag de separare ntre distanele mici i distanele mari.
(Un asemenea prag obiectiv se stabilete de obicei exploatndu-se o anumit distribuie
2
. Vom reveni.) Creai documentul nume_ANUAR.doc coninnd cele dou tabele i
diagrama de mai sus, cu explicaiile necesare.
- 32 -
Lucrarea practic 3
Indicaii generale:
Un prim scop al lucrrii practice este explorarea posibilitilor de obinere de
diagrame de tip statistic de evoluie i de comparaie cu Excel, inclusiv a celor de tip
Pareto.
Un al doilea scop al lucrrii practice este aprofundarea modalitilor de calcul
aritmetic cu Excel, prin efectuarea de medii ponderate.
Un alt scop al lucrrii practice este explorarea posibilitilor de a efectua operaiuni
specifice bazelor de date cu Excel, prin intermediul funciei VLOOKUP. Evident, nefiind
un soft specific unor asemenea operaiuni, ele vor fi efectuate ceva mai dificil.
Vei aborda apoi un soft util n situaii care necesit prezentarea unor rezultate n
cadrul expunerilor, conferinelor, etc. Este vorba despre o alt component a ansamblului
Microsoft Office, anume PowerPoint. Acest soft poate fi utilizat i pentru a crea animaii,
dar fr preteniile unui film. Ca tem special, vei crea o asemenea animaie.
n aceast lucrare practic:
a) vei crea diagrame de comparaie de tipul Pareto, de asemenea diagrame de
evoluie;
b) vei explora posibilitile de a calcula medii ponderate;
c) vei crea tabele i diagrame n documente;
d) vei crea o prezentare de rezultate, n care vei controla tipul de apariie a
diapozitivelor precum i timpii de tranziie de la un diapozitiv la urmtorul;
e) vei simula o animaie cu imagini tomografice.
Teme
12: diagrame Pareto
13: calculul mediei ponderate
14: funcia VLOOKUP
15: diagrame de evoluie i comparaie
16: prezentri cu PowerPoint
17: prezentri medicale cu PowerPoint
special: ierarhizarea cauzelor de deces (diagram Pareto)
special: animaia cu PowerPoint
- 33 -
Tema 12: diagrame Pareto. n aprecierile fcute asupra calitii funcionrii unui
sistem (mecanic, social, biologic ) se studiaz cu atenie cauzele funcionrii
defectuoase. Aceste cauze se sorteaz apoi, n ordine descresctoare dup frecvenele
relative. Pentru prezentarea lor vizual se ntocmete o diagram de tip Pareto.
Se tie c unul dintre motivele ntrzierilor n stabilirea diagnosticului unui pacient l
constituie slaba calitate a dosarului su (fiei medicale). S lum, ca exemplu fictiv, o
analiz a calitii dosarelor medicale ntocmite ntr-un spital n anul 2007. Au fost
descoperite diverse nereguli, conform tabelului urmtor, n dosarele celor 614 pacieni care
au fost trase la sori ca eantion:
Cauza
Numr cazuri
Dosarul medical pierdut
2
Lipsa unei adeverine la dosar
79
Existena unei hrtii nesemnate la dosar
185
Existena unei hrtii fr identificarea pacientului
15
Datele nu permit identificarea tratamentului urmat
22
Introducem n Excel, pe foaia Datele din fiierul nume_PARETO.xls, n
domeniul A1:B7, coninutul tabelului anterior. Pe coloana C calculm frecvenele relative.
Anume:
- n celula C1 introducem textul Frecvena relativ,
- n celula B7 calculm totalul neregulilor, cu formula
=SUM(B1:B6)
- n celula C2 calculm (atenie la fixarea prin caracterul $)
=B2/$B$7
- extindem prin tragere de mner coninutul celulei C2 la domeniul C2:C7
(includem i celula C7 pentru control),
- selectm coloana C i comandm afiarea procentelor, cu 2 zecimale (Format
CeluleNumrProcentaj)
Dup ce am calculat frecvenele relative, vom sorta cauzele n ordine descresctoare
a frecvenelor. Astfel, selectm domeniul A1:C6, apoi comandm DateSortare
Sortare (descresctoare) dup (Frecvena relativ), cu Rnd antet.
Calculm acum pe coloana D frecvenele cumulate:
- introducem n celula D1 textul Frecvene cumulate,
- introducem n celula D2 formula (atenie la caracterul $)
=SUM(C$2:C2)
- extindem formula la domeniul D2:D6.
ncercm reprezentarea grafic a rezultatelor obinute, ntr-o diagram de tipul
Pareto, cu comanda InserareDiagramTipuri particularizate (linie-coloan).
Pentru Axa valorii intrai n meniul de context, alegei comanda Formatare ax,
apoi fixai Numr zecimale = 0 n tableta Numr i Maxim = 1 n tableta Scar.
Diagrama, cu titlu i legend, salvat ntr-o foaie separat denumit Pareto, ar
trebui s arate ca n figura urmtoare.
(Not. Nu trebuie confundate diagramele Pareto cu diagramele n care se prezint
simultan distribuia i distribuia cumulat a unei variabile aleatoare!)
- 34 -
F
6.0
168.0
11.1
1.3
8.2
774.2
45.5
50.9
9.1
16.6
4.4
4.1
29.1
3.6
Introducei acest tabel ntr-o foaie de calcul nou din fiierul nume_PARETO.xls, n
domeniul A1:C15. Putei prelua datele, prin copiere/lipire, din foaia Anuar a fiierului
LP03_1.xls. Completai coloana D cu totalurile, apoi folosii datele din aceast coloan.
Recomandm s creai o coloan cu denumiri prescurtate, pe care s-o utilizai n locul
coloanei A.
Tema 13: calculul mediei ponderate. Aplicaia Excel nu dispune de o funcie
pentru calculul mediilor ponderate. Alte aplicaii, cum ar fi Statistica sau SPSS, dispun i
ele de asemenea funcii, ceea ce permite obinerea direct a rezultatului. Excel permite
ns, ntr-un mod indirect, s obinem medii ponderate.
- 35 -
Costul spitalizrii unui pacient, pentru patru tipuri de tratament, precum i numrul
cazurilor nregistrate anul trecut n spital, sunt trecute n tabelul urmtor:
Tipul de tratament
Costul spitalizrii (lei)
Numrul de cazuri
Apendicit
(KA=)
80
(NA=)
422
Rezecie Pan
(KR=
200
(NR=)
180
By-pass coronarian
(KB=)
1200
(NB=)
41
Fractur femural
(KF=)
100
(NF=)
515
Introducei, ntr-un document Word denumit nume_POND.doc, datele din acest
tabel. Vei ncepe prin a cere inserarea unui tabel cu 5 coloane i 5 rnduri. Pe primul rnd,
dup ce vei introduce n prima coloan textul Tipul de tratament, vei comasa celulele
din a doua i a treia coloan, folosind comanda mbinare celule din meniul Tabel. La fel
vei proceda i cu celulele din a patra i a cincea coloan. Pe rndurile urmtoare vei
introduce textele i numerele, avnd grij s aliniai numerele la dreapta (comanda
Paragraf din meniul Format, opiuni de aliniere la dreapta, indentare la dreapta 1 cm) iar
indicii (KA, NA etc.) s-i obinei prin folosirea opiunii Indice din comanda Font a
meniului Format. Ct privete bordurile diferite, care este calea cea mai rapid de a le
obine?
Aspectele formale (tipul de linie folosit n chenare, alinierile) sunt i ele importante,
dar mai important este aprecierea (estimarea) costului mediu al spitalizrii unui pacient.
Costul mediu al spitalizrii unui pacient se poate obine ca medie ponderat a
costurilor, fiecare pondere fiind dat exact de numrul de cazuri. Formula este:
K NA K R NR K B NB K F NF
K mediu A
.
NA NR NB NF
Nu exist posibilitatea de a efectua calculele cu Word. Pentru a calcula costul mediu
vei folosi aplicaia Excel. Vei plasa datele din tabelul de mai sus pe o foaie de calcul pe
care o vei redenumi n final CMP, iniialele de la costul mediu ponderat din fiierul
nume_PONDERATE.xls.
Nu este necesar s tastai nc odat datele. Putei selecta n Word tabelul (comanda
SelectareTabel din meniul Tabel), apoi cu tehnica de copiere/lipire l putei lipi pe
foaia de calcul.
Vei plasa datele din tabel n domeniul A1:E5. Avem nevoie ns i de produsele
KN (ce reprezint costurile totale de spitalizare corespunztoare tipurilor de tratament),
care vor fi plasate de exemplu pe coloana F. Mai precis, n celula F2 vei plasa formula de
calcul
=C2*E2
pe care o vei extinde prin tragere de mner la celulele domeniului F2:F5. Urmeaz s
calculai cele dou sume, cea de la numitorul formulei i cea de la numrtorul formulei.
Vei face apel la funcia SUM(), prin intermediul butonului
de pe bara instrumentelor,
att din celula E6 ct i din celula F6.
Pentru a ncheia calculele cu ultima mprire, vei tasta n celula B6 textul Costul
mediu iar n celula C6 formula de calcul
=F6/E6
Rezultatul a fost obinut aadar n celula C6. Dispunem n Excel i de alternativa
utilizrii funciei SUMPRODUCT() de calcul a sumelor de produse. Este o funcie care
- 36 -
Deja a aprut o repetare a profesiei. n cazul n care lista este lung, tastarea textului
asistent medical ar putea fi fcut cu uoare variaii. Aceste variaii, datorate oboselii,
vitezei sau altor cauze, vor provoca probleme serioase atunci cnd vom selecta din list
asistenii medicali, sau atunci cnd vom ordona alfabetic sublista asistenilor medicali.
- 37 -
- 38 -
100
(scara logaritmica)
30-34
35-39
40-44
45-49
50-54
55-59
60-64
65-69
70-74
10
1
1973-76
1980-82
1983-87
1988-92
- 39 -
1000
100
10
1988-92
1983-87
1980-82
perioada
1973-76
1
30-34
35-39
40-44
45-49
50-54
55-59
60-64
65-69
70-74
800
700
30-34
35-39
40-44
45-49
50-54
55-59
60-64
65-69
70-74
600
500
400
300
200
100
0
1973-76
1980-82
1983-87
1988-92
perioada
nregistrai cele trei foi-diagram, alturi de foaia de calcul, n fiierul pe care-l vei
denumi nume_PULMONAR.xls. Vei folosi ulterior unele dintre cele trei diagrame ntr-o
prezentare Powerpoint.
Preluai din site-ul catedrei fiierul-carte de calcul LP03_2.xls. (Nu lucrai direct cu
fiierul din site-ul catedrei!
Fiierul are o singur foaie de calcul pe care gsii nite date. Cu aceste date vei
crea o diagram. Salvai n final dup ce ai schimbat autorul fiierul (cu cele dou foi)
dndu-i numele nume_ECORADIO. (Atenie la tipul de fiier pe care-l obinei!)
nainte de a salva fiierul, efectuai urmtoarele operaiuni:
- 40 -
- 41 -
- 42 -
Completai n Slide 3, n cele dou zone prestabilite, textele Funcia VLOOKUP din
Excel are sintaxa, resp. =VLOOKUP (secven, zona tabelului, deplasare). Selectai pe
rnd textele i modificai-le mrimea la 24 puncte tipografice. Deplasai cele dou zone
astfel nct diapozitivul s arate asemntor celui din figura de mai sus.
Inserai urmtorul diapozitiv i tergei toate obiectele din acest diapozitiv mai puin
titlul. De data aceasta alegei tipul Chart. Plasai n zona superioar textul n
Powerpoint se pot realiza diagrame de tip rozet, ca de exemplu cu fontul Arial de
mrime 36 p.t. Apoi, n zona inferioar, cu un dublu-clic, deschidei un tabel (cu un rnd i
trei coloane) n care introducei datele 20, 140, 90 pentru a obine diagrama ca n figura de
mai jos. ncheiai cu un clic.
- 43 -
- 44 -
69337
77986
Violena
22481
14947
Alte
80564
91385
Prezentai datele din tabelul de contingen anterior printro diagram adecvat. De
asemenea,
a) Prezentai diagramatic situaia cauzelor de deces pentru ntreaga populaie a
Franei, n 2004 (tipul adecvat poate fi rozeta);
b) Reprezentai prin diagrame Pareto datele din tabelul urmtor:
Cauze detaliate de deces
Accident de circulaie
Accident vascular cerebral
Cancer intestinal
Cancer mamar
Cancer pancreas
Cancer prostat
Cancer pulmonar
Diabet
Infarct miocardic
Brbai
4035
13985
8817
4021
9138
22773
5135
23122
Femei
1354
19502
7641
11199
3727
5619
5756
17564
- 45 -
- 46 -
- 47 -
Lucrarea practic 4
Indicaii generale:
Publicarea informaiilor tiinifice se face, n mod tradiional, n articole din reviste
specializate, imprimate pe hrtie. Vei explora regulile care trebuie respectate atunci cnd
ncercai publicarea clasic. Va trebui s respectai aceste reguli n editarea ca document
a proiectului de Informatic medical i/sau Biostatistic pe care-l vei ncheia la sfritul
semestrului.
n decursul acestei lucrri practice vei ncerca publicarea n Internet a unei lucrri
de tip articol tiinific, dar dup ce l vei realiza ca document clasic, conform cerinelor de
publicare ntr-o revist medical. (Nu vei reui ns publicarea n Internet de fapt n
World Wide Web din cauza inexistenei unui server web pe calculatorul pe care lucrai!)
Vei lua cunotin de organizarea logic a unui articol medical publicabil standard,
precum i de un mod de a cita alte articole/cri publicate. Vei exersa controlul tabelelor i
al casetelor-text inserate.
n aceast lucrare practic:
a) vei redacta complet un articol tiinific;
b) l vei transforma n document hipertext, publicabil n Internet;
c) v vei explica metode robuste de estimare a centrului datelor numerice (n
strns legtur cu cursurile de biostatistic elementar).
d) vei exersa controlul numrului de coloane n documentele clasice;
Teme
18: paginarea unui articol
19: publicarea n Internet
20: mediana i estimarea centrului
21: mai multe coloane n documente
Softul ce va fi utilizat n lucrarea practic:
Word, Internet Explorer, Excel
- 48 -
Tema 18: paginarea unui articol. Vom presupune vrei s publicai un articol
tiinific (n colaborare cu ali autori). Acesta are urmtoarele componente:
a) titlul,
b) autorii,
c) sumarul,
d) lista cuvintelor-cheie,
e) textul propriu-zis,
f) bibliografia.
Pregtii un fiier-document (denumit) nume_ARTICOL.DOC ce va avea drept
coninut articolul tiinific. (Atenie, nu tastai extensia, ci ALEGEI tipul corect!)
Prima operaiune, atunci cnd dorii publicarea ntro revist, este s v informai
asupra condiiilor de publicare. Editurile ofer machete (templates), sub form de fiiere
.DOT, care pot fi descrcate. De asemenea, editurile ofer indicaii pentru autori, de regul
pe una dintre ultimele pagini ale revistei. Aceste indicaii trebuie nelese i respectate
ntocmai, altfel la repaginare softul va determina modificri total inestetice!
nainte de a ncepe, trebuie s nelegem faptul c n tipografie sunt acceptate mai
multe uniti de msur pentru lungimi, iar alegerea unitii corecte este esenial. S
presupunem c aceasta este centimetrul. Pentru a fixa centimetrul ca unitate de msur,
se poate aciona n tableta General a casetei de dialog Opiuni, mai precis n lista derulant
Uniti de msur. Caseta de dialog Opiuni va fi obinut prin alegerea comenzii
Opiuni din meniul Instrumente. (Chiar dac a fost ales ca unitate centimetrul, n unele
comenzi de exemplu pentru spaierea pe vertical a paragrafelor se folosete conform
tradiiei punctul tipografic.)
Ar trebui s acionai i n tableta Corectare ortografic i gramatical, activnd
opiunile Verificarea ortografiei n timpul tastrii i ntotdeauna se sugereaz corecii.
Alegei apoi opiunea Romn (Romnia) din caseta de dialog ce se obine n urma
selectrii comenzii InstrumenteLimbStabilire limb.
Vei pregti oglinda paginii de hrtie. O foaie de hrtie standard (de format A4 n
Europa) are dimensiunile de 21 29.7 cm. Paginile ei nu sunt folosite integral. Att in
partea de sus, ct i n partea de jos i lateral (stnga/dreapta sau interior/exterior) sunt
lsate margini albe.
S stabilim dimensiunile textului la
sus
15 23.5 cm. Pentru marginile laterale va
antet
rmne un spaiu de 6 cm lime, pe care-l
repartizm echitabil n dou benzi verticale de
(textul)
lime 3 cm fiecare. Pentru marginile sus/jos
rmne un spaiu de 29.7 23.5 = 6.2 cm.
Vom fixa marginea de sus la 3 cm, iar cea de
jos la 3.2 cm.
Atenie, att antetul, ct i subsolul se
afl n afara textului propriu-zis!
Limea antetului se fixeaz prin
stabilirea distanei ntre muchiile de sus ale foii
i antetului. O distan de 2 cm va determina
astfel o lime a antetului de 1 cm. Analog, o
distan de 2.2 cm ntre muchiile de jos ale foii
subsol
i subsolului va determina o lime a subsolului
jos
de 1 cm.
- 49 -
- 50 -
Brbai
Vrsta medie n ani (Deviaia standard)
Infarct miocardic
Timpul mediu de la internare pn la operaie n zile (DS)
Numr mediu de igri pe zi (DS)
Au renunat la fumat naintea internrii n spital
Consider fumatul un factor agravant al strii de sntate
- 51 -
Control
(n = 266)
Intervenie
(n = 274)
207
56 (10.1)
253
4.6 (3.4)
21.1(11.4)
68
231
210
55 (10.3)
252
4.9 (4.6)
22.6 (13.0)
75
233
Este destul de dificil ca tabelul s fie forat s se ncadreze ntr-o coloan. Este de
preferat ca s fie plasat ntr-o caset text, a crei poziie pe pagin s fie modificat
independent. Explorai comanda TabelAutoFitAutoFit to Contents.
Controlul casetei text este asigurat prin caseta de dialog Formatare caset text, la
care putei face apel cu un clic pe butonul DIN DREAPTA al mausului, avnd indicatorul
mausului poziionat DEASUPRA CONTURULUI casetei.
Caseta de dialog Formatare caset text
Continuai introducerea textului, completnd cele mai importante dou capitole, cel de
Rezultate, apoi cel de Discuii:
- 52 -
Rezultate
Discuii
(atenie, validarea lucrrii practice este condiionat de completarea celor dou capitole!) i
ncheind cu bibliografia, care va fi realizat cu litere de corp 10 (mrime 10 p.t.). Atenie la
punctuaia de separare: titlu periodic, an apariie; volum: de la pagina-la pagina. Adugai
o a treia citaie bibliografic (care s se refere la o lucrare al crei autor suntei inventat,
evident), citnd-o n capitolul Rezultate sau n capitolul Discuii.
Bibliografie
1 Wilson K, Gibson N, Aillan A, Cook D.
Effect of smoking cessation on mortality after myocardial
infarction: meta-analysis of cohort studies. Arch Intern
Med 2000; 160: 939-944.
2 Rigotti NA, McKool KM. Predictors of
smoking cessation after coronary artery bypass graft
surgery. Results of a randomized trial with 5-years
follow-up. Ann Intern Med 1994; 120: 287-293
Tema 19: publicarea n Internet. Publicarea articolului n Internet este deosebit de
facil, n urmtoarele condiii:
a) existena unui calculator legat la Internet, avnd o adres IP fix sau o denumire
(adres literal) nregistrat. n memoria permanent a sa va fi depus articolul;
b) existena pe acest calculator a unui web-server. Acesta este un program (soft) care
preia comenzile date de diveri clieni web (programe de navigare cum este Internet
Explorer) i le rspunde corespunztor.
Este necesar i transformarea articolului n forma unui fiier hipertext, acesta din
urm putnd fi apelat prin intermediul legturilor (anchors) din interiorul altor fiiere
hipertext.
Aceast transformare este asigurat de ctre Word, prin simpla operaiune de
salvare. nainte de a cere transformarea, imaginai-v ce se ntmpl cu un utilizator
Internet care caut s ajung la fiierul d-voastr prin intermediul unui motor de cutare.
Motoarele de cutare indexeaz documentele publicate n Internet n primul rnd dup
cuvintele-cheie relevante; de aceea este recomandabil ca autorii s le precizeze ei nii.
Comandai: FiierProprieti
i completai caseta-text Cuv. cheie cu ceea ce considerai c este suficient de relevant
privind coninutul articolului, apoi comandai FiierSalvare ca i asigurai-v c alegei
tipul fiierului Pagin Web. Vei observa apariia fiierului denumit
nume_ARTICOL1.HTM (care poate fi nsoit i de un dosar denumit
nume_ARTICOL1.files). Observai iconia ce-i reprezint tipul; ea v indic faptul c l
putei citi cu Internet Explorer. (De fapt, n mod obinuit anumite extensii de fiierelor
sunt legate, de ctre sistemul de operare, de cte o aplicaie: doc cu Word, htm cu
Internet Explorer.)
Deschidei fiierul nume_ARTICOL1.HTM folosind navigatorul Internet Explorer
apoi, cu comanda VizualizareSurs HTML, explorai-i coninutul. Identificai locul n
care este nregistrat autorul documentului.
- 53 -
x1 , x2 ,..., xn
pe care le-am obinut dintr-un eantion, folosim mediana Me n locul mediei aritmetice m,
atunci avem urmtoarele:
E (Me) (ceea ce nseamn c estimatorul median este nedeplasat),
s2
1.57 Var (m)
N
ceea ce nseamn c estimatorul Me este cu 57% mai puin eficient dect estimatorul m.
Acesta este motivul principal pentru care folosim cu precdere, n estimaii, media
aritmetic i nu mediana.
Dar dac, dup obinerea mediei m i medianei Me vom calcula
m Me
,
m2
2
ce vom putea spune despre m2 ca estimator al lui ? Avem
E (m) E ( Me)
E ( m2 )
(deci i acesta este nedeplasat),
2
1 s2
s2
s2
Var (m2 ) 1.57 1.28
4 N
N
N
Var ( Me) 1.57
aadar m2 este intermediar ca eficien ntre media m i median, cu 28% mai puin
eficient dect media aritmetic.
1 s2
s2
s2
Var (m2 ) 1.57 1.28
4 N
N
N
aadar m2 este intermediar ca eficien ntre media m i median, cu 28% mai puin
eficient dect media aritmetic.
Avem mai multe posibiliti de a introduce textul cu indice x1 . De exemplu,
tastm x1, apoi selectm a doua liter i folosim comada FontIndice din meniul
Format. Nu recomandm asemenea mod de aciune.
O posibilitate mult mai elegant de a introduce formule n text o constituie folosirea
instrumentului Equation Editor. Recomandm s inserai un obiect de tipul Microsoft
Equation 3.0 ori de cte ori trebuie inserat o formul. Folosirea instrumentului se nva
uor, simbolurile fiind grupate n 19 grupe: aritmetice, paranteze, spaiere, fracii i
radicali, indici i exponeni, logice etc.
- 54 -
- 55 -
n aplicarea ei putem lua drept centru 0 fie media de eantion (n care caz valoarea 1
corespunde abaterii standard de eantion), fie mediana (n care caz valoarea 2 corespunde
intervalului inter-cuartile).
Estimarea centrului se va face apoi prin statistica
w( xi ) xi .
w( xi )
Folosirea calculatorului face posibil obinerea de estimri robuste cum este media
ponderat care ofer garanii de eficien chiar n prezena unor valori aberante sau a altor
situaii complicate.
Not. Probabil c n operaiunile de creare de documente nu ai respectat destul de
multe reguli gramaticale. Corectai erorile NAINTE de transferul fiierelor. Putei corecta
cu uurin greelile. De exemplu:
1) cu comanda nlocuire cu din meniul Editare vei putea, n trei etape, s v asigurai
c dup fiecare punct sau virgul va fi introdus un spaiu alb. Vei declara c nlocuii peste
tot caracterul . cu . , apoi caracterul , cu , , iar apoi perechea de blancuri
cu un singur blanc;
2) cu clic-dreapta deasupra cuvintelor subliniate cu rou vei putea alege din lista celor
propuse pentru nlocuire. (Aceasta presupune ns s avei activate opiunile de autocorecie!)
- 56 -
- 57 -
Lucrarea practic 5
Indicaii generale:
Aplicaiile de calcul tabelar sunt astzi instrumente puternice la dispoziia
cercettorilor. Nu doar calcule care n trecut necesitau eforturi mari i consum de timp, dar
i reprezentri grafice elaborate, pot fi obinute astzi cu uurin. Aceasta va fi
exemplificat prin obinerea coeficientului de corelaie ntre dou seturi de date i a dreptei
de regresie, de asemenea prin realizarea rapid a unei diagrame de tip structur radial
special.
Bazele de date (BD) reprezint colecii organizate de informaii despre diverse
subiecte. Ele sunt organizate n anumite structuri i pot fi consultate i modificate. Pentru a
construi o astfel de baz de date sunt necesare: a) un suport fizic pe care informaiile s fie
stocate (unitile de disc ale calculatorului), i b) un soft de prelucrare a acestor date,
ansamblu numit generic SGBD = Sistem de Gestiune a Bazelor de Date.
Operaiile ce se pot efectua asupra unei baze de date sunt:
introducerea de elemente noi n BD (exemple: introducerea unui nou abonat n
agenda de telefoane; crearea unei fie pentru un pacient nou);
modificarea sau tergerea datelor existente n baza de date (modificarea
numrului de telefon al unui abonat; completarea fiei pacientului n urma consultaiei);
reorganizarea BD dup anumite criterii (aranjarea alfabetic a abonailor din
agenda telefonic; aranjarea alfabetic a fielor pacienilor);
consultarea informaiilor din baza de date (aflarea unui numr de telefon; citirea
datelor din fia pacientului).
n aceast lucrare practic:
a) v vei reaminti principalele capabiliti ale unei aplicaii de calcul tabelar
(Microsoft Excel), i anume cele de creare de diagrame i cele de efectuare
rapid de calcule statistice;
b) vei aborda un prim exemplu de felul n care se formeaz opinii tiinifice,
bazate pe date puine, i de felul n care ele se pot valida statistic;
c) v vei familiariza cu exploatarea simultan a datelor depuse pe mai multe foi
de calcul;
d) vei nva s controlai diagrame de tipul structur radial din structur
radial, cel mai complicat tip realizat de ctre Excel;
e) vei crea un tabel de date, familiarizndu-v cu diversele tipuri de date;
f) vei ncerca vizualizarea datelor introduse i modificarea lor;
Teme
22: controlul detaliat al diagramelor Excel
23: calculul intervalelor de ncredere n Excel
24: structuri radiale n Excel
special: coeficieni de corelaie n Excel
25: crearea tabelelor de date FoxPro
26: transferul de date ntre Excel i FoxPro
Softul ce va fi utilizat n lucrarea practic:
Excel, Visual Fox Pro
58
59
control
12
11
10
9
8
7
6
5
4
3
tratament
2
1
0
10
12
14
16
18
20
(zie)
ncercai modificarea culorilor n care sunt afiate barele, de exemplu n rou pentru
primele 7 bare (cele de jos) i n albastru pentru celelalte. Plasai de asemenea textele
tratament i control colorate corespunztor, ca n figur.
Duplicai foaia pe care ai depus diagrama, denumind 1-16 copia. ncercai, pe foaia
1-16, schimbarea ordinii de afiare a duratelor de vindecare (astfel nct barele orizontale
tratament s apar deasupra celor control.
Tema 23: calculul intervalelor de ncredere n Excel
Compararea grafic, pe diagrame, este util atunci cnd vrem s transmitem rapid
informaie privitorului, sau cazul nostru atunci cnd avem de-a face cu secvene lungi
de numere, care se citesc cu dificultate. Din punct de vedere statistic, ar trebui s
ncepem studiul nostru cu compararea mediilor celor dou grupuri. Mediile se obin uor,
cu ajutorul funciei AVERAGE.
Este ns de preferat s ncepem prin a organiza datele comparative pe foaia de calcul. De
exemplu, s plasm n celula F1 textul Tratament, n celula G1 textul Control, n celula
E2 textul Numr cazuri iar n celula E3 textul Medii.
Chiar dac numrul de cazuri ne este cunoscut, recomandm obinerea sa cu ajutorul
funciei COUNTIF. Activnd celula F2, apelai (comanda Inserare Funcie) aceast
funcie din categoria celor statistice. Are dou argumente: domeniul datelor care ar trebui
s fie C2:C17 i criteriul de selecie, care ar trebui s fie secvena de caractere tratament.
ntruct aceast valoare se afl n cteva celule, printre care i C2, al doilea argument ar
putea fi chiar C2.
Analog, celula G2 ar trebui s aib drept coninut formula
=COUNTIF(C2:C17,C17)
Pentru calculul mediei vom face apel la funcia AVERAGE, i ea din categoria funciilor
statistice. n celula F3 plasm formula (!)
=AVERAGE(B2:B8)
60
61
62
Este foarte important s aflai despre posibilitile de lucru cu datele aflate pe mai multe
foi de calcul. Identificatorul unei celule (sau al unui domeniu) care se afl pe alt foaie se
creaz din numele foii terminat cu caracterul ! (semnul exclamrii) urmat de identificatorul
celulei (domeniului). Introducei n celula B2 formula:
=COUNTIF(Lombar!E$2:E$201,A2)
Este clar c funcia va numra apariiile valorii celulei A2 (n cazul nostru secvena in
punct fix) n domeniul E2:E201 de pe foaia Lombar. Reamintim c $ are rolul de a fixa
identificatorul de rnd sau de coloan pe care-l precede. Acest lucru este extrem de util
atunci cnd facem extinderi sau copieri de formule.
Trgnd de mnerul celulei B2, vom putea extinde cu uurin formula la domeniul
B2:B4.
S plasm n celula A1 textul Fr, iar n celula B1 formula
=COUNTA(Lombar!E$2:E$201)SUM(B2:B4)
care permite calculul imediat al numrului de subieci la care nu s-a constatat durere
lombar.
Cu datele din domeniul A1:B4 s crem o diagram de tipul Structur radial din
structur radial. Dup selectarea domeniului apelm comanda InserareDiagram i ne
asigurm c alegem tipul Structur radial subtipul Structur radial din structur
radial. Declarai ca titlu Distribuia durerii lombare n lotul studiat i plasai n final
diagrama pe o foaie separat (distinct de foile de calcul!)
Vei aciona acum asupra componentelor grafice ale foii-diagram.
Cu un clic-dreapta deasupra unui sector colorat putei intra n caseta de dialog Formatare
serie de date. Acionai n tableta Opiuni, alegnd valoarea 3 pentru Supr. secundar
conine ultimele ... valori. ncercai controlul mrimii rozetelor i spaiului dintre ele, prin
stabilirea la 120 a mrimii rozetei din dreapta (Dimensiunea secundar; cea din stnga are
mrimea standard de 100) i la 75 a distanei dintre rozete (Lime spaiu liber).
De asemenea, n tableta Etichete de date activai dou dintre casetele de validare din
grupul Eticheta de date, i anume Afiare etichet i Afiare valoare. Vei observa c n
dreptul sectoarelor de cerc apar inscripiile din domeniul A1:A4, cu excepia inscripiei
None, 68. Prin dublu-clic deasupra acesteia ncercai s preluai controlul ei i s eliminai
textul nedorit, rmnnd numai 68.
63
Prin clic, clic-dreapta sau dublu-clic deasupra cte unui sector ncercai s preluai
controlul colorrii sectorului respectiv. ncercai s determinai aplicarea unor efecte de
umplere. (Ar trebui s acionai n caseta de dialog Formatare puncte de date, tableta
Modele, grupul Suprafaa, prin apsarea butonului Efecte de umplere.) Atenie, nu ncercai
acest lucru n caseta de dialog Formatare serie de date, ntruct vei determina
nediferenierea sectoarelor. Nu uitai: n cazul unei erori sau obinerii unui efect nedorit,
revenii la situaia anterioar prin comanda EditareRevenire.
Plasai acum n celula D1 a foii Frecvene textul Separatori, iar n domeniul D2:D7
numerele 140, 150, 160, 170, 180, 190. n celula E1 plasai textul Frecvene, iar n celula
E2 formula
=FREQUENCY(Lombar!F2:F201,D2:D7)
Selectai acum domeniul E2:E8, plasai cu un clic un punct de inserare pe bara formulei,
apoi tastai [Ctrl]+[Shift]+[Enter]. n acest fel se obin dintr-o singur micare toate
frecvenele (absolute) ale nlimilor indivizilor din eantion, conform valorilor de separare
alese (din 10 n 10 centimetri).
Selectnd acum domeniul D1:E8, ncercai s realizai o diagram a frecvenelor. Care
este tipul adecvat i ce titlu ar trebui s poarte diagrama?
Redenumii nume_SONDAJ.xls cartea de calcul coninnd cele dou foi de calcul i
dou foi cu diagrame. ncercai salvarea sub form de pagin web, pregtind-o pentru
inserare n site-ul d-voastr.
Tema special: coeficieni de corelaie n Excel
Dorim s aflm dac pe datele eantionului de 200 de subieci se confirm legtura (de
dependen liniar) ntre nlime i bust. Pentru aceasta avem dou ci:
a) Interpretarea coeficientului de corelaie ntre seria de date Inaltime i seria de date
Bust. Pe aceast cale vom calcula, de exemplu n celula I1, coeficientul de corelaie prin
formula:
=CORREL(F2:F201,H2:H201)
64
65
a) copierea foii de calcul Lombar ntr-o carte de calcul nou, denumit nume_CORR;
b) sortarea datelor de pe noua foaie Lombar dup valorile coloanei SEX;
c) inserarea unei coloane noi ntre coloanele G (GREUTATE) i H (BUST) i
plasarea n celula H1 a textului GREUTATE F;
d) modificarea textului din celula G1 n GREUTATE M;
e) mutarea datelor de pe coloana G corespunztoare sexului feminin pe coloana H
(posibila mutare a domeniului G104:G201 n H104:H201);
f) selectarea coloanelor F, G i H;
g) inserarea unei diagrame de tipul X-Y pe o foaie nou i redenumirea foii n separat;
h) inserarea n diagram a liniilor de tendin.
ncercai obinerea i a diagramei corespunztoare variabilelor INALTIME i BUST,
nainte de a salva definitiv fiierul nume_CORR. Ce comentarii ai putea face?
(Not. Pentru explicaii i comentarii n documente este nevoie i de calculul
coeficienilor de determinaie i de obinerea ecuaiilor de regresie.)
Tema 25. crearea tabelelor de date FoxPro
Lansai aplicaia FoxPro. Pentru aceasta, cutai pe ecran iconia de startare a FoxPro-
ului
. Facei cu mausul dublu clic pe aceasta. O alt cale pentru lansarea aplicaiei
este apsarea butonului Start, apoi Programs, apoi Microsoft Visual FoxPro.
Comenzile n aplicaia FoxPro se
pot da fie folosind bara de meniuri din
partea superioar a ecranului, fie prin
intermediul
ferestrei
de
comenzi
(Command). Aceast fereastr se deschide
cu comanda Command Window din
meniul Window.
Creai un tabel de date cu ajutorul
meniului File, comanda New sau cu
ajutorul combinaiei de taste [Ctrl]+[N]. Pe
ecran apare caseta de dialog New.
Selectai Table n butonul radio File type i apoi apsai butonul New file. n caseta
de dialog Create salvai (Save in) tabelul de date n dosarul Anul2. Dai numele
nume_INTERNATI tabelului de date n zona Enter table, asigurai-v c tipul fiierului
este Table/DBF i apoi apsai butonul Save.
Putei crea un tabel de date tastnd n fereastra de comenzi comanda:
CREATE nume_INTERNATI
dar n acest caz trebuie s controlai dosarul n care va fi salvat tabelul de date cu ajutorul
unei comenzi de tipul
CURDIR="C:\Anul2"
dat n prealabil n fereastra de comenzi (pentru c altfel aplicaia FoxPro va depune fiierul
n directorul curent implicit). Evident, se poate comanda direct:
CREATE C:\Anul2\nume_INTERNATI
n continuare pe ecran apare o caset de dialog Table Designer, n care se va preciza
structura tabelului de date, adic:
66
67
Table
Designer
rspundei Yes la ntrebarea
afiat:
Input data records
now?
Aplicaia FoxPro va
deschide o nou fereastr ce v
permite introducerea valorilor
pentru fiecare cmp.
(Dac fereastra nu are aspectul din figura de mai sus, comandai ViewEdit.)
n zonele rezervate introducei valorile cmpurilor pentru prima nregistrare (primul
pacient): Numepren = Popescu Ion, Data_inter = 01/06/2001 (formatul datei calendaristice
este lun/zi/an), Sex_masc = T, Varsta = 48. De la un cmp la altul se trece tastnd [Enter]
sau tastele sgei. Dup tastarea ultimei valori a nregistrrii se permite introducerea datelor
pentru a doua nregistrare.
Introducei date pentru ali zece (!) pacieni.
La nregistrarea cu numrul cinci, n cmpul Numepren ncercai s introducei, de
exemplu, Constantinescu Alexandru. Observai c se rein doar primele 17 caractere ale
numelui i prenumelui. (De ce?)
(Dac fereastra nu are aspectul din figura de mai sus, comandai ViewEdit.)
n zonele rezervate introducei valorile cmpurilor pentru prima nregistrare
(primul pacient): Numepren = Popescu Ion, Data_inter = 01/06/2001 (formatul datei
calendaristice este lun/zi/an), Sex_masc = T, Varsta = 48. De la un cmp la altul se trece
tastnd [Enter] sau tastele sgei. Dup tastarea ultimei valori a nregistrrii se permite
introducerea datelor pentru a doua nregistrare.
Introducei date pentru ali zece (!) pacieni.
La nregistrarea cu numrul cinci, n cmpul Numepren ncercai s introducei, de
exemplu, Constantinescu Alexandru. Observai c se rein doar primele 17 caractere ale
numelui i prenumelui. (De ce?)
Se simte nevoia unei redimensionri. Pentru modificarea structurii unui tabel de
date revenii n fereastra de comand cu ajutorul meniului Window. Structura unui tabel
de date se poate modifica fie folosind comanda:
MODIFY STRUCTURE
(n form prescurtat: MODI STRU), fie alegnd comanda Table Designer din meniul
View (ceea ce se recomand), fie opiunea Properties din meniul Table, apsnd apoi
butonul Modify. Pe ecran apare aceeai fereastr Table Designer. Putei foarte uor s
modificai lungimea cmpului Numepren n aa fel nct s fie permis introducerea unor
nume mai lungi (de exemplu de maxim 30 caractere).
Putei, de asemenea, s introducei un cmp nou n tabelul de date. Introducerea
unui cmp nou se va face naintea cmpului curent. Plasai cursorul pe cmpul Sex_masc.
Apsnd [Insert] vei insera un cmp nou ntre cmpurile Data_inter i Sex_masc.
Denumii acest cmp Diagext, precizai-i tipul Character i limea de 150 de caractere.
n acest cmp vei stoca diagnosticul la externare pentru fiecrui pacient. Dac limea nu
e suficient, o putei mri pn la 254 de caractere sau putei folosi mai multe cmpuri
consecutive de tip Character pentru diagnostic. (A treia posibilitate, anume folosirea unor
cmpuri de tip Memo, o vom trata ulterior.) Apsai butonul OK i se va deschide o nou
caset de dialog ce conine ntrebarea:
68
Coninutul tabelului de date creat poate fi oricnd consultat folosind fie comanda
BROWSE n fereastra de comenzi, fie opiunea Browse din meniul View. (Cmpul Diagext a
fost micorat intenionat pentru a putea fi vizualizat ntregul tabel.)
Creai un nou tabel care s aib o structur similar, dar mai simpl; de exemplu s
nu conin cmpurile Varsta i Sex_masc, locul lor fiind ocupat de cmpul Cnp (de tip
Character, cu limea 13) iar numele s fie nume_SIMILAR. Introducei date pentru ali
civa (cel puin zece) pacieni n noul tabel de date.
nchidei toate tabelele de date cu care ai lucrat pn acum, folosind n acest scop
fereastra de comenzi i dnd comanda:
CLOSE ALL
Pentru a folosi un tabel de date creat anterior, acesta trebuie deschis ntr-o zon de
lucru. Pentru aceasta folosii comanda:
USE nume_SIMILAR
sau putei folosi bara de meniuri alegei opiunea Open din meniul File.
Putem prelua datele corespunztoare a dou cmpuri din tabelul de date
nume_INTERNATI n tabelul de date curent, folosind comanda:
APPEND FROM nume_INTERNATI FIELDS Numepren,Diagext
Folosind comanda BROWSE n fereastra de comenzi putei observa c
nume_SIMILAR conine acum mai multe nregistrri.
Prsii aplicaia FoxPro cu comanda QUIT dat n fereastra de comenzi sau cu
opiunea Exit din meniul File.
Tema 26: transferul de date ntre Excel i FoxPro
Vei studia acum posibilitile de transfer de date ntre aplicaiile Excel i FoxPro.
ntruct ambele au fost create de aceeai firm (Microsoft), transferul ar trebui s fie facil,
fr s ridice probleme deosebite. i totui
Preluai din prin ftp fiierul LP05_2.xls. Coninutul acestui spreadsheet este simplu:
o singur foaie de calcul, creat de aplicaia Excel. Dac vei ncerca s-l deschidei
(FileOpen) cu FoxPro, vei constata c acest lucru nu este posibil, extensia XLS
nefigurnd n lista Files of type a extensiilor acceptate de aceast aplicaie. Observm ns o
alt comand, anume Import, n meniul File. Aparent aceast comand ar trebui s rezolve
problema, dup ce declarm parametrii de control pentru acest import de date. Apare ns
o uoar abatere de la standarde: n urma importului, prima linie a tabelului de date va
conine nu prima nregistrare, ci exact aa cum este n foaia de calcul Excel denumirile
cmpurilor; vom fi obligai s o eliminm i s procedm la o redenumire a cmpurilor.
69
Toat aceast neregul poate fi evitat dac procedm invers. Mai precis, n loc de
a importa fiierul tip xls cu FoxPro, l vom prelua cu Excel i-l vom salva ca fiier de tipul
DBF 4 (dBASE IV). Vom obine un fiier cu extensia dbf (DataBase File).
70
Lucrarea practic 6
Indicaii generale:
Utilizarea unei baze de date este mult mai comod (n special atunci cnd volumul
de date este foarte mare) n situaia n care informaiile depuse n ea sunt ordonate dup
diverse criterii. De exemplu, gsirea numrului de apel al unui abonat telefonic, ntr-o baz
de date, este foarte dificil dac aceasta nu e ordonat avnd drept criteriu ordinea
alfabetic a numelor. Se spune c un tabel de date ESTE ORDONAT dac o nregistrare
arbitrar a acestuia se afl ntr-o anumit legtur, dat de criteriul de ordonare (cheia de
ordonare), cu nregistrrile anterioar, respectiv posterioar.
Interogarea unei baze de date este cea mai des ntlnit activitate, din punctul de
vedere al medicului-utilizator. Vei exersa n aceast lucrare practic sortri (ordonari),
interogri, dar i reorganizri ale structurii.
Introducerea datelor n tabele nu este practicat de obicei la nivel de nregistrare
complet. O nregistrare poate fi completat n mai multe etape, de ctre mai muli
utilizatori, care nu au neaprat aceleai drepturi de vizualizare. Vei exersa i crearea de
formulare de introducere de date.
n aceast lucrare practic:
a) vei exersa sortarea i indexarea nregistrrilor unui tabel de date.
b) vei interoga o baz de date;
c) vei crea formulare de introducere a datelor;
Teme
27: ordonarea nregistrrilor unui tabel
28: restructurri i nlocuiri
29: interogarea prin filtre
30: formulare de introducere
Softul ce va fi utilizat n lucrarea practic:
Visual FoxPro
71
72
73
74
Valoarea T (true)
pentru acest cmp apare n
dreptul un pacient care are
infarct antero-septal n
antecedente (ceea ce s-a
nregistrat n tabel prin
valoarea as plasat n
cmpul ima).
Pentru a umple
automat cu valori cmpul
verific vei folosi comanda
REPLACE mpreun cu o
expresie format cu ajutorul
operatorului $:
string$nume_cmp
unde string este o secven oarecare de caractere. Operaia simbolizat de $ are un rezultat
logic, i anume T (true) pentru un anumit pacient dac i numai dac secvena string
este coninut n valoarea cmpului nume_cmp pentru acel pacient; n caz contrar
rezultatul este F (false).
Sintaxa comenzii REPLACE este destul de complex. Trebuie indicate nregistrrile
asupra crora se va aciona, de asemenea cmpurile asupra crora se va aciona i, evident,
valorile care vor fi introduse. Aceste valori pot fi obinute i prin calcule. Pentru a afla
detalii asupra comenzii REPLACE putei folosi comenzile meniului Help sau navigarea n
Web.
Concret, ar trebui s modificai, n toate nregistrrile, valoarea cmpului verific.
Comandai:
REPLACE ALL verific WITH "as"$ima
care, n urma executrii, schimb n T valorile cmpului verific din nregistrrile ce
conin as n cmpul ima. Valoarea F (false) este implicit.
Tema 29: interogarea prin filtre
Interogarea unei baze de date se poate efectua prin intermediu filtrelor de selecie.
Creai ca exemplu un filtru de selecie simplu, numit nume_FILTRU prin care vei
selecta doar datele despre pacienii cu infarct antero-septal n antecedente. Pentru aceasta
folosii comanda
CREATE QUERY nume_FILTRU
Se va deschide o fereastr Query Designer n cadrul creia se specific parametrii
filtrului (interogrii). nainte de aceasta se va deschide ns o caset de dialog Open n care
trebuie s specificai tabelele de date folosite pentru a realiza filtrarea. (n cazul nostru
doar tabelul LP06_1.dbf.) Apsai apoi pe butonul Close n caseta de dialog Add Table or
View. n felul acesta filtrarea se face numai cu datele unui singur tabel.
Sintaxa general a comenzii de filtrare este urmtoarea:
CREATE QUERY nume_fiier | ?
Criteriul de filtrare (interogare) va putea fi salvat direct n nume_fiier, extensia
implicit a fiierelor de tip filtru (interogare) fiind QPR. Dac n locul numelui de fiier se
folosete caracterul ?, atunci va fi deschis o caset de dialog Open n care se va
prezenta lista filtrelor existente, urmnd a se alege unul dintre acestea.
75
Criteriul de
filtrare (interogare)
va fi format pe baza
denumirilor
de
cmpuri
(ce
reprezint de fapt
valorile corespunztoare), a unor valori
concrete, precum i
pe
baza
comparatorilor =, <
,>, Like, Between
etc.
(Ar trebui s
fie clar ce nseamn
fiecare.)
n fereastra Query Designer, pagina (tableta) Fields, putei selecta cmpurile
folosite pentru filtrare, trecndu-le prin apsarea butonului Add n dreapta, n zona
Selected fields. Putei selecta chiar toate cmpurile, apsnd butonul Add All.
n pagina (tableta) Filter vi se permite s specificai destul de comod condiiile de
filtrare. Selectai zona Field Name i, cu un clic, deschidei lista cmpurilor din care
selectai LP06_1.verific.
n zona Example tastai (fr a neglija punctele) .T. iar comparaia o vei face
selectnd Like n zona Criteria. (Dac nu ai fi ncadrat valoarea logic T prin puncte,
atunci ea ar fi fost interpretat nu ca valoare, ci ca denumire de cmp!)
Dac se dorete negarea logic a criteriului de selecie se poate bifa butonul Not.
Informai-v asupra posibilitilor oferite de butonul Case precum i de zona Logical.
n momentul n care se dorete finalizarea activitii de filtrare se apeleaz la
opiunea Close din caseta de control (sau se tasteaz [Ctrl]+[F4], sau se apas butonul
marcat cu X din colul dreapta-sus) a ferestrei Query Designer. Ca urmare, criteriul de
selecie care selecteaz pacienii pentru care n cmpul verific apare valoarea logic .T.
a fost salvat n fiierul nume_FILTRU.qpr.
A vedea pe ecran rezultatul filtrrii este ns aciunea care ne intereseaz
prioritar. Pentru aceasta putei inspecta coninutul dosarului de salvare a fiierelor, n care
ar trebui s se afle fiierul nume_FILTRU.qpr. Dup un dublu-clic pe acesta se va
deschide o fereastr Query de tip browse n care vor fi afiate doar valorile din
nregistrrile selectate prin filtrare.
Prsii
acum
fereastra
Query
(de
exemplu cu opiunea
Close din caseta de
control). Asigurai-v n
meniul
Windows,
comanda Data Session,
c tabelul de date activ
este LP06_1.
Sortai-l, folosind
76
Trecem rapid peste prima selecie (ntruct folosim un singur tabel): pentru a intra n etapa
1-a (principal), cea a selectrii cmpurilor care vor aprea n formular. Concret, vom
selecta cmpurile numpren, chirurg, sexf, varsta i fumator, pe care le vom trece din
lista Available fields n lista Selected fields prin simpla apsare a butonului .
Dup etapa 1:
77
78
79
80
Lucrarea practic 7
Indicaii generale:
Problema vizualizrii selective a datelor, mai ales atunci cnd avem de-a face cu
multe tabele sau cu tabele avnd o structur bogat este i ea deosebit de important. Pe
ecran ar trebui s avem afiate doar datele ce ne intereseaz. Vei exersa i crearea de
vizualizri.
Una dintre cele mai importante activiti n legtur cu baza de date a spitalului este
raportarea (inclusiv pe hrtie) a unor date selectate. Aceast activitate presupune (la fel ca
i cea de selectare) dou faze: n prima faz este creat macheta de raportare, urmnd ca n
faza a doua s fie obinut raportul propriu-zis.
Dar scopul principal pentru care sunt create i ntreinute bazele de date l
constituie obinerea, ntr-un timp ct mai scurt, a unor informaii utile coninute n datele
plasate n tabele de date. Una dintre cele mai importante faciliti ale bazelor de date este
posibilitatea obinerii unor date cu caracter global despre nregistrri (cum ar fi, de
exemplu, calculul vrstei medii a pacienilor tratai de un medic, din nregistrrile
pacienilor n care apare codul numeric personal cod n care este coninut data naterii).
Vei exersa cteva dintre acestea.
n aceast lucrare practic:
a) vei vizualiza parial date din tabele distincte.
b) vei interoga o baz de date;
c) vei crea machete de raportare i le vei modifica;
d) vei crea machete pentru etichete, exersnd controlul hrtiei;
Teme
31: vizualizri
32: machete de raportare
33: etichete
suplimentar: baze de date complexe
81
82
83
O
alt
posibilitate
de
completare a valorilor cmpului
catvar
o
constituie
folosirea
comenzii TableReplace Field.
Comanda ar trebui folosit de trei ori,
odat pentru fiecare valoare 1, 2, 3.
Algoritmul de nlocuire va putea fi
programat n caseta For, cu ajutorul
constructorului de expresii (vezi
figura pentru cazul valorii 2).
84
La pasul 2 va
trebui precizat criteriul
de grupare a nregistrrilor. Avem intenia de a
grupa pacienii n cele
trei grupe de vrst, de
aceea
vom
selecta
cmpul catvar.
(Nu vom folosi
criteriile secundar i
teriar!)
LP07.dbf
Alegerea stilului
raportului, dintre cele
cteva gata pregtite, este
doar o chestiune de
estetic personal (vezi
figura urmtoare)
85
Este
simpl
i
alegerea
poziionrii
paginilor de hrtie: nu avem
alte posibiliti de alegere,
dect
ntre
orientarea
portret i cea peisaj.
Pasul 5 este ns
ceva mai complicat. n mod
obinuit, datele imprimate
pe foile de hrtie ale
rapoartelor sunt ordonate,
pentru a permite o regsire
vizual rapid. ALEGEREA
CRITERIULUI
DE
ORDONARE
ESTE
ESENIAL.
S-ar putea ca s existe deja
ordonri complexe ale nregistrrilor
tabelului! n cazul nostru, avnd de-a
face cu lista pacienilor, se impune
natural ordonarea alfabetic dup
nume i prenume.
Prin urmare, vei selecta
cmpul numpren dintre cele aflate n
lista Available fields or index tag,
prin folosirea butonului (ca mai
sus).
nainte de a ncheia machetarea automat, mai este necesar doar
declararea unui titlul pentru raport, fie acesta Raport Sectia I (responsabil numele dvoastr). Evident, din butonul radio Select an option and click Finish preferm s
alegem opiunea Save report for later use.
86
Aceasta ne va
obliga s acordm un nume
fiierului-machet
de
raportare (cu extensia frx).
l
vei
denumi
nume_CATVAR.
87
88
LP07_1.nrcrt
LP07_1.numpren
LP07_1.chirurg
LP07_1.sexf
LP07_1.varsta
LP07_1.catvar
LP07_1.obezitate
LP07_1.fumator
(Aceasta din urm va trebui aliniat, ceea ce este recomandabil a se face dup
o examinare a rezultatului (FilePrint Preview).
Observai n zona subsolului (Page Footer) comanda de introducere a
paginaiei, format din eticheta Page pe care o vei nlocui cu Pagina i
combinaia ALLTRIM(STR(_PAGENO)). Ea se obine prin aplicarea funciei de
conversie STR() asupra numrului curent al paginii, urmat de aplicarea funciei
ALLTRIM() care elimin blancurile din secvenele de caractere. Ar fi de preferat s
construii, cu ajutorul constructorului de expresii, valoarea concatenat
Pagina +ALLTRIM(STR(_PAGENO))
Lrgii zona Group Footer pentru a introduce aici o informaie de totalizare
(a numrului de linii din fiecare grup de pacieni). Plasai aici un obiect de tip Field,
care s conin de exemplu LP07.varsta, dar CalculationsCount n caseta de
dialog Expression Builder. ncercai s-l ncadrai cu inscripiile Total i
pacienti, realizate ca obiecte de tip Label.
Ar fi de dorit s introducei n aceast zon a raportului i alte informaii
supli-mentare utile, de exemplu vrsta medie a pacienilor.
Refacei macheta n stilul Executive, lund n considerare gruparea dup
chirurg (nu dup categoria de vrst, de care nu avei nevoie), observnd i
diferenele n afiare. Vei numi aceast nou machet nume_CHIRURG.
De data aceasta, n zona Group Footer, sub coloana vrstelor pacienilor, vei
plasa un obiect de tip Field, care s conin LP07_1.varsta, dar pentru care alegei
CalculationsAverage n caseta de dialog Expression Builder. n stnga sa plasai
textul Varsta medie.
Se obinuiete n raportrile medicale ca vrsta medie s fie nsoit de
abaterea (deviaia) standard.
Pentru a respecta aceasta, plasai n zona Group Footer nc un obiect de tip
Field, n dreapta precedentului. Putei alege i pentru acesta expresia LP07_1.varsta,
ns CalculationsStandard deviation. ntre cele de tipul Field plasai textul Ds
aa nct informaiile afiate s arate astfel:
Varsta medie 48 Ds 3
(Cum reuii s afiai: Varsta medie 48 (Ds 3)?)
89
90
91
Lucrarea practic 8
Indicaii generale:
Un prim scop al lucrrii practice este crearea de fiiere de tip chestionar (sau viewuri) pentru introducerea datelor n fiierele create n EpiInfo 2005. Acesta este un soft
specific unor prelucrri statistice de date, utilizat n special n epidemiologie.
Avantajul principal al acestui soft const n faptul c nu impune cheltuieli majore,
n condiiile n care, cu ajutorul su, se pot obine majoritatea rezultatelor prelucrrilor de
date cu care ne ntlnim n cercetarea medical.
Punctul su forte, pentru care este recomandat folosirea sa, este posibilitatea
crerii unor chestionare care s nu permit, din start, introducerea de date eronate flagrant.
Punctul su slab l constituie slaba calitate a diagramelor pe care le poate crea.
Afirmaii de tipul fumatul este asociat cu decesul timpuriu, dup un prim atac de
cord, fcute n urma comparrii unor proporii calculate cu date obinute din eantioane
reprezentative, pot fi confirmate statistic prin teste hi ptrat (care n asemenea situaii
sunt considerate ca teste de semnificaie statistic, i nu ca teste de bonitate).
Aplicaiile statistice (SPSS, Epi Info, ) au evident implementate module pentru
efectuarea direct a calculelor necesare. Dar rezultatele pot fi obinute i cu ajutorul
aplicaiei Excel, controlnd n mod corespunztor desfurarea calculelor.
n aceast lucrare practic:
a) vei crea fiiere de tip baze de date, chestionare n interiorul lor, apoi vei
introduce nregistrri;
b) vei ncepe prelucrarea statistic a nregistrrilor, pe exemple simple.
c) vei exersa modul de obinere a tabelelor de contingen din datele primare,
att n Excel, ct i n FoxPro;
d) vei aplica teste Z i hi ptrat pe tabele de contingen simple;
e) vei ncepe s folosii modulul Analyze Data al aplicaiei Epi Info;
f) vei nva s lucrai cu comanda TABLES din acest modul, comand dedicat
obinerii tabelelor de contingen i a rezultatelor conexe.
Teme
34: crearea chestionarelor n Epi Info
35: introducerea datelor n Epi Info
36: analiza statistic primar a datelor din fiiere
37: tabele de contingen n Excel
38: testul hi ptrat n Excel
39: comanda TABLES n Epi Info
- 92 -
- 93 -
StatCalc, care este folosit pentru efectuarea de calcule statistice cu date plasate n tabele.
Data Compare, care este folosit pentru identificarea diferenelor ntre dou tabele.
Table to View, care se folosete pentru a genera un chestionar (view) pe baza unui tabel
de date existent.
VisData, utilizat pentru citirea fiierelor de date i schimbarea proprietilor.
Epi Lock, care furnizeaz o criptare pentru a se proteja accesul la date i pentru a facilita
att transmisia dar i crearea cpiilor de rezerv (backup).
Compact, care este folosit la compactarea bazelor de date de tip (MS)Access.
Aplicaia Epi Info cuprinde i
un sistem de ajutorare a utilizatorului (help), care conine informaii despre
facilitile oferite,
un manual de utilizare, precum i
un program de ndrumare interactiv n crearea fiierelor folosite n epidemiologie.
Pentru crearea unui fiier-chestionar se va folosi modulul Make View, anume comanda:
FileNewFile name (numele bazei de date: nume_EPI)OpenName the View
(Chest1 ca nume dat chestionarului)
n pagina din partea stng gsii trei opiuni referitoare la gestiunea paginilor din
chestionar (Add Page adugarea unei noi pagini la sfritul celor deja existente, Insert
Page adugarea unei pagini noi ntre dou deja existente, Delete Page eliminarea paginii
curente) precum i comanda Program care face posibil programarea anumitor operaii de
verificare, ducnd astfel la evitarea erorilor care pot aprea la introducerea datelor.
Introducerea de cmpuri n pagina curent a chestionarului, conform indicaiei afiate, se
efectueaz cu un clic pe butonul din dreapta la mausului, n poziia n care se dorete apariia
cmpului respectiv (pentru fixarea poziiei este util grila). Ca urmare, va aprea caseta de
dialog Field Definition n care se vor introduce caracteristicile cmpului: numele, tipul,
dimensiunea, limitrile valorilor, codificri, valorile legale etc.
- 94 -
Caseta de dialog Field Definition este prezentat n figura urmtoare. Se observ c tipul
cmpului este fixat implicit pe Text.
- 95 -
- 96 -
Cu ajutorul comenzii Add Page (din meniul din pagina din stnga) se va aduga o nou
pagin n care vor fi plasate ultimele trei cmpuri:
12. Salariat, de tipul Yes/No,
13. Numrul copiilor, de tip numeric cu valori ntre 0 i 14,
14. Copii, o list-tabel care va conine numele i vrsta copiilor. Pentru aceasta n caseta
text Question or Prompt vom introduce Copii:, iar n grupul Code Tables vom apsa
butonul Grid. n caseta combinat Enter Column Name for Grid se va introduce textul
Numele copilului, dup care se apas butonul Save Column i se procedeaz la fel pentru
Vrsta copilului.
15. Vrsta pacientului n momentul internrii, de tip numeric.
Evident, odat ce cunoatem data naterii i data internrii, vrsta pacientului ar trebui s
fie calculat automat! Pentru asemenea operaiuni se poate folosi comanda Program din
pagina din stnga!
Ca urmare a comenzii Program pe ecran va aprea o cu totul alt organizare: pagina din
stnga va fi intitulat Check, iar cea din dreapta Check Commands.
Vei alege Varsta drept cmp n care se va calcula valoarea, apoi vei comanda Assign,
ncercnd s introducei expresia de calcul
=YEARS(DataNast, DataIntern)
(ca n figura de mai jos).
- 97 -
- 98 -
datelor este Epi 2000, dar acesta poate fi schimbat astfel nct este posibil s se preia date i
din alte tipuri de fiiere (de exemplu diverse versiuni de Excel, diverse versiuni de Fox Pro,
Paradox sau chiar documente hipertext).
Softul Epi Info este nsoit de mai multe proiecte pentru exemplificare i auto-nvare,
dintre care cel mai simplu este Sample.mdb.
Lansai n execuie comanda:
Read (Import)Data Formats: Epi 2000
Data Source: Sample.mdb
Show: Views
Views: viewBabyBloodPressure
Vei constata c aceasta este de fapt comanda:
READ 'C:\...\Epi_Info\Sample.mdb':viewBabyBloodPressure
List, din grupul Statistics, este comanda de afiare sub form tabelar (Grid sau HTML)
a valorilor unor variabile din fiierul activ de date. Implicit, pentru valoarea * n lista
Variables, vor fi afiate valorile pentru toate variabilele. Dac ns vor fi selectate doar unele
variabile, afiarea valorilor se va efectua doar pentru aceste variabile. Aceast comand
permite i modificarea valorilor variabilelor din fiierul activ de date (Allow Updates).
Ca exemplu, vom afia doar valorile variabilelor (cmpurilor) Birthweight,
SystolicBlood, AgeInDays sub form tabelar (Display Mode: Grid) dup ce aceste
cmpuri au fost selectate din lista derulant Variables.
Comanda efectiv este:
LIST Birthweight SystolicBlood AgeInDays GRIDTABLE
Frequencies, din grupul Statistics, este comanda cu care de obicei se ncepe analiza
unui nou set de date, pentru c nainte de a face prelucrri statistice mai complicate, vrem s
aflm cteva informaii de baz, legate de distribuiia datelor. Comanda se poate folosi att
pentru variabile calitative, ct i pentru variabile cantitative, i conduce la obinerea unui
tabel-sintez care conine toate valorile variabilelor specificate n lista Frequency of:,
- 99 -
Frequency
Percent
Cum Percent
90
6.3%
6.3%
95
6.3%
12.5%
100
6.3%
18.8%
105
12.5%
31.3%
120
25.0%
56.3%
125
18.8%
75.0%
130
6.3%
81.3%
135
6.3%
87.5%
150
6.3%
93.8%
160
6.3%
100.0%
16
100.0%
100.0%
Total
95% Conf Limits
90
0.2%
30.2%
95
0.2%
30.2%
100
0.2%
30.2%
105
1.6%
38.3%
120
7.3%
52.4%
125
4.0%
45.6%
130
0.2%
30.2%
135
0.2%
30.2%
150
0.2%
30.2%
160
0.2%
30.2%
Se observ c sunt afiate i intervalele de ncredere 95% (95% Confidence Limits)
pentru fiecare valoare a variabilei. Ele trebuie citite n felul urmtor: avem ncredere 95% c
procentul celor care la natere cntresc 90 oz se situeaz undeva ntre 0.2% i 30.2%. Acest
rezultat este bazat pe nregistrarea unui caz din 16! La cursurile de biostatistic din anul al IIlea se va explica modul n care se obin aceste evaluri.
n cazul n care se specific o variabil de stratificare, se obin mai multe tabele de
frecven, cte unul pentru fiecare valoare a variabilei de stratificare.
Comanda Means conduce, n plus fa de datele pe care le-am obinut deja cu comanda
Frequencies, la obinerea unor indicatori statistici de centrare i mprtiere: media (Mean),
mediana (Median), cuartilele (de 25% i de 75%), valoarea minim (Minimum) i maxim
(Maximum), modul = valoarea avnd frecvena maxim (Mode), variana (Variance) i
abaterea standard (Std Dev). Evident, Obs este numrul total de valori ale variabilei, iar Total
este suma tuturor valorilor variabilei.
n figura de mai jos este prezentat efectul comenzii
- 100 -
MEANS AgeInDays
Frequency
Percent
Cum Percent
Age in Days(X2)
2
18.8%
18.8%
43.8%
62.5%
25.0%
87.5%
12.5%
100.0%
Total
16
100.0%
100.0%
Obs Total
16 53.0000
Minimum
2.0000
Mean Variance
3.3125
.8958
25%
Median
3.0000 3.0000
Std Dev
.9465
75%
Maximum
4.0000
5.0000
Mode
3.0000
Comanda Means poate fi folosit ns numai pentru variabile cantitative; pentru cele
calitative trebuie s ne mulumim cu rezultatele comenzii Frequencies.
Comanda Select, din grupul Select/If, este folosit pentru selectarea unui grup de
nregistrri care ndeplinesc un anumit criteriu. Dup selectarea grupului de nregistrri, n
prelucrare vor fi luate n calcul doar acestea. Comanda Select rmne activ pna la anularea
ei (Cancel select).
Ca exemplu, s selectm noii nscui cu vrsta (exprimat n zile) mai mare de 3. n
caseta Select Criteria: formai expresia AgeInDays>3. n urma unei comenzi List se va
obine urmtorul rezultat:
Observation Birthweight in
Number
Ounces (X1)
Age in
Days(X2)
120
90
130
92
125
98
120
96
10
90
95
10
14
150
97
14
- 101 -
Comanda Type, din acelai grup Output, este analoag celei anterioare; evident, este
folosit pentru inserarea unei secvene de caractere sau a coninutului unui fiier-text n
fluxul de ieire (fie cel implicit monitorul , sau cel specificat cu comanda RouteOut).
Comanda RouteOut redirecteaz ieirea (fluxul de rezultate) ctre coninutul unui fiier
cu numele specificat; acest proces va fi terminat prin comanda CloseOut. Rezultatele
obinute n urma unor comenzi precum Frequencies, List etc. vor fi inserate n coninutul
fiierului cu numele specificat prin RouteOut.
Deschidei (din Sample.mdb) cu ajutorul comenzii Read (Import) tabelul
viewEstriolAndBirthweight. Folosii comanda RouteOut pentru a redireciona rezultatele
obinute spre fiierul cu numele nume_EBW (evident, n folderul C:\Anul_1). Ce extensie
va avea acest fiier?
Introducei titlul Estriolul i greutatea la natere cu ajutorul comenzii Header bifnd
opiunile Bold i Italic i alegnd mrimea fontului de 7. Introducei apoi textul
Coninutul fiierului cu ajutorul comenzii Type bifnd i acum opiunile Bold i Italic,
ns alegnd mrimea fontului de 5. Folosii comanda List pentru a lista valorile celor dou
variabile Birthweight i Estriol, alegnd modul de afiare Web (HTML). Introducei un
nou text: Prelucrri statistice pstrnd parametrii de la textul anterior. Cu ajutorul
comenzii Means calculai indicatorii statistici pentru variabila Birthweight, apoi pentru
Estriol. nchidei fiierul de rezultate cu ajutorul comenzii CloseOut.
Probabil c suntem de acord cu toii c informaia prezentat grafic este mai uor de
neles. Cele mai utilizate moduri de prezentare grafic sunt diagramele cu dreptunghiuri
(Bar sau Rotated Bar), diagramele de tip rozet (Pie) i histogramele (Histogram). Primele
dou tipuri sunt potrivite pentru afiarea informaiei despre variabilele care au un numr
mic de valori (n special variabile calitative). Ultimul tip este adecvat prezentrii
sumarizate a variabilelor care au un numr mare de valori numerice (aa cum este cazul
greutii exprimat n grame, sau a nlimii exprimat n centimetri), bineneles dup ce se
realizeaz gruparea valorilor n cteva intervale de valori.
Comanda Graph, din grupul Statistics, este folosit pentru a realiza reprezentri
grafice ale variabilelor din fiierul activ de date. Ca un exemplu, s deschidem (din sursa
Sample.mdb) cu ajutorul comenzii Read (Import) tabelul viewSmoke. Cu ajutorul
comenzii Graph vom prezenta valorile variabilei Sex ntro diagram cu bare
(dreptunghiuri). Pentru aceasta n fereastra obinut prin lansarea comenzii, alegem Bar n
lista Graph Type: i Sex n X-AXIS Main_Variable(s):. n Y-AXIS Show values of: va
fi pstrat valoarea implicit Count. Titlul diagramei va fi: Repartitia pe sexe a
persoanelor fumatoare | creat de ... (numele d-voastr). Dup afiare, diagrama obinut va
fi exportat (FileExport...) n format jpg dup care va fi redenumit nume_DISX.jpg
alegnd i calea de acces prin opiunea Export Destination: File Browse.
n mod asemntor se procedeaz pentru variabila Race pentru care vom alege tipul de
diagram Rotated Bar, apoi pentru variabila Marital pentru care alegem tipul de grafic
Pie. Salvai cele dou diagrame, dup ce ai ales titluri adecvate, n fiiere cu denumirile
nume_DIRACE.jpg respectiv nume_DIMAR.jpg. Pentru variabila cantitativ Age tipul de
diagram adecvat va fi Histogram, pentru care vei stabili lungimea intervalului de grupare
la 10, iar prima valoare va fi 0. Diagrama obinut va fi salvat n fiierul
nume_DIAGE.jpg. Ce titlu i-ai stabili?
n continuare, dorim s reprezentm grafic variabila Weight separat pentru fiecare
valoare a variabilei Sex. Pentru aceasta, alegem tipul de diagram Histogram, variabila
principal Main_Variable(s): va fi aleas Weight, lungimea intervalului de grupare va fi
- 102 -
15, titlul principal va fi: Repartitia greutatii in functie de sex | creat de ... (numele dvoastr), la opiunea One Graph for Each Value of alegem variabila Sex, vom bifa
opiunea Multiple Graph per Page i vom introduce valorile 2 pentru No
Across/Horizontal respectiv 1 pentru No Down/Vertical. Vom salva diagramele obinute
sub numele nume_DIAGESX1.jpg respectiv nume_DIAGESX2.jpg.
Ca un exerciiu de control, deschidei tabelul viewOswego din proiectul Sample.mdb.
Redirectai rezultatele prelucrrilor urmtoare spre fiierul nume_OSW. Fiecare comand va
fi nsoit de un text explicativ, n care vei specifica ce se obine cu comanda respectiv.
Listai coninutul fiierului. Pentru variabila Age vei calcula media pentru persoanele
sntoase (criteriul ill=No) i separat pentru persoanele bolnave (ill=Yes).
Reprezentai grafic adecvat variabilele Age, Sex, Ill, salvai diagramele obinute n
format JPG i inserai-le, nsoite de comentariile d-voastr referitoare la ceea ce dorii s
prezentai n diagramele respective, ntr-un document denumit nume_DIOSWEGO.doc.
Tema 37: tabele de contingen n Excel
Riscul apariiei unei maladii (sau riscul de deces) este raportul ntre numrul de
evenimente ce apar ntro perioad de timp specificat (de obicei un an) i numrul de
indivizi luai n considerare (respectiv aflai n via) la nceputul perioadei.
Tabelul urmtor, ntocmit pentru compararea riscurilor, conine date privind mortalitatea
la doi ani dup primul atac de cord suferit de fumtori. (Sursa: Daly, Bourke and McGilvray,
pag. 184.)
Supravieuirea la 2 ani
Total
decedai
n via
au continuat s fumeze
19
135
154
n-au mai fumat
15
199
214
Total
34
334
368
Acesta este un exemplu tipic de tabel de contingen (de tipul 2 2, adic dou linii, dou
coloane), bordat cu o linie i o coloan a totalurilor.
Datele primare nu se prezint ns n acest fel. Preluai fiierul LP08_1.xls pentru a vedea
cum sunt nregistrate datele primare. Dac deschidem fiierul cu Excel, atunci vom folosi de
patru ori (pe patru coloane) nsumarea rezultatelor date de funcia logic IF, condiiile
logice fiind de forma AND(C2=FALSE,D2=TRUE) i analoagele.
Preluai cele 368 de nregistrri pe o prim foaie de calcul a fiierului nume_CALCULE,
foaie pe care o vei denumi Primare.
Creai tabelul de mai sus pe a doua foaie de calcul, de exemplu n domeniul A1:D5
(avnd grij s denumii aceast foaie de calcul Conting)
Calculai n coloana E rata deceselor. (Astfel, pentru ntreg lotul de pacieni, n celula E5
vom plasa formula =B5/D5 i vom obine rata de 9.24%; pentru cei ce au continuat s
fumeze, n celula E3 vom plasa formula =B3/D3 i vom obine rata de 12.34%, iar pentru
cei ce n-au mai fumat, n celula E4 vom obine rata 7.01%. Evident, ar fi de dorit s plasai
n celula E2 un text explicativ, ca de exemplu Rata deceselor)
Se va observa o cretere a ratei deceselor n cazul celor ce au continuat s fumeze,
comparativ cu cazul celor care n-au mai fumat. Oare aceast cretere este semnificativ?
Pentru a rspunde la ntrebri de acest fel va fi obligatoriu s precizm nivelul de
semnificaie, altfel rspunsurile sunt lipsite de coninut.
S alegem nivelul de semnificaie uzual 0.05 . Afirmaia c fumatul este ASOCIAT
CU decesul timpuriu, dup un prim atac de cord poate fi confirmat (dar nu respins!) cu
- 103 -
34
368
n2 214 .
Statistica pe care o folosim este z
p 2 p1
1
1
p(1 p)
n1 n2
compara cu valoarea prag z corespunztoare nivelului de semnificaie ales. Mai precis,
vom putea respinge ipoteza nul doar dac vom constata c z z .
- 104 -
Copiai ntreaga foaie de calcul Conting ntro foaie nou, denumit ZTest. Plasai aici
n celula E2 inscripia Frecvene relative iar dedesubt afiai coninutul celulelor cu 4
zecimale (numeric, nu n procente).
Plasai n celula A7 inscripia Nivelul de semnificaie, iar n celula B7 numrul 0.01. n
continuare, plasai n celula C7 inscripia Valoarea prag, iar n celula D7 formula
=NORMSINV(1-B7)
De asemenea, plasai n celula E7 inscripia Valoarea statisticii, iar n celula F7
formula de calcul:
=(E3-E4)/SQRT(E5*(1-E5)*(1/D3+1/D4))
n sfrit, n celula A8 plasai, aliniat la stnga, formula logic:
=IF(F7>D7,"respingem H0","nu putem respinge H0")
Care este rezultatul?
Modificai acum nivelul de semnificaie, n celula B7, la 0.05. Ce se ntmpl?
Ar trebui, cu nivelul de semnificaie de 5%, s tragei concluzia c fumatul n continuare
are efect negativ asupra ratei de supravieuire a pacienilor ce au suferit un atac de cord.
Totui, cu nivelul de semnificaie mai mic, de doar 1%, aceast concluzie nu mai este
susinut de datele din eantioane.
Putem afla oare nivelul de semnificaie limit pentru care concluzia este susinut de
datele din eantioane?
Plasai n celula A9 inscripia Valoarea p (riscul acceptrii ipotezei alternative), iar n
celula B9 formula
=1-NORMSDIST(F7)
Ar trebui s obinei 4.08%.
Copiai acum ntreg coninutul foii de calcul ZTest n alt foaie de calcul, pe care o vei
redenumi Gripa.
Modificai aici coninutul tabelului din A2:D5, aa nct s apar astfel:
S-au mbolnvit de grip
Nu s-au mbolnvit de grip
Total
Vaccinai
80
420
?
Nevaccinai
150
535
?
Total
?
?
?
Este vorba despre rezultatul unui studiu organizat de o companie farmaceutic, pentru a
testa eficacitatea unui vaccin nou mpotriva gripei. n acest studiu, au fost selectai n mod
aleatoriu o serie de locuitori ai unui ora mare (ci anume?), care au fost urmrii din
noiembrie pn n februarie. Dintre acetia, unii (ci anume?) au fost vaccinai, ceilali nu.
Se poate afirma c vaccinul este eficient n combaterea gripei? (Se va alege ca nivel de
semnificaie 0.05 .) Care este valoarea p a acestei afirmaii?
Tema 38: testul hi ptrat n Excel
S relum afirmaia fumatul este ASOCIAT CU decesul timpuriu, dup un prim atac de
cord. Ea poate fi confirmat cu ajutorul unui test hi-ptrat DE SEMNIFICAIE.
n Excel calculele necesare confirmrii vor exploata tabelul de contingen (din domeniul
B3:C4 (care, reamintim, conine datele observate). Acest tabel are dou rnduri i dou
coloane. Prin urmare, numrul gradelor de libertate este (21)(21) = 1.
Copiai tabelul de pe foaia ZTest pe o foaie nou, unica foaie de calcul din fiierul
nume_HIPATRAT.xls. Redenumii ChisqTest aceast foaie.
- 105 -
N N
N rc r c , unde N r sunt totalurile pe linii, N c sunt
N
N
N r N c
N N
N
N rc r c , pe care l-am putea
Ar urma calculul preliminar al termenilor
N r N c
N
efectua de exemplu n domeniul I3:J4, prin formula
=1/F3*(B3-F3)^2
i analoagele ei.
Acestea fiind calculate, formula din celula B9 devine o simpl nsumare:
=SUM(I3:J4)
iar concluzia privind confirmarea afirmaiei (prin respingerea ipotezei nule) apare automat n
celula A8.
Ar fi interesant s plasai n celula A9 inscripia Valoarea p (riscul acceptrii ipotezei
alternative), iar n celula B9 formula de calcul, care n cazul acestui test hi ptrat devine
=CHITEST(B3:C4,F3:G4)
Ar trebui s obinei o valoare dubl fa de valoarea pe care ai obinut-o (pentru acelai
nivel de semnificaie ales), n celula A9 de pe foaia ZTest. Avei o explicaie pentru
aceast coinciden?
Tema 39: comanda TABLES n Epi Info
Vom folosi acum modulul Analyze Data al aplicaiei EpiInfo pentru a analiza datele
primare din fiierul LP08_1.xls.
nainte de toate este necesar s prelum acest fiier, care nu a fost creat cu aplicaia
EpiInfo! Pentru aceasta vom folosi comanda Read (Import) din gruparea de comenzi Data.
n caseta de dialog READ va trebui s alegem Excel 8.0 n lista Data Formats, apoi s
identificm fiierul n caseta Data Source.
Comenzile date, exprimate n limbajul aplicaiei, vor fi afiate n fereastra Program
Editor. Ele vor putea fi reluate (eventual dup modificri) cu butonul Run din aceast
fereastr.
- 106 -
Apelai comanda List pentru a vedea coninutul fiierului. Observai cum sunt
identificate datele, pe linii i pe coloane. (Este un exemplu simplificat de tabel coninnd
date primare.)
Apelai comanda Tables pentru a crea tabelul de contingen ntre variabilele Cont_smok
i Deceased. Alegei aceste variabile n casetele list Exposure Variable respectiv Outcome
Variable (ca n figura urmtoare).
- 107 -
2-tailed p
0,0816356755
0,0820513166
0,1190395582
Lucrarea practic 9
Indicaii generale:
Testarea de semnificaie statistic este o metod, veche de circa 75 de ani, pentru
confirmarea adevrurilor pe baza datelor obinute din eantioane.
Ea const, aa cum a precizat creatorul ei, R. A. Fisher, n acceptarea adevrului
afirmaiei dorite prin respingerea ca implauzibil a unei alte afirmaii, numite ipoteza
nul. Este ns absolut necesar ca ipoteza nul s exprime o egalitate sau o coinciden!
Avnd la dispoziie date provenite dintrun eantion, dispunem de dou metode de
stabilire statistic a adevrului, anume testarea bonitii i testarea semnificaiei
statistice. Ele se deosebesc prin specificul propoziiilor asupra crora pot fi aplicate:
- testarea bonitii stabilete adevrul statistic al unor propoziii ce exprim o
egalitate, o similaritate sau o coinciden,
- testarea semnificaiei statistice (de semnificaie statistic) stabilete adevrul
statistic al unor propoziii ce exprim o inegalitate, o disimilaritate sau o
discrepan.
Un caz particular, destul de des ntlnit, este cel al testului t (sau Student). Acest
test se poate aplica, n studiile biologice, n dou situaii:
1) Pentru a confirma c o populaie se afl, dup un tratament, ntro stare mai
bun dect naintea tratamentului;
2) Pentru a confirma c o populaie se afl ntro stare mai bun dect alt
populaie.
Condiia esenial de aplicare a acestui test este ca indivizii populaiilor s poat fi
msurai, aadar s putem obine eantioane de numere reale.
n aceast lucrare practic:
a) vei nva s lucrai cu comanda MEANS rezolvnd probleme date ca exemplu,
b) vei interpreta rezultatul testului (de bonitate) Bartlett;
c) vei confirma, prin testare de semnificaie, propoziii care afirm c o medie este
mai mare dect alta,
d) vei exploata funcia RAND pentru a obine un eantion aleator,
e) vei folosi Excel pentru a obine o curb ROC.
Teme
40: comanda MEANS n Epi Info
41: afirmaii acceptate prin testare de semnificaie statistic
42: teste Student pereche
43: extragerea eantioanelor aleatoare
special: obinerea curbei ROC n Excel
Softul ce va fi utilizat n lucrarea practic:
Epi Info
108
109
Pentru a efectua calcule statistice vom folosi modulul Analyze Data. Mai nti vom prelua
fiierul creat anterior. Pentru aceasta vom folosi comanda Read, indicnd n Data Source
denumirea nume_EPIINFO.mdb.
Pentru cele dou variabile calitative, Sex i Dom, am putea crea cu comanda Tables
tabelul de contingen. Vom obine o serie de rezultate ale comenzii. Formal, am putea
depista o eventual asociere ntre sexul masculin i domiciliul urban, de exemplu, asociere
care poate prea ntmpltoare. Atragem atenia c metodele statisticii dau uneori rezultate
care nu sunt justificate logic!
Variabilelor numerice NU li se aplic deloc comanda Tables, ci comanda Means.
Calculai media i variana variabilei Varsta. Folosii comanda MeansMeans of:
Varsta. Media va fi valoarea afiat la Mean iar variana valoarea afiat la Variance. Ar
trebui s obinei: Mean n jur de 48.0 i Variance aprox. 347.5.
Calculai media i variana variabilei Varsta separat pentru persoanele de sex masculin i
pentru persoanele de sex feminin: Folosii aceeai comand Means Means of: Varsta, dar
de data aceasta Stratify by: Sex.
110
Comanda Means are dou formate. Dac se utilizeaz numai pentru o singur variabil
(Means of), ea genereaz un tabel identic cu cel al comenzii Frequencies, dar n plus sunt
calculate i statisticile descriptive.
n cazul n care comanda se utilizeaz pentru dou variabile, prima fiind o variabil
numeric care conine datele care vor fi analizate (Means of) iar cea de-a doua o variabil
de grupare (Cross-tabulate by Value of), se va obine un tabel mai amplu, cu urmtoarele
statistici descriptive pentru fiecare valoare a variabilei de grupare: media (Mean), mediana
(Median), cuartilele (25% i 75%), valoarea minim (Minimum) i maxim (Maximum),
modul (Mode), variana (Variance) si deviaia standard (Std Dev). Tabelul se continu cu
valorile pentru testele statistice Anova, t, Bartlett, Mann-Whitney/Wilcoxon sau KruskalWallis. Dac este specificat i variabila de grupare (Stratify by), se obin mai multe
tabele, cte unul pentru fiecare valoare a variabilei de grupare.
Concret, putei observa c comanda Means realizeaz urmtoarele teste statistice:
1. teste parametrice: ANOVA, Student (t-test),
2. teste neparametrice: Kruskal-Wallis, Mann-Whitney (U-test).
n cazul n care variabila de grupare are numai dou valori (adic avem dou grupuri) este
calculat testul t (Student) sau testul Mann-Whitney (Wilcoxon Rank Sum Test), iar n cazul n
care variabila de grupare are mai mult de dou valori (sunt cel puin trei grupuri) este
calculat testul F (ANOVA) sau testul Kruskal-Wallis. Alegerea ntre testul parametric
respectiv cel neparametric se va face n funcie de rezultatul testului Bartlett (testul pentru
verificarea omogeneitii varianelor).
Atenie, testul Bartlett este un test de bonitate, iar toate celelalte sunt teste de semnificaie
statistic.
Ca exemplu, preluai datele dintrun fiier de nvare a softului, cu ajutorul comenzii
ReadData Formats: Epi 2000, Data Source: sample.mdb, Views: viewSmoke.
Folosii mai nti comanda List pentru a identifica denumirile variabilelor (cmpurilor).
ncercai s identificai ce fel de date conine fiecare. (Valorile variabilei Sex sunt 1 i 2.)
S verificm c exist o diferen semnificativ ntre media nlimilor brbailor i media
nlimilor femeilor. Pentru aceasta vom folosi comanda Means n care variabila numeric
este Height iar variabila de grupare (Cross-tabulate by Value of) este Sex.
111
Variabila Sex are, aa cum am observat, dou valori. Vom verifica mai nti dac
dispersiile sunt omogene pentru cele dou grupuri: brbai (valoarea 1?) i femei (valoarea
2?), cu ajutorul testului Bartlett. Se va observa c varianele pentru nlimea brbailor
(2481.7762) i pentru nlimea femeilor (2509.2829) nu difer foarte mult ntre ele.
Valoarea p dat de testul Bartlett este 0.9455 (foarte apropiat de 1), ceea ce indic faptul
c cele dou variane sunt aproximativ egale, prin urmare putem s folosim rezultatele de la
testele parametrice (fie ANOVA, fie t). n cazul nostru vom folosi rezultatul dat de testul t.
Valoarea p dat de testul t (Student) este afiat ca 0.0000, deci este foarte mic. Se poate
respinge deci ipoteza nul! Afirmaia conform creia exist o diferen semnificativ ntre
nlimea medie a brbailor i nlimea medie a femeilor este confirmat de datele din
eantionul folosit. Aceast diferen nu poate s fie atribuit ansei, ntmplrii sau erorii de
eantionare!
S verificm c exist o diferen semnificativ ntre greutile medii ale straturilor
(persoanele au fost grupate n 3 straturi). Pentru aceasta vom folosi comanda Means n care
variabila numeric este Weight iar variabila de grupare (Cross-tabulate by Value of) este
Strata. Vom lucra cu urmtoarele ipoteze:
Ipoteza nul: Greutatea medie a persoanelor din stratul 1 coincide cu greutatea medie a
persoanelor din stratul 2 i cu greutatea medie a persoanelor din stratul 3.
Ipoteza alternativ: Exist cel puin o diferen semnificativ ntre greutile medii
corespunztoare celor 3 straturi.
Rezultatele afiate de ctre EpiInfo vor arta n felul urmtor:
Descriptive Statistics for Each Value of Crosstab Variable
Obs
Total
Mean
Variance
Std Dev
1 113
23747.0000
210.1504
40130.0575
200.3249
2 112
3 112
24359.0000
18840.0000
217.4911
168.2143
43714.5044
7674.8366
209.0801
87.6061
Minimum
1 104.0000
2 88.0000
3 99.0000
25%
130.0000
130.0000
130.0000
Median
150.0000
154.5000
155.0000
75%
185.0000
187.0000
189.0000
Maximum
999.0000
999.0000
999.0000
Mode
150.0000
140.0000
120.0000
112
Observm c variabila Strata are trei valori (1, 2 i 3). Vom verifica mai nti
omogeneitatea varianelor, pentru cele trei grupuri, cu ajutorul testului Bartlett. (Rezultate: 1:
40130.05; 2: 43714.50; 3: 7674.83). Observai ct de diferite sunt valorile varianelor n cele
trei straturi.
Valoarea p (de la testul Bartlett) este de data aceasta foarte mic (0.0000), ceea ce indic
faptul c dispersiile sunt categoric neomogene. Prin urmare nu putem s folosim rezultatele
de la testele parametrice (ANOVA sau t). Va trebui aadar s folosim rezultatele testelor
neparametrice, i anume n cazul nostru rezultatul testului Kruskal-Wallis.
Valoarea p este 0.9582, foarte mare, ar trebui s ne determine s acceptm ipoteza nul,
conform creia nu exist diferene semnificative ntre greutile medii ale celor trei straturi
(1: 210.15; 2: 217.49; 3: 168.21).
n concluzie, nu exist, din punct de vedere statistic, diferene ntre greutile medii ale
persoanelor din cele trei straturi, iar diferenele constatate pot s fie atribuite ansei
(ntmplrii) sau erorii de eantionare.
Exportai spre Excel datele pe care le folosii. Comanda utilizabil este Write(Export)
Output Formats: Excel 4.0, File Name: nume_SMOKE. Vei exploata acest fiier n
lucrarea practic urmtoare.
Exerciiu
a) Exist diferen semnificativ ntre mediile dozei de medicament (dose) la persoanele
cu vrsturi (vomit = 1) i la persoanele fr vrsturi (vomit = 0)? Fiierul de date este
LP09_2.xls.
b) Exist diferen semnificativ ntre mediile dozei de medicament (dose) la persoanele
din grupurile definite de cele trei metode (method = 1, 2, 3)? Fiierul de date este acelai.
Considerai pe rnd ntrebrile de mai sus a) i b). Rezolvai problema ridicat cu ajutorul
aplicaiei Epi Info. Completai documentul nume_MEANS cu urmtoarele precizri, pentru
fiecare situaie n parte:
- explicit, ipoteza nul i ipoteza alternativ luate n consideraie,
- rezultatul testului Bartlett i interpretarea sa,
- testul statistic corespunztor ce va fi ales,
- rezultatul testului i interpretarea valorii p corespunztoare,
- concluzia (recomandarea) final.
De asemenea, salvai-l i ca document hipertext, pregtit pentru includerea n site-ul pe
care vi l-ai creat.
Tema 41: afirmaii acceptate prin testare de semnificaie statistic.
La tema anterioar ai creat un fiier nume_SMOKE.xls. Conine date obinute de la 337
persoane, de ambele sexe, n cadrul unei cercetri efectuate n S.U.A. privind obiceiul de a
fuma. Printre altele, pe coloana intitulat HEIGHT vom gsi nlimile persoanelor, msurate
ns n oli (inches), nu n cm. De asemenea, pe coloana SEX se afl nregistrate valori 1 sau
2 (presupunem c nseamn feminin, resp. masculin)
Vom folosi aceste date ca un eantion care s serveasc la confirmarea statistic a
propoziiei considerat ca ipotez alternativ:
nlimea medie a femeilor este mai mic dect nlimea medie a brbailor.
(Aceasta este departe de a constitui o noutate tiinific! Dar scopul nostru, pur didactic,
este de a arta cum confirmm o propoziie prin testare de semnificaie.)
Ipoteza nul corespunztoare (care va fi respins) se exprim astfel:
nlimea medie a femeilor coincide cu nlimea medie a brbailor.
113
Medicament
6.1
7.0
8.2
Placebo
5.2
7.9
3.9
Pacientul
6
7
8
Medicament
8.4
6.9
6.7
Placebo
5.4
4.2
6.1
7.6
4.7
7.4
3.8
6.5
5.3
10
5.8
6.3
114
La o prim examinare, se poate observa c duratele din coloana Placebo sunt, cu doar
dou excepii, mai mici dect cele din coloana Medicament. Aceasta este o indicaie
pozitiv, dar confirmarea afirmaiei folosirea pilulei cu substana X conduce la o cretere a
duratei de somn profund va trebui fcut altfel. Mai precis, confirmarea se va obine prin
efectuarea unui test de semnificaie. De data aceasta vom efectua un test t pereche.
Ipoteza nul, pe care ncercm s o respingem n urma efecturii testului de
semnificaie, este urmtoarea
medicament placebo
i ea exprim faptul c cele dou durate medii de somn profund nu difer semnificativ una
de alta. Ipoteza alternativ, pe care o vom accepta dac vom reui respingerea ipotezei nule,
este urmtoarea:
medicament placebo.
Introducei datele din tabelul de mai sus, pe coloanele A-B-C, ntro foaie de calcul din
fiierul nume_TESTE.xls, pe care o vei redenumi TTest.
Prima operaiune care trebuie efectuat este calculul duratelor medii de somn profund,
mmedicament pentru Medicament, respectiv m placebo pentru Placebo. Ar trebui s avem
mmedicament m placebo, n caz contrar testarea de semnificaie statistic trebuie oprit
imediat (datele din eantion nu confirm ipoteza dorit!)
Plasai n celula B12 formula de calcul a mediei
=AVERAGE(B2:B11)
i extindei-o la celula C12.
Valorile obinute (7.26 i 5.28) sunt compatibile cu ipoteza alternativ.
Este de dorit s plasm n celula A12 textul explicativ Medii.
Continum cu calculul diferenelor ntre valorile obinute pentru fiecare pacient. Ele vor fi
obinute prin plasarea n celula D2 a formulei de calcul =B2-C2, apoi prelungirea ei la
domeniul D2:D11. Este de dorit s plasm n celula D1 textul explicativ Diferene.
n celula D13 plasai formula de calcul a abaterii standard (a diferenelor)
=STDEV(D2:D11)
Se va obine (aproximativ) valoarea s 1.768 . Statistica pe care o folosim acum este
m placebo mmedicament
t
iar valoarea obinut o vom compara cu valoarea prag t
s/ n
corespunztoare nivelului de semnificaie ales, pentru o distribuie t cu n 1 9 grade de
libertate. Mai precis, vom putea respinge ipoteza nul doar dac vom constata c t t .
Este de dorit s plasm n celula A13 textul explicativ Abateri standard.
Plasai n celula A14 inscripia Nivelul de semnificaie, iar celula B14 numrul 0.01. n
continuare, plasai n celula C14 inscripia Valoarea prag, iar n celula D14 formula
=TINV(B14,9)
De asemenea, plasai n celula E14 inscripia Valoarea statisticii, iar n celula F14
formula de calcul:
=(B12-C12)/(D13/SQRT(10))
n sfrit, n celula A15 plasai formula logic:
=IF(F14>D14,"respingem H0","nu putem respinge H0")
Care este rezultatul?
Modificai acum nivelul de semnificaie, n celula B14, la 0.05. Ce se ntmpl?
Ar trebui, cu nivelul de semnificaie de 5%, s tragei concluzia c folosirea pilulelor cu
substana X crete durata de somn profund.
115
Totui, cu nivelul de semnificaie de doar 1%, aceast concluzie nu mai este susinut de
datele din eantion. Dar o simpl modificare, pentru pacientul nr. 2 a valorii 7.9 n 7.7
(pentru placebo), va determina schimbarea deciziei!
Ar fi de dorit s evalum valoarea p asociat ipotezei alternative, adic a riscului de
acceptare eronat a ipotezei alternative (bazndu-ne pe datele din eantionul ales). Este un
calcul simplu, dac tim s folosim funcia TTEST. Plasai ntro celula liber formula
=TTEST(B2:B11,C2:C11,1,1)
i evaluai rezultatul, care este tocmai valoarea p dorit.
Tema 43: extragerea eantioanelor aleatoare.
Teoria statisticii se bazeaz pe presupunerea c eantionul a fost ales aleator n populaie.
Vei exersa acum tehnica extragerii unui eantion aleator de pacieni.
S admitem c dorim extragerea unui numr determinat (prin calcule statistice anterioare)
de pacieni, n condiiile n care fiecrui pacient trebuie s i se acorde anse egale de a fi ales.
(Atenie, atunci cnd afirmm c extragem la ntmplare, de fapt subnelegem c ansa de
a fi ales este aceeai pentru fiecare candidat potenial.)
Probabil c dintre aplicaiile larg utilizate cea mai dotat pentru simulri aleatoare este
Excel. Ea dispune de funcia RAND, precum i de un modul de generare de numere
aleatoare distribuite Bernoulli, binomial, Poisson, normal etc. Cea mai adecvat scopului
nostru este funcia RAND, care returneaz UN numr distribuit uniform ntre 0 i 1 ceea ce
nseamn, n principiu, c orice numr dintre 0 i 1 are aceleai anse de a fi returnat de ctre
funcie. (Atenie, funcia RAND d un rezultat volatil, care se modific la orice schimbare
efectuat pe foaia de calcul!)
Soluia de alegere la ntmplare a unui numr de indivizi este bazat pe exploatarea
funciei RAND.
Pentru exemplificare, s folosim datele celor 368 pacieni stocate n foaia de calcul
LP09_3.xls, presupunnd c acetia au fost toi pacienii examinai de medicul A.B. n
decursul unui an. Vom selecta la ntmplare un eantion format din 20 de pacieni.
Observm c sunt ocupate doar coloanele A-E. Coloana A, sub titulatura id conine
coduri-numere de ordine. Atunci cnd efectuai selecii, asigurai-v c fiecare nregistrare
(pacient) are un identificator unic, de acest tip.
Vom efectua operaiunea de selecie exploatnd celulele din coloana F. Mai precis, n
celula F1 vom plasa textul selectia, iar n celula F2 vom plasa coninutul =RAND() (ar fi
de preferat s-o facei prin intermediul comenzii InserareFuncie.)
Odat plasat acest coninut, l vei extinde pe vertical prin tragere de mnerul celulei
la domeniul F2:F369.
(Ar trebui s observai c n urma extinderii coninutul din F2 se schimb; motivul este
volatilitatea funciei RAND.)
Selectai acum datele din celulele A-F (prin tragere deasupra butoanelor-indicator de
coloan). Sortai aceste date, dup valorile coloanei F. Folosii comanda DateSortare.
Acum, primele 21 de rnduri vor conine datele celor 20 de indivizi selectai n eantion.
Copiai aceste prime 21 rnduri ntro foaie nou, pe care o denumii Eantion1. Repetai
procedura de selecie prin sortarea dup datele din coloana F, prelund o copie a primelor 21
rnduri n alt foaie, pe care o denumii Eantion2. Redenumind Originale foaia iniial
a fiierului, salvai-l cu denumirea nume_SELECTII.xls (dar i ca pagin Web!).
116
117
118
Indicaii generale:
n cadrul modelelor de regresie multipl ne intereseaz influena variabilelor
predictor (n numr de dou sau mai multe) asupra variabilei rspuns.
Variabila rspuns ar putea fi, de exemplu, durata de spitalizare a pacientului, pentru
care am dori o estimare n momentul internrii. Variabila rspuns ar putea reprezenta, de
asemenea, o mrime dificil de msurat, n condiiile n care variabilele predictor sunt
msurabile mult mai facil.
Pot prezenta interes urmtoarele:
1. Care este importana relativ a efectului fiecrei variabile predictor?
2. Ar putea fi oare eliminat din model o anumit variabil predictor, dat fiind
c efectul ei asupra variabilei rspuns pare neglijabil?
3. Ar trebui incluse n model alte variabile predictor?
4. Modelul obinut este bun pentru a face predicii?
n aceast lucrare practic vei exemplifica diverse situaii n care s-ar putea obine
modele de regresie:
a) simpl, liniar sau neliniar,
b) multipl, liniar sau cu interaciune,
ncercnd validarea lor pentru a fi folosite n prognoze.
Teme
44: folosirea testului Student
45: linii de tendin n Excel
46: regresia liniar cu Epi Info
special: regresia multipl
Softul ce va fi utilizat n lucrarea practic:
Excel, Epi Info
119
30
25
20
15
10
0
0
10
15
Vrsta (ani)
120
20
25
30
Inserai pe diagram dreapta de tendin liniar (se mai numete i dreapta de regresie).
Este vizibil c dreapta de tendin liniar nu ajusteaz bine datele. n schimb, o curb
parabolic (tendin polinomial de gradul 2) are un coeficient de determinaie foarte bun
(0.961) i poate fi folosit pentru a efectua prognoze. Curba ne sugereaz inversarea la
vrsta de 18 ani a tendinei de cretere a nivelului steroizilor.
Ce nivel al steroizilor ne ateptm s gsim la persoanele n vrst de 21 i 24 ani? Este
util curba pentru a prognoza nivelul steroizilor la persoanele n vrst de 40 ani?
Prerea nutriionitilor este c masa muscular, la persoanele de sex feminin i vrst
naintat, descrete odat cu vrsta. Datele de care dispunem, msurate de un nutriionist
pentru 16 persoane de sex feminin, sunt urmtoarele.
vrsta
71 64 43 67 56 73 68 56 76 65 45 58 45 53 49 78
masa musc. 41 45 50 34 43 36 39 40 32 42 58 38 48 50 52 38
Putem estima masa muscular medie pentru o femeie de 60 de ani? Putem accepta
prerea nutriionitilor?
Adugai masa muscular evaluat de d-voastr pentru alte dou persoane, i ncercai
s interpretai datele obinute prin regresie liniar simpl i prin regresie neliniar. Plasai
datele din cele dou tabele anterioare, explicaiile despre ele i diagramele obinute ntrun
document denumit nume_REGRESII.doc.
Tema 46: regresia liniar cu Epi Info.
Dorim s gsim o formul care s ne ajute s prezicem durata de spitalizare (D) odat
ce cunoatem vrsta (V) i sexul (S) al pacientului. Valorile lui S le definim astfel: 1 =
masculin, 0 = feminin.
Cea mai simpl formul o obinem folosind un model de regresie liniar multipl
D = 0 + 1V + 2S
n care coeficienii 0, 1, 2 vor fi obinui prin estimare, odat ce cunoatem datele (di, vi,
si) dintr-un eantion.
Folosind sub-eantionul format doar din pacienii de sex feminin, modelul de regresie se
reduce (teoretic) la
D = 0 + 1V.
Iar dac folosim sub-eantionul format doar din pacienii de sex masculin, modelul de
regresie devine
D = (0 + 2) + 1V.
Observm c n toate cele trei modele avem acelai coeficient pentru vrsta V, iar
termenii liberi difer ntre ei exact prin coeficientul lui S.
ns este esenial s ne dm seama c din sub-eantioane nu vom obine dect estimaii
ale parametrilor. De exemplu, pentru parametrul 1 vom obine estimaiile 1 i 1 . Nu
avem motive s credem c aceste estimaii ar fi egale. Dar oare sunt apropiate ca valori?
S exploatm datele din fiierul LP10_1.xls, n care coloanele corespund variabilelor
noastre n mod evident.
DURATA = D, VARSTA = V, SEXUL = S.
Adugai datele a doi pacieni suplimentari (de sexe diferite), apoi preluai-le n tabel n
fiierul document nume_PREDICTIE.doc, dedesubtul unei explicaii de clarificare
Tabelul urmtor conine vrsta (n ani), sexul i durata de spitalizare a 56 de pacieni
internai n Spitalul Judeean ncepnd cu data de 1 mai 2008
i deasupra textului urmtor:
Pe baza acestor date dorim s determinm o formul de calcul care s ne permit
prognozarea duratei de spitalizare pentru un pacient nou, odat ce-i nregistrm vrsta i
sexul. Folosim n acest scop comanda REGRESS din EpiInfo.
121
Preluai aadar datele n EpiInfo, apoi folosii comanda Advanced Statistics Linear
Regression, ncercnd s determinai execuia comenzii (n clar)
REGRESS DURATA = VARSTA SEXUL
EpiInfo v va oferi rapid, ca rezultate, valorile
0 (CONSTANT) = (aproximativ) 22.477
(VARSTA) = (aproximativ) 0.699, (SEXUL) = (aproximativ) 0.014.
1
122
123
Este posibil ca modulul de analiz a datelor s nu fie disponibil n Excel. Exact aceleai
rezultate numerice vor fi obinute ncercai cu EpiInfo, n urma executrii unei
comenzi
REGRESS BODY_FAT = SKIN_THICK THIGH_CIRC MIDARM_CIRC
Dintre celelalte rezultate ale comenzii, sunt importante urmtoarele:
- coeficientul de determinaie multipl, de aproximativ 0.80. Valoarea sa destul de
ridicat valideaz formula (o face utilizabil);
- valorile p ataate coeficienilor. De fapt, o asemenea valoare p este ataat ipotezei
c coeficientul respectiv este nenul, ceea ce exprim faptul c variabila predictor
respectiv trebuie s apar n formul. Lsnd la o parte constanta, observm o
valoare p destul de mare ataat coeficientului lui THIGH_CIRC.
Merit analizat situaia n care renunm la a insera variabila THIGH_CIRC n
modelul nostru liniar. n urma executrii unei comenzi
REGRESS BODY_FAT = SKIN_THICK MIDARM_CIRC
vom obine un coeficient de determinaie multipl doar puin mai mic, de aproximativ
0.79, iar valorile p vor confirma necesitatea apariiei ambelor variabile n modelul liniar,
formula
BODY_FAT = (6.79) + (1.01)*SKIN_THICK + (0.43)*MIDARM_CIRC
putnd fi folosit pentru evaluarea cantitii de grsime corporal.
Astfel, pentru o persoan pentru care se constat o grosime a pielii tricepsului de 22 i o
circumferin a braului de 25, se poate estima la 18.25 kg cantitatea de grsime n corp.
Iar pentru o persoan pentru care se constat o grosime a pielii tricepsului de 10 i o
circumferin a braului de 22, se poate estima la 8.25 kg cantitatea de grsime n corp.
Dar, atenie, ultima evaluare este riscant, valorile de 10, respectiv 22 aflndu-se n afara
domeniilor de valori ce au fost constatate!
Apare i problema unitilor de msur, care ar fi trebuit precizate de la nceput? Ce
nseamn de fapt 22 ca grosime a pielii tricepsului? (Reamintim c datele din fiier au fost
obinute n urma unui studiu efectuat n S.U.A.).
Calculai valorile minime i maxime ale datelor din coloanele foii de calcul BODYFAT
a crii de calcul LP10_2.xls. Ar trebui s avei datele coloanei SKIN_THICK ntre 14 i
32, iar ale coloanei MIDARM_CIRC ntre 21 i 37. Adugai o foaie de calcul nou,
denumind-o Grid. n ea, pregtii n domeniul B3:B21 o gril 14, 15, ..., 32 pentru
valorile grosimii pielii tricepsului, iar n domeniul C2:S2 o gril 21, 22, ..., 37 pentru
valorile circumferinei braului. Plasai n celula C1 textul Circumferina braului, apoi
unificai celulele din domeniul C1:S1. Plasai n celula A3 textul Grosimea pielii
tricepsului, apoi unificai celulele din domeniul A3:A21. Direcionai textul pe vertical.
Plasai n celula A1 textul Grsimea corporal medie, apoi unificai celulele din
domeniul A1:B2.
Ai obinut un tabel, n domeniul C3:S21, ale crui celule le vei completa cu numerele
date de formula obinut. Introducei astfel n celula C3 formula
=6.79+1.01*$B30.43*C$2
(atenie, folosii coeficienii pe care i-ai obinut!) apoi extindei-o, prin tragere, la ntreg
domeniul. Salvai n aceast ultim form cartea de calcul, cu denumirea
nume_CORPORAL.xls.
Sunt plauzibile datele obinute n acest fel? Unde credei c s-a greit? Care sunt
riscurile folosirii oarbe a formulelor?
124
125
S examinm un alt exemplu, legat de un studiu observaional n care iniial au fost luate
n considerare 4 variabile explicative. Anume, ntr-o unitate clinic s-a ncercat aflarea unei
formule de prognoz a duratei de supravieuire a pacienilor supui unei proceduri
chirurgicale asupra ficatului. Din evalurile pre-operatorii au fost luate n considerare,
conform opiniei specialitilor, urmtoarele informaii:
- scorul de coagulare sanguin BLOOD_SCORE,
- indicele de prognostic PROGN_INDEX (n care se include i vrsta pacientului),
- scorul de funcionare enzimatic ENZYME_TST,
- scorul de funcionare a ficatului LIVER_TST.
Variabila rspuns, dependent, este evident durata de supravieuire SURV_TIME.
Datele de care dispunem au fost obinute de la 54 de pacieni alei aleator dintre cei ai
unitii clinice, i pot fi gsite n fiierul LP10_4.xls.
Adugai o nregistrare suplimentar, a 55-a.
Evident, vom ncepe prin a
estima parametrii modelului liniar.
Folosind Excel, i anume comanda
Analiza DatelorRegresie/Data
AnalysisRegression din meniul
Instrumente/Tools, vom obine
un coeficient de determinaie
multipl destul de bun (0.837).
Vom avea ns grij s bifm
casetele de validare Residuals i
Normal Probability Plots (vezi
figura alturat).
Standard Error
64.80042601
7.017274632
0.563384543
0.511160932
12.52532754
t Stat
-9.59249
4.726027
7.582494
8.07131
1.125045
P-value
7.86E-13
1.97E-05
8.35E-10
1.49E-10
0.266051
Normal Probability Plot
900
800
700
600
500
Y
Intercept
X Variable 1
X Variable 2
X Variable 3
X Variable 4
400
300
200
100
0
0
20
40
60
Sample Percentile
126
80
100
120
127
Indicaii generale:
Prin formularea unui model matematic explicit, un investigator dorete s descrie
ct de mult variaie din variabila rspuns (de exemplu din durata de supravieuire dup
diagnosticarea bolii pentru un grup de indivizi) poate fi explicat n termenii uneia sau a
mai multor variabile predictor statistic semnificative cu care este corelat.
n acest scop ar putea ncerca exprimarea probabilitii de supravieuire pe o
durat mai mare dect durata d ca funcie liniar de valorile variabilei (variabilelor)
predictor.
n cercetarea biologic este des folosit regresia logistic (logit). Iar prelucrarea
datelor de supravieuire se face n primul rnd cu tehnica Kaplan-Meyer.
Compararea eficacitii a dou teste biologice se poate face grafic, prin diagrame
de tipul ROC (receiver operating characteristics).
n aceast lucrare practic vei nva s:
a) lucrai cu comanda LOGISTIC REGRESSION pentru analizarea legturii
ntre o variabil continu i una Boolean;
b) lucrai cu comanda KAPLAN-MEIER SURVIVAL pentru prelucrarea datelor
privind supravieuirea pacienilor;
c) estimai curbe ROC pentru compararea eficacitii a dou teste.
Teme
47: regresia logistic
48: analiza supravieuirii cu Epi Info
special: compararea testelor prin curbe ROC n Excel
Softul ce va fi utilizat n lucrarea practic:
Excel, Epi Info
128
Odds
Ratio
95%
C.I.
Coefficie
nt
S. E.
ZStatistic
P-Value
dose
3.3179 1.4248 7.7261
0.4313
2.7809 0.0054
1.1993
CONSTANT
*
*
* -26.2133
9.5109 -2.7561 0.0058
Reinei de aici coeficienii, dar i faptul c ei sunt validai de valorile p foarte mici
(putem accepta c sunt nenuli). Aadar formula
P
log
26.2133 1.1993 X
1 P
este suficient de bun pentru prognozarea probabilitii de vindecare n funcie de
concentraia dozei injectate.
Y
Evident, P
unde Y exp(26.2133 1.1993 X ) .
1 Y
129
0.0
10
15
20
25
30
35
130
131
132
Preluai graficele (pe care EpiInfo le livreaz sub forma de fiiere de tipul JPG) i
comentai-le n fiierul-document Word intitulat nume_COMENTARIU.doc. Comparai
comportarea att pe termen scurt (imediat dup nceperea tratamentului) ct i pe
termen lung. Nu ar trebui s lipseasc nici comentariul privind numrul de observaii de
care ar trebui s dispunem pentru a putea trage concluzii certe privind superioritatea
unui tratament asupra altuia (i nici aprecieri privind calitatea vieii dup nceperea
tratamentului).
n fiierul LP11_3.xls gsii urmtoarele date nregistrate pentru nou-nscuii cu
greutatea la natere sub 1 kg:
sexul, n coloana SEX, valori F sau M;
regiunea geografic de domiciliu a prinilor (5 valori, identificai-le), n coloana
REGGEO;
data naterii, n coloana DATANAST;
decedat, valori Da sau Nu;
data decesului, n coloana DATADECES (completat dac este cazul).
Preluai cu EpiInfo acest fiier i ncercai s rspundei plasnd rspunsurile n
documentul Word nume_INFANT.doc la urmtoarele ntrebri:
1) numrul de decedai (comanda Select);
2) distribuia decedailor pe sexe, pe regiuni geografice (comanda Frequencies);
3) distribuia decedailor pe sexe i pe regiuni geografice (comanda Tables).
Creai o nou variabil, DurataVietii, n care plasai durata vieii fiecrui subiect
decedat (n zile). Calculai media i mediana acestei noi variabile (comanda Means), apoi
mediile pe sexe. Se poate afirma c durata vieii la subiecii de sex feminin difer de cea a
subiecilor de sex masculin? Completai fiierul nume_COMENTARIU.doc. cu
concluziile d-voastr.
Tema special: compararea testelor prin curbe ROC n Excel.
Relum tema utilizrii curbelor ROC (receiver operating characteristics), de data
aceasta pentru compararea eficacitii a dou teste biologice n detecia aceleiai maladii.
Vom utiliza Excel, mai precis crend un fiier carte de calcul denumit nume_2ROC, cu
cinci foi de calcul denumite Datele, CalculeCK i CalculeT, respectiv GraficCK
i GraficT.
Testul troponinei T tinde s nlocuiasc testul CK (creatin-fosfokinazei) n depistarea
infarctului de miocard deoarece: (a) este mai specific n cazul afectrii muchiului cardiac,
i (b) poate fi efectuat pe o durat mai ndelungat de timp. Valorile obinute nu sunt
sensibile la afectarea altor muchi (prin injecii, exerciii fizice sau medicamente).
S comparm cele dou teste folosind un lot de 44 pacieni, asupra crora au fost
efectuate ambele teste. Unii dintre acetia au avut confirmat ulterior diagnosticul infarct
miocardic. Rezultatele msurtorilor (exprimate pentru testul CK n uniti/litru iar pentru
testul TT n micrograme/litru) precum i diagnosticul final le vei prelua din fiierul
LP11_4.xls.
Plasai coloana diagnosticelor, urmat de coloanele CK i TT, n domeniul A1:C45 al
foii de calcul Datele din fiierul nume_2ROC.
Aa cum ai procedat ntro lucrare practic anterioar, vei ncepe prin a determina
valorile extreme ale testelor. n celula D1 plasai textul Extreme CK, n E1 plasai textul
Extreme T, apoi n celulele din domeniul D2:E3 inserai formulele de calcul
corespunztoare. (n D2 formula =MIN(B2:B45), ... n E3 formula =MAX(C2:C45).)
Copiai acum pentru calcule datele din coloanele A:B n foaia CalculeCK. Aici le
vei sorta n ordine cresctoare dup valorile testului (coloana B?) dup care, pe coloana
133
134
135
Indicaii generale:
Prin crearea unor modele statistico-matematice se ncearc s se explice
funcionarea organelor de sim, inndu-se seam de rezultatelor cercetrilor fiziologice
moderne (legea Weber-Fechner, curba lui Fletcher-Munson n audiologie, etc.)
Modelele de funcionare a aparatului fonator uman, ca i a celui auditiv, necesit
foarte multe calcule i nu dintre cele mai simple. Este de ajuns s menionm c n 1936,
nainte de apariia calculatoarelor, pentru obinerea spectrului unei nregistrri sonore de
2.6 secunde calculele necesare au durat aproape 1 an. Calculatoarele personale actuale au
ajuns la o putere de calcul suficient pentru tratarea informaiei auditive sau vizuale n
timp real.
Un program relativ simplu de calculator poate fi folosit, n lipsa unor audiometre
perfecionate, pentru autocontrolul auzului, permind detectarea unor leziuni ale urechii
interne datorate expunerii prelungite la zgomote.
Prelucrarea imaginilor, chiar dac a fcut progrese imense, este nc la un stadiu
iniial atunci cnd avem de-a face cu imagini lipsite de claritate. Astzi este cazul
imaginilor termografice, aa cum n trecut imaginile ecografice ridicau probleme de
interpretare. Spectrele de culoare, precum i anumite transformri de culoare, permit
obinerea de rezultate spectaculoase n cercetarea biologic.
n aceast lucrare practic vei nva s:
a) V orientai n execuia unor softuri speciale, de laborator;
b) Manevrai cu noiuni mai puin evidente, cum ar fi spectrele;
c) V ntocmii singuri audiograma.
Teme
49: analiza sunetelor
50: analiza imaginilor
special: crearea audiogramei tonale
Softul ce va fi utilizat n lucrarea practic:
AnalizorulDeSunete, PrelucrareImagini, Audiometer
136
137
efectuarea unui clic n dreptul momentului de nceput.) Ar trebui s tim c pentru calculul
spectrului de moment se folosesc 1024 valori consecutive ale undei, adic datele undei din
urmtoarele 23 de milisecunde ce urmeaz momentului curent ales.
Spectrul de moment ar trebui s arate ca n figura urmtoare:
Se pot identifica cele dou vrfuri, plasate n dreptul frecvenelor celor dou
componente ale undei. Aceasta nu este neobinuit, pentru c ne ateptm ca modelul
statistico-matematic s recupereze informaia principal. Dar ceva nu corespunde: anume,
n desen apare a doua component ca avnd intensitatea mai mare! (Aceast neregul este
datorat algoritmului de calcul!)
ns forma de melc a urechii interne nu este compatibil cu aspectul liniar n frecvene al
spectrului, ci mai degrab cu o scar logaritmic n frecvene. O asemenea scar este cea
melodic, iar spectrul melodic arat ca n figura urmtoare:
Ar trebui s tim c cele circa 1000 de coloane ale imaginii acoper aproape n ntregime
domeniul frecvenelor audibile. Dar deasupra membranei bazilare se afl peste 3000 de
baterii de celule ciliate! Aadar un sunet ca cel din figur ar trebui s fie semnalizat de
peste 30 de baterii de celule ciliate. Acest model ar trebui s ne evidenieze clar fineea
analizorului de frecvene pe care-l avem n urechea intern!
(Se mai impune un comentariu: i intensitile sunt percepute logaritmic de ctre
urechea uman, de aceea scara intensitilor este gradat n deciBeli. Trebuie tiut c 3 dB
nseamn dublare, iar 3 dB nseamn njumtire. O gradaie pe axa vertical nseamn
aadar dublarea sau njumtirea intensitii.)
138
Nu este cazul s folosim meniul Energia ntruct unda creat a fost de intensitate
constant. De asemenea, nici meniul Spectrograma nu ne aduce informaii noi, ntruct nu
exist variaii n frecven pe durata celor 1000 milisecunde ale sunetului.
Este momentul s refolosim programul AnalizorulDeSunete pentru a analiza fiierul
sonor LP12_1.wav, care conine undele nregistrate, prin intermediul unui microfon legat de
placa de sunet, pe cnd cinci persoane pronunau, una dup alta, vocala [a].
Apelai mai nti comanda Afiseaza din meniul Energia pentru a identifica momentele i
duratele de existen a semnalelor sonore. (Ar trebui s identificm faptul c primul semnal
dureaz circa 280 milisecunde, iar al treilea apare ntre milisecundele 660 950. Identificai
i reinei cele cinci momente de mijloc ale semnalelor, care vor fi folosite pentru obinerea
spectrelor de moment.)
Dup comanda Afiseaza din meniul Unda, ncercai s stabilii (cu un clic) momentul de
nceput la 450 milisecunde (acesta este aproximativ n mijlocul emisiei celei de-a doua
vocale). Afiai apoi spectrul de moment, dup care ncercai s identificai poziiile celor mai
puternice patru linii spectrale. (Ar trebui s fie aproximativ la 400, 800, 1200 i 1600 Hz.
Nu trebuie s ne surprind progresia aritmetic! Se tie c 400 Hz este frecvena
fundamental de vibraie a coardelor vocale, pentru o persoan de sex feminin cu voce foarte
piigiat. Celelalte frecvene corespund armonicelor consecutive.) Cu ajutorul reprezentrii
melodice, ncercai identificarea intensitilor acestor linii spectrale, innd seam de faptul
c 3 dB nseamn jumtate. (Lund linia a treia, cea de intensitate maxim, ca standard, ar
trebui s gsii c linia spectral de 400 Hz are intensitatea 1/10, linia spectral de 800 Hz are
intensitatea 1/2, iar linia spectral de 1600 Hz are intensitatea 1/3.)
nainte de a crea un sunet artificial care s simuleze vocala [a] pronunat de persoana
n cauz, este recomandabil s:
1) afiai spectrele de moment pentru toate cele cinci vocale [a] pronunate, ncercnd
s depistai, n fiecare caz, frecvenele fundamentale precum i poziiile celor mai puternice
linii spectrale;
2) capturai imaginile celor cinci spectre de moment n fiiere bitmap distincte, pe care
s le transformai apoi n fiiere de tip JPG (pentru a face economie de spaiu de stocare);
3) afiai spectrograma, pentru domeniul vocalelor, i s-o capturai n fiier (vezi figura
urmtoare. Atenie, programul calculeaz spectrograma doar pentru primele 950 de
milisecunde, deci vei vedea doar imaginile primelor trei emisii sonore!)
139
Folosii din nou CreatorulDeSunete. De data aceasta creai un sunet prin suprapunerea
a patru componente sinusoidale pure (cele patru identificate mai sus).
Alegnd intensitatea maximal de 6000 pentru a treia component, nseamn c prima
component va avea intensitatea 600, a doua va avea intensitatea 3000, iar a patra 2000.
Frecvenele componentelor vor fi de 400, 800, 1200 i 1600 Hz. (Programul permite i
alegerea fazelor, ns se tie c defazajele nu sunt identificate de urechea uman, aa nct pot
fi neglijate.) Redenumii nume_A4COMP.wav fiierul sonor pe care-l obinei, apoi trecei
la analizarea sa. Programul AnalizorulDeSunete ar trebui s identifice spectre asemntoare
n banda frecvenelor sub 2000 Hz cu spectrul de moment al vocalei [a], de la care am
plecat.
Din nefericire, asemenea modele artificiale ale vocalelor sunt mult prea simpliste, iar
sunetele generate astfel sunt metalice. Componente importante ale vocalelor umane se
ntlnesc pn spre 4000 Hz.
Trebuie s atragem atenia c programul AnalizorulDeSunete, ca de altfel toate
programele de analiz sonor (cel mai cunoscut este SoundForge) nu calculeaz exact
spectrele, ci le aproximeaz printr-o metod denumit Transformata Fourier Rapid (FFT =
Fast Fourier Transform). Algoritmii de aproximare pot produce artefacte, care pot nela cu
uurin utilizatorul neinformat.
Pentru a da un exemplu, folosii CreatorulDeSunete pentru a crea un fiier sonor la
frecvena de eantionare de 22050 Hz, cu patru componente, anume exact cele implicite
(aadar cu frecvenele de 4000, 8000, 10000 i 13000 Hz). Dup creare, analizai-l cu
AnalizorulDeSunete, i afiai un spectru de moment. Vei constata c primele trei
componente sunt identificate exact, dar n locul componentei de 13000 Hz apare una fals de
circa 9000 Hz. (Aceasta se datoreaz fenomenului de repliere, cauzat de nerespectarea
condiiei Shannon-Nyquist. Comentai!)
Pentru a ne putea da seama de complexitatea aparatului fonator uman, i putem compara
emisiile cu altele, de exemplu cu cele generate de syrinxul psrilor sau de coardele vocale
ale primatelor. n fiierul LP12_2.WAV gsii o nregistrare a emisiei sonore generate de un
syrinx, iar n fiierul LP12_3.WAV este vorba despre emisiile sonore ale gibonilor.
Comparai-le la nivel de spectrograme, capturnd cteva imagini (evident, transformate n tip
JPG) care s ilustreze comentariile pe care le facei n documentul nume_SUNETE.
Tema 50: analiza imaginilor
Preluai acum programul denumit PrelucrareImagini, mpreun cu toate celelalte fiiere
pe care le gsii n folderul Imagini. ncepei prin a crea un document nume_IMAGINI.doc
n care vei insera diverse comentarii adecvate.
Startai programul PrelucrareImagini. Acesta are ca scop extragerea de informaii din
fiiere-imagine de tipul BMP color, cu 8 sau 24 bii/pixel. (Exist o diferen major ntre
modurile de stocare a culorii n cele dou tipuri. Informai-v despre acestea comentai n
documentul nume_IMAGINI.)
ncercai s prelucrai fiierul LP12_4.BMP. Dup afiarea imaginii, observai meniulcomand Afiseaza spectru. Vei constata c n acesta apar patru opiuni, dintre care sunt
permise doar dou, GlobalRGB i GlobalYCbCr. Ele corespund celor dou modele de
culoare implementate n program, anume modelul electronic RGB (red-green-blue) i
modelul n luminan Y i crominan (de albastru Cb i de rou Cr). Informai-v despre
aceste modele de culoare i comentai n documentul nume_IMAGINI.
Afiai cele dou spectre globale i notai-v amnuntele de distribuie a culorilor, care
apar i n caseta de informare din dreapta-jos.
140
Dup comanda Selecteaza i apoi selectarea prin tragere cu mausul a unei zone
dreptunghiulare a imaginii, vei constata activarea celorlalte dou opiuni din meniul
Afiseaza spectru. Selectai mai multe zone de interes i notai-v indicatorii de centrare i de
mprtiere pentru spectrele zonelor selectate. Comparaii cu indicatorii pentru spectrul
global.
141
15
Cutai apoi n subfolderul Audiograma ce conine programul (fiierul executabil)
Audiometer.exe precum i fiierele frecv_intens.WAV (ncepnd cu 0125_03.WAV).
Acestea sunt fiiere al cror coninut red variaia presiunii aerului n cazul unui sunet de
frecvena sinusoidal pur f, prin valori numerice pe 16 bii. Frecvena de eantionare, este
de 44100 valori numerice pe secund. Transferai-le pe toate n dosarul Anul2 al volumului
C: de pe staia de lucru.
n continuare vei avea nevoie de ajutorul unui coleg. Dup ce v vei instala ct mai
etan ctile pe urechi, colegul d-voastr va declana Audiometer, apoi v va trimite n cti
diverse sunete artificiale, ntro ordine aleatoare, fr a v anuna despre frecvenele i
intensitile alese.
Atenie, fiecare asemenea sunet are durata de o secund. Nu dai importan eventualelor
pcnituri scurte, datorate modului imperfect n care au fost generate sunetele artificiale.
142
Spunei-i colegului felul n care percepei sunetele respective, folosind cuvintele deloc,
slab, normal, puternic, dureros,. Colegul d-voastr va nota n celulele tabelului, pe
hrtie, valorile lingvistice care exprim felul n care percepei sunetele respective.
143
Indicaii generale:
Aplicaiile dau posibilitatea utilizatorului de a alege, n decursul execuiei lor,
diverse ci. Alegerea unei ci se face de obicei printr-o caset de dialog. Exist ns i
posibiliti de setare iniial a valorilor unor parametri, prin intermediul unor fiiere.
Odat cu creterea drastic a performanelor calculatoarelor personale n ultimul
deceniu, au aprut aplicaii de imagistic medical utilizabile pe asemenea calculatoare
(chiar i pe cele de tip laptop).
n aceast lucrare practic vei nva s:
a) v familiarizai cu i s controlai o aplicaie de imagistic medical.
Tema
51: controlul parametrilor aplicaiilor de imagistic
Softul ce va fi utilizat n lucrarea practic:
IQ-View
144
Vei constata c mesajele principale sunt afiate n limba german (ceea ce nu ar trebui s
ne surprind, ntruct aplicaia a fost creat n Germania). Programatorii au prevzut ns
posibilitatea de a folosi mesaje afiate n alt limb, exploatnd n acest scop coninutul unui
fiier de configuraie.
Cutai n subfolderul Language fiierul custom.ini i copiai-l n folderul aplicaiei
(alturi de Lite.exe). Startai iari aplicaia Lite.exe. De data aceasta ar trebui s observai c
mesajele sunt afiate n limba englez.
Identificai un mesaj oarecare, de exemplu Modality afiat deasupra tipului de
investigaie (CT = tomografie computerizat, respectiv MR = rezonan magnetic). S-l
traducem n limba romn prin Tipul. Intervenim cu Notepad n coninutul fiierului
custom.ini, cutnd (cu comanda Find din meniul Edit) cuvntul Modality. l vom gsi n
mai multe locuri, dar modificarea o vom face doar n cadrul perechii
StudyBrowserForm.StudyTableHeaders.Lines[0]=Modality
(ar trebui s ne dm seama c prin . programatorii neleg subordonarea).
Startnd iari aplicaia Lite.exe, modificarea ar trebui s fie vizibil.
145
146
147