Sunteți pe pagina 1din 17

MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică

Indicaţii generale:
Tradiţia activităţilor contabile cere ca datele privind veniturile şi cheltuielile unei
firme sau gospodării să fie aranjate sub forma unui tabel. Modul tabelar de aranjare a
datelor este adecvat şi pentru alte activităţi, în general tuturor activităţilor în care datele
„primare” urmează a fi prelucrate. Evident, şi în domeniul medical întâlnim deseori situaţii
în care aranjarea tabelară a datelor prezintă avantaje considerabile, şi aceasta nu doar în
gestiunea spitalului sau a cabinetului medical. Pentru asemenea activităţi pentru care
aplicaţia Word nu este adecvată, ne vom familiariza cu aplicaţia Excel.
Un prim scop al lucrării constă în exemplificarea obţinerii unor indicatori statistici
şi a efectuării calculelor simple în Excel. Apoi se explorează colaborarea între Word şi
Excel în domeniul conversiei tabelelor, foarte utilă pentru efectuarea unor operaţiuni de
separare; urmează explorarea în Excel a funcţiilor statistice şi a celor dedicate prelucrării
textelor, precum şi grafica în Excel.
Se va constata că există destule compatibilităţi între organizările tabelare în cele
două softuri; cu toate acestea, Excel este net superior în ceea ce priveşte calculele, dar mai
greoi în operaţiunile de aranjare „estetică”.
Alt scop al lucrării îl constituie repetarea felului în care se reprezintă diagramatic,
cu Excel, anumite date „de sinteză”.
În continuare se vor folosi unele funcţii implementate în Excel pentru a se efectua
diverse calcule statistice simple, dar nu numai.
În această lucrare practică:
a) Vă veţi familiariza cu calculul tabelar.
b) Veţi exersa obţinerea rapidă a indicatorilor statistici uzuali;
c) Veţi explora posibilităţile de „colaborare” între aplicaţii;
d) Vă veţi familiariza cu folosirea funcţiilor încastrate.

Teme:

7: aplicaţia Excel
8: frecvenţe, mediane şi cuartile în Excel
9: calcule simple în Excel
10: diagrame cu Excel
11: funcţii în Excel (COUNTIF, CONCATENATE, AVERAGE, STDEV)
specială: diagrame cu coloane

Softul ce va fi utilizat în lucrarea practică:


Word, Excel,

- 16 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016

Tema 7: aplicaţia Excel. Cu toate că oferă bune posibilităţi de tabelare a datelor,


aplicaţia Word a fost prevăzută doar cu dotări elementare în ceea ce priveşte prelucrarea
prin calcul a acestora.
Pe lângă rapiditatea cu care sunt executate calculele, în general aplicaţiile de calcul
tabelar (dintre care vom folosi Excel) prezintă şi alte avantaje:
recalculare automată (şi „instantanee”) a tuturor rezultatelor, imediat ce o valoare
oarecare a fost modificată;
posibilităţi multiple de formatare utile pentru prezentarea, pe ecran, a datelor;
posibilitatea reordonării rapide a liniilor, după diverse criterii;
existenţa unei varietăţi de funcţii „încastrate” de natură matematică, statistică,
financiară care, însoţite fiind de explicaţii detaliate privind modul de utilizare,
sunt utilizabile cu uşurinţă chiar de către nespecialişti;
posibilitatea realizării rapide a diagramelor şi graficelor statistice, de diverse
forme, pe baza datelor din tabele;
posibilitatea transferului rezultatelor spre şi dinspre documente.
De circa un deceniu în aceste aplicaţii a fost implementată organizarea datelor pe
mai multe foi de lucru (worksheets), presupuse situate ca într-o carte. Fiecare foaie de
lucru are o denumire ce o identifică; implicit, în Excel aceste denumiri sunt Foaie1,
Foaie2, …
O foaie de lucru poate fi organizată ca tabel (spreadsheet).
Orice tabel este format din celule dispuse pe linii şi pe coloane. În fiecare celulă
putem plasa o valoare de un tip extrem de divers:
valoare numerică;
text (secvenţă de caractere);
dată calendaristică;
formulă de calcul cu date ce sunt plasate în alte celule.
Afişarea pe ecran a valorii unei celule poate fi efectuată în diverse moduri; de
regulă valoarea afişată diferă, uneori substanţial, de valoarea plasată în celulă!
Exprimarea formulelor respectă regulile clasice ale algebrei, semnele operaţiilor
aritmetice fiind +, -, * (pentru înmulţire) şi / (pentru împărţire). Pentru a fi deosebite de
textele ordinare, formulele sunt precedate de caracterul ‚=’.
Evident, o celulă este identificată prin precizarea liniei şi coloanei din care face
parte. De obicei identificarea coloanelor se face prin litere A, B, … iar după epuizarea
acestora prin secvenţe de două litere AA, AB, …, AZ, BA, BB, … Cât despre identificarea
liniei, aceasta este dată de numărul de ordine: 1, 2, 3, … Astfel, notaţia H21 identifică
aceeaşi celula din linia 21 şi coloana a 8-a.
Ca exemplu general, notaţia Foaie2!AB215 identifică celula aflată pe coloana a
28-a şi linia a 215-a de pe a 2-a foaie implicită.
Pe o foaie de lucru organizată ca tabel pot exista cel mult 256 de coloane (ceea ce
înseamnă că ultimul identificator de coloană este IV). Cât despre numărul maxim de linii,
acesta este în principiu 65536.
Celulele pot fi grupate, după dorinţă, în domenii, iar pentru uşurinţă domeniile pot
fi denumite.

- 17 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică

Un domeniu elementar este uşor de definit, ca grup dreptunghiular de celule


(contigue). Un asemenea grup este determinat evident de două celule extreme: cea de colţ
din stânga-sus şi cea de colţ din dreapta-jos. Evident, o celulă poate fi considerată ca
formând, ea singură, un domeniu elementar „degenerat”. De asemenea, pot exista domenii
de tip coloană, pentru care „dreptunghiul” se reduce la celule contigue de pe aceeaşi
coloană; analog pentru linii.
Identificarea unui domeniu elementar (care nu este degenerat) poate fi făcută prin
specificarea identificatorilor celulelor de colţ, separându-i prin caracterul ‚:’. Astfel,
C1:E4 identifică un domeniu elementar având 12 celule (situate pe 4 linii şi 3 coloane),
iar A2:D2 identifică un domeniu tip coloană, având 4 celule.
În general, un domeniu este alcătuit din domenii elementare, prin operaţiuni de
reunire şi intersectare. Pentru simbolizarea reunirii se foloseşte caracterul ‚,’, iar pentru
simbolizarea intersectării se foloseşte caracterul ‚ ’ (blanc). Astfel, A3:B5,D3:E5
identifică un domeniu format din 12 celule, grupate în două domenii elementare separate;
ca un alt exemplu, B3:C6 A4:D5 identifică exact domeniul elementar B4:C5.
De obicei într-un domeniu sunt depuse date ce au o legătură logică între ele (dar nu
sunt neapărat de acelaşi tip). Astfel, în cazul reprezentării grafice a unor date numerice se
obişnuieşte să se completeze domeniul datelor cu o linie şi o coloană de „explicaţii”. Excel
„înţelege” rostul fiecărei date din domeniul extins!
Forma de cruce albă (Cross) a cursorului mausului este folosită
pentru selectarea unui domeniu. Domeniul elementar selectat va fi încadrat,
iar celulele sale vor avea fundalul colorat (cu excepţia celulei active,
plasată în colţ).
Forma asemănătoare literei I (I Beam)este folosită în activităţi de
editare.
Forma de săgeată albă, vârful înspre stânga (Left Arrow) este
folosită pentru mutarea domeniului selectat.

Forma de cruce neagră se foloseşte pentru activităţi de umplere


automată a conţinuturilor celulelor, prin „tragere” (drag and drop).

Forma de săgeată dublă este folosită pentru redimensionare (în


direcţiile arătate de săgeţi).

Aplicaţia Excel permite crearea rapidă de diagrame statistice. Urmăriţi figura de mai
jos şi completaţi domeniul A1:F4 cu datele pe care le vedeţi. (De exemplu, în celula A2
plasaţi textul „Mai puţin de o săptămână”.)

- 18 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016

Selectaţi domeniul A1:F4, apelaţi comanda Diagramă din meniul Inserare,


alegeţi tipul „Bară”, subtipul „bară stratificată, 100%”, adăugaţi legenda şi titlul, în aşa fel
încât să realizaţi – pe o foaie nouă – diagrama următoare.

Mai puţin de o săptămână


Evoluţia proporţiilor deceselor infantile De la 1 la 4 săptămâni
De la 4 săptămâni la 1 an

2007 (prog.)

1987

1967

1947

1927

0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Adăugaţi săgeţile roşii, apelând la instrumentul „Segment” de pe bara


instrumentelor de desenare. (În caz că nu aveţi vizibilă această bară, afişaţi-o apelând
comanda Bare de instrumente Desenare din meniul Vizualizare.) Încercaţi să afişati pe
bare procentele seriei „albastre”, apoi să schimbaţi culoarea albastră cu culoarea verde, iar
procentele cu culoare portocalie. Redenumiţi „Datele” foaia pe care aţi depus datele şi
„Diagrama” foaia pe care este diagrama creată. După ce aţi completat proprietăţile
fişierului (titlul, subiectul, autorul, ...) apelând comanda Proprietăţi din meniul Fişier,
salvaţi fişierul cu denumirea nume_INFANTIL.xls.
În fişierul nume_INALTIMI.xls veţi introduce datele privind distribuţia
înălţimilor bărbaţilor la încorporare (18-22 ani), şi veţi crea diagrame de tip histogramă şi
rozetă care să prezinte aceste date. Datele se află în tabelul următor:
Clasa Numărul
Sub 150 cm 112
150 – 152.5 cm 523
152.5 – 155 cm 1715
155 – 157.5 cm 3371
157.5 – 160 cm 5906
160 – 162.5 cm 8655
162.5 – 165 cm 11214
165 – 167.5 cm 11628
167.5 – 170 cm 10338
170 – 172.5 cm 8228
172.5 – 175 cm 5789
175 – 177.5 cm 3356
1 7.5 – 180 cm 1828
180 – 182.5 cm 685
182.5 – 185 cm 224
Peste 185 cm 18

- 19 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică

Cum putem pregăti „raţional” reprezentările grafice? În primul rând, pe coloana A


(dar de la celula A2 în jos) vom plasa separatorii 150, 152.5, 155 şi aşa mai departe. Nu
este necesar să-i tastăm pe toţi; este suficient să plasăm valoarea 150 în celula A2, valoarea
152.5 în celula A3, apoi să selectăm domeniul A2:A3 şi să „tragem” în jos de mânerul de
tragere (având forma de cruce neagră a indicatorului mausului!).
Folosind separatorii din coloana A, pe coloana B vom crea prin concatenare
denumirile claselor. Mai precis, în celula B1 vom plasa formula
=CONCATENATE(A1,” – ”,A2,” cm”)
pe care o vom extinde prin tragere la domeniul B1:B16. (Atenţie, formula nu se tastează,
ci se completează caseta de dialog ce apare după apelarea opţiunii Funcţie
CONCATENATE din meniul Inserare.)
Vom corecta conţinutul celulelor B1 şi B16 în aşa fel încât să devină „Sub 150
cm” respectiv „Peste 185 cm”. În coloana C vom introduce datele numerice.
Înainte de a trece la reprezentările grafice propriu-zise, să ţinem seamă de
recomandarea ca domeniul datelor (adică C1:C16) să fie bordat cu o coloană de inscripţii
în stânga, dar şi deasupra cu o linie de inscripţii. Neexistând această linie, o vom introduce.
Astfel, vom selecta una dintre celulele de pe prima linie (de exemplu celula A1) şi vom
comanda Inserare Rânduri. Constatăm că domeniul datelor devine acum C2:C17. Să
introducem în celula C1 textul de titlu „Repartiţia bărbaţilor incorporabili, după înălţime”.
Să selectăm acum domeniul extins B1:C17, apoi să cerem reprezentarea
diagramatică a datelor din acest domeniul. O veţi face de două ori, odată alegând tipul „cu
coloane”, a doua oară alegând tipul „rozetă”. Veţi plasa de fiecare dată diagrama pe o foaie
nouă, redenumind apoi foile prin „histograma” respectiv „rozeta”. Recomandăm ca foaia
cu datele să fie redenumită „datele”.
Pentru prima diagramă nu aveţi nevoie de legendă, însă ar fi de dorit să introduceţi
valorile seriei ca „etichete”. Dimpotrivă, pentru a doua diagramă legenda este obligatorie,
iar ca etichete ar fi recomandabil să introduceţi „procentele”. Reflectaţi asupra scopului
reprezentărilor grafice şi încercaţi să plasaţi pe diagrame informaţiile relevante.
Repartiţia bărbaţilor incorporabili, după înălţime

14000

12000 11628
11214

10338
10000

8655
8228
8000

5906 5789
6000

4000
3371 3356

1715 1828
2000

523 685
112 224
18
0
Sub 150 150 - 152.5 - 155 - 157.5 - 160 - 162.5 - 165 - 167.5 - 170 - 172.5 - 175 - 177.5 - 180 - 182.5 - Peste
cm 152.5 cm 155 cm 157.5 cm 160 cm 162.5 cm 165 cm 167.5 cm 170 cm 172.5 cm 175 cm 177.5 cm 180 cm 182.5 cm 185 cm 185 cm

- 20 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016

0% Repartiţia bărbaţilor incorporabili, după înălţime


0%
0%
1%
1%
2%
2%
5% 5%

8% 8% Sub 150 cm
150 - 152.5 cm
152.5 - 155 cm
155 - 157.5 cm
157.5 - 160 cm
160 - 162.5 cm
11% 12% 162.5 - 165 cm
165 - 167.5 cm
167.5 - 170 cm
170 - 172.5 cm
172.5 - 175 cm
175 - 177.5 cm
177.5 - 180 cm
180 - 182.5 cm
14% 182.5 - 185 cm
15%
Peste 185 cm

16%

Tema 8: frecvenţe, mediane şi cuartile în Excel.


Într-o cercetare având ca scop studierea obezităţii în raport cu vârsta şi factorii
geografici, a fost evaluat un lot de 251 elevi (de ambele sexe) în vârstă de 18 ani. Rezultatele
sunt prezentate sintetic în tabelul următor:
Categoria de 40-49 50-59 60-69 70-79 80-89 90-99 100 kg şi
greutate kg kg kg kg kg kg peste
băieţi 22 62 45 34 13 4 1
fete 16 20 21 9 4 0 0
Plasăm datele din tabelul de mai sus în domeniul A1:H3 dintr-o foaie de calcul – pe
care s-o numim „datele” – a fişierului nume_MEDIANE.xls.
Totalurile se obţin simplu, introducând în celula B4 formula
=B2+B3
apoi extinzând-o „orizontal” la celulele B4:H4. Evident, în A4 vom plasa textul „Total”.
Cea mai rapidă metodă de a obţine mediana şi cele două cuartile este bazată pe calcului
frecvenţelor cumulate. Pentru a o aplica, vom calcula mai întâi, pe coloana I, totalurile
efectivelor. Astfel, în celula I1 vom plasa textul „Total”, iar In celulele I2, I3 şi I4 vom
plasa formula de însumare
=SUM(B2:H2)
şi analoagele.
Frecvenţele cumulate vor fi plasate pe rândurile 6 (pentru băieţi), 7 (pentru fete) şi 8
(pentru întreg lotul).
Vom plasa pe coloana A texte adecvate: în celula A5 plasăm „Frecvenţe cumulate”, în
A6 „Băieţi”, în A7 „Fete” iar în A8 „Întreg lotul”.
Frecvenţele cumulate se calculează similar, de aceea este suficient să introducem o
singură formulă, pe care o vom extinde apoi şi pe orizontală, şi pe verticală.
Formula de calcul adecvată pentru celula B6 este următoarea (de ce?):
=SUM($B2:B2)/$I2
După ce o prelungiţi la domeniul B6:H8, încercaţi să afişaţi procentual – cu 2
zecimale – datele din acest domeniu.

- 21 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică

Creaț i un document nume_QUARTILE.doc, care va conţine paragraful anterior


redat pe fond gri precum ș i frecventele cumulate. De asemenea, acest document va conţine
paragrafele următoare pe fond gri şi diagrama ataşată.
S-ar impune o întrebare: diferă între ele distribuţiile greutăţilor pentru cele două sexe?
Un răspuns îl vom putea da după ce privim o reprezentare diagramatică a celor două seturi
de date ale frecvenţelor cumulate.
Selectaţi, (ajutându-vă eventual de tasta [Ctrl]) domeniile A1:H1 şi A6:H7. (Avem
nevoie şi de „capete de tabel” pentru cele două serii de date!) Inseraţi o diagramă cu linii –
dar fâră marcatori – având grijă să alegeţi seriile pe rânduri şi nu pe coloane.

Aparent, cele două distribuţii cumulate diferă între ele! Dar, pentru a răspunde
„statistic corect” la întrebare, va trebui să adoptăm un limbaj adecvat. Vom reveni.
În studiile privind obezitatea cercetătorii au opinii împărţite: cei americani consideră
importantă percentila a 95-a, iar cei francezi percentila a 97-a. Mai precis, aceste percentile
ar constitui „graniţa” între „supraponderal” şi „obez”.
Obţinerea medianei, cuartilelor şi percentilelor este mult uşurată în situaţiile în care
dispunem de datele primare şi nu de prezentări sintetice.
De exemplu, dispunem de datele primare din fişierul LP02_1.xls. Pentru băieţi
greutăţile sunt trecute aici, pe singura foaie „Greutati”, în domeniul A2:A98; pentru fete
găsim datele în domeniul B2:B151. Medianele respective vor putea fi obţinute imediat, cu
formulele
=MEDIAN(A2:A98)
=MEDIAN(B2:B151)
=MEDIAN(A2:A98,B2:B151)
Informaţi-vă asupra utilizării funcţiilor QUARTILE() şi PERCENTILE() în Excel.
(Fişierele MG_LP... trebuie preluate prin copiere; nu se lucrează direct cu Excel
asupra originalului.

- 22 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016

Tema 9: calcule simple în Excel. Riscul apariţiei unei forme oarecare de cancer la
fumători (sunt „fumători” cei care fumează pipă sau mai mult de o ţigară pe zi) a fost evaluat
la 0.085. În acelaşi studiu de tip caz-control au mai fost evaluate următoarele riscuri:
- Riscul apariţiei unei maladii cardiovasculare la fumători, la 0.143;
- Riscul apariţiei unei forme de cancer la nefumători, la 0.032;
- Riscul apariţiei unei maladii cardiovasculare la nefumători, la 0.048.
Pentru o evaluare comparativă se foloseşte noţiunea de risc relativ (RR). Astfel, pentru
formele de cancer
0.085
RR cancer 2.66
0.032
exprimă faptul că un fumător este de peste 2.6 ori mai expus apariţiei unei forme de cancer
decât un nefumător. Pentru maladiile cardiovasculare, calculăm şi interpretăm analog
0.143
RR cardiovascular 2.98 .
0.048
Asemenea calcule simple sunt uşor programabile în Excel. Creaţi o carte de calcul
nume_RISCURI.xls, cu o foaie denumită „Calcule”. Aici, în celula A2 introduceţi textul
„riscul pentru fumători”, iar în celula A3 textul „riscul pentru nefumători”. Cu condiţia
completării ulterioare a celulelor B2 şi B3, puteţi plasa în celula B4 formula
=B2/B3
(Expresia #DIV/0! n-ar trebui să ne surprindă. Celula B3 este „goală”, valoarea ei este
asimilată cu 0, aşadar formula ne indică o împărţire la 0.)
Să plasăm în celula B1 textul „cancer”, iar în celula C1 textul „maladii
cardiovasculare”. De îndată ce completăm celulele B2 şi B3 cu valorile 0.085 respectiv
0.032, vom observa apariţia valorii riscului relativ în celula B4. Dar după completarea
celulelor C2 şi C3 cu valorile 0.143 respectiv 0.048, riscul relativ pentru maladii
cardiovasculare nu se completează automat! Va trebui să introducem formula de calcul şi în
celula C4!
Nu este nevoie de tastarea unei noi formule. Vom putea selecta celula B4 în care se
găseşte vechea formulă şi o vom putea extinde, prin tragere de mâner, spre dreapta!
Riscul pentru fumători este o ESTIMARE a probabilităţii ca unui fumător să-i apară o
formă oarecare de cancer, respectiv o maladie cardiovasculară. Aceste estimări sunt obţinute
în urma unor studii bine controlate.
O altă noţiune des întâlnită – în special în epidemiologie – este cea de cotă (odds în
engleză), provenită din limbajul pariorilor; ea exprimă raportul unor şanse.
În cazul formelor de cancer, cota pentru fumători se calculează astfel
0.085
Oddsf 0.093
1 0.085
iar pentru nefumători
0.032
Oddsnf 0.033
1 0.032
Raportul celor două cote este notat de obicei OR (iniţialele de la odds ratio.)
Pare simplu să programăm calculul unei cote. Să plasăm în celula A5 textul „cota
pentru fumători”, iar în celula A6 textul „cota pentru nefumători”.

- 23 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică

Formula pe care o introducem în celula B5 este următoarea:


=B2/(1-B2)
Ea se poate extinde direct, prin tragere de mâner în jos, la celula B6. Încheiaţi lucrul în
foaia „Calcule” după ce aţi programat pe rândul 7 calculul lui odds ratio (şi aţi extins totul la
coloana C).

Tema 10: diagrame cu Excel. Creaţi cu Word un fişier-document nou, denumit


nume_JUDETEAN, în care plasaţi textul (în stilul Titlu):
„Situaţia pacienţilor internaţi în Secţia I a Spitalului Judeţean, în luna martie”
apoi tabelul:
Diagnostice Număr pacienţi
stenoză mitrală 8
boală mitrală 24
insuficienţă mitrală 4
stenoză aortică 11
boală aortică 4
(Atenţie la tipurile de bordură! Controlul acestora îl obţineţi astfel: selectaţi celulele
pe care doriţi să le încadraţi, făcând apoi apel la comanda Borduri şi umbrire din meniul
Format.)
Adăugaţi tabelului un rând suplimentar dedesubt şi o coloană suplimentară în
dreapta. Plasaţi textele „Total pacienţi” şi „Frecvenţa relativă” (tabelul următor!).
Calculul numărului total al pacienţilor este uşor de efectuat: plasând cursorul de
editare în celula corespunzătoare, apelaţi la comanda Formulă din meniul Tabel. Aplicaţia
Word este dotată cu un minim de „inteligenţă”, de fapt cu posibilităţi de a propune
utilizatorului acţiunile cele mai probabile în contextul în care se află. În situaţia noastră
acţiunea propusă ca fiind „probabilă” este =SUM(ABOVE), ceea ce corespunde cu
intenţiile noastre.
Dacă însă dorim să calculăm frecvenţele relative (pe care le vom plasa pe coloana
din dreapta), constatăm că nu dispunem de o cale imediată, iar a le obţine cu ajutorul
accesoriului Calculator, cu toată precizia rezultatelor, este o soluţie primitivă.
Diagnostice Număr pacienţi Frecvenţa relativă
stenoză mitrală 8
boală mit ală 24
insuficienţă mitrală 4
stenoză aortică 11
boală aortică 4
Total pacienţi 51
Datele din primele două coloane sunt suficiente pentru a putea crea o diagramă de tip
histogramă, mult mai adecvată prezentării acestui tip de informaţie decât secvenţa de
numere din tabel. Obţinerea unei asemenea diagrame se face cu ajutorul accesoriului
Graph Chart. (folosim opţiunea Obiect din meniul Inserare)
Acum vom încerca să exploatăm „colaborarea” între Word şi Excel care, după cum
ştim, fac parte din acelaşi pachet de aplicaţii (Microsoft Office). Minimizaţi fereastra
aplicaţiei Word.

- 24 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016

Declanşaţi Excel şi salvaţi imediat cartea de calcul propusă (Registru1) în fişierul


denumit nume_JUDETEAN.
Reluaţi activitatea în Word.
Selectaţi tabelul anterior (folosind
comanda Selectare→Tabel din
meniul Tabel). Preluaţi în Clipboard
tabelul, cu comanda Copiere din
meniul Editare. Treceţi apoi în
Excel, selectaţi cu un clic celula de
colţ A1 din Foaie1, apoi comandaţi
Lipire din meniul Editare.
Rezultatul este clar: tabelul a fost preluat, celulă cu celulă, în foaia de calcul.
Avantajele sunt multiple. În primul rând, în Excel calculele sunt imediate. De exemplu, în
celula C2 putem plasa formula evidentă
=B2/B7
pentru calculul frecvenţei relative (vezi figura anterioară). Valoarea 0.1568… se obţine
imediat.
Nu este nevoie să plasăm individual câte o formulă, analoagă celei de mai sus, în
fiecare dintre celulele C3, …, C6. După ce vom fi informaţi despre cele patru referinţe
posibile la o celulă dată, despre felul în care se modifică ele în situaţia „tragerii de mâner”
(adică despre rolul caracterului ,$’), vom putea modifica formula de mai sus în următoarea
=B2/B$7
apoi o vom extinde prin „tragere de mâner” la domeniul C2:C6. Domeniul se va umple
automat cu toate frecvenţele relative.
Să folosim Excel pentru a obţine diagrama datelor. Pentru aceasta vom selecta mai
întâi domeniul A1:B6, după care comandăm Inserare Diagramă. Vom fi conduşi la o
casetă de dialog cu patru etape, în care vom fixa:
– mai întâi tipul „Coloană”, subtipul bidimensional;
– apoi seria de date (care este bineînţeles pe coloană);
– în etapa a treia vom modifica uşor titlul în „Numărul pacienţilor internaţi în Secţia
I”, apoi vom renunţa la afişarea legendei, întrucât nu este necesară. În pagina Etichete de
date se va alege opţiunea Afişare valoare, iar în pagina Linii de grilă se va renunţa la toate
aceste linii;
– în ultima etapă vom avea grijă să alegem opţiunea „Ca foaie nouă”, în detrimentul
opţiunii „Ca obiect în Foaie1”.
(A doua opţiune nu o recomandăm întrucât componentele diagramei nu sunt facil
controlabile atunci când pregătim imprimarea sa.)
Am obţinut astfel diagrama de tip histogramă pe foaia Diagramă1, bazată pe date
plasate în celulele din Foaie1. De menţionat că orice modificare a datelor va provoca
„instantaneu” redesenarea diagramei.
Reluaţi activitatea în Word, plasând sub tabel următorul text:
„Comparativ, situaţia este prezentată mai bine de diagrama următoare:”
şi în continuare „lipiţi” diagrama de pe Diagramă1. Înainte de a proceda la lipire, folosiţi
instrumentul Casetă text de pe bara grafică pentru a pregăti un chenar cu dimensiunile
aproximative de 14 8 cm. Lipirea diagramei va fi făcută în interiorul chenarului. (Observaţi
- 25 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică

ce se întâmplă în urma lipirii, dacă nu pregătim anterior chenarul.) Controlul chenarului se


poate face cu comanda Formatare casetă text care devine accesibilă prin apăsarea
butonului din dreapta al mausului, având vârful indicatorului undeva deasupra bordurii
casetei text.
Dedesubtul diagramei plasaţi textul următor:
„Aceleaşi date pot fi prezentate şi sub formă de rozetă (structură radială):”
şi în continuare „lipiţi” o diagramă de acest tip, obţinut în Excel, pe baza aceloraşi date, dar
pe altă foaie Diagramă2. Plasaţi pe această diagramă legenda şi încercaţi să plasaţi şi
procentele corespunzătoare fiecărei „felii”.
Dedesubtul acestei rozete plasaţi textul:
„Prezentare întocmită astăzi (data curentă) de către (numele d-voastră).”
în care data curentă o veţi insera cu comanda Data şi ora din meniul Inserare, apoi salvaţi
cele două fişiere nume_JUDETEAN (documentul si fiș ierul xls).
Număr pacienţi
ă
ţi
Nu
lorurlp
ma c ie n

30

24
25
8% 16%

20 22%
ă
te m
s nitraol z

ă
bmoitraal l
15

11 ţă
ă
in s
umitra
fc lie n

10 8 ă
te a
s n o rticz

ă
baoo
a rticl
4 4
5 8%

46%

0
stenoză mitrală boală mitrală insuficienţă mitrală stenoză aortică boală aortică

De unde provin frecvenţele absolute din tabelul iniţial? Răspunsul este imediat: din
înregistrările primare.
Înregistrările primare au fost stocate în fişierul denumit LP02_2.xls. Pentru a-l
prelua, identificaţi pe desktop (biroul de lucru) în ce fel aveţi acces la Reţeaua din
vecinătate (Network neighborhood). De fapt trebuie să identificaţi reţeaua INFOMED în
cadrul căreia se află calculatorul Infomedcd-pdc. Conţinutul dosarului MG2 este accesibil
tuturor utilizatorilor care s-au identificat cu numele de acces „mg.....”.
Preluaţi (prin copiere/lipire) fişierul LP02_2.xls în memoria calculatorului „local”,
mai precis în dosarul Anul2. Deschideţi ACEST exemplar cu un dublu-clic.
Extensia XLS este specifică registrelor create de aplicaţia Excel, de aceea nu este de
mirare că fişierul va fi deschis de către Excel.
Veţi constata că registrul are o
singură foaie de calcul, pe care sunt
plasate câteva date pentru 51 de pacienţi:
numele şi prenumele, sexul, vârsta şi
diagnosticul.
Fiecărui pacient îi este rezervat un
rând, începând cu rândul nr. 2.
Diagnosticului îi este rezervată coloana F.
Putem obţine frecvenţele absolute ale
celor cinci diagnostice printr-o simplă
operaţiune de sortare. Selectăm coloanele
A-F (prin tragere cu mausul deasupra
„inscripţiilor”) după care comandăm
Sortare din meniul Date. Caseta de dialog Sortare ne oferă posibilitatea de a
- 26 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016

descrie criteriul de sortare ca o combinaţie de trei coloane (dar, atenţie, cu opţiunea


Rând antet activată!). După sortare nu ne mai rămâne decât să numărăm rândurile pe
care găsim aceeaşi valoare a diagnosticului.

Tema 11: funcţii în Excel (COUNTIF, CONCATENATE, AVERAGE, STDEV).


O altă posibilitate, mai inteligentă, constă în folosirea repetată a funcţiei predefinite
COUNTIF(). Selectând una dintre celulele libere, de exemplu celula H2, vom face apel
(comanda Inserare Funcţie) la funcţia COUNTIF din categoria celor statistice. Prin
caseta de dialog alăturată folosirea acestei funcţii este controlată destul de facil: trebuie
precizat domeniul în care avem datele ce ne interesează (anume domeniul F2:F52) apoi
criteriul de selecţie pentru numărare (anume valoarea „stenoza mitrală”). Rezultatul
selecţiei este imediat.

Folosiţi iarăşi iconiţa Network Neighborhood de pe biroul de lucru (desktop) prin


intermediul căreia veţi explora reţeaua INFOMED. Identificaţi acum fişierul denumit
LP02_3.xls, pe care îl veţi transfera (Copy/Paste!) în memoria propriului calculator.
Redenumiţi-l imediat nume_PACIENTI.xls (şi dezactivaţi-i atributul Read only).
Veţi constata că este folosită o singură foaie de calcul, denumită datele. În aceasta se
află plasate, pe coloanele B-F şi rândurile 2-26, date personale referitoare la 25 de
pacienţi: numele şi prenumele, sexul, vârsta (probabil în ani) şi diagnosticul (codificat).
Observaţi că numele este separat de prenume, iar valorile pentru sex sunt binare: 0, resp. 1.
Dorim să comasăm, întro singură coloană intitulată Numepren, numele şi prenumele
pacienţilor. În acest scop veţi folosi funcţia predefinită CONCATENATE(), pe care o
puteţi găsi în categoria funcţiilor de prelucrare de text („Text”). Mai precis, plasaţi în
celula G1 denumirea „Numepren”, apoi selectaţi celula G2 şi apelaţi caseta de dialog
Lipire Funcţie (fie apăsând butonul Lipire Funcţie de pe bara instrumentelor, fie apelând
la comanda Funcţie din meniul Inserare).
Pentru început plasaţi în casetele Text1 şi Text2 referinţele la celulele B2, resp. C2.
Observaţi efectul în partea de jos a casetei, în dreptul etichetei „Rezultatul formulei =”. Nu
este exact ceea ce dorim, întrucât din nume şi prenume a fost creat un singur cuvânt.
Pentru a obţine rezultatul dorit va fi necesar să efectuaţi o uşoară corecţie; anume, în caseta
Text2 veţi plasa un spaţiu alb, iar referinţa la celula C2 va fi plasată în caseta Text3. De
data aceasta rezultatul este corespunzător.
După ce apăsaţi butonul OK, veţi observa apariţia în celula G2 a acestui rezultat.
(Atenţie la conţinutul celulei, care nu este „Trofin Ionica”, ci este cel afişat pe bara
formulei! Ar trebui să fie =CONCATENATE(B2;" ";C2).)

- 27 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică

Reţineţi că, prin convenţie, ghilimelele sunt folosite în programare pentru a indica
începutul şi sfârşitul unei secvenţe de caractere.
Este posibil ca formula să apară astfel: =CONCATENATE(B2," ",C2), cu virgule
în loc de punct-virgule. Separatorul între argumente (virgula sau punctul-virgulă) este cel
corespunzător standardului naţional implementat în sistemul de operare Windows XP.
(Căutaţi Regional Settings în Settings→Control Panel pentru mai multe
informaţii.) Extindeţi, prin „tragere de mâner”, formula din celula G2 la întreg domeniul
G2:G26.
Veţi face o încercare de duplicare a valorilor din coloana G în coloana I. Selectaţi
coloana G (clic având indicatorul mausului în dreptul inscripţiei „G” de deasupra coloanei)
apoi comandaţi Copiere. Selectaţi apoi celula I1 şi comandaţi simplu Lipire. Ar trebui să
constataţi că efectul nu este cel dorit de noi! Dat fiind că în formula
=CONCATENATE(B2," ",C2)
referinţele sunt relative, prin copiere şi lipire ele vor fi modificate corespunzător!
Există însă în meniul Editare (al aplicaţiei Excel!) o comandă denumită Lipire
specială, care oferă posibilităţi de manevră suplimentare faţă de comanda Lipire. Ea
conduce la caseta de dialog din figura de mai sus. Alegerea în butonul radio Lipire a
opţiunii Valori, are efectul dorit.
Observaţi că denumirea „Numepren” a coloanei este pe fond alb, spre deosebire de
denumirile celorlalte coloane. Pentru a unifica stilurile, folosiţi tehnica de Copiere/Lipire
specială preluând din celula B1 formatul în celula G1.
Veţi încerca acum să efectuaţi operaţiunea inversă, anume descompunerea datelor
din coloana „Numepren” în „Nume” şi „Prenume”. Aparent există destul de multe funcţii
de prelucrare de text; cu toate acestea operaţiunea dorită nu poate fi realizată direct, cu
ajutorul unei asemenea funcţii. Evident, există posibilitatea întocmirii unui program, bazat
în special pe folosirea funcţiei logice IF(), dar aceasta este o soluţie complicată.
O soluţie mult mai simplă necesită doar folosirea aplicaţiei Word şi exploatarea
comenzilor de lucru cu tabele.
Concret, selectaţi domeniul G2:G26, apoi comandaţi Copiere. Reamintiţi-vă că
obiectul selectat este „copiat” în Clipboard, unde va rămâne până la următoarea comandă
de copiere (sau decupare), indiferent în care aplicaţie o veţi da.
Declanşaţi aplicaţia Word, urmând a crea documentul nume_provizoriu.doc.
Apelând la comanda Lipire celule din meniul Editare al aplicaţiei Word, veţi constata
apariţia (în document a) unui tabel cu 25 de rânduri, dar o singură coloană.
- 28 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016

În continuare veţi apela comenzi din meniul Tabel. Mai întâi veţi selecta tabelul,
plasând cursorul de editare undeva în interiorul său şi apoi apelând Selectare►Tabel.
Odată selectat, veţi face apel la comanda Conversie►Tabel în text; în caseta de dialog
veţi alege ca separator în paragrafe sfârşitul de paragraf (format din secvenţa de caractere
13, 10).
Rezultatul este simplu: înlocuirea tabelului cu o listă de 25 de componente. Această
listă fiind selectată (dacă nu, selectaţi-o!), veţi comanda acum Conversie►Text în tabel.
De această dată, în caseta de dialog veţi alege blancul (caracterul 32) ca separator al
textului în coloane.
Rămâne acum doar să selectaţi cele două coloane (care conţin numele şi prenumele),
să le copiaţi, apoi să le lipiţi începând cu celula J2 a foii de calcul Excel.
Valorile din coloana D sunt binare (0, respectiv 1). Ne dăm seama că valoarea 0
reprezintă sexul masculin (şi nu invers). Pentru a nu da posibilitatea unei interpretări
greşite, ar fi bine să înlocuim valorile 0/1 prin masculin/ feminin/

În acest scop, în celula J2 veţi plasa (prin Lipire Funcţie) funcţia IF(). Cele trei
argumente ale acestei funcţii sunt clare:
a) testul logic, ca expresie logică de referinţe la celule sau domenii; în cazul nostru
se referă doar la conţinutul celulei D2;
b) valoarea funcţiei pentru cazul în care expresia logică test este adevărată (1);
c) valoarea funcţiei pentru cazul în care dacă expresia logică test este falsă (0).
Preluaţi (prin Copiere/Lipire specială) valorile din coloana J în coloana K. Modificarea
valorilor text poate fi făcută prin intermediul funcţiilor de prelucrare de text, cum sunt
PROPER(), UPPER(), LOWER(), SUBSTITUTE() etc. Verificaţi modul de acţiune şi
efectul fiecăreia.
Valorile coloanei E reprezintă vârstele, exprimate în ani. Veţi calcula vârsta medie, precum
şi abaterea standard (deviaţia standard) a vârstelor pacienţilor de la medie. în acest scop se
pot folosi funcţiile statistice AVERAGE(), respectiv STDEV().
Plasaţi în celula E27 (prin tastare sau apelând la Lipire Funcţie; dacă tastaţi, nu
uitaţi caracterul ‚=’ înaintea formulelor!) formula
=AVERAGE(E2:E26)
iar în celula E28 formula
=STDEV(E2:E26)
Ar trebui să obţineţi rezultatele 48.68, respectiv 10.40. Folosiţi comanda Celule din
meniul Format pentru a stabili ca în afişarea rezultatelor să se folosească numai două cifre

- 29 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică

zecimale. În articolele medicale aceste informaţii sunt prezentate astfel:


Vârsta medie a pacienţilor 48.7 (10.4) ani.
(Atunci când valorile au o anumită precizie, media lor va fi prezentată cu o zecimală
în plus. La fel abaterea standard.)
Valorile coloanei F reprezintă cinci diagnostice posibile, codificate prin 111, 222,
333, 444 şi 555. Veţi întocmi histograma valorilor, pe o foaie separată în cadrul cărţii de
calcul (registrului). În acest scop va fi folosită funcţia statistică FREQUENCY().
Dar, mai întâi, vor fi pregătite informaţiile explicative ce vor fi plasate în graficul-
histogramă: în celula L1 veţi plasa textul „Coduri”, în celula M1 veţi plasa „Frecvenţe”, iar
în domeniul L2:L6 veţi plasa – unul sub altul – codurile 111, 222, 333, 444 şi 555.
Selectaţi acum domeniul M2:M6 (chiar dacă momentan nu conţine nimic). Este
esenţial să cunoaşteţi faptul că acest domeniu va fi umplut cu valorile-frecvenţe (absolute)
printr-un singur apel la funcţia FREQUENCY(). Atenţie însă la felul în care procedaţi: va
trebui să daţi o comandă suplimentară după „apăsarea” butonului OK în caseta de dialog a
acestei funcţii!
Concret, având selectat domeniul M2:M6, efectuaţi următorii paşi:
a) faceţi apel (prin simplă tastare sau apelând la Lipire Funcţie) la funcţia
statistică FREQUENCY();
b) completaţi caseta text Data_array (prin tastare sau tragere cu mausul) cu
domeniul F2:F26;
c) completaţi caseta text Bins_array (prin tastare sau tragere cu mausul) cu
domeniul L2:L6;
d) apăsaţi butonul OK, ceea ce va duce la închiderea casetei de dialog;
e) plasaţi printr-un clic cursorul de editare pe bara formulei, deasupra formulei
=FREQUENCY(F2:F26;L2:L6), apoi tastaţi combinaţia Ctrl+Shift+Enter.
Observaţi că formula a fost încadrată de
acolade,
{=FREQUENCY(F2:F26;L2:L6)},
ceea ce înseamnă că ea va umple un
domeniu şi nu doar o singură celulă!
Dispuneţi acum de toate datele necesare
creării histogramei. Selectaţi domeniul
L1:M6 (ataşând datelor „capul de tabel”),
apoi comandaţi Diagramă din meniul
Inserare.
a) Treceţi prin cele patru etape
ale creării unui grafic: tipul „Coloană”,
subtipul bidimensional;
b) seria pe coloane! Observaţi
că diagrama este completată automat (vezi
figura de mai sus) dar cu două serii! Va fi
obligatoriu să eliminaţi seria „Coduri”;
c) titlul va fi „Repartiţia
pacienţilor pe maladii”, pe axa X veţi plasa „Coduri”, iar pe axa Y „Număr pacienţi”.
Renunţaţi la folosirea legendei, întrucât nu este necesară atunci când se reprezintă grafic
doar o singură serie de date. Plasaţi ca etichete valorile frecvenţelor deasupra coloanelor;
- 30 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016

d) plasaţi desenul ca foaie nouă a registrului, cu denumirea „diagrama


frecvenţelor”. Eliminaţi din registru cele două foi de calcul, Foaie1 şi Foaie2, care nu
conţin nimic. (Probabil că va veţi da seama de ce nu puteţi acorda denumiri „lungi” foilor
registrului! Recomandăm să alegeţi denumiri scurte dar sugestive.)
Codificarea maladiilor prin coduri le numerice 111, 222, 333, 444, 555 este complet
artificială. În crearea codurilor se obişnuieşte combinarea cifrelor cu litere. Modificaţi aceste
coduri (ar fi de preferat s-o faceţi pe o copie a foii de calcul, fie aceasta Coduri) prin A1, A2,
B1, C1, C2. Puteţi observa că funcţia FREQUENCY() nu mai dă rezultatele dorite!
Aceste rezultate pot fi obţinute însă cu COUNTIF(). Plasaţi în celula M2 formula
=COUNTIF(F$2:F$26,L2)
apoi extindeţi-o la toate cele cinci celule ale domeniului M2:M6. Repetaţi crearea diagramei
cu coloane; ar trebui să observaţi că Excel o creează automat, fără a mai fi nevoie de
eliminarea de serii!
Ar fi de dorit ca să plasaţi valorile seriei de date deasupra coloanelor, eventual
evidenţiate prin „bolduire” şi mărime 18.
Nu uitaţi că pentru validarea lucrării practice fişierele depuse trebuie să fie complete şi
să aibă declarat autorul.

Tema specială: diagrame cu coloane. Datele din tabelul următor sunt preluate din
Anuarul Statistic al Populaţiei (2005). În tabel se prezintă numărul de familii cu N copii.
Nr. copii în familie Numărul de familii
0 11204
1 114992
2 67712
3 19609
4 8369
5 4284
6 2329
7 1478
>7 2247
De la un eşantion investigat de 46 de familii s-au obţinut următoarele rezultate:
Nr. copii în familie Numărul de familii
0 3
1 20
2 15
3 5
4 3
>4 0
Reprezentarea diagramatică ne permite o percepere mai rapidă a seturilor de date
(comparativ cu citirea numerelor din tabele).
Vom întocmi în Excel o diagramă cu coloane, după ce vom plasa datele pe o foaie de
calcul (denumită, ca de obicei, „Datele”), în domeniul A1:C10. Vom selecta acest domeniu,
după care vom folosi casetele de dialog Inserare diagramă. În final diagrama ar trebui să arate
ca în figura următoare.

- 31 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică

Putem afirma că
eşantionul nostru este
„reprezentativ”? Aparent
da, dacă
„reprezentativitatea” este
considerată relativ la
numărul de copii.
Totuşi, afirmaţia ar
trebui să se bazeze pe
ceva „obiectiv”, nu doar
pe o examinare vizuală a
diagramei!
De exemplu, s-ar putea
baza pe faptul că
„distanţa”
dintre setul de date din eşantion şi setul de date din Anuarul Statistic este mică, mai mică
decât un prag de separare între distanţele „mici” şi distanţele „mari”.
(Un asemenea prag „obiectiv” se stabileşte de obicei exploatându-se o anumită distribuţie
2
. Vom reveni.) Creaţi documentul nume_ANUAR.doc conţinând cele două tabele şi
diagrama de mai sus, cu explicaţiile necesare.

- 32 -

S-ar putea să vă placă și