Documente Academic
Documente Profesional
Documente Cultură
MG LP02
MG LP02
Indicaţii generale:
Tradiţia activităţilor contabile cere ca datele privind veniturile şi cheltuielile unei
firme sau gospodării să fie aranjate sub forma unui tabel. Modul tabelar de aranjare a
datelor este adecvat şi pentru alte activităţi, în general tuturor activităţilor în care datele
„primare” urmează a fi prelucrate. Evident, şi în domeniul medical întâlnim deseori situaţii
în care aranjarea tabelară a datelor prezintă avantaje considerabile, şi aceasta nu doar în
gestiunea spitalului sau a cabinetului medical. Pentru asemenea activităţi pentru care
aplicaţia Word nu este adecvată, ne vom familiariza cu aplicaţia Excel.
Un prim scop al lucrării constă în exemplificarea obţinerii unor indicatori statistici
şi a efectuării calculelor simple în Excel. Apoi se explorează colaborarea între Word şi
Excel în domeniul conversiei tabelelor, foarte utilă pentru efectuarea unor operaţiuni de
separare; urmează explorarea în Excel a funcţiilor statistice şi a celor dedicate prelucrării
textelor, precum şi grafica în Excel.
Se va constata că există destule compatibilităţi între organizările tabelare în cele
două softuri; cu toate acestea, Excel este net superior în ceea ce priveşte calculele, dar mai
greoi în operaţiunile de aranjare „estetică”.
Alt scop al lucrării îl constituie repetarea felului în care se reprezintă diagramatic,
cu Excel, anumite date „de sinteză”.
În continuare se vor folosi unele funcţii implementate în Excel pentru a se efectua
diverse calcule statistice simple, dar nu numai.
În această lucrare practică:
a) Vă veţi familiariza cu calculul tabelar.
b) Veţi exersa obţinerea rapidă a indicatorilor statistici uzuali;
c) Veţi explora posibilităţile de „colaborare” între aplicaţii;
d) Vă veţi familiariza cu folosirea funcţiilor încastrate.
Teme:
7: aplicaţia Excel
8: frecvenţe, mediane şi cuartile în Excel
9: calcule simple în Excel
10: diagrame cu Excel
11: funcţii în Excel (COUNTIF, CONCATENATE, AVERAGE, STDEV)
specială: diagrame cu coloane
- 16 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016
- 17 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică
Aplicaţia Excel permite crearea rapidă de diagrame statistice. Urmăriţi figura de mai
jos şi completaţi domeniul A1:F4 cu datele pe care le vedeţi. (De exemplu, în celula A2
plasaţi textul „Mai puţin de o săptămână”.)
- 18 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016
2007 (prog.)
1987
1967
1947
1927
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%
- 19 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică
14000
12000 11628
11214
10338
10000
8655
8228
8000
5906 5789
6000
4000
3371 3356
1715 1828
2000
523 685
112 224
18
0
Sub 150 150 - 152.5 - 155 - 157.5 - 160 - 162.5 - 165 - 167.5 - 170 - 172.5 - 175 - 177.5 - 180 - 182.5 - Peste
cm 152.5 cm 155 cm 157.5 cm 160 cm 162.5 cm 165 cm 167.5 cm 170 cm 172.5 cm 175 cm 177.5 cm 180 cm 182.5 cm 185 cm 185 cm
- 20 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016
8% 8% Sub 150 cm
150 - 152.5 cm
152.5 - 155 cm
155 - 157.5 cm
157.5 - 160 cm
160 - 162.5 cm
11% 12% 162.5 - 165 cm
165 - 167.5 cm
167.5 - 170 cm
170 - 172.5 cm
172.5 - 175 cm
175 - 177.5 cm
177.5 - 180 cm
180 - 182.5 cm
14% 182.5 - 185 cm
15%
Peste 185 cm
16%
- 21 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică
Aparent, cele două distribuţii cumulate diferă între ele! Dar, pentru a răspunde
„statistic corect” la întrebare, va trebui să adoptăm un limbaj adecvat. Vom reveni.
În studiile privind obezitatea cercetătorii au opinii împărţite: cei americani consideră
importantă percentila a 95-a, iar cei francezi percentila a 97-a. Mai precis, aceste percentile
ar constitui „graniţa” între „supraponderal” şi „obez”.
Obţinerea medianei, cuartilelor şi percentilelor este mult uşurată în situaţiile în care
dispunem de datele primare şi nu de prezentări sintetice.
De exemplu, dispunem de datele primare din fişierul LP02_1.xls. Pentru băieţi
greutăţile sunt trecute aici, pe singura foaie „Greutati”, în domeniul A2:A98; pentru fete
găsim datele în domeniul B2:B151. Medianele respective vor putea fi obţinute imediat, cu
formulele
=MEDIAN(A2:A98)
=MEDIAN(B2:B151)
=MEDIAN(A2:A98,B2:B151)
Informaţi-vă asupra utilizării funcţiilor QUARTILE() şi PERCENTILE() în Excel.
(Fişierele MG_LP... trebuie preluate prin copiere; nu se lucrează direct cu Excel
asupra originalului.
- 22 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016
Tema 9: calcule simple în Excel. Riscul apariţiei unei forme oarecare de cancer la
fumători (sunt „fumători” cei care fumează pipă sau mai mult de o ţigară pe zi) a fost evaluat
la 0.085. În acelaşi studiu de tip caz-control au mai fost evaluate următoarele riscuri:
- Riscul apariţiei unei maladii cardiovasculare la fumători, la 0.143;
- Riscul apariţiei unei forme de cancer la nefumători, la 0.032;
- Riscul apariţiei unei maladii cardiovasculare la nefumători, la 0.048.
Pentru o evaluare comparativă se foloseşte noţiunea de risc relativ (RR). Astfel, pentru
formele de cancer
0.085
RR cancer 2.66
0.032
exprimă faptul că un fumător este de peste 2.6 ori mai expus apariţiei unei forme de cancer
decât un nefumător. Pentru maladiile cardiovasculare, calculăm şi interpretăm analog
0.143
RR cardiovascular 2.98 .
0.048
Asemenea calcule simple sunt uşor programabile în Excel. Creaţi o carte de calcul
nume_RISCURI.xls, cu o foaie denumită „Calcule”. Aici, în celula A2 introduceţi textul
„riscul pentru fumători”, iar în celula A3 textul „riscul pentru nefumători”. Cu condiţia
completării ulterioare a celulelor B2 şi B3, puteţi plasa în celula B4 formula
=B2/B3
(Expresia #DIV/0! n-ar trebui să ne surprindă. Celula B3 este „goală”, valoarea ei este
asimilată cu 0, aşadar formula ne indică o împărţire la 0.)
Să plasăm în celula B1 textul „cancer”, iar în celula C1 textul „maladii
cardiovasculare”. De îndată ce completăm celulele B2 şi B3 cu valorile 0.085 respectiv
0.032, vom observa apariţia valorii riscului relativ în celula B4. Dar după completarea
celulelor C2 şi C3 cu valorile 0.143 respectiv 0.048, riscul relativ pentru maladii
cardiovasculare nu se completează automat! Va trebui să introducem formula de calcul şi în
celula C4!
Nu este nevoie de tastarea unei noi formule. Vom putea selecta celula B4 în care se
găseşte vechea formulă şi o vom putea extinde, prin tragere de mâner, spre dreapta!
Riscul pentru fumători este o ESTIMARE a probabilităţii ca unui fumător să-i apară o
formă oarecare de cancer, respectiv o maladie cardiovasculară. Aceste estimări sunt obţinute
în urma unor studii bine controlate.
O altă noţiune des întâlnită – în special în epidemiologie – este cea de cotă (odds în
engleză), provenită din limbajul pariorilor; ea exprimă raportul unor şanse.
În cazul formelor de cancer, cota pentru fumători se calculează astfel
0.085
Oddsf 0.093
1 0.085
iar pentru nefumători
0.032
Oddsnf 0.033
1 0.032
Raportul celor două cote este notat de obicei OR (iniţialele de la odds ratio.)
Pare simplu să programăm calculul unei cote. Să plasăm în celula A5 textul „cota
pentru fumători”, iar în celula A6 textul „cota pentru nefumători”.
- 23 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică
- 24 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016
30
24
25
8% 16%
20 22%
ă
te m
s nitraol z
ă
bmoitraal l
15
11 ţă
ă
in s
umitra
fc lie n
10 8 ă
te a
s n o rticz
ă
baoo
a rticl
4 4
5 8%
46%
0
stenoză mitrală boală mitrală insuficienţă mitrală stenoză aortică boală aortică
De unde provin frecvenţele absolute din tabelul iniţial? Răspunsul este imediat: din
înregistrările primare.
Înregistrările primare au fost stocate în fişierul denumit LP02_2.xls. Pentru a-l
prelua, identificaţi pe desktop (biroul de lucru) în ce fel aveţi acces la Reţeaua din
vecinătate (Network neighborhood). De fapt trebuie să identificaţi reţeaua INFOMED în
cadrul căreia se află calculatorul Infomedcd-pdc. Conţinutul dosarului MG2 este accesibil
tuturor utilizatorilor care s-au identificat cu numele de acces „mg.....”.
Preluaţi (prin copiere/lipire) fişierul LP02_2.xls în memoria calculatorului „local”,
mai precis în dosarul Anul2. Deschideţi ACEST exemplar cu un dublu-clic.
Extensia XLS este specifică registrelor create de aplicaţia Excel, de aceea nu este de
mirare că fişierul va fi deschis de către Excel.
Veţi constata că registrul are o
singură foaie de calcul, pe care sunt
plasate câteva date pentru 51 de pacienţi:
numele şi prenumele, sexul, vârsta şi
diagnosticul.
Fiecărui pacient îi este rezervat un
rând, începând cu rândul nr. 2.
Diagnosticului îi este rezervată coloana F.
Putem obţine frecvenţele absolute ale
celor cinci diagnostice printr-o simplă
operaţiune de sortare. Selectăm coloanele
A-F (prin tragere cu mausul deasupra
„inscripţiilor”) după care comandăm
Sortare din meniul Date. Caseta de dialog Sortare ne oferă posibilitatea de a
- 26 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016
- 27 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică
Reţineţi că, prin convenţie, ghilimelele sunt folosite în programare pentru a indica
începutul şi sfârşitul unei secvenţe de caractere.
Este posibil ca formula să apară astfel: =CONCATENATE(B2," ",C2), cu virgule
în loc de punct-virgule. Separatorul între argumente (virgula sau punctul-virgulă) este cel
corespunzător standardului naţional implementat în sistemul de operare Windows XP.
(Căutaţi Regional Settings în Settings→Control Panel pentru mai multe
informaţii.) Extindeţi, prin „tragere de mâner”, formula din celula G2 la întreg domeniul
G2:G26.
Veţi face o încercare de duplicare a valorilor din coloana G în coloana I. Selectaţi
coloana G (clic având indicatorul mausului în dreptul inscripţiei „G” de deasupra coloanei)
apoi comandaţi Copiere. Selectaţi apoi celula I1 şi comandaţi simplu Lipire. Ar trebui să
constataţi că efectul nu este cel dorit de noi! Dat fiind că în formula
=CONCATENATE(B2," ",C2)
referinţele sunt relative, prin copiere şi lipire ele vor fi modificate corespunzător!
Există însă în meniul Editare (al aplicaţiei Excel!) o comandă denumită Lipire
specială, care oferă posibilităţi de manevră suplimentare faţă de comanda Lipire. Ea
conduce la caseta de dialog din figura de mai sus. Alegerea în butonul radio Lipire a
opţiunii Valori, are efectul dorit.
Observaţi că denumirea „Numepren” a coloanei este pe fond alb, spre deosebire de
denumirile celorlalte coloane. Pentru a unifica stilurile, folosiţi tehnica de Copiere/Lipire
specială preluând din celula B1 formatul în celula G1.
Veţi încerca acum să efectuaţi operaţiunea inversă, anume descompunerea datelor
din coloana „Numepren” în „Nume” şi „Prenume”. Aparent există destul de multe funcţii
de prelucrare de text; cu toate acestea operaţiunea dorită nu poate fi realizată direct, cu
ajutorul unei asemenea funcţii. Evident, există posibilitatea întocmirii unui program, bazat
în special pe folosirea funcţiei logice IF(), dar aceasta este o soluţie complicată.
O soluţie mult mai simplă necesită doar folosirea aplicaţiei Word şi exploatarea
comenzilor de lucru cu tabele.
Concret, selectaţi domeniul G2:G26, apoi comandaţi Copiere. Reamintiţi-vă că
obiectul selectat este „copiat” în Clipboard, unde va rămâne până la următoarea comandă
de copiere (sau decupare), indiferent în care aplicaţie o veţi da.
Declanşaţi aplicaţia Word, urmând a crea documentul nume_provizoriu.doc.
Apelând la comanda Lipire celule din meniul Editare al aplicaţiei Word, veţi constata
apariţia (în document a) unui tabel cu 25 de rânduri, dar o singură coloană.
- 28 -
UMF „Carol Davila” – Informatică Medicală şi Biostatistică MG - Lucrarea practică 2 2015/2016
În continuare veţi apela comenzi din meniul Tabel. Mai întâi veţi selecta tabelul,
plasând cursorul de editare undeva în interiorul său şi apoi apelând Selectare►Tabel.
Odată selectat, veţi face apel la comanda Conversie►Tabel în text; în caseta de dialog
veţi alege ca separator în paragrafe sfârşitul de paragraf (format din secvenţa de caractere
13, 10).
Rezultatul este simplu: înlocuirea tabelului cu o listă de 25 de componente. Această
listă fiind selectată (dacă nu, selectaţi-o!), veţi comanda acum Conversie►Text în tabel.
De această dată, în caseta de dialog veţi alege blancul (caracterul 32) ca separator al
textului în coloane.
Rămâne acum doar să selectaţi cele două coloane (care conţin numele şi prenumele),
să le copiaţi, apoi să le lipiţi începând cu celula J2 a foii de calcul Excel.
Valorile din coloana D sunt binare (0, respectiv 1). Ne dăm seama că valoarea 0
reprezintă sexul masculin (şi nu invers). Pentru a nu da posibilitatea unei interpretări
greşite, ar fi bine să înlocuim valorile 0/1 prin masculin/ feminin/
În acest scop, în celula J2 veţi plasa (prin Lipire Funcţie) funcţia IF(). Cele trei
argumente ale acestei funcţii sunt clare:
a) testul logic, ca expresie logică de referinţe la celule sau domenii; în cazul nostru
se referă doar la conţinutul celulei D2;
b) valoarea funcţiei pentru cazul în care expresia logică test este adevărată (1);
c) valoarea funcţiei pentru cazul în care dacă expresia logică test este falsă (0).
Preluaţi (prin Copiere/Lipire specială) valorile din coloana J în coloana K. Modificarea
valorilor text poate fi făcută prin intermediul funcţiilor de prelucrare de text, cum sunt
PROPER(), UPPER(), LOWER(), SUBSTITUTE() etc. Verificaţi modul de acţiune şi
efectul fiecăreia.
Valorile coloanei E reprezintă vârstele, exprimate în ani. Veţi calcula vârsta medie, precum
şi abaterea standard (deviaţia standard) a vârstelor pacienţilor de la medie. în acest scop se
pot folosi funcţiile statistice AVERAGE(), respectiv STDEV().
Plasaţi în celula E27 (prin tastare sau apelând la Lipire Funcţie; dacă tastaţi, nu
uitaţi caracterul ‚=’ înaintea formulelor!) formula
=AVERAGE(E2:E26)
iar în celula E28 formula
=STDEV(E2:E26)
Ar trebui să obţineţi rezultatele 48.68, respectiv 10.40. Folosiţi comanda Celule din
meniul Format pentru a stabili ca în afişarea rezultatelor să se folosească numai două cifre
- 29 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică
Tema specială: diagrame cu coloane. Datele din tabelul următor sunt preluate din
Anuarul Statistic al Populaţiei (2005). În tabel se prezintă numărul de familii cu N copii.
Nr. copii în familie Numărul de familii
0 11204
1 114992
2 67712
3 19609
4 8369
5 4284
6 2329
7 1478
>7 2247
De la un eşantion investigat de 46 de familii s-au obţinut următoarele rezultate:
Nr. copii în familie Numărul de familii
0 3
1 20
2 15
3 5
4 3
>4 0
Reprezentarea diagramatică ne permite o percepere mai rapidă a seturilor de date
(comparativ cu citirea numerelor din tabele).
Vom întocmi în Excel o diagramă cu coloane, după ce vom plasa datele pe o foaie de
calcul (denumită, ca de obicei, „Datele”), în domeniul A1:C10. Vom selecta acest domeniu,
după care vom folosi casetele de dialog Inserare diagramă. În final diagrama ar trebui să arate
ca în figura următoare.
- 31 -
MG - Lucrarea practică 2 2015/2016 UMF „Carol Davila” – Informatică Medicală şi Biostatistică
Putem afirma că
eşantionul nostru este
„reprezentativ”? Aparent
da, dacă
„reprezentativitatea” este
considerată relativ la
numărul de copii.
Totuşi, afirmaţia ar
trebui să se bazeze pe
ceva „obiectiv”, nu doar
pe o examinare vizuală a
diagramei!
De exemplu, s-ar putea
baza pe faptul că
„distanţa”
dintre setul de date din eşantion şi setul de date din Anuarul Statistic este mică, mai mică
decât un prag de separare între distanţele „mici” şi distanţele „mari”.
(Un asemenea prag „obiectiv” se stabileşte de obicei exploatându-se o anumită distribuţie
2
. Vom reveni.) Creaţi documentul nume_ANUAR.doc conţinând cele două tabele şi
diagrama de mai sus, cu explicaţiile necesare.
- 32 -