Sunteți pe pagina 1din 17

MG - Lucrarea practic 2 2012/2012

UMF Carol Davila Informatic Medical i Biostatistic

Indicaii generale: Tradiia activitilor contabile cere ca datele privind veniturile i cheltuielile unei firme sau gospodrii s fie aranjate sub forma unui tabel. Modul tabelar de aranjare a datelor este adecvat i pentru alte activiti, n general tuturor activitilor n care datele primare urmeaz a fi prelucrate. Evident, i n domeniul medical ntlnim deseori situaii n care aranjarea tabelar a datelor prezint avantaje considerabile, i aceasta nu doar n gestiunea spitalului sau a cabinetului medical. Pentru asemenea activiti pentru care aplicaia Word nu este adecvat, ne vom familiariza cu aplicaia Excel. Un prim scop al lucrrii const n exemplificarea obinerii unor indicatori statistici i a efecturii calculelor simple n Excel. Apoi se exploreaz colaborarea ntre Word i Excel n domeniul conversiei tabelelor, foarte util pentru efectuarea unor operaiuni de separare; urmeaz explorarea n Excel a funciilor statistice i a celor dedicate prelucrrii textelor, precum i grafica n Excel. Se va constata c exist destule compatibiliti ntre organizrile tabelare n cele dou softuri; cu toate acestea, Excel este net superior n ceea ce privete calculele, dar mai greoi n operaiunile de aranjare estetic. Alt scop al lucrrii l constituie repetarea felului n care se reprezint diagramatic, cu Excel, anumite date de sintez. n continuare se vor folosi unele funcii implementate n Excel pentru a se efectua diverse calcule statistice simple, dar nu numai. n aceast lucrare practic: a) V vei familiariza cu calculul tabelar. b) Vei exersa obinerea rapid a indicatorilor statistici uzuali; c) Vei explora posibilitile de colaborare ntre aplicaii; d) V vei familiariza cu folosirea funciilor ncastrate. Teme: 7: aplicaia Excel 8: frecvene, mediane i cuartile n Excel 9: calcule simple n Excel 10: diagrame cu Excel 11: funcii n Excel (COUNTIF, CONCATENATE, AVERAGE, STDEV) special: diagrame cu coloane

Softul ce va fi utilizat n lucrarea practic: Word, Excel,

- 16 -

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 2 2012/2013

Tema 7: aplicaia Excel. Cu toate c ofer bune posibiliti de tabelare a datelor, aplicaia Word a fost prevzut doar cu dotri elementare n ceea ce privete prelucrarea prin calcul a acestora. Pe lng rapiditatea cu care sunt executate calculele, n general aplicaiile de calcul tabelar (dintre care vom folosi Excel) prezint i alte avantaje: recalculare automat (i instantanee) a tuturor rezultatelor, imediat ce o valoare oarecare a fost modificat; posibiliti multiple de formatare utile pentru prezentarea, pe ecran, a datelor; posibilitatea reordonrii rapide a liniilor, dup diverse criterii; existena unei varieti de funcii ncastrate de natur matematic, statistic, financiar care, nsoite fiind de explicaii detaliate privind modul de utilizare, sunt utilizabile cu uurin chiar de ctre nespecialiti; posibilitatea realizrii rapide a diagramelor i graficelor statistice, de diverse forme, pe baza datelor din tabele; posibilitatea transferului rezultatelor spre i dinspre documente. De circa un deceniu n aceste aplicaii a fost implementat organiz area datelor pe mai multe foi de lucru (worksheets), presupuse situate ca ntr-o carte. Fiecare foaie de lucru are o denumire ce o identific; implicit, n Excel aceste denumiri sunt Foaie1, Foaie2, O foaie de lucru poate fi organizat ca tabel (spreadsheet). Orice tabel este format din celule dispuse pe linii i pe coloane. n fiecare celul putem plasa o valoare de un tip extrem de divers: valoare numeric; text (secven de caractere); dat calendaristic; formul de calcul cu date ce sunt plasate n alte celule. Afiarea pe ecran a valorii unei celule poate fi efectuat n diverse moduri; de regul valoarea afiat difer, uneori substanial, de valoarea plasat n celul! Exprimarea formulelor respect regulile clasice ale algebrei, semnele opera iilor aritmetice fiind +, -, * (pentru nmulire) i / (pentru mprire). Pentru a fi deosebite de textele ordinare, formulele sunt precedate de caracterul =. Evident, o celul este identificat prin precizarea liniei i coloanei din care face parte. De obicei identificarea coloanelor se face prin litere A, B, iar dup epuizarea acestora prin secvene de dou litere AA, AB, , AZ, BA, BB, Ct despre identificarea liniei, aceasta este dat de numrul de ordine: 1, 2, 3, Astfel, notaia H21 identific aceeai celula din linia 21 i coloana a 8-a. Ca exemplu general, notaia Foaie2!AB215 identific celula aflat pe coloana a 28-a i linia a 215-a de pe a 2-a foaie implicit. Pe o foaie de lucru organizat ca tabel pot exista cel mult 256 de coloane (ceea ce nseamn c ultimul identificator de coloan este IV). Ct despre numrul maxim de linii, acesta este n principiu 65536. Celulele pot fi grupate, dup dorin, n domenii, iar pentru uurin domeniile pot fi denumite.

- 17 -

MG - Lucrarea practic 2 2012/2012

UMF Carol Davila Informatic Medical i Biostatistic

Un domeniu elementar este uor de definit, ca grup dreptunghiular de celule (contigue). Un asemenea grup este determinat evident de dou celule extreme: cea de col din stnga-sus i cea de col din dreapta-jos. Evident, o celul poate fi considerat ca formnd, ea singur, un domeniu elementar degenerat. De asemenea, pot exista domenii de tip coloan, pentru care dreptunghiul se reduce la celule contigue de pe aceeai coloan; analog pentru linii. Identificarea unui domeniu elementar (care nu este degenerat) poate fi fcut prin specificarea identificatorilor celulelor de col, separndu-i prin caracterul :. Astfel, C1:E4 identific un domeniu elementar avnd 12 celule (situate pe 4 linii i 3 coloane), iar A2:D2 identific un domeniu tip coloan, avnd 4 celule. n general, un domeniu este alctuit din domenii elementare, prin operaiuni de reunire i intersectare. Pentru simbolizarea reunirii se folosete caracterul ,, iar pentru simbolizarea intersectrii se folosete caracterul (blanc). Astfel, A3:B5,D3:E5 identific un domeniu format din 12 celule, grupate n dou domenii elementare separate; ca un alt exemplu, B3:C6 A4:D5 identific exact domeniul elementar B4:C5. De obicei ntr-un domeniu sunt depuse date ce au o legtur logic ntre ele (dar nu sunt neaprat de acelai tip). Astfel, n cazul reprezentrii grafice a unor date numerice se obinuiete s se completeze domeniul datelor cu o linie i o coloan de explicaii. Excel nelege rostul fiecrei date din domeniul extins! Forma de cruce alb (Cross) a cursorului mausului este folosit pentru selectarea unui domeniu. Domeniul elementar selectat va fi ncadrat, iar celulele sale vor avea fundalul colorat (cu excepia celulei active, plasat n col). Forma asemntoare literei I (I Beam)este folosit n activiti de editare. Forma de sgeat alb, vrful nspre stnga (Left Arrow) este folosit pentru mutarea domeniului selectat. Forma de cruce neagr se folosete pentru activiti de umplere automat a coninuturilor celulelor, prin tragere (drag and drop). Forma de sgeat dubl este folosit pentru redimensionare (n direciile artate de sgei). Aplicaia Excel permite crearea rapid de diagrame statistice. Urmrii figura de mai jos i completai domeniul A1:F4 cu datele pe care le vedei. (De exemplu, n celula A2 plasai textul Mai puin de o sptmn.)

- 18 -

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 2 2012/2013

Selectai domeniul A1:F4, apelai comanda Diagram din meniul Inserare, alegei tipul Bar, subtipul bar stratificat, 100%, adugai legenda i titlul, n aa fel nct s realizai pe o foaie nou diagrama urmtoare.
Evoluia proporiilor deceselor infantile
Mai puin de o sptmn De la 1 la 4 sptmni De la 4 sptmni la 1 an

2007 (prog.)

1987

1967

1947

1927
0% 10% 20% 30% 40% 50% 60% 70% 80% 90% 100%

Adugai sgeile roii, apelnd la instrumentul Segment de pe bara instrumentelor de desenare. (n caz c nu avei vizibil aceast bar, afiai-o apelnd comanda Bare de instrumenteDesenare din meniul Vizualizare.) ncercai s afiati pe bare procentele seriei albastre, apoi s schimbai culoarea albastr cu culoarea verde, iar procentele cu culoare portocalie. Redenumii Datele foaia pe care ai depus datele i Diagrama foaia pe care este diagrama creat. Dup ce ai completat proprietile fiierului (titlul, subiectul, autorul, ...) apelnd comanda Proprieti din meniul Fiier, salvai fiierul cu denumirea nume_INFANTIL.xls. n fiierul nume_INALTIMI.xls vei introduce datele privind distribuia nlimilor brbailor la ncorporare (18-22 ani), i vei crea diagrame de tip histogram i rozet care s prezinte aceste date. Datele se afl n tabelul urmtor: Clasa Numrul
Sub 150 cm 150 152.5 cm 152.5 155 cm 155 157.5 cm 157.5 160 cm 160 162.5 cm 162.5 165 cm 165 167.5 cm 167.5 170 cm 170 172.5 cm 172.5 175 cm 175 177.5 cm 1 7.5 180 cm 180 182.5 cm 182.5 185 cm Peste 185 cm 112 523 1715 3371 5906 8655 11214 11628 10338 8228 5789 3356 1828 685 224 18

- 19 -

MG - Lucrarea practic 2 2012/2012

UMF Carol Davila Informatic Medical i Biostatistic

Cum putem pregti raional reprezentrile grafice? n primul rnd, pe coloana A (dar de la celula A2 n jos) vom plasa separatorii 150, 152.5, 155 i aa mai departe. Nu este necesar s-i tastm pe toi; este suficient s plasm valoarea 150 n celula A2, valoarea 152.5 n celula A3, apoi s selectm domeniul A2:A3 i s tragem n jos de mnerul de tragere (avnd forma de cruce neagr a indicatorului mausului!). Folosind separatorii din coloana A, pe coloana B vom crea prin concatenare denumirile claselor. Mai precis, n celula B1 vom plasa formula =CONCATENATE(A1, ,A2, cm) pe care o vom extinde prin tragere la domeniul B1:B16. (Atenie, formula nu se tasteaz, ci se completeaz caseta de dialog ce apare dup apelarea opiunii Funcie CONCATENATE din meniul Inserare.) Vom corecta coninutul celulelor B1 i B16 n aa fel nct s devin Sub 150 cm respectiv Peste 185 cm. n coloana C vom introduce datele numerice. nainte de a trece la reprezentrile grafice propriu-zise, s inem seam de recomandarea ca domeniul datelor (adic C1:C16) s fie bordat cu o coloan de inscripii n stnga, dar i deasupra cu o linie de inscripii. Neexistnd aceast linie, o vom introduce. Astfel, vom selecta una dintre celulele de pe prima linie (de exemplu celula A1) i vom comanda InserareRnduri. Constatm c domeniul datelor devine acum C2:C17. S introducem n celula C1 textul de titlu Repartiia brbailor incorporabili, dup nlime. S selectm acum domeniul extins B1:C17, apoi s cerem reprezentarea diagramatic a datelor din acest domeniul. O vei face de dou ori, odat alegnd tipul cu coloane, a doua oar alegnd tipul rozet. Vei plasa de fiecare dat diagrama pe o foaie nou, redenumind apoi foile prin histograma respectiv rozeta. Recomandm ca foaia cu datele s fie redenumit datele. Pentru prima diagram nu avei nevoie de legend, ns ar fi de dorit s introducei valorile seriei ca etichete. Dimpotriv, pentru a doua diagram legenda este obligatorie, iar ca etichete ar fi recomandabil s introducei procentele. Reflectai asupra scopului reprezentrilor grafice i ncercai s plasai pe diagrame informaiile relevante.
Repartiia brbailor incorporabili, dup nlime 14000

12000 11214

11628 10338

10000 8655 8228 8000

6000

5906

5789

4000

3371

3356

2000 523 112 0


Sub 150 150 cm 152.5 cm

1715

1828 685 224 18


Peste 185 cm

152.5 155 cm

155 157.5 cm

157.5 160 cm

160 162.5 cm

162.5 165 cm

165 167.5 cm

167.5 170 cm

170 172.5 cm

172.5 175 cm

175 177.5 cm

177.5 180 cm

180 182.5 cm

182.5 185 cm

- 20 -

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 2 2012/2013

0% 0% 0% 1% 2% 5% 8% 1% 2% 5%

Repartiia brbailor incorporabili, dup nlime

8%

11%

12%

14%

15%

Sub 150 cm 150 - 152.5 cm 152.5 - 155 cm 155 - 157.5 cm 157.5 - 160 cm 160 - 162.5 cm 162.5 - 165 cm 165 - 167.5 cm 167.5 - 170 cm 170 - 172.5 cm 172.5 - 175 cm 175 - 177.5 cm 177.5 - 180 cm 180 - 182.5 cm 182.5 - 185 cm Peste 185 cm

16%

Tema 8: frecvene, mediane i cuartile n Excel. ntr-o cercetare avnd ca scop studierea obezitii n raport cu vrsta i factorii geografici, a fost evaluat un lot de 251 elevi (de ambele sexe) n vrst de 18 ani. Rezultatele sunt prezentate sintetic n tabelul urmtor: Categoria de 40-49 50-59 60-69 70-79 80-89 90-99 100 kg i greutate kg kg kg kg kg kg peste biei 22 62 45 34 13 4 1 fete 16 20 21 9 4 0 0 Plasm datele din tabelul de mai sus n domeniul A1:H3 dintr-o foaie de calcul pe care s-o numim datele a fiierului nume_MEDIANE.xls. Totalurile se obin simplu, introducnd n celula B4 formula =B2+B3 apoi extinznd-o orizontal la celulele B4:H4. Evident, n A4 vom plasa textul Total. Cea mai rapid metod de a obine mediana i cele dou cuartile este bazat pe calcului frecvenelor cumulate. Pentru a o aplica, vom calcula mai nti, pe coloana I, totalurile efectivelor. Astfel, n celula I1 vom plasa textul Total, iar In celulele I2, I3 i I4 vom plasa formula de nsumare =SUM(B2:H2) i analoagele. Frecvenele cumulate vor fi plasate pe rndurile 6 (pentru biei), 7 (pentru fete) i 8 (pentru ntreg lotul). Vom plasa pe coloana A texte adecvate: n celula A5 plasm Frecvene cumulate, n A6 Biei, n A7 Fete iar n A8 ntreg lotul. Frecvenele cumulate se calculeaz similar, de aceea este suficient s introducem o singur formul, pe care o vom extinde apoi i pe orizontal, i pe vertical. Formula de calcul adecvat pentru celula B6 este urmtoarea (de ce?): =SUM($B2:B2)/$I2 Dup ce o prelungii la domeniul B6:H8, ncercai s afiai procentual cu 2 zecimale datele din acest domeniu.

- 21 -

MG - Lucrarea practic 2 2012/2012

UMF Carol Davila Informatic Medical i Biostatistic

Creai un document nume_QUARTILE.doc, care va conine paragraful anterior redat pe fond gri precum i frecventele cumulate. De asemenea, acest document va conine paragrafele urmtoare pe fond gri i diagrama ataat. S-ar impune o ntrebare: difer ntre ele distribuiile greutilor pentru cele dou sexe? Un rspuns l vom putea da dup ce privim o reprezentare diagramatic a celor dou seturi de date ale frecvenelor cumulate. Selectai, (ajutndu-v eventual de tasta [Ctrl]) domeniile A1:H1 i A6:H7. (Avem nevoie i de capete de tabel pentru cele dou serii de date!) Inserai o diagram cu linii dar fr marcatori avnd grij s alegei seriile pe rnduri i nu pe coloane.

Aparent, cele dou distribuii cumulate difer ntre ele! Dar, pentru a rspunde statistic corect la ntrebare, va trebui s adoptm un limbaj adecvat. Vom reveni. n studiile privind obezitatea cercettorii au opinii mprite: cei americani consider important percentila a 95-a, iar cei francezi percentila a 97-a. Mai precis, aceste percentile ar constitui grania ntre supraponderal i obez. Obinerea medianei, cuartilelor i percentilelor este mult uurat n situaiile n care dispunem de datele primare i nu de prezentri sintetice. De exemplu, dispunem de datele primare din fiierul LP02_1.xls. Pentru biei greutile sunt trecute aici, pe singura foaie Greutati, n domeniul A2:A98; pentru fete gsim datele n domeniul B2:B151. Medianele respective vor putea fi obinute imediat, cu formulele =MEDIAN(A2:A98) =MEDIAN(B2:B151) =MEDIAN(A2:A98,B2:B151) Informai-v asupra utilizrii funciilor QUARTILE() i PERCENTILE() n Excel. (Fiierele MG_LP... trebuie preluate prin copiere; nu se lucreaz direct cu Excel asupra originalului. Reamintim c ele pot fi preluate: a) Din dosarul special al reelei locale, sau b) Prin ftp, din site-ul 10.0.1.125.)

- 22 -

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 2 2012/2013

Tema 9: calcule simple n Excel. Riscul apariiei unei forme oarecare de cancer la fumtori (sunt fumtori cei care fumeaz pip sau mai mult de o igar p e zi) a fost evaluat la 0.085. n acelai studiu de tip caz-control au mai fost evaluate urmtoarele riscuri: - Riscul apariiei unei maladii cardiovasculare la fumtori, la 0.143; - Riscul apariiei unei forme de cancer la nefumtori, la 0.032; - Riscul apariiei unei maladii cardiovasculare la nefumtori, la 0.048. Pentru o evaluare comparativ se folosete noiunea de risc relativ (RR). Astfel, pentru formele de cancer 0.085 RR cancer 2.66 0.032 exprim faptul c un fumtor este de peste 2.6 ori mai expus apariiei unei forme de cancer dect un nefumtor. Pentru maladiile cardiovasculare, calculm i interpretm analog 0.143 RR cardiovascular 2.98 . 0.048 Asemenea calcule simple sunt uor programabile n Excel. Creai o carte de calcul nume_RISCURI.xls, cu o foaie denumit Calcule. Aici, n celula A2 introducei textul riscul pentru fumtori, iar n celula A3 textul riscul pentru nefumtori. Cu condiia completrii ulterioare a celulelor B2 i B3, putei plasa n celula B4 formula =B2/B3 (Expresia #DIV/0! n-ar trebui s ne surprind. Celula B3 este goal, valoarea ei este asimilat cu 0, aadar formula ne indic o mprire la 0.) S plasm n celula B1 textul cancer, iar n celula C1 textul maladii cardiovasculare. De ndat ce completm celulele B2 i B3 cu valorile 0.085 respectiv 0.032, vom observa apariia valorii riscului relativ n celula B4. Dar dup completarea celulelor C2 i C3 cu valorile 0.143 respectiv 0.048, riscul relativ pentru maladii cardiovasculare nu se completeaz automat! Va trebui s introducem formula de calcul i n celula C4! Nu este nevoie de tastarea unei noi formule. Vom putea selecta celula B4 n care se gsete vechea formul i o vom putea extinde, prin tragere de mner, spre dreapta! Riscul pentru fumtori este o ESTIMARE a probabilitii ca unui fumtor s-i apar o form oarecare de cancer, respectiv o maladie cardiovascular. Aceste estimri sunt obinute n urma unor studii bine controlate. O alt noiune des ntlnit n special n epidemiologie este cea de cot (odds n englez), provenit din limbajul pariorilor; ea exprim raportul unor anse. n cazul formelor de cancer, cota pentru fumtori se calculeaz astfel 0.085 Oddsf 0.093 1 0.085 iar pentru nefumtori 0.032 Oddsnf 0.033 1 0.032 Raportul celor dou cote este notat de obicei OR (iniialele de la odds ratio.) Pare simplu s programm calculul unei cote. S plasm n celula A5 textul cota pentru fumtori, iar n celula A6 textul cota pentru nefumtori.

- 23 -

MG - Lucrarea practic 2 2012/2012

UMF Carol Davila Informatic Medical i Biostatistic

Formula pe care o introducem n celula B5 este urmtoarea: =B2/(1-B2) Ea se poate extinde direct, prin tragere de mner n jos, la celula B6. ncheiai lucrul n foaia Calcule dup ce ai programat pe rndul 7 calculul lui odds ratio (i ai extins totul la coloana C). Tema 10: diagrame cu Excel. Creai cu Word un fiier-document nou, denumit nume_JUDETEAN, n care plasai textul (n stilul Titlu): Situaia pacienilor internai n Secia I a Spitalului Judeean, n luna martie apoi tabelul: Diagnostice Numr pacieni stenoz mitral 8 boal mitral 24 insuficien mitral 4 stenoz aortic 11 boal aortic 4 (Atenie la tipurile de bordur! Controlul acestora l obinei astfel: selectai celulele pe care dorii s le ncadrai, fcnd apoi apel la comanda Borduri i umbrire din meniul Format.) Adugai tabelului un rnd suplimentar dedesubt i o coloan suplimentar n dreapta. Plasai textele Total pacieni i Frecvena relativ (tabelul urmtor!). Calculul numrului total al pacienilor este uor de efectuat: plasnd cursorul de editare n celula corespunztoare, apelai la comanda Formul din meniul Tabel. Aplicaia Word este dotat cu un minim de inteligen, de fapt cu posibiliti de a propune utilizatorului aciunile cele mai probabile n contextul n care se afl. n situaia noastr aciunea propus ca fiind probabil este =SUM(ABOVE), ceea ce corespunde cu inteniile noastre. Dac ns dorim s calculm frecvenele relative (pe care le vom plasa pe coloana din dreapta), constatm c nu dispunem de o cale imediat, iar a le obine cu ajutorul accesoriului Calculator, cu toat precizia rezultatelor, este o soluie primitiv. Diagnostice stenoz mitral boal mit al insuficien mitral stenoz aortic boal aortic Total pacieni Numr pacieni 8 24 4 11 4 51 Frecvena relativ

Datele din primele dou coloane sunt suficiente pentru a putea crea o diagram de tip histogram, mult mai adecvat prezentrii acestui tip de informaie dect secvena de numere din tabel. Obinerea unei asemenea diagrame se face cu ajutorul accesoriului Graph Chart. (folosim opiunea Obiect din meniul Inserare) Acum vom ncerca s exploatm colaborarea ntre Word i Excel care, dup cum tim, fac parte din acelai pachet de aplicaii (Microsoft Office). Minimizai fereastra aplicaiei Word.

- 24 -

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 2 2012/2013

Declanai Excel i salvai imediat cartea de calcul propus (Registru1) n fiierul denumit nume_JUDETEAN. Reluai activitatea n Word. Selectai tabelul anterior (folosind comanda SelectareTabel din meniul Tabel). Preluai n Clipboard tabelul, cu comanda Copiere din meniul Editare. Trecei apoi n Excel, selectai cu un clic celula de col A1 din Foaie1, apoi comandai Lipire din meniul Editare. Rezultatul este clar: tabelul a fost preluat, celul cu celul, n foaia de calcul. Avantajele sunt multiple. n primul rnd, n Excel calculele sunt imediate. De exemplu, n celula C2 putem plasa formula evident =B2/B7 pentru calculul frecvenei relative (vezi figura anterioar). Valoarea 0.1568 se obine imediat. Nu este nevoie s plasm individual cte o formul, analoag celei de mai sus, n fiecare dintre celulele C3, , C6. Dup ce vom fi informai despre cele patru referine posibile la o celul dat, despre felul n care se modific ele n situaia tragerii de mner (adic despre rolul caracterului ,$), vom putea modifica formula de mai sus n urmtoarea =B2/B$7 apoi o vom extinde prin tragere de mner la domeniul C2:C6. Domeniul se va umple automat cu toate frecvenele relative. S folosim Excel pentru a obine diagrama datelor. Pentru aceasta vom selecta mai nti domeniul A1:B6, dup care comandm InserareDiagram. Vom fi condui la o caset de dialog cu patru etape, n care vom fixa: mai nti tipul Coloan, subtipul bidimensional; apoi seria de date (care este bineneles pe coloan); n etapa a treia vom modifica uor titlul n Numrul pacienilor internai n Secia I, apoi vom renuna la afiarea legendei, ntruct nu este necesar. n pagina Etichete de date se va alege opiunea Afiare valoare, iar n pagina Linii de gril se va renuna la toate aceste linii; n ultima etap vom avea grij s alegem opiunea Ca foaie nou, n detrimentul opiunii Ca obiect n Foaie1. (A doua opiune nu o recomandm ntruct componentele diagramei nu sunt facil controlabile atunci cnd pregtim imprimarea sa.) Am obinut astfel diagrama de tip histogram pe foaia Diagram1, bazat pe date plasate n celulele din Foaie1. De menionat c orice modificare a datelor va provoca instantaneu redesenarea diagramei. Reluai activitatea n Word, plasnd sub tabel urmtorul text: Comparativ, situaia este prezentat mai bine de diagrama urmtoare: i n continuare lipii diagrama de pe Diagram1. nainte de a proceda la lipire, folosii instrumentul Caset text de pe bara grafic pentru a pregti un chenar cu dimensiunile aproximative de 14 8 cm. Lipirea diagramei va fi fcut n interiorul chenarului. (Observai

- 25 -

MG - Lucrarea practic 2 2012/2012

UMF Carol Davila Informatic Medical i Biostatistic

ce se ntmpl n urma lipirii, dac nu pregtim anterior chenarul.) Controlul chenarului se poate face cu comanda Formatare caset text care devine accesibil prin apsarea butonului din dreapta al mausului, avnd vrful indicatorului undeva deasupra bordurii casetei text. Dedesubtul diagramei plasai textul urmtor: Aceleai date pot fi prezentate i sub form de rozet (structur radial): i n continuare lipii o diagram de acest tip, obinut n Excel, pe baza acelorai date, dar pe alt foaie Diagram2. Plasai pe aceast diagram legenda i ncercai s plasai i procentele corespunztoare fiecrei felii. Dedesubtul acestei rozete plasai textul: Prezentare ntocmit astzi (data curent) de ctre (numele d-voastr). n care data curent o vei insera cu comanda Data i ora din meniul Inserare, apoi salvai cele dou fiiere nume_JUDETEAN (documentul si fiierul xls).
Numr pacieni
Nu o l i u r rl p ma c i en

30

25

24
8% 16%

20

22%

en t s m a r t i o lz bo m a r t i a ll

15 11 10 8

ns i u m c i f ai r t e l n en t s aoz c i t r bo aa ol c i t r

8% 46%

0 stenoz mitral boal mitral insuficien mitral stenoz aortic boal aortic

De unde provin frecvenele absolute din tabelul iniial? Rspunsul este imediat: din nregistrrile primare. nregistrrile primare au fost stocate n fiierul denumit LP02_2.xls. Pentru a-l prelua, identificai pe desktop (biroul de lucru) n ce fel avei acces la Reeaua din vecintate (Network neighborhood). De fapt trebuie s identificai reeaua INFOMED n cadrul creia se afl calculatorul Infomedcd-pdc. Coninutul dosarului MG2 este accesibil tuturor utilizatorilor care s-au identificat cu numele de acces mg...... Preluai (prin copiere/lipire) fiierul LP02_2.xls n memoria calculatorului local, mai precis n dosarul Anul2. Deschidei ACEST exemplar cu un dublu-clic. Extensia XLS este specific registrelor create de aplicaia Excel, de aceea nu este de mirare c fiierul va fi deschis de ctre Excel. Vei constata c registrul are o singur foaie de calcul, pe care sunt plasate cteva date pentru 51 de pacieni: numele i prenumele, sexul, vrsta i diagnosticul. Fiecrui pacient i este rezervat un rnd, ncepnd cu rndul nr. 2. Diagnosticului i este rezervat coloana F. Putem obine frecvenele absolute ale celor cinci diagnostice printr-o simpl operaiune de sortare. Selectm coloanele A-F (prin tragere cu mausul deasupra inscripiilor) dup care comandm Sortare din meniul Date. Caseta de dialog Sortare ne ofer posibilitatea de a

- 26 -

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 2 2012/2013

descrie criteriul de sortare ca o combinaie de trei coloane (dar, atenie, cu opiunea Rnd antet activat!). Dup sortare nu ne mai rmne dect s numrm rndurile pe care gsim aceeai valoare a diagnosticului. Tema 11: funcii n Excel (COUNTIF, CONCATENATE, AVERAGE, STDEV). O alt posibilitate, mai inteligent, const n folosirea repetat a funciei predefinite COUNTIF(). Selectnd una dintre celulele libere, de exemplu celula H2, vom face apel (comanda Inserare Funcie) la funcia COUNTIF din categoria celor statistice. Prin caseta de dialog alturat folosirea acestei funcii este controlat destul de facil: trebuie precizat domeniul n care avem datele ce ne intereseaz (anume domeniul F2:F52) apoi criteriul de selecie pentru numrare (anume valoarea stenoza mitral). Rezultatul seleciei este imediat.

Folosii iari iconia Network Neighborhood de pe biroul de lucru (desktop) prin intermediul creia vei explora reeaua INFOMED. Identificai acum fiierul denumit LP02_3.xls, pe care l vei transfera (Copy/Paste!) n memoria propriului calculator. Redenumii-l imediat nume_PACIENTI.xls (i dezactivai-i atributul Read only). Vei constata c este folosit o singur foaie de calcul, denumit datele. n aceasta se afl plasate, pe coloanele B-F i rndurile 2-26, date personale referitoare la 25 de pacieni: numele i prenumele, sexul, vrsta (probabil n ani) i diagnosticul (codificat). Observai c numele este separat de prenume, iar valorile pentru sex sunt binare: 0, resp. 1. Dorim s comasm, ntro singur coloan intitulat Numepren, numele i prenumele pacienilor. n acest scop vei folosi funcia predefinit CONCATENATE(), pe care o putei gsi n categoria funciilor de prelucrare de text (Text). Mai precis, plasai n celula G1 denumirea Numepren, apoi selectai celula G2 i apelai caseta de dialog Lipire Funcie (fie apsnd butonul Lipire Funcie de pe bara instrumentelor, fie apelnd la comanda Funcie din meniul Inserare). Pentru nceput plasai n casetele Text1 i Text2 referinele la celulele B2, resp. C2. Observai efectul n partea de jos a casetei, n dreptul etichetei Rezultatul formulei =. Nu este exact ceea ce dorim, ntruct din nume i prenume a fost creat un singur cuvnt. Pentru a obine rezultatul dorit va fi necesar s efectuai o uoar corecie; anume, n caseta Text2 vei plasa un spaiu alb, iar referina la celula C2 va fi plasat n caseta Text3. De data aceasta rezultatul este corespunztor. Dup ce apsai butonul OK, vei observa apariia n celula G2 a acestui rezultat. (Atenie la coninutul celulei, care nu este Trofin Ionica, ci este cel afiat pe bara formulei! Ar trebui s fie =CONCATENATE(B2;" ";C2).)

- 27 -

MG - Lucrarea practic 2 2012/2012

UMF Carol Davila Informatic Medical i Biostatistic

Reinei c, prin convenie, ghilimelele sunt folosite n programare pentru a indica nceputul i sfritul unei secvene de caractere. Este posibil ca formula s apar astfel: =CONCATENATE(B2," ",C2), cu virgule n loc de punct-virgule. Separatorul ntre argumente (virgula sau punctul-virgul) este cel corespunztor standardului naional implementat n sistemul de operare Windows XP. (Cutai Regional Settings n SettingsControl Panel pentru mai multe informaii.) Extindei, prin tragere de mner, formula din celula G2 la ntreg domeniul G2:G26. Vei face o ncercare de duplicare a valorilor din coloana G n coloana I. Selectai coloana G (clic avnd indicatorul mausului n dreptul inscripiei G de deasupra coloanei) apoi comandai Copiere. Selectai apoi celula I1 i comandai simplu Lipire. Ar trebui s constatai c efectul nu este cel dorit de noi! Dat fiind c n formula =CONCATENATE(B2," ",C2) referinele sunt relative, prin copiere i lipire ele vor fi modificate corespunztor! Exist ns n meniul Editare (al aplicaiei Excel!) o comand denumit Lipire special, care ofer posibiliti de manevr suplimentare fa de comanda Lipire. Ea conduce la caseta de dialog din figura de mai sus. Alegerea n butonul radio Lipire a opiunii Valori, are efectul dorit. Observai c denumirea Numepren a coloanei este pe fond alb, spre deosebire de denumirile celorlalte coloane. Pentru a unifica stilurile, folosii tehnica de Copiere/Lipire special prelund din celula B1 formatul n celula G1. Vei ncerca acum s efectuai operaiunea invers, anume descompunerea datelor din coloana Numepren n Nume i Prenume. Aparent exist destul de multe funcii de prelucrare de text; cu toate acestea operaiunea dorit nu poate fi realizat direct, cu ajutorul unei asemenea funcii. Evident, exist posibilitatea ntocmirii unui program, bazat n special pe folosirea funciei logice IF(), dar aceasta este o soluie complicat. O soluie mult mai simpl necesit doar folosirea aplicaiei Word i exploatarea comenzilor de lucru cu tabele. Concret, selectai domeniul G2:G26, apoi comandai Copiere. Reamintii-v c obiectul selectat este copiat n Clipboard, unde va rmne pn la urmtoarea comand de copiere (sau decupare), indiferent n care aplicaie o vei da. Declanai aplicaia Word, urmnd a crea documentul nume_provizoriu.doc. Apelnd la comanda Lipire celule din meniul Editare al aplicaiei Word, vei constata apariia (n document a) unui tabel cu 25 de rnduri, dar o singur coloan.

- 28 -

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 2 2012/2013

n continuare vei apela comenzi din meniul Tabel. Mai nti vei selecta tabelul, plasnd cursorul de editare undeva n interiorul su i apoi apelnd SelectareTabel. Odat selectat, vei face apel la comanda ConversieTabel n text; n caseta de dialog vei alege ca separator n paragrafe sfritul de paragraf (format din secvena de caractere 13, 10). Rezultatul este simplu: nlocuirea tabelului cu o list de 25 de componente. Aceast list fiind selectat (dac nu, selectai-o!), vei comanda acum ConversieText n tabel. De aceast dat, n caseta de dialog vei alege blancul (caracterul 32) ca separator al textului n coloane. Rmne acum doar s selectai cele dou coloane (care conin numele i pr enumele), s le copiai, apoi s le lipii ncepnd cu celula J2 a foii de calcul Excel. Valorile din coloana D sunt binare (0, respectiv 1). Ne dm seama c valoarea 0 reprezint sexul masculin (i nu invers). Pentru a nu da posibilitatea unei interpret ri greite, ar fi bine s nlocuim valorile 0/1 prin masculin/ feminin/

n acest scop, n celula J2 vei plasa (prin Lipire Funcie) funcia IF(). Cele trei argumente ale acestei funcii sunt clare: a) testul logic, ca expresie logic de referine la celule sau domenii; n cazul nostru se refer doar la coninutul celulei D2; b) valoarea funciei pentru cazul n care expresia logic test este adevrat (1); c) valoarea funciei pentru cazul n care dac expresia logic test este fals (0). Preluai (prin Copiere/Lipire special) valorile din coloana J n coloana K. Modificarea valorilor text poate fi fcut prin intermediul funciilor de prelucrare de text, cum sunt PROPER(), UPPER(), LOWER(), SUBSTITUTE() etc. Verificai modul de aciune i efectul fiecreia. Valorile coloanei E reprezint vrstele, exprimate n ani. Vei calcula vrsta medie, precum i abaterea standard (deviaia standard) a vrstelor pacienilor de la medie. n acest scop se pot folosi funciile statistice AVERAGE(), respectiv STDEV(). Plasai n celula E27 (prin tastare sau apelnd la Lipire Funcie; dac tastai, nu uitai caracterul = naintea formulelor!) formula =AVERAGE(E2:E26) iar n celula E28 formula =STDEV(E2:E26) Ar trebui s obinei rezultatele 48.68, respectiv 10.40. Folosii comanda Celule din meniul Format pentru a stabili ca n afiarea rezultatelor s se foloseasc numai dou cifre

- 29 -

MG - Lucrarea practic 2 2012/2012

UMF Carol Davila Informatic Medical i Biostatistic

zecimale. n articolele medicale aceste informaii sunt prezentate astfel: Vrsta medie a pacienilor 48.7 (10.4) ani. (Atunci cnd valorile au o anumit precizie, media lor va fi prezentat cu o zecimal n plus. La fel abaterea standard.) Valorile coloanei F reprezint cinci diagnostice posibile, codificate prin 111, 222, 333, 444 i 555. Vei ntocmi histograma valorilor, pe o foaie separat n cadrul crii de calcul (registrului). n acest scop va fi folosit funcia statistic FREQUENCY(). Dar, mai nti, vor fi pregtite informaiile explicative ce vor fi plasate n graficulhistogram: n celula L1 vei plasa textul Coduri, n celula M1 vei plasa Frecvene, iar n domeniul L2:L6 vei plasa unul sub altul codurile 111, 222, 333, 444 i 555. Selectai acum domeniul M2:M6 (chiar dac momentan nu conine nimic). Este esenial s cunoatei faptul c acest domeniu va fi umplut cu valorile-frecvene (absolute) printr-un singur apel la funcia FREQUENCY(). Atenie ns la felul n care procedai: va trebui s dai o comand suplimentar dup apsarea butonului OK n caseta de dialog a acestei funcii! Concret, avnd selectat domeniul M2:M6, efectuai urmtorii pai: a) facei apel (prin simpl tastare sau apelnd la Lipire Funcie) la funcia statistic FREQUENCY(); b) completai caseta text Data_array (prin tastare sau tragere cu mausul) cu domeniul F2:F26; c) completai caseta text Bins_array (prin tastare sau tragere cu mausul) cu domeniul L2:L6; d) apsai butonul OK, ceea ce va duce la nchiderea casetei de dialog; e) plasai printr-un clic cursorul de editare pe bara formulei, deasupra formulei =FREQUENCY(F2:F26;L2:L6), apoi tastai combinaia Ctrl+Shift+Enter. Observai c formula a fost ncadrat de acolade, {=FREQUENCY(F2:F26;L2:L6)}, ceea ce nseamn c ea va umple un domeniu i nu doar o singur celul! Dispunei acum de toate datele necesare crerii histogramei. Selectai domeniul L1:M6 (atand datelor capul de tabel), apoi comandai Diagram din meniul Inserare. a) Trecei prin cele patru etape ale crerii unui grafic: tipul Coloan, subtipul bidimensional; b) seria pe coloane! Observai c diagrama este completat automat (vezi figura de mai sus) dar cu dou serii! Va fi obligatoriu s eliminai seria Coduri; c) titlul va fi Repartiia pacienilor pe maladii, pe axa X vei plasa Coduri, iar pe axa Y Numr pacieni. Renunai la folosirea legendei, ntruct nu este necesar atunci cnd se reprezint grafic doar o singur serie de date. Plasai ca etichete valorile frecvenelor deasupra coloanelor;

- 30 -

UMF Carol Davila Informatic Medical i Biostatistic

MG - Lucrarea practic 2 2012/2013

d) plasai desenul ca foaie nou a registrului, cu denumirea diagrama frecvenelor. Eliminai din registru cele dou foi de calcul, Foaie1 i Foaie2, care nu conin nimic. (Probabil c va vei da seama de ce nu putei acorda denumiri lungi foilor registrului! Recomandm s alegei denumiri scurte dar sugestive.) Codificarea maladiilor prin coduri le numerice 111, 222, 333, 444, 555 este complet artificial. n crearea codurilor se obinuiete combinarea cifrelor cu litere. Modificai aceste coduri (ar fi de preferat s-o facei pe o copie a foii de calcul, fie aceasta Coduri) prin A1, A2, B1, C1, C2. Putei observa c funcia FREQUENCY() nu mai d rezultatele dorite! Aceste rezultate pot fi obinute ns cu COUNTIF(). Plasai n celula M2 formula =COUNTIF(F$2:F$26,L2) apoi extindei-o la toate cele cinci celule ale domeniului M2:M6. Repetai crearea diagramei cu coloane; ar trebui s observai c Excel o creeaz automat, fr a mai fi nevoie de eliminarea de serii! Ar fi de dorit ca s plasai valorile seriei de date deasupra coloanelor, eventual evideniate prin bolduire i mrime 18. Nu uitai c pentru validarea lucrrii practice fiierele depuse trebuie s fie complete i s aib declarat autorul. Tema special: diagrame cu coloane. Datele din tabelul urmtor sunt preluate din Anuarul Statistic al Populaiei (2005). n tabel se prezint numrul de familii cu N copii. Nr. copii n familie Numrul de familii 0 11204 1 114992 2 67712 3 19609 4 8369 5 4284 6 2329 7 1478 >7 2247 De la un eantion investigat de 46 de familii s-au obinut urmtoarele rezultate: Nr. copii n familie Numrul de familii 0 3 1 20 2 15 3 5 4 3 >4 0 Reprezentarea diagramatic ne permite o percepere mai rapid a seturilor de date (comparativ cu citirea numerelor din tabele). Vom ntocmi n Excel o diagram cu coloane, dup ce vom plasa datele pe o foaie de calcul (denumit, ca de obicei, Datele), n domeniul A1:C10. Vom selecta acest domeniu, dup care vom folosi casetele de dialog Inserare diagram. n final diagrama ar trebui s arate ca n figura urmtoare.

- 31 -

MG - Lucrarea practic 2 2012/2012

UMF Carol Davila Informatic Medical i Biostatistic

Putem afirma c eantionul nostru este reprezentativ? Aparent da, dac reprezentativitatea este considerat relativ la numrul de copii. Totui, afirmaia ar trebui s se bazeze pe ceva obiectiv, nu doar pe o examinare vizual a diagramei! De exemplu, s-ar putea baza pe faptul c distana dintre setul de date din eantion i setul de date din Anuarul Statistic este mic, mai mic dect un prag de separare ntre distanele mici i distanele mari. (Un asemenea prag obiectiv se stabilete de obicei exploatndu-se o anumit distribuie 2 . Vom reveni.) Creai documentul nume_ANUAR.doc coninnd cele dou tabele i diagrama de mai sus, cu explicaiile necesare.

- 32 -

S-ar putea să vă placă și