Sunteți pe pagina 1din 14

Laboratorul al II-lea

Biostatistic Medicin General


Lucrarea de laborator Nr.2
Scop: la sfritul laboratorului vei ti:

S folosii facilitile pachetului Excel legate de calculul indicatorilor statistici i a altor funcii
S calculai indicatori statistici i alte funcii Excel separat, la anumite categorii de pacieni
S folosii tabelele de frecven pentru calculul unor indicatori statistici

1. Funcii Excel
Programul Excel pune la dispoziia utilizatorului un set de funcii foarte bogat care permite realizarea foarte
rapid a unor calcule. Printre cele mai simple funcii sunt suma, media, mediana, cuartilele, minimul,
maximul, numrarea valorilor, etc. n statistic, de obicei avem de calculat astfel de funcii pentru coloane
de valori care sunt introduse ntr-un tabel. Deci ne vom pune problema de a calcula media sau mediana sau o
alt funcie pentru valorile cuprinse ntr-o coloan numeric dintr-un tabel.
1.1. Folosind date introduse de la tastatur
Dac valorile pentru care dorim s facem calculele nu sunt deja nregistrate pe calculator, ele trebuie
introduse de la tastatur. Nu se procedeaz aa dect cnd numrul de valori este relativ mic.
Lansai programul EXCEL i, dup ce numerotai pe coloana A, de la 1 la 15, ca n figura de mai jos,
introducei pe coloana B valorile din figur, sau unele asemntoare (ar putea fi valorile hemoglobinei la 15
pacieni). Avei grij ca, numerotarea i valorile propriu-zise s nceap pe linia 2, deoarece pe linia 1 sunt
scrise titlurile coloanelor, Nrcrt, i respectiv, Hb. Avei de asemenea grij, s scriei numerele zecimale
folosind punctul zecimal, adic, de exemplu, 12.5 i nu 12,5.

Apoi, n celula B18, scriei textul =average(b2:b16) i apoi apsai tasta Enter. Vei constata c n celul,
apare numrul 13.69333, care este media celor 15 numere introduse. Pentru moment nu v preocupai de
faptul c media este nscris n celul cu 5 zecimale (ceea ce este prea mult, n general trebuie s lucrm cu
una sau dou zecimale), lsai aa cum a inserat programul.
Tastai apoi n celula A18, cuvntul Media, pentru a avea o informaie despre ce fel de indicator este calculat
n celula B18.
Pentru calculul deviaiei standard, a minimului i a maximului, scriei ca n figur, n celulele B19, B20 i
apoi n B21, textele: =stdev(b2:b16), apoi, =min(b2:b16), apoi, =max(b2:b16), de fiecare dat, apsnd

Laboratorul al II-lea

tasta Enter. Vor apare numerele 1.18229, care este deviaia standard a seriei celor 15 valori, 11.6, care este
valoarea minim, i 15.7, care este valoarea maxim.
n acest mod, se pot calcula mai muli astfel de indicatori, care n Excel se numesc funcii (funcii Excel), cu
condiia s le cunoatem numele (average, stdev, min, max, etc). n seciunea urmtoare vei vedea cum se
pot folosi aceste funcii, prin alegerea lor dintr-o list oferit de program. Totdeauna cnd dorii s calculai
repede o medie, putei proceda ca mai sus. Scriei numerele pe o coloan (sau pe o linie) i calculai media cu
ajutorul funciei Average.
1.2. Folosind date din tabele executate anterior.
S presupunem c am nregistrat ntr-un tabel de pacieni, valorile bilirubinei, pe o coloan numit BRT, i
c tabelul conine i multe alte coloane cu informaii despre pacienii respectivi. Este vorba de tabelul
CIROZA.
Deschidei tabelul cu date, folosind secvena File->Open, i se alege Ciroza.xls
Cutai coloana care v intereseaz. Aa cum am spus mai sus, ne intereseaz coloana valorilor
bilirubinei totale (BRT). Coloana este P i valorile sunt nregistratede la P2 la P235. La P1, este
numele coloanei.
Putem situa media sau alt calcul cu valorile de pe aceast coloan n orice celul liber. Totui,
pentru a lucra organizat, ne vom deplasa cu ajutorul barelor de derulare sau cu ajutorul sgeilor de
pe tastatur, pn n celula P237, adic sub coloana de valori, lsnd o celul liber(P236).

n celula P237, scriei textul: =average(p2:p235) fr s v preocupai de faptul c nu are loc exact n celul.
Urmrii de fapt textul pe care l scriei n linia de stare situat imediat deasupra numelor coloanelor. Acolo
este redat ceea ce ai tastat la un moment dat. Cnd ai terminat de scris, apsai tasta ENTER.
Vei constata c n locul formulei pe care ai scris-o, apare un numr, care nu este altceva dect media
valorilor de pe coloana BRT.
Dac vei executa un clic pe celula unde ai calculat media, adic pe celula p237, i vei privi n linia de stare,
deasupra numelor coloanelor, vei constata c, dei n celul este scris un numr (media valorilor din coloana
P), n linia de stare este scris formula pe care ai aplicat-o. Dac executai clic pe orice alt celul care
conine un numr, n linia de stare apare exact ceea ce este i n celul. Totui, celulele care conin un rezultat
al unui calcul sau n general, al unei funcii, nu respect aceast regul. n timp ce n celul este afiat
rezultatul calculului sau funciei, n bara de stare se afiaz formula.
Pentru a continua cu exerciiile, n celula p238, scriei textul: =stdev(p2:p235) dup care apsai tasta
ENTER. Vei constata la fel, c n celula p238, apare deviaia standard a valorilor din coloana P. Dac
executai clic pe celula p238 i urmrii linia de stare, vei vedea c programul a memorat acolo formula
folosit. Observai c deviaia standard a valorilor bilirubinei totale este 3,59, deviaie care, pentru media de
3,89, care se afl deasupra, poate fi considerat ca indicnd o mprtiere mare a valorilor.
2

Laboratorul al II-lea

Pentru a nu ncurca formulele, precum i pentru a lucra organizat, este indicat ca lng o formul, ntr-o
celul de preferat n stnga s se scrie ce funcie a fost aplicat.
Deci, ar fi bine s v deplasai n celula O237 i s scriei acolo cuvntul Media. La fel, n celula O238,
scriei cuvintele Deviaia Standard, fr a v preocupa de faptul c textul nu are loc n celul. Dup ce ai
terminat de scris, apsai tasta ENTER, i apoi facei o ajustare a coloanei O, aa cum se vede n figura de
mai sus, aa nct textul s fie vizibil ntr-un mod mai estetic.
Calculai i indicatorii minim, maxim, mediana, numrul de valori, astfel:
n celula p239 scriei formula =min(p2:p235), apoi apsai tasta ENTER
n celula p240 scriei formula =max(p2:p235), apoi apsai tasta ENTER
n celula p241 scriei formula =median(p2:p235), apoi apsai tasta ENTER
n celula p242 scriei formula =count(p2:p235), apoi apsai tasta ENTER

Laboratorul al II-lea

n celulele corespunztoare de pe coloana O, scriei numele indicatorilor, astfel ca la sfrit s arate ca n


figura de mai sus.
Programul Excel, ofer posibilitatea copierii funciilor, astfel c, dac dorim s calculm media i la
coloanele vecine, acest lucru se simplific foarte mult. Pentru a copia formula mediei pentru coloanele din
dreapta coloanei P, procedai astfel:
Cu ajutorul barelor de defilare, aducei coloana O astfel nct s fie prima din stnga. Aceast manevr este
destinat doar scopului de a aduce n ecran coloanele pentru care dorim s calculm media i anume,
coloanele de la Q la Y.
Executai clic n celula p237, apoi deplasai foarte fin cursorul mouse-ului n jurul colului din dreapta jos al
acestei celule. Ar trebui ca, n funcie de poziia lui fa de acest col, s ia trei forme diferite:
cursorul sgeat, apare n apropierea marginilor celulei active
cursorul plus, numai n apropierea colului din dreapta jos, al celulei active.
cursorul cruce, cursorul normal, apare pe restul paginii.

Pentru a copia formula mediei, trebuie s tragei de mouse cu butonul stng apsat exact n momentul n
care cursorul a luat forma de plus. Tragei la dreapta pn n dreptul coloanei Y, chiar dac n timpul
operaiei avei impresia c programul nu face nimic, dup care eliberai butonul. Vei vedea cnd
eliberai butonul mouse-ului c celulele de pe linia 237, de la coloana Q la coloana Y, au n ele mediile
calculate. S-au calculat astfel, mediile coloanelor de la Q la Y, adic pentru valorile urmtorilor
parametri: bilirubina direct, bilirubina indirect, fosfataza acid, GGT, LAP, colesterol, TGP, TGO i
LDH.
4

Laboratorul al II-lea

Repetai operaia de mai sus, trgnd din celula P238 pn n celula Y238, i aa i pe liniile 239 pn la 242.
n final, ecranul ar trebui s arate ca n figura de mai sus. Nu v ngrijorai pentru apariia eventual pe Y240,
sau n alte celule, a unor semne diez. Ele se datoreaz faptului c numrul care a rezultat din calcul este mare
i nu are loc n celul. Ajustai coloana Y, astfel ca numrul s fie afiat corect.

Pn acum am inserat n diferite celule funcii EXCEL fr s ne preocupe de unde putem afla care sunt
funciile oferite i care este numele lor. De fapt, s-a vzut c se poate calcula o funcie dac ne este cunoscut
numele ei: AVERAGE, MEDIAN, STDEV, etc. Dar aceste nume sunt destul de strine i, fiind de fapt
foarte multe, nu pot fi inute minte. Funciile EXCEL pot fi folosite i apelnd la o list a lor, list mprit
pe categorii, astfel nct s putem ajunge mai uor la funcia care ne intereseaz.
Pe lng funciile pe care le-am calculat pn acum, ar mai fi util s tii s calculai cuartilele. Anume este
bine ca ele s fie inserate la celulele P243 i P244. Pentru inserarea unei funcii EXCEL din lista de funcii,
se procedeaz astfel:
Se aaz cursorul pe celula P243, aceast celul devenind activ. Apoi se execut secvena Insert
Function, care deschide fereastra Paste Function (figura de ma jos, stnga).
Fereastra conine dou liste. n stnga, este lista capitolelor sau familiilor de funcii care in de domenii de
activitate diverse. Unul dintre capitole este Statistical. n lista din dreapta sunt listate funciile care in de
statistic. Printre ele, observai pe locul al doilea i funcia Average pe care tocmai ai folosit-o. Mai sunt
funcii matematice, financiare, logice, etc. Un capitol special este primul, al funciilor folosite recent (Most
5

Laboratorul al II-lea

Recently Used). Aici se ine evidena funciilor care au mai fost folosite recent i deci este mai probabil s le
gsim uor.

Vei continua astfel:


Vei alege n lista din stnga capitolul Statistical i vei executa un clic pe numele su
Vei cuta n lista din dreapta funcia QUARTILE i vei da un clic i pe numele ei
Apoi vei apsa butonul OK al ferestrei. Efectul, este apariia ferestrei din figura de mai sus, dreapta,
n care va trebui s specificai ce cuartil dorii i unde sunt valorile de calculat.
n caseta de dialog Array, introducei locul (intervalul) n care se afl valorile de pe coloana care ne
intereseaz pe noi, adic p2:p235
n caseta de dialog Quart, scriei care cuartil o dorii. n cazul nostru este cuartila Q1, deci vei
scrie 1, ca n figura de sus, din dreapta. n final, apsai OK

Efectul este c n celula p243 a aprut valoarea cuartilei Q1.


Procedai asemntor, punnd cursorul n celula p244 i repetai paii de mai sus, ncepnd de la Insert
Function, cernd de data aceasta cuartila Q3, adic atunci cnd ajungei la caseta Quart, scriei 3 i nu 1. n
final, scriei pe celulele O243 i O244, numele funciilor calculate, Q1 i Q3, sau Cuartila I i, respectiv,
Cuartila III. Dup ce ai calculat n acest fel cuartilele pe coloana P, copiai formulele i pe celelalte coloane,
de la Q la Y, aa cum ai procedat i la medie i la ceilali indicatori (prin tragere).
Foaia de calcul, trebuie s arate ca n figura de mai sus.
Programul Excel nu are o funcie special pentru calculul coeficientului de variaie, care este un indicator
important. De aceea, calculul acestui indicator al mprtierii trebuie fcut prin mprirea mediei la deviaia
standard (conform formulei) i eventual nmulirea acestui raport cu 100, pentru a l exprima n procente.
Deci, vei proceda astfel: n celula P245 scriei formula: =p238/p237*100, iar dup apsarea tastei ENTER,
urmrii valoarea coeficientului de variaie care este exprimat n procente, deci trebuie s fie de ordinul
zecilor (uneori chiar peste 100%). n cazul nostru este 92,28, sau o valoare apropiat. Apoi tragei spre
dreapta pentru multiplicarea formulei la coloanele de la Q la Y.
6

Laboratorul al II-lea

2. Statistic descriptiv
Excel are o funcie care returneaz indicatorii statistici mai importani pentru o serie de date numerice, nu pe
rnd, ci toi odat. Pentru a ncepe lucrul, deschidei tabelul CIROZA, dac nu este deschis, folosind
secvena File->Open. Pentru a face apel la aceast funcie deosebit de util, trebuie mai nti s ne asigurm
de urmtoarele:
S presupunem c ne intereseaz indicatorii statistici pentru coloana de vrste ale pacienilor din tabel.
Fixm coloana care ne intereseaz, innd minte numele ei, precum i care sunt celulele de nceput i de
sfrit ale irului de valori. n tabelul CIROZA, numele coloanei de vrste este evident VARSTA. datele se
afl pe coloana D, de la celula D2 pn la celula D235. Acest lucru este bine s fie inut minte, pentru c
funcia pe care o vom folosi imediat, Descriptive Statistics, ne va ntreba acest lucru: unde se afl irul de
numere pentru care dorim indicatorii statistici. Deocamdat ns, nu folosim aceast funcie ci urmrim mai
nti cteva amnunte importante:
Punem cursorul pe prima celul a coloanei, n cazul nostru D1, i folosind tasta sgeat jos, de pe tastatur,
facem s defileze valorile din coloan, urmrind dac datele coninute de coloan sunt numerice i dac sunt
plauzibile. Aceast operaie este deosebit de important. Se ntmpl cteodat ca din eroare s apar pe
coloana de vrste sau pe orice alt coloan i informaie eronat introdus accidental, cum ar fi diferite
texte sau numere mult prea mari, mult prea mici, etc. Chiar dac informaia este numeric, este bine s
urmrim ce valori sunt introduse pentru a nu avea surpriza unor valori aberante. Cele mai des ntlnite valori
aberante sunt zerouri, care sunt inserate uneori la pacienii la care nu au fost disponibile valorile reale.
Observaii. Excel scrie numerele uneori n format tiinific. De exemplu, numrul 0,0000000000234 este scris uneori
de Excel ca 2,34E-11. Aceste valori trebuie terse, fiind erori de introducere. Nu este cazul acum, dar dac ntlnii
astfel de valori, le tergei.
De asemeni, pot aprea din diverse motive valori aberante, de exemplu este posibil ca un pacient s aib trecut vrsta
de 223 ani, sau hemoglobina 145, n loc de 14,5, etc. Aceste valori aberante sau texte pe care le gsii ntr-un tabel,
trebuie eliminate nainte de a face orice calcul, pentru a nu ajunge la rezultate false. Mai jos, avei o imagine care a fost
falsificat pentru exemplificare. Astfel, n celula AP12, apare valoarea 1428, probabil n loc de 14.28. n
celuleleAP16-AP18, apar valori de 0.00, care trebuie i ele terse, dac le vei ntlnii.
Mai observai n figura de mai jos c, celulele pot aprea goale, atunci cnd pacientul nu a fcut analiza respectiv. De
exemplu, leucocitele nu sunt nregistrate pe coloana AQ (numit L) la pacienii de pe liniile 13, 16, 17, 18, 20. Acest
lucru nu mpiedic programul s fac calculele pentru restul pacienilor. Pe coloanele AO i AR (numite C3 =
complementul C3 i respectiv TR = trombocite) sunt chiar foarte multe locuri goale datorate faptului c pacienii
respectivi nu au fcut analiza respectiv.

Revenim la tabelul CIROZA care este acum deschis. Calculele pe care le face comanda Descriptive
statistics, pe care o vom folosi n continuare, impune ca valorile aberante s fie eliminate nainte de folosirea
ei. De aceea, urmrii pe coloana VARSTA, dac valorile sunt sau nu plauzibile. Dac nu suntei siguri c
unele valori sunt sau nu aberante ntrebai cadrul didactic.
7

Laboratorul al II-lea

Pentru a ncepe lucrul, procedai astfel: executai secvena Tools->Data Analysis->Descriptive Statistics.
Va apare o fereastr pe care o vedei n figura de mai sus i pe care trebuie s o completai cu deosebit
atenie, dup cum urmeaz:
Scriei n caseta de opiuni numit Input Range, D1:D235. Prin aceasta ai specificat programului
intervalul de celule unde se afl nscrise numele coloanei i vrstele pacienilor, de la D1 pn la
D235 (D1 are nscris numele coloanei, iar de la D2 sunt vrstele)
Bifai caseta de validare numit Labels in First Row. Aceasta anun programul c de fapt, n
intervalul D1:D235, prima celul, D1 conine numele coloanei (Label = Etichet) i nu vrsta
primului pacient, iar vrstele pacienilor ncep de fapt de la D2 n jos
Bifai butonul radio numit Output Range i scriei n csua de dialog corespunztoare D240. n
momentul bifrii butonului Output Range, vei constata c programul schimb automat textul
introdus mai devreme n caseta Input Range, din D1:D235 n $D$1:$D$235. Acest lucru este
normal i n acest moment nu trebuie s v preocupe. Am precizat prin D240, locul unde programul
va depune rezultatele, din celula D240 spre dreapta i n jos. Pot fi specificate i alte celule cu
condiia s fie libere aproximativ 18 celule n jos pe coloana respectiv i pe coloana vecin din
dreapta. Practic, programul va scrie pe celulele de la D240 la D257 i de la E240 la E257. De aceea,
aceste celule trebuie s fie libere
Bifai butoanele de opiune numite Summary statistics, Kth Largest i Kth Smallest. n casetele
de opiune ale ultimelor dou butoane, scriei 59 (ceea ce reprezint un sfert din numrul de
pacieni). Aceast specificare se face atunci cnd dorim ca programul s calculeze cuartilele (Q1,
pentru Kth Smallest i Q3 pentru Kth Largest). Dac nu dorim cuartilele, se poate scrie n casetele
de dialog respective orice numere ntre 1 i numrul total de linii ale tabelului. De exemplu, dac
vom scrie 10 n ambele, programul o s ne returneze al zecelea cel mai n vrst pacient i al zecelea
cel mai tnr pacient. Apoi apsai butonul OK

Rezultatul este afiat pe coloanele D i E, de la celula 240, n jos, aa cum se vede n figura de sus, stnga, pe
fond de culoare nchis. Apsai pe orice celul alb a ecranului i vei constata c fondul nchis dispare i
celulele cu rezultate sunt ca i restul ecranului. Dup ce ajustai coloanele, lindu-le astfel ca rezultatele s
se vad mai bine, gsii indicatorii statistici ca n figura de sus, dreapta (pe fond alb).
Valorile indicatorilor statistici, sunt afiate cu un numr foarte mare de zecimale, lucru care le face greu de
citit. Se pot afia cu un numr de zecimale mai mic, pentru a fi citite mai uor. Pentru a afia cu mai puine
8

Laboratorul al II-lea

zecimale, mai nti, selectai celulele de la e242 la e256. Apoi, din meniul principal, alegei opiunea
Format, apoi Cell, i executai clic pe aceast opiune. Feresatra care se deschide (figura de mai jos, stnga),
permite setarea celulelor selectate astfel ca afiarea s se fac n mai multe formate ca numr, dat, or,
procent, fracie, text i altele.

Alegei opiuna Number, care se vede c este marcat n figura de sus. n acest caz, programul permite i
fixarea numrului de zecimale, care pentru indicatorii statistici obinui la pasul anterior, este suficient s fie
2. n cazul n care ai dori 3 sau mai multe zecimale, putei s ajustai prin apsri pe cele dou triunghiuri
care mresc sau micoreaz numrul dup dorin. La sfrit, apsai OK. Indicatorii pe care i furnizeaz
aceast funcie sunt listai nc odat n figura de mai sus, dreapta, mpreun cu numele lor n limba romn
(nu este nevoie s scriei numele n romnete, sunt listate doar pentru uurarea reinerii lor).
Observai c media de vrst este de 53,85, iar deviaia standard este de 9,79. Acest lucru se scrie mai
condensat sub forma: 53,85 9,79. Mediana este 55 de ani, ceea ce nseamn c jumtate dintre pacieni sunt
mai tineri de 55 de ani i jumtate mai n vrst. Quartila Q1 este 48 de ani (Smallest(59)), adic un sfert
dintre pacieni sunt sub 48 de ani i trei sferturi au vrsta peste 48 de ani. La fel, interpretai quartila Q3.
Uneori, se arat tendina central a valorilor din serie i excentricitatea distribuirii lor n jurul mediei prin
precizarea medianei i a cuartilelor sub forma: mediana [cuartila Q1; cuartila Q3], adic n cazul nostru 55
ani [48 ani; 60 ani]. Aceasta se face n special atunci cnd seria arat o excentricitate mare.
ntre cele dou cuartile, adic ntre 48 i 60 de ani, se situeaz vrstele a jumtate dintre pacieni. Este deci o
afeciune care afecteaz mai ales aceast grup de vrst. Programul returneaz i modul, care este cea mai
frecvent valoare pe care o ntlnete n seria de valori. n cazul nostru este 58. Excentricitatea de 0,29,
arat c distribuia valorilor n jurul mediei este aproximativ simetric. Boltirea de 0,25, arat c distribuia
este boltit jos.
De reinut: n cazul seriilor numerice cu valori foarte multe, mai ales cnd numerele sunt zecimale,
modul nu are o semnificaie util i nu trebuie interpretat. n cazul seriilor de volum mic, sub 10 15
valori, quartilele nu au o valoare informativ semnificativ i nu se interpreteaz.

3. Subtotaluri
Foarte des apare necesitatea de a calcula repede diverse funcii EXCEL dar nu folosind valorile nregistrate
la toi pacienii ci numai pe ale acelora care ndeplinesc o condiie. De exemplu, am putea avea nevoie s
calculm media de vrst numai pentru pacienii de sex masculin, sau s calculm cea mai mare valoare a
tensiunii arteriale numai la pacienii de sex feminin, etc.
3.1. Subtotaluri pentru date introduse de la tastatur
S presupunem c avem la dispoziie valorile calcemiei la un numr de 30 de pacieni, femei i brbai, aa
cum vedei n figura de jos, din stnga. Introducei datele aa cum le vedei n imagine, iar pentru calculul
mediei, separat la cele dou sexe, vom proceda astfel:

Laboratorul al II-lea

Executai clic n orice celula a tabelului pe care l-ai introdus de la tastatur, de exemplu, n A1
Sortai pacienii dup sex, cu ajutorul comenzii Data->Sort i alegnd n caseta Sort by, numele coloanei
Sex
Apoi efectuai comanda Data->Subtotals, i completai ca n figura de mai sus (dreapta sus), n prima
caset, numele coloanei Sex, n a doua, funcia de efectuat, Average (media), iar n a treia, trebuie s
rmm bifat numai numele coloanei Calcemia. Apoi urmrii s fie bifate i opiunile Replace current
subtotals i Summary below data, ca n figur. Apoi apsai butonul OK

Vei observa, aa ca n figura de mai sus, dreapta jos, c pe linia 16 a aprut pe coloana B, media calcemiei la
femei, iar n celula B33, media calcemiei la brbai. n plus, n celula B34, este media pentru toi pacienii,
iar la C16, C33 i C34, sunt scrise scurte explicaii. F Average, nseamn media la categoria F, adic la
femei, i aa mai departe. n mod asemntor se pot calcula orice funcii excel, alegnd adecvat numele ei n
caseta n care ai ales nainte funcia Average
3.2. Subtotaluri pentru date din tabele mari
S ne punem problema de a calcula media de vrst a pacienilor din tabelul CIROZA separat cea a femeilor
de cea a brbailor. Aceast sarcin se poate realiza n EXCEL cel mai simplu, astfel:

10

Laboratorul al II-lea

Se deschide tabelul CIROZA, dac nu este deja deschis


Folosind secvena Data->Sort, se realizeaz sortarea pacienilor dup coloana SEX, la finalul acestei
operaii fiind listai nti pacienii de sex masculin i apoi cei de sex feminin
Apoi, se execut secvena Data Subtotals, care deschide fereastra Subtotal (vezi mai sus, stnga)
n prima caset de dialog, alegei SEX. n a doua caset de dialog alegei Average (media). n a
treia caset de dialog, bifai caseta de validare VARSTA. Verificai s nu fie i alte nume de coloane
bifate. Apoi, apsai butonul OK

Rezultatul este c au fost inserate unele linii n tabel, pe care sunt listate subtotalurile. Deoarece noi am cerut
media (average) calculat dup fiecare schimbare de simbol pe coloana SEX, programul va calcula media de
vrst a brbailor i respectiv a femeilor.
Prima linie este inserat dup ultimul pacient de sex masculin, dup linia 158, n celua D159. Acolo este
inserat numrul 55 pe coloana vrsta, iar pe coloana SEX este inserat cuvntul Average. Deci, media de
vrst (rotunjit), la brbai este 55 ani. Dac vei cuta la sfritul tabelului, vei gsi nc dou linii inserate,
una cu media de vrst a femeilor i una cu media de vrst pentru toi pacienii.
Dup cum ai observat, programul Excel a afiat mediile de vrst rotunjite la un numr ntreg. Este greu de
crezut c dup mprirea sumei vrstelor la numrul de pacieni, s-a ntmplat s dea o medie ntreag i la
pacienii de sex feminin, i la cei de sex masculin, i la toi pacienii. Explicaia nu poate fi dect c
programul a rotunjit mediile. Dac este nevoie de o precizie de una sau dou zecimale, procedai astfel:

Executai clic pe celula D159, unde se afl media de vrst pentru pacienii de sex masculin (vezi
figura de mai sus, stnga)

Executai secvena Format Cells


Din ferestra care apare, alegei din caseta de opiune Category, opiunea Number, iar n caseta
Decimal places, optai pentru trei zecimale (vezi figura de mai sus, dreapta)
Apoi apsai butonul OK. Media de vrst din celula D159 are acum 3 zecimale

La fel procedai cu celulele D237 i D238. La final, mediile vor fi afiate cu numrul de zecimale dorit.
Excel ofer posibilitatea de a face astfel de subtotaluri folosind nu numai o funcie cum este media ci mai
multe. Acest lucru se realizeaz astfel:
Deschidei tabelul LIMFOM.XLS. Urmrii pe coloana H, stadiul evolutiv al afeciunii pentru fiecare pacient
n parte, iar pe coloana AC, durata supravieuirii, n luni. Ne propunem s calculm media duratei de
supravieuire la pacienii care sunt n stadiul 1, separat la pacienii din stadiul 2, la cei din stadiul 3 i
stadiul 4. n plus, vom calcula i deviaiile standard, i duratele minime i maxime de supravieuire, pentru
fiecare grup de pacieni n parte.

11

Laboratorul al II-lea

Realizai sortarea pacienilor dup stadiul evolutiv al bolii, folosind secvena Data->Sort i alegnd
o singur coloan de sortare, coloana STADIUEV
Apoi, cu secvena Data->Subtotals, cerei programului s calculeze mediile duratei de supravieuire,
completnd ca n figura din stnga. Atenie, pentru a bifa csua de opiune din dreptul numelui
DURATASUP, trebuie s cutai n list cu ajutorul butoanelor triunghiulare. Verificai s nu fie
bifat dect numele coloanei DURATASUP, nu i alte nume de coloan. Atenie, s rmn nebifat
caseta Replace current subtotals
Pentru calculul deviaiilor standard la cele patru categorii, repetai secvena Data->Subtotals, i
schimbai numai numele funciei: n locul funciei Average, alegei StdDev, apoi apsai OK
Apoi, reluai aceeai secven de dou ori alegnd prima dat funcia Max, iar a doua oar funcia
Min

Acum vom urmri dac programul a calculat i media, i deviaia standard, i minimul i maximul, la toate
cele patru grupe de pacieni. Cutai la H10 H13 i vei gsi scrise numele funciilor, precedate de numrul
1 (adic au fost calculate pentru pacienii din stadiul 1). Apoi, la AC10 AC13, gsii Minimul (5 luni),
Maximul (24 luni), Deviaia standard (6,15 luni) i Media (15,125 luni), pentru pacienii din stadiul I.
n mod asemntor, vei gsi la H98 H101, numele funciilor precedate de numrul 4 (adic au fost
calculate pentru pacienii aflai n stadiul 4).

La H102 H105, gsii din nou numele funciilor precedate de cuvntul Grand (adic funciile au fost
calculate pentru ntregul lot). Rezultatele n sine sunt situate la AC98 AC101 i respectiv AC102 AC105.
Deoarece programul a inserat valorile mediilor i ale deviaiilor standard cu multe zecimale, se poate face o
ajustare a numrului de zecimale folosind secvena Format->Cells..., din fereastra care apare alegei
Number i apsai butonul OK. Vor fi afiate toate numerele cu dou zecimale.

4. Exerciii i chestiuni de examen


1. Calculai indicatorii statistici la tabelul CARDIO, la coloanele care reprezint tensiunile: TAMAXINT,
TAMININT, TAMAX2S, TAMIN2S, TAMAX3L, TAMIN3L (tensiunile sistolic i diastolic ale
pacienilor la internare, la dou sptmni de tratament i la 3 luni la controlul postspitalizare). ncepei cu
coloana TAMAXINT, apoi prin copiere, calculai i pentru celelalte 5 coloane. Scriei pe o foaie de hrtie,
ntr-un tabel, mediile, deviaiile standard i coeficienii de variaie pentru cele 6 coloane, iar ntr-un alt tabel,
indicatorii de asimetrie.
12

Laboratorul al II-lea

2. Folosind funcia Descriptive statistics, calculai indicatorii statistici pentru coloana numit Hb, (Tabelul
CIROZA) pe care a fost nregistrat hemoglobina pacienilor. Pe o coal de hrtie, scriei n ordine, unul sub
altul, urmtorii indicatori: media, deviaia standard, coeficientul de variaie (l calculai!), apoi valoarea
minim, cuartila Q1, mediana, cuartila Q3, valoarea maxim. La sfrit, mai precizai excentricitatea
(skewness) i boltirea (kurtosis).
3. Folosind funcia Descriptive statistics, calculai indicatorii statistici pentru coloana BRT (bilirubina
total) i observai c de data aceasta media i mediana difer foarte mult, iar excentricitatea este mult mai
mare. Scriei pe o foaie de hrtie centralizarea situaiei parametrului bilirubina total, preciznd media,
deviaia standard, coeficientul de variaie, iar ca excentricitate, precizai mediana i quartilele sub forma
mediana [cuartila Q1; cuartila Q3].
4. Un numr de 22 de pacieni au fost testai prin chestionarul scalei Oswestry, care urmrete s gradeze
incapacitatea unui pacient cauzat de durerea lombar joas. Scorurile pot fi cuprinse ntre 0 i 100, cu 0
pentru sntos i 100 pentru maximum de incapacitate. Cei 22 de pacieni au obinut urmtoarele scoruri: 56,
42, 48, 64, 33, 34, 22, 68, 24, 57, 48, 46, 57, 51, 40, 63, 60, 49, 59, 45, 46, 43. Calculai indicatorii statistici
pentru seria celor 22 de scoruri obinute de cei 22 de pacieni.
5. Folosind subtotaluri, calculai mediile i deviaiile standard pentru tensiunea arterial sistolic la internare
(TAMAXI), la pacienii din tabelul CARDIO, la fiecare profesie n parte.
Va trebui s sortai pacienii dup profesie, cu ajutorul secvenei Data->Sort, dup care executai de dou ori
secvena Data->Subtotals. n fereastra Subtotal, n caseta numit At each change in, vei pune PROFESIE,
n caseta Use function, vei pune Average, iar n caseta Add subtotal to, vei avea grij s fie bifat numai
TAMAXI. Apsai OK. Apoi reluai, cu secvena Data->Subtotals avnd grij s bifai n caseta Use
function, numele funciei Stdev.
6. Folosind subtotaluri, realizai calculul mediei i deviaiei standard pentru latena medie pe ochiul stng
(LMS) la pacienii din tabelul MIGRENA, separat la fiecare afeciune.
Afeciunile sunt nregistrate pe coloana DIAG, i sunt: MCLS (Migren clasic), MCOM (Migrena comun),
HCEF (Hidrocefalie), PSN (Pseudo-neurastenie), SPB (Sindrom pseudo-bulbar), LC (Lacunarism cerebral)
i NORM (Normali). n acest caz, nu este nevoie s realizai sortarea pacienilor, deoarece tabelul este grupat
deja dup afeciuni (Coloana DIAG). Coloana nu este sortat alfabetic, ns pentru calculul subtotalurilor
este nevoie numai de gruparea pe daignostice. Dup ce laculai mediile, vei constata medii mult crescute la
afeciunea numit LC.
7. Folosind subtotaluri, calculai mediile i deviaiile standard i la coloanele LMD (Latena medie pe ochiul
drept), AMS (Amplitudinea medie pe ochiul stng) i AMD (Amplitudinea medie pe ochiul drept) la
pacienii din tabelul MIGRENA, separat la fiecare afeciune. Vezi ex. 6 pentru indicaii.
8. Un studiu complex, a urmrit printre altele, s stabileasc dac scorurile obinute pe scala IDG (Indexul de
Incapacitate Cervical), la un lot de 105 pacieni cu disabiliti motorii, sunt influenate de vrst i de sex. A
fost alctuit un eantion format din 105 pacieni, 39 femei i 66 brbai, cu diferite vrste. Repartizarea pe
grupe de vrste a fost cea din tabelul de mai jos:
Feminin

Masculin

Total

<35 ani

17

35 - 55 ani

15

25

40

>55 ani

16

32

48

Total

39

66

105

Scorurile obinute de pacieni sunt listate n tabelul IDG.xls mpreun cu grupa de vrst i sexul fiecrui
individ. Calculai mediile scorului IDG separat la femei i la brbai. Apoi, calculai mediile scorului IDG la
pacienii din diferite grupe de vrst. Pentru calculul mediilor la femei i la brbai, realizai nti sortarea
dup sex i apoi efectuai subtotaluri cernd funcia Average. Pentru calculul mediilor scorului IDG n
funcie de vrst, sortai din nou pacienii, de data aceasta dup coloana GRV, i apoi efectuai subtotalurile.
13

Laboratorul al II-lea

9. Folosind comanda FREQ, apreciai dac se distribuie simetric valorile hemoglobinei la pacienii din
tabelul CIROZA.
10. Apreciai dac talia i greutatea pacienilor din tabelul SHR se distribuie simetric. Coloanele unde au fost
nregistrate aceste date n tabelul SHR se numesc Talie i respectiv, Greut1. Atenie, dac lucrai n EPI
INFO, va fi nevoie s realizai nainte citirea tabelului SHR folosind comanda READ.
11. Printre alte teste la care sunt supui pacienii cu astm, pentru a realiza o imagine a abilitilor lor motorii
este i testul 6MWD (distana pe care o pot parcurge n 6 minute), iar pentru monitorizarea dispneei
(greutii n respiraie), scala Borg. n tabelul ASTM, pe coloana BORGI a fost nregistrat scorul Borg la 240
de pacieni. La aceiai 240 de pacieni bolnavi de astm, a fost msurat i scorul 6MWD pe coloana 6MWDI.
Folosind comanda FREQ, stabilii dac valorile celor dou scoruri au o distribuie simetric.
12. Calculai folosind funcii excel sau comanda Descriptive statistics, indicatorii statistici ai tendinei
centrale pentru coloanele BRT i HB din tabelul CIROZA.
13. Calculai indicatorii de mprtiere pentru tensiunea arterial sistolic la internare, la dou sptmni i la
3 luni, la pacienii din tabelul CARDIO. Coloanele se numesc TAMAXI, TAMAX2S i TAMAX3L.
14. n tabelul ASTM, pe coloanele 6MWDI, 6MWDM, 6MWDF, sunt nregistrate pentru fiecare din cei 240
de pacieni bolnavi de astm bronic, distana parcurs n 6 minute la msurtoarea iniial, nainte de
tratament, la msurtoarea intermediar, la mijlocul tratamentului, precum i la msurtoarea final, dup
efectuarea tratamentului. Ateptrile celor care au aplicat tratamentul au fost c pacienii ar trebui s
parcurg distane din ce n ce mai mari, cu avansarea tratamentului. Folosind comanda MEANS, calculai
media la cele trei coloane i verificai dac n medie, distana parcurs iniial de pacieni, crete la
msurtoarea intermediar i apoi, din nou la msurtoarea final. Apreciai de asemenea, dac dispersia
valorilor la msurtoarea iniial este n cretere sau n descretere la msurtorile intermediar i final.

14

S-ar putea să vă placă și