Sunteți pe pagina 1din 10

MG – Lucrarea practică 4 2019/2020 UMF “Carol Davila” – Informatică Medicală şi Biostatistică

Lucrarea practică 4
Indicaţii generale:

Un prim scop al lucrării practice este aprofundarea modalităţilor de calcul aritmetic


cu Excel, prin efectuarea de medii ponderate.
Un al doilea scop al lucrării practice este explorarea posibilităţilor de a efectua
operaţiuni specifice bazelor de date cu Excel, prin intermediul funcţiei VLOOKUP.
Evident, nefiind un soft specific unor asemenea operaţiuni, ele vor fi efectuate ceva mai
dificil.
Un alt scop este controlul detaliat al diagramelor realizate în Excel şi calculul
intervalelor de încredere.
Aplicaţiile de calcul tabelar sunt astăzi instrumente puternice la dispoziţia
cercetătorilor. Nu doar calcule care în trecut necesitau eforturi mari şi consum de timp, dar
şi reprezentări grafice elaborate, pot fi obţinute astăzi cu uşurinţă. Aceasta va fi
exemplificat prin realizarea rapidă a unei diagrame de tip structură radială specială.

În această lucrare practică:


a) veţi explora posibilităţile de a calcula medii ponderate;
b) veţi învăţa să utilizaţi funcţia VLOOKUP;
c) veţi învăţa să controlaţi diagrame de tipul structură radială din structură
radială, cel mai „complicat” tip realizat de către Excel;
d) vă veţi reaminti principalele capabilităţi ale unei aplicaţii de calcul tabelar
(Microsoft Excel), şi anume cele de creare de diagrame şi cele de efectuare
rapidă de calcule statistice;
e) veţi aborda un prim exemplu de felul în care se formează opinii ştiinţifice,
bazate pe date puţine, şi de felul în care ele se pot valida „statistic”;
Teme

13: calculul mediei ponderate


14: funcţia VLOOKUP
15: structuri radiale în Excel
16: controlul detaliat al diagramelor Excel
17: calculul intervalelor de încredere în Excel

Softul ce va fi utilizat în lucrarea practică:


Word,Excel

28
UMF “Carol Davila” – Informatică Medicală şi Biostatistică MG – Lucrarea practică 4 2019/2020

Tema 13: calculul mediei ponderate. Aplicaţia Excel nu dispune de o funcţie


pentru calculul mediilor ponderate. Alte aplicaţii, cum ar fi Statistica sau SPSS, dispun şi
ele de asemenea funcţii, ceea ce permite obţinerea directă a rezultatului. Excel permite
însă, într-un mod indirect, să obţinem medii ponderate.
Costul spitalizării unui pacient, pentru patru tipuri de tratament, precum şi numărul
cazurilor înregistrate anul trecut în spital, sunt trecute în tabelul următor:
Tipul de tratament Costul spitalizării (lei) Numărul de cazuri
Apendicită (KA=) 80 (NA=) 422
Rezecţie Péan (KR= 200 (NR=) 180
By-pass coronarian (KB=) 1200 (NB=) 41
Fractură femurală (KF=) 100 (NF=) 515
Introduceţi, într-un document Word denumit nume_POND.docx, datele din acest
tabel. Veţi începe prin a cere inserarea unui tabel cu 5 coloane şi 5 rânduri. Pe primul rând,
după ce veţi introduce în prima coloană textul „Tipul de tratament”, veţi comasa celulele
din a doua şi a treia coloană (după ce le-aţi selectat), folosind comanda Merge Cells din
grupul Merge al tab-ului Layout. La fel veţi proceda şi cu celulele din a patra şi a cincea
coloană de pe primul rând. Pe rândurile următoare veţi introduce textele şi numerele, având
grijă să aliniaţi numerele la dreapta (folosind lansatorul casetei de dialog Paragraph -
colţul din dreapta jos al grupului Paragraph din tab-ul Home, opţiuni de aliniere la
dreapta, indentare la dreapta 1 cm) iar indicii (KA, NA etc.) să-i obţineţi cu ajutorul opţiunii
Subscript prin lansatorul casetei de dialog Font al tab-ului Home. Cât priveşte bordurile
diferite, care este calea cea mai rapidă de a le obţine?
Aspectele formale (tipul de linie folosit în chenare, alinierile) sunt şi ele importante,
dar mai importantă este aprecierea („estimarea”) costului mediu al spitalizării unui pacient.
Costul mediu al spitalizării unui pacient se poate obţine ca medie ponderată a
costurilor, fiecare pondere fiind dată exact de numărul de cazuri. Formula este:
K A NA K R NR K B NB K F NF
K mediu .
NA NR NB NF
Nu există posibilitatea de a efectua calculele cu Word. Pentru a calcula costul mediu
veţi folosi aplicaţia Excel. Veţi plasa datele din tabelul de mai sus pe o foaie de calcul – pe
care o veţi redenumi în final „CMP”, iniţialele de la „costul mediu ponderat” – din fişierul
nume_PONDERATE.xlsx.
Nu este necesar să tastaţi încă odată datele. Puteţi selecta în Word tabelul (având
cursorul în interiorul tabelului utilizaţi comanda Select→Select Table din tab-ul Layout),
apoi cu tehnica de copiere/lipire (copy/paste) îl puteţi „lipi” pe foaia de calcul.
Veţi plasa datele din tabel în domeniul A1:E5. Avem nevoie însă şi de produsele
K N (ce reprezintă costurile totale de spitalizare corespunzătoare tipurilor de tratament),
care vor fi plasate de exemplu pe coloana F. Mai precis, în celula F2 veţi plasa formula de
calcul
=C2*E2
pe care o veţi extinde – prin tragere de mâner – la celulele domeniului F2:F5. Urmează să
calculaţi cele două sume, cea de la numitorul formulei şi cea de la numărătorul formulei.
Veţi face apel la funcţia SUM(), prin intermediul opţiunii Insert Functions,atât în celula
E6 cât şi în celula F6.

29
MG – Lucrarea practică 4 2019/2020 UMF “Carol Davila” – Informatică Medicală şi Biostatistică

Pentru a încheia calculele cu ultima împărţire, veţi tasta în celula B6 textul „Costul
mediu” iar în celula C6 formula de calcul
=F6/E6
Rezultatul a fost obţinut aşadar în celula C6. Dispunem în Excel şi de alternativa
utilizării funcţiei SUMPRODUCT() de calcul a sumelor de produse. Este o funcţie care
poate fi găsită în lista celor matematice şi trigonometrice. Introduceţi în celula F7 formula
(vezi figura de mai jos):
=SUMPRODUCT(C2:C5,E2:E5)
Ar trebui să constataţi că rezultatul este exact acelaşi cu cel din celula F6.

Tema 14: funcţia VLOOKUP. Funcţiile de căutare au ca scop înlocuirea unor valori
cu altele, conform unor tabele de asociere. Utilitatea lor este necontestată în situaţiile în
care trebuie să introducem, în mod repetat, „expresii” identice. În lucrul la calculator este
clar ce înseamnă „secvenţe de caractere identice”. Nu este vorba deloc despre felul în care
sunt ele afişate pe ecran; prin comparare vizuală am putea fi induşi în eroare cu destul de
multă uşurinţă!
Dacă am introduce expresiile prin tastare, ar fi mari şanse ca erori mici să producă
secvenţe de caractere care să nu fie „identice”. De aceea se recomandă ca o „expresie” care
a fost introdusă anterior prin tastare să nu mai fie tastată a doua oară; dimpotrivă,
introducerea următoarelor „exemplare” să fie făcută prin copierea primului.
Să considerăm un exemplu simplu, cel al unei liste de persoane, în care numele şi
prenumele fiecărei persoane este însoţit de profesia sa, astfel:
Ionescu Ion medic
Popescu Ioana asistent medical

30
UMF “Carol Davila” – Informatică Medicală şi Biostatistică MG – Lucrarea practică 4 2019/2020

Teodorescu Petre laborant


Constantinescu Jan asistent medical

Deja a apărut o repetare a profesiei. În cazul în care lista este lungă, tastarea textului
„asistent medical” ar putea fi făcută cu uşoare variaţii. Aceste variaţii, datorate oboselii,
vitezei sau altor cauze, vor provoca probleme serioase atunci când vom selecta din listă
asistenţii medicali, sau atunci când vom ordona alfabetic sublista asistenţilor medicali.
O cale de evitare a posibilelor nereguli o constituie folosirea funcţiei predefinite
VLOOKUP. Ea a fost creată pentru a căuta o anumită secvenţă (valoare) în cadrul unei
coloane a tabelului şi a returna valoarea corespunzătoare (de pe acelaşi rând) din altă
coloană, conform sintaxei
=VLOOKUP(valoare căutată, nume tabel, deplasare)
Efectul utilizării funcţiei este următorul: atunci când funcţia găseşte secvenţa
(valoarea) căutată într-o celulă din coloana de căutare, se va reţine poziţia rândului, apoi se
efectuează deplasarea indicată pe acel rând, returnând în final conţinutul noii celule.
Pentru un exemplu concret, să creăm un fişier nou nume_LOOKUP.xlsx, şi să
plasăm în domeniul A1:B3 (de pe prima foaie de calcul) valorile
A B
1 1 asistent medical
2 2 laborant
3 3 medic
iar în domeniul A4:B5 valorile
A B
4 1 feminin
5 2 masculin
Să redenumim cele două domenii (după selectarea fiecăruia folosim comanda
Define Name→Name din grupul Defined Names al tab-ului Formulas) PROFESIA,
respectiv SEXUL. Să completăm acum, începând cu celula D1, următoarele date:
D E F G H
1 Numele şi prenumele Profesia Sexul Profesia Sexul
2 Ionescu Ion 3 2
3 Popescu Ioana 1 1
4 Teodorescu Petre 2 1
Celulele de pe coloanele G şi H vor fi completate automat. De exemplu, în celula
G2 se va introduce formula
=VLOOKUP(E2,PROFESIA,2)
iar în H1 formula
=VLOOKUP(F2,SEXUL,2)
Completaţi tabelul cu încă cel puţin patru înregistrări (rânduri) pe coloanele D-F,
după care extindeţi formulele pe coloanele G şi H. (Evident, corectaţi erorile!)
Amestecarea, pe aceeaşi foaie de calcul, a mai multor tabele nu este o idee prea

31
MG – Lucrarea practică 4 2019/2020 UMF “Carol Davila” – Informatică Medicală şi Biostatistică

bună Recomandăm mutarea tabelului cu datele persoanelor pe o altă foaie de calcul,


începând cu celula A1. Aici coloanele G şi H vor deveni coloanele C şi D. Recomandăm şi
separarea celor două domenii care au fost denumite PROFESIA respectiv SEXUL, pe două
foi de calcul separate denumite corespunzător.

Tema 15: structuri radiale în Excel


În cadrul unei investigaţii mai largi au fost examinaţi un număr de 200 elevi (în vârstă de
10-18 ani), măsurându-li-se înălţimea (în cm), greutatea (în kg), circumferinţa bustului (în
cm). De asemenea, a fost înregistrată vârsta lor, sexul şi localizarea durerii lombare, în caz
că s-a constatat prezenţa acesteia.
Datele înregistrate pot fi găsite în fişierul LP04_1.xlsx. Ar trebui să identificaţi o singură
foaie denumită „Lombar” şi, în ea, următoarele coloane: Cod, Numpre, Varsta, Sex, Durere
lombara, Inaltime, Greutate, Bust.
Inseraţi (cu comandaInsert Insert Sheet din grupul Cells al tab-ului Home) o nouă
foaie, pe care o denumiţi „Frecvenţe”. În ea, în celula A2 plasaţi textul „in punct fix”, în
celula A3 plasaţi textul „iradiata” iar în celula A4 textul „nesistematizata”. (NU TASTAŢI
ACESTE TEXTE! Se recomandă ca acestea să fie plasate prin copiere/lipire din celule ale
foii iniţiale în care se află asemenea texte.)
Să ne amintim că am folosit funcţia COUNTIF care „numără” apariţiile aceleiaşi
secvenţe de caractere într-un domeniu. (Face parte din categoria funcţiilor statistice.)
Este foarte important să aflaţi despre posibilităţile de lucru cu datele aflate pe mai multe
foi de calcul. Identificatorul unei celule (sau al unui domeniu) care se află pe altă foaie se
crează din numele foii terminat cu caracterul „!” (semnul exclamării) urmat de identificatorul
celulei (domeniului). Introduceţi în celula B2 formula:
=COUNTIF(Lombar!E$2:E$201,A2)
Este clar că funcţia va număra apariţiile valorii celulei A2 (în cazul nostru secvenţa „in
punct fix”) în domeniul E2:E201de pe foaia „Lombar”. Reamintim că „$” are rolul de a fixa
identificatorul de rând sau de coloană pe care-l precede. Acest lucru este extrem de util
atunci când facem extinderi sau copieri de formule.
Trăgând de mânerul celulei B2, vom putea extinde cu uşurinţă formula la domeniul
B2:B4.
Să plasăm în celula A1 textul „Fără”, iar în celula B1 formula
=COUNTA(Lombar!E$2:E$201)–SUM(B2:B4)
care permite calculul imediat al numărului de subiecţi la care nu s-a constatat durere
lombară.
Cu datele din domeniul A1:B4 să creăm o diagramă de tipul Structură radială din
structură radială. După selectarea domeniului apelăm comanda Insert Pie or Doughnut
Chart din grupul Chart al tab-ului Insert şi ne asigurăm că alegem tipul „2D Pie” subtipul
„Pie of Pie”. Declaraţi ca titlu „Distribuţia durerii lombare în lotul studiat” şi plasaţi în final
diagrama pe o foaie separată (distinctă de foile de calcul!)
Veţi acţiona acum asupra componentelor grafice ale foii-diagramă.
Cu un clic-dreapta deasupra unui sector colorat puteţi intra în panoul din dreapta Format
Data Series. Acţionaţi butonul Series Options, alegând valoarea „3” pentru Values in second
plot. Încercaţi controlul mărimii rozetelor şi spaţiului dintre ele, prin stabilirea la 120% a
mărimii rozetei din dreapta (Second Plot Size; cea din stânga are mărimea standard de 100)
şi la 75% a distanţei dintre rozete (Gap Width).

32
UMF “Carol Davila” – Informatică Medicală şi Biostatistică MG – Lucrarea practică 4 2019/2020

De asemenea, în panoul Format Data Labels activaţi două dintre casetele de validare prin
butonul Label Options, şi anume „Category Name” şi „Value”, apoi alegeţi „Outside End” în
zona Label Position. Veţi observa că în dreptul sectoarelor de cerc apar inscripţiile din
domeniul A1:A4, cu excepţia inscripţiei „Other, 68”. Prin dublu-clic deasupra acesteia
încercaţi să preluaţi controlul ei şi să eliminaţi textul nedorit, rămânând numai „68”.
Prin clic, clic-dreapta sau dublu-clic deasupra câte unui sector încercaţi să preluaţi
controlul colorării sectorului respectiv. Încercaţi să determinaţi aplicarea unor efecte de
umplere. (Ar trebui să acţionaţi în panoul Format Data Point, prin apăsarea butonului Fill şi
alegerea efectului de umplere dorit: Gradient fill, Picture or texture fill, Pattern fill.) Atenţie,
nu încercaţi acest lucru în panoul Format Data Series, întrucât veţi determina nediferenţierea
sectoarelor. Nu uitaţi: în cazul unei erori sau obţinerii unui efect nedorit, reveniţi la situaţia
anterioară prin butonul Undo Format Object (Ctrl+Z).
Plasaţi acum în celula D1 a foii „Frecvenţe” textul „Separatori”, iar în domeniul D2:D7
numerele 140, 150, 160, 170, 180, 190. În celula E1 plasaţi textul „Frecvenţe”, iar în celula
E2 formula
=FREQUENCY(Lombar!F2:F201,D2:D7)
Selectaţi acum domeniul E2:E8, plasaţi cu un clic un punct de inserare pe bara formulei,
apoi tastaţi [Ctrl]+[Shift]+[Enter]. În acest fel se obţin dintr-o singură mişcare toate
frecvenţele (absolute) ale înălţimilor indivizilor din eşantion, conform valorilor de separare
alese (din 10 în 10 centimetri).
Selectând acum domeniul D1:E8, încercaţi să realizaţi o diagramă a frecvenţelor. Care
este tipul adecvat şi ce titlu ar trebui să poarte diagrama?
Redenumiţi nume_SONDAJ.xlsx cartea de calcul conţinând cele două foi de calcul şi
două foi cu diagrame. Încercaţi salvarea sub formă de pagină web cu denumirea
nume_SONDAJ.htm.

Tema 16: controlul detaliat al diagramelor Excel


Cercetătorii unei firme farmaceutice au imaginat un unguent (bazat pe un compus chimic
nou) despre care cred că ar trebui să vindece mai rapid arsurile pielii. Unguentul a fost testat
în laborator pe un număr de 7 şoareci aleşi aleator dintre cei 16 de care dispunea laboratorul

33
MG – Lucrarea practică 4 2019/2020 UMF “Carol Davila” – Informatică Medicală şi Biostatistică

pentru aceste teste. (Tuturor celor 16 şoareci li s-au provocat arsuri de piele, de gravităţi
echivalente.)
Pentru grupul celor 7 „trataţi” au fost constatate următoarele durate de vindecare (în zile):
9 4 3 19 10 2 14
Pentru grupul „de control” al celor 9 „netrataţi” au fost constatate următoarele durate de
vindecare (în zile):
5 2 4 10 5 3 14 3 5
Se poate afirma că tratamentul cu noul unguent grăbeşte vindecarea arsurii?
Să utilizăm aplicaţia Excel pentru a-i explora posibilităţile de a ne ajuta în a da
răspunsuri justificate la întrebări de tipul celei anterioare.
Veţi crea un fişier-carte de calcul denumit nume_UNGUENT.xlsx cu cel puţin o foaie
de calcul. Se recomandă ca diagramele să NU fie plasate peste celulele foii de calcul, ci în
foi separate!
Redenumiţi prima foaie de calcul „Arsuri” şi, în domeniul B2:B17, plasaţi – una sub alta
– cele 16 durate de vindecare. În celula B1 veţi plasa textul „Durata de vindecare (în zile)”,
iar în celula C1 textul „Grupul”.
Alăturat duratelor de vindecare, în domeniul C2:C17, plasaţi textele „tratament” sau
„control”, după caz.
Coloana A o veţi folosi pentru identificarea (numerotarea) cazurilor. Mai precis, în A1
veţi plasa textul „Individul nr.”, iar dedesubt veţi plasa – unul sub altul – numerele 1, 2, ...,
16. (Reamintiţi-vă cum se poate extinde, prin tragere de mâner, o progresie aritmetică.)
Poate că o reprezentare grafică a
datelor ne va fi de ajutor. Cu Excel
obţinem repede o asemenea
reprezentare; este suficient să
selectăm domeniul A1:B17 şi să
apelăm comanda Insert→Insert
Column or Bar Chart→2-D
Bar→Clustered Bar, probabil
diagrama cea mai potrivită pentru
această situaţie fiind cea „cu bare
orizontale”. În etapa de eliminare a
seriei „Individul nr.” putem apela la
butonul Select Data din tab-ul Recomandăm realizarea diagramei pe o foaie
Design şi după selecţia seriei separată, evitând amestecul între grafică şi calcule
„Individul nr.” folosim butonul pe aceeaşi foaie de lucru. Denumiţi „16-1” foaia
Remove– a se vedea figura separată
alăturată.

34
UMF “Carol Davila” – Informatică Medicală şi Biostatistică MG – Lucrarea practică 4 2019/2020

Încercaţi modificarea culorilor în care sunt afişate barele, de exemplu în roşu pentru
primele 7 bare (cele de jos) şi în albastru pentru celelalte. Plasaţi de asemenea textele
„tratament” şi „control” colorate corespunzător, ca în figură.
Duplicaţi foaia pe care aţi depus diagrama, denumind „1-16” copia. Încercaţi, pe foaia
„1-16”, schimbarea ordinii de afişare a duratelor de vindecare (astfel încât barele orizontale
„tratament” să apară deasupra celor „control”).

Tema 17: calculul intervalelor de încredere în Excel


Compararea grafică, pe diagrame, este utilă atunci când vrem să transmitem rapid
informaţie privitorului, sau – cazul nostru – atunci când avem de-a face cu secvenţe lungi de
numere, care se „citesc” cu dificultate. Din punct de vedere statistic, ar trebui să începem
studiul nostru cu compararea mediilor celor două grupuri. Mediile se obţin uşor, cu ajutorul
funcţiei AVERAGE.
Este însă de preferat să începem prin a organiza datele comparative pe foaia de calcul. De
exemplu, să plasăm în celula F1 textul „Tratament”, în celula G1 textul „Control”, în celula
E2 textul „Număr cazuri” iar în celula E3 textul „Medii”.
Chiar dacă numărul de cazuri ne este cunoscut, recomandăm obţinerea sa cu ajutorul
funcţiei COUNTIF. Activând celula F2, apelaţi (comanda Insert Function) această funcţie
din categoria celor statistice. Are două argumente: domeniul datelor – care ar trebui să fie
C2:C17 – şi criteriul de selecţie, care ar trebui să fie secvenţa de caractere „tratament”.
Întrucât această valoare se află în câteva celule, printre care şi C2, al doilea argument ar
putea fi chiar C2.
Analog, celula G2 ar trebui să aibă drept conţinut formula
=COUNTIF(C2:C17,C17)
Pentru calculul mediei vom face apel la funcţia AVERAGE, şi ea din categoria funcţiilor
statistice. În celula F3 plasăm formula (!)
=AVERAGE(B2:B8)
35
MG – Lucrarea practică 4 2019/2020 UMF “Carol Davila” – Informatică Medicală şi Biostatistică

iar în celula G3 formula analoagă.


După o formatare adecvată a acestor două celule, cerând afişarea cu 2 zecimale, ar trebui
să obţinem afişate valorile 8.71 respectiv 5.67.
Cercetătorii nu ar avea motive de optimism: în medie, durata de vindecare este mai mare
pentru indivizii trataţi cu unguent!
Situaţia de mai sus este excepţională, de regulă nu se întâmplă aşa, dar nu trebuie excluse
asemenea situaţii!
Copiaţi acum foaia „Arsuri” peste foaia a doua, pe care o veţi denumi „Corect”. Copierea
unei foi întregi se face de asemenea cu tehnica de copiere/lipire (copy/paste), iar selectarea
prealabilă a întregii foi se poate face prin „apăsarea” butonului de colţ (aflat în stânga
butoanelor A, B, C, ... care identifică coloanele şi deasupra butoanelor 1, 2, 3, ... care
identifică rândurile). Prin copiere/lipire au fost preluate toate formulele!
Înlocuiţi acum, în foaia „Corect”, datele din domeniul B2:B8 prin următoarele
5 4 3 5 8 2 6
De data aceasta durata medie de vindecare (pentru indivizii trataţi) este de 4.71 zile, iar
cercetătorii pot afirma că unguentul este eficace în vindecarea arsurilor.
Evident, această afirmaţie va fi făcută la modul general, dar ea este bazată pe doar câteva
cazuri constatate în laborator! Care sunt riscurile acceptării acestei afirmaţii ca fiind
„adevărată la modul general”?
Statistica ne învaţă să enunţăm afirmaţii de forma: „durata medie de vindecare la
indivizii trataţi este semnificativ mai mică decât la indivizii netrataţi”. Dar când oare
suntem îndreptăţiţi să facem asemenea afirmaţii?
Excel ne permite să calculăm rapid ingredientele necesare justificării unor asemenea
afirmaţii. Conform teoriei, ar trebui să obţinem erorile standard ale celor două medii, să
identificăm intervalele de încredere (95%) şi să constatăm că cele două intervale sunt
disjuncte.
Obţinerea erorii standard a unei medii necesită mai multe calcule. Eroarea standard nu
se obţine direct, ci prin intermediul abaterii standard, care în Exceleste dată de funcţia
STDEV. Formula este simplă:
eroarea standard = abaterea standard / (numărul de indivizi)
Odată obţinută eroarea standard a mediei, intervalul de încredere 95% pentru medie va
fi:
media – eroarea standard * 1.96, media + eroarea standard * 1.96.
Aşadar, avem nevoie de medii (obţinute cu AVERAGE), de abateri standard (obţinute
cu STDEV), şi de numărul de indivizi (obţinut cu COUNTIF).
Să organizăm calculele în felul următor: în celula E4 să plasăm textul „Abateri standard”,
în celula E5 textul „Erori standard”, în E6 textul „Extr. stângă” iar în E7 textul „Extr.
dreaptă”.
Formulele de calcul pe care le vom introduce în coloana F vor fi, respectiv,
=STDEV(B2:B8)
=F4/SQRT(F2)
=F3–F5*1.96
=F3+F5*1.96

36
UMF “Carol Davila” – Informatică Medicală şi Biostatistică MG – Lucrarea practică 4 2019/2020

În coloana G vom introduce formulele corespunzătoare datelor „de control”, care au fost
plasate în domeniul B9:B17.
Ar trebui să obţineţi intervalele de încredere [3.25, 6.18] respectiv [3.14, 8.20]. Ele nu
sunt disjuncte, astfel că statistica nu justifică deloc afirmaţia cercetătorilor!
Este momentul să atragem atenţia asupra unui aspect extrem de important: duratele de
vindecare nu ar trebui apreciate „în medie”, întrucât un singur caz „aberant de lung” ar
putea schimba în mod esenţial concluziile. Dimpotrivă, aprecierea ar trebui să fie făcută
după mediane!
Plasaţi în celula E8 textul „Mediane”, apoi în dreapta formulele de calcul, făcând apel la
funcţia MEDIAN. Ar trebui să obţineţi, pentru ambele grupuri, mediana 5. Aceasta ar trebui
să constituie un semnal de alarmă privind incorectitudinea afirmaţiei cercetătorilor!
Preluaţi în foaia a treia, prin copiere/lipire, conţinutul foii „Corect”. Redenumiţi foaia a
treia „Ultima” şi, pe ea, efectuaţi următoarele modificări. Schimbaţi conţinutul domeniului
B9:B17 în următorul:
5 7 6 11 6 9 14 6 10
Ar trebui să constataţi că mediile se modifică sensibil, şi că intervalele de încredere 95%
devin [3.25, 6.18] respectiv [6.27, 10.18].
Se observă că cele două intervale de încredere sunt disjuncte, prin urmare – pe aceste
date – putem accepta – cu încredere 95% – ca adevărată afirmaţia cercetătorilor (sau a firmei
de medicamente).
Constatăm şi că medianele diferă în mod esenţial şi, reamintim, acestea ar trebui să fie
luate în consideraţie în aprecierea validităţii afirmaţiei cercetătorilor. Ar fi de dorit să
dispunem de intervale de încredere 95% pentru cele două mediane. Din păcate, Excel nu
ne poate ajuta în obţinerea acestor intervale de încredere; este nevoie de soft statistic
specializat, care eventual să exploateze metode speciale cum ar fi tehnicile bootstrap.
Salvaţi în această formă cartea de calcul Excel, cu cele trei foi de calcul şi două
„grafice”.

37