Sunteți pe pagina 1din 396

STATISTICĂ ȘI INFORMATICĂ PENTRU

CHIMIE MEDICALĂ ȘI FARMACEUTICĂ

CONCEPTE, METODE, TEHNOLOGII, SOFTWARE ȘI APLICAȚII


Reproducerea integrală sau parţială, multiplicarea prin orice mijloace și sub
orice formă, cum ar fi xeroxarea, scanarea, transpunerea în format electronic
sau audio, punerea la dispoziţia publică, inclusiv prin internet sau prin reţele de
calculatoare, stocarea permanentă sau temporară pe dispozitive sau sisteme cu
posibilitatea recuperării informaţiilor, cu scop comercial sau gratuit, precum și
alte fapte similare săvârșite fără permisiunea scrisă a deţinătorului
copyrightului reprezintă o încălcare a legislaţiei cu privire la protecţia
proprietăţii intelectuale și se pedepsesc penal și/sau civil în conformitate cu
legile în vigoare.
Marin Vlada

STATISTICĂ ȘI INFORMATICĂ
PENTRU
CHIMIE MEDICALĂ ȘI FARMACEUTICĂ

CONCEPTE, METODE, TEHNOLOGII, SOFTWARE ȘI APLICAȚII

2017
6 MARIN VLADA

Referenți științifici:
Prof. univ. dr. Ion Văduva, Universitatea din București
Prof. univ. dr. Adrian Adăscăliței, Universitatea Tehnică „Gh. Asachi” din Iași
Conf. univ. dr. Vasile David, Universitatea din București

©
Şos. Panduri, 90-92, Bucureşti-050663, România
Telefon/Fax: (0040) 021.410.23.84
E-mail: editura.unibuc@gmail.com; editura@g.unibuc.ro
Web: www.librarie-unibuc.ro/magazin/
Centru de vânzare: Bd. Regina Elisabeta, nr. 4-12, Bucureşti,
Tel. (004) 021.305.37.03

Sursa, imagine copertă:


Frans Marcelis – http://members.home.nl/fg.marcelis/24-cell.htm

Copertă & DTP: Meri Pogonariu

Descrierea CIP a Bibliotecii Naţionale a României


VLADA, MARIN

Statistică şi informatică pentru chimie medicală şi farmaceutică :


concepte, metode, tehnologii, software şi aplicaţii / Marin Vlada. -
Bucureşti : Editura Universităţii din Bucureşti, 2017

Conţine bibliografie
ISBN 978-606-16-0940-6

004
Statistică şi Informatică pentru chimie medicală şi farmaceutică 7

MOTTO

Mediile din natură sunt guvernate de Limbaje. Omul a inventat calculatorul, limbajele şi ştiinţele
pentru cunoaştere. Prin intermediul calculatorului se prelucrează informaţiile şi cunoştinţele. Pentru
reprezentarea şi prelucrarea informaţiilor calculatorul utilizează limbajele artificiale. Acest fapt
dovedeşte că limbajele au fost inventate nu numai pentru comunicarea informaţiilor, ci mai ales pentru
prelucrarea lor. Prin urmare, Limbajele sunt instrumente ale gândirii, iar ştiințele sunt modele şi
reprezentări virtuale ale cunoaşterii.
M. Vlada, „eLSE 2005”, CNIV 2010

Informatica a devenit o ştiinţă deoarece utilizează metode, tehnici şi instrumente proprii pentru
investigarea obiectelor şi proceselor pe care le defineşte şi cu care operează. Tezaurul ştiinţific al
Informaticii este rezultatul unor simbioze de cunoştinţe şi cercetări provenite şi de la alte ştiinţe
(matematică, cibernetică, microelectronică, fizică, chimie etc.), şi care prin metode şi tehnici proprii, şi
utilizînd echipamente speciale (sisteme de calcul, dispozitive input/output) prelucrează informaţii şi
cunoştinţe pe care trebuie să le interpreteze, să le transforme şi să le comunice.

M. Vlada, Informatică aplicată, 2012

„Informatica restabileşte nu numai unitatea matematicilor pure şi a celor aplicate, a tehnicii


concrete şi a matematicilor abstracte, dar şi cea a ştiinţelor naturii, ale omului şi ale societăţii.
Reabilitează conceptele de abstract şi de formal şi împacă arta cu ştiinţa, nu numai în sufletul omului
de ştiinţă, unde erau întotdeauna împăcate, ci şi în filosofarea lor.”

Gr. C. Moisil (1906-1973)


Fondatorul Informaticii din România,
Computer Pioneer Award of IEEE

„Este mult mai greu să-i înveţi pe studenţi cum să înveţe decât să le predai”

Henry Hallett Dale (1875-1968)


Premiul Nobel în Psihologie şi Medicină (1936)

„Învăţarea duce la obţinerea cunoştinţelor,


dar observaţiile şi experimentele
duc la consolidarea lor”
Ştefan Procopiu (1890-1972),
fizician şi inventator român
Statistică şi Informatică pentru chimie medicală şi farmaceutică 9

C U P R I N S

Prefaţă .......................................................................................................................................... 11

1 Concepte privind studiul fenomenelor .......................................................................... 13


1.1 Impactul calculatorului asupra cunoaşterii .................................................................... 17
1.1.1 Platforme e-Learning .................................................................................................. 20
1.2 Exemple privind studiul fenomenelor ............................................................................ 24
1.2.1 Fenomenul mişcării corpurilor în 2D/3D .............................................................. 24
1.2.2 Mişcarea particulelor încărcate în câmpuri electrice şi magnetice ....................... 37
1.2.3 Modelarea unui proces în domeniul Farmacocineticii .......................................... 39
1.2.4 Determinarea predispoziţiei la bolile cardiovasculare ........................................... 43
1.2.5 Fenomenul de difuzie a unui nor de gaz ................................................................. 46
1.2.6 Modelul planetar al lui Newton şi Modelul atomic al lui Bohr ............................ 47
1.2.7 Teoria Haosului şi Meteorologie .............................................................................. 50
1.2.8 Dinamica atmosferei - studiul mişcării aerului ....................................................... 53
1.2.9 Matematica fenomenului gheţii marine ................................................................... 56
1.2.10 Mecanica statistică a moleculelor ........................................................................... 56
1.3 Teoria erorilor, incertitudini şi aproximări . ................................................................... 60
1.3.1 Analiza datelor experimentale – Tipuri de erori ................................................... 61
1.3.2 Termeni şi concepte despre erori ............................................................................ 63
1.4 Gândirea algoritmică – noi abordări de rezolvare ....................................................... 68
1.4.1 Puterile mari ale lui 2 .................................................................................................. 68
1.4.2 Rezolvarea problemei lui Gauss ............................................................................... 78

2 Analiza şi interpretarea datelor experimentale ............................................................. 85


2.1 Seturi de date şi indicatori statistici ................................................................................. 85
2.2 Reprezentarea grafică a datelor ........................................................................................ 90
2.2.1 Prelucrări şi reprezentări grafice cu programul Excel ........................................... 91
2.2.2 Etapele de elaborare a unei diagrame ...................................................................... 108
2.3 Reprezentarea datelor în studiile clinice ......................................................................... 121
2.3.1 IMC – Indicele de masă corporală .......................................................................... 121
2.3.2 Glaucomul, boală de ochi ........................................................................................... 128
2.3.3 Diabet Zaharat (DZ) – studiu clinic ........................................................................ 133
2.3.4 Ciroza hepatică (CH) – studiu clinic ........................................................................ 134
2.3.5 Patologia parodontală la tânăr – studii clinice ....................................................... 136
2.3.6 Studiu prin metode atomice şi moleculare – Probe biologice ............................. 137
2.3.7 Tetrazoli – cercetări biologice şi farmaceutice ....................................................... 138
2.3.8 Tensiunea arterială- reprezentări grafice .................................................................. 139
10 MARIN VLADA

3 Statistică şi probabilităţi ..................................................................................................... 145


3.1 Concepte de bază. Teorii şi Metode ............................................................................... 147
3.1.1 Concepte şi definiţii privind prelucrările statistice ............................................. 157
3.1.2 Produse software pentru prelucrări statistice şi reprezentări grafice ................. 162
3.2 Prelucrări statistice. Probleme rezolvate ........................................................................ 165
3.2.1 Numărul de locuitori la un pat din unităţile sanitare – indicele Nl/p ... ............... 165
3.3 Cercetare, eşantioane şi colectarea datelor .................................................................... 174
3.3.1 Ultimul recensământ din România ........................................................................... 177
3.3.2 Proiectarea unui eşantion ........................................................................................... 181
3.3.3 Gruparea statistică în intervale/clase ....................................................................... 184
3.4 Testarea şi eliminarea valorilor aberante ........................................................................ 196
3.5 Probabilităţi şi funcţii de repartiţie .................................................................................. 203
3.6 Distribuţia, propagarea şi estimarea erorilor ................................................................. 216
3.7 Legi de probabilitate utilizate frecvent ........................................................................... 221
3.7.1 Distribuţii continue de probabilitate ........................................................................ 224
3.8 Estimarea parametrilor. Verificarea ipotezelor statistice ............................................. 249
3.8.1 Intervalul de încredere ................................................................................................ 249
3.8.2 Determinarea parametrului statistic – limitele intervalului de semnificaţie ....... 253
3.8.3 Testarea ipotezelor statistice ..................................................................................... 257

4 Modele de aproximare liniare şi neliniare ..................................................................... 267


4.1 Modele matematice în analiza datelor ............................................................................ 267
4.2 Metoda celor mai mici pătrate (MCMP) ........................................................................ 276
4.3 Modele liniare. Dreapta de regresie ................................................................................ 280
4.4 Modele neliniare. Metoda regresiei ................................................................................. 289
4.5 Modele neliniare în Farmacocinetică .............................................................................. 301
4.6 Aplicaţie. Problema călugărului ....................................................................................... 312

5 Proiecte şi aplicaţii practice ............................................................................................... 319


5.1 Determinarea modelelor liniare şi neliniare ................................................................... 320
5.2 Parametrizarea şi rezolvarea problemelor ...................................................................... 326
5.2.1 Problema celor n vase cu azot ................................................................................. 327
5.2.2 Problema celor 5 pahare Berzelius ........................................................................... 337
5.3 Teme practice pentru Laborator ..................................................................................... 342
5.4 Rezultatele proiectului DEMODEF .............................................................................. 358

Bibliografie generală ................................................................................................................ 369

Anexă – Tabelul funcţiilor Excel (2007, 2010, 2013, 2016) ................................................. 375
Statistică şi Informatică pentru chimie medicală şi farmaceutică 11

PREFAŢĂ

„Analfabetul viitorului nu va mai fi cel care nu ştie să citească,


ci cel care nu ştie să înţeleagă”
Alvin Toffler
„Omul, când nu înţelege, e contra”
Acad. Grigore C. Moisil

Prezenta carte este concepută ca un tutorial (curs descriptiv) având în vedere


cerinţele mediului educaţional actual şi aşteptările studenţilor privind eficienţa învăţării şi
metodele procesului de învăţare. S-a avut în vedere experienţa profesională şi didactică a
autorului şi comparaţiile stilurilor de învăţare, în domeniul formării iniţiale, cu cele ulterioare,
şi anume, în formarea continuă versus diversitatea problemelor ştiinţifice şi de cercetare.
Acestea au condus la o îmbinare între diversitatea problemelor de rezolvat şi înţelegerea
corectă a teoriilor şi metodelor utilizate în demersul didactic şi ştiinţific. În toate etapele
formării lor, studenţii reclamă caracterul teoretic al conţinutului disciplinelor, şi aşteaptă de la
sistemul de învăţământ adaptarea resurselor educaţionale la cerinţele lor actuale, pentru o
aplicare şi în procesul de formare a lor, a noilor metode şi tehnologii oferite de utilizarea
calculatorului.
„Eu nu vă conving, eu demostrez” şi „Omul, când nu înţelege, e contra” spunea acad. Grigore
C. Moisil, iar aceste ziceri le folosea şi acad. Solomon Marcus: „Universalitatea gândirii
matematice a fost interpretată de unii autori ca o pretenţie a matematicienilor de a institui o hegemonie a
matematicii faţă de celelalte domenii ale cunoaşterii. În fapt însă, universalitatea matematicii este complet
echilibrată de aservirea ei faţă de celelalte discipline”. Ideea de bază a acestei adaptări, este că trebuie
să se înceapă, nu cu prezentarea unei teorii, ci cu enunţul problemei, și după aceea, se va
căuta teoria și metodele adecvate pentru rezolvarea ei. Astfel, studentul va fi convins de
utilitatea unei teorii sau metode. Așa au apărut știinţele! Cartea este concepută să prezinte o
abordare pragmatică a cunoștintelor și temelor cu care se vor confrunta viitorii specialiști ce
vor absolvi specializarea „Chimie medicală/farmaceutică”.
Prelucrarea datelor medicale şi farmaceutice, unele dintre acestea fiind studiate la
diverse cursuri şi lucrări de laborator, va fi prezentă în formarea profesională medicală,
pentru care e necesară însuşirea elementelor descriptive şi de analiză din domeniul medical.
Mai târziu, acestea vor constitui instrumente de neînlocuit în cercetarea ştiinţifică. Unele
metode şi teorii din matematică vor fi abordate într-o formă modernă, prin utilizarea
instrumentelor informatice (produse software) având în vedere diversitatea de programe şi
platforme din ce în ce mai performate, în demersul rezolvării problemelor de specialitate, din
domeniul chimiei şi medicinii. Statistica matematică reprezintă modalitatea principală de
12 MARIN VLADA

extragere şi prelucrare a informaţiilor relevante din datele clinice şi de laborator. De


asemenea, Statistica medicală, Biostatistica, Bioinformatica şi Informatica medicală sunt discipline care
au apărut şi se află în curriculum facultăţilor de medicină şi farmacie, datorită evoluţiei
instrumentelor ştiinţifice prin fenomenul transdisciplinarităţii, cu suport oferit de evoluţia
informaticii şi a calculatoarelor.
Lucrarea conţine multe exemple de utilizare a instrumentelor software pentru
rezolvarea diverselor probleme privind prelucrarea şi analiza datelor experimentale. Noua
abordare este implementată prin definirea şi analiza enunţului problemei şi apoi, căutarea
metodelor, teoriilor pentru rezolvarea problemei. În multe cazuri se utilizează programe şi
aplicaţii oferite de calculator. În acest sens, studenţii vor fi motivaţi şi îndrumaţi să caute
metoda cea mai eficientă şi să fie la curent cu schimbările şi apariţia de noi instrumente
software în rezolvarea de probleme. Performanţele calculatoarelor moderne şi diversitatea de
aplicaţii pentru rezolvarea problemelor ştiinţifice şi practice, trebuie să fie în atenţia tuturor
celor care se adaptează continuu la noile tehnologii.
După anul 1995, deja au început cercetări pentru schimbarea de paradigmă privind
evoluţia calculatoarelor: Calculatoare moleculare (Molecular Computers, DNA Computing, inventator
Leonard Adleman - 2002 Turing Award) şi Calculatoare cuantice (Quantum Computers, Peter Shor
– Massachusetts Institute of Technology (MIT), 1994). În câţiva ani, calculatoarele noi
(Quantum Computer) de la IBM, Google şi Microsoft vor accelera descoperirile din
domeniile chimiei, medicinei şi ştiinţei materialelor (Ref.: http://www.nextbigfuture.com/
2017/03/in-few-years-new-quantum-computers-from.html). Calculatoarele cuantice vor fi
mai puternice decât calculatoarele convenţionale, pentru probleme de rutare eficientă, pentru
logistică, pentru companiile de cartografiere, noi forme de învăţare automată, inventarea de
noi produse, teste de diagnosticare îmbunătăţite. Primele calculatoare cuantice universale vor
fi utilizate în chimie pentru simularea de molecule şi reacţii. Simulând efectele cuantice care
modelează structurile şi reacţiile moleculare, aceasta este o problemă naturală pentru aceste
calculatoare, deoarece puterea lor vine de la datele de codificare în aceleaşi stări cuantice
dificile. Componentele care alcătuiesc computerele cuantice, cunoscute sub numele de qubiţi,
pot utiliza procese cuantice mecanice pentru a executa comenzi rapide de calcul imposibile
pentru o maşină convenţională.
La Facultatea de Chimie a Universitatii din Bucureşti, în anul 2016, s-a înfiinţat
specializarea „Chimie medicală”, ca apoi, în anul 2017 să apară şi specializarea „Chimie
farmaceutică”. Sperăm că, efortul nostru de a realiza o abordare transdisciplinară şi cu
instrumente oferite de matematică, informatică şi statistică matematică – folosind şi
calculatorul, să vină în sprijinul celor care explorează cunoaşterea, printr-o învățare profundă,
cu rezolvare de aplicaţii practice, şi nu printr-o învăţare superficială.

12 iunie 2017, Bucureşti Marin Vlada, Universitatea din Bucureşti, membru


asociat CRIFST (Comitetul Român de Istoria şi
Filosofia Ştiinţei şi Tehnicii), Academia Română
Statistică şi Informatică pentru chimie medicală şi farmaceutică 13

1
Concepte privind
studiul fenomenelor
Motto:
Refinement of thinking:
„All science is nothing more than a refinement of everyday thinking.
As a result, a critical thinking physicist cannot be limited to examining concepts in his own particular field, but must
stop and seek towards the everyday thinking, which is more difficult to analyze.”
Albert Einstein.

Dezvoltarea ştiinţei:
„Dezvoltarea ştiinţei se bazează pe două mari realizări: invenţia sistemului de logică formală (în geometria euclidiană)
de către filosofii greci, şi posibilitatea de a descoperi relaţii cauzale prin experiment sistematic (în timpul Renaşterii).”
Albert Einstein.

Matematica şi legile naturii:


„Matematica este un mod de exprimare a legilor naturale, este cel mai simplu
şi cel mai potrivit chip de a înfăţişa o lege generală sau curgerea unui fenomen,
este cea mai perfectă limbă în care se poate povesti un fenomen natural.”
Gheorghe Ţiţeica (1873-1939).

Mediul înconjurător și natura, societățile omenești – tot ce se află pe planeta Terra,


inclusiv în spațiul macrocosmos/microcosmos, se schimbă, se transformă și se dezvoltă
ca urmare a multiplelor fenomene ce apar, se desfășoară și dispar în conformitate cu
diverse legi pe baza cărora își exercită efectele, și ca urmare a stării optime a unor
parametri ce definesc aceste fenomene. Fenomenele se desfășoară de la un moment
inițial, își exercită efectele pe o perioada de timp finită/infinită, și se încheie la un
moment final, în cazul în care nu are o evoluție infinită. Toate acestea există, atât în
spațiul macrocosmic, cât și în spațiul microcosmic (spațiul organic sau spațiul anorganic).
„Noi suntem făcuţi din materie stelară”: „Azotul din ADN-ul nostru, calciul din
dinţii noştri, fierul din sângele nostru, carbonul din plăcintele noastre cu mere, au fost
14 MARIN VLADA

produse în interiorul stelelor aflate în colaps gravitaţional. Noi suntem făcuţi din materie
stelară.” Carl Edward Sagan (1934-1996), american astronomer, cosmologist, astrophysicist,
astrobiologist. Pe de altă parte, „Geometria euclidiană, geometria sferică, geometria
eliptică, geometria hiperbolică şi geometria proiectivă sunt instrumente matematice
pentru a exprima proprietăţi ale lumii reale.” Frans Marcelis – Frans Marcelis,
http://members.home.nl/fg.marcelis/.

Definiție. Un fenomen (fr. phénomène, it. fenomeno, cf. gr. phainomenon – ceea ce apare
și se desfășoară) reprezintă un aspect sau mai multe aspecte din mediul înconjurător,
natură, din societățile omenești, inclusiv din spațiul macrocosmic și din spațiul
microcosmic (spațiul organic-organisme vii sau spațiul anorganic-compuși anorganici), și
care se generează la un moment inițial, se desfășoară pe o perioadă de timp, își exercită
efectele, și se încheie la un moment final. Un fenomen se caracterizează prin legi pe baza
cărora se desfășoară și prin parametri ce definesc starea fenomenului, și astfel se
desfășoară în timp prin intermediul unor procese și evenimente pe care le generează.

Explicațiile din DEX: „FENOMÉN, fenomene, s. n. 1. Aspect al naturii în


mișcare; formă exterioară a lucrurilor prin care se manifestă esența lor și care poate fi
percepută direct prin organele senzoriale. Materia organică constituie un fenomen mult
mai nou, produs al unei îndelungate dezvoltări. LENIN, O. XIV 64. ◊ Fenomen al naturii
= manifestare a unui element al naturii; p. ext. element al naturii. Ploaia este un fenomen
al naturii. ♦ Fapt. Răscoala din Țara Romînească [1821] nu trebuie privită ca un fenomen
izolat, ci în cadrul general al frămîntărilor epocii. IST. R.P.R. 292. 2. Ființă, obiect,
aspect, întîmplare care surprinde (prin calități, noutate, raritate etc.)”.
Exemple (conform DEX):
 ABSORBȚIE – Fenomen fizic prin care un corp lichid sau solid încorporează
prin difuzie din afară o substanță oarecare. Micșorare sau anulare a intensității
unei radiații care trece printr-un corp. Fenomen optic caracteristic lentilelor
ochelarilor de vedere de a reține, filtra razele de lumină care dăunează
ochiului. Proces de pătrundere a apei, a substanțelor minerale și organice,
precum și a gazelor în celulele organismului. Absorbție intestinală =
pătrunderea în sânge și în limfă a produșilor rezultați din digestia alimentelor.
 Fenomene naturale – descărcări electrice (trăsnet), cutremure, furtuni,
tornade, inundații etc.
 Fenomene meteorologice – ploi, vânt, căderi de zăpadă etc.
 Fenomene chimice – reacții chimice, cristalizare, solubilitate, explozii, topire,
încălzire, înghețare etc.
 Fenomene fizice – plutirea unui vas pe apă, zborul unui avion, mișcarea unui
satelit artificial al Pământului.
 Fenomene sociale și istorice – răzvrătiri sociale, războaie, cruciade, migrații
de popoare etc.

Definiție. Un proces (lat. processus – mers înainte, d. procédere – a înainta; fr. procès)
repezinta desfășurare în timp a unui eveniment sau a unui fenomen, și anume evoluția,
dezvoltarea și desfășurarea pentru un fenomen sau un eveniment. Un proces se
Statistică şi Informatică pentru chimie medicală şi farmaceutică 15

caracterizează prin succesiuni de acțiuni/operații, transformări succesive și progresive ce


se finalizează cu producerea de lucruri, lucrări, obiecte, efecte etc., în mediul
înconjurător, în natură, în societatea omenească, în spațiul cosmic etc.
Un fenomen poate să se desfășoare prin intermediul mai multor procese
(exemplu: procese în timpul execuției unui program de calculator). Uneori fenomen = proces.

Exemple (conform DEX):


 Proces metabolic – totalitatea transformărilor biochimice și energetice care au
loc în țesuturile organismului viu. Metabolismul este un proces complex, ce
implică schimburi de materii și energii, și care include două procese
(simultane) opuse.
 Maladie (a unui organ sau a întregului organism) în evoluție (sau în regres).
 Proces tehnologic – totalitatea operațiilor care comportă prelucrări mecanice
și chimice, tratamente termice, impregnări, montaje etc. și prin care materiile
prime, semifabricatele etc. sunt transformate în produse finite.
 Proces în justiție – acțiune în justiție ce se realizează pentru soluționarea unui
diferend între două părți ce sunt în litigiu sau pentru constatarea și
sancționarea conform legislației.
 Proces-verbal – act cu caracter oficial în care se consemnează un fapt; la
întocmirea unui inventar se încheie un proces-verbal care va cuprinde toate
obiectele inventariate.
 Proces de conștiință – a-și analiza, a regreta, a-și reproșa anumite atitudini sau
acțiuni.

Apariția omului pe pământ este rezultatul unor fenomene ce s-au desfășurat pe o


perioadă foarte mare de timp și care au produs adaptarea și evolutia omului în natură.
Charles Darwin (1809 – 1882), celebru naturalist britanic, geolog, biolog și autor de cărți,
fondatorul teoriei referitoare la evoluția speciilor (teoria evoluționistă), a observat că
toate speciile de forme de viață au evoluat de-a lungul timpului din anumiți strămoși
comuni, ca rezultat al unui proces pe care l-a numit „selecție naturală”, studiile fiind
publicate în celebra scriere „Originea speciilor”, din anul 1859, Teoria evoluționistă a
fost recunoscută de către comunitatea științifică și publicul larg încă din timpul vieții sale,
în timp ce „Teoria selecției naturale” a fost considerată ca prim argument al procesului
evoluției abia prin anii 1930, iar acum constituie baza Evoluționismului sintetic.
Ajungând la o anumită evoluție fizică și intelectuală, omul și-a îmbunătățit
continuu condițiile de viață prin inventarea uneltelor de muncă, prin diversificarea
metodelor de supraviețuire în natură, prin organizarea socială a membrilor societății,
inclusiv prin perfecționarea metodelor de comunicare și prin perfecționarea metodelor de
învățare privind domeniul cunoașterii. Astfel, evoluția continuă a omului se datorează și
următoarelor procese:
 Procesul Învățării – învățare sistematică prin formare inițială (școala primară,
gimnazială, liceală, învățământ superior), perfecționare continuă, răspundere
personală pentru învățare și perfecționare;
 Procesul Cunoașterii – influența evoluției științelor asupra dezvoltării societății
umane, pregătire superioară prin doctorat și participarea la cercetarea științifică;
16 MARIN VLADA

 Procesul Comunicării – impactul comunicării prin metodele și tehnicile de


comunicare, eficientă și tehnologiile utilizate în comunicații și comunicare;
 Procesul Informării – suport de stocare și de răspândire a informațiilor
utilizând tehnologiile informației și comunicațiilor, suporturi tradiționale
(cărți, reviste etc.), suporturi și tehnologii oferite de calculatoarele moderne.
Ştiinţele au apărut în diverse etape specifice de dezvoltare a societăţii umane şi
s-au dezvoltat ca urmare a acumularii de cunoştinţe despre realitatea înconjurătoare şi
despre o realitate virtuală. Fiecare ştiinţă reprezintă un continuu proces al cunoaşterii ce
utilizează metode şi tehnici de observare şi experimente, metodologii şi tehnologii într-o
continuă perfecţionare, metode proprii de cercetare, informaţii proprii despre obiectele
investigate, un limbaj ştiinţific propriu.
Prin apariţia calculatorului şi a noilor tehnologii de prelucrare a informaţiilor şi
cunoştinţelor, ştiinţele au realizat salturi mari în acumularea de noi cunoştinţe şi noi
descoperiri. Prin urmare, ştiinţa este un generator de cunoştinţe obţinute prin activitatea
oamenilor de ştiinţă ce adaugă de fiecare dată la fondul comun al ştiinţei, cunoştinţe noi,
descoperiri noi, revizuiri ale unor cunoştinţe vechi, realizând astfel o dezvoltare
permanentă a ştiinţei.

Oxford Advanced Learner's Dictionary:


 Education = „A process of teaching, training and learning, especially in
schools or colleges, to improve knowledge and develop skills”;
 Learning = „The acquisition of knowledge or skills through study,
experience, or the act of being taught”;
 Thinking = „The process of considering or reasoning about something”.
Albert Einstein (http://stiintasitehnica.com/un-interviu-cu-albert-einstein/):
 „știința nu este nimic altceva decât o rafinare a gândirii din viața de zi cu zi.
Gândirea critică a fizicianului nu poate fi restrânsă numai la examinarea
conceptelor din propriul său domeniu de studiu. El nu ar putea face nimic,
dacă nu ar ține seama de o problemă mult mai dificilă, cea a analizei naturii
gândirii din viața de zi cu zi”.
 „avem o experiență dureroasă, din care am învățat că gândirea rațională nu
este suficientă pentru a rezolva problemele cu care ne confruntăm în viața
socială. Rezultate extraordinare ale cercetării științifice au avut adesea
consecințe tragice pentru omenire. S-au inventat lucruri spectaculoase care,
pe de o parte, eliberează omul de muncile istovitoare și îi fac viața mai ușoară
iar, pe de altă parte, îl transformă într-un sclav al tehnologiei. Am creat și
mijloacele pentru distrugerea în masă a oamenilor. Iar cel mai tragic lucru
este că în timp ce omenirea a produs mulți cercetători valoroși în domeniul
științei și tehnologiei, nu am reușit să găsim soluții potrivite la conflictele
politice și la tensiunile economice care ne afectează viața”.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 17

1.1 Impactul calculatorului asupra cunoaşterii


Mediile din natură sunt guvernate de Limbaje. Omul a inventat limbajele, ştiinţele
şi calculatorul, pentru cunoaştere și care a determinat rezolvarea de probleme, evoluţia şi
stocarea cunoşterii, evoluția și dezvoltarea societății omenești.

Piloni ai CUNOAŞTERII:
1. LIMBAJE – Prin intermediul calculatorului (computer) se prelucrează
informaţiile (IT – Tehnologia informaţiei). Pentru reprezentarea şi prelucrarea
informaţiilor calculatorul utilizează limbajele artificiale. Acest fapt dovedeşte
că limbajele au fost inventate nu numai pentru comunicarea informţiilor, ci
mai ales pentru prelucrarea (procesarea) informaţiilor;
2. TEORII-METODE-TEHNICI – dezvoltarea științelor, metodelor și tehnicilor
pentru adaptarea omului în natură, pentru îmbunătățirea continuă a vieții sale,
pentru rezolvarea problemelor;
3. MEDII DE STOCARE – Evoluţia cunoaşterii este influenţată de natura şi
performanţa reprezentării şi stocării: hârtie (cărţi şi reviste), suport magnetic,
suport optic, memorii flash etc.;
4. ÎNVĂŢAREA – Societatea umană se dezvoltă prin Cunoaştere şi Învăţare.
Dacă Dezvoltarea şi Cunoaşterea se moştenesc, Învăţarea nu se poate moşteni,
ci se formează şi se perfecţionează continuu, pe tot parcursul vieţii (Blended
Learning).

Observaţie: Apariţia microprocesorului (în anul 1972) a determinat performanţe mari ale
prelucrării informaţiilor: viteza de calcul, timp de execuţie a programelor, interactivitatea
în utilizarea calculatorului etc.

Fig. 1. Piloni ai cunoașterii și învățării


18 MARIN VLADA

Fig. 2. Piloni ai dezvoltării: Familia, Școala și Societatea

„Education and training also have a substantial contribution to the other flagship
initiatives such as the Digital Agenda and Innovation Union. Systems of education and
training in Europe should provide the right combination of skills and abilities, to ensure
a sufficient number of graduates science, mathematics and engineering, to equip people
with basic skills, motivation and ability to learn , to encourage the development of
transversal competences, including those that permit the use of modern digital
technologies , to promote sustainable development and active citizenship and encourage
creativity, innovation and entrepreneurship”. (Europe 2020 Strategy)

Fig. 3. Complexitatea Procesului de învățare (M. Vlada, A. Adăscăliței, eLSE 2014)


Statistică şi Informatică pentru chimie medicală şi farmaceutică 19

“The modern world is the product of ideas, beliefs and values of human imagination and
culture have shaped it over centuries. It has been created out of our minds as much as
from the natural environment. The human mind is profoundly and uniquely creative, but
too many people have no sense of their true talents. Education has an important role in
helping us to achieve our potential, but the processes by which we assess ability were
designed for other times and for other purposes. This extensively revised and updated
version of Ken Robinson’s bestselling classic, Out of Our Minds, offers a new approach
to creativity in education and in business. It is a provocative call for a more innovative
approach to teaching, training and development that will increase our opportunities for
economic, cultural and human survival.” (Sir Ken Robinson, Out of Our Minds: Learning
to be Creative, Wiley/Capstone)

Fig. 4. Mediul educațional integrat (M. Vlada, A. Adăscăliței, eLSE 2014)

Referință
1. Vlada Marin, Adăscăliței Adrian, Computers: as digital facilities for scientific research and as
tools for enhanced learning in higher education, In The 10th International Scientific Conference
eLearning and software for Education, Bucharest, Advanced Distributed Learning Department,
„Carol I” National Defense University, eLSE 2014, Bucharest, April 24-25, 2014, volume 2,
Editura Universității Naționale de Apărare „Carol I” (ISSN: 2066 - 026X print 2066-8821 online),
pp. 537-544, 2014, www.elseconference.eu.
20 MARIN VLADA

1.1.1 Platforme e-Learning

Construirea unei societăţi informaţionale (ce va reprezenta trecerea la societatea


cunoaşterii și la o cultură a învățării) nu se poate realiza fără cercetare şi proiecte de
investiţii, atât în domeniul IT&C, cât şi în domeniile educaţiei și cercetării. Dezideratul
final fiind competenţa, nici o tehnologie, nici o teorie, nici o abordare nu va elimina sau
neglija relaţia profesor-elev/student. Toate vor fi instrumente comode şi eficiente la
îndemâna, atât a profesorului, cât şi elevului/studentului. Uneori, aceste instrumente pot fi
unice faţă de instrumentele tradiţionale din educaţie. Unele reprezentări pot fi reproduse
sau simulate doar prin intermediul calculatorului care oferă metode şi tehnici privind
grafica, animaţia, sunetul.

De exemplu, reprezentările 3-dimensionale sau evoluţia unor fenomene fizice,


chimice, biologice etc., care se desfăşoara dinamic, nu pot fi reprezentate sau studiate
decât folosind calculatorul. Competenţa implică experienţă în rezolvarea problemelor
dintr-un anumit domeniu de activitate. Competenţa şi experienţa în rezolvarea
problemelor se pot obţine doar dacă permanent se are în vedere interdependenţa
realitatea fizică-realitatea virtuală, şi dacă se întreprind eforturi pentru însuşirea de noi
cunoştinţe, pentru cunoaşterea corespunzătoare a tuturor aspectelor privind modelul fizic,
respectiv modelul virtual, aspecte determinate de particularităţile problemelor de rezolvat
dintr-un anumit domeniu. Tehnologiile de e-learning ce sunt răspândite azi sunt rezultatul
evoluţiei, atât a metodelor pedagogice şi psihologice din educaţie, cât şi a tehnologiilor
IT&C (tehnologii Web, tehnologii multimedia, tehnologii de comunicaţie). Astfel,
utilizarea sistemului Internet, a programelor de elaborare a produselor Web, a
înregistrărilor audio/video, a stocării informaţiilor pe CD-uri, a implementării rezultatelor
din domeniul graficii pe calculator, au facut posibilă elaborarea de cursuri online, de
software educaţional pentru diverse discipline, de biblioteci şi laboratoare virtuale.

Calculatorul – mijloc de formare a unei noi viziuni asupra educaţiei, cercetării şi


inovării

 „LUMEA CONTEMPORANĂ este marcată de o evoluţie rapidă şi greu previzibilă


din toate punctele de vedere (economic, politic, social, ştiinţific). Această evoluţie
marchează toate regiunile globului şi toate sferele vieţii sociale. Are un caracter
imperativ, pluridisciplinar, cu conexiuni puternice şi numeroase. În faţa acestor
demersuri epistemologice, oamenii tentaţi să folosească abordări unidisciplinare şi
nu pluridisciplinare sau transdisciplinare sunt dezorientaţi şi depăşiţi de situaţie.
Pentru a forma noile generaţii astfel încât să fie capabile să facă faţă problemeticii
lumii contemporane, sunt necesare acele schimbări în paradigma învăţării care
favorizează trecerea de la învăţărea disciplinară, atomizată, la cea orientată către
dezvoltarea unui nou mod de gândire, integrator, ancorat în actualitatea
socioculturală complexă, autonom, creativ, deschis. Procesul învăţării transcende
educaţia formală şi depinde de interacţiuni realizate cu o multitudine de surse
externe situate în zona proximei dezvoltări individuale şi în orizontul motivaţional
personal.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 21

 OMUL şi LUMEA interacţionează continuu, realitatea este văzută din perspective


multiple, informaţia ne parvine prin diverse canale, astfel încât, pentru a avea un
răspuns adecvat, CUNOŞTINŢELE noi trebuie produse, şi nu reproduse.
ÎNVĂŢAREA este individualizată, iar dezvoltarea în plan cognitiv şi afectiv nu
poate face abstracţie de contextul cultural, social, tehnologic. Acestea sunt motive
serioase pentru care şcoala secolului 21 ar trebui să se deschidă spre activităţi
care să permită o educaţie de factură nouă, mai adecvată realităţilor contemporane.
Una dintre cele mai bune instrumentate modălităţi de abordare a învăţării în mod
integrator şi diferenţiat este utilizarea calculatorului în sala de clasă.
 CALCULATORUL incită la permanentă reconfigurare a imaginii pe care o avem
despre domeniile cunoaşterii prin accesarea de surse diverse de informaţii şi ne
oferă un alt mod de a cunoaşte şi de a produce CUNOAŞTEREA.
 EDUCATORUL nu mai dirijează şi nu mai controlează informaţiile care intră în
lumea elevilor. El ar trebui să faciliteze înţelegerea lumii externe, corespondenţele
subiective între lumea externă şi lumea internă, iar calculatorul îi poate fi de mare
ajutor în demersul său de la o instruire uniformă, pentru toţi elevii la fel şi una
individualizată, fiecăruia după potenţialul biopsihologic şi nevoi. Schimbarea de
paradigmă a învăţării şi anume trecerea de la achiziţii de cunoştinţe la dezvoltarea
de competenţe, valori şi atitudini impune focalizarea instruirii pe activităţi
dominante de participare activă şi voluntară a elevilor după nevoile, interesele şi
profilurile lor de învăţare. Diferenţierea instruirii şi contextualizarea acesteia are
un suport deosebit de util în utilizarea calculatorului la clasă.” [1].

Referinţe
[1] Mihaela Ilie, Radu Jugureanu, Otilia Ştefania Păcurari, Olimpius Istrate, Emil Dragomirescu,
Dana Vlădoiu (2008), Manual de instruire a profesorilor pentru utilizarea platformelor de
eLearning, Editura LITERA Internaţional, Bucureşti, 2008
[2] BETT, www.bettshow.com
[3] Siveco, http://www.siveco.ro/web/content.jsp?page=2795&language=1
[4] CNIV and ICVL Projects, www.cniv.ro (romanian project), www.icvl.eu (international project)
[5] CNIV, http://www.cniv.ro/2009/elearning
[6] Vlada, Marin (2009) Utilizarea Tehnologiilor eLearning: cele mai importante 10 initiative şi
proiecte din Romania. In: Elearning.Romania. Bucharest: TEHNE – Centre for Innovation in
Education. Available online: http://www.elearning.ro.
[7] Vlada, Marin, Adăscăliţei, A. and Jugureanu, R. (2009) Trends of eLearning: Learning –
Knowledge – Development. In eLSE 2009 – The 5th International Scientific Conference
„eLearning and Software for Education”, BUCHAREST, April 09-10, 2009, „Carol I” National
Defense University, Romania, Available Online: http://adl.unap.ro/else2009/index.php

Obiectivele învăţării:

 „a şti ce” – procesul şi conţinutul gândirii.


 „a şti cum” – metode şi procedee în rezolvarea problemelor.
 „a fi eficient” – abilitatea de a găsi o soluţie optimă (cu costuri minime) sau mai
multe pentru rezolvarea problemelor complexe.
22 MARIN VLADA

PROCESUL ÎNVĂŢĂRII ÎN REZOLVAREA PROBLEMELOR


(Taxonomia Bloom & Anderson – 1956, 2001)
„Învăţarea care are sens le oferă elevilor cunoştinţele şi procesele cognitive de care au
nevoie pentru a putea rezolva probleme.” Lorin Anderson

6. CREAŢIA
- abilitatea de a combina lucruri
existente pentru a face ceva nou -
generează, planifică şi produce.

5. EVALUAREA
- capacitatea de a emite judecăţi de valoare -
critică, judecă, justifică, argumentează, susţine.

4. ANALIZA CUNOŞTINŢELOR
- capacitatea de descompunere a cunoştinţelor în părţi şi
considerarea relaţiei dintre părţi şi structura generală -
analizează prin diferenţiere, organizare şi atribuire.

3. APLICAREA PROCEDEELOR
- abilitatea de utilizare a unui procedeu învăţat într-o situaţie
familiară sau una nouă - modelarea, pregatirea, construirea.

2. ÎNŢELEGEREA CONCEPTELOR
- abilitatea de a forma propriul înţeles pe baza materialelor
educaţionale şi explicaţiilor profesorului - interpretarea,
exemplificarea, clasificarea, rezumarea, deducerea, compararea.

1. AMINTIREA CUNOŞTINŢELOR
- recunoaşterea şi reamintirea conceptelor şi informaţiilor relevante din
memoria pe termen lung.

Fig. 5. Piramida cunoaşterii. Etapele învăţării


Statistică şi Informatică pentru chimie medicală şi farmaceutică 23

Model de Instruire Asistată de Calculator


Fundamente
Navigaţie / Expert /
Hyperlegături Interviu
Teoretice
T P
R
E A
O SCENARIUL
Studii de caz/ C
R Model (Didactic) T
Exercitii
I I
E C
Ă
Internet / Vizualizare /
Literatură Cercetare Simulări

COMPUTER
16 May 2015 Technical University Gh. Asachi, Iași & University of Bucharest, România 19

Fig. 6. Model de instruire asistată de calculator (A. Adăscăliței, M. Vlada, 2015)

Fig. 7. Metode de instruire On-Line (A. Adăscăliței, M. Vlada, 2015)

Referință
A. Adăscăliței, M. Vlada, „Didactică cu programe software educaţionale, Blended-Learning și
Moodle”, Prima Conferinţă Naţională Moodle în Educaţie, 16 mai 2015, Liceul Tehnologic
„V. Sav”, ISJ Roman
24 MARIN VLADA

1.2 Exemple privind studiul fenomenelor

Exemplu. Studiul fenomenelor fizice și chimice. Studiul și modelarea mișcării corpurilor


(corp real versus punct material) în 2D și 3D.

1.2.1 Fenomenul mișcării corpurilor în 2D / 3D

Cinematica (Kinemat=mișcare) este ramura Mecanicii clasice ce s-a dezvoltat ca


ramură a Fizicii. Cinematica studiază mişcarea sistemelor materiale (punct material,
sistem de puncte materiale, solid rigid, sisteme de corpuri rigide) fără a ţine seama de
mase şi forţe. Fizica a fost fundamentată ca știintă de către Galileo Galilei și Isaac
Newton în sec. XVII, prin formularea unui set de principii ale dinamicii corpurilor.
Dinamica este o ramură a mecanicii clasice care se ocupă cu studiul mișcării corpurilor,
în special cu efectul forțelor asupra mișcării corpurilor respective. Legile fundamentale
ale dinamicii au fost formulate inițial de către Isaac Newton. În mecanica cuantică,
dinamica se ocupă cu studiul cuantificării forțelor, cum este în cazul electrodinamicii
cuantice și cromodinamicii cuantice.

Se pot formula următoarele constatări:


 Principiile sunt adevăruri unanim recunoscute, verificabile prin consecințe
într-o multitudine de situații din viața reală. Împreună cu observația și
experimentul, acestea servesc la formularea legilor fizice, care reprezintă
legături cantitative de tip cauză-efect, între mărimile relevante într-un proces
fizic. Structura matematică a mecanicii clasice a fost dezvoltată ulterior prin
lucrările lui Lagrange, în secolul al XVIII-le și Hamilton în secolul al XIX-lea.
 Evoluția și dezvoltarea Mecanicii clasice și Fizicii-precum și a multor științe,
se datorează teoriilor și metodelor oferite și de Matematică: geometrie,
algebra, calculul diferențial și integral, statistica matematică etc. Astfel, a
fost posibilă apariția de noi discipline ale Fizicii: Mecanica analitică, Teoria
relativității, Mecanica cuantică etc., ce servesc la înțelegerea lumii
înconjurătoare, fiind instrumente necesare pentru rezolvarea a nenumărate
probleme din viața reală.
 În ultimele decenii Mecanica clasică a revenit în atentia fizicienilor după ce
Matematica și Informatica au oferit noi instrumente și abordări pentru analiza
dinamicii sistemelor a căror evoluție este descrisă de ecuații neliniare și
rezolvate prin utilizarea calculatoarelor tot mai performante. Deși, Fizica
clasică folosește Modele liniare, lumea fizică înconjurătoare este în mod
preponderent neliniară. În acest sens, au apărut tehnici de abordare modernă a
evoluției unor sisteme mecanice descrise de dinamici neliniare, așa cum apar
ele în Teoria haosului: atractori, analiza în spatiul fazelor, bifurcații,
coeficienți Lyapunov, teoria fractală etc. Aceste instrumente descriu
comportarea haotică a sistemelor fizice guvernate de legi deterministe, pentru
care ecuațiile de mișcare și condițiile inițiale permit determinarea evoluției
sistemului la orice moment de timp.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 25

Modelarea vitezei și a accelerației-conceptul de derivată a unei funcții

Studiul mişcării implică alegerea unui sistem de referinţă. În Cinematică, trei


probleme sunt esenţiale: problema traiectoriilor, problema vitezelor, problema
acceleraţiilor. Conceptele și reprezentările oferite de Matematică sunt aspecte
virtuale/abstracte care modelează într-un spațiu virtual realitatea fizică înconjurătoare
(lumea reală): Modelul virtual vs. Modelul fizic.
Aspectele modelării (reprezentarea corpurilor în mișcare, traiectoria și ecuațiile
mișcării):
 Modelul punctului material – se aplică cu succes, atât pentru studierea
mișcării unor corpuri de dimensiuni și mase gigantice (macrocosmos-
corpurile din interiorul sistemului solar), cât și unor corpuri de dimensiuni
nanoscopice (microcosmic – atomi, nuclee, electroni etc.).
 Modelul traiectoriei și mișcarea – într-un sistem de coordonate (cartezian,
cilindric, sferic, polare, n-dimensional) traiectoria este reprezentată de
poziția unui mobil/punct material în mișcare (curbe în spațiu 2D, 3D sau Rn),
iar legea mișcării este reprezentată de ecuațiile mișcării.

Modelul 3D (spațiul tridimensional R3, reperul OXYZ în spațiu)

Orice corp material din mediul înconjurător (spațiul fizic, lumea reală) este
caracterizat de dimensiuni spațiale finite și de masa m. În lumea reală, spațiul ocupat de
corp conține o infinitate de puncte, de aceea nu este posibilă precizarea poziției lui în
spațiu utilizând coordonatele carteziene (x, y, z) din spațiul virtual OXYZ (oferit de
geometria 3D). Din acest motiv corpul material este reprezentat/asimilat cu un punct
geometric în care este concentrată toata masa m a corpului. Astfel, studiul mișcării
corpului se reduce la descrierea mișcării unui punct geometric în spațiu. Această
simplificare poartă denumirea de aproximația corpului material, iar punctul geometric cu
care este asimilat corpul se numește punct material.

Fig. 8. Modelarea corpului fizic ca punct material (T. Petrișor, 2011)

Pentru studiul diverselor fenomene, în matematică, există două modalități de


identificare (poziționare) a unui punct material în spațiu (aceste reprezentări conduc la
calcule specifice fiecărei modalități):
1. Mărimi scalare spațiale – coordonate carteziene (x, y, z) din spațiul virtual
OXYZ – valori reale R, raportate la axele OX, OY și OZ; aceste coordonate
definesc în mod unic poziția punctului în spațiu (obținut prin proiecția
punctului pe planele XOY, YOZ, respectiv ZOX); în general, Geometria
analitică utilizeaza mărimi scalare spațiale.
26 MARIN VLADA


2. Mărimi vectoriale spațiale – Vectorul r se numește raza vectoare/vectorul de

poziție asociată/asociat punctului material. Vectorul r definește în mod unic
poziția punctului în spațiu, deoarece el are modulul, direcția și sensul
determinate de poziția punctului ce reprezintă un mobil în mișcare; majoritatea
cazurilor studiate în Fizică utilizeaza mărimi vectoriale spațiale.

Z Z

z z

P(x,y,z) P(x,y,z)
 
y
k r
y
Y  
i j Y
x
x
X
X
a) Mărimi scalare spațiale – coordonate
b) Mărimi vectoriale spațiale – Vectorul
carteziene (x, y, z) 
r
Fig. 9. Identificarea poziției în spațiu-coordonate carteziene (a), raza vectoare (b)

Relația ce demonstrează echivalența dintre cele modalități de a defini poziția unui


punct în spațiu:
   
r = xi + y j + zk ,
  
unde x, y, z  R și i, j, k sunt vectorii versori ai direcțiilor x, y și z. Modulul
  
vectorilor versori este egal cu unitatea: | i | = | j | = | k | =1.
În studiul fenomenelor, diversitatea din lumea reală necesită utilizarea mai multor
sisteme de coordonate, cu facilităti de conversie între ele:
1. Coordonate carteziene – coordonatele carteziene (x, y, z) din spațiul virtual
OXYZ oferă poziția unui mobil ce generează traiectoria într-o mișcare în
spațiul R3 funcție de timpul t. Ecuațiile parametrice vor fi:
x=x(t), y=y(t), z=z(t), iar vectorul de poziție
   
r = xi + y j + z k , unde x, y, z  R
2. Coordonate cilindrice - coordonatele cilindrice (r, Ɵ, z) transformă mișcarea
unui mobil pe o traiectorie într-o mișcare pe suprafața unui cilindru. Acestea
sunt o generalizare a coordonatelor polare în plan obținută prin adăugarea
celei de-a treia dimensiuni, cota z. Domeniile pentru coordonatele cilidrice
sunt (raza polară, unghiul polar și cota):
Statistică şi Informatică pentru chimie medicală şi farmaceutică 27

r  (0, ) ,   (0,2 ) , z  (, ) . Ecuațiile parametrice vor fi:


r=r(t), Ɵ =Ɵ(t), z=z(t).
     
Versorii sistemului cilindric sunt  , n, k , unde  = cos(Ɵ) i + sin(Ɵ) j este

versorul cu direcția identică cu a proiecției vectorului
 
r pe planul XOY,
 
iar n = - sin(Ɵ) i + cos(Ɵ) j este normală pe  .

Vectorul r se transformă în
     
r ' = r  + z k = r cos(Ɵ) i + r sin(Ɵ) j + z k ;

Fig. 10. Identificarea poziției în coordonate cilindrice

3. Coordonate sferice – coordonatele sferice (r, Ɵ, φ) transformă mișcarea unui


mobil pe o traiectorie într-o mișcare pe suprafața unei sfere. Domeniile pentru
coordonatele cilidrice sunt (r = raza polară, φ = longitudinea, Ɵ = azimutul):

r  (0, ) ,   (0,  ) ,   (0, 2 ) .


Ecuațiile parametrice vor fi:
r = r(t), Ɵ =Ɵ(t), φ = φ (t).
   
Versorii sistemului sferic sunt  , n ,  , unde  este versorul cu direcția
  
identică cu a vectorului r , iar  este normală pe  .

Vectorul r se transformă în
    
r ' = r  = r sin(Ɵ) cos(φ) i + r sin(Ɵ)sin(φ) j + r cos(Ɵ) k ;
28 MARIN VLADA

Exemplu. Sistemul de coordonate geografic1, (GPS – poziția unui mobil pe suprafața


pământului dată de latitudine (λ) și longitudine (φ)). Utilizarea coordonatelor sferice în
Geografie. Sistemul de coordonate sferic ≈ sistemul de coordonate geografic, și anume,
în sistemul de coordonate geografic r=R, unde R este raza Pământului (R≈6371km).
Unghiul φ reprezintă longitudinea, iar unghiul θ colatitudinea (θ=900-λ). Latitudinea –
unghiul λ, este unghiul pe care îl face raza Pământului cu proiecția ei în planul
ecuatorului.

Fig. 11. Identificarea poziției în coordonate sferice

4. Coordonate polare – sistem în 2D (planul XOY) identic cu sistemul cilindric


din 3D, cu coordonata (cota) z=0. Coordonatele polare (r, Ɵ) transformă
mișcarea unui mobil pe o traiectorie într-o mișcare pe circumferința unui cerc.
Domeniile pentru coordonatele polare sunt (r-raza polară, Ɵ = unghiul polar):
r  (0, ) ,   (0,2 ) . Ecuațiile parametrice vor fi:
r=r(t), Ɵ =Ɵ(t).
  
Versorii sistemului sunt  , n , unde  este versorul cu direcția identică cu
   
vectorului r , iar n este normală pe  . Vectorul r se transformă în
   
r ' = r  = r cos(Ɵ) i + r sin(Ɵ) j .

1
Sistemul de coordonate geografice este un sistem de referință care utilizează coordonatele
unghiulare, latitudine (nordică sau sudică) și longitudine (estică și vestică) și servește la
determinarea unghiurilor laterale ale suprafeței terrestre (sau mai general ale unui sferoid). Globul
este împărțit în 360° (grade) longitudine și 180° (grade) latitudine.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 29


Fig. 12. Identificarea poziției în coordonate polare

Exemplu.

a) definirea unui cerc de rază r și centru O, C(O, r) prin coordonate polare


(ecuații parametrice):
x = r cos (Ɵ), y = r sin (Ɵ), unde   (0,2 ) .
Această reprezentare se poate exprima prin definirea unei curbe în R2, adică o
funcție
c: (0, 2π)  R2, unde c(Ɵ) = (x(Ɵ), y(Ɵ) ) și
x(Ɵ) = r cos (Ɵ), y(Ɵ) = r sin (Ɵ)
De asemenea, elipsa de centru O și semiaxe a,b> 0, E(O,a,b), se reprezintă
parametric printr-o curbă în R2, adică funcția
c: (0, 2π)  R2, unde c(Ɵ) = (x(Ɵ), y(Ɵ) ) și
x(Ɵ) = a cos (Ɵ), y(Ɵ) = b sin (Ɵ)
b) Curba definită prin coordonatele polare
r = – 1 – 2 sin(Ɵ) ), unde   (0,2 ) ,
este o curbă cu 2 vârfuri (vârfuri de bucle), conform cu Dennis DeTurck, Herman Gluck,
Daniel Pomerleano, and David Shea Vick, The four vertex theorem and its converse.
Notices Amer. Math. Soc., 54(2): 192-207, 2007.
30 MARIN VLADA

Fig. 13. O posibilă traiectorie a mișcării unui mobil.


Curba cu 2 vârfuri, Andrei-Dan Halanay [1]

Astăzi, în Geometrie există un număr mare de curbe ce au o definiţie „dinamică”


ca urmare a generării lor prin mișcarea unui anumit punct:
 cicloidă - curba descrisă de un punct care se află pe un cerc care se
rostogoleşte fără frecare pe o dreaptă.
 epicicloidă - curba descrisă de un punct aflat pe un cerc de rază r care se mişcă
fără frecare pe exteriorul unui cerc de rază R.
 hipocicloidă - curba descrisă de un punct aflat pe un cerc de rază r care se
mişcă fără frecare pe interiorul unui cerc de rază R.

Fig. 14. Cicloida (Eric W. Weisstein [2])

Hipocicloide
Statistică şi Informatică pentru chimie medicală şi farmaceutică 31

Epicicloide
Fig. 15. Epicicloide și Hipocicloide (Eric W. Weisstein [2])

Problema reginei Didona

Se consideră o curbă netedă (cu derivate continue de orice ordin) c: [0, a]  R2,
c(t) = (x(t), y(t)), a> 0
cu proprietatea că y(0) = y(a)=0.
Domeniul mărginit de curbă şi de axa OX are arie maximă atunci când curba c
este un cerc.

Observație. Pentru rezolvare se va folosi formula pentru aria unui domeniu mărginit de o
curbă simplă închisă şi pozitiv orientată c: [a, b]  R2, și inegalitatea:
L2  4A ,
unde L este lungimea curbei c, iar A este aria domeniului mărginit de c. Există egalitate
dacă şi numai dacă c este un cerc.
Referință
1. Andrei Dan Halanay, Curs de geometrie, pag 29-31
http://gta.math.unibuc.ro/pages/ahalanay/Curs.pdf, accesare 2017
2. Eric W. Weisstein, http://scienceworld.wolfram.com/chemistry/, accesare 2017

Traiectoria și mișcarea corpurilor (mobil/punct material)


Poziția unui mobil ce generează traiectoria dintr-o mișcare în spațiul R3 funcție de
timpul t este reprezentată de ecuațiile parametrice:
x=x(t), y=y(t), z=z(t),
iar vectorul de poziție este
   
r = xi
+ y j + z k , unde x, y, z  R .
Legea mișcării – indică poziția mobilului în sistemul de coordonate în orice moment de
 
timp t: r = r (t).    
- în coordonate carteziene r (t) = x(t) i + y(t) j + z(t) k , unde
x = x(t), y = y(t), z = z(t)
sunt ecuațiile parametrice ale traiectoriei.
- în coordonate cilindrice
     
r (t) = r(t)  + z(t) k = r cos(Ɵ) i + r sin(Ɵ) j + z k ,
32 MARIN VLADA

unde r=r(t), Ɵ =Ɵ(t), z=z(t) sunt ecuațiile parametrice ale traiectoriei, r  (0, ) ,
  (0,2 ) , z  (, ) .
- în coordonate sferice
    
r (t) = r(t)  = r sin(Ɵ) cos(φ) i
+ r sin(Ɵ)sin(φ) j + r cos(Ɵ) k ,
unde r=r(t), Ɵ =Ɵ(t), φ = φ(t) sunt ecuațiile parametrice ale traiectoriei, r  (0, ) ,
  (0, ) ,   (0, 2 ) .

Modelarea vitezei și a accelerației

ale unei funcții au fost introduse pentru modelarea vitezei


 Conceptele de derivate
( v ) și a accelerației ( a ) unui corp în mișcare:
- Viteza – în fizică/mecanică, viteza medie reprezintă raportul dintre spațiul/
distanța parcursă [s1,s2] și durata deplasării [t1, t2] unui corp, adică
s
| v | , s  s2  s1 , t  t 2  t1.
t
- Accelerația – în fizica/mecanică, accelerația medie reprezintă raportul dintre
variația vitezei [v1,v2] și durata deplasării [t1, t2] unui corp, adică
v
| a | , v  v2  v1 , t  t 2  t1.
t
Valoarea exactă a vitezei/accelerației se poate determina prin utilizarea
expresiilor rezultate din calculul derivatei sau integralei. Calculul diferențial și integral
din Matematică oferă instrumente puternice pentru modelarea și rezolvarea multor
fenomene și procese din fizică, chimie, biologie, medicină, astronomie etc.

Definiția vitezei în Rn
Fie c: I  Rn o curbă neteda (cu derivate continue de orice ordin) în spatiul Rn dată prin
c(t )  ( x1 (t ),  , xn (t )), t  I . Pentru t  I  R , t cu semnificația de timp, vectorul
c(t )  R n se numește vectorul tangent sau vectorul viteză al curbei în punctul t. Viteza în
punctul t este dată de norma euclidiană
n
| c(t ) |  [x (t )]
i 1
i
2
.

A nu se confunda “traiectoria” ce este o curbă în spațiul fizic XYZ, cu


curba/funcția atașată ecuației de mișcare s(t).

Legea vitezei – indică viteza mobilulului (derivata deplasării) în orice moment de timp t
și este
- în coordonate carteziene

  dr dx  dy  dz 
v  v (t )   i j k
dt dt dt dt
Statistică şi Informatică pentru chimie medicală şi farmaceutică 33

- în coordonate cilindrice
 
  dr d (r ) dz  dr  d  dz 
v  v (t )    k   r n k ,
dt dt dt dt dt dt
unde r=r(t), Ɵ =Ɵ(t), z=z(t) sunt ecuațiile parametrice ale traiectoriei, r [0, ) ,
 
 [0,2 ) , z  (, ) . Trebuie precizat că în sistemul cilindric  și n nu sunt

d d 
constanți în timp. Avem  n,
dt dt
     
 = cos(Ɵ) i + sin(Ɵ) j , n = - sin(Ɵ) i + cos(Ɵ) j

Legea accelerației – indică accelerația mobilulului (derivata vitezei) în orice moment de


timp t și este
- în coordonate carteziene
 
  dv d 2 r d 2 x  d 2 y  d 2 z 
a  a (t )    i  2 j 2 k
dt dt 2 dt 2 dt dt
- în coordonate cilindrice
 
  dv d 2r d 2  dr d d 2  d 2 z 
a  a (t )   ( 2  r( ) )  ( .  r 2 )n  2 k
dt dt dt dt dt dt dt

Fig. 16. Viteza și accelerația unui mobil în 3D


34 MARIN VLADA

Modelul 2D (spațiul bidimensional R2, reperul OXY în plan)

Mișcarea pe o traiectorie curbilinie oarecare

În planul 2D se consideră un mobil ce se mișcă pe o traiectorie curbilinie


 
oarecare pe care se precizează două puncte A și B. Se notează cu  A ,  B versorii
tangentelor la traiectorie în punctele A și B. Normalele (perpendicularele) la aceste
tangente se intersectează în punctul C –centrul de curbură, iar lungimea R=|AC| |se
numește raza de curbură. Dacă punctul B tinde spre punctul A, arcul de curbă s se
suprapune peste arcul de cerc de raza R cu centrul în C.


a) Vectorul deplasare r și lungimea
deplasării pe curba s b) Curbura și raza de curbura a traiectoriei

Fig. 17. Mișcarea pe o traiectorie curbilinie (T. Petrișor, 2011)

Prin această observație se definește raza de curbura a traiectoriei în punctul A:


s  0 ds 1 d
R  . Curbura este inversul razei de curbură c   .
 d R ds
Normalele la curba traiectoriei:

 Normala principală – versorul n din A cu directța de-a lungul razei R și
îndreptat spre centrul de curbură C;
 
 Binormala – are versorul definit de produsul vectorial   n .
   
Dacă punctul A tinde spre punctul B, atunci  A   B =  , iar | |=1 si
 
 devine perpendicular pe  . În acest caz sunt valabile formulele lui Frénet:

  0 d  d 1 
  n,  n.
 d ds R
Statistică şi Informatică pentru chimie medicală şi farmaceutică 35

a) Viteza și vectorul de viteză b) Accelerația și vectorul de accelerație

Fig. 18. Viteza și acceleratia pe o traiectorie curbilinie (T. Petrișor, 2011)

Viteza pe o traiectorie curbilinie:


 Viteza instantanee – viteza în punctul A la momentul t ca urmare a distanței
ds parcursă de mobil, intervalul de timp dt tinzând către 0:
s t 0 ds
v 
t dt
 Vectorul viteză instantanee – vectorul obținut când A  B și t  0 ,
 
 r t 0 dr ds  
v     v ,
t dt dt

unde  este versorul tangentei la traiectorie în sensul creșterii arcului ds.
Accelerația pe o traiectorie curbilinie:
 Accelerația instantanee – accelerația este derivata de ordinul unu a vitezei sau

  v
derivata de ordinul doi a vectorului de poziție în raport cu timpul a 
r
t
 Vectorul accelerație instantanee - vectorul obținut când A  B și t  0 ,
 
 v t 0 d (v ) dv  v 2   
a     n, coeficientți lui  , n , sunt
t dt dt R
accelerația tangențiala (at) ce este tangentă la traiectorie și are aceiași direcție și

sens cu viteza v , fiind datorată variației în timp a modulului vitezei, respectiv,
accelerația normală (an) ce este normală la traiectorie fiind îndreptată spre
interiorul acesteia și este datorată variației direcției vitezei în timp.
36 MARIN VLADA

Modelul mișcării uniform variate

O mișcare se numește uniform variată dacă accelerația tangențială at a mobilului


pe traiectorie este constantă în timp. În cazul unei mișcari rectilinii uniforme accelerația
tangențiala este egală cu accelerația totală a = at , deoarece în acest caz accelerația
normală este egală cu zero an = 0. Acest lucru este ușor de demonstrat știind că raza de
curbură a unei drepte tinde la infinit R   . Dependența de timp a vitezei instantanee
are următoarea expresie:
dv
 a   dv   adt  v  v0  at , unde
dt
v0 este viteza inițială a mobilului la momentul t =0.
Analog, dependența de timp a deplasării/spațiului instantanee are următoarea
expresie
2
ds 1
 v   ds   vdt   (v0  at )dt  s  s0  v0t  at ,
dt 2
unde s0 este spațiul/deplasarea/ inițială a mobilului la momentul t =0.
Prin urmare, ecuațiile mișcării uniforme variate sunt:
 Ecuația vitezei v(t )  v0  at ,
1
 Ecuația de mișcare - deplasare/spațiul s (t )  s0  v0t  at 2 ,
2
v 2  v0
2

 Ecuația accelerației  2a .
s  s0
Ultima ecuație (relația dintre cele 3 concepte: deplasare, viteză, accelerație),
numită ecuația lui Galileo Galilei se obține prin eliminarea parametrului t din primele
două. De asemenea, trebuie precizat că mișcarea poate fi accelerată, deci acelerația poate
fi pozitivă (a>0), sau poate fi încetinită, deci acelerația poate fi negativă (a<0).

Pentru mișcarea uniform variată:


 ecuația de mișcare este o parabolă,
 viteza instantanee este tangentă la parabolă. Grafic, ecuația vitezei este
ecuația unei drepte,
 accelerația este panta dreptei,
 spatiul Δs parcurs de mobil în intervalul de timp Δt este aria marginită de
dreapta (fig. a) de la fig. 19).

În general, Accelerația este un vector de aceeași orientare cu vectorul viteza v .
Variația vitezei în intevalul de timp timp Δt este aria marginită de graficul accelerației
(fig. b) de la fig. 19).
Statistică şi Informatică pentru chimie medicală şi farmaceutică 37

a) Reprezentarea evoluției mișcarii s(t) și a b) Reprezentarea evoluției accelerației


vitezei v(t) (T. Petrișor, 2011) a(t) (D. Luca, C. Stan, 2007)
Fig. 19. Viteza și accelerația pe o traiectorie curbilinie

Referințe
1. Dumitru Luca, Cristina Stan, Mecanică Clasică, Universitatea Al. I. Cuza din Iași, Universitatea
Politehnica București, 2007
2. S. D. Anghel, Fizica plasmei şi aplicaţii, Universitatea „Babeș Bolyai” Cluj-Napoca.
http://www.phys.ubbcluj.ro/~anghels/teaching/Plasma/Capitole_curs/CAP3.pdf
3. Traian Petrișor, Curs de fizică, Universitatea Tehnică Cluj-Napoca, http://www.msl.utcluj.ro/
Curs_Fizica_I.html, 2011

1.2.2 Mişcarea particulelor încărcate în câmpuri electrice şi magnetice

Este vorba de procesele ce se petrec într-un gaz ionizat pentru fenomenele care
au loc în cazul interacţiunilor sarcină-câmp. Se studiază doar interacţiunea particulă
individuală-câmp, neglijând interacţiunile electrice dintre particulele încărcate. În acest
caz, se consideră o particulă de masă m, încărcată cu sarcina electrică e, fără a specifica
natura ei, decât atunci când este necesar. Concluziile sunt valabile, atât pentru electroni,
cât şi pentru ionii pozitivi sau negativi.
Mecanismul străpungerii unui anumit gaz supus unei diferenţe de potenţial
alternativ este funcţie de frecvenţa câmpului aplicat şi de presiunea gazului.

Mişcarea în câmp electric alternativ (sinusoidal)

Pentru un câmp electric alternativ descris de ecuaţia


   
d 2 r (t )
E  E0 sin(  t )  m  eE0 sin(  t ) ,
dt 2
iar ecuaţia de mişcare are soluțiile:
38 MARIN VLADA

 
  eE    eE0
v (t ) v 0  0 cos( t ) , r (t )  r0 v 0 t  cos( t ) .
m m 2

Soluția r (t ) arată că mişcarea particulei este rezultatul compunerii a două mişcări:

 o mişcare rectilinie uniformă cu viteza pe care o avea la intrarea în câmp ( v 0 ),

eE0
 o mişcare oscilatorie armonică cu amplitudinea şi cu frecvenţa
m 2
câmpului electric care-i determină această mişcare.

Fig. 20. Mişcarea unei particule încărcate în câmp electric alternativ (S. D. Anghel)

„Comparând legea de variaţie a vitezei cu legea de variaţie a câmpului electric, se poate


observa că între cele două mărimi este un defazaj de 900. Din punct de vedere fizic
aceasta înseamnă că particula este mai întâi accelerată de către câmp pentru ca, la
schimbarea polarităţii acestuia, să-i cedeze înapoi energia câştigată.” S. D. Anghel, Fizica
plasmei şi aplicaţii, Universitatea "Babeș Bolyai" Cluj-Napoca.

Câmpuri electrice şi magnetice statice şi omogene

Fie o particulă încărcată care intră într-un un câmp magnetic suprapus peste un
câmp electric, ambele statice şi omogene.

În fig. 21 este dată ecuaţia de mişcare a particulei. Se consideră ca avem cele


două câmpuri descrise de vectorii E și B, reciproc perpendiculari. Considerăm că inducția
câmpului magnetic B are componentă doar pe direcția axei Oz. Deoarece, câmpul electric
este static, din ultima ecuaţia scalară rezultă că acceleraţia particulei în direcţia câmpului
magnetic este constantă. Deci, de-a lungul direcţiei Oz particula va avea o mişcare
rectilinie uniform accelerată. Mai multe detalii în S.D. Anghel, Fizica plasmei şi aplicaţii,
Universitatea „Babeș Bolyai” din Cluj-Napoca.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 39

Ecuaţia de mişcare a particulei


 
dv  
m  eE  e(v  B0 ) . Se face proiecția
dt
ecuaţiei de mişcare pe cele trei axe de
coordonate și rezultă ecuaţiile
dv x eE x eB0
scalare:   vy ,
dt m m
dv y eE y eB0
  vx ,
dt m m
dv z eE z

dt m
Fig. 21. Câmp magnetic încrucişat cu câmp electric-axa Oz a fost aleasă în lungul
câmpului magnetic (S. D. Anghel)

Referință
S. D. Anghel, Fizica plasmei şi aplicaţii, Universitatea „Babeș Bolyai” Cluj-Napoca,
http://www.phys.ubbcluj.ro/~anghels/teaching/Plasma/Capitole_curs/CAP3.pdf

1.2.3 Modelarea unui proces în domeniul Farmacocineticii

Astăzi, procedurile pentru testarea medicamentelor includ rezultate importante


obţinute în cercetarea privind utilizarea medicamentelor la tratarea diverselor boli.
Bioinformatica, Biostatistica şi Biofarmacia sunt discipline ce oferă diverse metode şi
analize privind domeniul Farmacocineticii.
În analiza şi practica din domeniul Farmacocineticii se studiază efectul
administrării medicamentelor în scopul tratării bolilor. Pentru un model
monocompartimental în care se studiază un medicament administrat extravascular,
există un proces de absorbţie (funcţia de variaţie C1(t), concentraţia substanţei active) şi
un procesul de eliminare (funcţia de variaţie C2(t), concentraţia substanţei active) – a se
vedea secțiunea 4.5 din această carte, Modele neliniare în Farmacocinetică.

Dacă se cunosc:
 C0 – concentraţia iniţială a medicamentului în locul administrării;
 Momentul iniţial determinat de C1(0)= C0 și C2(0)= 0;
 ka – constanta de absorbţie;
 ke – constanta de eliminare,
atunci la locul administrării substanţei active funcţia de variaţie C1(t) în procesul de
absorbţie este
 ,
C1 t   c0 ekat

iar în sânge, funcţia de variaţie C2(t) în procesul de eliminare este


40 MARIN VLADA

C2 t   
k a c0 kat ket
ke  k a
e e .
Reprezentarea grafică a curbei de absorbţie-eliminare folosind programul
software https://www.wolframalpha.com/examples/PlottingAndGraphics.html:

Plot (3/(0.03-0.3))*(EXP(-0.3*x)-EXP(-0.03*x)) x from 0 to 150

Fig. 22. Reprezentarea grafică a curbei de absorbţie-eliminare folosind programul


software https://www.wolframalpha.com/

Referință
M. Vlada, Informatică aplicată. Modele de aproximare, software şi aplicaţii, Editura Universităţii
din Bucureşti, ISBN 778-606-16-0190-5, 2012
Statistică şi Informatică pentru chimie medicală şi farmaceutică 41

Fig. 23. Reprezentarea curbei de absorbţie-eliminare folosind programul software:


http://web2.0calc.com/, f(x)=(3/(0.03-0.3))*(EXP(-0.3*x)-EXP(-0.03*x)

Fig. 24. Reprezentarea folosind programul http://www.mathe-fa.de,


f(x)=(3/(0.03-0.3))*(e^(-0.3*x)-e^(-0.03*x))
42 MARIN VLADA

Exemplu. Molecular and Biomolecular Spectroscopy: The positions of the absorption


and fluorescence bands are determined by Gaussian curve fit analyses using OriginPro 7.5.

Fig. 25. Gaussian curves fitted for the fluorescence spectra in ethanol
(from Yadigar Gülseven Sıdır and Isa Sıdır, Spectrochimica Acta, 2013)

Fig. 26. The molecular structure of 7-acetoxy-6-(2,3-dibromopropyl)-4,8-


dimethylcoumarin (from Y. G. Sıdır and Isa Sıdır, Spectrochimica Acta, 2013)

Sursa: Yadigar Gülseven Sıdır and Isa Sıdır, „Solvent effect on the absorption and fluorescence
spectra of 7-acetoxy-6-(2,3-dibromopropyl)-4,8-dimethylcoumarin: Determination of ground and
excited state dipole moments”, Spectrochimica Acta Part A: Molecular and Biomolecular
Spectroscopy 102 (2013) 286-296;
PDF: http://www.unibuc.ro/prof/vlada_m/docs/2015/mai/27_19_43_53elsevier-2013-
spectrochimie.pdf
Statistică şi Informatică pentru chimie medicală şi farmaceutică 43

1.2.4 Determinarea predispoziției la bolile cardiovasculare

Modelare și sistem expert pentru diagnosticarea bolilor cardiace: Baza de


cunoștințe și predicate ale unui sistem expert.

În domeniul diagnosticării pentru diverse boli, deja sunt rezultate considerabile,


atât prin teoriile și metodele Inteligenței Artificiale, căt si prin limbajele (Logic
Programming, Prolog) ce oferă elaborarea de baze de cunoștinte și programe logice
privind procesul diagnosticării, prin intermediul sistemelor inteligente/expert. Acestea
s-au dezvoltat încă din anul 1970, de exemplu:

 DENDRAL – sistem expert destinat analizei structurilor moleculare;


 MYCIN, un sistem expert pentru diagnosticul și tratamentul infecțiilor sanguine;
 sistemele EMYCIN, HEADMED, CASNET și INTERNIST pentru domeniul
medical;
 PROSPECTOR – pentru evaluarea prospecțiunilor și forajelor geologice;
 TEIRESIAS – pentru achiziția inteligentă a cunoașterii.

Un sistem expert are următoarele componente principale:

 Baza de cunoștințe (Knowledge Base, KB) – servește pentru stocarea tuturor


elementelor cunoașterii (fapte, reguli, metode de rezolvare, euristici) specifice
domeniului de aplicație, preluate de la experții umani sau din alte surse.
 Motorul de inferențe – este un program logic (de regulă Prolog) în care s-a
implementat cunoașterea de control, procedurală sau imperativă, cu ajutorul
căruia se exploatează/interoghează baza de cunoștințe pentru efectuarea de
raționamente, în vederea obținerii de soluții, recomandări sau concluzii.

Programarea logică (programare declarativă pentru baze de cunoștințe) susținută


de limbajul Prolog (conceput ca motor de inferență prin implementarea fundamentelor
logicii de ordinul I în reprezentarea și prelucrarea cunoștințelor) oferă:

 reprezentarea problemelor în termeni de obiecte și definirea relațiilor (clauze


Horn: fapte și reguli) dintre obiecte;
 reprezentarea ce definește baze de cunoștințe ce va fi interogată (procesate
prin inferențe logice) prin motorul de inferențe Prolog (căutarea de soluții se
realizează prin metoda backtracking, metodă a Inteligenței Artificiale).

Conceperea, elaborarea și implementarea acestor sisteme expert se realizează


printr-o colaborare între specialiști IT, informaticieni cu cunoștinte de Inteligență
Artificială, și specialiști ai domeniului respectiv.
44 MARIN VLADA

Fig. 27. Rezolvarea problemelor folosind Inteligența Artificială,


http://unibuc.ro/prof/vlada_m/Inteligenta_Artificiala.php, accesare 2017

În prezent, bolile cardiovasculare sunt una dintre principalele cauze de deces. Cu


scopul de a dezvolta un model predictiv (sistem expert) pentru a estima riscul de boli
cardiovasculare, se va folosi o bază de date (BD) cu informații de la un număr n= 488 de
fișe medicale ale pacienților, de la o instituție de îngrijire a sănătății [1]. Această bază de
date va genera o bază de cunoștințe ce se va folosi la elaborarea programului logic de
diagnosticare.

Fig. 28. Un fragment al bazei de cunoștințe pentru diagnosticarea bolilor cardiovasculare


Statistică şi Informatică pentru chimie medicală şi farmaceutică 45

Acesta realizează reprezentarea cunoștințelor și raționament de cautare pentru a


stabili structura informațiilor și mecanismele de inferență asociate. Sistemul expert va
oferi utilizatorului posibilitatea de a restrânge spațiul de căutare pentru cazuri similare,
prin alegerea celei mai potrivite strategii ce rezolvă problema diagnosticării.
Se va aplica algoritmul prezentat în Fernandes et al. (2015) pentru a genera baza
de cunoștințe referitoare la bolile cardiovasculare (CDP – Cardiovascular Diseases
Predisposing). Cu scopul de a stabili abordarea privind cunoștințele (informații) asociate
unei persoane (pacient), reprezentarea se realizează prin două valori ce vor fi stabilite, și
anume:
 Calitatea Informației (Quality-of-Information, QoI);
 Gradul de încredere (Degree-of-Confidence, DoC).
În programul logic valoarea QoI trebuie înțeleasă ca o funcție matematică care va
returna o valoare de adevăr cuprinsă între 0 și 1, odată ce acesta functie este asociată cu
extensia unui anumit predicat, adică, QoI = 1, atunci când informația este cunoscută
(pozitivă) și QoI = 0 sau fals (negativă), dacă informația este necunoscută.
Gradul de încredere (DoC) va reprezenta limitele unui interval de valori ce vor fi
folosite în argumentele unui predicat și care înseamnă încrederea în criteriul pentru o
anumită informație/cunoștință. Formula de calcul:
DoC  1  l 2 ,
unde l este o lungime de timp dintr-un interval și va fi setat pe intervalul [0,1] pentru a
fi utilizat ca atribut într-un argument pentru un predicat. Acest lucru înseamnă o
normalizare ce se calculează prin formula:
(Y – Ymin ) / (Ymax – Ymin),
unde Y este lungimea de timp.
Obiectivul problemei de analizat este descris prin stabirea argumentelor unui
predicat destinat pentru studiul bolilor cardiovasculare (CDP). Predicatul obiectivului
este definit astfel:

cdp : Age x SBP x CholLDL x CholHDL x Trigly x CTR x AKP x RF  {0, 1},

unde domeniile (mulțimea de valori) argumentelor predicatului sunt:


 Age – Age
 SBP – Sistolic Blood Pressure
 CholLDL – Cholesterol LDL
 CholHDL – Cholesterol HDL
 Trigly – Triglycerides
 CTR – Cardiac Thoracic Ratio
 AKP – Aortic Knuckle Perimeter
 RF – Risk Factors,
iar domeniul de valori 0 și 1 semnifică, valoarea logică de fals (false), respectiv valoarea
logică de adevăr (true).

Referinţe
1. R. Faria, V. Alves, F. Ferraz, J. Neves, H. Vicente, J. Neves, A Case Base Approach to
Cardiovascular Diseases using Chest X-ray Image Analysis, In Proceedings of ICAART 2017 -
46 MARIN VLADA

9th International Conference on Agents and Artificial Intelligence - Editors Jaap van den Herik,
Ana Paula Rocha and Joaquim Filipe, vol. 2, 24-26 feb. 2017, Porto-Portugal, pp. 266-274
2. Fernandes, F., Vicente, H., Abelha, A., Machado, J., Novais, P., Neves J., 2015. Artificial
Neural Networks in DiaCbetes Control. In Proceedings of the 2015, Science and Information
Conference – SAI 2015, 362-370.
3. Blanco, X., Rodríguez, S., Corchado, J.M., Zato, C., 2013. Case-based reasoning applied to
medical diagnosis and treatment. In Distributed Computing and Artificial Intelligence – Advances
in Intelligent Systems and Computing, Volume 217, 137-146.
4. Figueiredo, M., Esteves, L., Neves, J., Vicente, H., 2016. A data mining approach to study the
impact of the methodology followed in chemistry lab classes on the weight attributed by the
students to the lab work on learning and motivation. Chemistry Education Research and Practice,
17: 156-171.

1.2.5 Fenomenul de difuzie a unui nor de gaz

Mai înainte se studiază fenomenul transportul de materie prin difuzie. Dacă un


mediu este umplut neuniform cu gaz, atunci are loc o difuzie a acestuia din regiunile de
concentrație mai mare spre regiunile cu concentrație mai mică. Același fenomen are loc
într-o soluție, când concentrația substanței dizolvate nu este constantă în volum. Se va
examina fenomenul de difuzie într-un tub gol sau umplut cu un mediu poros,
presupunând că în orice moment și în orice loc, concentrația gazului (soluției) este
aceeași pe toată secțiunea tubului.
Fenomenul poate fi descris cu o funcție C(x, t) ce reprezintă concentrația în
secțiunea x a tubului la momentul t. Conform legii lui Nernst2 (ce extinde legea lui Fick),
masa de gaz care trece prin secțiunea x a tubului în intervalul de timp (t, t + Δt) este
C
Q   D ( x, t )  S  t , unde
x
D este coeficientul de difuzie, iar S este aria secțiunii tubului.
Se va determina variația cantității de gaz pe porțiunea (x1, x2) a tubului, datorită
variației concentrației, în intervalul de timp (t1, t2) , ce depinde de π(x), coeficientul de
porozitate, defnit ca raportul dintre volumul porilor și volumul total, iar D(x) este funcția
ce reprezintă coeficientul de difuzie.
Pentru a obține ecuația de difuzie sub formă diferențială se presupune că funcțiile
C(x,t) și D(x) au derivate parțiale de ordinul I și II continue, după care prin calcule, în
ipoteza că în tub nu există difuzie prin pereții tubului, se va determina forma finală a
ecuației de difuzie:
C   C 
 ( x)   D( x)  
t x  x 
Dacă există surse de materie în tub sau difuzie prin pereții tubului, și dacă acestea
pot fi caracterizate prin funcția F(x, t), atunci ecuația de difuzie este :

2
Ecuația lui Nernst este o formulă matematică care redă potențialul de electrod funcție de
concentrație a speciilor electroactive. A fost introdusă de Walther Nernst în anul 1888. Ecuația
Nernst–Planck este o ecuație care exprimă fluxurile ionice sub acțiunea unui gradient de
concentrație și a unui câmp electric.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 47

C   C 
 ( x)   D ( x )    F ( x, t ) .
t x  x 
Pentru a stabili ecuația de transport prin difuzie într-un domeniu spațial   R 3 ,
considerăm o parte    . Se utilizează legea lui Fick [2] pentru a determina masa de
gaz care trece prin suprafața ∂ω în intervalul de timp (t1, t2). Analog, prin calcule și
raționament matematic, se ajunge la ecuația de difuzie în spațiu (R3):
C
 ( x)   ( D ( x )  C )  F ( x , t ) ,
t
3
unde x R , iar  este operatorul gradient. Dacă u(x1, x2, x3) este o funcție (câmp
scalar), operatorul  u asociază un câmp vectorial definit prin coordonate carteziene:
u u u
u =( , , ).
x1 x 2 x3
Cu ajutorul acestei ecuații se studiază procesul de difuzie a unui „nor de gaz” care
se formează datorită exploziei unui proiectil sau scăpărilor de gaz dintr-o uzină chimică.

Referinţe
1. Ştefan Balint, Loredana Tănasie, Modele clasice în ştiinţe, Notiţe de curs Master. Informatică
aplicată în ştiinţe, tehnică şi economie, Universitatea de Vest din Timișoara, 2015.
2. Ştefan Balint, Lecții de mecanică teoretică. Mișcarea punctului material, Tipografia Universității de
Vest din Timișoara, 1995.

1.2.6 Modelul planetar al lui Newton și Modelul atomic al lui Bohr

Modelul planetar al lui Newton

Fenomenul mișcării corpurilor cerești (planete) a fost o preocupare veche a


omenirii. Johannes Kepler (1571-1630), astronom și matematician german, a fost adeptul
sistemului heliocentric al lui Copernic3. Kepler a fost primul om de știință care a intuit că
studiul mișcării astrelor nu trebuie abordat doar din perspectiva cinematicii. El este
inițiatorul introducerii considerentelor de dinamică în mecanica cerească și primul
astronom care a arătat că mișcarea corpurilor cerești este un subiect de fizică. A
descoperit că planetele sistemului solar se rotesc pe traiectorii eliptice, având Soarele
într-unul din focare. Pentru prima dată, în anul 1795, Carl Friedrich Gauss a folosit
Metoda celor mai mici pătrate (MCMP) pentru calculul orbitelor corpurilor cerești.
Fenomenul mișcării corpurilor cerești a fost explicat prin mai multe etape, în funcție de
dezvoltarea diverselor teorii, generând cunoștințe de Astronomie și Mecanică cerească:
 Etapa I, model geocentric datorat lui Ptolemeu – inițial, în urma observațiilor
mișcării planetelor (observații astronomice) realizate de unii oameni, s-a emis ipoteza că

3
Teorie fundamentată de Copernic, conform căreia Soarele se află în centrul sistemului nostru
planetar.
48 MARIN VLADA

Pământul este în centrul universului, iar celălalte corpuri cerești se mișcă în jurul lui.
Calculele în acest model reușesc să prezică eclipsele cu o precizie destul de bună;
 Etapa II, model heliocentric din secolul XVI, datorat următorilor: Nicolas
Copernic, Galileo Galilei4 și Johannes Kepler5, – modelul contesta ipoteza lui Ptolemeu,
iar ipoteza este înlocuită cu alta, care admite că Soarele este fix și planetele, deci și
Pământul, se mișcă în jurul Soarelui. Prin prelucrarea măsurărilor astronomice efectuate
de Ticho Brache, astronomul german Johannes Kepler a găsit că traiectoriile descrise de
planete, în mișcarea lor, sunt elipse, având Soarele în unul din focare. Din datele
măsurărilor astronomice a determinat semiaxele acestor elipse, precum și orientarea
semiaxei elipsei față de o orientare (axa polară) aleasă în momentul începerii
observațiilor. Curbele plane au început să fie studiate de greci începînd cu Apollonios din
Perga, autorul unui tratat despre conice, pe care le-a studiat motivat de traiectoriile
corpurilor cereşti. Studiul conicelor a fost reluat 1800 de ani mai tîrziu de J. Kepler, care
a formulat binecunoscutele legi ale mişcării planetelor în jurul Soarelui. R. Descartes şi
I. Newton au dezvoltat geometria analitică şi analiza matematică pentru a pune legile lui
Kepler pe un fundament riguros.
 Etapa III, model heliocentric din secolul XVII, datorat lui Isac Newton6 –
Modelul matematic elaborat, numit modelul planetar al lui Newton sau simplu, modelul
planetar, are ca ipoteză că Soarele și planetele sunt puncte materiale. Variabilele care
descriu mișcarea unei planete sunt cele trei coordonate ale punctului material prin raport
cu un reper fix a cărui origine este Soarele, iar ecuațiile pe care le satisfac coordonatele
sunt cele date de legea lui Newton, conform căreia produsul dintre masa și accelerația
planetei de masa m, este egală cu forta care acționează asupra planetei:
 2 xi
m  2  Fi , i  1,2,3 ,
t
unde (x1(t), x2(t), x3(t)) sunt coordonatele planetei la momemtul t față de reperul ales
(aceste funcții descriu mișcarea planetei), m este masa planetei, M este masa Soarelui, iar
setul F1, F2, F3 reprezintă componentele forței de atracție universală între planetă și
Soare. Sistemul de ecuații care definește modelul matematic planetar este:
 2 xi xi
 G  m  M , i  1,2,3 ,
t 2
( x12  x22  x32 ) 3
unde G este constanta de atracție universală (constanta gravitațională universală7,
constanta lui Newton), G ≈ 6,674 x 10-11 N (m2/kg2). 1N = 1 Newton=1 kg m/s2;
 Etapa IV, model heliocentric din secolele XVIII-XIX – În anul 1809 Carl
Friedrich Gauss (1777-1855) a publicat metoda lui de calcul a orbitelor

4
Galileo Galilei (1564-1642), https://en.wikipedia.org/wiki/Galileo_Galilei.
5
Johannes Kepler (1571-1630), German mathematician, astronomer, and astrologer; Kepler's laws
of planetary motion - https://en.wikipedia.org/wiki/Kepler%27s_laws_of_planetary_motionm
6
Sir Isaac Newton (1642-1726), English mathematician, astronomer, and physicist -
https://en.wikipedia.org/wiki/Isaac_Newton.
7
Constanta atracției universale a fost prima dată calculată în 1798 de către savantul britanic Henry
Cavendish și este numeric egală cu forța cu care se atrag două corpuri punctiforme, fiecare cu
masa 1kg, aflate la distanța r=1m unul de celălalt.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 49

corpurilor cerești. În această lucrare el a pretins că a utilizat metoda celor mai


mici pătrate, începând cu anul 1795 (The Method of Least Squares Fitting,
http://mathworld.wolfram.com/LeastSquaresFitting.html). De obicei, Metoda
celor mai mici pătrate (MCMP) este atribuită lui Carl Friedrich Gauss8, (calculul
orbitelor corpurilor cerești, 1795), dar se ştie că aceasta a fost publicată pentru
prima dată de Adrien Marie Legendre9, în anul 1805 [Bretscher, O., 1995], iar
mai târziu, în anul 1809, și Carl Friedrich Gauss; Astăzi, pentru această metodă
se folosește si denumirea „metoda de regresie”, termenul de „regresie” a fost
inventat de către Francis Galton (1822-1911) în secolul al XIX-lea pentru a
descrie un fenomen biologic. De asemenea, a introdus conceptul statistic de
corelaţie şi a promovat pe scară largă regresia folosind conceptul de medie
[Bulmer M., Francis Galton, 2003].

Modelul atomic al lui Bohr

În anul 1913, Niels Bohr descrie mișcarea electronului atomului de hidrogen (H)
în câmpul nucleului într-un mod asemănător cu mișcarea planetelor în jurul Soarelui. În
modelul lui Bohr, nucleul este fix (Soarele), iar electronul (planeta) este cel care se mișcă
și forța de interacțiune este dată de formula lui Coulomb:
 
q2 r
F  .  , unde
4 | r |3

q este sarcina electronului, ε este permitivitatea mediului, iar r reprezintă vectorul de
poziție a electronului față de un reper având centrul O în nucleul atomului de hidrogen.
Nucleul și electronul sunt modelate prin puncte materiale. Se folosesc ecuațiile lui
Newton:
 
d 2r q2 r
m   .  .
dt 4 | r |3
Analog, ca în cazul planetelor, se ajunge la concluzia că variabila r(t), care
descrie evoluția în timp a distanței electronului până la nucleu verifică relația, după
modelul lui Bohr:

 2
1  2 q 1 1 1 r  q 
m | v0 |    .    .
2 4 r 2 md 2 0 | v0 |2 sin 2 ( ) | r |3  4 

8
Carl Friedrich Gauss (1777-1855) - German mathematician who contributed significantly to
many fields, including number theory, algebra, statistics, analysis, differential geometry, geodesy,
geophysics, mechanics, electrostatics, astronomy, matrix theory, and optics.
9
Legendre, Adrien-Marie (1805), Nouvelles méthodes pour la détermination des orbites des
comètes [New Methods for the Determination of the Orbits of Comets] (in French), Paris: F. Didot
50 MARIN VLADA

Mișcarea se va face pe cercul de rază



md0 2 | v0 | 2 sin 2 ( )
r1  .4 ,
q2
unde d0 este raza cercului pe care se mișcă electronul.
Modul de mișcare pe acest cerc rezultă din ecuația:
 
d | v0 | |v |
 ,  (0)  0, adică  (t )  0 t ,
dt d0 d0
și astfel variabilele care descriu mișcarea într-un reper cartezian cu centrul în nucleu și
axele, în planul mișcării sunt:
 
| v0 |  | v0 | 
x1 (t )  d 0 t, x2 (t )  d 0 sin  t.
d0  d0 
Energia totală a electronului care execută această mișcare este dată de expresia:
1  q 1 q 1
E  m | v0 | 2   .
2 4 d 0 8 d 0
Această energie depinde de d0, raza cercului pe care se mișcă electronul în jurul
nucleului, ce nu este determinata în model. Dacă se admite că d0 poate varia continuu,
atunci E variază continuu și se ajunge în contradicție cu datele experimentale care arată
că energia electronului nu variază continuu, ci poate avea doar anumite valori, energia
este cuantificată. De aceea, Bohr admite că raza d0 a cercului pe care se mișcă electronul
nu variază continuu, ci poate lua doar valori pentru care lungimea traiectoriei este
multiplu de lungimea de undă „de Broghie” (indrodusă în anul 1923, pentru care a primit
premiul Nobel în anul 1929)¸ asociată electronului
h
  .
m | v0 |
Referinţe
1. Ştefan Balint, Loredana Tănasie, Modele clasice în ştiinţe, Notiţe de curs Master. Informatică
aplicată în ştiinţe, tehnică şi economie, Universitatea de Vest din Timisoara, 2015.
2. Ştefan Balint, Lecții de mecanică teoretică. Mișcarea punctului material, Tipografia
Universității de Vest din Timișoara, 1995.
3. D. Moore and G. McCabe, Introduction to the Practice of Statistics, W. H. Freeman and Co.,
London, 2003.
4. A. Tihonov, A.A. Samarsk, Ecuațiile Fizicii Matematice, Editura Tehnică, 1956.
5. Traian Petrișor, Curs de fizică, Universitatea Tehnică Cluj-Napoca, http://www.msl.utcluj.ro/
Curs_Fizica_I.html, 2011.

1.2.7 Teoria Haosului și Meteorologie

Teoria sistemelor complexe (Teoria haosului) – domeniu de studiu în matematică,


fizică, economie și filozofie, descrie comportamentul anumitor sisteme dinamice
neliniare, a acelor sisteme care prezintă fenomenul de instabilitate numit sensibilitate față
de condițiile inițiale, motiv pentru care comportamentul lor pe termen relativ lung (deși se
Statistică şi Informatică pentru chimie medicală şi farmaceutică 51

conformează legilor deterministe) este imprevizibil, adică aparent haotic. Comportamentul


haotic a fost observat în laborator pe o varietate de sisteme care includ circuite electrice,
lasere, reacții chimice oscilante, dinamica fluidelor și aparate magneto-mecanice și
mecanice, dar și în simulări virtuale ale proceselor haotice. Una dintre aplicațiile cele
mai de succes ale teoriei haosului este în ecologie, unde sistemele dinamice de genul
modelului lui Ricker au fost folosite pentru a arăta cum creșterea populației în raport cu
suprafața ocupată duce la o dinamică haotică.
Teoria haosului a apărut mai recent, după anul 1950, deoarece era nevoie de
calcule laboriose executate de un calculator, pentru studiul elementelor în mișcare, care
să studieze toate posibilitățile de interacțiune. De asemenea, un rol important l-a avut
trecerea de la era deterministă la revoluția Mecanicii Cuantice10. Până la apariția
mecanicii cuantice, oamenii credeau că fenomenele sunt cauzate de alte fenomene.
Modelul după care oamenii explicau fenomenele, care aveau loc la scara lor de spațiu și
de timp, eșua în a explica fenomenele ce au loc la scară foarte mică, foarte mare sau cele
care au loc cu o viteză extrem de ridicată. Modul de a privi universul prin ochii unui
observator uman obișnuit a fost transformat în observabile și teorii care preziceau corect
fenomene, care explicate prin fizica clasică generau rezultate imposibile. Astfel,
s-a creat imaginea unui univers care intra puternic în contradicție cu tot ceea ce oamenii
știau până atunci.
Mecanica cuantică stă la baza mai multor discipline înrudite, incluzând fizica
materiei condensate, electromagnetism, fizica particulelor sau parțial al cosmologiei, și
este instrumentul principal de investigare în biologia structurală. Tot ea stă la baza
explicării proprietăților chimice ale atomilor. În cadrul științelor inginerești, mecanica
cuantică joacă un rol foarte important în dezvoltarea nanotehnologiei și electronicii.
Teoria haosului a fost formulată de Edward Lorenz în 1960: „Un fenomen care pare a se
desfășura la întâmplare, are de fapt un element de regularitate ce ar putea fi descris
matematic.” Prin urmare, există o ordine ascunsă în orice evoluție aparent haotică a
oricărui sistem dinamic complex.

Model meteorologic creat de Edward Lorenz în anul 1960

Modelul meteorologic al lui Lorenz era compus dintr-o serie de formule


complexe (ecuații matematice care evoluează în timp) și avea ca scop evoluția aspectelor
atmosferice în vederea estimării parametrilor atmosferici. Modelul meteorologic a fost
executat printr-un sistem de programe elaborate pentru unul din calculatoarele (calculator
de generația a 3-a) universității din Massachusetts (MIT – Massachusetts Institute of
Technology, http://web.mit.edu). Rezultatele modelului nu repeta nici o secvență a
parametrilor studiați și se comporta cât se poate de asemănător cu vremea reală. S-a
sperat că dacă vor fi introduse date meteorologice reale, care să fie în concordanță cu
vremea de afară, modelul s-ar transforma într-un adevărat sistem de estimare. Într-o zi,

10
Mecanica cuantică (Teoria cuantică) este o știință a fizicii care se ocupă cu comportamentul
materiei și al energiei la scară atomică și al particulelor subatomice / undelor. Mecanica cuantică
este esențială în înțelegerea forțelor fundamentale din natură, cu excepția gravitației. Bazele
mecanicii cuantice au fost puse la începutul secolului 20 de ideile inovatoare ale lui Max Planck și
Niels Bohr. Termenul "mecanică cuantică" a fost inventat de către Max Born în 1924.
52 MARIN VLADA

Lorenz a schimbat modul de lucru al modelului. A executat programul cu date ințiale și a


reținut anumiți parametri în baza cărora să genereze un anumit fenomen meteorologic
pentru a putea să observe mai bine finalitatea procesului. Nu a lăsat programul să se
execute cu setările inițiale și să calculeze rezultatul după mai mult timp de execuție, ci
Lorenz a decis să oprească programul și să reia execuția cu datele valorilor rezultate, pe
care programul le calculase anterior și le tipărise cu doar ultimele 3 zecimale exacte. De
fapt, acest fapt este cunoscut azi prin așa-numitul proces de iterație.
Starea atmosferei – Vremea, reprezintă comportamentul tuturor componentelor
atmosferei (gaze, particule materiale, vapori de apă, picături de apă, cristale de gheață etc.)
care formează atmosfera. Deoarece, în timp, nu se poate localiza cu exactitate o particulă,
acesta este motivul pentru care previziunile meteorologice nu sunt valabile mai mult de 2-3
zile, acesta e motivul pentru care ele sunt simple aproximări ale situației din acel moment.
Prin prisma ideilor convenționale ale acelei vremi, Lorenz nu făcuse nimic greșit.
Azi, Meteorologia este disciplina care se ocupă de studiul fenomenelor
atmosferice, având ca obiect în special procesele climatice, precipitații, temperatură,
curenți de aer, descărcări electrice (fulgere) și prognoza lor. Aceste prognoze se
realizează, de regulă pentru intervalul de la 1 la 7 zile, având la bază rezultatele obținute
în urma unui set complex de ecuații matematice, care se înregistrează în timp pornind de
la starea inițială a atmosferei. Aceleași ecuații matematice se pot utiliza în determinarea
stării probabile pentru un interval de maxim 10 zile, utilizând modele mai performante. În
cazul prognozelor pentru un interval mai mare de 7-10 zile, erorile de prognozare sunt
însemnate, fapt pentru care nu pot fi luate în considerare.
Cele mai utilizate modele de prognoză:
 Modelul HRM – Modelul HRM (High resolution Regional Model) a fost
realizat de DWD (Deutscher Wetterdienst – Serviciul Meteorologic Național
German). Modelul a fost utilizat pentru prima dată de ANM (Administrația
Națională de Meteorologie – http://www.meteoromania.ro/anm2/) pe 1 decembrie
1999. Datele inițiale sunt furnizate de model la o rezoluție orizontală de
aproximativ 60 km și este utilizat pentru un interval de până la 148 ore. Datele
mai pot fi folosite de Modelul HRM (Modele Mezoscalare Hidrostatice) sau
de Modelul Local. HRM este utilizat în estimarea difuziei și a transportului de
poluanți de tip INPUFF, dar și pentru supravegherea neîntreruptă a posibilelor
poluări accidentale de la diverse surse potențiale.
 Modelul MM5 – Modelul, ajuns la a V-a versiune, a fost dezvoltat la Centrul
Național al Cercetărilor Atmosferice din Pennsylvania State University, iar în
2002 Administrația Națională de Meteorologie a inclus acest model în
proiectul de modernizare Simin. Modelul este integrat operațional pe o stație
de lucru Sun, pentru un interval de prognoza de 24 ore și este integrat de patru
ori pe zi. Dispune de o rezoluție de 15 km și de o grilă de 80 km / 167 km.
 Modelele statistice – Modelele au fost implementate în 1989 și erau utilizate
pentru prognozarea temperaturilor extreme la București utilizând date de
intrare furnizate de modelul ECMWF (Franța). În urma colaborării
Administrației Naționale de Meteorologie cu Meteo France, colaborare
începută în anul 1993, modelul a putut fi aplicat de mai multe stații din țară.
Pe lângă datele de intrare furnizate de modelul ECMWF, au fost utilizate și
datele modelelor ALADIN și ARPEGE.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 53

Fig. 29. Hartă sinoptică, care arată presiunea, temperatura și umezeala aerului,
nebulozitatea, tendința barică, direcția și viteza vântului
(sursa:Markus Aebischer)

1.2.8 Dinamica atmosferei – studiul mișcării aerului

Atmosfera Pământului, zona gazoasă ce înconjoară planeta, permite transferul


energiei între soare şi planetă şi de la o regiune a globului la alta. Aceasta este considerată
un sistem fluid, de aceea atmosfera este sediul tuturor tipurilor de mişcare, de la
turbioanele foarte mici-cu dimensiuni sub un metru, la circulaţia globală, prin undele
planetare. Mişcarea aerului influenţează componentele atmosferei, cum ar fi vaporii de
apă, norii, şi astfel, poate redistribui masele de aer şi constituienţii atmosferei într-o
varietate infinită de configuraţii complexe. Mișcarea intervine în procesele atmosferice și
face din circulaţia atmosferică un important factor al bilanţului energetic global.
Dinamica atmosferei / meteorologia dinamică se ocupă de studiul mişcării aerului și care
în ultimele decenii, a avansat foarte rapid, tinând seama de teoriile ce s-au perfecționat și
54 MARIN VLADA

care utilizează facilitățile oferite de calculatoare performante. Dinamica atmosferei


stabileşte legile de mişcare a maselor de aer din atmosferă şi metodele de rezolvare a
ecuaţiilor de mişcare, în scopul de a prevedea evoluţia viitoare a vremii.
Diferitele mărimi fizice care caracterizează starea atmosferei (presiune, densitate,
temperatură, viteză) se presupune că au o valoare unică în fiecare punct al fluidului
atmosferic. În plus, aceste variabile de câmp şi derivatele lor sunt presupuse funcţii
continue în spaţiu şi timp. Astfel, legile fundamentale ale mecanicii fluidului şi
termodinamicii care guvernează mişcările din atmosferă, pot fi exprimate în termenii
ecuaţiilor diferenţiale care implică variabilele de câmp.

În dinamica atmosferei ca şi în mecanica fluidelor, efectuarea raţionamentelor şi


stabilirea legităţilor se sprijină pe conceptul de particulă. Particula se poate defini ca
fiind volumul de fluid în interiorul căruia nu pot fi puse în evidenţă neuniformităţile
parametrilor fizici (p, T, V etc.) şi a parametrilor mecanici (viteză, acceleraţie etc.).
Sistemul de referinţă pentru Pământul în rotaţie are axele de coordonate orientate astfel:
 Ox – de la vest la est, tangentă la cercul latitudinal; Mişcarea de-a lungul axei
Ox se numeşte mişcare zonală;
 Oy – de la sud la nord, tangentă la meridional; Mişcarea de-a lungul axei Oy
se numeşte mişcare meridională.
 axa Oz – de jos în sus, de-a lungul razei Pamântului. Mişcarea de-a lungul axei
Oz se numeşte mişcare verticală.
Mişcările din atmosfera sunt guvernate de legile fundamentale din fizică: legea de
conservare a masei, a impulsului şi a energiei. Legea a II-a a lui Newton pentru mişcare
arată că, accelerația unui corp de masă unitate într-un sistem de coordonate fixat în spaţiu
este suma tuturor forţelor care acţionează asupra corpului:
 
dV  F
 .
dt m
Pentru o studiere completă, aerul atmosferic trebuie studiat și ca sistem
termodinamic. Pentru un sistem închis masa şi compoziţia chimică definesc sistemul
însuşi, iar celelalte proprietăţi definesc starea lui. Dintre toate variabilele care descriu
starea sistemului, numai câteva sunt independente. Pentru sistemele omogene de
compoziţie chimică constantă (nici o reacţie chimică), dacă nu considerăm masa, numai
două variabile sunt independente. Parametrii T (Temperatura), p (presiune) şi V (Volum)
sunt variabile de stare. Toate proprietăţile sistemului vor depinde de starea definită prin
parametrii de stare şi prin funcţiile de stare, cum ar fi de exemplu: energia internă (U),
entalpia (H) şi entropia (S).
      
Vectorul viteza a vântului V = u i + v j + w k , unde u, v, w  R si i, j,k
sunt vectorii versori ai direcțiilor u, v și w:
dx
 u (t )  – este pozitivă când are sensul spre Est şi poartă numele de
dt
componenta zonală;
Statistică şi Informatică pentru chimie medicală şi farmaceutică 55

dy
 v(t )  – este pozitivă când are sensul spre Nord şi poartă numele de
dt
componenta meridională;
dz
 w(t )  – este pozitivă când are sensul în Sus şi se spune ca mişcarea este
dt
ascendentă pentru w > 0 şi descendentă pentru w < 0.

În domeniul meteorologiei – în cadrul mişcărilor din atmosferă, forţele


fundamentale care acţionează asupra particulelor de aer de masă unitate sunt:
 forţa de gradient baric – Datorită mişcărilor moleculare asupra suprafeţelor
volumului elementar de aer se exercită presiune pe toate cele trei direcţii. Dacă
masa elementului de volum va fi m = ρdxdydz, componenta pe direcţia x a forţei
de presiune, care acţionează asupra unităţii de masă, acceleraţia va fi
Fx 1 dp
 , analog pentru direcţiile y și z. Forța de gradient presiune/baric
m  dx

F 1
pe unitatea de masă va fi   p , unde  este operatorul gradient;
m 
 forţa gravitaţională – Dacă M este masa Pământului, K este constanta atracţiei
universale şi m este masa particulei de aer din atmosferă, atunci forţa exercitată
asupra unităţii de masă a particulei de atracţia gravitaţională a Pământului este
 
Fg  K M r
 g   2 ( ), unde g este valoarea acceleraţiei gravitaţionale ce
m r r
depinde de acceleraţia gravitaţională de la nivelul mării;
 forţa de frecare – Forţa de frecare este mai dificil de cuantificat și se face cu

Legea lui Newton, F    A  v , unde η este coeficient de vâscozitate
dinamică, ∇v gradientul vitezei de curgere a aerului, iar A aria suprafeţei
perpendiculare pe direcţia de curgere;
 forţele aparente – forţa Coriolis şi forţa centrifugă. Sistemul de referinţă,
Pământul este un sistem acccelerat sau sistem neinerţial. Forţa Coriolis este cea
mai importantă dintre forţele aparente şi se numeşte astfel după numele
fizicianului, inginerului şi matematicianului francez G. C. de Coriolis (1792–1843).

Având expresiile forţelor care acţionează asupra particulei de aer atmosferic cu


masa unitate, se poate scrie sub formă vectorială, legea a doua a mecanicii, legea lui
Newton. Detalii în Sabina Ştefan11, Fizica atmosferei, vremea și clima, Editura
Universității din București, 2004, 425 pag., ISBN 973-575-961-6.

11
Premiul „Ştefan Hepites“ al Academiei Române, anul 2004, primit în anul 2006.
56 MARIN VLADA

Referinţe
1. Teoria haosului, https://ro.wikipedia.org/wiki/Teoria_haosului
2. Modele matematice în meteorologie, http://www.ijmet.org/wp-content/uploads/2014/09/361.pdf
3. Sabina Ştefan, Fizica atmosferei, vremea şi clima, Editura Universității din București, 2004, 425
pag., ISBN 973-575-961-6 (Premiul „Ştefan Hepites“ al Academiei Române), http://www.fizica.
net/Fizica/Admitere/Master/doc/2009/StudiuFAPPM.pdf
4. Sabina Ştefan, N. Rîmbu, Dinamica Atmosferei – Culegere de probleme, Editura Universităţii
din Bucureşti, 250 pg. ISBN 973-575-379-0

1.2.9 Matematica fenomenului gheții marine

Programul "Mathematics of sea ice phenomena" este inclus într-un proiect de


cercetare al Institutului I. Newton (The Isaac Newton Institute for Mathematical Sciences,
University of Cambridge, UK, https://www.newton.ac.uk/), perioada Ianuarie-August
2017. Programul a fost prevăzut să se concentreze asupra mecanicii și termodinamicii
gheții marine, precum și asupra interacțiunii gheții marine cu fluide și solide. Modelarea
gheții marine și comportamentul acesteia în situații diferite este o problemă dificilă, care
se întinde pe mai multe domenii ale fizicii și matematică, și are implicații complexe în
științele naturale și inginerie.
Programul va studia modelarea problemelor legate de gheață, oferind un nivel
adecvat de rigoare fizică și matematică la astfel de probleme. Se vor identifica problemele
care necesită atenția urgentă a matematicienilor și fizicienilor care să stabilească o rețea
științifică privind cercetarea gheții, prin coordonarea eforturilor pentru a aborda
problemele existente și viitoare. Programul va reuni cercetători din diferite domenii
pentru a lucra în grupuri pe probleme moderne ale dinamicii și termodinamicii gheții
marine, formularea unor noi probleme și modele, și pentru a discuta strategii pentru
soluțiile lor. De asemenea, programul își propune să aducă noi specialiști cu noi idei și
abordări non-standard și tehnici pentru problemele dificile de modelare a gheții marine.

1.2.10 Mecanica statistică a moleculelor

Statistical Mechanics of Molecular and Cellular Biological Systems

An interdisciplinary approach to virus structure and assembly (by Reidun


Twarock and Peter Stockley, 2004), The Isaac Newton Institute for Mathematical
Sciences, University of Cambridge, UK. „Într-un studiu de pionierat interdisciplinar al
virușilor bazat pe o combinație între teoria grafurilor, biochimie și modelarea cinetică,
Stockley și Twarock au reușit, mai întâi, să prezică o configurație asimetrică apentru
secvența liniară RNA în densitatea observată (medie) a RNA-ului la orice virus”-
https://www.newton.ac.uk/ files/attachments/1265589/689477.pdf.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 57

Fig. 30. Un drum Hamiltonian care indică localizarea moleculei RNA – genomice în
capsidă (in the capsid) (R. Twarock) – https://www.newton.ac.uk/

Concluzii

a) Paradigme ale conceptelor – Conceptual age (concept workers) – 21st


Century.

Daniel Pink's book contains a description of new age - the Conceptual Age:

1. Agricultural age (farmers) – 18th Century;


2. Industrial age (factory workers) – 19th Century;
3. Information age (knowledge workers) – 20th Century;
4. Conceptual age (concept workers) – 21st Century.

b) Cum trebuie predate Matematica şi Informatica?

Textul de mai jos este o provocare şi o invitaţie pentru comunitatea ştiinţifică şi


didactică din România de a deveni unul dintre pionierii apropierii de o nouă şcoală a
viitorului:
„Să ne concentrăm mai mult pe geneza noţiunilor (conceptelor) fundamentale ale
matematicii. Pentru a le defini a fost nevoie de secole, pentru a demonstra majoritatea
teoremelor au fost necesari doar câţiva ani. Fiecare concept nou a făcut posibilă
investigarea atâtor lucruri că nicio descoperire nu poate concura cu introducerea unui
concept fundamental. Extinderea matematicii ca instrument de cercetare este principala
sarcină a matematicii, iar derivarea de noi concepte matematice furnizează cea mai bună
imagine a naturii sale reale. Fără aceasta, nimeni nu poate înţelege cu adevărat rolul şi
utilitatea sa. Numai dacă înţelegem geneza matematicii ca dezvoltare a unui limbaj al
ştiinţei şi ca un instrument de cercetare, putem să o aplicăm curent în toate domeniile
58 MARIN VLADA

vieţii noastre. Predarea matematicii în acest spirit poate schimba complet comportarea
membrilor societăţii din jur.” Juraj Hromkovic, prof. univ. dr. la ETH (Eidgenössische
Technische Hochschule) Zürich, Elveţia - http://c3.cniv.ro/

c) Programe complexe de cercetare-dezvoltare

În domeniul ştiinţific, un cercetător sau un specialist foloseşte teorii, metode şi


tehnici din domeniul matematicii în studiul diverselor fenomene şi procese pe care le
studiază şi le analizează. Utilizarea şi aplicarea acestora depinde de nivelul de pregătire şi
de experienţa cercetătorului (specialistului). În cercetare şi în activitatea profesională a
unui specialist pot apărea probleme a căror rezolvare să fie foarte complexă. Rezolvarea
problemelor complexe necesită programe de cercetare-dezvoltare la care participă mai
mulţi specialişti şi cercetători dintr-o anumită ţară sau chiar din mai multe ţări.
Astăzi, se pot evidenţia multe astfel de exemple numai dacă se analizează
activitatea de cercetare ştiinţifica din spaţiul american sau spaţiul european. De exemplu,
în perioada 1990-2005 s-au finanţat şi desfăşurat activităţi de cercetare pentru întocmirea
hărţii genomului uman în cadrul proiectului de cercetare „THE HUMAN GENOME”.
Printr-o simplă căutare a subiectelor pe această temă, se poate observa că Informatica
(Computer Science/Informatics), Bioinformatica (Bioinformatics), Biologia computaţională
(Computational Biology), Medicina Genetică (Genetic Medicine), Ingineria Genetică
(Genetic Engineering) etc., sunt domenii ştiinţifice importante ce şi-au adus contribuţia la
finalizarea hărţii genomului uman.
Articolul “The Sequence of the Human Genome” apărut în anul 2001 în revista
Science, vol 291, are un număr foarte mare de autori de la diverse universităţi, institute,
laboratoare (a se vedea imaginea de mai jos, fig. 31) şi este rezultatul unor cercetări în
cadrul acestui proiect (The Sequence of the Human Genome, Science, vol 291, pp. 1145-1434,
2001, http://cs.brown.edu/~sorin/pdfs/venter2.pdf). Ca exemplu, printre autori se află şi
cercetători proveniţi din România:
 Prof. dr. Sorin Istrail se numără printre şefii echipelor de cercetători care au
realizat cercetări pentru întocmirea hărţii genomului uman (Sorin Istrail –
Professor of Computer Science, and Director of the Center for Computational
Molecular Biology at Brown University- are doctoratul la Universitatea din
Bucureşti din anul 1979 sub conducerea profesorilor Solomon Marcus şi
Sergiu Rudeanu; Ref.: Istrail Laboratory – www.brown.edu/Research/
Istrail_Lab/, http://cs.brown.edu/~sorin/, http://mvlada.blogspot.com/2011/
07/professor-sorin-istrail.html).
 De asemenea, printre autori se află şi Liliana Florea absolventă de informatică
la Universitatea din Bucureşti (Liliana Florea – Assistant Profesor at Center
for Bioinformatics and Computational Biology, McKusick-Nathans Institute
of Genetic Medicine, Johns Hopkins University School of Medicine
University of Maryland School of Medicine; Ph.D., Computer Science and
Engineering (2000) Pennsylvania State University; M.Sc., Computer Science
and Engineering (1998) Penn State University; B.S., Computer Science (1994)
University of Bucharest, România; Ref.: http://www.cbcb.umd.edu/~florea/).
Statistică şi Informatică pentru chimie medicală şi farmaceutică 59

Fig. 31. Prima pagină din articolul „The Sequence of the Human Genome”
The Sequence of the Human Genome, Science, vol. 291, pp.1145-1434, 2001, http://cs.
brown.edu/~sorin/pdfs/venter2.pdf
60 MARIN VLADA

1.3 Teoria erorilor, incertitudini şi aproximări


„Să măsurăm ce se poate măsura şi să facem măsurabil ceea ce nu se poate măsura încă.”
Galileo Galilei

În sens larg, cuvântul „eroare” înseamnă greşeală, incertitudine, nesiguranţă etc.


Prin greşeală înţelegem un fapt realizat de om în activitatea profesională, socială,
economică etc. privind un raţionament greşit, o metodă aplicată greşit, un instrument
utilizat greşit, o atitudine ce contrazice regulile morale, sociale sau legislative,
neînţelegeri ale unor noţiuni, termeni sau concepte din limbajul ştiinţific, economic,
social etc. Prin incertitudine se înţelege lipsa de certitudine, îndoială asupra unor
raţionamente, calcule, sau experimente, iar în domeniul social poate reprezenta starea
unei persoane lipsite de siguranţă, de hotărâre. În doate domeniile există incertitudini.
De exemplu, în domeniul ştiinţific s-au dezvoltat diverse teorii care “controlează”
incertitudinile:
 logica matematică bivalentă (cu 2 valori: true, false; logica propoziţiilor,
logica predicatelor, logica relaţiilor) oferă metode şi tehnici certe (logica
matematică are aplicaţii în electrotehnică – studiul schemelor cu relee, al
schemelor electronice, în cibernetică-teoria automatelor, tehnica programării,
în neurofiziologie-modelarea sistemelor neuronale, lingvistică, lingvistica
matematică etc.); sistemele de calcul folosesc limbajul binar pentru procesarea
informaţiilor; pentru rezolvarea diverselor probleme complexe a fost necesară
conceperea unor teorii de logică matematică trivalente şi cu mai multe valori
(primele sisteme de logică polivalentă au fost construite de J. Lukasiewicz
(1920), E. Post (1921) şi de Grigore C. Moisil (1963)); În limbajul de
manipulare a datelor SQL (Structured Query Language), o stare de adevăr
TRUE pentru o expresie (de exemplu într-o clauză WHERE) iniţializează o
acţiune pe un rând (returnează un rând), în timp ce o stare de adevăr
UNKNOWN sau FALSE nu face acest lucru. În acest fel, logica trivalentă este
implementată în SQL, şi se comportă ca logică bivalentă pentru utilizatorul
SQL; limbajul Prolog (programare în logică) este conceput şi elaborat având la
bază logica de ordinul I (cuantificatorii oricare (  ) şi există (  ) operează doar
asupra variabilelor). Primul compilator a fost elaborat în anul 1972.
 teoria logicii şi a multimilor fuzzy (suport pentru studiul incertitudinii şi
impreciziei; aplicaţii în analiza fenomenelor şi proceselor, fiabilitatea
sistemelor, uzura produselor, gradul de utilizare a produselor sau maşinilor,
procesarea imaginilor etc.). Incompletitudinea unei informaţii/date se exprimă
pe două scări: scara incertitudinii se referă la încrederea care i se acordă
informaţiei (dacă sursa de informaţie, instrumentul de măsură sau expertul
sunt siguri, demni de încredere, informaţia este certă), scara impreciziei se
referă la conţinutul informaţional (informaţia este precisă dacă mulţimea
valorilor specificate în enunţul corespunzător este o valoare unică). Există
fenomene și procese în care gradualitatea şi ambiguitatea joacă un rol
important (imprecizia nu este de tip aleator). Problema este de a putea aprecia
în ce măsură un obiect dat aparţine unei clase ale cărei margini nu pot fi
precizate clar. Clasa de obiecte are grade de apartenenţă continue. O astfel de
mulţime este caracterizată de o funcţie de apartenenţă ce atribuie fiecărui
obiect un grad de apartenenţă între 0 şi 1.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 61

Sunt cunoscute exemple de oameni de ştiinţă din matematică, fizică, chimie etc.
ce au făcut greşeli în cercetările/teoriile lor (există cazuri când s-au făcut descoperiri
ştiinţifice în mod întâmplător, de ex. razele X, Penicilina, Viagra etc.):
 exemple relevante pentru matematică sunt prezentate în Alexandru Froda
(1894-1973), Eroare şi paradox în matematică, Editura Enciclopedică
Română, 1971.
 sute de lucrări ştiinţifice sunt retrase în fiecare an, din cauza documentărilor
superficiale, plagiatului sau analizelor greşite; de exemplu: „Apendicita se
tratează cu antibiotice. The Journal of Gastrointestinal Surgery a publicat în
2009 un studiu al unor cercetători indieni care susțineau că antibioticele sunt
o metodă mai sigură decât îndepărtarea chirurgicală a apendicelui. Ei au fost
contestați de chirurgi italieni, iar studiul a fost retras din publicație pe motiv
de plagiat.” (Sursa: LiveScience);
 invenţii atribuite greşit – Conceptul de computer desktop – „oficial”:
Microsoft (prin Windows), real: Xerox PARC; Razele X – Inventator
„oficial”: Thomas Edison, real: Wilhelm Rontgen; Becul – Inventator
„oficial”: Thomas Edison, real: Sir Humphry Davy; Radioul – Inventator
„oficial”: Guglielmo Marconi, real: Nikola Tesla; insulina – În anul 1923
Frederick G. Banting și John Macleod primesc Premiul Nobel pentru
descoperirea insuline, deși Nicolae Paulescu este adevăratul inventator,
recunoscândui-se meritele, abia în anul 1969. Sursa: http://www.descopera.ro/.

1.3.1 Analiza datelor experimentale – Tipuri de erori

În Chimie şi Fizică, precum şi în alte ştiinţe inginereşti, metodele folosite la


măsurarea parametrilor (mărimi fizice sau chimice) sunt în general precise. Totuşi, în
timpul măsurărilor pot interveni diferiţi factori perturbatori care generează apariţia
erorilor de măsurare. Pentru determinarea mărimilor fizice sau chimice se folosesc
instrumente de măsură, care au o anumită precizie. Nici o măsurare nu este absolută.
Măsurând de mai multe ori aceeaşi mărime fizică, în aceleaşi condiţii, cu aceleaşi
mijloace, se poate observa că rezultatele obţinute sunt diferite. Diferenţele ce apar depind
de construcţia instrumentelor de măsură, de observator, sau de alţi factori perturbatori.
Acurateţea unui experiment arată cât de aproape este rezultatul masurării de valoarea
adevărată. Prin urmare, acurateţea este o măsură a corectitudinii rezultatelor obţinute prin
măsurare şi prin calcul. Precizia unui experiment este o măsură a exactităţii determinării
rezultatelor sau o măsură a gradului de împrăștiere (dispersie) a măsurărilor repetate.
Procedurile de observare statistică în analiza fenomenelor şi proceselor pot fi
afectate de erori. Prelucrarea statistică a datelor experimentale prin calculele matematice
ce urmează a fi efectuate cu datele respective, contribuie cu o anumită cantitate de erori.
De aceea, specialiştii ştiu că atât erorile de observare statistică, cât si cele de
calcul, vor afecta rezultatele obţinute din prelucrarea şi interpretarea datelor experimentale.
Unii specialiști spun că exactitatea (acuratețea) este cu atât mai bună cu cât erorile
sistematice sunt mai mici, iar precizia este cu atât mai bună cu cât erorile întâmplâtoare
(aleatoare) sunt mai mici. Din aceste motive ne propunem să examinăm în această
secținue atât sursele de erori, cât şi modul în care acestea influenţează rezultatele finale.
62 MARIN VLADA

TIPURI DE ERORI

ERORI EXPERIMENTALE ERORI DE CALCUL NUMERIC

 ERORI GROSOLANE  ERORI INERENTE


 ERORI SISTEMATICE  ERORI DE METODĂ
 ERORI ALEATOARE  ERORI DE ROTUNJIRE

Fig. 32. Posibile tipurile de erori

Erorile se pot clasifica în două mari categorii:


1. erori experimentale – efectuarea masurărilor pot produce erori care au aceeaşi
mărime, când procesul de măsurare se efectuează în condiţii identice, sau erori
care au mărimi variabile, variaţia acestora fiind supusă unei anumite legi de
variaţie;
Erorile de măsurare se clasifică în:
- erori grosolane (greşeli): pot apărea din aplicarea unor metode de calcul
inexacte, din citiri eronate, din neatenţia sau lipsa de instruire a personalului;
aceste erori trebuie eliminate şi refăcute măsurările;
- erori sistematice: pot apărea din cauza unor caracteristici constructive ale
aparatelor, incorectei etalonări sau uzurii; pot fi erori produse de metoda de
măsurare sau erori produse de factori externi (erori de influenţă), deosebit de
greu de evaluat prin calcule, deoarece nu întotdeauna pot fi cunoscute cauzele
şi legile de variaţie în timp a condiţiilor de mediu (temperatură, presiune,
umiditate, câmpuri magnetice, radiaţii etc.);
- erori aleatoare (accidentale, întâmplătoare): pot apărea ca urmare a
diversităţii proceselor şi fenomenelor, precum şi a interacţiunilor
experimentului cu alte procese şi fenomene ce se desfăşoară simultan; nu este
posibilă depistarea şi înlăturarea lor, efectul global fiind producerea unor erori
aleatoare inevitabile, ce nu pot fi înlăturate din rezultatele măsurărilor;
2. erori de calcul numeric – interpretarea matematică a datelor reprezintă totalitatea
operaţiilor matematice ce trebuie efectuate pentru obţinerea unui anumit rezultat,
în vederea căruia au fost efectuate măsurările respective. În timpul efectuării
acestor calcule, pot interveni anumite erori ce se vor adăuga la erorile
experimentale, şi astfel valoarea măsurată să se abată şi mai mult faţă de
mărimea adevărată; se disting următoarele categorii de erori de calcul:
Statistică şi Informatică pentru chimie medicală şi farmaceutică 63

- erori inerente: pot apărea ca urmare a folosirii aproximative a unor valori


provenite din măsurări, a utilizării în calcule a numerelelor iraţionale
(, e, 2 ), sau ca urmare a calculelor aproximative (serii numerice) oferite de
calculatoarele numerice; trebuie specificat faptul că multe valori ale unor
funcţii obişnuite (sin, cos, lg, ln etc.) sunt obţinute prin calculul aproximativ al
valorii unor serii numerice;
- erori de metodă: analiza şi interpretarea datelor experimentale depind de
experienţa specialiştilor care efectuează prelucrarea datelor experimentale;
matematica, şi în special analiza numerică, oferă o multitudine de metode şi
tehnici de rezolvare a problemelor în acest caz; unele dintre aceste metode
sunt mai eficiente sau nu pentru un anumit caz, de aceea, alegerea metodei
este foarte importantă pentru rezultatul final, care se doreşte a fi obţinut cu o
anumită eroare de aproximare; de remarcat este faptul că determinarea
soluţiilor se realizează prin procese iterative, numărul de iteraţii determinând
eroarea de aproximare;
- erori de rotunjire: aceste erori sunt inevitabile deoarece depind de
posibilităţile limitate de reprezentare a numerelor în memoria calculatoarelor
numerice; orice calculator, indiferent cât de performant este construit, poate
reprezenta numerele cu un număr redus de cifre semnificative, depinzând de
lungimea cuvântului de memorie (numărul de biţi: 32 sau 64 biţi) utilizat la
stocarea unui număr; calculatoarele actuale oferă calcule pentru numerele
reale cu maxim 7 cifre semnificative, în simplă precizie, şi cu maxim 15 cifre
semnificative, în dublă precizie.

1.3.2 Termeni şi concepte despre erori

 Eroarea reală este definită ca diferenţa dintre valoarea reală (corectă) a unei
mărimi y şi valoarea măsurată (aproximativă) y a mărimii, adică y  y  y .
' '

'
În cazul în care y < y, mărimea respectivă este aproximată prin lipsă, altfel
aproximaţia este prin exces sau adaos.
 Eroarea absolută – uneori nu se cunoaşte semnul erorii y  y  y , de aceea se
'

foloseşte noţiunea de eroare absolută care este definită prin relaţia


y | y  y ' | .
 Eroarea relativă se defineşte ca raportul dintre eroarea absolută şi valoarea
absolută a mărimii exacte, adică

| y  y ' | y
y   .
| y| | y|

y
Eroarea relativă se poate exprima şi în procente, adică  y %  100[%].
| y|
64 MARIN VLADA

 Eroarea absolută limită – în cazul în care valoarea mărimii y nu este cunoscută,


se introduce noţiunea de eroare absolută limită  y corespunzătoare valorii
aproximative y ' ; valoarea acestei erori reprezintă cel mai mic număr pozitiv care
conţine una sau mai multe cifre semnificative, ales în aşa fel încât să putem fi
siguri că eroarea absolută comisă, în cazul respectiv, nu depăseşte acest
număr; prin urmare avem următoarea relaţie
y | y  y ' |  y , adică y '   y  y  y '   y , ceea ce înseamnă că
valoarea y poate fi aproximată prin lipsă, respectiv adaos;
 Incertitudine de măsurare (∆) reprezintă intervalul în care se estimează, cu o
anumită probabilitate, că se află valoarea adevărată a mărimii y;
 Eroarea convenţională - În realitate, valoarea adevărată a unei mărimi nu poate fi
cunoscută, de aceea este necesar să se adopte o valoare de referinţă, care are un
caracter convenţional. Se defineşte astfel eroarea convenţională ca diferenţa
dintre valoarea măsurată şi valoarea de referinţă admisă y conv , adică
yconv  yconv  y ' .

∆ interval incertitudine

∆y

O y' y y conv

Fig. 33. Erori de măsurare

Erori de trunchiere şi erori de rotunjire

Metodele numerice oferite de analiza matematică împreună cu implementarea


algoritmilor eficienţi din domeniul informaticii sunt utilizate cu succes la multe probleme
complexe din toate domeniile ştiinţifice, tehnice, economice etc. Cu toate acestea, trebuie
să se cunoască corect gradul de precizie privind obţinerea soluţiilor în aceste rezolvări de
probleme. Am văzut mai sus că varietatea şi combinarea diverselor erori (de măsurare, de
calcul, de aproximare, de rotunjire etc.), pot să conducă la rezultate ce nu răspund
exigenţelor practice. Acest lucru este şi mai complicat atunci când în diverse situaţii
(fizică, chimie etc.) trebuie să se realizeze calcule cu valori foarte mari, dar şi cu
zecimale foarte multe, care depăşesc performanţa calculatoarelor actuale (de exemplu,
aritmetica modală).
Calculele matematice şi operaţiile implementate în algoritmii de calcul pentru
calculatoarele numerice utilizează aproximarea cu serii numerice şi dezvoltarea funcţiilor
analitice prin descompunere de tip Taylor şi de tip Mac-Laurin. Dezvoltările în serii
numerice se utilizează la obţinerea rezultatelor cu mai multe zecimale exacte, şi anume,
se ţine seama de precizia dorită 10-p, unde p reprezintă numărul de zecimale exacte. De
exemplu, pentru calculul valorii ln2, cu p = 2 zecimale exacte, folosind dezvoltarea în
serie alternantă,
Statistică şi Informatică pentru chimie medicală şi farmaceutică 65


1
ln 2   (1)i1 ,
i 1 i
trebuie să se calculeze suma seriei până la n=99 (trunchiere de rang 99). În practică,
există alte reprezentări care sunt mai eficiente decât cazul n=99, şi anume trunchierea se
realizează la un rang mai mic. Exemplu: Calculul valorii sin(2) cu eroarea 10-7 este
0.909297. Folosind programul Excel se obţine valoarea 0.909297427, cu 9 zecimale
exacte şi valoarea 0.909297426825682, cu 15 zecimale exacte.
Programul Excel oferă pentru calcule şi reprezentarea valorilor reale următoarele formate:
 Number – decimal places, de exemplu 345.67845634322 cu p=11 zecimale
exacte;
 Scientific – forma exponenţială xE  nm , unde nm reprezintă exponentul lui
10, adică x10 nm , de exemplu 3.45678456343E+02;
 Fraction – forma fracţională de diverse tipuri, de exemplu 345 211/311.

Fig. 34. Fereastra „Format Cells”

O funcţie reală f : I  R derivabilă de o infinitate de ori în x 0  I  R este analitică


în punctul x 0 dacă există relaţia

f ( i ) ( x0 )
f ( x)  f ( x0 )   ( x  x0 ) i ,
i 1 i!
pentru  x  ( x 0   , x 0   )  I , unde   0 este un număr real dat.
Orice funcţie analitică se descompune în polinomul Taylor de ordinul n şi în
restul seriei Taylor de ordinul n, adică f ( x )  Tn ( x)  Rn ( x) , unde
66 MARIN VLADA

n
f ( i ) ( x0 )
Tn ( x)  f ( x0 )   ( x  x0 ) i ,
i 1 i!
şi restul de la rangul (n+1)

f ( i ) ( x0 )
Rn ( x )  
i  n 1 i!
( x  x0 ) i .

Restul seriei Taylor de ordinul n se poate reprezenta sub forma Lagrange, adică
f n 1 ( )
Rn ( x )  ( x  x 0 ) n 1 ,
(n  1)!
unde   ( x 0 , x ) sau   ( x , x0 ) .
Funcţiile elementare (sin, cos, ln etc.) sunt funcţii reale analitice ce au
proprietatea că restul seriei lui Taylor tinde la 0. Mai jos sunt exemple de dezvoltări de tip
Mac-Laurin pentru x 0  0 .
1 1 1 1
ln 2  1     ...  (1) n1  ...
2 3 4 n
2 n
x x x
e x  1    ...   ...
1! 2! n!
x 3
x 5
x 2 n1
sin x  x    ...  (1) n  ...
3! 5! (2n  1)!
x2 x4 x 2n
cos x  1    ...  (1) n  ...
2! 4! (2n)!
etc.

Reprezentarea în virgulă mobilă a numerelor reale

Calculatoarele actuale utilizează reprezentarea în virgulă mobilă a numerelor


reale. Dacă b este o bază de numeraţie (se presupune număr par) şi p este o precizie
(număr de cifre semnificative), atunci reprezentarea unui număr real în virgulă mobilă are
următoarea formă:
p 1
ck E
 (c 0   k
)b , cu cifrele semnificative
k 1 b
ck  0,1, ..., b  1, k  0,1, ..., p  1 ,
E fiind exponentul marginit E min  E  E max .
Statistică şi Informatică pentru chimie medicală şi farmaceutică 67

Tabelul de mai jos exemplifică cei patru parametri (baza, precizia, valorile limită
ale exponentului) ce caracterizează reprezentarea în virgulă mobilă în diverse sisteme
(IEEE-Institute of Electrical and Electronics Engineers):

Tabelul 1. Sisteme de reprezentare în virgulă mobilă


Sistem reprezentare Baza b Precizia p E E max
min
IEEE single-precission 2 24 −126 127
IEEE double-precission 2 53 −1022 1023
Cray 2 48 −16383 16384
Calculator HP 10 12 −499 499
Mainframe IBM 16 6 −64 63

Reprezentarea în virgulă mobilă în formă normalizată este reprezentarea unui


număr y sub forma
y  f b E , b 1  f  1 ,
unde f reprezintă mantisa, iar E exponentul.

Reprezentarea normalizată a numerelor reale are următoarele avantaje:


 reprezentarea fiecărui număr este unică;
 nu se pierd cifre pentru reprezentarea primele zerourilor de la dreapta virgulei;
 în sistemul binar (baza b=2) prima cifră poate să nu mai fie stocată (deoarece
este întotdeauna 1).

Un număr real cu mai multe cifre semnificative este rotunjit la numărul de cifre
maxim. Acest lucru se realizează prin rotunjirea mantisei. Alte rotunjiri se efectuează în
decursul operaţiilor. Aproximarea unui număr real cu cele două forme de reprezentare se
numeşte tehnica de rotunjire ce introduce eroarea de rotunjire. Există mai multe
modalităţi de rotunjire:
 trunchiere (rotunjire prin tăiere) – se reţin primele p cifre din reprezentarea
normalizată;
 rotunjire la cel mai apropiat număr în virgulă mobilă (rotunjire la valoare
pară) – forma în virgulă mobilă este cel mai apropiat număr de numărul
aproximat.
Rotunjirea la valoarea pară determină o acurateţe mai mare a reprezentării.
Acurateţea sistemului în virgulă mobilă este caracterizată de aşa-numita precizie a
maşinii  mach. Dacă regula de rotunjire este trunchierea, atunci  mach  b1 p , iar
dacă regula de rotunjire este rotunjirea la valoarea pară, atunci

1 1 p
 mach  b .
2
68 MARIN VLADA

Programul Excel oferă următoarele funcții: trunchiere la un număr întreg


TRUNC(număr, [num_cifre]); rotunzire la un număr specificat de cifre ROUND (număr,
num_cifre); prin adaugare ROUNDUP; prin lipsă ROUNDDOWN, la un anumit multiplu
MROUND.

1.4 Gândirea algoritmică – noi abordări de rezolvare


Există cazuri (chimie, fizică etc.) în care trebuie să se lucreze în calcule cu
numere foarte mari. În acest caz, trebuie să se cunoască foarte bine limitele oferite de
calculatoare privind reprezentarea numerelor şi modul de calcul pentru toate operaţiile. Pe
lângă teoriile (aritmetica modală) ce se ocupă de aceste aspecte, există diverse
implementări de algoritmi pentru astfel de situaţii. Un alt exemplu este lucrul cu tablouri
foarte mari de date (tablouri de tip masive). În acest caz este vorba de matricele rare.
Matricele rare îşi găsesc aplicabilitatea în modelarea unor procese biologice, neuronale,
de natură industrială, economică, tehnică, socială etc.

1.4.1 Puterile mari ale lui 2

a) Utilizarea programului Excel. (Puterile 2k, k > 30). Pentru k > 30 să se determine
numărul cifrelor şi cifrele puterii 2k (de exemplu, să se verifice că 2100 are 31 de cifre şi
2100 = 1267650600228229401496703205376 , iar 21000 are 302 cifre).

Evident, problema ar fi simplă dacă s-ar rezolva printr-o singură instrucţiune


scrisă într-un limbaj de programare. Acest lucru se poate realiza doar dacă ar exista
restricţia k < 31. Ţinând seama de reprezentarea tipului integer în memoria internă a
calculatorului, astăzi microprocesoarele şi limbajele de programare pot stoca/reprezenta
o valoare întreagă doar pe 4 bytes (32 biţi). Prin urmare 231−1 = 2147483647 este cea
mai mare valoare întreagă pe care o poate stoca. Este necesar să concepem un algoritm
pentru calculul puterilor 2k, k>30. Vom lua în consideraţie următorul tabel (generat
printr-un simplu program, sau folosind facilităţile unor programe de calcul, de exemplu
programul Excel inclus în pachetul Microsoft Office, versiunile 2003-2007; versiunea
2010 oferă precizie mai mare):

k 1 2 3 4 5 6 7 8 9 10 11 12 13 14
2k 2 4 8 16 32 64 128 256 512 1024 2048 4096 8192 16384

Folosind programul Excel (ce oferă funcţia Power şi operaţia de putere „^ “) se


poate constata că 236 = 68719476736 (dacă se utilizează pentru celule formatul
„General”) este puterea maximă ce se poate calcula, şi 249 = 562949953421312 (dacă se
utilizează pentru celule formatul „Number” cu 0 zecimale) este puterea maximă ce se
poate calcula.

În tabelul de mai jos avem următoarele concluzii (se folosește formula =2^k sau
functia =POWER(2,k)):
Statistică şi Informatică pentru chimie medicală şi farmaceutică 69

Pentru k=50 rezultatele sunt eronate (versiunea Excel 2010 oferă precizie mai
mare, în acest caz), şi anume se poate observa că ultimele cifre din dreapta sunt eronate:
pentru k=50, prima cifra din dreapta, pentru k=51, ultimele 2 cifre, s.a.m.d. Rezultate
corecte calculate cu Web 2.0 scientific calculator (http://web2.0calc.com/):

250= 1125899906842624 și 251 = 2251799813685248.

Tabelul 2. Puterile lui 2 calculate programul Excel


k= 1 2 k = 28 268435456
2 4 29 536870912
3 8 30 1073741824
4 16 31 2147483648
5 32 32 4294967296
6 64 33 8589934592
7 128 34 17179869184
8 256 35 34359738368
9 512 36 68719476736
10 1024 37 EROARE 1.37439E+11
11 2048 38 2.74878E+11
12 4096 39 5.49756E+11
13 8192 40 1.09951E+12
14 16384
… …
15 32768
16 65536 Corect
17 131072 49 562949953421312
18 262144 50 1125899906842620
19 524288 51 2251799813685250
20 1048576 52 4503599627370500
21 2097152 53 9007199254740990
22 4194304 54 18014398509482000
23 8388608 55 36028797018964000
24 16777216 56 72057594037927900
25 33554432 57 144115188075856000
26 67108864 58 288230376151712000
27 134217728

Rezultate eronate !
268435456
536870912
b) Utilizarea programului online Web 2.0 (scientific calculator) 1073741824

Astăzi, nu este nevoie să se apeleze frecvent la algoritmi de calcul care să


utilizeze un limbaj de programare (C++, Java, Visual Basic etc.), deoarece până în
prezent s-a dezvoltat foarte mult piaţa sistemelor de programe specializate, ce au
70 MARIN VLADA

programe eficiente şi comode pentru a fi utilizate de elevi, studenți, specialişti. De altfel,


dezvoltarea tehnologiilor Web a făcut posibilă apariţia unui număr foarte mare de
programe specializate pentru calcule și reprezentări grafice. Un astfel de program este dat
de site-ul http://web2.0calc.com/ ce are un Web 2.0 Scientific Calculator. Rezultate
obţinute prin utilizarea acestui program:

2100=1267650600228229401496703205376
2300=20370359763344860862684456884093781610514683936659362506361404493543
81299763336706183397376

Fig. 35. Pagina Web http://web2.0calc.com/

Observaţie: programul lucrează cu 14 zecimale exacte!


 = 3.14159265358979, e = 2.71828182845905 (reprezentare cu 14 zecimale exacte)

Acest program se poate utiliza pentru obţinerea diverselor calcule matematice şi


inginereşti (cu utilizarea unităţilor de măsura: Units), rezolvarea de ecuaţii (Solve),
operaţii cu matrice (Matrix), reprezentarea grafică a funcţiilor (Draw, Plot) etc.

c) Utilizarea platformei https://www.wolframalpha.com

Platforma pune la dispoziție, prin accesarea https://www.wolframalpha.com/


examples/, o varietate de calcule și reprezentări grafice pentru următoarele domenii
științifice:

Mathematics, Statistics & Data analysis, Chemistry, Phsics, Astronomy, Engineering,


Computation Sciences, Web & Computer Sciences, Heath & Medicine, Materials, Life
Sciences, Transportist, Words & Linguistics, People & History, Art & Disign, Music,
Statistică şi Informatică pentru chimie medicală şi farmaceutică 71

Places & Geography, Earth sciences, Weather & Meteorology, Technological World,
Educational etc.
Prin accesarea adresei https://www.wolframalpha.com/examples/Math.html și
prin indicarea calculului 2^1000, platforma calculează valoarea și indică cele 302 cifre.

Fig. 36. Calculul 2^100 folosind platforma www.wolframalpha.com/examples/Math.html

Exemplul. Reprezentarea grafică a funcţiilor

În funcţie de metoda utilizată de programul specializat, şi funcţie de


complexitatea unei funcţii, pot apărea erori frecvente în astfel de situaţii. Aceste erori pot
apărea în primul rând din cauza neînţelegerii noţiunilor matematice despre funcţii sau ca
urmare a unei slabe experienţe în acest tip de probleme. Vom realiza acest lucru printr-un
simplu exemplu.

Să presupunem că trebuie să se reprezinte grafic funcţia f(x) = x*sin (x), unde x


aparţine intervalului [–50,50]. Evident, funcţia este o compunere de funcţii, o dreaptă şi o
sinusoidă. Metoda matematică învăţată de elevi la liceu nu este chiar comodă în acest caz.
Nici nu se recomandă să se utilizeze procedura rezultată din metoda matematică.
72 MARIN VLADA

Astăzi, nici studentul de anul I nu se mai gândeşte la metoda matematică. Ştie şi


intuieşte că sunt foarte multe programe care oferă posibilitatea reprezentării grafice a
funcţiilor. Problema este aceea a alegerii unui astfel de program ţinând seama de licenţa
de utilizare şi funcţiile acelui produs software. Majoritatea programelor ştiinţifice (2D și
3D) au această posibilitate.

a) cazul programului Excel

Pentru testarea modului de a utiliza programul Excel în cazul reprezentării grafice


a funcţiilor, considerăm ca exemplu funcția g(x)=sin(x) pe intervalul [-10, 10].
Pentru test, să considerăm că graficul trebuie obţinut pe intervalul [0,10]. Primul
lucru, care se realizează rapid şi fără să se intuiască eroarea, se generează valorile
naturale 1, 2, 3, ... , 10 pentru argumentul x. Evident că va rezulta graficul unei linii
poligonale şi nu graficul real al funcţiei sin(x), după cum se vede din graficul de mai sus.

1.50000

1.00000

0.50000

0.00000 Series1
1 3 5 7 9 11 13 15 17 19 21 23 25 27 29 31

-0.50000

-1.00000

-1.50000

Fig. 37. Reprezentarea grafică greșită a functiei sin(x)

Eroarea provine de la faptul ca trebuie să se realizeze discretizarea intervalului


(tabelarea funcţie cu un pas cât mai mic p= 10-1, 10-2 etc. ce are legatură cu funcţia
studiată; afișajul grafic trebuie să “cuprindă” convexităţile şi cancavităţile graficului). În
cazul funcţiei sin(x) este suficientă discretizarea cu pasul p= 10-1, dar tabelarea va
produce 10x10 = 100 puncte pe axa pozitivă şi tot atâtea pe axa negativă. E nevoie să se
genereze tabelarea funcţiei, și apoi se poate trece la realizarea graficului f(x) = x*sin (x),
pe intervalul [–10,10]. Va rezulta graficul corect,care este mai fidel şi mai realist.

Tabelarea funcţiei. Discretizare și Calculul integral. Rezoluţie

Sistemul de diviziuni (proces de discretizare) din calculul integral este analog


rezoluţiei (matricea de pixeli; un „pixel” este unitatea grafică indivizibilă a unui display
grafic-device) dată de un display grafic (CRT sau LCD). Această structură de pixeli
reprezintă în informatică ceea ce reprezintă calculul integral în analiza matematică
Statistică şi Informatică pentru chimie medicală şi farmaceutică 73

(Newton, Riemann, Darboux, Leibniz etc.). Cu cât rezolutia este mai mare cu atât
reprezentarea este de calitate mai bună. Mai jos, este rezoluţia dată de un ecran grafic.
Display Properties  Screen Resolution: Less-800x600 pixels, More-1680x1050 pixels.
Odată cu apariţia display-ului grafic (Graphic Display) în anul 1953, s-a trecut la
o nouă etapă în dezvoltarea şi răspândirea calculatorului. Utilizarea bit-ului prin
organizarea eficientă a memoriei calculatorului, nu oferea posibilitatea de modelare
spaţială a işirilor (OUTPUT), nici prin hardware, nici prin software. Reprezentările
grafice folosind caractere (numerice sau alfanumerice) nu era o soluţie care să realizeze o
reprezentare fidelă a obiectelor reale. Suportul hardware fiind inventat, în perioada
1960-1980 au fost nevoie de cercetări şi experimente, modele, algoritmi si programe care
să foloseacă aprinderea unui „pixel” (unitatea grafică indivizibilă oferită de un display
grafic) ce oferea şi culoare, dar mai ales o structură de reprezentare grafică. Atunci, s-a
născut Grafica pe calculator: trasarea unui segment de dreaptă (algoritmul Bresenham),
trasarea cercului şi elipsei, trasarea şi aproximarea curbelor, algoritmi de decupare
(clipping) (algoritmul Cohen – Sutherland, algoritmul Suitherland-Hodgman, algoritmul
Weiler- Atherton), tehnici de vizualizare 2D şi 3D, modele de iluminare şi reflexie,
modele de tip rastru, modele vectoriale, tehnici de textură. Astfel, s-au pus bazele pentru
soluţii integrate software şi hardware pentru proiectare, analiză şi producţie asistată de
calculator (CAD) – Computer Aided Design. După anul 1990, s-au obţinut rezultate
deosebite în domeniul modelării şi simulării obiectelor din lumea reală, atât prin
elaborarea de tehnici şi algoritmi specifici, cât și prin apariţia produselor software care să
sprijine acest domeniu. Astfel, Realitatea Virtuală (Virtual Reality) este un nou domeniu
al Informaticii, ce are un impact deosebit în utilizarea calculatorului pe scară largă şi
pentru o diversitate mare de teme.

b) cazul programului online Web 2.0 scientific calculator


Se accesează adresa programului, https://web2.0calc.com/ şi se va urmări ce pune
la dispozișie programul pentru ca graficul să fie executat corect.

Fig. 38. Meniul programului Web 2.0 scientific calculator


74 MARIN VLADA

Se accesează adresa programului ce oferă fereastra pentru reprezentarea grafică


a mai multor funcții, în același sistem de coordonate.
Atenție! E nevoie să se valideze opțiunea „Rad” pentru ca argumentul funcției să
fie în radiani (valori reale). Se accesează „draw graph” din partea dreapta-jos, ce oferă
fereastra pentru reprezentarea grafică, după care se indică: expresia analitică a funcției (în
variabila x), limitele intervalului pentru x (xmin, xmax), respectiv limitele valorilor funcției
pe acest interval (ymin, ymax). Se acționează tasta „Enter” după ce apare graficul și se pot
utiliza butoanele ce oferă schimbarea diviziunilor pentru cele două axe, sau se poate
realiza Zoom.

Fig. 39. Grafic obținut cu Web 2.0 scientific calculator

c) cazul platformei www.wolframalpha.com

Cu această platformă se pot realiza reprezentări grafice, dar în același timp (prin
acționarea link-ului „Compute”) se realizează calculul integralei corespunzător funcției
indicate și descrierea funcției sub formă de serie Taylor. Se va accesa adresa
https://www.wolframalpha.com/examples/PlottingAndGraphics.html și, în caseta pentru
comanda privind funcția analizată, se pot opta pentru următoarele variante:
1. plot x*sin(x) from x=−50 to 50, cu indicarea intervalului;
2. plot (x*sin(x), x=−50..50), cu indicarea intervalului;
3. plot x*sin(x), fără indicarea intervalului.

În cazul primelor două variante, când sunt indicate limitele intervalului de


definiție, programul calculeaza și integrala pe acest interval, așa cum se vede în figura 40.
În cazul variantei 3, platforma oferă două variante de grafice, pe un interval mai mic, și
pe un interval mai mare. De exemplu, pentru funcția f(x) = xsin(x), platforma realizează
două grafice, unul pe intervalul [−6.3 , 6.3], iar altul pe intervalul [−37.7, 37.7].
Statistică şi Informatică pentru chimie medicală şi farmaceutică 75

Fig. 40. Grafic cu www.wolframalpha.com/examples/PlottingAndGraphics.html

Se pot reprezenta și funcții de


două variabile (suprafețe în 3D).

De exemplu, pentru funcția

f(x,y)=xsin(y),

suprafața reprezentată apare în figura


alăturată.
76 MARIN VLADA

Fig. 41. Grafic obținut cu varianta 3

Fig. 42. Seria Taylor pentru funcția f(x) = xsin(x)


Statistică şi Informatică pentru chimie medicală şi farmaceutică 77

d) cazul programului http://www.mathe-fa.de

Fig. 43. Meniul și graficul realizat cu www.mathe-fa.de (D.Schmidt-Loebe)


78 MARIN VLADA

1.4.2 Rezolvarea problemei lui Gauss

Problema lui Gauss. Un vas conţine 2000 litri dintr-un lichid cu o concetraţie de 80 %
alcool. În fiecare zi se scot din vas 15 litri şi se înlocuiesc cu alţi 12 litri dintr-un lichid
a cărui concentraţie în alcool este de numai 40 %. După câte zile concentraţia lichidului
din vas ajunge la 50 % ?

În cele ce urmează vom aborda 3 variante de rezolvări ale problemei pentru a


evidenţia atât evoluţia metodelor şi tehnicilor de rezolvare (teorii şi metode numerice),
cât şi obstacole în utilizarea diverselor metode (de exemplu, problema propagării
erorilor în calcule):
1. Modelarea matematică-metoda matematică – modelarea matematică va
reprezenta o ecuaţie funcţională ce se poate aborda ca o ecuaţie funcţională cu
diferenţe finite de ordinul I neomogenă;
2. Algoritm de calcul-program într-un limbaj de programare – conceperea
procesului de calcul ce realizează un proces iterativ al operaţiilor pentru
rezolvarea problemei;
3. Rezolvare cu programul Excel – se vor utiliza facilităţile programului Excel şi
forma algoritmică dată de metoda algoritmică.

Modelarea matematică şi Metoda algoritmică.

Problema este prezentată în [1] și aparent enunţul ei este al unei probleme


simple, dar interesantă din punctul de vedere al rezolvării ei, deoarece problema a fost
menţionată la vremea respectivă chiar de GAUSS. În [2] apare rezolvarea problemei cu
calculatorul. Rezolvarea problemei nu este evidentă, după cum se va vedea în cele ce
urmează. Din punct de vedere matematic, rezolvarea necesită noţiuni şi concepte de
matematică superioară din domeniul ecuaţiilor funcţionale, şi anume a ecuaţiilor cu
diferenţe finite de ordinul I neomogene. În două articole ştiinţifice, problema a fost
rezolvată de către W. Lorey (1935) şi A. Walther (1936). Din punct de vedere numeric,
rezolvarea problemei necesită cunoaşterea metodelor numerice specifice rezolvării
ecuaţiilor cu diferenţe finite. De altfel, W. Lorey a şi utilizat o maşină de calcul pentru
rezolvarea numerică a unei ecuaţii cu diferenţe finite, aceasta deoarece a sesizat faptul că
soluţia se obţine după un număr considerabil de iteraţii.
Din punct de vedere informatic, rezolvarea va fi simplă, deoarece nu se va utiliza
modelul matematic (ecuaţia funcţională) obţinut din modelarea analitică a problemei, ci
un proces de calcul care simulează operaţiile şi stările unor locaţii de memorie (acesta
este de fapt algoritmul care codifică rezolvarea problemei), şi care, implementat într-un
limbaj de programare (de exemplu C sau Pascal), va rezolva problema în cazul general.
Pentru a face comparaţia între soluţia algoritmică obţinută pentru calculator şi soluţia
analitică, prezentăm succint rezolvarea dată de W. Lorey. Vom considera problema în
cazul general, de accea vom face următoarele notaţii:

a - cantitatea de lichid (în litri) conţinută iniţial în vas;

b - cantitatea de lichid ce se scoate zilnic din vas;


Statistică şi Informatică pentru chimie medicală şi farmaceutică 79

c - cantitatea de lichid ce se adaugă zilnic în vas;

y0 - cantitatea de alcool pe litru (concentraţia de alcool) a lichidului din vas la


momentul iniţial;

yp - cantitatea de alcool pe litru a lichidului ce se adaugă;

yf - cantitatea de alcool pe litru a lichidului din vas, la momentul final;

x - numărul de zile (operaţii de înlocuire a lichidului);

y(x) - cantitatea de alcool pe litru a lichidului din vas după x operaţii de înlocuire
a lichidului.

Ecuaţia funcţională (ecuaţia cu diferenţe finite) pentru determinarea funcţiei y(x), se


obţine exprimând cantitatea totală de alcool din vas după x zile, în două moduri :

i) (a - bx + cx ) y(x)

ii) (a - bx + c(x-1) ) y(x-1) + c yp,

unde cazul ii) se obţine adunând cantitatea de alcool din lichidul rămas în vas după (x-1)
zile, din care s-au scot b litri, cu cantitatea de alcool a celor c litri care se adaugă.

Prin urmare, se obţine următoarea ecuaţie funcţională:

(1) (a - bx + cx) y(x) - (a - bx + c(x-1)) y(x-1) = c yp , ecuaţie cu diferenţe


finite de ordinul I neomogenă.

Rezolvarea acestei ecuaţii este prezentată în [1], soluţia generală fiind

 a b  a 
     x
bc  bc
y ( x)  y0  ( y0  y p )   , ( x)   et t x 1dt ,
0
 a  ac 
     x
bc bc 

unde (x) este funcţia lui Euler.

În cazul particular a=2000, b=15, c=12, y0=0,8, yp=0,4, y(x) este un polinom de
gradul IV:
 3x   3x   3x   3x 
y ( x)  0,4  0,4  1    1    1    1  ,
 1988   1991   1994   1997 
80 MARIN VLADA

de unde, prin aproximare se deduce că y(194) = 0,50048, y(195) = 0,49963, prin urmare,
după x=195 zile se ajunge la concentraţia de 0,5.

Metoda algoritmică - proces de calcul şi codul algoritmului

În cazul rezolvării algoritmice, vom abandona metoda obţinerii ecuaţiei


funcţionale şi rezolvarea ei analitică sau numerică, şi vom concepe algoritmul ce
realizează procesul de calcul generat de cerinţele problemei.
Pe lângă variabilele x, a, b, c, yp, yf cu semnificaţiile prezentate mai sus, vom
utiliza şi următoarele variabile:
z – cantitatea de alcool din vas la un moment dat;
t – cantitatea de lichid din vas la un moment dat;
y0 – concentraţia de alcool din vas la un moment dat.

Algoritmul în limbaj pseudo-cod este următorul:

algorithm Gauss;
int x;
float a,b,c,y0,yp,yf,z,t;

begin // main
read a,b,c ; // cantităţi de lichid
read y0,yp,yf; //concentraţii
// initializations
x1; z(a-b)*y0+c*yp;
ta-b+c
while yf < z/t do
begin
xx+1;
y0 z/t; //concentraţie
z(t-b)*y0+c*yp;
tt-b+c;
end
write x; // soluţia
end

Prin execuţia programului de mai sus (în limbaj de programare C, Pascal etc.),
pentru valorile b=15, c=12, y0 (iniţial) = 0,8, yp= 0,4, yf = 0,5 se obţin următoarele
rezultate:

a = 2000, yf = 0,5004515, x(zile) = 195


a = 5000, yf = 0,5001438, x(zile) = 488
Statistică şi Informatică pentru chimie medicală şi farmaceutică 81

a = 10000, yf = 0,5000983, x(zile) = 976


a = 100000, yf = 0,5000064, x(zile) = 9763

Referinţe
[1] Gabriel Sudan, Câteva probleme matematice interesante, Biblioteca SSM, Editura Tehnică,
Bucureşti, 1969.
[2] Marin Vlada, O problemă a lui K.F. Gauss rezolvată cu calculatorul, Gazeta Matematică,
nr. 5/1995.

Rezolvare cu programul Excel

Pentru a realiza în Excel calculul iterativ din algoritmul de mai sus, vom
introduce mai înainte, în celulele corespunzătoare, valorile datelor cunoscute:

a b c y0 yp yf
2000.000 15.000 12.000 0.800 0.400 0.500

Calculul iterativ şi valorile parametrilor/variabilelor acestui calcul trebuie să fie


implementate într-un tabel de forma:

x ycurent z t
0 0.800 1600.000 2000.000
1 0.800 1592.800 1997.000
2 0.798 1585.636 1994.000
3 0.795 1578.508 1991.000

Deoarece în algorimul de calcul precedent variabila y0 este folosită şi pentru


concentraţia de alcool din vas la un moment iniţial, dar şi pentru concentraţia de alcool
din vas la un moment curent, vom introduce variabila:
- ycurent = concentraţia de alcool din vas la un moment curent.
Din aceste motive, trebuie să implementăm în Excel un calcul iterativ de forma:

while yf < z/t do


begin
xx+1;
ycurent z/t; //concentraţia
z(t-b)*ycurent+c*yp;
tt-b+c;
end

Trebuie să se realizeze următoarele etape (capul de tabel este pe rândul 6):


1. se generează cu Edit  Fill valorile pentru variabila (număr de zile) x:
0..200 pe coloana A corespunzătoare acesteia, şi anume pe rândurile 7-207;
82 MARIN VLADA

2. se introduc valorile pentru starea iniţială (x=0), adică pentru ycurent, în B7


valoare 0.800, pentru z în C7 formula =A$4*D$4, iar pentru t, în celula D7,
valoarea 2000;
3. se introduc formulele pentru prima iteraţie (x=1) ţinând seama de calcul
iterativ de mai sus (a se vedea imaginea capturată din programul Excel), şi
anume,
- pentru ycurent, B8= =C7/D7
- pentru z, C8 =(D7-B$4)*B8+C$4*E$4
- pentru t, D8 =D7-B$4+C$4.
4. se generează formulele (prin Copy sub Excel) pentru iteraţiile x= 2..200,
adică se selectează domeniul de celule B8:D8, se eliberează butonul de
mouse, după care se aduce cursorul cruce (mare) al mouse-lui către colţul
dreapta-jos al cadrului, care a selectat domeniul de celule, determinând
apariţia cursorului de cruce mică; după aceea se apasă butonul din stânga şi
se trage până la rândul 207 (x=200), realizându-se astfel calcule
corespunzătoare pentru cele 3 coloane din tabel.

Fig. 44. Rezolvarea problemei lui Gauss folosind programul Excel

Valorile generate de calculul iterativ sunt prezentate în continuare. Concluzia este


că soluţia în acest caz este x=195, adică identică cu soluţia determinată prin algoritmul/
programul precedent.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 83

Tabelul 3. Tabelul valorilor obținute prin calculul iterativ


0 0.800 1600.000 2000.000 9 0.781 1536.484 1973.000
1 0.800 1592.800 1997.000 10 0.779 1529.603 1970.000
2 0.798 1585.636 1994.000 11 0.776 1522.756 1967.000
3 0.795 1578.508 1991.000 12 0.774 1515.944 1964.000
4 0.793 1571.416 1988.000 13 0.772 1509.166 1961.000
5 0.790 1564.359 1985.000 14 0.770 1502.422 1958.000
6 0.788 1557.338 1982.000 15 0.767 1495.712 1955.000
7 0.786 1550.351 1979.000 16 0.765 1489.036 1952.000
8 0.783 1543.400 1976.000 17 0.763 1482.394 1949.000

182 0.512 743.148 1454.000


183 0.511 740.282 1451.000
184 0.510 737.429 1448.000
185 0.509 734.590 1445.000
186 0.508 731.764 1442.000
187 0.507 728.952 1439.000
188 0.507 726.154 1436.000
189 0.506 723.369 1433.000
190 0.505 720.597 1430.000
191 0.504 717.838 1427.000
192 0.503 715.092 1424.000
193 0.502 712.360 1421.000
194 0.501 709.640 1418.000
195 0.500 706.934 1415.000
196 0.500 704.240 1412.000
197 0.499 701.558 1409.000
198 0.498 698.890 1406.000
199 0.497 696.233 1403.000
200 0.496 693.590 1400.000
Soluţia corectă!

Concluzii
Din analiza celor 3 rezolvări ale problemei lui Gauss se poate exprima concluzia
că metoda matematică (rezolvarea unei ecuaţii funcţionale) este laborioasă şi incomodă,
iar metoda algoritmică susţinută de un program scris într-un limbaj de programare este
cea mai comodă şi eficientă.
De asemenea, rezolvarea folosind facilităţile programului Excel este comodă şi
eficientă, în primul rând pentru că se bazează pe procesul de calcul iterativ din metoda
algoritmică. Incoveniențele (eliminate în cazul programului scris într-un limbaj de
programare) apar atunci când în vas cantitatea de lichid este foarte mare (5000, 10000
etc.), caz în care tabelul de calcul necesită dimensiuni mari. Mai jos, vom exemplifica
84 MARIN VLADA

printr-o situaţie, modul în care propagarea erorilor poate denatura obţinerea rezultatului
corect în cazul acestei probleme.

Exemplu privind propagarea erorilor

Pentru cantitatea de lichid de 2000 litri, numărul de iteraţii este considerabil


(x=195, soluţia) şi astfel, aceste iterații pot determina un proces de propagare a erorilor.
Astfel, formula variabilei/parametrului z din algoritmul de calcul utilizează valoarea
concentraţiei de la pasul precedent,
z(t-b)*ycurent + c*yp .
Vom modifica formula astfel ca să se utilizeze valoare concentraţiei la momentul
curent, adică formula C8 = (D7-B$4)*B8+C$4*E$4 va fi modificată astfel:
C8 = (D7-B$4)*B7+C$4*E$4.
În urma refacerii calculelor obţinem rezultatele de mai jos.

Tabelul 4. Tabelul valorilor obținute prin calculul iterativ

x ycurent z t 186 0.607 875.596 1442.000


0 0.800 1600.000 2000.000 187 0.607 871.634 1439.000
1 0.800 1592.800 1997.000 188 0.606 869.466 1436.000
2 0.798 1590.400 1994.000 189 0.605 865.531 1433.000
3 0.798 1583.243 1991.000 190 0.604 863.367 1430.000
4 0.795 1580.843 1988.000 191 0.604 859.459 1427.000
5 0.795 1573.730 1985.000 192 0.602 857.300 1424.000
6 0.793 1571.330 1982.000 193 0.602 853.418 1421.000
7 0.793 1564.259 1979.000 194 0.601 851.263 1418.000
8 0.790 1561.859 1976.000 195 0.600 847.408 1415.000
9 0.790 1554.831 1973.000 196 0.599 845.257 1412.000
10 0.788 1552.432 1970.000 197 0.599 841.428 1409.000
11 0.788 1545.446 1967.000 198 0.597 839.282 1406.000
12 0.786 1543.047 1964.000 199 0.597 835.479 1403.000
200 0.595 833.337 1400.000

Rezultate eronate !

În acest caz, soluţia are valoare mai mare decât valoarea corectă. O implementare
greșită a influenţat propagarea erorilor și obţinerea unor rezultate eronate. Evident,
numărul mai mare de iterații a condus la astfel de rezultate.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 85

2
Prelucrarea,
reprezentarea și
interpretarea datelor

2.1 Seturi de date și indicatori statistici

Indicatorii statistici sunt definiţi pentru a surprinde (a analiza) variaţii de


manifestare a unor valori măsurate pentru fenomene şi procese, şi care necesită elaborarea
unor metodologii şi tehnici de rafinare, transformare şi aplicare a unor operaţii speciale de
calcul pentru obţinerea unor determinări cantitativ-numerice. Indicatorul statistic, în
forma sa generală, este expresia numerică a manifestărilor unor fenomene, procese,
activităţi sau categorii economice şi sociale, delimitate în timp, spaţiu. Pentru cunoaşterea
proceselor şi fenomenelor, indicatorii statistici îndeplinesc mai multe funcţii şi anume: de
măsurare; de comparare; de analiză sau de sinteză; de estimare; de verificare a
ipotezelor şi/sau de testare a semnificaţiei parametrilor utilizaţi.
Indicatorii statistici se pot grupa în:
 Indicatori primari (mărimi absolute) – exprimă direct valori inițiale (măsurări)
pentru obiectivele cercetate; se pot obţine prin înregistrarea directă, centralizarea
datelor sau prin însumarea parţială sau totală a datelor individuale; prezintă o
capacitate relativ limitată de descriere a fenomenului/procesului analizat, şi nu
permite realizarea unor aprecieri calitative;
86 MARIN VLADA

 Indicatori derivaţi – se obţin prin prelucrarea indicatorilor primari şi fac posibilă


analiza aspectelor calitative ale fenomenelor şi proceselor analizate (ex: mărimi
relative, mărimi medii, indicatori ai variaţiei, indici, indicatori ai corelaţiei etc).

Indicatorii tendinţei centrale

În general, indicatorii tendinţei centrale se determină ca indicatori medii sau


indicatori de poziţie (de localizare), în funcţie de natura caracteristicilor urmărite în
colectivitatea investigată, de scopul investigaţiei. Sunt multe situaţiile când tendinţa
centrală se caracterizează printr-un anumit tip de medie (aritmetică, armonică, pătratică,
geometrică), dar şi situaţii de utilizare a indicatorilor sintetici de poziţie (localizare:
modul, cuantile).

Diverse tipuri de medii ale valorilor primare (seturilor de date):


 Media aritmetică – În sens statistic, media aritmetică a valorilor individuale
(x1, x2, …, xn) ale variabilei / parametrului X = (x1, x2, …, xn) reprezintă acea
valoare x care s-ar fi înregistrat dacă toţi factorii de influenţă ar fi acţionat
constant (cu aceeaşi intensitate) la nivelul fiecărei valori măsurare/înregistrare.
Prin urmare,
n

x  x2  ...  xn x i
x 1 , sau x  i 1
, şi avem min xi  x  max xi .
n n i i

 Media ponderată – Într-o colectivitate statistică, suficient de mare (n valoare


mare), unde de obicei, multe valori prezintă o anumită frecvenţă de apariţie,
media aritmetică se calculează ca o medie ponderată:
n

fx i i n
x i 1

n
, unde fi reprezintă frecvenţa valorii xi, şi avem f
i 1
i  n.

 Media armonică – Media armonică este folosită numai în anumite situaţii, şi


anume, atunci când valorile/seturile de date sunt alcătuite din valori exprimate
sub formă de rapoarte, cum ar fi preţurile, vitezele (în mp/h), preţurile (în
u.m./kg), sau productivitatea (produse/oră-om). Media armonică se defineşte ca
valoare inversă a mediei aritmetice a inverselor valorilor elementelor individuale
înregistrate; relaţia de calcul a mediei armonice simple a şirului de valori
X = (x1, x2, …, xn) este următoarea:
n
ma  n
;
1

i 1 x i
Pentru o serie de distribuţii de frecvenţe, media armonică ponderată se calculează
după relaţia:
Statistică şi Informatică pentru chimie medicală şi farmaceutică 87

f i
ma  n
i 1
,
1

i 1 xi
fi

 Media geometrică – Media geometrică este o mărime specializată, folosită pentru


a calcula media creşterilor procentuale (media creşterilor procentuale a salariilor
sau preţurilor bunurilor). Media geometrică reprezintă acea valoare a
caracteristicii observate care, dacă ar înlocui fiecare valoare individuală din serie,
produsul acestora nu s-ar modifica, adică
1
 n n
m g   xi 
 i 1  .
Indicatori de poziţie

Indicatorii de poziţie calculează şi se identifică în cadrul unui set de valori cu câte


o variantă reală, care posedă o anume proprietate, conform căreia respectiva variantă
oferă o informaţie satisfăcătoare despre setul de valori studiat:

 Mediana (Median) – aceasta


reprezintă valoarea centrală a
unei serii de date aranjate
crescător sau descrescător, şi are
proprietatea că împarte seria în 2
grupuri egale, astfel încât
jumătate dintre valori sunt mai
mici decât mediana şi jumătate
sunt mai mari decât mediana.
Este cuartila de mijloc,
cuartilele fiind valori care
împart seria în 4 grupe, sau este
percentila de mijloc, percentilele
fiind valori care împart seria în
10 grupe egale. Pentru o serie cu
număr impar de valori, valorile
seriei sunt în ordine crescătoare
şi valoarea care împarte seria în
două părţi egale este mediana. Valoarea de mijloc a unei distribuţii este definită
drept cel mai mic număr astfel încât jumătate dintre valori să nu fie mai mari
decât el. Cu alte cuvinte, jumătate dintre valori sunt mai mici sau egale cu
mediana, jumătate sunt mai mari decât mediana. De remarcat că, deşi este utilizat
în general ca un indicator de tendinţă centrală, mediana oferă mai degrabă
informaţii asupra repartizării observaţiilor (indicator de împrăştiere). De regulă,
mediana este raportată împreună cu quartilele distribuţiei în aşa-zisa rezumare
88 MARIN VLADA

prin cinci valori. Dacă x1, x2, . . . , xn sunt valorile observate, mediana este
calculată, după ordonarea crescătoare a valorilor, x(1) ≤ x(2) ≤ . . . ≤ x(n), astfel:

 xk 1 , N  2k  1
Me  
( xk  xk 1 ) / 2, N  2k

Este de notat că mediana realizează minimul sumei abaterilor absolute ale


n
valorilor distribuţiei de la un punct fixat: 
i 1
|xi – m| este minimă pentru m egală

cu mediana distribuţiei (în cazul unui număr par de valori, mediana – aşa cum a
fost definită – nu este singura valoare cu această proprietate). Programul Excel
are functia MEDIAN pentru calculul aceste valori. În pagina precedenta apare
fereastra Help pentru utilizarea acestei funcții.

Funcţia Excel: MEDIAN(number1, number2,...)

Number1, number2, ... are 1 to 30 numbers for which you want the median.

Exemplu: Median (18,19,20,21,22,23,24,25,26,27,28,29,30,31,32)=25 (număr


impar de valori); Median (18,19,20,21,22,23,24,25,26,27,28,29,30,31) = 24.5

 Modulul (Mode) – valoarea modală, adică dominanţa unei variabile, reprezintă


valoarea care înregistrează cea mai mare frecvenţă de apariţie. Valoarea modală
se utilizează ca indicator al tendinţei centrale atunci când media nu se poate
calcula sau nu are sens să fie calculată. Valoarea modulului este cea mai
frecventă valoare dintr-o mulţime de valori. Grafic, dintr-o histogramă, o valoare
modulului este identificată printr-un maxim relativ. O distribuţie poate avea
astfel, mai multe valori modul (distribuţii unimodale, bimodale etc.).

Funcţia Excel: MODE (number1,number2,...)

Number1, number2, ... are 1 to 30 arguments for which you want to calculate
the mode. You can also use a single array or a reference to an array instead of
arguments separated by commas.

Exemplu: Mode (18,19,20,21,22,20,24,20,26,27,20,29,30,31,32)=20,


Mode (18,19,20,18,22,18,24,25,26,27,18,29,30,31) = 18

Așadar, în programul Excel, funcţiile corespunzătoare parametrilor media


arimetică, mediana şi modulul sunt: AVERAGE, MEDIAN, MODE.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 89

Indicatori ai împrăştierii (variaţiei)

 Amplitudinea (Range) – sau indicele de dispersie (Dispersion indexes) – este


definită ca xmax–xmin, unde xmax şi xmin sunt valorile extreme ale unui set de numere
observate. Oferă o imagine a răspândirii datelor, dependentă însă de numărul de
valori observate. Cu cât se măsoară mai multe elemente, cu atât şansa de a
observa valori mai depărtate creşte, deci și şansa de a obţine o amplitudine mai
mare.
 Abaterea medie (Mean Deviation) – deviaţia sau abaterea medie reprezintă
media abaterilor valorilor individuale faţă de valoarea medie:

1 n
DM   | xi  x |
n i 1

 Abaterea standard (Standard Deviation – SD) este radical din media abaterilor
pătratice datelor individuale şi se calculează cu formula:
n n

 xi  x 2  x i  x
2

s i 1
,X  i 1
n 1 n
(în programul Excel este funcţia STDEV, pentru un eșantion sau STDEVP, pentru
o populație).
 Varianţa (Variance) sau dispersia este pătratul abaterii medii pătratice,
n n

 xi  x   x  x
2 2
i
V x   i 1
,  x2  i 1
n 1 n
(în Excel este funcţia VAR, pentru un eșantion sau VARP, pentru o populație).

 Intervalul de confidenţă (Confidence interval) – interval de încredere pentru


estimarea unui parametru (de exemplu, media, dispersia etc). În cazul unei
distribuţii normale, de tip Gauss (a se vedea capitolul 3):
a) x  x   , cu probabilitate de 0,682.
b) x  x  2 , cu probabilitate de 0,954.
c) x  x  3 , cu probabilitate de 0,997.

În programul Excel există funcţia CONFIDENCE (alpha,standard_dev,size),


Alpha is the significance level used to compute the confidence level. The confidence
level equals 100*(1 - alpha)%, or in other words, an alpha of 0.05 indicates a 95 percent
confidence level. Standard_dev is the population standard deviation for the data range
and is assumed to be known. Size is the sample size.
90 MARIN VLADA

2.2 Reprezentarea grafică a datelor


În matematică termenul/conceptul de funcție reprezintă relația dintre două seturi
de date (mulțimi de valori), un set de date semnificând domeniul de definiție, de exemplu
mulțimea A, și un set de date semnificând domeniul de valori (codomeniul), de exemplu
mulțimea B. În limbaj matematic, această relație se notează prin
f : A  B, unde A, B  R , iar ecuația/relația y=f(x) indică faptul că pentru
x  A  y  B , y este o valoare calculată printr-o expresie algebrică f(x), ceea ce
reprezintă corespondența dintre valorile x și y, adică x y. În studiul fenomenelor și
proceselor din diverse domenii (fizică, chimie, biologie, medicină, sociologie, economie
etc.), există o mare varietate de seturi de date, corespunzătoare mulțimilor A și B,
elementele acestora fiind marimi/valori ce au diverse unități de măsură.

Mulțimea T (timp) Mulțimea P (presiune)

T1 o P1 o
T2 o P2 o
… f …
x o y o
… y = f(x) …
Tn o Pn o

În programul Excel, reprezentarea acestei relații se realizează printr-un tabel


vertical (eventual orizontal).

Timp T1 T2 ... x ... Tn


Presiune P1 P2 ... y ... Pn

Exemplu.
Tabelul 5. Tabelul cu date ale unor persoanele
Nr. Vârsta Masa
Nume și prenume pacient
crt. [ani] corporală [kg]
1 Popescu Mihai 42 85,67
2 Iancu Stelian 56 90,70
3 Voicu Ion 67 88,90
4 Marinoiu Ștefan 80 92,45
5 Albescu Valeriu 37 78,67
Statistică şi Informatică pentru chimie medicală şi farmaceutică 91

Fig. 45. Diagrama „2D-Column” pentru variabila „Vârstă“

Se selectează coloana „Nume și prenume pacient”, apoi <Ctrl> și se selectează


coloana „Masa corporală”.

Fig. 46. Diagrama „2D-Column” pentru variabila „Masa corporală“

2.2.1 Prelucrări și reprezentări grafice în Excel

Facilități generale și specifice prelucrărilor de date: date numerice și nenumerice,


calcule numerice și prelucrări prin sortare numerică sau sortare text, reprezentări grafice
ale seturilor de date.
Bara de meniu: Home; Insert; Page Layout; Formulas; Data; Review; View
92 MARIN VLADA

Bara de instrumente – Meniul Home

Alignment (Wrap text, Merge & Center) Number (General, ...)

(partea dreaptă)

Cells (Insert, Delete, Format) AutoSum (Sum, More Functions) Fill Sort &Filter

Bara de instrumente - Meniul Insert

Table Picture Shapes Charts Text Box Object Symbol

Bara de instrumente - Meniul Formulas

Function Autosum More Functions Define Names

(partea dreaptă)
Statistică şi Informatică pentru chimie medicală şi farmaceutică 93

Formula Auditing Calculation

Bara de instrumente – Meniul Data

Get External Data Connections Sort & Filter


(partea dreaptă)

Data Tools Outline


Formatarea celulelor.
Meniul Format  Format Cells: Number; Allignment; Font; Border; Fill; Protection

Categorii Number: General, Number,


Currency, Accounting, Date, Time,
Percentage, Fraction, Scientific, Text,
Special, Custom.
94 MARIN VLADA

Categoria Currency

Categoria Percentage
Statistică şi Informatică pentru chimie medicală şi farmaceutică 95

Categoria Scientific

Categoria Custom
96 MARIN VLADA

Alignment
Text alignment
Text control: Wrap text;
Shrink to fit; Merger cells
Right-to-left
Orienttation

Tipuri de diagrame / grafice în Excel 2016, 2013, 2010, 2007

Programul Excel acceptă multe tipuri de diagrame, pentru a afișa datele în


diverse modalități, care să reprezinte ceva în interpretarea acestora: comparații de
mărimi, creșteri de mărimi, evoluția în timp a unor mărimi etc. Când se creează o
diagramă sau se modifică o diagramă existentă, există posibilitatea să se selecteze dintr-o
varietate de tipuri de diagrame (Exemplu: o diagramă coloană sau o diagramă radială) și
din subtipurile lor (Exemplu: o coloană stratificată sau o structură radială într-o diagramă
3-D). De asemenea, există posibilitatea să se creeze o combinație de diagrame, utilizând
mai multe tipuri de diagrame în diagramă: diagrame bidimensionale (2D) sau
tridimensionale (3D).

Prezentarea structurii/elementelor unei diagrame.

O diagramă are mai multe elemente în prezentare. Unele dintre aceste elemente
sunt afișate în mod implicit, altele pot fi adăugate după necesitate. Axistă posibilitatea să
se modifice afișarea elementelor diagramei mutându-le în alte locații din diagramă,
redimensionând sau modificând formatul. De asemenea, axistă posibilitatea să se elimine
elementele de diagramă. Folosind click-dublu pe suprafața diagramei, în bara de sus va
apărea meniul Design ce permite adăugarea/modificarea acestor elemente. Alegerea
structurii diagramei se face prin submeniul Chart Layouts:
Statistică şi Informatică pentru chimie medicală şi farmaceutică 97

Suprafața grafic Titlul diagramei Legenda

Etichete,
Valori mărimi

Titlul axa Y Diviziune axa Y Titlul axa X Diviziune axa Y


Fig. 47. Structura unei diagrame și Meniul Design

Chart Layouts:
Modele pentru
structura diagramei
98 MARIN VLADA

Pentru afișarea etichetelor de valori în grafic, se selectează obiectul reprezentat și


apoi se face click-dreapta, ce deschide fereastra în care apare Add Data Labels.

Fig. 48. Afișarea etichetelor folosind Add Data Labels

Fig. 49. Reprezentarea unei suprafețe


https://store.office.com/en-us/surface-chart-WA104380632.aspx
Statistică şi Informatică pentru chimie medicală şi farmaceutică 99

Varietatea tipurilor de diagrame/grafice oferite de programul Excel răspunde


diversității seturilor de date pentru diverse domenii (științific, tehnic, economic,
sociologic etc.), de unde provin aceste seturi de date. Trebuie să precizăm că, în funcție
de natura acestor seturi de date, este nevoie de o analiză înainte de a alege tipul de
diagramă ce trebuie utilizat, acesta să fie adecvat acestora. Sunt situații când tipul de
diagramă nu are sens să fie realizat pentru un anumit set de date. De exemplu, în ultimii
ani este disponibil tipul „Surface”, ce poate fi folosit de matematicieni, statisticieni,
ingineri, economiști etc., în reprezentarea suprafețelor în spațiul 3D (tridimensional,
XYZ). Suprafețele sunt exprimate de relația z=f(x,y), unde f: AxB  R, este o funcție de 2
variabile x și y, valoarea z fiind numită cotă. Evident, mai există și alte produse software
ce permit astfel de reprezentări ale suprafețelor în spațiul XYZ.

Pentru a descrie varietatea reprezentărilor seturilor de date, vom considera un


exemplu de set de date și vom verifica ce tip de diagramă/grafic este adecvat acestui set
de date. Vom descrie acele seturi de date pentru care este adecvat să se utilizeze tipurile
de grafice oferite de programul Excel.

Exemplu. Vânzări de medicamente pe cele 4 trimestre în anii 2014-2016.

Trimestru An 2014 An 2015 An 2016


Trim 1 2000 2200 2500
Trim 2 1600 2500 2200
Trim 3 1500 2100 2200
Trim 4 2400 2800 3000

Modele (Templates) Chart (diagrame/grafice):


1. Column (Coloană) – Un astfel de grafic este folosit pentru a arăta variaţia în timp
a unor mărimi discrete. Acest tip de diagramă utilizează bare verticale pentru a
reprezenta măsurări făcute la intervale de timp diferite. Graficele coloană sunt
folosite frecvent pentru compararea diferitelor elemente prin plasarea lor unele
lângă altele. Barele verticale pot fi înlocuite cu graficele de tip cilindru, con,
piramidă;
100 MARIN VLADA

Stacked Column
(Stiva)-se realizează
sumele mărimilor

2. Line (Linie) – Un astfel de grafic, la care intervalele de variație sunt egale, arată
evoluția unei mărimi. Dacă intervalele de variaţie sunt neegale, se va utiliza un
grafic (dispersat) de tip X Y (Scatter). Pentru fiecare serie de date, se obţine câte
o linie;

3. Pie (Sector) – Un astfel de grafic de tip sector (circular) evidenţiază mărimea


părţilor în raport cu întregul (sunt reprezentate procentele părților). Într-un
astfel de grafic, se poate reprezenta o singură serie de date. Pentru a scoate mai
bine în evidenţă valorile pe care le reprezintă, sectoarele din grafic pot fi scoase
în afara cercului;
Statistică şi Informatică pentru chimie medicală şi farmaceutică 101

Observație. În cazul diagramei de tip sector, dacă se selecteză toate coloanele, nu


se realizează graficul decât pentru datele anului 2014. Pentru a realiza diagrama
referitoare la datele anului 2015, se selectează prima coloană, se apasă <CTRL>, și apoi
se selectează coloana cu datele pentru anul 2015.

4. Bar (Bare) – Este utilizat pentru compararea mărimilor neconectate în timp.


Acest tip de grafic nu permite o imagine prea bună a evoluţiei în timp a unor
mărimi. Acesta utilizează bare orizontale pentru a arăta variaţia pozitivă sau
negativă faţă de un punct de referinţă. Barele aflate la stânga punctului de
referinţă arată o variaţie negativă, iar cele din dreapta arată o variaţie pozitivă;
102 MARIN VLADA

5. Area (Arie) – Un astfel de grafic ilustrează continua schimbare în volum a unor


serii de date. Acest tip de grafic însumează datele din toate seriile individuale
pentru a crea linia de vârf care cuprinde zona, oferind privitorului o imagine
asupra modului în care diferitele serii contribuie la volumul total. Exercitiu: Să se
utilizeze graficul „Area” pentru cifrele referitoare la vânzări şi la producţie,
pentru a arăta modul în care volumul se modifică în timp şi pentru a evidenţia
cantitatea sau volumul schimbării;
6. X Y (Scatter) (Dispersie-nor de puncte) – Graficele de tip XY (Puncte dispersate)
reprezintă doar punctele date de coordonatele X și Y. Un grafic de tip XY
(Dispersie) este asemănător cu unul de tip Linie, numai că ilustrează evoluţia
unor mărimi la care intervalele de variaţie nu sunt egale; Acest tip de grafic este
necesar atunci când se dorește crearea modelelor de aproximare/regresie liniare/
neliniare în cadrul aproximării evoluției unui proces/fenomen;
7. Stock (Stoc) – Se utilizează pentru activități de investiții la mai multe societăți pe
acțiuni sau investitori. În general, un tabel de valori cuprinde data de asigurare
stoc, volumul de stoc, prețul de deschidere, prețul de închidere, cel mai mare preț
și cel mai mic preț (Exemplu: https://www.extendoffice.com/documents/excel/
2138-excel-create-stock-chart.html);
8. Surface (Suprafață) – Această diagramă este folosită de obicei de matematicieni
și statisticieni pentru analiza specială a datelor și reprezentarea suprafețelor în
3D, în spațiul XYZ. Acest grafic nu este utilizat pentru a vizualiza puncte de date
3D arbitrare. Pentru a forma o suprafață z=f(x,y), pe axele X și Y mărimea
valorilor x și y trebuie să aibă distanțe egale între ele. Reprezentarea suprafeței se
poate realiza doar dacă este dată o discretizare, o rețea (grid) pentru direcțiile X și Y.
De obicei, aceste valori pot fi construite prin utilizarea funcției Meshgrid din
Statistică şi Informatică pentru chimie medicală şi farmaceutică 103

Matlab sau alte funcții echivalente. Valorile date de relația z=f(x,y) reprezintă o
funcție de evaluare care este vizualizată în diagramă. Sunt necesare 3 coloane de
date numerice corezpunzătoare penru x, y, z. (Detalii: https://store.office.com/en-
us/surface-chart-WA104380632.aspx). Reprezentarea grafică de mai jos nu are
sens deoarece nu respectă relația z=f(x,y), unde x,y,z sunt mărimi corespunzătoare
celor 3 direcții din spațiul XYZ.

9. Doughnut (Inel) – Graficele de tip Inel, la fel ca şi graficele de tip Pie (circulare),
scot în evidenţă mărimea părţilor dintr-un întreg. Deosebirea este că structura
diagramelor de tip Inel permite reprezentarea mai multor serii de date. Fiecare
inel concentric conţine datele dintr-o serie de date;
104 MARIN VLADA

10. Bubble (Bule) – O diagramă Bubble este o variantă a unei diagrame X Y


(dispersie), în care punctele de date sunt înlocuite cu bule, și o dimensiune
suplimentară a datelor este reprezentată în mărimea bulelor. La fel ca și o
diagramă de dispersie, o diagramă cu bule nu utilizează o axă categorie – axele,
cea orizontală și cea vertical, sunt axe de valoare;
11. Radar (Radar) – Un astfel de grafic ilustrează mărimi raportate la propria axă.
Fiecare categorie (fiecare etichetă care ar fi afişată pe axa X la un grafic în două
dimensiuni) are propria axă. Punctele de date sunt plasate de-a lungul acestor axe.
Un grafic de tip radar rezultă prin unirea punctelor de date care au aceeaşi
semnificaţie pe toate axele.

Tipuri de diagrame și varietatea lor – varietate dată de programul Excel.


Statistică şi Informatică pentru chimie medicală şi farmaceutică 105

Diagrame Coloane
(Column 2 D , 3D ... )

Diagrame Linie
(Line 2 D , 3D ... )
106 MARIN VLADA

Diagrame Sector
(Pie 2 D, 3D ... )

Diagrame Bare
(Bar 2 D , 3D ... )
Statistică şi Informatică pentru chimie medicală şi farmaceutică 107

Diagrame Arie
(Area 2 D , 3D ... )

Diagrame Puncte
(Scatter)
108 MARIN VLADA

Diagrame Altele
(Other Charts )

2.2.2 Etapele de elaborare a unei diagrame

Definiție. O diagramă (Chart), denumită și grafic, este o reprezentare vizuală a unor


seturi de date selectate dintr-o foaie de calcul și stocate într-un tabel. Diagramele/
Graficele sunt folosite pentru a afișa serii de date numerice într-un format grafic în scopul
facilitării înțelegerii unei cantități mari de date și a relației dintre serii diferite de date
(seturi de date).

Având în vedere că în practică, în multe domenii de activitate, există o mare


diversitate de seturi de date, ce reclamă diverse comparații, evoluții etc., programul Excel
oferă multe tipuri de diagrame, cu posibilitatea de a afișa datele în modalități care să
reprezinte diverse semnificații în interpretarea seturilor de date. Când se realizează o
diagramă sau se modifică, există posibilitatea să se selecteze dintr-o varietate de tipuri de
diagrame (cum ar fi o diagramă coloană sau o diagramă radială) și din subtipurile lor
(cum ar fi o coloană stratificată sau o structură radială într-o diagramă 3-D). De
asemenea, există posibilitatea să se creeze o combinație de diagrame, utilizând mai multe
tipuri de diagrame.

Exemplu. Facilități recente în Excel 2016, Excel pentru Tablete Android, Excel Mobile.
Pentru accesare este nevoie de abonament Office 365 de la Microsoft.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 109

Crearea unei diagrame Funnel Chart (Pâlnie). Diagramele pâlnie afișează valori
în mai multe etape dintr-un proces. De exemplu, puteți utiliza o diagramă pâlnie pentru a
afișa numărul de vânzări potențiale din fiecare etapă a unei oportunități de vânzări. De
obicei, valorile scad treptat, făcând ca barele să semene cu o pâlnie.

Fig. 50. Diagramă Pâlnie. Ref.: https://support.office.com/ro-ro/

Exemplu. Crearea unei diagrame Combo cu o axă secundară. Există cazuri când
numerele dintr-o diagramă variază foarte mult de la o serie de date la alta, sau când
există tipuri amestecate de date (cum ar fi preț și volum). În aceste cazuri, se pot
reprezenta una sau mai multe serii de date pe o axă verticală secundară (valorică). Scara
axei verticale secundare arată valorile pentru seria de date asociată. O axă secundară
funcționează bine într-o diagramă care afișează o combinație de diagrame coloană și linie.
Mai jos, se dă un exemplu de diagramă combinație care utilizează tipurile de diagrame de
tip coloană și de tip linii.

Axa verticală
secundară

Fig. 51. Diagramă Combo.Ref. https://support.office.com/


110 MARIN VLADA

Pentru a crea o diagramă sau un grafic în Excel, se parcurg etapele:


1. se deschide o foaie de calcul/lucru;
2. se introduc datele numerice pentru diagramă în foaia de calcul;
3. se utilizează meniul Insert  Chart, reprezentarea datelor într-o diagramă se
realizează dacă se selectează tipul de diagramă dorit a fi utilizat;
4. se modifică sau se completează structura diagramei cu diverse opțiuni (titlul
diagramă, titlul axe, legendă, etichete mărimi etc.). Eventual, utilizatorul poate
opta ca diagrama construită să fie salvată ca șablon pentru următoarele diagrame
ce vor fi construite.

Diagrame predefinite și stil de diagramă cu aspect profesionist

În loc de a adăuga sau a modifica manual elementele dintr-o diagramă sau a


formata diagrama, există posibilitatea de a aplica rapid aspecte și stiluri predefinite de
diagramă, Excel furnizând o varietate de aspecte și stiluri predefinite. Astfel, un aspect
sau un stil pot fi reglate în detaliu prin modificări manuale efectuate asupra aspectului și
formatării elementelor individuale ale diagramei, cum ar fi zona de diagramă, suprafața
de reprezentare grafică, seriile de date sau legenda diagramei.

 Când se aplică un aspect predefinit de diagramă, un set specific de elemente de


diagramă (cum ar fi titluri, o legendă, un tabel de date sau etichete de date) sunt
afișate într-un aranjament specific în diagramă. există posibilitatea de a selecta
dintr-o varietate de aspecte furnizate pentru fiecare tip de diagramă.
 Când se aplică un stil de diagramă predefinit, diagrama este formatată pe baza
temei de document aplicate, pentru ca diagrama să corespundă culorilor tematice
(un set de culori), fonturilor tematice (un set de fonturi de antet și corp de text) și
efectelor tematice (un set de linii și efecte de umplere) care sunt specifice
organizației.

Observație. Nu se pot crea aspecte sau stiluri de diagramă proprii, dar se pot crea
șabloane de diagramă, care includ aspectul de diagramă și formatarea dorite.

Modificarea unei diagrame de bază în funcție de cerința de utilizare

După ce se realizează o diagramă, se poate modifica oricare dintre elementele sale.


De exemplu, se poate modifica modul de afișare a axelor, să se adăuge un titlu de
diagramă, să se mute sau să se ascundă legenda, sau să se afișeze elemente suplimentare
de diagramă. Pentru a modifica o diagramă, se alege una sau mai multe dintre
următoarele variante:

 Modificarea afișării axelor diagramei – Se poate specifica scala axelor și să


se ajusteze intervalul dintre valorile sau categoriile afișate. Pentru ca
diagrama să fie mai simplu de citit, se poate adăuga gradații la o axă și
specificații privind intervalul la care vor apărea.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 111

 Adăugarea titlurilor și etichetelor de date la o diagramă – Pentru a ajuta la


clarificarea informațiilor care apar în diagramă, este posibil să se adăuge un
titlu, titluri de axă și etichete de date.
 Adăugarea unei legende sau a unui tabel de date – Există posibilitatea să se
afișeze sau să se ascundă o legendă, să se modifice locația sau să se modifice
intrările de legendă. În anumite diagrame, există posibilitatea să se afișeze și
un tabel de date care să afișeze simboluri de legendă și valorile prezentate în
diagramă.
 Aplicarea opțiunilor speciale pentru fiecare tip de diagramă – Liniile
speciale (cum ar fi cele maxim-minim și liniile de tendință), barele (cum ar fi
barele verticale și barele de eroare), marcatorii de date și alte opțiuni sunt
disponibile pentru diferite tipuri de diagrame.

Facilitățile meniului Design asupra structurii diagramei

Aceste acțiuni asupra elementelor de diagramă se vor realiza după ce se va face


click-dublu pe suprafața diagramei. Imediat, în bara de sus va apărea Meniul Design ce
oferă adăgarea/modificarea acestor elemente.

Fig. 52. Meniul Design

Fig. 53. Submeniul Chart Layout


112 MARIN VLADA

Facilități ale Meniul Design:


 Alegerea tipului (Type) – Change Chart Type, Save as Template;
 Modificare, adăugare Data – Switch Row/Column, indicarea seturilor de date
pentru axa X și axa Y;
 Alegerea structurii diagramei se face prin submeniul Chart Layouts – se aleg
componentele dorite în structura diagramei;
 Alegerea stilului pentru diagramă – Chart Styles.

Exemplu. În diagrama de mai jos, manual, s-au folosit aceste modificări și adăugiri –
etichetele privind valoarea mărimii s-au realizat doar pentru anul 2016.

Fig. 54. Diagramă cu informații multiple


Statistică şi Informatică pentru chimie medicală şi farmaceutică 113

Exemplu. Pentru a indica etichete pentru mărimile din grafic, se selectează acele mărimi
și se face click-dreapta, iar în fereastra ce apare, se alege Add Data Labels. Se poate
observa că această fereastră oferă Add Trendline, opțiune ce va fi folosită în cadrul
elaborării modelelor de aproximare (modele de regresie), pornind de la un grafic de tip
X Y Scatter (puncte dispersate) (a se vedea capitolul 4).

Facilitățile meniului Layout asupra structurii diagramei

Dacă se realizează click-dublu pe suprafața unei diagrame, atunci se activează


meniul principal Chart Tools, ce oferă instrumente de prelucrare prin cele 2 meniuri:
1. Design – cu submeniurile Type, Data, Chart Layouts, Chart Styles;
2. Layout – cu submeniurile Curent selection, Insert, Labels, Axes, Background,
Analysis, Properties.

Fig. 55. Submeniul Layout

Submeniul Labels oferă instrumente pentru adăugarea/modificarea componetelor


din structura unei diagrame: Chart Title, Axis Titles, Legend, Data Labels, Data Table.
Pentru fiecare din aceste facilități se oferă variante de eliminare sau de apariție sub o
anumită formă.

Fig. 56. Layout Data Table


114 MARIN VLADA

Fig. 57. Show Data Table – Apariția tabelului cu date sub diagramă

Legend Date Labels


Statistică şi Informatică pentru chimie medicală şi farmaceutică 115

Axis Titles

Chart Title
Fig. 58. Submeniurile Legend, Date Labels, Chart Title, Axis Titles

Modificarea sursei de date (Source Data)

Definiție. O sursă de date (Source Data) este un domeniu de celule al unei foi de calcul,
date ce urmează a fi reprezentate grafic printr-o diagramă, ce semnifică forme geometrice
corespunzătoare valorilor numerice din domeniul de celule specificat.
O serie este formată din următoarele componente:
 numele seriei – este indicată de celula care conține textul din dreptul
înregistrării cu valori, pentru cazul nostru numele seriilor vor fi An 2014, An
2015 și An 2016 pentru coloane și Trim 1, Trim 2, Trim 3, Trim 4 pentru linii;
 valorile seriei – este reprezentată de linia de date (sunt cazuri în care valorile
seriei pot fi regăsite și pe coloane) ce conține valorile individuale;
 etichetele de categorii – reprezintă linia de celule (sunt cazuri în care
etichetele de categorii sunt și pe coloană) ce indică numele fiecărei serii de
date, adică linia de celule de deasupra (din fața) datelor.

Meniul Design oferă submeniul (Butonul) Switch Row/Column ce determină


interschimbarea celor 2 axe: X și Y.

Fig. 59. Show Data Table – Apariția pe diagramă

Rezultatul este diagrama de mai jos.


116 MARIN VLADA

Fig. 60. Switch Row/Column – schmbarea axelor X ↔Y

Fig. 61. Switch Row/Column

De asemenea, Meniul Design oferă submeniul (Butonul) Select Data, ce


determină apariția ferestrei Select Data Source. Aceasta oferă facilități pentru indicarea
Legendei (Legend Entriee-Series) și axei orizontale ( X, Horizontal Axis).
În același grup de comenzi, butonul Select Data oferă posibilitatea de a redefini sursa de
date prin fereastra Select Data Source, în care se poate:
 alege un alt domeniu de celule de reprezentare (Chart Data Range),
 schimba seriile în categorii și invers (butonul Switch Row/Column),
 edita lista de componente ale seriilor de date prin adăugare (butonul Add),
modificare a numelui de serie (Edit) sau ștergere a acestora (Remove),
Statistică şi Informatică pentru chimie medicală şi farmaceutică 117

 modifica ordinea de reprezentare a acestora, prin folosirea butoanelor Move Up și


Move Down, în lista de serii, numită Legend Entries (Series).

Facilități privind axele (Axes) sau liniile de rețea (Gridlines) din diagrame

Meniul Layout oferă submeniul (Butonul) Axes ce determină apariția ferestrei ce


oferă alegerea axei orizontale (Primary Horizontal Axis) sau alegerea axei verticale
(Primary Vertical Axis). Pentru fiecare, apare o fereastră unde se indică opțiunile privind
apariția diviziunilor corespunzătoare axei respective.

Fig. 62. Switch Row/Column

Fig. 63. Switch Row/Column


118 MARIN VLADA

De asemenea, Meniul Layout oferă submeniul (Butonul) Gridlines, care


determină apariția ferestrei ce oferă alegerea axei orizontale (Primary Horizontal
Gridlines) sau alegerea axei verticale (Primary Vertical Gridlines). Pentru fiecare, apare
o fereastră unde se indică opțiunile privind apariția tipului de grilă (Major Gridlines sau
Minor Gridlines, mărimea echidistanței dintre liniile grilei) corespunzătoare axei
respective.

Fig. 64. Switch Row/Column

Exemplu. Utilizare Gridlines  Primary Horizontal Gridlines  Minor Gridlines.

Fig. 65. Switch Row/Column


Statistică şi Informatică pentru chimie medicală şi farmaceutică 119

Adăugarea unei formatări atractive la diagramă

Pe lângă aplicarea unui stil de diagramă predefinit, există posibilitatea să se


aplice cu ușurință formatări la elementele individuale de diagram, cum ar fi marcatorii de
date, suprafața diagramei, suprafața reprezentată grafic sau numerele și textul din titluri și
etichete pentru a oferi diagramei un aspect particularizat, atractiv. Există posibilitatea să
se indice stiluri specifice de forme și stiluri WordArt, și de asemenea, este posibil să
formatați manual formele și textul elementelor din diagramă.

Pentru a adăuga formatare, se poate utiliza una (sau mai multe) dintre următoarele:

 Umplerea elementelor diagramei – Se pot utiliza culori, texturi, imagini și


umpleri cu gradiente pentru a atrage atenția către elemente specifice ale diagramei.
 Modificarea sublinierii elementelor din diagramă – Se pot utiliza culori, stiluri de
linie și grosimi de linii pentru a sublinia elementele de diagramă.
 Adăugarea de efecte speciale la elementele de diagramă – Există posibilitatea să
se aplice efecte special, cum ar fi umbre, reflecții, străluciri, muchii atenuate,
teșiturile și rotiri 3-D la formele elementelor diagramei, ceea ce oferă diagramei
un aspect finisat.
 Formatarea textului și a numerelor – Există posibilitatea să se formateze textul și
numerele în titlurile, etichetele și casetele text dintr-o diagramă la fel cum se
formatează textul și numerele într-o foaie de lucru. Pentru a evidenția textul și
numerele, este posibil să se aplice și stiluri WordArt.

Reutilizarea diagramelor prin crearea șabloanelor de diagramă (My Templates)

Dacă se dorește să se reutilizaze o diagramă, care a fost particularizată conform


necesităților, există posibilitatea să se salveze acea diagramă ca șablon de diagramă
(*.crtx), în folderul șabloanelor de diagramă. Când e creată o diagramă, există
posibilitatea să se aplice apoi șablonul de diagram, la fel cum se procedează cu oricare alt
tip de diagramă predefinită. De fapt, șabloanele de diagramă sunt tipuri de diagramă
particularizate. De asemenea, acestea se pot utiliza pentru a modifica tipul de diagramă al
diagramei existente. Dacă se utilizează frecvent un șablon de diagramă specific, există
posibilitatea să se salveze ca tip de diagramă implicit.

Exemplu. Pentru ca diagrama de mai sus (Fig. 65) să devină un șablon cu care să se
creeze următoarele diagrame, se va face click-dublu pe suprafața diagramei. Imediat, în
bara de sus va apărea Meniul Desing ce oferă la submeniul Type, butonul Save as
Template, și care va salva un fișier (*.crtx) în Microsoft/Templartes/Charts.
120 MARIN VLADA

Fig. 66. Fișierul șablon Chart-medicamente

Pentru a fi utilizat acest model (template) se selectează seturile de date și se


acționează Insert  Other Charts  Templates  My Templates  se alege modelul
propriu.

Fig. 67. Alegerea modelului propriu


Statistică şi Informatică pentru chimie medicală şi farmaceutică 121

Fig. 68. Șoblon propriu în Excel

Pentru finalizarea diagramei se introduc texte pentru cele 3 titluri.

Referințe
1. Microsoft Office , Excel 2016, 2013, 2010, 2007,
https://support.office.com/ro-ro/article/Crearea-unei-diagrame-de-la-%c3%aenceput-la-
sf%c3%a2r%c8%99it-0baf399e-dd61-4e18-8a73-b3fd5d5680c2?ui=ro-RO&rs=ro-
RO&ad=RO#__toc255902069
2. L. Boiculese, C. Dascălu, G. Dimitriu, M. Moscalu, A. Doloca, Metode Descriptive și Elemente
de Analiză Statistica a datelor medicale. Exemple practice în Excel și Access, Editura
Performantica, Iași, 2009.

2.3 Reprezentarea datelor în studiile clinice


2.3.1 IMC – Indicele de masă corporală

Influențele alimentației zilnice și stilul de viață al oamenilor, precum și unele


perturbări metabolice în timpul vieții, determină variații ale masei corporale (M) și ale
înălțimii (H). Indicele de masă corporală (IMC) (Body mass index – BMI) este un
indicator statistic al masei unei persoane raportată la înălțimea persoanei respective.
Prin urmare, indicatorul este util numai pentru măsurarea unei populații și nu este
folosit pentru a pune diagnosticul asupra unei singure persoane. A fost inventat între anii
1830 și 1850 ce către belgianul Adolphe Quetelet în timpul dezvoltării „fizicii sociale”.
Valoarea este aproximativă si nu se aplică la copii și la cei în vârstă. Valoarea IMC este o
măsură care poate indica dacă o persoană are o masă corporală sănătoasă pentru înălțimea
sa. Practic, nu contează neapărat forma corpului, deoarece masa corporala optimă este
calculată pentru o anumită înălțime.
Indicele de masă corporală este definit ca raportul dintre masa corporală (M),
exprimată în kilograme, și pătratul înălțimii (H), exprimată în metri. Formula are ca
rezultat o cantitate exprimată în kg/m2:
122 MARIN VLADA

M [kg]
IMC  .
H 2 [m]
S-au definit nivele de risc pentru a indica o stare funcție de valoarea IMC:
1. Sub-ponderal – dacă IMC < 18.5;
2. Normal-ponderal – dacă 18.5 ≤ IMC < 25.0;
3. Supra-ponderal - dacă 25.50 ≤ IMC < 30.0;
4. Obezitate I - dacă 30.0 ≤ IMC < 35.0;
5. Obezitate II - dacă 35.0 ≤ IMC < 40.0;
6. Obezitate III – dacă IMC ≥ 40.0.
Exemplu. Pentru 23 de persoane se dau masa corporală și înălțimea. În tabelul următor
este calculat indicatorul IMC și este determinat nivelul acestui indice.

M- H– IMC=M/H^2 Stare-
Nr. Crt. Masă[kg] înălțime[m] [kg/m2] indice
1 67 1.8 20.679012 Norm-P
2 35 1.5 15.555556 Sub-P D10
3 67 1.8 20.679012 Norm-P
4 108 2 27 Supra-P
5 89 1.7 30.795848 Obez-I
6 105 1.9 29.085873 Supra-P
7 90 1.5 40 Obez-III
8 81 1.7 28.027682 Supra-P
9 47 1.4 23.979592 Norm-P
10 106 1.7 36.678201 Obez-II
11 76 1.7 26.297578 Supra-P
12 65 1.9 18.00554 Sub-P
13 111 2 27.75 Supra-P
14 53 1.9 14.68144 Sub-P
15 120 1.6 46.875 Obez-III
16 35 1.4 17.857143 Sub-P
17 95 1.5 42.222222 Obez-III
18 104 1.7 35.986159 Obez-II
19 70 2.1 15.873016 Sub-P
20 97 1.8 29.938272 Supra-P
21 101 1.8 31.17284 Obez-I
22 40 1.4 20.408163 Norm-P
23 77 2.1 17.460317 Sub-P

Pentru a determina nivelele de risc (Stare indice), se va utiliza funcția Excel,


IF(logical_test,value_if_true,value_if_false).
Statistică şi Informatică pentru chimie medicală şi farmaceutică 123

Celula E10 va conține formula „=IF(D10<18.5,"Sub-P",IF(D10<25,"Norm-


P",IF(D10<30,"Supra-P",IF(D10<35,"Obez-I",IF(D10<40,"Obez-II","Obez-III")))))”.

Fig. 69. Diagrama pentru valorile IMC

Fig. 70. Relația dintre masa corporală și indicele IMC


124 MARIN VLADA

IMC-stare Min Max Se selectează cele 3


Sub-P 10 18.5 coloane și se utilizează
Charts: 2-D Column
Normal-P 18.5 25
Supra-P 25 30
Obez-I 30 35
Obez-II 35 40
Obez-II 40 50

Fig. 71. Diagrama Min-Max

Pentru delimitarea nivelelor de stare, în vederea determinării dreptelor


corespunzătoare, se folosesc (Xmin, Ymin) si (Xmax,Ymax) pentru fiecare dreaptă, și astfel
cunoscând panta, se poate determina ecuația fiecărei drepte date prin 2 puncte:

Xmin Ymin Xmax Ymax


IMC-nivel Hmin Mmin Mmax Mmax Panta
18.5 1.5 41.625 2.1 80.2 64.29167
25 1.5 56.25 2.1 110 89.58333
30 1.5 67.5 2.1 130 104.1667
35 1.5 78.75 1.96 130 111.413
40 1.5 90 1.83 130 121.2121
Statistică şi Informatică pentru chimie medicală şi farmaceutică 125

Ecuațiile celor 5 drepte sunt:


f1(x) = 64.29*(x-1.5) + 41.62
f2(x) = 89.58*(x-1.5) + 56.25
f3(x) = 104.16*(x-1.5) + 67.5
f4(x) = 122.41*(x-1.5) + 78.75
f5(x) = 121.21*(x-1.5) + 90.0.

Ecuația unei drepte determinată de punctele (x1,y1) și (x2,y2):


y2  y1
f ( x)  ( x  x1 )  y1 .
x2  x1

Reprezentarea grafică a acestor drepte (domenii) se face cu programul Excel,


folosind următorul tabel (pasul de discretizare p=0,1):

x f1(x) f2(x) f3(x) f4(x) f5(x)


1.5 41.620 56.250 67.50 78.750 90.000
1.6 48.049 65.208 77.916 89.891 102.121
1.7 54.478 74.166 88.332 101.032 114.242
1.8 60.907 83.124 98.748 112.173 126.363
1.9 67.336 92.082 109.164 123.314 138.484
2 73.765 101.04 119.58 134.455 150.605
2.1 80.194 109.998 129.996 145.596 162.726
2.2 86.623 118.956 140.412 156.737 174.847

Fig. 72. Graficele celor 5 drepte folosind programul Excel


126 MARIN VLADA

Fig. 73. Graficele celor 5 drepte folosind https://web2.0calc.com/

Fig. 74. Diagramele valorilor celor 5 drepte


Statistică şi Informatică pentru chimie medicală şi farmaceutică 127

Fig. 75. Graficele primelor 4 drepte folosind http://www.mathe-fa.de/


128 MARIN VLADA

Referințe
1. http://www.doctor.info.ro/calculator_imc.html
2. https://bariatrie.ro/chirurgia-bariatrica/preoperator/calculator-bmi-indice-masa-
corporala/?gclid=COmohKrjy9ICFW4z0wodxfEHFw
3. https://ro.wikipedia.org/wiki/Indice_de_mas%C4%83_corporal%C4%83
4. https://en.wikipedia.org/wiki/Body_mass_index

2.3.2 Glaucomul, boală de ochi – studii clinice

Glaucomul-boală de ochi este o boală progresiv neurodegenerativă. Bolile


cardiovasculare (HTA) suprapuse bolii glaucomatoase (PIO cu valori peste medie) pot fi
factori de progresare în glaucom.
„Studiile din medicină au arătat implicarea factorului vascular ca factor de risc în
patologia Glaucomului: presiunea sângelui şi presiunea de perfuzie oculară. Conceptul
de presiune a perfuziei oculare şi identificarea acesteia ca factor de risc în dezvoltarea şi
progresul Glaucomului aduce împreună cele două teorii: ischemică şi mecanică. Astfel,
există o balanţă între tensiune şi PIO, influenţată de capacitatea de autoreglare a
ochiului.” Abdul Rahman Al-Mousa, UMF Iași, 2012.

Concluzie: „Echilibrul dintre PIO și tensiunea arterială sistemică influenţează


capacitatea de autoreglare a ochiului. În absenţa acestui echilibru se poate instala
suferinţa nervului optic”.
Datele unor studii clinice sunt preluate din Abdul Rahman Al-Mousa, Conceptul de
presiune de perfuzie oculară și identificarea acesteia ca factor de risc în dezvoltarea și
progresul glaucomului, Teză de doctorat, Disciplina Oftalmologie, Universitatea de
Medicină şi Farmacie „Gr.T.Popa” din Iaşi, 2012.

Se notează: PIO – presiunea intraoculară masurată în mmHg.

PIO PIO
Ora inițial 12 luni
ora 9 22,9 17,0
ora 12 23,7 18,0
ora 15 23,4 17,9
ora 18 23,9 17,9
ora 21 22,5 17,1
ora 24 23,2 17,3
ora 6 24,8 18,7

Pentru realizarea unei diagrame în Word, se selectează cele 3 coloane și apoi se


folosește meniul Insert  Chart.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 129

25

20 ora 9
ora 12
15 ora 15
ora 18
10
ora 21
5 ora 24
ora 6
0
PIO initial PIO 12 luni

Fig. 76. Diagrama realizată cu programul Word

În programul Excel, grafic tip Linie: se selectează primele 2 coloane, coloana


„Ora” și „PIO intițial”, apoi se folosește butonul Chart.

Fig. 77. Diagrama realizată cu programul Excel

În programul Excel, Grafic tip Linie: se selectează coloana „Ora”, apoi tasta <Ctrl>
și se selectează coloana „PIO 12 luni”, după care se folosește butonul Chart.
130 MARIN VLADA

Fig. 78. Diagrama realizată cu programul Excel

În programul Excel, Grafic tip Linie: se selectează toate cele 3 coloane „Ora”,
„PIO intițial” și „PIO 12 luni”, apoi se folosește butonul Chart.

Fig. 79. Diagrama realizată cu programul Excel

În programul Excel, grafic tip Coloana: se selectează toate cele 3 coloane „Ora”,
„PIO intițial” și „PIO 12 luni”, apoi se folosește butonul Chart.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 131

Fig. 80. Diagrama realizată cu programul Excel

PPD – presiunea de perfuzie diastolică.


PPS – presiunea de perfuzie sistolică.

PPD.
Presiunea diastolică de perfuzie
oculară

Timp PPD
Inițial 110,0
6 luni 98,0
12 luni 93,7

PPS.
Presiunea sistolică de perfuzie
oculară

Timp PPS
Inițial 146,3
6 luni 132,9
12 luni 145,0

Fig. 81. Diagrame pentru PPD și PPS


132 MARIN VLADA

- Studiul – Deficitul perimetric iniţial. Total lot pacienți urmăriți: 51.


- Deficitul perimetric înregistrat la pacienţii în momentul luării în evidenţă a fost
de 75,11% (39 pacienţi). Absenţa deficitului perimetric a fost înregistrată pentru 12
pacienţi.

Deficitul perimetric iniţial

Diagnostic Pacienți
Deficit 39
Absență 12

În programul Excel, Grafic tip Pie (sector): se selectează toate cele 2 coloane
„Diagnostic”, „Pacienți”, apoi se folosește butonul Chart.

Distribuția cazurilor în funție de deficitul perimetric, conform clasificării


HODAPP:
Nivel Inițial Final
Precoce 28 21
Moderal 11 16
Avansat 8 10

Referință
1. Abdul Rahman Al-Mousa, Conceptul de presiune de perfuzie oculară și identificarea acesteia
ca factor de risc în dezvoltarea și progresul glaucomului, Teză de doctorat, Universitatea de
Medicină şi Farmacie „Gr.T.Popa” Iaşi, 2012
http://www.umfiasi.ro/ScoalaDoctorala/TezeDoctorat/Teze%20Doctorat/Rezumat%20ABDUL%2
0RAHMAN%20AL%20MOUSA.pdf
Statistică şi Informatică pentru chimie medicală şi farmaceutică 133

2.3.3 Diabet Zaharat (DZ) – Studiu clinic

„Diabetul zaharat a devenit o problemă de importanță majoră pentru individ, medicină și


societate. Aceasta, pentru că este o boală tot mai frecventă, de lungă durată și
devastatoare, dacă nu este bine gestionată. Prin urmare, impactul său este multiplu:
epidemiologic, biologic, socio-familial, economic etc.” Rigas Nikolaos, Teză de doctorat,
Universitatea de Medicină şi Farmacie, Craiova, 2012.

Vârsta Procent
sub 50 ani 0.68%
51-60 ani 0,79%
61-70 ani 21,42%
71-80 ani 55,00%
peste 80 ani 22,11%
Total 100,00%

Fig. 82. Diagrama bolnavilor în funcție de vârsta pacienților

Vârsta diabet Procent


sub 60 luni 57.14%
61-120 luni 32.86%
121-180 luni 8.57%
peste 180 luni 1.43%
Total 100.00%
134 MARIN VLADA

Fig. 83. Diagrama în funcție de vârsta bolii

Referință
1. Rigas Nikolaos, „Studiu clinic asupra eficienţei terapeutice a unor inhibitori de dipeptidil
peptidază 4, în diabetul zaharat tip 2”, Teză de doctorat, UMF Craiova, 2012, http://
www.umfcv.ro/files/s/t/Studiu%20clinic%20asupra%20eficientei%20terapeutice%20a%20unor%
20inhibitori%20de%20dipeptil%20peptidaza4%20in%20diabetul%20zaharat%20tip%202.pdf

2.3.4 Ciroza hepatică (CH) – Studiu clinic

Din cei 273 pacienţi evaluaţi, 248 bolnavi au îndeplinit toate criteriile de
includere şi de excludere şi au fost incluşi în studiu [1].
Repartiţia pacienţilor cu CH pe grupe de vârstă:

Vârsta Procent
sub 30 ani 0,80%
30-39 ani 4,04%
40-49 ani 14,52%
50-59 ani 45.96%
60-69 ani 24,19%
peste 70 ani 10,49%
Total 100,00%
Statistică şi Informatică pentru chimie medicală şi farmaceutică 135

Fig. 84. Diagrama în funcție de vârstă

Distribuţia etiologică a cazurilor de CH din lotul studiat:

Factor Procent
Consum de alcool 41,13%
Infecție virala B 12,10%
Infecție virala C 22,58%
VHB + alcool 7,26%
VHC + alcool 11,29%
Infecții VHB+VHC 1,61%
Infecții VHB+VHD 4,03%
Total 100,00%

Fig. 85. Diagrama în funcție de factori


136 MARIN VLADA

Referință
1. Gabriela Balan, Aspecte clinice, terapeutice şi prognostice ale sindromului ascitic în ciroza
hepatică, Teză de doctorat, Universitatea de Medicină şi Farmacie din Iasi, 2011,
http://www.umfiasi.ro/ScoalaDoctorala/TezeDoctorat/Teze%20Doctorat/Rezumat%20Balan%20G
abriela.pdf

2.3.5 Patologia parodontală la tânăr – studii clinice

Numărul total de cazuri examinate -134


Notații: GBG = Gingivită bacteriană generalizată, PMCS = Parodontită marginală
cronică superficială, PA = Parodontită agresivă (juvenilă), FSA = Fără semne de afectare.

Nr. Cazuri Procent Diagnostic Procent


63 47,01% GBG 47,01%
29 21,64% PMCS 21,64%
7 5,22% PA 5,22%
35 26,12% FSA 26,12%
Total 134 100,00% Total 100,00%

Fig. 86. Diagrama în funcție de diagnostic

Referință
1. Anca Mihaela Stupu, Studii privind posibilităţile de diagnostic şi tratament în patologia
parodontală la tânăr (copil și adolescent), Teză de doctorat, Universitatea de Medicină şi
Farmacie din Iași, 2012,
http://www.umfiasi.ro/ScoalaDoctorala/TezeDoctorat/Teze%20Doctorat/Rezumat%20STUPU%2
0ANCA%20MIHAELA.pdf
Statistică şi Informatică pentru chimie medicală şi farmaceutică 137

2.3.6 Studiu prin metode atomice și moleculare – Probe biologice

Testul cafeinei – metodă de diagnosticare a disfuncţie hepatice [1].

„Cafeina poate fi utilizată pentru măsurarea capacităţii metabolice a ficatului. S-a


observat că metabolismul cafeinei este scăzut la pacienţii cu diferite forme de boală de
ficat în funcţie de starea bolii. Cafeina are avantajul de a fi bine tolerată când se
administrează oral, nivelele în salivă fiind în concordanţă cu concentraţiile serice,
făcând posibile teste neinvazive.” Cornelia Mesaroş, 2010.

S-a studiat pe o grupă de 10 copii martori (n=10) cu vârste între 5-15 ani. Doza
medie a fost de 4 mg/kg, p.o. Înainte de începerea acestei cercetări s-a obţinut acordul în
scris de la părinţii fiecărui subiect.
Cafeina s-a administrat oral la copiii cu diferite disfuncţii hepatice. S-a utilizat
pentru injectare o soluţie sterilă de cafeină -benzoat de sodiu în apă conţinând 125 mg
cafeină şi 125 mg benzoat de sodiu per fiolă de 1 ml din farmacie. Toţi ceilalţi reactivi au
fost de la Merck (Germania).
S-au recoltat probe de sânge la 0, 30 min, 1, 3, 6, 9 şi 12 h. Probele de sânge au
fost puse în tuburi de plastic cu heparină şi centrifugate imediat. Plasma s-a păstrat
la -20oC.
S-au determinat concentrațiile de cafeină din probe de sânge recoltate la 0, 30
min, 1, 3, 6, 9 şi 12 h. Concentația de cafeină este măsurată în μg/ml. Pentru studiul
parametrilor farmacocinetici se determină modelul de regresie (aici, dreapta de regresie)
ce aproximează evoluția concentrației măsurate. În capitolul 4 al acestei cărți se vor
studia Modele de aproximare liniare și neliniare. Astfel, se calculează parametrii
farmacocinetici:
 Constanta de eliminare a cafeinei
ln( C1 )  ln( C2 )
K el  , unde
t
C1-concentraţia mare de cafeină în sânge
C2-concentraţia mică de cafeină în sânge.
t - timpul dintre două colectări de probe de sânge.
 Viteza de eliminare (clearence)
Vel  K el  Vd , unde
Vd - constantă de volum de distribuţie de 0,6 litri per kg corp.
 Timpul de înjumătăţire t1 / 2  ln 2 / K el .

Rezultate: „Clearance-ul cafeinei, măsurat la pacienţii cu ciroză şi hepatită


cronică a fost redus iar timpul de înjumătăţire a fost mărit la copiii bolnavi faţă
de cei sănătoşi. Descreşterea metabolismului observată la pacienţii cu diferite forme de
boală hepatică s-a corelat cu starea bolii. Valorile medii ale celor doi parametri
farmacocinetici studiaţi, Vel şi t1/2, pentru pacienţii cu boli hepatice şi martori, arată
diferenţe mari în special între martori şi cazurile cu ciroză. Valorile timpilor de viaţă
medie au scăzut iar valorile clearence-lui (vitezei de eliminare) au crescut pentru
pacienţii cu disfuncţii hepatice comparativ cu martorii” Cornelia Mesaroş, 2010.
138 MARIN VLADA

În figura de mai jos se prezintă valorile mari ale concentraţiilor de cafeină ale
pacienţilor comparativ cu valoarea medie a concentraţiei cafeinei pentru martori
(n=10).

Lot C1 C2
pacienți (1h) (9h)
Martor 17 5
Ciroză 30 15
Hepatită
cronică 37 14

Fig. 87. Nivelul cafeinei după o oră şi 9 ore de la administrare, comparativ cu proba
martor (concentraţia măsurată în μg/ml)

Referință
1. Cornelia Mesaroş, Studii prin metode atomice şi moleculare a unor probe biologice, Teză de
doctorat, Universitatea „Babes Bolyai” Cluj-Napoca - Facultatea de Fizica, 2010,http://
doctorat.ubbcluj.ro/sustinerea_publica/rezumate/2010/fizica/MESAROS_CORNELIA_RO.pdf

2.3.7 Tetrazoli - cercetări biologice și farmaceutice

Vom prelua rezultatele privind „Sinteza, caracterizarea și activitatea


antiinflamatoare a unor tetrazoli substituiți la azot” din articolul având autorii Mohite
P.B., Pandhare R.B. and Khanage S.B., Synthesis, Caracterization and Anti-Inflammatory
Activity of Novel N-Substituted Tetrazoles, Analele Universității din București, Chimie
(serie nouă), vol. 20, no. 2, 2011.

Tetrazolii sunt o clasă de compuși sintetici heterociclici organici, constând dintr-


un inel de 5 membri dintre care patru atomi de Azot și un atom de Carbon. Cel mai
simplu este tetrazolul CH2N4. Aceștia nu se întâlnesc în natură.

„Tetrazoles are a class of synthetic organic heterocyclic compound, consisting of a 5-


member ring of four nitrogen atoms and one carbon atom. The simplest is tetrazole itself,
CH2N4. They are unknown in nature”
Statistică şi Informatică pentru chimie medicală şi farmaceutică 139

Fig. 88. Structura Tetrazole - Ref.: https://en.wikipedia.org/wiki/Tetrazole

Componentele 4a-4h sunt descrise în articolul invocat.

Name of compound Inhibation of denaturation (%)


4a 68,33
4b 50,83
4c 65,00
4d 62,50
4e 70,00
4f 40,00
4g 31,66
4h 25,00

Fig. 89. Diagrama procentelor pentru componentele 4a-4h

2.3.8 Tensiunea arterială- reprezentări grafice

Definiție. Tensiunea arterială (TA, Blood Pressure) se referă la forța exercitată prin
circulația sângelui asupra pereților vaselor de sânge și constituie una dintre semnele
vitale pentru sănătatea omului. Presiunea sângelui scade pe măsură ce sângele se mișcă
140 MARIN VLADA

prin artere, arteriole, capilare și vene. În general, termenul de tensiunea arterială se referă
la presiunea arterială din arterele mari, acestea fiind vasele de sânge care transportă
sângele departe de inimă.

Există două componente ale presiunii sanguine:


1. presiunea sistolică – este presiunea exercitată asupra pereților arteriali când
inima se contractă (în sistolă) – cu valori normale între 100 și 130 mm coloana
de mercur (Hg);
2. presiunea diastolică – este presiunea exercitată asupra pereților arteriali când
inima se relaxează între două contracții (în diastolă) – cu valori normale sub
85 mmHg.

Definiție. Hipertensiunea arterială (HTA) este tensiunea arterială ale cărei valori
tensionale sunt peste 140/90 mmHg, indiferent de vârstă (nu se mai acceptă ideea că
tensiunea normală crește cu vârsta). Hipertensiunea arterială (HTA) reprezintă o
importantă problemă de sănătate publică, fiind cea mai frecventă boală cardiovasculară,
cauza importantă de morbiditate și mortalitate în rândul populației adulte.

Observație. Recent, al 7-lea raport al Comitetului Național de Prevenire, Depistare,


Evaluare și Tratament (USA) al bolilor cardiovasculare, a recomandat definirea presiunii
arteriale normale ca presiune arterială 135/85 mm Hg.

Clasificarea hipertensiunii arteriale la persoanele peste 18 ani:


Categoria Sistolic (mmHg) Diastolic (mmHg)
Normală < 120 < 80
Prehipertensiune 120 − 139 80 − 89
Hipertensiune stadiul I 140 − 159 90 − 99
Hipertensiune stadiul II ≥ 160 ≥ 100

Interval de presiune arterială scăzută (Hipotensiune):


Presiune sistolică Presiune diastolică Interval de presiune
(mm Hg) (mm Hg)
90 60 Scăzută
60 40 Prea scăzută
50 33 Risc mare

Interpretare de presiune arterială normală:


Presiune sistolică Presiune diastolică Interval de presiune
(mm Hg) (mm Hg)
130 85 Normal înaltă
120 80 Normal
110 75 Normal Joasă
Statistică şi Informatică pentru chimie medicală şi farmaceutică 141

Interpretare de presiune arterială ridicată (HTA, Hipertensiune):


Presiune sistolică Presiune diastolică Stadiul de presiune
(mm Hg) (mm Hg)
210 120 Stadiul 4
180 110 Stadiul 3
160 100 Stadiul 2
140 90 Stadiul 1

Tensiunea arterială în funcție de vârsta:


Vârsta Presiune sistolică Presiune diastolică
(mm Hg) (mm Hg)
3-6 116 76
7-10 122 78
11-13 126 82
14-16 136 86
17-19 120 85
20-24 120 79
25-29 121 80
30-34 122 81
35-39 123 82
40-44 125 83
45-49 127 84
50-54 129 85
55-59 131 86
60+ 134 87

Tensiunea arterială la copii:


Vârsta Fete Băieți
Sistolică/ Diastolică Sistolică/ Diastolică
1-3 80/34 – 120/75 83/38 – 117/76
4-6 88/47 – 128/84 88/50 – 122/83
7-10 92/53 – 130/90 95/55 – 129 /88

Nivelul tensiunii arteriale.


Nivel Diastolică Sistolică
Foarte scăzută 40 70
Hipotensiune 60 90
Normală 80 120
Ușor crescută 90 140
Hipertensiune 100 190

În programul Excel, pentru a crea diagrama reprezentării acestor date, se vor


selecta toate cele 3 coloane și se va indica butonul Chart, alegând diagrama de tip
2D-Column (diagrama coloane/bare).
142 MARIN VLADA

Fig. 90. Diagrama Nivelului tensiunii arteriale

Fig. 91. Nivelul tensiunii arteriale în funcție de vârstă (Ref.


http://www.bloodpressureuk.org/BloodPressureandyou/Thebasics/Bloodpressurechart)

Valorile tensiunii arteriale în funcție de vârstă

Legendă:
 S-x = Sistolică y,
 D-x= Diastolică y, unde x  {min, normal, max} și y  {minim, normal, maxim}.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 143

Vârsta S-min D-min S-normal D-normal S-max D-max


0-1 an 75 50 90 60 100 75
1-5 ani 80 55 95 65 110 79
6-13 ani 90 60 105 70 115 80
14-19 ani 105 73 117 77 120 81
20-24 ani 108 75 120 79 132 83
25-29 ani 109 76 121 80 133 84
30-34 ani 110 77 122 81 134 85
35-39 ani 111 78 123 82 135 86
40-44 ani 112 79 125 83 137 87
45-49 ani 115 80 127 84 139 88
50-54 ani 116 81 129 85 142 89
55-59 ani 118 82 131 86 144 90
60-64 ani 121 83 134 87 147 91
64-70 ani 122 84 135 88 149 92

Pentru a crea diagrama reprezentării acestor date, în programul Excel se vor


selecta toate cele 7 coloane și se va indica butonul Chart, alegând diagrama de tip
2D-Column.

Fig. 92. Diagrama valorilor tensiunii arteriale în funcție de vârstă

Referințe
1. Disabled-World.Com, https://www.disabled-
world.com/artman/publish/bloodpressurechart.shtml
2. http://www.bloodpressureuk.org/BloodPressureandyou/Thebasics/Bloodpressurechart
3. Valorile în funcție de vârsta http://www.cdt-babes.ro/articole/tensiune_arteriala.php
4. L. Boiculese, C. Dascălu, G. Dimitriu, M. Moscalu, A. Doloca, Metode Descriptive și Elemente
de Analiză Statistica a datelor medicale. Exemple practice în Excel și Access, Editura
Performantica, Iași.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 145

3
Statistică și Probabilități

„Toată cunoaşterea noastră îşi are originea în percepţiile noastre.”


Leonardo da Vinci
„Nu se poate prevedea limitele cunoaşterii şi previziunile ştiinţifice.”
Dimitri I. Mendeleev
„Ştiinţa reprezintă cunoaşterea organizată. Înţelepciunea reprezintă viaţa organizată.”
Kant

Definiție. Statistica este o disciplină aplicată a matematicii care, folosind teoria


probabilităților și prelucrări pe calculator, studiază diverse fenomene și procese de tip
colectiv/populație (din societate, natură, economie, educație, sănătate, industrie etc.) din
punct de vedere cantitativ, în scopul descrierii acestora și al descoperirii legilor care
guvernează manifestarea lor. Folosind teorii și metode adecvate, se ocupă de colectarea,
clasificarea, prezentarea și interpretarea datelor numerice, în scopul folosirii acestora
pentru a formula concluzii și a lua decizii.

Statistica oferă teorii, metode și calcule/prelucrări statistice, de regulă realizate de


calculator prin sisteme informatice, pentru fizică, chimie, biologie, psihologie, economie,
sociologie, educație, sănătate, industrie etc. și obtine rezultate și excelează atunci când
relațiile deterministe referitoare la fenomene/procese/evenimentue studiate sunt
imposibil, ori foarte dificil de aflat.

Definiție. Teoria probabilităților, ca disciplină a matematicii, studiază legile după care


evoluează fenomenele aleatoare (stochastice) din natură și din lumea înconjurătoare, cu
aplicații în fizică, chimie, biologie, psihologie, economie, sociologie, sănătate, industrie
etc. Aplicarea matematicii la studierea fenomenelor aleatoare se bazează pe faptul că, prin
repetarea de mai multe ori a unui experiment, în condiții practic identice, frecvența
relativă a apariției unui anumit rezultat (raportul dintre numărul experimentelor în care
146 MARIN VLADA

apare rezultatul și numărul tuturor experimentelor efectuate) este aproximativ același,


oscilând în jurul unui număr constant.

Necesitatea apariției teoriei probabilităților se datorează faptului că în lumea


înconjurătoare, fenomenele deterministe ocupă doar o mică parte, însă majoritatea
fenomenelor din natură și societate sunt stochastice (aleatoare). Studiul acestora nu poate
fi făcut pe cale deterministă și, de aceea, știința hazardului a apărut ca o necesitate. La
început, conceptele și problemele teoriei probabilităților sunt legate de numele
matematicienilor Jacob Bernoulli, Blaise Pascal și Pierre Fermat în secolul al XVII-lea,
ajungând la probleme legate de probabilitate datorită jocurilor de noroc. Dezvoltarea
teoriei probabilităților și cercetarea unor probleme nelegate de jocurile de noroc sunt
legate de matematicienii: A. Moivre, P.-S. Laplace, C. F. Gauss, S.-D. Poisson, P. L.
Cebîșev, A. A. Markov, în secolul XIX, iar în secolul al XX-lea de R. Fisher, G. W.
Snedecor, A. N. Kolmogorov și A. I. Hincin.

Şcoala româneasca de Teoria probabilităţilor şi Statistică

De remarcat este faptul că, în România, lucrarea lui Dimitrie Cantemir


„Descriptio Moldaviae” (1716) poate fi considerată o primă lucrare de statistică. A fost
scrisă la cererea Academiei din Berlin și conține toate cunoștințele acumulate în domeniu
până la acea dată.
De asemenea, vom scoate în evidență „Primul Recensământ oficial al populaţiei
din Romania în perioada 1859-1860”. Aceasta este prima investigaţie de acest fel care a
urmărit atât aspecte demografice, cât şi aspecte economico-sociale, simultan, în cele două
provincii unite, la 24 ianuarie 1859. În anul 1860, la Iași, Direcția Centrală Statistică Iași
condusă de Costache Negruzzi, a publicat rezultatele „Lucrări statistice facute în anii
1859-1860” (Sursa: http://www.recensamantromania.ro/istoric/recensaminte – 1859-1990/).
În Romania, Octav Onicescu (1892-1983) și Gheorghe Mihoc (1906-1981),
membrii titulari al Academiei Române, au pus bazele Şcolii matematice româneşti de
teoria probabilităţilor şi statistică matematică. Acad. Gheorghe Mihoc12 este considerat
întemeietorul şcolii româneşti de probabilităţi şi statistică matematică, împreună cu acad.
Octav Onicescu, mentorul său, înființând prima catedră de probabilități din România și
una dintre primele din lume. A intrat în istoria matematicii prin contribuțiile sale
remarcabile în teoria probabilităților și aplicațiile ei, fiind autor a peste 180 de lucrări și
studii. Gh. Mihoc are contribuții în: teoria lanțurilor Markov, dependența cu legături
complete și aplicațiile teoriei probabilităților în actuariat, statistică matematică și
cercetări operaționale.
O. Onicescu a introdus conceptul de „lanţ cu legături complete”, cea mai
importantă contribuţie românească în teoria probabilităţilor. A fost autor al unei noi
varietăţi de mecanică: „Mecanica invariantivă Onicescu”. În anul 1930 a înfiinţat
Şcoala de Statistică, Actuariat şi Calcul în Bucureşti (care mai apoi s-a transformat
în institut, azi INS (Institutul Național de Statistică) – http://www.insse.ro/cms/), al cărui
director a fost timp de mulţi ani, chiar de la înfiinţare. La acest institut s-au format
ulterior mulţi specialişti în statistică şi actuariat. O. Onicescu a jucat un rol deosebit

12
M. Vlada, „Contribuția acad. Gheorghe Mihoc (1906-1981) la dezvoltarea școlii matematice românești –
110 ani de la naștere”: http://www.c3.cniv.ro/?q=2016/mihoc
Statistică şi Informatică pentru chimie medicală şi farmaceutică 147

de important în modernizarea şi predarea teoriei relativităţii şi aplicarea fundamentală


a ştiinţelor matematice.
„Câmpul de acţiune al matematicienilor în planul social a fost şi este larg, mai cu seamă
atunci când conştiinţa unei misiuni generează şi o indispensabilă emulaţie. În ce mă
priveşte, am contribuit la asanarea practicilor societăţilor de asigurare interbelice. Am
colaborat apoi cu Casa generală de pensii, al cărei director general, Neculai
Praporgescu, a fost şi el un matematician reputat. Am fost alături de eforturile lui
Francisc Rainer de a întemeia ştiinţific antropologia, uzând de instrumente matematice,
şi nu mi-a fost străin nici domeniul zootehniei în care am colaborat cu Gh. K.
Constantinescu, un cunoscut zootehnist al timpului. Tocmai pentru a răspunde acestor
necesităţi de ordin social am creat, în 1930, Institutul de statistică, actuariat şi calcul,
care şi-a desfăşurat activitatea până în 1947, fiind extrem de solicitat de toate instituţiile
româneşti interesate (interviu Octav Onicescu, Revista „Flacăra”, 1981, Mihai Pelin).

Contribuția acad. Gh. Mihoc13 la dezvoltarea matematicii și a învățământului


românesc:

 Centrul de Statistică Matematică (CSM) a fost înființat în anul 1964, datorită


strădaniilor profesorului Gheorghe Mihoc, având ca nucleu secția de
probabilități a Institului de Matematică al Academiei Române. Din anul 1997
Centrul poartă numele fondatorului său, iar mai târziu, în anul 2001, acesta s-a
unit cu Institutul de Matematică Aplicată „Caius Iacob”, devenind Institutul
de Statistică Matematică și Matematică Aplicată „Gheorghe Mihoc-Caius
Iacob” al Academiei Române – http://www.csm.ro/.
 De asemenea, în colaborare, a elaborat cărți și manuale universitare de Teoria
probabilităților și statistică matematică, precum și manuale de matematică
pentru clasa a XII-a, Elemente de teoria probabilităților și statistică matematică.

3.1 Concepte de bază. Teorii și Metode


Aplicațiile Statisticii studiază – folosind teoria/calculul probabilităților și metode
și tehnici de prelucrare, fenomenele din punct de vedere cantitativ prin intermediul
cercetărilor/studiilor, ce înseamnă colecții de observații efectuate asupra unor entități de
aceeași natură, numite unități statistice. Cercetările/studiile se realizează prin
observații/măsurări asupra entităților definite prin una sau mai multe caracteristici/
parametri, denumite variabile/parametri.
Odată cu dezvoltarea spectaculoasă a Informaticii și ITC, prin apariția de
calculatoare tot mai performante și a diversității aplicațiilor informatice în domeniul
Statisticii, cercetătorul/specialistul dintr-un anumit domeniu (economie, industrie,
medicină, sociologie, învățămant etc.) este absolvit de efectuarea unor calcule laborioase

13
M. Vlada, „Contribuția acad. Gheorghe Mihoc (1906-1981) la dezvoltarea școlii matematice românești -
110 ani de la naștere”: Academia Româna, revista Diviziei de Istoria Științei a CRIFST al Academiei
Române, Comitetul Român de Istoria şi Filosofia Ştiinţei şi Tehnicii (CRIFST), STUDII ŞI COMUNICĂRI /
DIS, vol. IX, 2016
148 MARIN VLADA

sau demonstrarea unor teorii și metode, dar, în primul rând trebuie să cunoască și să
înțeleagă principiile de bază și metodele oferite de Statistică pentru a fi capabil să
interpreteze rezultatele obținute în urma prelucrării datelor. În al doilea rând, trebuie să
aibă competențele digitale corespunzătoare pentru utilizarea calculatorului și a utilizăriii
eficiente a sistemelor software. Trebuie să precizăm că în Romania, Universitățile de
Medicină și Farmacie, după anul 1970, au introdus un curs obligatoriu pentru utilizarea
calculatoarelor, dar și pentru utilizarea teoriilor și metodelor statisticii în domeniul
sănătății.

Fig. 93. Platforma digitală a Universității de Medicină și Farmacie din Târgu Mureș –
https://www.umftgm.ro/e-umf.html

Platforma digitală (fig. 93) elaborată sub platforma TYPO314 (Open Source
Enterprise CMS , https://typo3.org/) oferă utilizatorilor următoarele categorii de
informații și resurse: e-Learning, Cadre didactice, Biblioteca online, Librăria online,
Manifestări științifice, Cercetare științifică, Documente, Rapoarte, Managementul
riscurilor, Rezidențiat, Studenți, Admitere, Planuri de învățamânt, Plăți online,
administrativ, Webmail.

14
„The TYPO3 Universe offers highly flexible, scaleable and customizable products for Web
Content Management, providing the basis for websites, intranets and web & mobile applications
worldwide - always with a focus on the current needs of businesses and public institutions.”
Statistică şi Informatică pentru chimie medicală şi farmaceutică 149

Într-un interviu, din anul 2016, prof. dr. Marius Mărușteri de la Universitatea de
Medicină și Farmacie din Târgu Mureș (acesta a promovat mereu utilizarea resurselor
digitale și a făcut posibilă elaborarea platformei digitale la Universitatea de Medicină și
Farmacie din Târgu Mureș – http://ehealthromania.com/marius-marusteri-informatica-
medicala/), afirmă că având în vedere informatizarea medicinei la nivelul Europei, se
dorește ca medicul de azi să știe ce înseamnă „Informatica medicală”. Din anul 2004 s-a
pus problema recunoașterii diplomelor medicale românești în Europa. Atunci, o comisie
de 29 de experți a vizitat toate Universitățile de Medicină din România. În toată Europa
trebuia să se studieze un număr de minimum de discipline medicale, iar printre acestea se
număra și Informatica medicală. Toată lumea a fost șocată atunci, de ce este Medicina
digitală și/sau Informatica medicală o disciplină obligatorie? Europa are nevoie de
medici care să înțeleagă vocabularul de bază privind utilizarea calculatorului, care să fie
capabili să folosească tehnologiile viitorului, să învețe permanent să utilizeze dispozitive
și produse software moderne, să stie să utilizeze tehnologii e-Learning și căutări avansate
oferite de platformele digitale etc.
În domeniul sănătății, se pleacă de la ipoteza că nu există două ființe umane
identice privind funcționarea organismelor, e nevoie de studii și prelucrarea datelor prin
măsurări și observații cât mai precise a unor parametri. Ținând seama de evoluția diversă
a parametrilor studiați, un parametru biologic poate fi cunoscut cu o anumită precizie,
doar pe baza unor mulțimi de măsurări și observații. Ref. Health - http://ec.europa.eu/
eurostat/web/health/statistics-illustrated.
Analiza statistică dă cercetătorului posibilitatea de a preciza variabilitatea
existentă în sânul unei colectivităţi. Măsura acestei variabilităţi dă indicaţii cu
consecinţe practice, în special în domeniul biologiei, unde se spune că „variabilitatea
este singura realitate, media fiind o ficţiune”. În faţa proceselor biologice, atât de
complexe, cum s-ar putea cunoaşte valorile normalului şi limitele lui de variaţie?

Definiție. Biostatistica este ramura Statisticii care se ocupă cu studiul de detalii și sintetic
al colecțiilor/mulțimilor de observații și măsurări referitoare la entitățile umane (oameni),
în vederea studierii fenomenelor biologice și medicale.

O definiție mai completă este dată de Prof. dr. Marius Mărușteri de la


Universitatea de Medicină și Farmacie din Târgu Mureș: „Biostatistica este o ramură
a statisticii, specializată în studiul fenomenelor biologice, inclusiv al celor
medicale. Se ocupă de culegerea, centralizarea şi gruparea datelor, precum şi de
prelucrarea şi determinarea unor parametri sau indicatori statistici pentru
descrierea fenomenelor biomedicale studiate, pe baza evidenţierii unor regularităţi
sau variabilităţi statistice. Totodată aplică şi dezvoltă tehnici statistico-probabilistice
pentru analiza datelor biomedicale”.

Definiție. Informatica Medicală este o disciplină interdisciplinară care se ocupă de


utilizarea noilor tehnologii (calculatoare, produse software, tehnologii Web) în domeniul
sănătății, atât pentru a fi un suport eficient în educația formală și perfecționarea continuă
150 MARIN VLADA

a medicilor, cât și pentru oferirea de resurse și echipamente digitale, tehnologii e-


Learning, precum și teorii și metode ale matematicii și informaticii în domeniul sănătății.

Informatica Medicală este o disciplină nouă, apărută în România după anul


1990. Universitatea de Medicină și Farmacie "Victor Babeş" (UMF) din Timişoara
(http://www.medinfo.umft.ro/) a fost prima instituţie de învăţămant superior din ţară care
a introdus această disciplină, sub formă de curs facultativ, încă din anul universitar 1983-
1984. Inițial, disciplina a funcţionat sub numele de „Laboratorul de Informatică
Medicală” în cadrul disciplinei de Biofizică, având în dotare un minicalculator tip M-18
pe care se desfăşurau lucrările practice, majoritatea sub formă de demonstraţii. Astăzi,
disciplina are o dotare modernă, cu 2 săli de lucrări practice: calculatoare PC și 2 servere
cu multiple facilităţi multimedia, inclusiv Sala Demo dotată cu o staţie grafică şi un
sistem de achiziţie şi prelucrare a semnalelor biologice (Sursa: http://medinfo.
umft.ro/dim/).
Aceste activități sunt susținute de Societatea Română de Informatică Medicală
(SRIM) / Romanian Society of Medical Informatics (http://srim.aut.upt.ro/contact.php) ce
este o organizaţie ştiinţifică, profesională şi non-guvernamentală, și care îşi propune să
promoveze cercetarea activă şi dezvoltarea comunităţilor informaticii medicale în
domeniul academic, comercial şi medical atât în ţară, cât şi în străinătate. SRIM are peste
120 de membri: medici, experţi IT, ingineri, matematicieni şi alţi profesionişti, care îşi
desfăşoară activitatea în domeniul Informaticii medicale. Organizaţia continuă activitatea
unui grup de specialişti, care a început să lucreze în acest domeniu încă din anul 1977
(Sursa: http://srim.aut.upt.ro/despre-srim.php). Remarcăm o tradiție a acestei organizații
privind organizarea Conferinţei Naţionale de Informatică Medicală (RO-MEDINF), încă
din anul 1977 (http://srim.aut.upt.ro/romedinf.php).
De asemenea, scoatem în evidență experiența UMF Târgu Mureș privind
platforma digitală https://www.umftgm.ro/e-umf.html în utilizarea tehnologiilor
E-learning. „Învăţământul de tip e-Learning permite derularea unor activităţi moderne, la
distanţă, prin administrarea unui domeniu, gestionarea utilizatorilor pe domeniul
respectiv, crearea unui management accesibil al cursurilor împreună cu activităţile şi
resursele asociate acestora, evaluarea studenţilor şi comunicarea dintre cadre didactice şi
studenţi ” (Sursa: https://www.umftgm.ro/index.php?id=3608).

Centrul Naţional de Statistică şi Informatică în Sănătate Publică (CNSISP)

În Romania, informaţiile de sănătate sunt centralizate, prelucrate şi puse la dispoziţia


celor interesaţi, de aproape 68 de ani – din anul 1948, de o instituţie care a trecut prin mai
multe transformări (Sursa: Dan D. Farcaş15, doctor în matematică, membru titular al
Academiei de Ştiinţe Medicale, http://www.marketwatch.ro/articol/3880/Centrul_
de_Statistica_Medicala_implineste_60_de_ani/):

15
Exemplu. Date statistice privind Obezitatea, Anul 2016, http://insp.gov.ro/sites/cnepss/wp-
content/uploads/2016/05/Analiza-de-situatie-pt-ZEIO-2016.pdf
Statistică şi Informatică pentru chimie medicală şi farmaceutică 151

 Anul 1948 – s-a înființat Direcţia Evidenţei şi Statisticii Sanitare a Ministerului


Sănătăţii; aceasta a realizat anchetele stării de sănătate a populaţiei din România
din anii 1959 și 1964; volumul imens de date a fost prelucrat din anul 1949 până
la începutul anilor 1970 de o „Staţie de maşini statistice” de tip mecanografic.
 Anul 1970 – devine secție a Institutului de Igienă cu numele de Centrul de Calcul
şi Statistică Sanitară (CCSS), când avea peste 150 de angajaţi, iar în anul 1975
obţine personalitate juridică și gestionează Arhiva Ministerului Sănătăţii Publice
şi Centrul de Documentare Medicală.
 Anul 1976 – CCSS este dotat cu un calculator electronic din generația a III-a –
licență franceză, calculatorul Felix-C256, fabricat în România, la Fabrica de
Calculatoare Bucuresti; Printr-un contract derulat cu CEPECA, în perioada
1971-1974 s-a elaborat primul sistem informatic naţional al sănătăţii, pentru:
evidenţa unităţilor sanitare, evidenţa aparaturii medicale, ancheta fertilităţii,
evidenţa donatorilor de sânge, evidenţa bolnavilor de silicoză, urmată de registre
naţionale similare pentru alte boli cronice (cancer, hepatită etc.); în anul 1977
CCSS a fost desemnat „centru de calcul coordonator, cu atribuţii de organizare,
îndrumare şi control ale activităţilor de informatică în domeniul sanitar“, între
atribuţii fiind menţionat faptul că CCSS „avizează aplicaţiile de informatică în
domeniul sanitar, recomandând măsuri şi soluţii în vederea introducerii şi
generalizării în exploatare a acestora, pentru realizarea de sisteme informatice
unitare“.
 Perioada 1983-1990 – proiectele de informatizare în sănătate din România,
finanţate din bani publici, puteau fi puse în funcţiune doar cu avizul CCSS; au
fost realizate anchetele stării de sănătate a populaţiei din România din anii 1983,
1989, 1997, pe eşantioane cu reprezentativitate naţională, vizând circa 100 boli
cornice.
 Anul 1990 – CCSS s-a dotat cu tehnica de calcul modernă (calculatoare PC), iar
de la mijlocul anilor 1990, a început creşterea explozivă a informatizării în sector,
descentralizarea sistemului sanitar, autonomia crescută a unităţilor de îngrijire a
sănătăţii, apariţia caselor de asigurări de sănătate etc.
 Anul 2006 – devine Centrul Naţional pentru Organizarea şi Asigurarea
Sistemului Informaţional şi Informatic în domeniul Sănătăţii.
 Anul 2010 – CCSS devine Centrul Naţional de Statistică şi Informatică în
Sănătate Publică (CNSISP), sub Institutul Național de Sănătate Publică –
http://www.ccss.ro/public_html/; apare și Centrul Național de Evaluare și
Promovare a Stării de Sănătate16 (CNEPSS).

Exemplu. Prevalența obezității de cauză neendocrină pe medii, în perioada 2004-2014.


Sursa: Raport naţional „Evaluarea nivelului de dezvoltare fizică şi a stării de sănătate pe
baza examenelor medicale de bilanţ la copiii şi tinerii din colectivităţile şcolare din
mediul urban şi rural, anul şcolar 2013-2014”.

16
M. Vlada, Dan D. Farcaș – de la calculatorul MECIPT la gândirea pluralistă, 2014,
http://mvlada.blogspot.ro/2014/12/dan-d-farcas-de-la-calculatorul-mecipt.html
152 MARIN VLADA

Tendința prevalenței obezității de cauză neendocrină este de creștere, atât în


mediul urban (de la 1,6% în 2004 la 2,9% în 2014), cât și în cel rural (de la 0,7% în 2004
la 1,22% în 2014), valorile înregistrate în intervalul de timp studiat fiind de peste de două
ori mai mari în urban (fig. 94).

Fig. 94. Obezitatea, comparația urban-rural

În practică, cercetările/studiile se realizează pe un număr restrâns de entități


(populații statistice, eșantioane), dar concluziile vor fi aplicate pe întreaga populație de
elemente.

Exemplu. Testarea unui medicament se face pe un număr restrâns (corespunzător) de


voluntari/pacienți, iar rezultatele vor fi aplicate pentru o întreagă populație.

Exemplu. În cazul alegerilor parlamentare, în ziua alegerilor, imediat după închiderea


urnelor, se pot anunța rezultatele sondajelor de opinie, numite sondaje exit-poll. Acestea
se realizează pe un număr restrâns de votanți dintr-un număr de secții de votare alese pe
baza unor reguli statistice.
Prezentarea rezultatelor unui sondaj exit-poll – România anul 2016.

Nr. Partid Procent


1 P1 46%
2 P2 21%
3 P3 9%
4 P4 6%
5 P5 5%
6 P6 6%
7 P7 3% =SUM(C6:C1
8 Alții 4% 3)
Suma 100%
Statistică şi Informatică pentru chimie medicală şi farmaceutică 153

Fig. 95. Rezultate exil-poll

Fig. 96. Rezultate exil-poll reprezentate ca Chart Pie

Evaluarea activităților didactice la Facultatea de Matematică și Informatică


– anul 2016

Începând cu anul universitar 2015/2016, studenții Facultății de Matematică


și Informatică – Universitatea din București au evaluat, prin intermediul unei
platforme online (Perioada de evaluare: 05/01/17 - 15/01/17), activitățile cadrelor
didactice de pe cele două semestre. Toți studenții de la programele de învătământ
Licență/Master/ID au avut posibilitatea să participe la această evaluare. Evaluarea a
constat în completarea unui chestionar cu întrebări tip grilă și întrebări deschise
154 MARIN VLADA

pentru fiecare activitate (curs/seminar/laborator) aferentă fiecărei discipline urmate pe


parcursul fiecărui semestru. Evaluările au avut un caracter anonim, fiecare student s-a
autentificat în aplicație folosind o parolă de tip token.

Fig. 97. Pagina platformei de evaluare online de la FMI (2017) -


http://evaluare.fmi.unibuc.ro

Întrebările de tip grilă pentru fiecare activitate didactică (curs/seminar/laborator)


evaluată au avut următoarele răspunsuri (Sursa: http://fmi. unibuc.ro/ro/pdf/2017/
rapoarte/Raport_asupra_evaluarii_activitatilor_didactice_de_catre_studenti_2015-
2016.pdf) :
 prea scăzut; scăzut; bun; ridicat; prea ridicat.
 dezacord total; dezacord parțial; neutru; acord parțial; acord total.
 mult mai ușor; mai ușor; echilibrat; mai greu; mult mai greu.
Răspunsurile studenților, cuantificate numeric și exprimate în procente au fost
obținute prin calculul mediei tuturor răspunsurilor pentru toate disciplinele de pe ambele
semestre. Pentru fiecare activitate evaluată chestionarul a conținut și 3 întrebări deschise,
la care studenții au putut răspunde liber: 1. Ce mi-a plăcut; 2. Cum consider că va putea fi
îmbunătățit; 3. Alte comentarii.
Răspunsurile la aceste întrebări au fost analizate în detaliu și împărțite în 5
categorii: 1. Aspecte pozitive importante; 2. Aspecte pozitive moderate; 3. Aspecte neutre;
4. Aspecte negative moderate; 5. Aspecte negative importante.
Dintr-un număr total de 2165 studenți ai FMI au evaluat cel puțin un curs 524 de
studenți (24% din total). Unii studenți au evaluat toate activitățile urmate pe parcursul
semestrului, alții au evaluat doar anumite activități. Au fost completate 3797 de
chestionare, reprezentând aproximativ 15% din numărul maxim de chestionare care s-ar
Statistică şi Informatică pentru chimie medicală şi farmaceutică 155

fi putut completa. Tabelul de mai jos prezintă gradul de participare al studenților la


evaluare pe domenii și ani de studiu.

Tehnologia
LICENȚĂ Matematică Informatică Total
Informației

Anul 1 28% 78% 37% 30%


Anul 2 34% 89% 38% 33%
Anul 3 28% 51% 24% 23%
Anul 4 20% 20%

Fig. 98. Participarea studenților la procesul de evaluare

Exemplu. Rezultatele privind răspunsurile la următoarele 4 întrebări:

1. Întrebarea 4.1 - Profesorul a respectat materia din programă


2. Întrebarea 4.2 - Expunerea profesorului a fost riguroasa și inteligibilă
3. Întrebarea 4.3 - A fost explicată utilitatea / importanța cursului în pregătirea
profesională
4. Întrebarea 4.4 - Profesorul mi-a dat impresia că stăpânește materia predată.

Dezacord Dezacord Acord Acord


Întrebare Total Parțial Neutru Parțial total
I4.1 2.81% 2.61% 18.89% 16.49% 59.17%
I4.2 9.24% 9.87% 16.30% 19.11% 45.45%
I4.3 11.42% 9.24% 21.04% 17.23% 41.05%
I4.4 4.10% 4.40% 12.27% 14.64% 64.57%
156 MARIN VLADA

Fig. 99. Răspunsurile la cele 4 întrebări-Reprezentarea grafică de tip „Diagrama bare”

Fig. 100. Reprezentarea grafică de tip „Diagrama Sector” –


„Pie Chart” pentru fiecare întrebare

Referință
http://fmi.unibuc.ro/ro/pdf/2017/rapoarte/Raport_asupra_evaluarii_activitatilor_didactice
_de_catre_studenti_2015-2016.pdf)
Statistică şi Informatică pentru chimie medicală şi farmaceutică 157

3.1.1 Concepte și definiții privind prelucrările statistice

Definitie. O populație/colectivitate statistică reprezintă o mulțime/colecție de persoane/


obiecte/produse/animale/ etc., pentru care se generează baza de date/set de date
caracterizate prin informații/date numerice obținute prin măsurări ale căror proprietăți
trebuie prelucrate și analizate.

Definitie. Un element al unei populații/colectivități statistice se numește unitate statistică


(individ statistic).

Conceptul de populație statistică este fundamental în statistică. De regulă, în


limbajul obișnuit, prin „populație” înțelegem o mulțime de oameni, persoane, cetățeni etc.
În statistică, „populația” poate fi o mulțime de persoane/obiecte/produse/animale/ etc.
caracterizate prin date numerice obținute prin măsurări. De exemplu: mulțimea
salariaților unei firme, mulțimea studenților unei universități/facultăți, colecție de
medicamente, mulțime de pacienți, mulțimea produselor realizate într-o companie etc.

Exemple. O mulțime de 100 de cobai cărora le-a fost injectat intraperitoneal o anumită
substanţă activă, pentru a studia un anumit efect farmacologic al acesteia, reprezintă
un exemplu de populaţie statistică. Populația unei țări/regiuni reprezintă un exemplu de
populaţie statistică.

O populaţie/colectivitate statistică poate fi:


 finită - exemplul de mai sus reprezintă o populaţie statistică finită.
 infinită - urmărirea frecvenţei de apariţie a unui anumit efect secundar pentru
un medicament dat la nivelul unei clinici pe o durată nedefinită de timp (ce
poate continua luni sau ani) reprezintă un exemplu de populaţie
statistică infinită.
 ipotetică - exemplu de populaţie statistică ipotetică pot fi parametrii
farmacocinetici ai unui model farmacocinetic simulat pe calculator
care va urma să fie verificat şi experimental.
 omogenă/neomogenă – criteriul de omogenitate este dat de coeficientul de
omogenitate/variație ce se calculează prin indicatori ai variației - prin
„împrăștierea datelor” (abaterea standard/medie) sau prin calculul dispersiei
(a se vedea în continuare despre indicatori statistici).

Exemplu. Să presupunem că se studiază statistiv o populație/coplectivitate de pacienți.


Dacă V este coeficientul de omogenitate/variație și V < 35%, atunci populația studiată
statistic este omogenă și media este reprezentativă pentru această populație. Dacă V >
75%, atunci populația studiată statistic este neomogenă și media nu este reprezentativă.

Definiție. Un eșantion (probe) E este o submulțime a unei populații statistice P,


E  P.
158 MARIN VLADA

Exemplu: Mulțimea pacienților dintr-un spital, din mulțimea pacienților din toate
spitalele, mulțimea medicamentelor pentru bolile cardiace din mulțimea medicamentelor,
mulțimea studenților dintr-o facultate a unei universități etc.
Definiție. O variabilă/variabilă de răspuns, uneori numită și parametru, este o
caracteristică numerică/informațională comună tuturor elementelor, și care prezintă
interes în cazul fiecărui element al unei populații statistice P sau al unui eșantion E.

Există următoarele tipuri de caracteristici (variabile măsurate în diverse moduri,


cu diverse unități de măsură):
 cantitative – reprezintă dimensiune, înălțime, masă corporală, volum,
concentrație, intensitate, forță etc., și sunt exprimate/măsurate cu valori
numerice, adică
- discrete – valori întregi (valori în mulțimea mumerelor întregi Z)
- continue – valori reale: fracții, numere cu zecimale (valori în mulțimea R)
 calitative – reprezintă grad de evaluare, grad de satisfacere, grad de utilitate
etc., și sunt exprimate/măsurate prin atribute de tipul: mai puțin bun, bun,
defect; nesatisfăcator, satisfăcător, bine, foarte bine, excelent.

Exemplu. Numărul pacienților dintr-un spital este exprimat cu numere naturale (tip
discret), iar concentrația unei substanțe active dintr-un medicament este exprimată cu
fracții sau numere cu zecimale (valori continue).

Exemplu. Pentru evaluarea unui curs predat de un cadru didactic, la întrebarea privind
complexitatea cursului, se răspunde cu următoarele criterii: mult mai ușor; mai ușor;
echilibrat; mai greu; mult mai greu.Variabilele ce sunt caracteristicile elementelor unei
populații statistice sau ale unui eșantion, se notează cu X, Y, Z, ... sau X1, X2, ... Xn. În
termeni de tabele (foi de calcul Excel) sau baze de date, variabilele sunt câmpurile unui
tabel/bază de date (care constituie capul de tabel).

Exemplu: Variabilele pentru fiecare pacient al unui eșantion sunt: „Nume și prenume
pacient”, „Vârstă”, „Masă corporală”, „Înălțime”, „Asigurat”, adică 5 variabile notate cu
X1, X2, X3, X4, X5.
Variabile/Parametri

Nr. Nume și prenume Vârsta Masă Înălțime Asigurat


crt. pacient corporală
1 Popescu Mihai 42 85,67 75,80 Da
2 Iancu Stelian 56 90,70 65,79 Da
3 Voicu Ion 67 88,90 68,80 Nu
4 Marinoiu Stefan 80 92,45 68,56 Da
5 Albescu Valeriu 37 78,67 70,34 Da

Seturi de date
Statistică şi Informatică pentru chimie medicală şi farmaceutică 159

Definiție. O dată este „valoarea” unei variabile de răspuns în cazul unui element al
populației sau al unui eșantion.

Exemplu: Elementul „Popescu Mihai” are asociate următoarele date: 42; 85,67; 75,80;
Da, corespunzătoare celor 5 variabile.

Definiție. Un set de date reprezintă valorile unei variabile/variabile de răspuns în cazul


unei populații statistice sau a unui eșantion. Într-un set de date valorile nu sunt neaparat
diferite deoarece se referă la elementele populației statistice sau eșantionului.

Exemplu: Valorile setului de date asociate variabilei „Masă corporală” sunt diferite, iar
valorile setului de date asociate variabilei „Asigurat” nu sunt diferite.

Reprezentarea unei diagrame – se selectează coloana „Nume și prenume pacient”,


apoi <Ctrl> și se selectează coloana „Vârsta”.

Fig. 101. Reprezentarea variabilei „Vârsta”

Definitie. Un experiment/sondaj este o planificare de activități având ca scop/obiective


obținerea unor seturi de date asociate unor variabile.

Exemplu: Definirea prealabilă a obiectivelor unui sondaj/experiment, a populației


statistice/eșantionului și a variabilei/variabilelor.

De exemplu, Obiectivul, populația statistică și variabila:


a) Obiectivul – Compararea eficacității unui medicament nou cu eficacitatea unui
medicament standard; populația statistică este reprezentată de pacienții care suferă de o
boală ce se tratează cu medicamentul considerat; variabila este timpul de recuperare;
160 MARIN VLADA

b) Obiectivul: Estimarea venitului mediu al unei familii dintr-un anumit județ;


familiile din județ reprezintă eșantionul; venitul total al unei familii din județ reprezintă
variabila.

Exemplu: Evaluarea activităților didactice la Facultatea de Matematică și Informatică –


anul 2016, prin intermediul unei platforme online. Evaluarea a constat în completarea
unui chestionar cu întrebări tip grilă și întrebări deschise pentru fiecare activitate
(curs/seminar/laborator). În acest caz avem:
 Obiectivul sondajului – „Evaluarea cursurilor de către studenți este un
proiect al FMI care vizează îmbunătățirea serviciilor educaționale oferite de
facultate”. Rezultatele obținute de evaluarea activităților didactice de către
studenți, prin prelucrarea statistică a informațiile colectate din chestionare,
vor fi valorificate prin măsuri centralizate, menite să contribuie la
îmbunătățirea generală a activităților didactice din facultate, și prin creșterea
conștientizării și responsabilității cadrelor didactice evaluate. Raportul
privind rezultatele evaluarii a fost postat pe site-ul facultății –
http://fmi.unibuc.ro/ro/.
 Populația/colectivitatea statistică – invitația privind completarea online a
chestionarului a fost adresată tuturor studenților FMI (total 2165 studenți),
desi doar 524 de studenți au evaluat cel puțin un curs 524 (24% din total).
 Variabilele – întrebările de tip grilă pentru fiecare activitate didactică
(curs/seminar/laborator) cu răspunsuri după următoarele 5 criterii:
- prea scăzut; scăzut; bun; ridicat; prea ridicat, sau
- dezacord total; dezacord parțial; neutru; acord parțial; acord total, sau
- mult mai ușor; mai ușor; echilibrat; mai greu; mult mai greu.
 Prelucrări statistice – răspunsurile au fost cuantificate numeric în procente
obținute prin calculul mediei pentru toate răspunsurile, pentru toate
disciplinele de pe ambele semestre.

Definiție. Un parametru este o caracteristică/valoare numerică a unei populații statistice P.


Pentru a nota un parametru se folosesc litere grecești: α, β, ... .

Exemplu: Salariul mediu al salariaților dintr-o anumită țară, procentul de oameni cu


afecțiuni cardiace la nivelul unei regiuni, procentul de studenți ai unei universități ce sunt
integraliști după sesiunea de examene.

Definiție. O statistică este o caracteristică/valoare numerică a unui eșantion E. Pentru a


nota o statistică, se folosesc litere latine: a, b, c, ... .

Exemplu: Înălțimea medie a pacienților internați într-un spital, procentul de oameni cu


afecțiuni cardiace la nivelul unui oraș.

Diversitatea de probleme referitoare la fenomene/procese/evenimentue studiate


de statistică oferă o clasificare a metodelor, prelucrărilor și modelor oferite:
 Statistică descriptivă (descriptive statistics) – este ramura statisticii ce se
ocupă de înțelegerea seturilor de date prin prelucrări și prezentări: indicatori
Statistică şi Informatică pentru chimie medicală şi farmaceutică 161

statistici (medie, mediană, dispersie/varianță etc.), grafice și diagrame


(grafice liniare, histograme, grafice de distribuție). Interpretarea datelor și
prelucrărilor vor fi facute de Statistica deductivă pentru a formula concluzii
și a lua decizii;
 Statistică deductivă/inferențială ((inferential statistics) – este ramura
statisticii ce utilizează modele în datele probă pentru a extrage deducții
despre populația statistică reprezentată. Aceste deducții pot lua formă de:
răspunsuri da/nu la întrebări despre seturile de date (testarea ipotezei,
estimarea caracteristicilor numerice ale datelor-estimare, descrierea-
asocieri între date corelare și modelarea relațiilor între date).

Statistica oferă modele, metode și instrumente pentru prelucrarea setelor de date.


Statistica este aplicabilă unor varietăți de discipline academice, incluzând științe naturale
și sociale, dar și unor domenii privind guvernarea, economia, educația, sănătatea,
afaceri etc. Consultanții în statistică ajută organizațiile și companiile care nu dispun de
expertiză "in-house" relevantă întrebărilor specifice companiilor sau organizațiilor.
Statistica aplicată cuprinde statistica descriptivă și statistica deductivă. Statistica
matematică/Statistica teoretică se preocupă cu argumentele logice ce subliniază
justificarea abordărilor asupra statisticii deductive.

Exemplu: Fizica statistică cuprinde trei discipline ale fizicii teoretice, înrudite prin
obiectul de studiu, dar diferite prin metodele utilizate. Obiectul de studiu comun sunt
fenomenele în care, într-un sistem macroscopic, are loc un transfer de lucru mecanic,
căldură sau substanță:
 Termodinamică – se ocupă cu studiul fenomenologic, la scară macroscopică,
al fenomenelor care decurg cu schimb de lucru mecanic, căldură și substanță.
Baza teoretică a termodinamicii o constituie un număr redus de principii,
derivate prin generalizare și abstractizare din fapte experimentale,
 Mecanică statistică – numită și termodinamică statistică, studiază proprietățile
sistemelor macroscopice la echilibru, utilizând metode statistice. Aceste
metode sunt aplicate unui colectiv statistic (ansamblu statistic) constând dintr-un
număr mare de stări microscopice ale sistemului studiat. Colectivul statistic
este presupus reprezentativ pentru sistem, în sensul că el trebuie să conțină, cu
ponderi corecte, toate stările stările dinamice microscopice compatibile cu
starea macrocopică dată,
 Teoria cinetică – utilizează metode statistice pentru a determina proprietățile
macroscopice ale unui sistem, pornind de la dinamica microscopică (forțele
care acționează la scară moleculară și atomică). Spre deosebire de mecanica
statistică, nu se limitează la studiul stărilor de echilibru termodinamic.

Alte exemple privind diversitatea aplicațiile statisticii cu suport dat de


tehnologiile informatice:
 în educație – statistica descriptivă este utilizată pentru a prezenta diverse
rezultate obținute de elevi și studenti; se realizează diverse estimări privind
evoluția unor procese în sistemul de educație prin modele oferite de statistica
deductivă;
162 MARIN VLADA

 în știință – analiza datelor esperimentale prin instrumentele statisticii


descriptive și colectarea de eșantioane și analiza acestora prin statistica
deductivă;
 în domeniul economic, guvernare, afaceri etc. – statistica descriptivă este
utilizată pentru a prezenta diverse rezultate obținute în activitățile
economice, sociale etc.; se realizează diverse estimări privind evoluția unor
procese în domeniile vieții economice și sociale prin modele oferite de
statistica deductivă.

Teoriile folosite în statistică au la bază Teoria probabilităților. Statistica matematică


folosește diferite teorii și anume:
 Teoria selecției (teoria estimației, testele de semnificație);
 Teoria controlului statistic (de exemplu, în industrie);
 Teoria deciziilor cu analiză secvențială;
 Teoria predicției, legată de teoria proceselor stochastice.

3.1.2 Produse software pentru prelucrări statistice și reprezentări grafice

Odată cu dezvoltarea domeniului Informaticii și IT, au apărut sisteme de


calcul/calculatoare din ce în ce mai performante, dar și programe/sisteme informatice/
(produse software specializate) dintre cele mai eficiente și mai variate, care oferă
prelucrările și analizele ce trebuie realizate de aplicațiile statisticii.
Exemple de produse software/programe utilizate mai mult:
1. Excel – Microsoft Excel is a spreadsheet developed by Microsoft (calcule
matematice, statistice, inginerești etc.) – https://products.office.com/en/excel
2. SPSS Packages – IBM SPSS Statistics (pachet de calcul statistic pentru
științe sociale) – http://www.ibm.com/analytics/us/en/technology/spss/.
3. SAS (Statistical Analysis Software) – Sistem de analiză statistică –
http://www.sas.com/en_us/software/analytics/stat.html
4. Epi Info – Software for data analyses with epidemiologic statistics. Epi Info
is statistical software for epidemiology developed by Center for Disease
Control and Prevention (CDC, USA). The program allows for electronic
survey creation, data entry, and analysis – https://www.cdc.gov/
epiinfo/index.html
5. PSPP – GNU PSPP is a program for statistical analysis of sampled data
https://www.gnu.org/software/pspp/
6. Statgraphics – „Statgraphics is a powerful yet intuitive software program for
data analysis, data visualization, statistical modeling, and predictive
analytics. It is a comprehensive program offering over 230 procedures
covering everything from summary statistics to advanced statistical models” –
http://www.statgraphics.com/
7. GNUPLOT – „It was originally created to allow scientists and students to
visualize mathematical functions and data interactively, but has grown to
support many non-interactive uses such as web scripting” –
http://www.gnuplot.info/
Statistică şi Informatică pentru chimie medicală şi farmaceutică 163

8. Q-DAS – Software company developing advanced statistical analysis


methods – http://www.q-das.com/en/applications/
9. AdAmsOFT – ADaMSoft is a free and Open-Source System for Data
Management, Data and Web Mining, Statistical Analyis –
http://adamsoft.sourceforge.net/ .
10. Minitab – Statistical Software – https://www.minitab.com
11. BMSR – Biomedical Simulations Resource – https://bmsr.usc.edu/software/
12. SalStat – Friendly, free data analysis. Making statistics friendlier –
http://www.salstat.com/.
13. SimFit - Simfit is a free software OpenSource Windows/Linux package for
simulation, curve fitting, statistics, and plotting, using a library of models or
user-defined equations. University of Manchester UK – http://www.
simfit.org.uk/.
14. OriginPro – Graphing and analysis; OriginLab publishes graphing and data
analysis software. „Our products provide a comprehensive solution for
scientists and engineers who need to analyze, graph, and professionally
present data”. OriginLab is headquartered in Northampton, Massachusetts,
USA - http://www.originlab.com/2016.

Observație: Top 10 free Statistical Software – http://www.predictiveanalyticstoday.


com/top-free-statistical-software/.

Exemplu. Programul SimFit utilizat pentru aplicații în:


 biology (nonlinear growth curves);
 ecology (Bray-Curtis dendrograms);
 psychology (factor analysis);
 physiology (membrane transport);
 pharmacology (dose response curves);
 pharmacy (pharmacokinetics);
 immunology (ligand binding);
 biochemistry (calibration);
 biophysics (enzyme kinetics);
 epidemiology (survival analysis);
 medical statistics (meta analysis);
 chemistry (chemical kinetics);
 physics (dynamical systems);
 mathematics (numerical analysis).
164 MARIN VLADA

Fig. 102. Pagina Web a programului SimFit - http://www.simfit.org.uk

Fig. 103. Exemple de reprezentări grafice folosind programul SimFit


Statistică şi Informatică pentru chimie medicală şi farmaceutică 165

3.2 Prelucrări statistice. Probleme rezolvate


Diferența dintre Statistică și Probabilități

Probleme 1. Comparația dintre urna


probabilistă și urna statistică.

Teoria probabilităților realizează


fundamentele prelucrărilor, metodelor și
modelelor utilizate de Statistică. Statistica și
Teoria probabilităților sunt două domenii
strâns legate, dar distincte ale matematicii.
Pentru a ilustra diferența dintre Probabilități și
Statistică vom considera două urne:
 o urnă probabilistă – urna conține 20 bile, adică 5 bile albe, 5 bile negre, 5
bile albastre și 5 bile roșii; pentru aceasta se poate rezolva o problemă de
probabilitate, adică dacă se scoate o bilă din urnă, se cere probabilitatea ca
aceasta să fie de culoare albă;
 o urnă statistică – urna conține 20 bile, dar nu se cunoaște combinația de
bile din urnă, și anume numărul de bile de o anumită culoare (albă, neagră,
albastră, roșie). Se extrage un eșantion (1, 2, 3 bile) și folosind acest eșantion
să se deducă ce culori au bilele din urnă.
Se pot afirma următoarele:
 în primul caz, pentru a determina probabilitatea cerută, trebuie să se
raspundă la întrebarea privind șansa ca un eveniment să se întâmple atunci
când se cunosc posibilitățile (se cunoaște populația statistică).
 în al doilea caz, statistica ne cere să facem un eșantion, să analizăm
eșantionul și pe urmă să realizăm o predicție asupra populației pe baza
informației găsite în eșantion.

3.2.1 Numărul de locuitori la un pat din unitățile sanitare – indicele Nl/p

Problema 2. Numărul paturilor de spital din România (stabilit prin HG 449/2014 privind
aprobarea Planului Național de Paturi pentru perioada 2014-2016).

În anul 2016, Ministerul Sănătății a asigurat finanțarea publică a 119.579 paturi


din unități sanitare publice și private (spitale). Din datele furnizate de ISE (Institutul
Național de Statistică) la numărul total de locuitori (populația după domiciliu) - rezultă un
pat la 186 de persoane. Potrivit Eurostat, în 2013 România avea 667 de paturi la 100.000
de locuitori, mai multe decât Danemarca, Belgia, Spania, Portugalia sau Slovenia. Un
număr mai mare de paturi la suta de mii de locuitori a raportat Germania (peste 800),
Austria, Ungaria sau Lituania (peste 700 de paturi).
Specialități medicale (conform ISE): Interne, Chirurgie, Cardiologie, ORL,
Obstretică-Ginecologie, Pediatrie, Nou născuți și imaturi, Boli infecțioase, Tuberculoză și
pneumologie, Psihiatrie și neuropsihiatrie, Oftalmologie, Neurologie. Dermatologie-
166 MARIN VLADA

venerologie, Oncologie, Recuperare, Medicină fizică și balnearologie, ATI (anestezie, terapie


intensivă), Medicina de familie, Medicina muncii, Ecografie, Imagistică medicală (CT).
Se poate observa că e necesar să se calculeze un indice (o valoare) – numărul de
locuitori la un pat, pe care îl notăm cu Nl/p, ce reprezintă numărul de paturi disponibile în
unitățile sanitare raportat la numărul de locuitori din județ/regiune/țară, adică numărul de
locuitori la un pat de spital.

Definiție. Numărul de paturi disponibile în unitățile sanitare raportat la numărul de


locuitori din județ/regiune/țară este dat de indicele Nl/p, și se calculează prin formula
Nl
Nl / p  ,
Np
Nl este numărul de locuitori, respectiv Np este numărul de paturi aferente.
După acest indice (numărul de paturi raportat la populație), primele zece județe sunt:
Nr. Crt. Județ Nr. Locuitori
la un pat - În București (indicele este 103) și în
1 Cluj 115 13 județe din România, un pat de
2 Iași 134 spital deservește mai puțin de 200 de
3 Timiș 149 locuitori.
4 Mureș 151 - În județele Giurgiu, Ialomița, Ilfov,
5 Covasna 157 Călărași, Vrancea și Tulcea, un pat de
6 Dolj 160 spital deservește mai mult de 300 de
locuitori.
7 Hunedoara 163
8 Bihor 175
9 Brașov 183
10 Sibiu 184

Exercițiu. Folosind datele furnizate de INS (Institutul Național de Statistică) - Populaţia


României pe localități la 1 ianuarie 2016) http://www.insse.ro/cms/ro/content/
popula%C5%A3ia-rom%C3%A2niei-pe-localitati-la-1-ianuarie-2016), setul de date
(valori numerice) pentru Nl și Np se găsesc în tabelele ce urmează. Folosind datele din
cele două tabele, propunem ca exercițiu, determinarea indicelui Nl/p pentru toate județele.
De exemplu, pentru București avem Nl/p =2106144/20341 = 103,54 , iar pentru Cluj
avem Nl/p =721955/6237 = 115,75 (a se vedea tabelul de mai sus, unde valoarea este 115).

Tabel cu numărul total de paturi aferente fiecărui județ (valori pentru Np)
Nr. Nr. paturi Nr. Nr. paturi
Județ Județ
Crt. aferente Crt. aferente
1 București 20331 2 Ilfov 644
3 Prahova 3649 4 Buzău 1843
5 Ialomița 775 6 Călărași 953
7 Brăila 1777 8 Tulcea 800
9 Constanța 4418 10 Dâmbovița 2028
11 Giurgiu 683 12 Teleorman 1591
13 Olt 1830 14 Dolj 4380
Statistică şi Informatică pentru chimie medicală şi farmaceutică 167

15 Argeș 2746 16 Gorj 1888


17 Vâlcea 1946 18 Mehedinți 1296
19 Caraș-Severin 1491 20 Timiș 4972
21 Arad 2191 22 Bihor 3528
23 Alba 1802 24 Sibiu 2527
25 Brașov 3438 26 Mureș 3931
27 Cluj 6237 28 Harghita 1724
29 Covasna 1453 30 Sălaj 1055
31 Satu Mare 1605 32 Maramureș 2518
33 Bistrița-Năsăud 1282 34 Suceava 2880
35 Botoșani 2062 36 Neamț 2374
37 Iași 6853 38 Bacău 3180
39 Vaslui 1943 40 Vrancea 1253
41 Galați 2838 42 Hunedoara 2873

Datele au fost preluate de la adresa: https://pressone.ro/harta-judetelor-cu-


numarul-paturilor-de-spital/, unde este prezentată o harta interactivă cu aceste date. Sunt
marcate pe harta României numărul de paturi aferente fiecărui județ (a se vedea tabelul
precedent), iar sub hartă, se află un top al județelor după numărul paturilor de spital
disponibile, raportat la populație (a se vedea tabelul de mai sus).

Fig. 104. Harta interactivă. Numărul total de paturi aferente fiecărui județ
168 MARIN VLADA

Referințe
1. Codruţa Simina, Harta județelor, cu numărul paturilor de spital, https://pressone.ro/harta-
judetelor-cu-numarul-paturilor-de-spital/
2. ISE, Paturi de spital aferente anumitor specialități medicale, la sfârșitul anului,
http://statistici.insse.ro/shop/index.jsp?page=tempo3&lang=ro&ind=SAN102A.

Fig. 105. Graficul complet (cu București)

Fig. 106. Graficul fără București


Statistică şi Informatică pentru chimie medicală şi farmaceutică 169

Fig. 107. Populația după regiuni și macroregiuni (sursa INS )


170 MARIN VLADA

Rezolvarea exercițiului. Determinarea indicelui Nl/p , numărul de locuitori la un pat.

Coloana A =ROUNDDOWN(D9/C9,0)

Nr. Județ Paturi Populația Indice Nr. Judet Paturi Populația Indice
aferente Nl/p aferente Nl/p
1 București 20331 2106144 103 22 Harghita 1724 333674 193
2 Alba 1802 380976 211 23 Hunedoara 2873 469853 163
3 Arad 2191 473946 216 24 Ialomiţa 775 293658 378
4 Argeş 2746 646333 235 25 Iaşi 6853 919049 134
5 Bacău 3180 746566 234 26 Ilfov 644 390751 606
6 Bihor 3528 619102 175 27 Maramureş 2518 525765 208
Bistriţa- 1282 1296
329188 Mehedinţi 286678
7 Năsăud 256 28 221
8 Botoşani 2062 455973 221 29 Mureş 3931 595948 151
9 Braşov 3438 630807 183 30 Neamţ 2374 577359 243
10 Brăila 1777 356196 200 31 Olt 1830 450094 245
11 Buzău 1843 478811 259 32 Prahova 3649 809052 221
Caraş- 1491 1605
328047 Satu Mare 390639
12 Severin 220 33 243
13 Călăraşi 953 317293 332 34 Sălaj 1055 247537 234
14 Cluj 6237 721955 115 35 Sibiu 2527 464202 183
15 Constanţa 4418 769768 174 36 Suceava 2880 743645 258
16 Covasna 1453 228732 157 37 Teleorman 1591 389433 244
17 Dâmboviţa 2028 528426 260 38 Timiş 4972 742886 149
18 Dolj 4380 700117 159 39 Tulcea 800 244249 305
19 Galaţi 2838 631669 222 40 Vaslui 1943 479815 246
20 Giurgiu 683 276781 405 41 Vâlcea 1946 403171 207
21 Gorj 1888 366261 193 42 Vrancea 1253 391169 312

Tabelul 6. Sortarea după indicele Nl/p , numărul de locuitori la un pat.


Nr. paturi Indicele
Nr. Crt. Județ aferente Populația Nl/p
1 București 20331 2106144 103
2 Cluj 6237 721955 115
3 Iaşi 6853 919049 134
4 Timiş 4972 742886 149
5 Mureş 3931 595948 151
6 Covasna 1453 228732 157
7 Dolj 4380 700117 159
8 Hunedoara 2873 469853 163
9 Constanţa 4418 769768 174
10 Bihor 3528 619102 175
11 Braşov 3438 630807 183
Statistică şi Informatică pentru chimie medicală şi farmaceutică 171

12 Sibiu 2527 464202 183


13 Gorj 1888 366261 193
14 Harghita 1724 333674 193
15 Brăila 1777 356196 200
16 Vâlcea 1946 403171 207
17 Maramureş 2518 525765 208
18 Alba 1802 380976 211
19 Arad 2191 473946 216
20 Caraş-Severin 1491 328047 220
21 Botoşani 2062 455973 221
22 Mehedinţi 1296 286678 221
23 Prahova 3649 809052 221
24 Galaţi 2838 631669 222
25 Bacău 3180 746566 234
26 Sălaj 1055 247537 234
27 Argeș 2746 646333 235
28 Neamţ 2374 577359 243
29 Satu Mare 1605 390639 243
30 Teleorman 1591 389433 244
31 Olt 1830 450094 245
32 Vaslui 1943 479815 246
33 Bistriţa-Năsăud 1282 329188 256
34 Suceava 2880 743645 258
35 Buzău 1843 478811 259
36 Dâmboviţa 2028 528426 260
37 Tulcea 800 244249 305
38 Vrancea 1253 391169 312
39 Călăraşi 953 317293 332
40 Ialomiţa 775 293658 378
41 Giurgiu 683 276781 405
42 Ilfov 644 390751 606
172 MARIN VLADA

Fig. 108. Diagrama pentru indicele Nl/p

Observație: Se poate observa că indicele cel mai mic îl are București (103), iar indicele
cel mare mare îl are judetul Ilfov (606). Se poate explica, doar prin faptul că județul Ilfov
se găsește în jurul orașului București și, probabil că locuitorii săi apelează frecvent la
serviciile medicale oferite de București. De asemenea, se poate observa că în primele 14
județe un pat de spital deservește cel puțin 200 locuitori.

Fig. 109. Foaia de calcul - Diagrama pentru indicele Nl/p


Statistică şi Informatică pentru chimie medicală şi farmaceutică 173

TENDINȚE ȘI PREDICȚIE

Se consideră că reducerea numărului de paturi spitalicești stimulează tratarea mai


eficientă a pacientului și reducerea costurilor în sistemul medical. La nivel european
există o tendință generală de reducere a numărului de paturi spitalicești, media fiind de
5,2 paturi la o mie de locuitori. Germania, Austria, Polonia sau Ungaria au un număr de
paturi mai mare decât România. În același timp, la nivelul UE numărul de paturi din
spitalele private a crescut în ultimii ani.
După aceste analize și prelucrări privind subiectul studiat, vom defini cerințele
problemei.

Cerințe și formularea problemei: estimarea indicelui Nl/p

Ministerul Sănătății dorește să facă un plan de dezvoltare a unităților sanitare din


România, și de exemplu, pentru a estima evoluția indicelui Nl/p (numărul de locuitori la
un pat de spital), pe o periodă de 2 ani sau chiar de 10 ani, este nevoie să se răspundă la
mai multe întrebări sau să se analizeze evoluția unor parametri ce influențează starea de
sănătate a oamenilor:
 Cum va evolua populația în perioada studiată?
 Care este valoarea indicelui la momentul analizei?
 Care sunt specialitățile medicale ce oferă servicii medicale în regim de spital?
 Care este numărul de îmbolnăviri raportate la specialitățile medicale studiate
și într-o anumită perioadă?
 Care este evoluția și numărul cadrelor medicale din spitale?

Acestea sunt doar câteva din întrebările și aspectele ce trebuie avute în vedere
pentru rezolvarea problemei enunțate. Rezultatele obținute vor fi folosite în luarea de
măsuri și decizii la nivel guvernamental, așa cum am precizat la începutul definirii
problemei: HG 449/2014 privind aprobarea Planului Național de Paturi pentru perioada
2014-2016.
Se va ajunge la rezultatele dorite folosind Statistica prin intrumentele oferite,
metodele de generare a eșantioanelor, tehnici de analiză a eșantioanelor, și în final prin
realizarea de predicții (estimări) asupra populației statistice pe baza informațiilor găsite în
eșantioanele studiate.

Referințe
1. Ștefan Balint, Loredana Tănasie, Statistică – Notițe de curs, Universitatea de Vest din
Timișoara, Statistica.pdf
2. Nicoleta Breaz, Marian Crăciun, Păstorel Gaşpar,. Maria Miroiu, Iuliana Paraschiv-Munteanu.
Modelarea.matematică prin Matlab, 2011,
http://www.edumanager.ro/community/documente/probabilitati%20si%20statistica.pdf
3. L. Boiculese, C. Dascălu, G. Dimitriu, M. Moscalu, A. Doloca, Metode Descriptive și Elemente
de Analiză Statistica a datelor medicale. Exemple practice în Excel și Access, Editura
Performantica, Iași.
174 MARIN VLADA

3.3 Cercetare, eșantioane și colectarea datelor


În vederea realizării unei cercetări (experiment, sondaj) și obținerii unor rezultate
folosind metodele și instrumentele oferite de Statistică, sunt necesare parcurgerea
următoarelor etape:
1. Definirea și enunțul obiectivelor experimentului/sondajului;
2. Definirea populației statistice și a variabilelor corespunzătoare obiectivelor;
3. Definirea seturilor de date pentru întreaga populație statistică (Recensământ)
sau selectarea unui eșantion (Cadrul de eșantionare);
4. Proiectarea eșantionului privind procedura de alegere a elementelor
eșantionului: eșantion probabilist (aleator), eșantion sistematic, eșantion
stratificat, eșantion proporțional, eșantion ciorchine;
5. Colectarea seturilor de date;
6. Prelucrarea statistică a datelor: indicatori, ipoteze, estimări.

Fig. 110. Etapele unei cercetări statistice

Definitie. Un recensământ este un ansamblu de entități enumerate sau listate și cuprinde


elementele populației statistice împreună cu datele asociate (valorile variabilelor).
Pentru o populație statistică de volum mare (la nivelul unei țări sau regiuni),
constituirea unui set de date la nivelul populației studiate este dificil și foarte costisitor
privind costurile și timpul de realizare. De aceea, în cazul în care nu este posibilă
realizarea unui recensământ, setul de date trebuie să se constituie doar pentru o
submulțime (parte) a populației, și anume pentru un eșantion. În acest caz, selecția
elementelor pentru eșantion se face dintr-un cadru de eșantionare.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 175

Conform legislației din România, Recensământul populaţiei şi al locuinţelor este


„operaţiunea care produce la intervale regulate numărarea oficială a populaţiei pe
teritoriul unei ţări şi în cele mai mici sub-teritorii geografice ale sale, împreună cu un
număr selectat de caracteristici demografice şi sociale ale populaţiei. De asemenea,
produce informaţii referitoare la stocul de locuinţe. Această operaţiune are avantajul
obţinerii informaţiei referitoare la două universuri – populaţie şi condiţii de locuit – în
cadrul aceluiaşi proces de diseminare.”

Operaţiunea include procesul colectării, agregării, prelucrării, evaluării,


diseminării şi analizei informaţiilor culese de pe teren. Pentru planificarea şi
implementarea politicilor economice şi sociale de dezvoltare, pentru activităţi
administrative sau de cercetare ştiinţifică este necesară existenţa unor date detaliate
referitoare la mărimea, distribuţia şi compoziţia populaţiei. Recensământul este o sursă
primordială pentru aceste date. Sursa: http://www.recensamantromania.ro/despre-
recensamant/.

Observație. În România, „Recensământul populaţiei şi al locuinţelor” s-a realizat ultima


dată în anul 2011, iar precedentele au fost în anii: 1859-1860; 1899; 1912; 1930; 1941;
ianuarie 1948; februarie 1956; martie 1966; ianuarie 1977; 1992; 2002 (Sursa:
http://www.recensamantromania.ro/istoric/lista-recensafmintelor-populației/).

Primul Recensămint oficial ale populaţiei din Romania în perioada 1859-1860

Aceasta este prima investigaţie de acest fel care a urmărit atât aspecte
demografice, cât şi aspecte economico-sociale, simultan, în cele două provincii unite la
24 ianuarie 1859: Principatele Unite ale Moldovei și Țării Românești. Oficial, La 12 iulie
1859, Domnitorul Alexandru Ioan Cuza semnează Ordonanţa domnească nr. 276 de
înfiinţare a Oficiului Central de Statistică Administrativă, marcând crearea statisticii
oficiale din România. Unirea Principatelor Române, cunoscută ca Mica Unire (Marea
Unire este cea din anul 1918), a avut loc la jumătatea secolului al XIX-lea prin unirea
statelor Moldova și Țara Românească sub numele Principatele Unite ale Moldovei și
Țării Românești.
La acea dată, la București, exista Serviciului Statistic Central din Ţara
Românească condus de Dionisie Pop Marţian (1829-1865), iar la Iași, Direcția de
Statistică a Moldovei condusă de Ion Ionescu de la Brad (1818-1891). Din aceste motive
acțiunile pentru recensământ s-au realizat separat pe cele două provincii recent unite.

„Metodologia de lucru şi indicatorii înregistraţi au diferit de la o provincie la alta,


Dionisie Pop Marţian, la Bucureşti, şi Ion Ionescu de la Brad, la Iaşi, având puncte de
vedere diferite privind modul de abordare a acţiunii. Dar, dincolo de chestiunile tehnice,
şi unul, şi celălalt aveau aceeaşi viziune privind principiile şi obiectivele statisticii, locul
ei în sistemul instituţiilor publice şi misiunea sa în slujba programului social într-o
Românie în care, pentru prima oară după secole de aşteptare, apăruseră condiţiile
dezvoltării unitare şi dinamice, ca premiză de prosperitate pentru toţi cetăţenii ţării
unite.”. Sursa: http://www.recensamantromania.ro/istoric/recensaminte-1859-1990/.
176 MARIN VLADA

Fig. 111. Pagina INS, Recensămintele oficiale ale populaţiei în perioada 1859-1990

Deși, în cele două provincii, oficialii nu s-au pus de acord asupra modului de
desfăşurare a recensământului, acesta a urmat un program de observare asemănător în
cele două principate. „Rezultatul a fost că, deşi desfăşurat în condiţii dificile prin
precaritatea mijloacelor financiare şi puţinătatea recenzorilor pregătiţi ca atare („cei 500
de inteligenţi” cum inspirat i-a numit Dionisie Pop Marţian), lucrările recensământului se
vor încheia cu succes, rezultatele fiind prezentate la 25 iunie 1860, pentru Muntenia, şi în
vara lui 1861, pentru Moldova”.

CONCLUZII ȘI OBSERVAȚII:
1. Rezultatele au oferit guvernului Al. I. Cuza importante informaţii privind
populaţia, după sex, stare civilă, vârstă şi infirmităţi, după naţionalitate şi
cult religios, pe categorii sociale şi medii, după profesii etc. într-o dispunere
pe judeţe, regiuni şi oraşe.
2. Următoarele recensăminte ale populaţiei din anii 1899 şi 1912, au fost
organizate şi conduse de Leonida Colescu (1872-1940), statistician, demograf,
economist, cu doctoratul la Paris, în ştiinţe economice şi financiare, director al
Serviciului General de Statistică. Acesta a aplicat următoarele principii,
cerinţe conforme cu practica statistică internaţională a timpului, valabile şi
astăzi: (1) efectuarea pe baza unei legi speciale; (2) dispunerea de resurse
Statistică şi Informatică pentru chimie medicală şi farmaceutică 177

pentru stimularea unui corp de recenzori şi controlori statistici; (3)


obligativitatea răspunsurilor; (4) independenţa faţă de orice operaţiuni de
înregistrare cu caracter fiscal.

3.3.1 Ultimul recensământ din România

Populația orașelor din județul Constanța (conform INS, Recensământul populaţiei


şi al locuinţelor, anul 2011).

ORAȘ TOTAL MASCULIN FEMININ


CONSTANȚA 317832 149118 168714
MANGALIA 42208 20433 21775
MEDGIDIA 46045 22303 23742
BĂNEASA 5830 2919 2911
CERNAVODĂ 19401 9532 9869
EFORIE 10978 5264 5714
HÂRȘOVA 11228 5452 5776
MURFATLAR 11633 5749 5884
NĂVODARI 41660 20452 21208
NEGRU VODĂ 5778 2866 2912
OVIDIU 15613 7740 7873
TECHIRGHIOL 8073 3945 4128
URBAN 536279 255773 280506

Fig. 112. Populația unor orașe din județul Constanța


178 MARIN VLADA

Populația localităților (comune) din județul Constanța (conform INS,


„Recensământul populaţiei şi al locuinţelor”, 2011)
LOCALITATE TOTAL MASCULIN FEMININ
23 AUGUST 5751 2889 2862
ADAMCLISI 2388 1232 1156
AGIGEA 7932 3967 3965
ALBESTI 3755 1900 1855
ALIMAN 2888 1535 1353
AMZACEA 2853 1476 1377
BARAGANU 2148 1079 1069
CASTELU 5408 2721 2687
CERCHEZU 1436 729 707
CHIRNOGENI 3403 1689 1714
CIOBANU 3523 1815 1708
CIOCÂRLIA 3141 1586 1555
COBADIN 9493 4746 4747
COGEALAC 5597 2857 2740
COMANA 2018 1040 978
CORBU 6289 3247 3042
COSTINEȘTI 3170 1566 1604
CRUCEA 3253 1698 1555
CUMPĂNA 14209 7057 7152
CUZA VODĂ 4356 2222 2134
DELENI 2488 1294 1194
DOBROMIR 3501 1808 1693
DUMBRĂVENI 562 298 264
FÂNTĂNELE 1632 850 782
GARLICIU 1739 885 854
GHINDĂREȘTI 2724 1398 1326
GRĂDINA 1154 587 567
HORIA 1172 590 582
INDEPENDENȚA 3054 1593 1461
ION CORVIN 2090 1101 989
ISTRIA 2588 1318 1270
LIMANU 6553 3309 3244
LIPNITA 3233 1645 1588
LUMINA 10603 5287 5316
MERENI 2471 1279 1192
Statistică şi Informatică pentru chimie medicală şi farmaceutică 179

MIHAI VITEAZU 3722 1924 1798


MIHAIL KOGĂLNICEANU 10300 5100 5200
MIRCEA VODĂ 5366 2721 2645
NICOLAE BĂLCESCU 5501 2780 2721
OLTINA 2696 1353 1343
OSTROV 5034 2577 2457
PANTELIMON 1839 983 856
PECINEAGA 3416 1744 1672
PEȘTERA 3562 1864 1698
POARTA ALBĂ 5625 2843 2782
RAȘOVA 3900 2043 1857
SĂCELE 2405 1240 1165
SALIGNY 2283 1154 1129
SARAIU 1334 678 656
SEIMENI 2231 1146 1085
SILIȘTEA 1519 782 737
TÂRGUȘOR 1680 874 806
TOPALU 1816 936 880
TOPRAISAR 6182 3139 3043
TORTOMAN 1925 1025 900
TUZLA 7115 3475 3640
VALU LUI TRAIAN 14715 7236 7479
VULTURU 748 390 358

Fig. 113. Populația localităților din județul Constanța


180 MARIN VLADA

Sortarea după numărul populației.


Nr. Localitate Populație Nr. Localitate Populație
1 DUMBRĂVENI 562 30 COSTINEȘTI 3170
2 VULTURU 748 31 LIPNITA 3233
3 GRĂDINA 1154 32 CRUCEA 3253
4 HORIA 1172 33 CHIRNOGENI 3403
5 SARAIU 1334 34 PECINEAGA 3416
6 CERCHEZU 1436 35 DOBROMIR 3501
7 SILIȘTEA 1519 36 CIOBANU 3523
8 FÂNTÂNELE 1632 37 PEȘTERA 3562
9 TÂRGUȘOR 1680 38 MIHAI VITEAZU 3722
10 GARLICIU 1739 39 ALBEȘTI 3755
11 TOPALU 1816 40 RASOVA 3900
12 PANTELIMON 1839 41 CUZA VODĂ 4356
13 TORTOMAN 1925 42 OSTROV 5034
14 COMANA 2018 43 MIRCEA VODĂ 5366
15 ION CORVIN 2090 44 CASTELU 5408
16 BĂRĂGANU 2148 45 N. BĂLCESCU 5501
17 SEIMENI 2231 46 COGEALAC 5597
18 SALIGNY 2283 47 POARTA ALBĂ 5625
19 ADAMCLISI 2388 48 23 AUGUST 5751
20 SĂCELE 2405 49 TOPRAISAR 6182
21 MERENI 2471 50 CORBU 6289
22 DELENI 2488 51 LIMANU 6553
23 ISTRIA 2588 52 TUZLA 7115
24 OLTINA 2696 53 AGIGEA 7932
25 GHINDĂREȘTI 2724 54 COBADIN 9493
26 AMZACEA 2853 55 M. KOGĂLNICEANU 10300
27 ALIMAN 2888 56 LUMINA 10603
28 INDEPENDENȚA 3054 57 CUMPĂNA 14209
29 CIOCÂRLIA 3141 58 VALU LUI TRAIAN 14715

Fig. 114. Sortare - Populația localităților din județul Constanța


Statistică şi Informatică pentru chimie medicală şi farmaceutică 181

3.3.2 Proiectarea unui eșantion

Definiție. Un cadru de eșantionare este un ansamblu de entități enumerate sau listate și


cuprinde elementele populației statistice din care se extrage eșantionul împreună cu datele
asociate (valorile variabilelor).

În cazul unei populații de persoane, de exemplu, listele de alegători sau cărțile


de telefon, sunt folosite adesea drept cadru de eșantionare. În functie de variabila de
răspuns acestea pot fi cadre de eșantion potrivite sau nepotrivite. După definirea cadrului
de eșantionare se trece la stabilirea modului de alegere a elementelor eșantionului.

Definiție. Proiectarea eșantionului înseamnă stabilirea procedurii de alegere a


elementelor eșantionului din cadrul de eșantionare.

Există mai multe procedee de alegere a elementelor eșantionului. Aceste procedee


împreună cu eșantioanele corespunzătoare se împart în două categorii:
 procedee bazate pe reprezentativitate – eșantioare pentru care elementele se
aleg astfel încât din perspectiva variabilei de răspuns, elementul ales să fie
reprezentativ pentru populație.
 procedee probabiliste – eșantion (probabilist) pentru care elementele sunt
selectate pe bază probabilistă; oricare element din cadrul eșantionului are o
anumită șansă nenulă sa fie selectat.
Exemple pentru procedeul bazat pe reprezentativitate:
1. în cazul unei variabile referitoare la un medicament pentru boli cardio-
vasculare, eșantionul va cuprinde doar pacienți cu boli cardio-vasculare,
ceilalți nu sunt reprezentativi;
2. în cazul unei variabile referitoare la modul de predare al unui curs predat de
un cadru didactic, nu sunt reprezentativi studenții ce nu au frecventat cursul
respectiv predat de cadrul didactic;
3. în cazul unei variabile referitoare la timpul liber petrecut de tinerii cu vârste
de 10-18 ani, sunt reprezentativi doar tinerii ce au vârste în intervalul
menționat.

În cazul inferențelor statistice e nevoie ca eșantionul să fie probabilist.


Eșantioanele probabiliste aleatoare sunt cele mai utilizate eșantioane probabiliste.

Definiție. Un eșantion aleator simplu este un eșantion probabilist aleator pentru care
elementele sunt selectate dintr-un cadru în care elementele au aceeași probabilitate să fie
alese.
Metode corecte de selectare a unui eșantion probabilist aleator simplu:
 utilizarea unui generator de numere aleatoare;
 utilizarea unei tabele de numere aleatoare;
 utilizarea unei stratificări.
182 MARIN VLADA

Definiție. Un eșantion sistematic se construiește alegând fiecare al k-lea (pas de


numărare) element din cadrul eșantionului cadru.

În această metodă de selecție se folosește o singură dată generatorul de numere


aleatoare sau tabela de numere aleatoare, pentru a determina punctul de plecare, după
care se face selecția elementelor.

Exemplu. Dacă se consideră un cadru de eșantion de 300 de pacienți și se dorește


construirea unui eșantion sistematic format din 20 de pacienți, atunci se parcurg
următoarele etape:
 se codifică numărul de pacienți cu numere de la 1 la 300;
 se determină pasul de numărare k = [nr. elemente din cadrul eșantionului /
nr. elemente din eșantion] = [300/20] = 15;
 se alege aleator punctul de plecare între 1 și numarul k=15. Folosind
generatorul de numere aleatoare sau un tabel de numere aleatoare, de
exemplu, dacă acest numar este 11, atunci obținem eșantionul, n = 11 + i k,
i {0,,19} , adică numerele asociate pacienților: 11, 26, 41, 56, 71, 86,
101, 116, 131, 146, 161, 176, 191, 206, 221, 236, 251, 266, 281, 296.
Generarea eșantionului selectat se poate face folosind programul Excel prin
generarea (folosind Fill Series), în coloana A, începand cu rândul 2, a numerelor
consecutive (numărul de ordine) 0, ..., 19, iar în coloana B, în celula B2, se introduce
formula de calcul „=11+A2*15”, după care aceasta se copiază la celelate rănduri din
coloana B. Avem tabelul din Excel:

i n 10 161
0 11 B2 11 176
1 26 =11+A2*15 12 191
2 41 13 206
3 56 14 221
4 71 15 236
5 86 16 251
6 101 17 266
7 116 18 281
B21
8 131 19 296
=296
9 146

Trebuie să precizăm că folosirea eșantionului sistematic nu este potrivită dacă


populația statistică este repetitivă sau ciclică în natură, din perspectiva variabilei de
răspuns. În cazul când se eșantionează populații statistice foarte mari, atunci când este
posibil, se împarte populatța în subpopulații statistice pe baza unor caracteristici. Aceste
subpopulații se numesc straturi, iar straturile sunt eșantionate separat. Aceste
subeșantioane pot fi aleatoare, sistematice etc. După aceea, subeșantioanele sunt
asamblate într-un singur eșantion pentru a colecta un set de date.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 183

Definiție. Un eșantion stratificat este un eșantion obținut în urma stratificării cadrului


eșantionului și prin selectarea unui număr dat de elemente din fiecare strat.

Exemplu. Pentru studierea unor caracteristici dintr-o populație de pacienți, această


populație poate fi împărțita (partiționată/stratificată) după: afecțiunile de care suferă,
vârstă, masa corporală etc. De asemenea, în cadrul unei populații de studenți de la o
anumită facultate, pentru studierea unor caracteristici, mulțimea studenților poate fi
împărțită (partiționată/stratificată) după: ani de studii, domenii de studii etc.

Definiție. Un eșantion cotă / eșantion proporțional este un eșantion stratificat ce se


construiește prin selectarea unui număr de elemente din fiecare strat, după o anumită cotă
sau proporțional cu mărimea stratului.

Exemplu: Pentru studierea unor caracteristici dintr-o populație de studenți, dacă se


dorește construirea unui eșantion de 100 de studenți din populația studenților Facultății de
Chimie, putem face stratificarea după anii de studiu. În acest caz, numărul de studenți ce
va fi selectat din fiecare an, va fi selectat proporțional cu numărul total de studenți din
anul respectiv:
=F4/$F$7
Anul de Număr Studenți
studiu studenti Procent eșantion
Anul I 240 44.44% 44
Anul II 200 37.04% 37 =100*G4
Anul III 100 18.52% 19
Total 540 100
În foaia de calcul Excel, tabelul este creat în coloanele E, F, G, H, începând cu randul 3.

Format Cells Percentage Format Cells Number, Decimal places=0


184 MARIN VLADA

Prin urmare, eșantionul va fi format din 44 de studenți din anul I, 37 de studenți


din anul II, și 19 studenți din anul III.

3.3.3 Gruparea statistică în intervale/clase

Fie un set de date/vector de valori: X  ( xi )i1,n


.
Definiții.
- Gruparea statistică a unui set de date este o prelucrare a datelor printr-o
centralizare a datelor pe intervale de variație/clase.
- Intervalul de variaţie reprezintă diferenţa dintre limita inferioară şi limita
superioară a clasei respective.
- Frecvența absolută pentru o valoare xi din setul de date reprezintă numărul de
apariții a acestei valori în șirul de date și se notează ai, iar frecvența relativă este dată de
raportul fi = ai / n, unde n este numărul de valori ale setului de date.

Pentru gruparea datelor statistice pe intervale egale, se parcurg următoarele etape:

1. Se determină numărul de intervale/clase notat cu r – de regulă, nu există o


metodă anume; dacă setul de date are număr mare de valori, se poate utiliza
formula 2  n , unde n = numărul de valori ale setului de date. Există
r

formula lui H. A. Sturges (cea mai des utilizată): r = [1+ 3,322 ∗ lgn], unde [ ]
este funcția partea întreagă (Ex. n=150, r=1+3,322*LOG10(150). Pentru
n > 100, există formula lui H. B. Mann şi A. Wald:
n 1
r  4*5
4
(Exemplu. n=150, r=4*POWER(149/4;1/5)).
2. Se determină amplitudinea variaţiei, notată cu A. Acesta este diferenţa dintre cea
mai mare valoare posibilă şi cea mai mică valoare posibilă, din setul de date:
A = Xmax – Xmin
3. Se determină mărimea intervalelor de grupare a datelor notată cu K= [A/r],
unde [ ] este funcția partea întreagă
4. Se determină limitele pentru fiecare grupă – se va stabili cea mai mică valoare
şi cea mai mare valoare pentru fiecare grupă; prin urmare, intervalele vor fi
[Xmin , Xmin + K ], [1+Xmin + K, 1+Xmin + 2K ], ... [(r-1)+Xmin +(r-1)K, Xmax]
5. Se determină frecvenţele pentru fiecare interval – În gruparea datelor
statistice pe intervale este util să se construiască o distribuţie a frecvenţelor
absolute cumulate şi o distribuţie a frecvenţelor relative cumulate, pentru
analiza şi interpretarea datelor statistice. Dacă a1 , a2 , ... , ar sunt frecvențele
absolute pe intervale, iar f1 , f2 , ... , fr sunt frecvențele relative pe intervale,
atunci avem:
Statistică şi Informatică pentru chimie medicală şi farmaceutică 185

r r

 ai  n,
i 1
f
i 1
i 1
Exemplu. Se consideră 100 de medicamente pentru care se cunoaște prețul de achiziție/
vânzare. Presupunem că valorile de preț sunt cuprinse în intervalul 4-270 și cu valori
întregi.

Rezolvare. Vom genera aleator/întâmplător 100 de valori întregi în intervalul 4-270


folosind funcția RAND() oferită de programul Excel.
Vom codifica medicamentele cu numerele de ordine 1-100. În coloana A
(din celula A5) vom genera valorile 1-100 folosind o serie aritmetică oferită de Excel prin
serviciul Fill Series din meniul Home (partea dreaptă din bara meniului Home).
În coloana B (în celula B5) vom scrie formula
=RAND()*(b-a)+a , adică =RAND()*(270-4)+4 .
Formatarea celulei se va face pentru date de tip NUMBER cu 0 zecimale, după
care se va copia această formula pentru toate rândurile A6-A104.

Observație. Deoarece prin diverse acțiuni în foaia de calcul, în coloana B se generează


valori prin reexecuția funcției RAND(), se recomandă sa se realizeze COPY pentru
valorile generate inițial, și sa se ștreargă acestea, după care să se realizeze PASTE Special
cu validarea pentru VALUES.
Conform celor de mai sus, pentru gruparea datelor statistice pe intervale egale, se
parcurg următoarele etape:
1. Determinarea numărului de intervale/clase r. Deoarece 27 = 128 > 100 < 256=28,
avem r=7, prin urmare sunt 7 intervale/clase. Celelalte 2 formule dau:
r = [1+ 3,322 ∗ lgn]=8,228 și r=4*POWER(149/4;1/5)) = 8,246
2. Determinarea amplitudinii
A = Xmax – Xmin , adică A = MAX(B5:B104) - MIN(B5:B104) = 270-5 = 265
3. Determinarea mărimii intervalelor de grupare a datelor K= [A/r] = [265/7]= 37
4. Determinarea intervalelor
[Xmin , Xmin + K ], [1+Xmin + K, 1+Xmin + 2K ], ... [(r-1)+Xmin +(r-1)K, Xmax],
adică următoarele r=7 intervale/clase [5,42], [43, 80], [81, 118], [119, 156],
[157, 194], [195, 232], [233, 270]
5. Determinarea frecvențelor absolute, a frecvențelor pentru fiecare interval/clasă
și o distribuție a acestora.

Prin urmare, într-o foaie de calcul, în rândul 4 edităm câmpurile capului unui
tabel cu 4 coloane: Nr. crt., Preț, Sortare, Frecvențe, iar valorile câmpurilor vor începe să
fie din rândul 5. Coloana C va conține valorile coloanei B ordonate crescător, iar coloana
D va conține frecvențele absolute calculate folosind funcția COUNTIF().
Pentru generarea valorilor de Preț, se folosește formula
=RAND()*(270-4)+4,
iar pentru determinarea frecvențelor se folosește formula:
=COUNTIF($B$5:$B$104;C5).
186 MARIN VLADA

Tabelul 7. Valorile pentru preț și frecvențele calculate

...
Nr. Preț Sortare Frecvențe 70 249 200 1
1 134 5 1 71 159 201 1
2 158 8 1 72 68 202 1
3 201 12 1 73 204 204 1
4 181 13 1 74 170 206 1
5 124 15 1 75 53 213 1
6 15 17 1 76 269 220 1
7 167 18 1 77 220 222 1
8 70 20 1 78 259 224 2
9 54 22 2 79 227 224 2
10 187 22 2 80 199 227 2
11 270 33 1 81 72 227 2
12 176 34 1 82 99 232 1
13 202 35 1 83 55 240 3
14 91 53 1 84 128 240 3
15 13 54 1 85 159 240 3
16 255 55 1 86 70 241 1
17 85 59 1 87 114 244 1
18 17 63 1 88 188 247 1
19 247 68 1 89 5 248 1
20 135 69 1 90 116 249 1
21 8 70 2 91 63 252 1
22 260 70 2 92 88 254 1
23 120 72 1 93 200 255 1
24 195 85 1 94 241 259 1
25 110 86 1 95 97 260 1
26 20 88 1 96 22 261 1
97 224 266 1
... 98 227 268 1
99 170 269 1
100 69 270 1

Analiza datelor pe intervale/clase

În foaia de calcul, în domeniul F24:K24 vom edita câmpurile capului de tabel de


mai jos. Pentru primele două coloane, de la rândul 25, vom introduce valorile cunoscute.
Pentru coloana „Frecvențe” vom folosi funcția COUNT() pentru a calcula, pentru fiecare
interval/clasă, numărul de valori ce apar în setul de date, și anume coloana C unde sunt
valorile ordonate crescător, și apar clasele în ordine. Pentru coloana „Frecvențe relative”,
în rândul 25 vom realiza calculul =H25/100, după care vom copia formula pentru
celelalte rânduri. Următoarele două coloane sunt sumele parțiale pentru frecvențele
absolute, respectiv frecvențe relative.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 187

Prin urmare, pentru aceste 4 coloane vom folosi următoarele formule de calcul:
=COUNT(C5:C17), =H25/100, =SUM($H$25:H25), =SUM($I$25:I25).

Tabelul 8. Grupele de variație și frecvențele


Frecvențe Suma Suma
Frecvențe
Nr. crt. Grupe relative frecvențe frecvențe
ai
fi=ai/n absolute relative
1 5-42 13 0,13 13 0,13
2 43-80 10 0,1 23 0,23
3 81-118 17 0,17 40 0,4
4 119-156 11 0,11 51 0,51
5 157-194 16 0,16 67 0,67
6 195-232 15 0,15 82 0,82
7 233-270 18 0,18 100 1
Suma 100 1

Concluzii.
1. Cele mai puține medicamente, în număr de 10, au prețurile în intervalul 43-80,
2. Cele mai multe, în număr de 18, au prețuri în ultimul interval 233-270,
3. Conform ultimei coloane (Suma frecvențe relative) 51% din numărul de
medicamente au prețuri mai mici decât 157.

Repartiția datelor. Reprezentarea pe clase – Histograme

Definiție. O serie de repartiție/distribuție, notată X este un ansamblu de două șiruri


definite, dintre care primul este șirul elementelor distincte din setul de date statistice
(șirul claselor obținute prin gruparea elementelor din setul de date statistice xi), iar cel
de-al doilea este șirul de frecvențe corespunzătoare, fi.
x x2 ... xn 
X :  1 .
 f1 f2 ... f n 
Uneori, în prezentarea seriilor de repartiție/distribuție, în locul frecvențelor fi se
 n
 
folosesc frecvențele relative: i
f  f i  f i sau forma procentuală: f i  100  f i .
/
i 1

Definiție. Se numește Mod, valoarea datei care apare cu cea mai mare frecvență într-o
serie de distribuție de date statistice. Clasa cu cea mai mare frecvență într-o serie de
distribuție de date grupate se numeste clasa modală. O serie bimodală este o serie de
distribuție de date grupate în care apar 2 clase modale, separate de clase cu frecvența mai
joasă.
Frecvența cumulată a unei clase este suma frecvențelor tuturor claselor cu valori
mai mici (marca mai mică).
188 MARIN VLADA

Definiție. O serie dinamică (temporală/cronologică) este un șir dublu dintre care primul
este șirul de valori ale variabilei de răspuns, iar cel de-al doilea este șirul de momente de
timp la care variabila are aceste valori. O serie dinamică se notează astfel
x x2 ... xn 
X :  1 .
 t1 t2 ... t n 
Definiție. O Histogramă este reprezentarea grafică a distribuției de frecvențe pentru un
set de date.
Realizarea histogramei privind frecvențele absolute: se selectează valorile
coloanelor „Grupe” și „Frecvențe”.

Fig. 115. Histograma frecvențe absolute

Realizarea histogramei privind frecvențele relative: se selectează valorile


coloanelor „Grupe” și „Frecvențe relative” (nefiind alăturate, se selectează mai întâi
prima coloană, apoi ținând apăsată tasta <Ctrl>, se selectează a două coloană).

Fig. 116. Histograma frecvențelor relative


Statistică şi Informatică pentru chimie medicală şi farmaceutică 189

Fig. 117. Foia de calcul din Excel

Aplicație. Se consideră 65 de reactivi chimici utilizați în laborator pentru care se


cunoaște prețul de achiziție/vânzare. Dacă se presupune că valorile prețului sunt în
intervalul [50,700] de lei, să se realizeze gruparea în clase de variație și să se elaboreze
histograma distribuției de frecvențe. De asemenea, să se calculeze prețul de achiziție al
reactivilor, știind faptul că distribuitorul oferă o reducere de 10 % pentru gramaje mai
mari de 50 de grame de substanță. Masele reactivilor sunt exprimate prin valori cuprinse
între 5 și 100 g. Să se grupeze substanțele în funcție de starea de agregare și gradul de
toxicitate al acestora.

Rezolvare. Într-o foaie de calcul din programul Excel se elaborează calculele


corespunzătoare. Datele pentru prelucrare se află prezentate în tabelul 11. Se vor calcula
r = [1+ 3,322 ∗ lgn]=7, A = Xmax – Xmin = 650 și K= [A/r] = 92.

Tabelul 9. Grupe și frecvențe


Suma frecvențe Suma frecvențe
Nr. crt. Grupe Frecvențe Frecvența relativă
absolute relative
1 50-142 12 0.12 12 0.12
2 143-235 9 0.09 21 0.21
3 236-328 9 0.09 30 0.3
4 329-421 13 0.13 43 0.43
5 422-514 3 0.03 46 0.46
6 515-607 11 0.11 57 0.57
7 608-700 8 0.08 65 0.65
190 MARIN VLADA

Tabelul 10. Medii și toxicitate


Media Media Media prețurilor Nr. reactivi Toxicitate
prețurilor gramajelor finale
9 toxic 1
357.36 51 17776.92
Nr. Stare de 11 toxic 2
reactivi agregare 5 toxic 3
59 lichid 10 coroziv
6 solid 3 iritant
Suma 65 14 inflamabil
11 oxidant
2 nu prezintă

Tabelul 11. Valori și proprietăți pentru reactivi


Statistică şi Informatică pentru chimie medicală şi farmaceutică 191
192 MARIN VLADA

Tabelul 12. Prelucrări privind prețul


Reactivi cu m>50g 60.83 78 4745.13 4270.61
Preț 570.52 79 45266.51 40739.86
Preț înainte de Pret după
per 1g Gramaj reducere reducere 390.12 81 31421.22 28279.10
75.43 50 3775.14 3397.62 187.77 86 16057.32 14451.59
438.14 52 22694.26 20424.83 556.76 92 51420.43 46278.38
123.44 55 6847.09 6162.38 400.90 93 37146.78 33432.10
202.46 93 18892.78 17003.50
651.93 58 37808.75 34027.88
558.94 58 32656.36 29390.72 405.91 95 38375.14 34537.62
315.71 96 30364.50 27328.05
263.09 62 16188.33 14569.50
346.66 96 33374.49 30037.04
350.77 64 22400.36 20160.32
191.56 97 18509.92 16658.92
366.55 64 23494.15 21144.74
342.17 97 33232.13 29908.92
659.36 64 42526.49 38273.84
298.55 100 29838.30 26854.47
672.72 66 44386.53 39947.88
Sume 823090 740781.17
81.82 67 5497.07 4947.36
418.69 70 29213.06 26291.75
620.14 76 47258.58 42532.72
208.75 77 16117.04 14505.34

Concluzii. Cele mai puține produse au prețurile (3) în intervalul 422-514, iar cei mai mulți
reactivi (13) au prețuri cuprinse în intervalul 329-421. Conform coloanei care conține suma
frecvențelor relative, 57% din numărul reactivilor chimici au prețurile mai mici de 607 de lei. Din
punct de vedere al stării de agregare, cele mai multe produse (59) sunt lichide, iar analizând
toxicitatea reactivilor, cel mai mare număr (14) îl inregistrează substantele inflamabile. Utilizând
reducerea de 10% din partea comerciantului, s-au economisit 82309.02 lei.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 193

Analiza calitativă

Din studiul unei histograme se poate observa că datele experimentale pot prezenta
două tendinţe:
1. Tendința de localizare – datele se concentrează în jurul unei anumite valori;
2. Tendința de împrăştiere – datele rezultate în urma măsurării se vor încadra
întotdeauna într-un interval (există date la care localizarea se face în jurul
aceleiași valori, dar care prezintă împrăștieri diferite).

De asemenea, se constată că repartiția frecvențelor poate fi simetrică sau


asimetrică, în raport cu poziția de localizare.

EXERCIȚIUL 1. Se consideră 50 de studenți pentru care se cunosc notele obținute la un


examen. Presupunem că valorile notelor sunt cuprinse în intervalul 2-10, valori întregi. Se
recomandă gruparea datelor în următoarele intervale: [2-4], [5-7], [8-10]. Să se determine
distribuția datelor și histogramele.

EXERCIȚIUL 2. Se consideră 50 de studenți pentru care se cunoasc masele lor corporale.


Presupunem că valorile sunt valori întregi în intervalul 50-96,. Se recomandă gruparea
datelor în următoarele intervale: [50-55], [56-60], [61-65], [66-70], [71-75], [76-80],
[81-85], [86-90], [91-96]. Să se determine distribuția datelor și histogramele.

Analiza cantitativă

Analiza tendințelor de localizare şi de variaţie/împrăștiere se poate efectua numai


cu ajutorul unor indicatori statistici determinați de valorile caracteristicilor respective.
Specific tendinţei datelor, indicatorii statistici se clasifică în:

 indicatori de localizare – media aritmetică, notată M[x], x ,µ; media
geometrică, notată Mg; media armonică, notată Ma; media pătratică, notată Mp;
mediana, notată Me; valoarea modală, notată Vm ; valoarea centrală, notată Xc;
 indicatori de împrăştiere – Dispersia, notată D[x], σ2 (pentru populație) sau s2
(pentru eșantion) și Abaterea medie pătratică, notată D(x) , σ (pentru
populație) sau s (pentru eșantion).

Indicatorii de localizare (de poziție)


1 n
 Media aritmetică M [ x ]   xi . Folosind Excel avem =AVERAGE(B5:B104)
n i1
n
1
 Media aritmetică ponderată M [ x ] 
p1  ...  pn
px
i 1
i i , unde p1, ..., pn sunt

ponderi, de exemplu frecvențele absolute.


n
 Media geometrică M g  n x
i 1
i . Folosind Excel avem =GEOMEAN(B5:B104)

 Media armonică
194 MARIN VLADA

 n 1 
M a  n /    . Folosind Excel avem =HARMEAN(B5:B104)
 i 1 xi 
n

x
2
i
 Media pătratică . Mp 
Folosind i 1
Excel avem
n
=POWER(SUM(E5:E104)/100;1/2), dacă E5:E104 conține pătratele volorilor din
coloana B.

 Valoarea medianei este valoarea ce ocupă locul central din setul de date, și
anume
xn / 2  x( n / 21)
M e  x( n1) / 2 , unde n  impar; M e  , unde n  par
2
 Valoarea modală Vm  max ai , unde a1 , a2 , ... , an sunt frecvențele absolute ale
i 1, n

setului de date. În cazul în care repartiţia frecvenţelor este reprezentată de o


curbă, valoarea modală corespunde valorii maxime a caracteristicii. După cum
repartiţia experimentală are unul, două, sau mai multe maxime, se numeşte
unimodală, bimodală, sau polimodală. Dacă valorile sunt grupate pe clase,
intervalul care conţine elementul median se numeşte interval median /clasă
mediană.
1
 Valoarea centrală Vc  ( xmi n  xmax ) , unde xmin , xmax sunt valoarea minimă,
2
respectiv maximă, pentru valorile setului de date. Valoarea centrală se poate

referi pentru un interval j=1,r, în acest caz avem Vcj 


2

1 j

xmin  xmax
j
, unde
j j
xmin , xmax sunt valoarea minimă, respectiv maxima, pentru valorile intervalului j.

Proprietăţi şi observaţii referitoare la indicatorii statistici de localizare


 Mediile aritmetică şi pătratică sunt influenţate de valorile mari ale setului de date.
 Mediile geometrică şi armonică sunt influenţate de valorile mici şi reduc din
influenţa valorilor mari.
 Între cei patru indicatori ai mediei (armonică, geometrică, aritmetică,
pătratică) există relaţia:

Ma ≤ Mg ≤ M[x] ≤ Mp , adică

x
2
 1
n

x
n n i
1
n /    ≤ n
i ≤  xi ≤ i 1

 i 1 xi  i 1 n i 1 n
Statistică şi Informatică pentru chimie medicală şi farmaceutică 195

Exemplu. Pentru valorile din domeniul B5:B104 (valorile setului de date), avem
29,73555719 < 113,9448435 < 147 < 166,3579574
 Mediana nu este influenţată de valorile extreme.
 Pentru repartiţii unimodale simetrice, abaterea medianei faţă de media
aritmetică este egală cu o treime din abaterea valorii modale faţă de media
aritmetică: 3*|M[x] – Me| = | M[x] – Vm |.

Indicatori de împrăştiere/variație

 Dispersia, notată D[x], σ2,sau s2 este dată de formula


1 n
D[ x]   ( xi  M [ x]) 2 . Dacă vom considera frecvențele absolute,
n i 1
respectiv frecvențele relative ai, fi = ai / n, pentru i=1,n avem formula
1 n n
D[ x]   ( xi  M [ x]) * ai  ( xi  M [ x]) 2 * f i
2

n i 1 i 1

În cazul estimării dispersiei populaţiei (setul întreg de date) cu ajutorul unei


selecţii (o partiție a setului de date), dispersia de selecţie se ajustează cu un factor de
corecţie n/(n-1). În acest caz, dispersia se numeşte dispersie corectată:

n 1 n
DC [ x] 
n 1
D[ x]  
n  1 i 1
( xi  M [ x]) 2

 Abaterea medie patratică, notată σ sau s este

1 n 1 n 2
D[ x]  
n i 1
( xi  M [ x]) 
2
*  xi  M [ x]2
n i 1

1 n 1 n 2
D[ x]  
n i 1
( xi  M [ x ]) 2
* a i  *  xi * ai  M [ x]2
n i 1

n n
D[ x]   (x  M [ x]) * f i  x * f i  M [ x ]2
2 2
i i
i 1 i 1
196 MARIN VLADA

În cazul în care abaterea medie pătratică


se estimează cu ajutorul unei selecţii
/eșantion avem (funcțiile STDEV și
STDEVA oferite de Excel; funcția
STDEVP se folosește pentru populații) :

1 n
s  ( xi  M [ x]) 2
n  1 i 1

Funcția STDEVA din Excel:

STDEVA (value1,value2,...)

Value1, value2, ... are 1 to 255 values


corresponding to a sample of a
population. You can also use a single
array or a reference to an array instead of
arguments separated by commas.

Fig. 118. Funcția STDEVA (value1,value2, ...) din Excel

3.4 Testarea și eliminarea valorilor aberante

În activitatea de prelucrare a seturilor de date rezultate din măsurări și


experimente, există posibilitatea de includere a unor valori ce apar din erori de măsurări
sau din greșeli umane. Aceste date pot perturba rezultatele și, implicit, concluziile
cercetării și ca urmare a unor calcule statistice. Aceste valori de date sunt diferite de
valorile rezultate ca urmare a unor aproximări. Aceste valori vor fi numite valori
aberante (aberant/outlier values) sau valori perturbatoare.

Definiție. O valoare dintr-un set de date se numește valoare aberantă/perturbatoare dacă


are o valoare disparată/discrepantă față de celelalte valori ce satisfac un anumit test
statistic, indicat de valorile critice ale unui nivel de încredere/risc procentual.

În cursul observațiilor/măsurărilor – în cazul în care nu au fost sesizate situații


deosebite (eroare umană, defecte de măsurare, defecte tehnologice etc.), este necesar să se
analizeze oportunitatea eliminării datelor aberante în faza de prelucrare statistică a
rezultatelor. Această operație este posibilă pe baza unor teste statistice care impun
alegerea unei probabilități (valori critice ce indică un nivel de încredere) în funcție de
care se ia decizia de păstrare sau de eliminare. Această verificare a setului de
date/eșantionului obținut poartă denumirea de analiza critică a datelor.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 197

Fie un set de date/vector de valori ordonate crescător sau descrescător


X  ( xi )i1,n
.
Prin urmare, fie valorile X = (x1, x2, ... , xn) ordonate crescător. Testele/metodele ce
trebuie aplicate sunt următoarele:
1. Testul Irwin (testul λ) – valorile fiind ordonate, se face testul pentru valorile
extreme x1 și xn. Pentru fiecare se calculează valoarea

| xa  v | 1 n

s
,s 
n  1 i 1
( xi  M [ x]) 2
,

unde xa este una din cele două valori extreme, iar v este valoarea cea mai apropiată de
aceasta, adică v=x2 dacă xa=x1 și v=xn-1 dacă xa=xn. M[x] este media aritmetică, iar
valoarea s este abaterea medie patratică. Testul: dacă λcritic ≤ λ, atunci valoarea xa este
valoare aberantă, și se va elimina, unde λcritic se va citi din tabelul valorilor critice pentru
nivelele de încredere (risc de încredere).

2. Testul Grubbs (testul u) – valorile fiind ordonate, se face testul pentru valorile
extreme x1 și xn. Pentru fiecare se calculează valoarea

| xa  M [ x ] | 1 n
u
s
,s 
n  1 i 1
( xi  M [ x]) 2
,

unde xa este una din cele două valori extreme. M[x] este media aritmetică, iar valoarea s
este abaterea medie pătratică.
Testul: dacă ucritic ≤ u , atunci valoarea xa este valoare aberantă, și se va elimina,
unde ucritic se va citi din tabelul valorilor critice pentru nivelele de încredere (risc de
încredere).

3. Testul Romanowski (testul t) – valorile fiind ordonate, se face testul pentru


valorile extreme x1 și xn. Pentru fiecare se calculează valoarea

| xa  M [ x ] | 1 n
t
n
,s  ( xi  M [ x]) 2
n  1 i 1
s
n 1 ,

unde xa este una din cele două valori extreme. M[x] este media aritmetică, iar valoarea s
este abaterea medie patratică.

Testul: dacă tcritic ≤ t atunci valoarea xa este valoare aberantă, și se va elimina, unde tcritic
se va citi din tabelarea valorilor critice pentru nivelele de încredere/risc de încredere.
198 MARIN VLADA

Tabelul 13. Tabelul valorilor critice pentru nivelele de încredere/risc de încredere


(există în literartura de specialitate-statistică).

Testul Irwin - Nivel Testul Gubbs - Nivel Testul Romanowski -

Număr încredere încredere Nivel încredere


valori (n) Nivel Nivel Nivel Nivel Nivel Nivel Nivel Nivel Nivel
0,95 0,98 0,99 0,95 0,98 0,99 0,95 0,98 0,99

3 1,79 2,17 2,90 4,93 8,04 9,46 1,41 1,41 1,41

4 1,64 2,05 2,75 3,56 5,08 6,53 1,71 1,72 1,73

5 1,51 1,93 2,60 3,04 4,11 5,04 1,92 1,96 1,97

6 1,39 1,81 2,45 2,78 3,64 4,36 2,07 2,13 2,16

7 1,31 1,69 2,30 2,62 3,36 3,96 2,18 2,27 2,31

8 1,24 1,57 2,16 2,51 3,18 3,71 2,27 2,37 2,43

9 1,20 1,51 2,09 2,43 3,05 3,54 2,35 2,46 2,53

10 1,18 1,46 2,03 2,37 2,96 3,41 2,41 2,54 2,62

11 1,14 1,43 2,00 2,33 2,89 3,31 2,47 2,61 2,69

12 1,11 1,41 1,97 2,29 2,83 3,23 2,52 2,66 2,75

13 1,09 1,39 1,94 2,26 2,78 3,17 2,56 2,71 2,81

14 1,07 1,37 1,91 2,24 2,74 3,12 2,60 2,76 2,86

15 1,06 1,35 1,88 2,22 2,71 3,08 2,64 2,80 2,91

16 1,05 1,33 1,86 2,20 2,68 3,04 2,67 2,84 2,95

17 1,04 1,31 1,84 2,18 2,66 3,01 2,70 2,87 2,98

18 1,03 1,29 1,82 2,17 2,64 3,00 2,73 2,90 3,02

19 1,03 1,28 1,81 2,16 2,62 2,95 2,75 2,93 3,05

20 1,03 1,27 1,80 2,15 2,60 2,93 2,78 2,96 3,08


Statistică şi Informatică pentru chimie medicală şi farmaceutică 199

Fig. 119. Testul IRWIN diagrama 3D-Column

Fig. 120. Testul IRWIN – Diagrama Line


200 MARIN VLADA

Comparație pe nivelul 0,95. Testul Irwin.

Fig. 121. Testul IRWIN – Nivel 0.95

Fig. 122. Testul IRWIN, Nivel 0.95-Diagrama Pie

Exemplu. Pentru un număr de 19 pacienți (cu o anumita boală) se determină numărul de


zile de tratament ce au fost necesare pentru vindecare: 164, 169, 176, 172, 167, 167, 179,
176, 189, 149, 181, 184, 172, 172, 174, 169, 174, 176,174. Prin urmare n=19 și
X=(164, 169, 176, 172, 167, 167, 179, 176, 189, 149, 181, 184, 172, 172, 174, 169, 174,
176,174).
Statistică şi Informatică pentru chimie medicală şi farmaceutică 201

Într-o foaie de calcul din Excel, presupunem că în coloana D67:D85, sunt valorile
sortate. În coloanele E, F și G se vor calcula-conform celor 3 teste, valorile pentru fiecare
valoare a lui X, conform următoarelor formule scrise în Excel:
=ABS(D67-$C$86)/($C$88*SQRT((20/19)))

=ABS(D67-D68)/$C$88 =ABS(D67-$C$86)/$C$88

Testul Testul Testul


Nr. crt. X Sortare
Irwin Gubbs Romanowski
1 164 149 1,785 2,838 2,766
2 169 164 0,357 1,052 1,026
3 176 167 0,000 0,695 0,678
4 172 167 0,238 0,695 0,678
5 167 169 0,000 0,457 0,446
6 167 169 0,357 0,457 0,446
7 179 172 0,000 0,100 0,098
8 176 172 0,000 0,100 0,098
9 189 172 0,238 0,100 0,098
10 149 174 0,000 0,138 0,134
11 181 174 0,000 0,138 0,134
12 184 174 0,238 0,138 0,134
13 172 176 0,000 0,376 0,366
14 172 176 0,000 0,376 0,366
15 174 176 0,357 0,376 0,366
16 169 179 0,238 0,733 0,714
17 174 181 0,357 0,971 0,946
18 176 184 0,595 1,328 1,294
19 174 189 0,595 1,923 1,875
M[X] 172,8421
D[X] 70,5848
S 8,401476
202 MARIN VLADA

Fig. 123. Valorile sortate

Rezultate:
1. Testul Irwin (testul λ) – λcritic ≤ λ, pentru n=19, λcritic pentru nivele 0,95; 0,98;
0,99 – în tabelul valorilor critice, avem: 1,03; 1,28; 1,81. Cum pentru valoarea
minimă =149, avem λ=1,785, atunci valoarea este aberantă, excepție riscul de
1% (0,99);
2. Testul Grubbs (testul u) – ucritic ≤ u, pentru n=19, ucritic pentru nivele 0,95;
0,98; 0,99 – în tabelul valorilor critice, avem: 2,16; 2,62; 2,95. Cum pentru
valoarea minimă =149, avem u=2,838, atunci valoarea este aberantă, excepție
riscul de 1% (0,99);
3. Testul Romanowski (testul t) – tcritic ≤ t, pentru n=19, tcritic pentru nivele 0,95;
0,98; 0,99 – în tabelul valorilor critice, avem: 2,75; 2,93; 3,05. Cum pentru
valoarea minimă =149, avem t=2,766, atunci valoarea este aberantă, excepție
riscul de 2% (0,98) și 1% (0,99);

Toate celelalte valori nu sunt valori aberante.

Temă. Folosind RAND() ce generează aleator volori în intervalul [0, 1], să se genereze
n=110 valori în intervalul [10, 50] și pentru care să se aplice testele privind găsirea
valorilor aberante. De regulă, pentru n > 100 se aplică testul Grubbs.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 203

Indicație. Într-o celulă vom scrie formula „=RAND()*(b-a)+a”, unde a=10, b=50, după
care o vom copia pe coloană, până la 110 valori generate.

Referințe
1. Marius Bulgaru, Prelucrarea statistică a șirurilor de date. Eliminarea valorilor aberante,
Universitatea Tehnică Cluj-Napoca, www.cermi.utcluj.ro/doc/Lucr_03.pdf
2.Sorana D. Bolboacă, Informatică medicală și Biostatistică. Estimarea parametrilor statistici,
prezentare ppt, Universitatea de Medicină și Farmacie, Cluj-Napoca, http://sorana.academicdirect.
ro/pages/doc/MV2012/MVRom01.pdf
3.http://www.info.umfcluj.ro/ro/did-ro/biostat-ro/mg1ro-ro/itemlist/category/203-cursuri2
4.http://www.info.umfcluj.ro/ro/component/k2/item/790-curs-7-introducere-in-statistica-medicala

3.5 Probabilități și funcții de repartiție


Lumea reală oferă o mare diversitate de probleme pe care omul trebuie să le
rezolve cu teoriile, metodele și tehnicile pe care le cunoaște la un moment dat, și care sunt
influențate de nivelul de dezvoltare a științelor. Științele sunt cele care se dezvoltă
permanent, și care oferă omului aceste cunoștințe și instrumente, cunoaștera lor
depinzând de capacitatea omului de învățare si de perfecționare continuă.
Teoria probabilităților și Statistica matematică s-au dezvoltat pentru rezolvarea
problemelor în care apare aspectul aleator/probabilist. Fiecare fenomen sau proces în
natură este constituit dintr-o mulțime de evenimente ce se desfășoară aleator. În activitatea
de cunoaștere, pentru studiul fenomenelor, omul apelează la diverse experimente pentru
rezolvarea problemelor și pentru controlul unor fenomene.

Definiție. Un experiment reprezintă realizarea unui ansamblu de condiţii conform unui


criteriu de cercetare ce se referă la un studiu pentru rezolvarea unor probleme.

Definiție. Un eveniment reprezintă rezultatul unui experiment și care apare ca urmare a


satisfacerii unor condiţii din criteriile de cercetare.

Definiție. Un câmp de evenimente reprezintă totalitatea evenimentelor care pot avea loc
în cadrul unui experiment. Acesta include evenimentul sigur, evenimentul imposibil şi
toate evenimentele aleatoare care pot avea loc.

Exemplu. Extragerea unei bile albe dintr-o urnă în care se găsesc bile albe şi negre. Acest
tip de experiment este în corespondenţă cu extragerea unei piese defecte dintr-un lot de
fabricaţie, lot în care se găsesc piese bune (bile albe) şi piese defecte (bile negre).
Realizarea condiţiilor, conform unui criteriu de cercetare, impune ca bilele să fie toate de
aceeaşi mărime, uniform amestecate, observatorul care face extragerea să nu poată
observa culoarea bilelor. Apariţia unei bile de culoare albă reprezintă un eveniment.

Noțiuni fundamentale din Teoria probabilităților: Experiment, Eveniment; Câmp


de evenimente; Tipuri de evenimente (compatibile/incompatibile, dependente,
independente); Algebra evenimentelor; Definiția probabilității; Funcții de repartiție;
204 MARIN VLADA

Principiul certitudinii practice; Formula probabilității totale; Teorema de limită


centrală; Teorema lui Bayes, Testarea ipotezelor.

În Teoria probabilităților se definesc numeroase funcții/legi de repartiție în


frecvență, pentru variabile aleatoare continue sau discrete. Studiind diverse fenomene, se
constată că, deşi acestea aparţin din domenii diferite, repartiţia în frecvenţă a acestora
este asemănătoare, adică histogramele au aceeaşi formă.
Se constată că 90% din fenomenele fizice se supun legii normale de repartiţie
(Legea Gauss-Laplace). Un studiu amănunţit a pus în evidentă proprietăţile acestora şi
gradul lor de aplicare. Unele legi de repartiţie devenite clasice, având un grad ridicat de
utilizare:
 Repartiții discrete – repartiţia binomială; repartiţia hipergeometricã;
repartiţia Poisson (repartiția evenimentelor rare);
 Repartiții continue – repartiţia normală Gauss; repartiţia χ2 (repartiția
multinomială); repartiţia Student; repartiţia Fischer.

Notații:
A = eveniment eleator, E = eveniment sigur, Փ = evenimentul imposibil (vid),
A = nagarea evenimentului A.

Definiție. Dacă A este un eveniment aleator, atunci probabilitatea de apariție a


evenimentului A este P(A), unde

m nr. cazuri favorabile nr. aparitii eveniment A


P( A)   ; P( A) 
n nr. cazuri posibile nr. total incercari
0  P( A)  1, P( )  0, P( E )  1, P( A )  1  P( A).

Probabilitatea ca mărimea măsurată/observată x să ia valori cuprinse în intervalul


(x1, x2) se notează prin
P( x1  x  x2 ) sau P( x  ( x1 , x2 )) .

Exemple:
1. Probabilitatea apariției cifrei 4 (x=4) la aruncarea zarului (zarul are 6 fețe și
are cifrele 1-6). Avem, m – numărul cazurilor favorabile (=1), n – numărul
cazurilor egal posibile (=6), P(x=4) = 1/6;
2. Probabilitatea găsirii unei persoane bolnave dintr-o mulțime de persoane a
unei populații dintr-o localitate. Această probabilitate se numește
coeficientul de îmbolnăvire. Presupunem că dintr-o populație de 1000 de
persoane există 100 persoane găsite bolnave. Care este probilitatea găsirii
unei persoane bolnave? A={persoana bolnavă}, P(A)=? Avem, m – numărul
cazurilor favorabile (= 100), n – numărul cazurilor posibile (= 1000),
P(A) = 100/1000 = 0,1 = 10%. Coeficientul de îmbolnăvire este b = 10%.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 205

Distribuţia probabilităţilor şi relaţia cu funcţia de repartiţie17

Variabile aleatoare discrete


Rezultatul aleatoriu al măsurării pentru o variabila X devine o variabilă
(aleatoare) discretă, dacă este expimată printr-un număr finit de măsurări, și anume
valorile rezultate x1, x2, ..., xn, iar probabilitatea ca o valoare oarecare să aibă valoarea xi
este: P (x = xi) = pi.

Definiție. Pentru toate valorile măsurate corespunzătoare variabilei X, se poate construi


tabloul sub următoarea formă:
x x2 ... xn 
X :  1 ,
 p1 p2 ... pn 
unde xi sunt măsurări, iar pi sunt probabilități de apariție, 0≤ pi ≤1. Acest tablou se
numește tabloul repartiției.

Tabloul poate fi și sub forma tabelului orizontal:


X X1 X2 ... Xn
P P1 P2 ... Pn

Definiție. Legea de probabilitate este legătura care există între variabila aleatoare X şi
probabilitatea de apariţie a acesteia, aceasta putând fi reprezentată grafic sub forma unei
diagrame cu bare (asemănătoare unei histograme de frecvențe) sau poligon de frecvențe
(diagrama tip linie).

X P 13 0,037017
1 0,561182 =RAND() 14 0,03265
2 0,870117 15 0,495111
3 0,0073 16 0,101
4 0,798116 17 0,284196
5 0,860924 18 0,558985
6 0,021148 19 0,489949
7 0,886638 20 0,063005
8 0,932441 21 0,46365
9 0,892959 22 0,873015
10 0,559867 23 0,097949
11 0,482275 24 0,160145
12 0,8676 25 0,223894

17
Cuvintele repartiție și distribuție sunt termeni sinonimi.
206 MARIN VLADA

Fig. 124. Reprezentarea probabilităților – sub forma 2D Column

Fig. 125. Reprezentarea probabilităților – sub forma 2D Line

Definiție. Funcţia de repartiție determină o expresie analitică prin care se stabilește o


legătură între variabila aleatoare şi probabilitate.

Deoarece, orice măsurare poate avea un singur rezultat, totalitatea valorilor


distincte şi posibile formează un sistem complet de evenimente incompatibile.
Probabilitatea ca X să aibă valorea xi este P(x=xi)=pi. Pentru mulţimea ale cărei perechi
n
ordonate definesc repartiţia, se poate scrie p
i 1
i  1. În multe aplicaţii interesează

probabilitatea evenimentului x < xi . În acest caz, se poate construi un tablou al repartiţiei


care are forma:

X X1 X2 ... Xn
P P1 P1+P2 ... P1+ P2+ ... +Pn
Statistică şi Informatică pentru chimie medicală şi farmaceutică 207

Functia de repartiţie se poate determina prin calculul probabilității pentru care


X<xk. Cunoscând funcţia de probabilitate a unei variabile aleatoare discrete, funcţia de
repartiţie va fi :
k k

F(xk) = P(X<xk) =  P ( xi )   pi .
i 1 i 1

Prin urmare, noțiunea de probabilitate și noțiunea de frecvență pentru variabile


aleatoare discrete, sunt concepte asemănătoare, ceea ce demonstrează că Teoria
probabilităților poată fi aplicată în Statistica matematică.

Fig. 126. Reprezentarea funcției de repartiție – sub forma 2D Column

Fig. 127. Reprezentarea funcției de repartiție – sub forma 2D Line


208 MARIN VLADA

Exemplu. Pentru un număr de 75 de studenți, vom genera aleator note de la 3 la 10. Vom
calcula numărul studenților ce au primit o anumită notă (frecevența notelor). Frecvența
notelor determină probabilitatea de a obține o anumită notă. Să se calculeze probabilitatea
de apariție a unei note.

Indicație. Într-o celulă vom scrie formula „=RAND()*(b-a)+a”, unde a=3, b=10, după
care o vom copia pe coloană, până la valoarea 75, valorile generate. Pentru calculul
frecvenței notelor, se va folosi funcția Excel COUNT(domeniu, criteriu), iar celulele să
aibă formatul „General”.

Formula pentru generarea notelor este =ROUND(RAND()*(10-3)+3, 0), cu


Format Cells=Number, Decimal=0.

Nr. Nota 26 7 51 9
1 6 27 3 52 8
2 3 28 4 53 3
3 5 29 6 54 8
4 6 30 6 55 6
5 7 31 7 56 6
6 5 32 7 57 8
7 6 33 7 58 4
8 6 34 5 59 10
9 7 35 6 60 3
10 6 36 5 61 10
11 5 37 6 62 8
12 8 38 3 63 8
13 9 39 8 64 5
14 7 40 7 65 5
15 5 41 10 66 9
16 6 42 9 67 9
17 5 43 3 68 4
18 10 44 8 69 6
19 4 45 7 70 5
20 4 46 7 71 4
21 10 47 3 72 7
22 4 48 6 73 8
23 8 49 5 74 7
24 6 50 8 75 8
25 9
Statistică şi Informatică pentru chimie medicală şi farmaceutică 209

=COUNTIF($C$6:$C$80,D6)
Format Cells=General

Nota Frecvență Probabilitate Procente

3 7 0.093 9.33%
4 7 0.093 9.33%
5 11 0.147 14.67%
6 15 0.200 20.00%
7 12 0.160 16.00%
8 12 0.160 16.00%
9 6 0.080 8.00%
10 5 0.067 6.67%
Suma 75 1 100.00%

Fig. 128. Diagrama frecvențelor


210 MARIN VLADA

Fig. 129. Diagrama probabilităților (Densitatea de probabilitate)

Variabile aleatoare continue

Rezultatul aleatoriu al măsurării pentru o variabilă X devine o variabilă


(aleatoare) continuă, dacă este exprimată printr-un număr infinit de măsurări, și anume
valorile rezultate x1, x2, ..., xn, , n ∞, iar probabilitatea ca o valoare oarecare x să aibă
valoarea xi, este: P (x = xi) = pi. Pentru toate valorile măsurate corespunzătoare variabilei
X, nu se poate construi tabloul sub următoarea formă:

x x2 ... xn 
X :  1 ,
 p1 p2 ... pn 

unde n tinde la infinit , xi sunt măsurări, iar pi sunt probabilități de apariție, 0≤ pi ≤1.
În schimb, se pot alege intervale de variație suficient de mici pentru care sunt
cunoscute probabilitățile ce sunt în număr finit, și astfel se utilizează functia de repartiție.
Acest proces este asemănător cu procesul de discretizare din calculul integral pentru
definirea integralelor și calculul acestora. Cazul histogramei, în cazul variabilei discrete,
este înlocuit cu un număr infinit de dreptunghiuri care descriu repartiția probabilității prin
definirea funcției de probabilitate f(x) (sau densitatea de probabilitate a variabilei
aleatoare X), unde


f ( x)  0,  f (u )du  1, lim f ( x)  lim f ( x)  0 .
 x  x 
Statistică şi Informatică pentru chimie medicală şi farmaceutică 211

Funcția de repartiție, notată F(x): R [0,1] se exprimă prin integrala (aria


cuprinsă între curba funcției de probabilitate f(x), între   , până la x și axa OX) . Pentru
o valoare dată x  (,) , conform definiţiei funcţiei de repartiţie, probabilitatea ca
X < x, este dată de relaţia:

F(x) = P ( X < x ) =  f (u )du ,




adică reprezintă aria de sub curba normală standard delimitată de – ∞ şi x. Evident,


legătura dintre funcția de probabilitate f(x) și funcția de repartiție F(x) este:

dF
f(x) = F ( x )  .
dx
Probabilitatea corespunzătoare unui interval (x1, x2 ) se exprimă prin integrala

x2

P (x1 < x < x2 ) =  f (u)du


x1
.

Distribuția Weibull
f(x) = 4*x*e^(-2*x^2)

Fig. 130. Graficul funcției de probabilitate f(x) și legătura cu F(x) (Weibull)


212 MARIN VLADA

Fig. 131. Graficul funcției de repartiție F(x) pentru densitatea de probabilitate f(x)

Funcția de repartiție F(x) are următoarele proprietăți:


 F(x) este funcție monoton crescătoare:
() x1  x2 , x1 , x2  R  F ( x1 )  F ( x2 ).
 Fiind o probabilitate, F(x) îndeplinește următoarele condiții:

0  F ( x)  1, lim F ( x)  0, lim F ( x)  1.
x x

 x2
Exemplu. Funcția lui Gauss (clopotul lui Gauss) f ( x)  e este o densitate de
probabilitate (distribuția normală Gauss). Mai multe detalii la adresa https://en.wikipedia.
org/wiki/Normal_distribution).

Fig. 132. Graficul densității de probabilitate f(x)


Statistică şi Informatică pentru chimie medicală şi farmaceutică 213

Fig. 133. Graficul funcției de repartiție F(x)

Graficul funcției lui Gauss se poate reprezenta folosind programul Excel, prin
generarea unei tabelări pe intervalul [-2, 2], și anume, cu pasul p=0,1 se generează
(se utilizează Fill  Series) pe o coloană o diviziune a intervalului [-2, 2], apoi pe altă
coloană se calculează valorile funcție în aceste puncte. Determinarea graficului f(x) se
face prin selectarea coloanei ce conține valorile funcției și prin alegerea tipului de grafic
2D Line. În acest caz, determinarea funcției de repartiție F(x) nu este un studiu simplu,
deoacece
x

F(x) = P ( X < x ) =  f (u )du ,




adică apare calculul unei integrale. Folosind calculatorul științific: int(exp(-x^2)),


https://web2.0calc.com, obținem: ((sqrt(pi)*erf(x)/2), rezultat ce nu satisface.

Fig. 134. Rezultatul dat de https://web2.0calc.com


214 MARIN VLADA

Funcția erf(x) este funcția de eroare (numită și funcția de eroare Gauss) ce este o
funcție specială de formă sigmoidă, care apare în probabilități, statistică și ecuații cu
derivate parțiale și care descrie procesul de difuzie:
x x
1 2
e  0
u 2 u 2
erf ( x)  du  e du.
 x

În statistică, pentru valorile nenegative ale lui x, funcția de eroare are următoarea
interpretare: pentru o variabila aleatoare X, care este distribuită normal, cu media 0 și ½
variația/dispersia, erf(x) descrie probabilitatea variabilei X ca să se încadreze în intervalul
[-x, x]. Ref.: https://en.wikipedia.org/wiki/Error_function.

În anul 1778 Laplace a demonstrat că


 
I   e u du   ; ( J   e u / 2 du  2 , Poisson).
2 2

 

Raționamentul pentru calcul acestei integrale este următorul:


   
 2
I  (  e dx)(  e
 x2  y2
dy)  
( x 2  y 2 )
dxdy   e r drd 
2
2
e
 0
   0
 
 2 1
 dxdy  (  (r  e r dr )  (  d )   2   .
( x 2  y 2 )

2
e
 0 2
 0
S-au realizat următoarele etape de calcul: 1. de la integrala simplă s-a trecut la
integrala dublă; 2. s-a realizat schimbarea de variabile (coordonate polare): x=r cos(Ɵ),
y = r sin(Ɵ), r2= x2 + y2; 3. s-au obținut 2 integrale simple, și apoi se face schimbarea de
variabilă u = r2.
Detalii Ref.: http://www.umich.edu/~chem461/Gaussian%20Integrals.pdf .
Legătura dintre funcțiile Erf și Gamma. Funcția G(x) este definită astfel:

( x)   t x 1e t dt , x( x)  ( x  1),
2

(1 / 2)   , (n)  (n  1)!.


Detalii Ref.: http://ro.math.wikia.com/wiki/Integrala_lui_Gauss.

Exemplu. Considerăm funcția erf(x) dată de o tabelare pe intervalul [0, 2]. Avem
x
2
erf ( x)   e t dt.
2

 0
Pentru valorile x=(0, 0.25, 0.5, 0.75, 1, 1.25, 1.5, 1.75, 2, avem, respectiv
F(x)=(0, 0.276, 0.52, 0.711, 0.843, 0.923, 0.967, 0.987, 0.995).
Statistică şi Informatică pentru chimie medicală şi farmaceutică 215

Fig. 135. Funcția F(x)

Fig. 136. Funcția f(x)

Exemplu. Distribuția IQ-ului persoanelor este o distribuție normală Gauss. Conform


calculelor de mai sus,

I   e u du   .
2



Un student de la psihologie ar
întreba: -„Ce legătură are IQ-ul
cu numărul π ?”.
Un student de la matematică se
presupune că ar fi răspuns:
-"În cazul în care IQ-ul tău ar fi
suficient de mare, vei înțelege!".

Fig. 137. IQ. Ref.: http://www.umich.edu/~chem461/Gaussian%20Integrals.pdf


216 MARIN VLADA

3.6 Distribuţia, propagarea şi estimarea erorilor


Erorile aleatoare (accidentale) produc efecte asupra preciziei datelor şi
rezultatelor. Acestea nu sunt corelate şi afectează valorile observate (măsurate) şi se
consideră că, pentru măsurări de volum foarte mare (n tinde către infinit), aceste erori
sunt realizări (sunt distribuite) ale unei variabile aleatoare normale (distribuția normală
Gauss) X. Proprietatea importantă a aceste distribuţii de probabilităţi este aceea că
valorile observate (măsurate) se distribuie aleator la stânga şi la dreapta faţă de valoarea
medie, adică satisface legea densităţii de probabilitate Gauss (numită şi clopotul lui
Gauss), distribuţia normală standard N(0,1), având media 0 şi dispersia 1:

h
f ( x)   e (h x2 )
2
1
 x  (,) h  2  
, , (precizia),

şi
lim f ( x)  lim f ( x)  0
x  x  .

Mai jos, este graficul densităţii de probabilitate pe intervalul [-2,2] realizat (pasul
discretizării/diviziunii, p=0,1) cu programul Excel.

Densitatea de probabilitate a erorilor f(x)

1.2

0.8

0.6 f(x)
y

0.4

0.2

0
1
-2

9
.7

.4

.1

.8

.5

.2

0.

0.

0.

1.

1.

1.
-1

-1

-1

-0

-0

-0

Fig. 138. Distribuția normală Gauss. Graficul folosind Excel


Statistică şi Informatică pentru chimie medicală şi farmaceutică 217

Fig. 139. Erorile aleatoare: Distribuţia probabilităţilor şi relaţia cu funcţia de repartiţie

Se poate demonstra că:

 3 


 
f (u)du  0.9973  f (u)du,
3 

adică aria limitată de graficul lui f(x), axa Ox și dreptele x=-3 și x=+3, și reprezintă
aproximativ 99.73% (adică 0.9973) din întreaga arie delimitată de graficul lui f(x) și axa OX.
Modelul teoretic al distribuţiei erorilor (curba lui Gauss: distribuţia normală
standard) se referă la un număr infinit de măsurări pentru valorile măsurate (observate).
În practică, numărul observaţiilor este finit, şi uneori acest număr este mic aşa cum este
cazul domeniilor de chimie, fizică etc. Să presupunem că se fac măsurări pentru marimea Y.
Dacă se repetă măsurarea mărimii Y, în condiţii identice, se constată că valorile
măsurate diferă între ele, şi atât pentru un număr foarte mare de măsurări (teoretic infinit),
cât şi pentru un număr mic de măsurări (finit), se obţin două şiruri (seturi) distincte de
valori măsurate. Dacă pentru ambele seturi de valori măsurate, se reprezintă grafic
frecvenţele de apariţie (distribuţia probabilităţilor) a valorii măsurate în funcţie de
valorile măsurate, se obţin două curbe diferite (a se vedea figura 140). Vom nota:

Yr = valoarea adevarată (reală, corectă) a mărimii Y;


m = media valorilor măsurate pentru un număr infinit de măsurări;
Y = media valorilor măsurate pentru un număr mic (finit) de măsurări.
218 MARIN VLADA

 Eroarea sitematică (obiectivă) este dată de diferenţa dintre media valorilor


măsurate pentru un număr infinit de măsurări şi valoarea adevarată a mărimii
Y, adică m - Yr .
 Eroarea aleatoare (accidentală) este dată de diferenţa dintre media valorilor
măsurate pentru un număr finit de măsurări şi media valorilor măsurate
pentru un număr infinit de măsurări, adică Y - m.

Fig. 140. Erori de măsurare sistematice și aleatoare


(Ref. M. Miron, L. Miron, Măsurări electrice şi electronice, Braşov, 2003,
http://www.afahc.ro/invatamant/electro/mee.pdf)

Propagarea erorilor

Pentru o valoare dată


x  (,) ,
conform definiţiei funcţiei de repartiţie, probabilitatea ca X < x este dată de relaţia:
x

F(x) = P ( X < x ) =  f (u )du ,




adică reprezintă aria de sub curba normală standard delimitată de –∞ şi x .


Atunci, când un rezultat experimental depinde de unul sau mai multe măsurări
nesigure, este necesar să se analizeze propagarea erorilor (incertitudinile: propagation of
error or propagation of uncertainty) acestor măsurări în rezultatul final al cercetării
(experimentului). În sens statistic, dacă X este o variabilă aleatoare dată ce are o
distribuţie cunoscută a erorilor, şi asupra ei acţionează un sistem de prelucrare
(experiment system), se doreşte să se cunoască propagarea erorilor (distribuţia erorilor)
pentru variabila aleatoare rezultat Y:
Statistică şi Informatică pentru chimie medicală şi farmaceutică 219

(input) X SISTEM Y (Output)


(experimental set-up)

Trebuie să se determine distribuţia funcţiei de ieşire pentru variabila Y, adică


Y = f(X), unde f este cunoscută, iar distribuţia erorilor pentru variabila aleatoare X este
cunoscută. Presupunem că variabila X (input) este normal distribuită N(x , x) cu media
x şi abaterea standard x, şi se doreşte să se determine cum se propagă intervalul
cu probabilitatea 68% [x – x, x + x ], prin sistemul de prelucrare în rezultatul final,
adică în variabila Y (output). Dacă f este o funcţie complexă, din figura următoare, se
poate observa că acest interval depinde de această funcţie, să determine o anumită
distribuţie a erorilor pentru rezultatul final Y. În cazul normal distribuit, pentru Y, avem
notaţia N (y , y).

Fig. 141. Propagarea erorilor pentru cazul neliniar al rezultatului

Pentru cazul general, când avem n variabile aleatoare la intrare (input) X1 , X 2, ...
Xn , avem următoarea schemă generală:

Fig. 142. Schema generală pentru n intrări

În acest caz, avem Y = f (X1 , X 2, ... Xn), unde X1 , X 2, ... Xn sunt variabile
aleatoare de intrare (input) având distribuţia normală N(i , i), unde i  1,2,..., n.
220 MARIN VLADA

În concluzie, reprezentarea lui Y sub forma dezvoltătii în serie Taylor de ordinul I


(se utilizează doar derivata de ordinul I)) în punctul (1 , 2, ... , n ), este
n
 f 
Y  f ( 1 ,  2 , ...,  n )    ( 1 ,  2 , ...,  n )  ( X i   i ).
i 1  X i 
Dacă pentru medie utilizăm notaţia din statistică (probabilităţi), E [ . ], atunci avem
următoarele calcule:
n
Y  a0   ai  ( X i  i ),
i 1
cu notaţiile
f
a0  f ( 1 ,  2 , ...,  n ), ai  ( 1 ,  2 , ...,  n ).
X i
Vom presupune că funcţia f este liniară şi astfel Y este o variabilă aleatore distribuită
normal N(y , y), cu media y şi abaterea standar y . Să calculăm y şi y2 :
 n

Y  E[Y ]  E a0   ai ( X i   i ) 
 i 1 
n
 E[a0 ]   ( E[ai X i ]  E[ai  i ])] 
i 1
n
 a0   ( E[ai X i ]  E[ai  i ])] 
i 1
n n
 a0   (ai E[ X i ]  ai E[  i ])]  a0   (ai  i  ai E[  i ])].
i 1 i 1

Pentru y2 vom avea,


 Y2   ai2 E[( X i  i ) 2 ]   ai a j [( X i  i )( X j   j )] 
i i j

  ai  i2   ai a j ij .
2

i i j
2
 f  2  f  f 
Prin urmare,       i      ij şi dacă vom considera că
2

  
Y
i  X i  i j  i 
X Xj 
variabilele aleatoare X1 , X 2, ... Xn sunt independente, atunci covarianţa ij este zero şi
avem:
2
 f  2
   
2
  i .
i  X i 
Y
Statistică şi Informatică pentru chimie medicală şi farmaceutică 221

Pentru exemplificare, vom da câteva exemple de operaţii asupra intrărilor.


Calculul erorii rezultatului final va fi analizat în cele ce urmează.

Input: a, b, c obţinute din măsurări directe cu erorile sa, sb, sc.

Output: rezultatul final x, cu eroarea sx.

Tabelul 14. Propagarea erorilor pentru diverse calcule


Nr. crt. Rezultatul final Propagarea erorilor
1 x=a+b-c s x  (sa ) 2  (sb ) 2  (sc ) 2  ...
2 x = a * b/c s x  (sa / a) 2  (sb / b) 2  (sc / c) 2  ...
3 x = abc s x  (sa / a) 2  (sb / b) 2  (sc / c) 2  ...

De exemplu, se poate calcula eroarea la etalonul de curent pe baza legii lui Ohm,
sau în general la măsurarea indirectă a curentului, prin măsurarea căderii de tensiune pe o
rezistenţă etalon. În Chimie şi Fizică sunt diverse formule de calcul pentru care trebuie să
se calculeze o eroare.

3.7 Legi de probabilitate utilizate frecvent

Dacă X este o variabilă aleatoare continuă cu densitatea de probabilitate f(x),


atunci avem:
 Media

M [ X ]   xf ( x)dx,


 Dispersia

  D[ X ]   ( x  M [ X ]) 2 f ( x)dx,
2



 Abaterea medie patratică

  D[X ].
Noțiunea de momente a fost introdusă, pe lângă indicatorii statistici de bază
(Dispersia şi abaterea standard sunt cei mai utilizaţi indicatori de variaţie.), pentru
stabilirea formei funcției de probabilitate experimentale și particularități ale acesteia.
222 MARIN VLADA

Momentele se împart în două categorii: 1. momente absolute de ordinul k – notate mk,


la care valorile sunt considerate în raport cu originea; 2. momente centrate de ordinul k –
notate Mk , la care valorile sunt exprimate în raport cu o valoare arbitrară δ).

Definiție. Se numește momentul absolut de ordinul k (k>1), valoarea dată de relaţia:

1 n k 1 n n
mk        ( xi  f i ),
k k
xi ( xi ai )
n i 1 n i 1 i 1 ,

unde X este variabila aleatoare măsurărilor,

X  ( xi )i1,n a1 , a2 , ... , an
,

sunt frecvențele absolute pe intervale, iar f1 , f2 , ... , fn sunt frecvențele relative.

Definiție. Momentul centrat de ordinul k (k>1), în raport cu o origine arbitrarã δ este:

1 n 1 n n
  ( xi   )   ( xi   )  ai   ( xi   ) k  f i ).
 k k
Mk
n i 1 n i 1 i 1

Observație. Dacă δ este chiar media aritmeticã, atunci Mmmentul centrat de ordinul k se
noteazã cu Mk , şi pentru k=2, avem M2 = D[X] (momentul centrat de ordinul 2 este egal
cu dispersia). În acest caz, între momentele absolute şi cele centrate, se pot scrie
următoarele relaţii:

M1 = 0; M2 = m2 – m12 = D[X];

M3 = m3 -3m1m2 + 2 m13;

M4 = m4 – 4 m1m3 + 6 m1m2 – 3 m1.

Indicatori pentru asimetrie şi aplatizare

Folosind indicatorii obținuti cu ajutorul momentelor, se pot studia diferite moduri


prin care se poate aprecia asimetria unei repartiţii (coeficientul de asimetrie) şi aplatizarea
unei repartiții (gradul de ascuțire/aplatizare a graficului/formei unei repartiții)
(coeficientul de exces), Indicatorii obținuți cu ajutorul momentelor sunt exprimați de
relaţiile (γ1 = Coeficientul de asimetrie, γ2 = Coeficientul de exces):
Statistică şi Informatică pentru chimie medicală şi farmaceutică 223

M3 M4
1  3
, 2   3.
( D[ X ] ) ( D[ X ]) 2

Fig. 143. Indicatorul γ1 – simetrie la dreapta γ1>0, simetrie γ1=0, asimetrie la stânga γ1<0

Fig. 144. Indicatorul γ2 – aplatizare γ2<0, normală γ2=0, ascuțită γ2>0

În practică, în diverse studii și cercetări, pot exista următoarele tipuri de repartiții:

Fig. 145. Tipuri de repartiții, cu 1 maxim (unimodală), cu 2 maxime (bimodală),


cu 1 minim (antimodală)

Se constată că 90% din fenomenele fizice se supun legii normale de repartiţie


(Legea Gauss-Laplace). Un studiu amănunţit a pus în evidentă proprietăţile acestora şi
gradul lor de aplicare. Unele legi de repartiţie devenite clasice au un grad ridicat de
utilizare:
 Repartiții discrete – repartiţia binomialã; repartiţia hipergeometrică; repartiţia
Poisson (repartiția evenimentelor rare);
224 MARIN VLADA

 Repartiții continue – repartiţia uniforma, repartiţia normală Gauss; repartiţia


χ2 (repartitia multinomială); repartiţia Student; repartiţia Fischer.

3.7.1 Distribuții continue de probabilitate

Distribuția uniformă

O variabilă aleatoare are o repartiție uniformă pe intervalul [a,b], dacă densitatea


de repartiție este:

1
f ( x)  , unde x  (a, b) , f ( x)  0, unde x  (a, b).
ba

Funcția de repartiție F(x) are următoarea expresie:

x
F ( x)   f (u)du  0, unde

x  a,

xa
x
F ( x)   f (u )du  , unde x  (a, b),
a
ba
b b
1
F ( x)   f (u )du    1, unde x  b.
a a
b  a

Tabelul 15. Indicatorii teoretici, Repartiția uniformă – Media, Dispersia, Momente


ab
Media M[X], μ M [ X ]   xf ( x)dx 

2

(b  a) 2
Dispersia D[X], σ , s
2 2  2   ( x  M [ X ] f ( x)dx 

12
b
x2
Momente mk m1  M [ X ], m2   dx
a
ba
Statistică şi Informatică pentru chimie medicală şi farmaceutică 225

f(x) F(x)

1
ba

0 a b x
0 a b x

Fig. 146. Densitatea de probabilitate f(x) și functia de repartiție F(x)

Distribuția normală Gauss N(μ, σ2) – clopotul lui Gauss

Această lege de distribuție este prima lege studiată în statistică și este cunoscută
sub denumirrea de legea lui Gauss (clopotul lui Gauss), sau legea Gauss-Laplace.
Parametrii teoretici ai acestei legi sunt media μ și dispersia σ2.

Distribuţia normală (Normal Distribution – ND) – Densitatea de probabilitate Gauss.

Definiţie. O variabilă aleatoare X are o repartiţie normală cu parametrii  (media) şi 2


(dispersia), dacă funcția sa de probabilitate (densitatea de probabilitate, probability
density function (PDF), există: NORMDIST(x,mean,standard_dev,FALSE)) este

( x )2
1 
f ( x)  e 2 2
,
 2

 1


f ( x)dx  1, max f ( x)  f (  ) 
x(  , )  2
.

Conform definiţiei funcţiei de repartiţie (funcția de repartiție cumulativă,


cumulative distribution function (CDF) există
NORMDIST(x,mean,standard_dev,TRUE)),
și avem:

(t   )2
1 x 
F ( x)  P( X  x) 
 2  
e 2 2
dt.
226 MARIN VLADA

Pentru orice valoare a, valoare F(a) este aria determinata de graficul funcție f(x),
axa OX și dreapta x=a. Determinarea funcției de repartiție F(x) nu este un studiu simplu,
deoarece
x

F(x) = P ( X < x ) =

 f (u )du
,
adică apare calculul unei integrale. Deoarece calculele pentru această integrală sunt
laborioase, în practica, se utilizează tabele speciale, care oferă aceste valori de
probabilitate. Se demonstrează că  şi  2 este media, respectiv dispersia variabilei
aleatoare X. Graficul functiei de probabilitate f(x) are formã de clopot şi are următoarele
1
proprietăți: admite un unic maxin pentru x=, are simetrie față de dreaptă, pentru
 2
x=, îşi modifică convexitatea în punctele x=μ − σ şi x=μ + σ, modificarea parametrului
μ translatează curba de-a lungul axei x, iar modificarea parametrului σ modifică ascuţirea
curbei.

Tabelul 16. Indicatorii teoretici, Distribuția normală Gauss – Media, Dispersia,


Momente

Media M[X], μ M [ X ]   xf ( x)dx 




Dispersia D[X], σ , s
2 2  2   ( x  M [ X ] f ( x)dx  2


Momente mk Impar: m2k+1 = 0; Par: m2k=(2k+1)m2k-2


m2 =  2, m4 = 3 2, m6 = 15 4

Exemplu. Pentru aceeași dispersie =1, curbele densităţii de probabilitate cu medii


diferite =0,1,2, vor fi translatate față de axa OY.

( x )2 ( x 1) 2 ( x2)2
1  1  1 
f ( x)  e 2
; f ( x)  e 2
; f ( x)  e 2
.
2 2 2
Statistică şi Informatică pentru chimie medicală şi farmaceutică 227

Maximul lui f(x) în x=


1
este
 2

Pentru o valoare x=a,


aria de sub grafic,
delimitată de – ∞ şi x=a
este F(a).

Fig. 147. Graficul funcției de probabiliate Gauss (clopotul lui Gauss)

Fig. 148. Graficul funcției de repartiție F(x) pentru densitatea de probabilitate f(x)
228 MARIN VLADA

(0,max)
(1,max)

(2,max)
max= 0.39846

Fig. 149. Translatare pentru =0,1,2 și =1. Curbele densităţii de probabilitate cu aceeaşi
dispersie dar medii diferite (http://www.mathe-fa.de/)

Exemplu. Curbele densităţii de probabilitate cu aceeaşi medie (=1), dar dispersii diferite
=0.5, 1, 2 vor avea ascuțirea diferită, mai mare pentru =0.5 și descrește pentru =1
și =2.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 229

4 ( x 1) 2 ( x 1) 2 ( x 1) 2


2  1  1 
f ( x)  e 2
; f ( x)  e 2
; f ( x)  e 8
.
2 2 2 2

Dispersia
=0.5
Media =1

Dispersia
=1

Dispersia
=2

Fig. 150. Ascuțirea după =0.5,1,2 . Curbele densităţii de probabilitate cu aceeaşi medie
(=1), dar dispersii diferite (http://www.mathe-fa.de/)
230 MARIN VLADA

Este remarcat faptul că pentru o curbă a funcției f(x) (exemplu, distribuţia


erorilor) cu o medie dată  şi cu diverse dispersii 1 , 2 şi 3 crescătoare, atunci cele
trei curbe au „baza” crescătoare, aşa cum se vede în Fig. 150.

Exemplu. Reprezentare graficului unei funcții de probabilitatea N(μ, σ2) folosind diverse
produse software pentru reprezentarea grafică. Caz particular: N(0,3), μ=0 și σ2=3.
Comanda: e^(-(x^2)/6)/(sqrt(6*pi)).

Fig. 151. Distribuția normală N(0,3), μ=0 și σ2=3


Statistică şi Informatică pentru chimie medicală şi farmaceutică 231

Fig. 152. Comanda plot e^(-(x^2)/6)/(sqrt(6*pi) from x=-1 to 30

Funcția erf(x) este funcția de eroare (numită și funcția de eroare Gauss) ce este o
funcție specială de formă sigmoidă, care apare în probabilități, statistică și ecuații cu
derivate parțiale, și care descrie procesul de difuzie:

x x
1 2
e  0
u 2 u 2
erf ( x)  du  e du.
 x

Când legea normală este folosită în fiabilitate (parametru de calitate=fiabilitatea


funcționării echipamantelor, proceselor, sistemelor, produselor etc.), pentru variabile
aleatoare dependente de timp, definirea are sens numai pentru t ≥ 0. Funcția de fiabilitatea
este R(t) =1–F(t), unde
232 MARIN VLADA

t   
t
F (t )   f ( x)dx  erf    erf   ,
0     

iar intensitatea defecțiunilor este Z(t) = f(t) / F(t).

Se poate demonstra că pentru orice a  b, probabilitatea ca a < (X–m)/s < b este


P(a < (X– m)/s < b) = aria de sub curba normală standard delimitată de x = a şi x = b,
formulă care permite calcularea probabilităţilor asociate cu repartiţia normală, doar
cunoscând probabilităţile asociate repartiţiei normale standard.

Notaţia uzuală este X~N(,2). Pentru


distribuţia normală standard se obţine
X~N(0,1). În Excel există funcţia:
NORMDIST(x,mean,standard_dev,cumula
tive)

- x is the value for which you want the


distribution.

- Mean is the arithmetic mean of the


distribution. Standard_dev is the standard
deviation of the distribution.

- Cumulative is a logical value that


determines the form of the function. If
cumulative is TRUE, NORMDIST returns
the cumulative distribution function (CDF);
if FALSE, it returns the probability mass
function (PDF).

- The equation for the normal density


function (cumulative = FALSE) is: When cumulative = TRUE, the formula is the integral
from negative infinity to x of the given formula. Distribuţia Laplace (repartiția normal
redusă, notată prin N(0, 1) se obţine din repartiţia Gauss N(μ, σ2) cu ajutorul schimbării
de variabilã: z= (x - μ)/σ. Astfel, densitatea de probabilitate Laplace și funcția de
repartiție Laplace au expresiile următoare:

x x
1 z2 / 2 1
f ( z)  e , F ( x)   f ( z )dz  e
z2 / 2
dz.
2  2 
Statistică şi Informatică pentru chimie medicală şi farmaceutică 233

Valorile celor două funcții sunt date tabelate și sunt calculate de diverse programe de
calculator. Funcția F(x) se mai notează cu Փ(x).

Regula celor 3σ

O variabilă normal repartizată X: N(μ,σ) ia valori semnicative numai în intervalul


(μ– σ,μ+3σ). Într-adevăr,
P(| X   | 3 )  1  P(| X   | 3 )  1  F (3)  0.0027 ,
valoare care în unele situații poate fi neglijată.

Teorema de limită centrală (Laplace)

Această teoremă este una din cele mai importante și cele mai utilizate proprietăți
ale distribuției normale Gauss.

Teoremă. Dacă X1, X2, ..., X2 sunt variabile aleatoare independente de tipul N(μ,σ), atunci

 n 
  X i  n  x
  x    ( x) 
1
e
i 1 z2 / 2
lim P dz.
n    n  2 
 
 

Prin urmare, variabila aleatoare (X1 + X2 + ... + X2)/n se aproximează la infinit cu


N(μ,σ/n).

Legea numerelor mari (Weak Law of Large Numbers)

Teoremă. Dacă X1, X2, ..., X2 sunt variabile aleatoare independente de tipul N(μ,σ),
n

X i
atunci, ()  0, lim P(| i 1
  |  )  1.
n  n

Prin urmare, teorema descrie rezultatul efectuării aceluiași experiment de un


număr mare de ori. Potrivit acestei teoreme, media rezultatelor obținute dintr-un număr
mare de încercări ar trebui să fie aproape de valoarea așteptată, și va tinde să se apropie
de aceasta valoare, cu cât sunt efectuate mai multe experimente.

Exemplu. În cazul aruncării unui zar ce 6 fețe (are pe fețe numerele 1-6), apariția unui număr are
probabilitate egală. Astfel, valoarea unei singure aruncări este (1+2+3+4+5+6)/6 = 3.5. În
conformitate cu legea numerelor mari, în cazul în care unui număr mare de aruncări/evenimente,
media valorilor lor (uneori numită medie proba) este aproape de 3.5, cu precizia în creștere cu mai
multe aruncări.
234 MARIN VLADA

Fig. 153. Numărul mediu obținut – https://en.wikipedia.org

Exemplu. Procesul de difuzie: Pătrunderea moleculelor unui corp printre moleculele altui
corp cu care vin în contact. În domeniul chimiei, procesul de difuzie este un exemplu al
legii numerelor mari. În chimie, un solvent este o soluție obtinută ca un amestec omogen
compus din două sau mai multe substanțe. Într-un astfel de amestec, o substanță dizolvată
este o substanță dizolvată într-o altă substanță, cunoscută ca solvent. În imagine
(fig. 154), în partea de jos, inițial, sunt molecule de solvent de pe partea stângă a unei bariere
și nici una pe dreapta. Bariera este îndepărtată, iar solventul umple întregul recipient.

 Partea de sus – cu o singură moleculă, mișcarea pare a fi destul de aleatorie;


 Partea din mijloc – cu mai multe molecule, există în mod clar o tendință în
cazul în care solventul umple recipientul mai mult și mai uniform, dar există,
de asemenea si fluctuații aleatorii;
 Partea de jos – cu un număr mare de molecule de solvent (prea multe pentru a
se vedea), hazardul este în esență: Solventul pare să se miște lin și sistematic
din zonele de mare concentrare la zonele de concentrație scăzută. În situații
realiste, chimiștii pot descrie difuzia ca fenomen de natură macroscopică
deterministă (a se vedea legile lui Fick), în ciuda naturii sale aleatorii.

Fig. 154. Procesul de difuzie – https://en.wikipedia.org/wiki/Law_of_large_numbers


Statistică şi Informatică pentru chimie medicală şi farmaceutică 235

Distribuţia Weibull. Legea exponenţială.

Repartiţia Weibull are densitatea de probabilitate dată de următoarea expresie:


f ( x)      x 1  e x , x [0, ],   0,  0.

Exemplu. Repartiţia Weibull pentru λ=2 și α= 2 reprezentată pe intervalul (0,2].

λ=2 și α= 2 , plot 4*x*e^(-2*x^2) from x=0 to 2.

Fig. 155. Distribuţia Weibull pentru λ=2 și α= 2


236 MARIN VLADA

Repartiția Weibull pentru λ=2 și α= 2, f(x) = 4*x*e^(-2*x^2)

Repartiția Weibull
λ=2 și α= 2,
f(x) = 4*x*e^(-2*x^2)

Fig. 156. Grafic pe [0,2] x [0,2] diviziunea pe axe 0.2 (Daniel Schmidt-Loebe,
http://www.mathe-fa.de

Tabelul 17. Indicatorii teoretici, Distribuția Weibull – Media, Dispersia, Momente


1
Media M[X], μ M [ X ]   xf ( x)dx  1 /   (  1)
0


D[X], σ2 2 1
Dispersia    ( x  M [ X ] f ( x)dx 2 /   ((  1)   2 (  1))
2

, s2 0
 
1
Momente mk m1  M [ X ]  1 /   (  1)

Distribuţia exponenţială (caz particular al distribuției Weibull, α=1) are densitatea de
probabilitate dată de următoarea expresie:
f ( x)  e  x , x  [0, ],   0.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 237

Tabelul 18. Indicatorii teoretici,Distribuția exponențială – Media, Dispersia, Momente


1
Media M[X], μ M [ X ]   xf ( x)dx 
0


1
Dispersia D[X], σ2 , s2  2   ( x  M [ X ] f ( x)dx m2  m12 
0
2

1 2
Momente mk m1  M [ X ]  , m2   x 2 e x dx 
 0
2

Funcția de repartiție este dată de următoarea expresie:

F ( x)  1  e  x , x  (0, ], F ( x)  0, x  0.

Fig. 157. Funcția de probabilitate f(x) a distribuţiei exponenţiale, λ=4


238 MARIN VLADA

Fig. 158. Funcția de repartiție F(x) a distribuţiei exponenţiale, λ=4

Fig. 159. Funcția de probabilitate f(x) a distrubuţiei exponenţiale, λ=4,2,1


Statistică şi Informatică pentru chimie medicală şi farmaceutică 239

Distribuția Gamma (Γ)


Distribuţia Gamma (Γ) are densitatea de probabilitate dată de următoarea expresie:
x p 1e  x
f ( x)  , x  (0, ), f ( x)  0, x  0, p  0,
( p )
unde funcția Γ(p), numită funcția lui Euler (integrala lui Euler de al II-lea tip), este dată
de următoarea expresie:

( p)   x p1e  x dx, p  0.
0
Proprietățile funcției Γ(p), unde p>0: Γ(p+1)=pΓ(p); Γ(n)= (n-1)!; Γ(1/2)= sqrt(π).

Tabelul 19. Indicatorii teoretici, Distribuția Gamma (Γ)– Media, Dispersia, Momente
Media M[X], 

μ M [ X ]   xf ( x)dx  p
0

Dispersia D[X], 

σ 2 , s2    ( x  M [ X ] f ( x)dx m2  m1 2  p
2

Momente mk m1  M [ X ]  p, mk  (k  p  1)( k  p  2)...( p  1) p

p=4

Fig. 160. p=4, plot ((x^3)*e^(-x))/gamma(4) from x=0 to 15


240 MARIN VLADA

p=6

Fig. 161. p=6, plot ((x^3)*e^(-x))/gamma(4) from x=0 to 15

Fig. 162. Graficul folosind www.wolframalpha.com


Statistică şi Informatică pentru chimie medicală şi farmaceutică 241

Distribuția χ2 - hi patrat (Helmert-Laplace)

Repartiţia χ2 (hi patrat) are densitatea de probabilitate dată de următoarea expresie:


n
1
2 x / 2
x e
f ( x)  , x  (0, ), f ( x)  0, x  0, n  0,
2 n / 2 (n / 2)
unde funcția Γ(p) este funcția lui Euler (integrala lui Euler de al II-lea tip), iar n este un
parametru ce semnifică numărul gradelor de libertate. Se spune că o variabilă X are
repartiţia χ2 cu n grade de libertate.

Tabelul 20. Indicatorii teoretici, Distribuția χ2 – Media, Dispersia, Momente



Media M[X], μ M [ X ]   xf ( x)dx n
0

Dispersia D[X], σ2 , s2  2   ( x  M [ X ] f ( x)dx m2  m12  2n
0

Momente mk m1  M [ X ]  n, mk  n(n  2)...(n  2k  2)

Fig. 163. N=4 plot (x*e^(-x/2))/(2^2*gamma(2)) from x=-0 to 20


242 MARIN VLADA

Fig. 164. N=8  plot (x^4*e^(-x/2))/(2^4*gamma(4)) from x=-0 to 20

Fig. 165. N=20  plot (x^4*e^(-x/2))/(2^4*gamma(4)) from x=-0 to 50


Statistică şi Informatică pentru chimie medicală şi farmaceutică 243

Fig. 166. N=100  plot (x^49*e^(-x/2))/(2^50*gamma(50)) from x=-0 to 200

Teoremă. Dacă variabilele aleatoare indepedente X1, X2, ..., Xn au fiecare distribuții
normale standard N(μ, σ2), atunci variabila aleatoare X = X12+X22+ ... + Xn2 are repartiția
χ2 cu n grade de libertate.

Distribuția Student (t). Legea Cauchy

Distribuţia Student (t) are densitatea de probabilitate dată de următoarea


expresie:
 n 1
  n 1

 2  2

 1   2 , x  (, ),
x
f ( x) 
n  (n / 2)  n 

unde funcția Γ(p) este funcția lui Euler (integrala lui Euler de al II-lea tip), iar n este un
parametru ce semnifică numărul gradelor de libertate. Se spune că o variabila X are
distribuţia Student (t) cu n grade de libertate.
244 MARIN VLADA

Tabelul 21. Indicatorii teoretici, Distribuția Student (t) – Media, Dispersia, Momente

Media M[X], μ M [ X ]   xf ( x)dx 0


0

D[X], σ2 n
Dispersia  2   ( x  M [ X ] f ( x)dx m2  m1 2 
, s2 0
n2
n k (2k  1)!!
Momente mk m1  M [ X ]  n, m2 k 1  0, m2 k 
(n  2)(n  4)...(n  2k )

Legea lui Cauchy. Pentru n=1 Legea (distribuţia) Student se mai numeşte Legea
(distribuţia) Cauchy. O variabilă aleatoare X cu distribuţie Cauchy are densitatea de
probabilitate:

1 x2
f ( x)  , x  (, ),

Fig. 167. N=1  plot (1/pi)*(1+x^2) from x=0 to 30


Statistică şi Informatică pentru chimie medicală şi farmaceutică 245

Fig. 168. N=1 (legea lui Cauchy)  plot (gamma(1)/(sqrt(pi)*gamma(1/2)))*(1+x^2)


from x=-0 to 30

Fig. 169. N=5  plot (gamma(3)/(sqrt(5*pi)*gamma(5/2)))*(1+x^2/5)^3 from x=-0 to 50


246 MARIN VLADA

Legăturile dintre distribuţia Student şi distribuţia normală sunt prezentate în


următoarele două teoreme.

Teoremă. Dacă variabilele aleatoare X1, X2, ..., Xn, ... , cu fi(x), i>0, au densitatea de
probabilitate a unei distribuţii Student(t), cu n grade de libertate, atunci
lim f n ( x)  f ( x),
n

unde f(x) este densitatea de probabilitate normală standard N(0,1).

Teoremă. Dacă fiecare dintre variabilele aleatoare independente X1, X2, ..., Xn +1 are
distribuţie normală cu parametrii N(0, σ ), atunci variabila aleatoare
2

X n 1
X n ,
X 1  X 2  ...  X n
2 2 2

are distribuţie Student cu n grade de libertate.

Distribuția Snedecor. Legea Fisher

Distribuţia Snedecor are densitatea de probabilitate dată de următoarea expresie:


mn
  m2
m  2  1  m  x  2 , x  (0, ),
m
1
f ( x)     x 2
  
n (m / 2)(n / 2)  n 
f ( x)  0, x  0, m, n  0,

unde funcția Γ(p) este funcția Euler (integrala lui Euler de al II-lea tip), iar m și n sunt
parametri ce semnifică numărul gradelor de libertate. Se spune că o variabilă X are
repartiţia Snedecor cu m și n grade de libertate.

Distribuţia Fisher are densitatea de probabilitate dată de următoarea expresie:


mn
  m 2
 m  mx  2   m 2x  2
f ( x)     e  1   e  , x  R,
n (m / 2)(n / 2)  n 

Teoremă. Dacă variabila aleatoare X are o distribuție Snedecor cu parametrii m și n,


atunci variabila aleatoare Y=(lnX)/2 are o distribuție Fisher cu parametrii m şi n.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 247

Tabelul 22. Indicatorii teoretici, Distribuția Fisher – Media, Dispersia, Momente


n
Media M[X], μ M [ X ]   xf ( x)dx  ,n  2

m2

D[X], σ2 , 2n 2 (m  n  2)
Dispersia  2   ( x  M [ X ] f ( x)dx m2  m12 
s2 
m(n  4)(n  2) 2
n k m(m  2)...(m  2k  2)
Momente mk m1  M [ X ], mk  k  , 2k  n
m (n  2)( n  4)...(n  2k )

Fig. 170. M=2 și N=3  plot (2/3)*gamma(5/2)/(gamma(1)*gamma(3/2))


*(1+2*x/3)^(5/2) from x=-30 to 50
248 MARIN VLADA

Fig. 171. Legea Fisher, M=1 și N=2  plot


(1/2)*e^x*gamma(3/2)/(gamma(1)*gamma(1/2)) *(1+(1/2)*e^(2*x))^(3/2)
from x=-1 to 2

Legătura dintre distribuţia normală şi distribuţia Snedecor este dată de următoarea


teoremă.

Teoremă. Dacă fiecare dintre variabilele aleatoare independente X1, X2, ..., Xm , Xm+1 ... ,
Xm+n are distribuţie normală cu parametrii N(0, σ2), atunci variabila aleatoare

n X 1  ...  X m
2 2

X ,
m X m1 2  ...  X m  n 2

are distribuţie Snedecor, cu m și n grade de libertate.


Statistică şi Informatică pentru chimie medicală şi farmaceutică 249

3.8 Estimarea parametrilor. Testarea ipotezelor statistice


3.8.1 Intervalul de încredere

Dacă se consideră o populație statistică a cărei valoare medie μ nu este


cunoscută, se cere determinarea acestei valori pentru a face interpretări și a utiliza această
valoare în alte calcule. În acest scop, se consideră un eșantion aleator de dimensiune n și
pentru care se poate calcula media valorilor M[X]. De exemplu, în biologie, multe
variabile aleatoare (din diverse procese) urmează o distribuție normală Gauss N(μ,σ2).

Definiție. O estimare/determinare a unui parametru γ a unei populații statistice este o


valoare g a unei statistici corespunzătoare.

Definitie. Un interval de estimare/determinare a unui parametru γ a unei populații


statistice este intervalul (γ-a, γ +b), folosit pentru a estima valoarea parametrului γ.
Valorile a și b sunt determinate funcție de eșantionul care este folosit pentru estimarea
parametrului γ.

γ
γ -a γ- b

Eșantion (E)

Populație statistică (P)


Fig. 172. Interval de estimare pentru parametrul γ

Inițial, se consideră că media valorilor eșantionului, M[X] estimează valoarea


medie a populației μ. În general, M[X] și μ sunt diferite, chiar daca M[X] aproximează cu
o anumită precizie pe μ. Această precizie poate fi apreciată cu ajutorul unui interval de
încredere centrat în μ. Prin urmare, media eșantionului M[X] este un estimator punctual al
mediei populației μ.

Definitie. O statistică a poziției este scorul standard (sau z – scor), numit și gradul de
încredere (confidenţă), dat de poziția valorii x față de media valorilor M[X] în unități de
deviație standard (s), adică
x  M[X ]
z .
s
Determinarea intervalului de estimare

Fie o populație statistică având o deviație standard σ cunoscută, o medie μ


necunoscută și un eșantion aleator simplu de mărime n și medie M[X] cunoscute. Fie un
interval centrat în μ, adică (μ-ε, μ + ε). Gradul de încredere (confidenţă)/Scorul
standard pentru mediile eșantioanelor este
250 MARIN VLADA

x  x x n (x  )
z   .
x / n 

Condiția ca valoarea M[X] să fie în intervalul (μ-ε, μ + ε) determină următoarele:

 x   
   x        z .
/ n / n / n / n / n
Prin urmare, intervalul de estimare (a,b) are extremitățile date de expresiile:

 n  n
a , b .
 
Caz particular ε=1.

Definiție. Nivelul de neîncredere, notat α, este probabilitatea ca statistica eșantionului să


aibă valoarea în afara intervalului de estimare.

Definiție. Nivelul de încredere/coeficientul de încredere, notat (1-α), este probabilitatea


ca statistica eșantionului să se afle în intervalul de estimare ales.

Dacă se consideră că variabila X este N(0,1), conform teoremei de limita centrală


avem:
 n n  n
P(   1  x    1)  P  z   2  P 0  z 
 


      
 n 1 x t 2 / 2
2 0
 2  F  , unde F ( x) 
 e dt.
  
Prin urmare, nivelul de neîncredere α, respectiv nivelul de încredere, sunt:

 n  n
  1  2  F  , 1    2  F 


  .
    
Definiție. Intervalul de încredere este un interval de estimare cu un nivel de încredere
(1-α) specificat.

Exemplu. Fie o populație statistică având o deviație standard σ cunoscută, o medie μ


necunoscută și un eșantion aleator simplu de mărime n și medie M[X] cunoscute. Fie un
interval centrat în μ, adică (μ-1, μ + 1). Scorul standard, intervalul de estimare și nivelul
de încredere (1-α) sunt următoarele:
Statistică şi Informatică pentru chimie medicală şi farmaceutică 251

n (x  )  n n  n
z ,   , , 1    2  F 


  .
      
Definiție. Pentru calculul parametrilor funcției de repartiție sunt definite următoarele
noțiuni:

 Ɵa, Ɵb – limitele de încredere/semnificație, sunt valori ce reprezintă valorile


limită între care se plasează cu o probabilitate dată, adevarata valoare a
parametrului necunoscut;
 (1-α) – nivel de încredere/semnificație, ce reprezintă probabilitatea
corespunzătoare;
 [Ɵa, Ɵb] – interval de încredere/semnificație, ce reprezintă mulțimea valorilor
care include, cu o probabilitate apreciată ca satisfacătoare, adevarata valoare
necunoscută;
 α – nivel de neîncredere/valoarea de risc; probabilitatea ca statistica
eșantionului să aibă valoare în afara intervalului de estimare;
 (-∞, Ɵa) U (Ɵb, -∞) – interval de neîncredere;

Definiție. Eroarea standard/maximă de estimare este jumătatea lungimii intervalului de


încredere cu nivelul de încredere (1-α) și are următoarea formulă:
  
  Err  z    ,
2 n
unde
  1 1 x
z   este soluția ecuației F ( z )  , F ( x)   et
2
/2
dt.
2 2 2 0

Prin urmare, intervalul de încredere cu nivelul de încredere (1- α) este (M[X] - ε,


M[X] + ε).

Exemplu. Fie o populație de pacienți pentru care se studiază nivelul glicemiei. Pentru un
eșantion format din n=121 pacienți, se măsoară nivelul glicemiei și se deduce că media
este M[X]=105. Valoarea aleatoare X ce indică valori ale glicemiei este o variabilă ce
urmează o distibuție normală N(μ,σ2) – distibuție Gauss. Știind că s-a extras eșantionul cu
nivelul de neincredere α = 0.05 (deci nivelul de incredere (1 - α) = 0.95) corespunzător
scorului de încredere z = 1.96, iar dispersia σ2 = 36 (adică σ = 6), să se determine
intervalul de încredere pentru media glicemiei la populația din care s-a extras eșantionul.
Vom avea,

   6
  Err  z     1.96   1.069091,
2 n 121

și astfel intervalul de încredere este (M[X] - ε, M[X] + ε), adică (103.9309, 106.0691).
252 MARIN VLADA

Intervalul de încredere pentru frecvenţe


Această situație se studiază în cazul eșantioanelor pentru care se verifica relația nf > 10,
unde n=dimensiunea eșantionului, f = m/n este frecvența, iar m= numărul de apariții.

Definiție. Intervalul de încredere pentru frecvenţe corespunzător scorului de încredere z


este intervalul
 f (1  f ) f (1  f ) 
f Z , f Z .
 n n 
Exemplu. Se dorește estimarea frecvenţei cancerului de sân la femeile, cu vârsta între 50
şi 54 de ani, care au antecedente familiale pozitive. Într-un studiu randomizat la care au
participat 10000 de femei, s-a constatat că 400 dintre acestea au fost diagnosticate cu
cancer de sân. Care este intervalul de încredere de 95% (cu scorul de încredere Z=1.96)
asociat frecvenţei observate?
Avem: n=10000, m=400, f=400/10000=0.04, Z=1.96, și astfel intervalul de
încrederea este (f - ε, f + ε), unde ε = 1.96*sqrt(0.04*0.96/10000) = 0.003841. Intervalul
de încredere este [0.036159, 0.0438410].
Riscul (valoarea de risc) α poate fi:
 unilateral (dreapta sau stânga), și în acest caz, pentru o funcția de distribuție
oarecare, legătura dintre nivelul de semnificație (1-α) și intervalul de
semnificație [Ɵa, Ɵb] este dată de relația (pentru dreapta) P(Ɵ > Ɵb) = 1-α,
respectiv P(Ɵ < Ɵb) = 1-α, pentru stânga;
 bilateral simetric, și în acest caz, pentru o funcția de distribuție oarecare,
legătura dintre nivelul de semnificație (1-α) și intervalul de semnificație
[Ɵa, Ɵb] este dată de relația P(Ɵ1- α/2 < Ɵ < Ɵα/2) = 1-α;

Fig. 173. Riscul unilateral dreapta


Statistică şi Informatică pentru chimie medicală şi farmaceutică 253

Fig. 174. Riscul bilateral stânga-dreapta

3.8.2 Determinarea parametrului statistic – limitele intervalului de semnificație

Se dă probabilitatea / nivelul de semnificație (1-α) (sau valoarea de risc α) și se


cere să se determine parametrului statistic, limitele intervalului de semnificație
(intervalele (-∞ , Ɵα); (Ɵα, ∞); (Ɵ1-α/2, Ɵα/2)), pentru funcția de repartiție corespunzătoare:
 zα pentru repartiția normală Gauss;
 χα2 pentru repartiția χ2;
 tα pentru repartiția Student;
 Fm,n,α pentru repartiția Fisher.

Determinarea probabilității / nivelului de semnificație (1-α)

Se dă parametrul statistic, limitele intervalului de semnificație pentru funcția de


repartiție corespunzătoare, și se cere să se determine probabilitatea / nivelul de
semnificație (1-α) (sau valoarea de risc α).
Se utilizează
NormSdist(z)
Distribuția normală standard N(0,1)

Exemplu. Pentru distribuția normala N(0,1) cu un risc unilateral dreapta, se dă valoarea


lui zα=1.58. Se cere să se determine riscul α.
254 MARIN VLADA

Densitatea de probabilitate N(0,1) se calculează folosind Excel, fiind dată de


funcția NORMSDIST(z) care calculează valoarea nivelul de semnificație (1-α). Avem,
NORMSDIST(1.58) = 0.942947 (94.29%), prin urmare, riscul α=0.057053 (5.70%).
Tabelul de mai jos realizează pentru valori ale lui zα, cu pasul 0.1, valorile riscului α.

z 1-alfa alfa
0 0,5 0,5
0,1 0,539828 0,460172
0,2 0,57926 0,42074
0,3 0,617911 0,382089
0,4 0,655422 0,344578
0,5 0,691462 0,308538
0,6 0,725747 0,274253
0,7 0,758036 0,241964
0,8 0,788145 0,211855
0,9 0,81594 0,18406
1 0,841345 0,158655
1,1 0,864334 0,135666
1,2 0,88493 0,11507
1,3 0,9032 0,0968
1,4 0,919243 0,080757
1,5 0,933193 0,066807
1,6 0,945201 0,054799
1,7 0,955435 0,044565
1,8 0,96407 0,03593
1,9 0,971283 0,028717
2 0,97725 0,02275
2,1 0,982136 0,017864
2,2 0,986097 0,013903
2,3 0,989276 0,010724
Se utilizează
2,4 0,991802 0,008198 NormSinv(p)
2,5 0,99379 0,00621
2,6 0,995339 0,004661
2,7 0,996533 0,003467
2,8 0,997445 0,002555
2,9 0,998134 0,001866
3 0,99865 0,00135
Statistică şi Informatică pentru chimie medicală şi farmaceutică 255

Exemplu. Pentru distribuția normală N(0,1) cu un risc unilateral dreapta, se dă valoarea


nivelului de semnificație (1-α)=0.95 (95%). Se cere să se determine valoarea limitei zα.
Valoarea se calculează folosind Excel, fiind dată de funcția NORMSINV(p) care
calculează valoarea limitei zα, dacă se dă ca argument valoarea unei probabilități p.
Această funcție este inversa funcției NORMSDIST(z). Avem NORMSINV(0.95) = 1.644854,
prin urmare, valoarea limitei zα=1.644854.

Tabelul de mai jos realizează pentru valori probabilității și valorile limitei zα, cu
pasul 0,001.
p z 0,96800 1,852179859
0,94000 1,554773595 0,96900 1,866295743
0,94100 1,563223647 0,97000 1,880793608
0,94200 1,571786817 0,97100 1,895697924
0,94300 1,580466818 0,97200 1,911035648
0,94400 1,589267557 0,97300 1,926836573
0,94500 1,59819314 0,97400 1,943133751
0,94600 1,607247892 0,97500 1,959963985
0,94700 1,616436371 0,97600 1,977368428
0,94800 1,625763386 0,97700 1,99539331
0,94900 1,635234015 0,97800 2,014090812
0,95000 1,644853627 0,97900 2,033520149
0,95100 1,654627902 0,98000 2,053748911
0,95200 1,664562861 0,98100 2,074854734
0,95300 1,674664889 0,98200 2,096927429
0,95400 1,684940768 0,98300 2,12007169
0,95500 1,69539771 0,98400 2,144410621
0,95600 1,706043397 0,98500 2,170090378
0,95700 1,716886018 0,98600 2,197286377
0,95800 1,727934322 0,98700 2,226211769
0,95900 1,739197665 0,98800 2,257129244
0,96000 1,750686071 0,98900 2,290367878
0,96100 1,762410298 0,99000 2,326347874
0,96200 1,77438191 0,99100 2,365618127
0,96300 1,786613365 0,99200 2,408915546
0,96400 1,799118107 0,99300 2,45726339
0,96500 1,811910673 0,99400 2,512144328
0,96600 1,825006821 0,99500 2,575829304
0,96700 1,838423669 0,99600 2,652069808
0,99700 2,747781385
0,99800 2,878161739
0,99900 3,090232306
256 MARIN VLADA

Exemplu. Pentru distribuția normală cu un risc bilateral simetric de α=0.05 (5%), se cere
determinarea intervalului de semnificație. Se cere să se determine valoarea limitei zα.
Valoarea se calculează folosind Excel, fiind dată de funcția NORMSINV(p) care
calculează valoarea limitei zα, dacă se dă ca argument valoarea unei probabilități p.
Avem: α/2=0.025 si (1-α)=0.975 (97,5%). Avem NORMSINV(0.975) = 1.959963985, prin
urmare valoarea limitei zα/2=1.959963985. Deoarece funcția de repartiție normală este
simetrică, intervalul de semnificație/încredere este (-zα/2, zα/2) = (-1.959963985,
1.959963985).
Se utilizează
Tdist(t,v,ind)
Distributia χ2
Exemplu. Pentru distribuția χ2 cu un risc unilateral dreapta, se dă valoarea lui χα2=13.362,
și numărul gradelor de libertate m+n=8. Se cere determinarea riscului α.
Valoarea se calculează folosind Excel, fiind dată de funcția CHIDIST(x,v) care
calculează valoarea riscului α, dacă se dă ca argumente valoarea χα2 și v=numărul
gradelor de libertate. Avem CHIDIST(13.362;8) = 0.09999. Prin urmare, valuarea riscului
este α = 0.09999 (9%).
Se utilizează TInv(2a,v)

Exemplu. Pentru distribuția χ2 cu un risc unilateral dreapta, se dă valoarea nivelului de


semnificație 1-α=95% și numărul gradelor de libertate ν=10. Se cere determinarea limitei
χα2. Valoarea se calculează folosind Excel, fiind dată de funcția CHIINV(α,v) care
calculează valoarea limitei χα2, dacă se dă ca argumente valoarea riscului α și v=numărul
gradelor de libertate. Cum 1-α=95%, înseamnă că α=5%, adică α=0.05 și
CHIINV(0.05;10) = 18.30703805. Prin urmare, valoarea χα2=18.30703805.

Exemplu. Pentru distribuția χ2 cu un risc bilateral simetric, se dă valoarea α=5% și


numărul gradelor de libertate ν=15. Se cere determinarea intervalului de semnificație,
limitele χ2α/2 și χ21-α/2. Valoarea se calculează folosind Excel, fiind dată de funcția
CHIINV(α,v) care calculează valoarea limitei χα2, dacă se dă ca argumente valoarea
riscului α și v=numărul gradelor de libertate. Cum α=5%, înseamnă că 1-α=95%, adică
α/2=2.5%=0.025 și CHIINV(0.025;15) = 27.48839286. Prin urmare, valoarea limitei din
dreapata χ2α/2 = 27.48839286. Pentru a determina valoarea limitei din stînga, vom calcula
valoarea nivelului de semnificație: 1-α/2 = 100%-2.5%=97.5%=0.975 și
CHIINV(0.975;15) = 6.262137817. Prin urmare, valoarea limitei din stânga
χ21-α/2 = 6.262137817. Intervalul de semnificație/încredere este (χ21-α/2, χ21-α/2) =
(6.262137817, 27.48839286).
Se utilizează
ChiDist(x,v)
Distribuția Student (t)
Exemplu. Pentru distribuția Student cu un risc unilateral dreapta, se dă valoarea lui
tα=1.812 și ν=10 grade de libertate. Se cere să se determine riscul α. Valoarea se
calculează folosind Excel, fiind dată de funcția TDIST(tα,v,ind) care calculează valoarea
riscului α, dacă se dă ca argumente valoarea lui tα, v = numărul gradelor de libertate și
Statistică şi Informatică pentru chimie medicală şi farmaceutică 257

ind=1, în cazul repartiției Student cu risc unilateral, respectiv ind=2, în cazul repartiției
Student cu risc bilateral. Avem TDIST(1.812, 10,1) = 0.050037629. Prin urmare, valoarea
riscului este α = 0.050037629 (5%).
Se utilizează ChiInv(x,v)

Exemplu. Pentru distribuția Student cu un risc unilateral dreapta, se dă valoarea riscului


α =10% și ν=15 grade de libertate. Se cere să se determine valoarea limitei tα. Valoarea
se calculează folosind Excel, fiind dată de funcția TINV(2α,v) care calculează valoarea
limitei tα, dacă se dă ca argumente valoarea lui 2α (funcția TINV() este implementata
pentru cazul distribuției bilaterale), v = numărul gradelor de libertate. Avem,
TINV(0.2, 15) = 1.340605608. Prin urmare, valoarea limitei este tα = 1.340605608.

Exemplu. Pentru distribuția Student cu un risc bilateral, se dă valoarea riscului α =10%


și ν=20 grade de libertate. Se cere să se determine limitele intervalului de semnificație
(-tα/2 ,tα/2). Valoarea se calculează folosind Excel, fiind dată de funcția TINV(α/2,v) care
calculează valoarea limitei tα, dacă se dă ca argumente valoarea lui α/2, v = numărul
gradelor de libertate. Avem, TINV(0.05, 20) = 2.085963441. Prin urmare, valoarea limitei
este tα = 2.085963441, adică intervalul (-tα/2 ,tα/2) = (-2.085963441, 2.085963441.

Se utilizează FInv(a,m,n)
Distributia Fisher (F m,n,α)
Exemplu. Pentru distribuția Fisher cu un risc unilateral dreapta, se dă valoarea riscului α
=10% și m=10, n=15 grade de libertate. Se cere să se determine valoarea limitei de
semnificație Fm,n,α. Valoarea se calculează folosind Excel, fiind dată de funcția
FINV(α,m,n) care calculează valoarea limitei tα, dacă se dă ca argumente valoarea lui α, și m,
n = numărul gradelor de libertate. Avem, FINV(0.1, 10, 15) = 2.059319496. Prin urmare,
valoarea limitei este Fm,n,α = 2.059319496.

Exemplu. Pentru distribuția Fisher cu un risc bilateral, se dă valoarea riscului α =20%


și m=15, n=20 grade de libertate. Se cere să se determine valoarea limitei de semnificație
(Fm,n,1-α/2, Fm,n,α/2). Valoarea se calculează folosind Excel, fiind dată de funcția
FINV(α/2,n,m) care calculează valoarea limitei Fm,n,α/2, dacă se dă ca argumente valoarea
lui α/2, și m, n = numărul gradelor de libertate. Avem FINV(0.1, 20, 15) = 1.924314491.
Prin urmare, valoarea limitei este Fm,n,α/2 = 1.924314491. Pentru calculul lui Fm,n,1-α/2,
avem FINV(0.1, 15, 20) = 1.844935151. Prin urmare, intervalul (Fm,n,1-α/2 , Fm,n,α/2) =
(1.844935151, 1.924314491).

3.8.3 Testarea ipotezelor statistice

În domeniul deciziilor privind credibilitatea unei aserțiuni/propoziții/ipoteze din


analiza și studiul masurărilor/datelor experimentale, Statistica matematică a dezvoltat o
procedură pentru verificarea ipotezelor statistice. În general, rezolvarea practică a
problemelor de prelucrare statistică a datelor, implică aproximarea unei distribuții
experimentale (obţinută din datele măsurate/observate ale unui fenomen/proces) cu o
258 MARIN VLADA

distribuție teoretică, care o aproximează în mod satisfăcător. Pentru eliminarea


aproximărilor „grosolane” este recomandat să se aplice un test de verificare, acest test
parcurgând următoarele etape:

1. Enunțarea ipotezei, o presupunere asupra uneia sau a mai multor distribuții,


sau asupra unuia sau a mai multor parametrii ai distribuției respective;
2. Alegerea parametrilor μ, α, n etc.;
3. Calculul funcției de repartiție pe baza datelor şi stabilirea regulilor/criteriilor
ce vor definii decizia (adaptarea sau respingerea unei repartiții);
4. Luarea deciziei, acceptarea sau respingerea funcției de repartiție.

Definiție. Un test statistic reprezintă o metodă a deciziei (de exemplu, în cazul deciziilor
medicale) prin utilizarea datelor experimentale din diverse domenii. Un rezultat se
numeşte semnificativ statistic dacă este puţin probabil să apară datorită întâmplării.

Definiție. O ipoteză statistică este o presupunere/asumpție asupra unui parametru al


populaţiei. Această presupunere/asumpţie poate să fie adevărată sau nu.

Definiție. Ipoteza nulă H0 se referă la verificarea faptului că valoarea presupusă nu diferă


(diferența este 0) de valoarea parametrului.

Definiție. Ipoteza alternativă H1 se referă la verificarea faptului că valoarea presupusă


diferă (diferența nu este 0) de valoarea parametrului, adică diferită de valoarea din
ipoteza H0.

Un test statistic este o variabilă aleatoare folosită pentru a respinge sau nu


ipoteza H0. Testul statistic este o statistică de eșantioane sau alte valori rezultate dintr-un
eșantion. Probabilitățile care apar în acest test statistic sunt determinate presupunând că
H0 este adevărată.

Definiție. O ipoteză clinică reprezintă o propoziţie sau un set de propoziţii, prezentate ca


explicaţie a apariţiei unui grup de fenomene/procese. Această explicaţie poate să fie o
ipoteză de lucru sau o ipoteză foarte probabilă în lumina faptelor stabilite. Aceasta poate
fi o explicaţie posibilă a unei observaţii sau a unui fenomen, sau o problemă care necesită
investigaţii.

Există diferite metode şi teste de verificare ce se aplică repartițiilor teoretice.


Cum, majoritatea fenomenelor/proceselor se supun legii de repartiție normală
Gauss-Laplace, cel mai frecvent test utilizate se referă la verificarea normalității. Pentru
verificarea repartițiilor, trebuie să se specifice un prag de semnificație sau o valoare de
risc pentru care să poată fi luată decizia de acceptare a ipotezelor.
De asemenea, există 2 situații, prima, enunțul unei ipoteze cu privire la un
parametru necunoscut la nivelul unei populații statistice, și a doua, enunțul unei ipoteze
cu privire la un parametru necunoscut la nivelul unui eșantion.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 259

Probabilitatea Populația – enunțul unei ipoteze cu


privire la un parametru necunoscut la
nivelul unei populații.

Eșantionul – enunțul unei ipoteze cu


privire la un parametru necunoscut la
nivelul unui eșantion. Statistica inferențială

Etapele testării ipotezelor statistice


1. Definirea/enunțul ipotezele statistice (presupuneri privind parametrii) H 0
(ipoteza nulă) şi H1 (ipoteza alternativă);
2. Alegerea nivelului de semnificaţie și stabilirea regiunii critică;
3. Calculul statisticii testului şi valoarea probabilitatii p asociate;
4. Concluzia statistică a testului

Etapa 1: Transpunerea problemei cercetate în termeni statistici prin presupuneri asupra


unor parametri ai distribuției ce se studiază. Se face o afirmație relativă la un parametru
al unei populații (de exemplu μ, α, n etc.). Ipoteza nulă H0 se referă la verificarea faptului
că valoarea presupusă nu diferă (diferența este 0) de valoarea parametrului.

Ipoteza alternativă H1 se referă la verificarea faptului că valoarea presupusă diferă


(diferența nu este 0) de valoarea parametrului, adică diferită de valoara din ipoteza H0.
Aceste ipoteze se pot referi și la cazul unilateral (distribuție cu un prag de semnificație),
și la cazul bilateral (distribuție cu un interval de semnificație).

Exemplu. Ipoteze statistice referitoare la parametrii unei populații (de exemplu media μ):

Cazul unilateral dreapta/stânga Cazul bilateral stânga-dreapta


H0: μ = 115 H0: μ = 115
H1: μ > 115 sau μ < 115 H1: μ ≠ 115

În etapa 4 (luarea deciziilor) se va face următoarea analiză:


Decizia Ipoteza H0 adevărată Ipoteza H0 falsă
Acceptare H0 Decizie corectă tip A Eroare tip II
Respingere H0 Eroare tip I Decizie corectă tip B

Concluzii:

 O decizie corectă de tip A: apare când H0 este adevărată și acceptăm H0


 O decizie corectă de tip B: apâre cand H0 este falsă și respingem H0
 O eroare de tip I: apare când H0 este adevarată și respingem H0
 O eroare tip II: apare când H0 este falsă și acceptăm H0.
260 MARIN VLADA

Probabilități:
 α – nivelul de semnificaţie = probabilitatea erorii de tip I (probabilitatea de a
respinge ipoteza nulă în condiţiile în care H0 este adevărată);
 β – probabilitatea erorii de tip II (probabilitatea de a accepta ipoteza nulă în
condiţiile în care ipoteza alternativă este adevărată).

Etapa 2: Metoda de verificare a ipotezelor constă din identificarea unui test statistic,
specificarea valorii lui α, determinarea regiunii critice și a valorii critice.

Probabilități:
 α – nivelul de semnificaţie = probabilitatea erorii de tip I (probabilitatea de a
respinge ipoteza nulă în condiţiile în care H0 este adevărată);
 β – probabilitatea erorii de tip II (probabilitatea de a accepta ipoteza nulă în
condiţiile în care ipoteza alternativă este adevărată).
Nivelul de semnificație este probabilitatea α de a face o eroare de tip I, adică de a
respinge H0 adevărat.
Regiunea critică este mulțimea de valori W pentru care P(X din W) ≤ α și care
determină să se respingă ipoteza H0. Valoarea critică este prima valoare din regiunea
critică. Dacă pentru un eșantion valoarea testului statistic X depăsește valoarea critică,
ipoteza H0 este respinsă.
 Dacă valoarea parametrului statistic aparţine regiunii critice, ipoteza nulă H0
va fi respinsă şi va fi acceptată ipoteza alternativă H1.
 Dacă valoarea parametrului statistic nu aparţine regiunii critice, ipoteza nulă
H0 va fi acceptată.

Etapa 3: Se calculează parametrul statistic al testului corespunzător distribuției (de


exemplu, Ztest, Ttest, Ftest etc.), care este informaţia/valoarea care se va utiliza pentru a
decide dacă respingem sau nu ipoteza nulă H0.

Fig. 175. Regiunea critică. Condiții de acceptare sau nu pentru H0


Statistică şi Informatică pentru chimie medicală şi farmaceutică 261

Etapa 4: Se analizează concluzia statistică a testului. Decizia se ia comparând valoarea


testului statistic cu regiunea critică determinată la Etapa 3.

Regula de decizie: Dacă valoarea testului statistic este în regiunea critică respingem
ipoteza H0, dacă nu, atunci acceptăm ipoteza H0. Ansamblul de valori ale testului statistic
care nu sunt în regiunea critică formează regiunea de acceptabilitate pentru H0.

Aplicație. La Facultatea de Chimie s-a realizat măsurarea greutății (masa corporală)


tuturor studenților din facultate, în număr de 457 de studenți, și s-a obținut media greutății
μ= 54,4 Kg. Această valoare este contestată de profesorul de sport. Pentru a face un test
statistic, se selecționează un eșantion aleator de 100 de studenți și se găsește că media
M[X]= 53,75 kg. Este această valoare suficientă pentru a respinge afirmația cu nivelul de
semnificație α = 0,05 (5%)?

Rezolvare.

Etapa 1: Definirea ipotezelor statistice H0: μ = 54,4 Kg ; H1: μ ≠ 54,4 Kg.

Etapa 2: Metoda de verificare a ipotezelor constă din identificarea unui test statistic,
specificarea valorii lui α, determinarea regiunii critice și a valorii critice.
Când în ipoteza nulă H0, media populației și deviația standard sunt cunoscute,
atunci scorul standard z este folosit ca și test statistic. Nivelul de semnificație α = 0,05
(5%)? este dat. Conform teoremei de limită centrală, distribuția mediilor eșantioanelor
este aproape normală. Prin urmare, distribuția normală va fi folosită pentru determinarea
regiunii critice. Regiunea critică este egală cu mulțimea valorilor scorului standard z care
determină respingerea ipotezei H0.
Media eșantionului este o estimare a mediei populației. Ipoteza alternativă H1
este susținută de medii de eșantioane în intervalul (53,75, 54,4). Ipoteză nulă H0 este
susținută de medii de eșantioane în jurul valorii 54,4. Regiunea critică este formată din
două părți egale, situate la cele două extremități ale distribuției normale. Aria
corespunzătoare fiecărei porțiuni este α/2, iar probabilitatea fiecărei părți a regiunii
critice, este α/2 = 0,025 (2,5%). Eroarea standard de estimare, intervalul de semnificație
(-Zα/2, Zα/2 ), adică Zα/2=1,96 se determină ca soluție a ecuației (folosind Excel, se va apela
funcția NORMSINV(0.025) = −1,959963985)
 1 
  e t
2
/2
dt.
2 2 z

Etapa 3: Se calculează parametrul statistic al testului corespunzător distributiei Ztest,


aceasta fiind informaţia/valoarea care se va utiliza pentru a decide dacă respingem sau nu
ipoteza nulă H0. Gradul de încredere / Scorul standard pentru mediile eșantioanelor este:
x  x x n(x  )
z   , Z test  1.204.
x / n 
262 MARIN VLADA

Acceptare H0

Respingere H0 Respingere H0

Z=-1.204
α/2=0.025

-1.96 1.96

Fig. 176. Regiunea critică

Etapa 4: Se analizează concluzia statistică a testului. Valoarea testului statistic nu este în


regiunea critică.

Decizia: Nu respingem ipoteza H0. Justificarea deciziei: Valoarea testului nu este în


dezacord cu H0 la nivelul de risc α = 0,05. Aceasta nu înseamnă că H0 este adevărată.
Concluzie: Media M[X]= 53,75 kg nu contravine ipotezei că media este 54,4 kg, cănd
dispersia este 5,4 kg. O decizie de respingere a lui H0 înseamnă că valoarea testului
implică faptul că H0 este falsă și indică H1.

Rezumat privind verificarea ipotezelor statistice asupra mediei (varianta clasică)


 Ipoteza H0 specifică o valoare particulară a mediei populației. Ipoteza H1 are
trei forme. Fiecare dintre acestea determină o locație specifică a regiunii
critice așa cum apare în tabelul de mai jos.

Semne în ipoteza H1 < ≠ >


Regiunea critică Test unilateral Test bilateral Test unilateral
stânga, regiunea stânga – dreapta, dreapta, regiunea
stânga regiunea stănga dreapta

 Valoarea lui α se numește nivel de semnificație și reprezintă riscul


(probabilitatea) respingerii lui H0, atunci când aceasta esta adevărată. Nu
putem determina dacă ipoteza H0 este adevărată sau falsă. Putem doar decide
dacă o respingem sau dacă o acceptăm.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 263

 Probabilitatea cu care respingem ipoteza adevărată are valoarea lui α, dar nu


știm probabilitatea cu care facem o decizie „greșită”. O eroare de tip I și o
„greșeală în decizie” sunt termeni diferiți.

Testul χ2 pentru verificarea normalității

De regulă, acest test de verificare a normalității unei distribuții, se utilizează


pentru populații statistice cu n > 100. Pentru un studiu de caz, se consideră un set de
date/eșantion de volum n=120 cu valorile înălțimii a 120 de persoane. Folosind funcția
RAND() ce generează valori aleatoare în intervalul (0, 1), vom genera cu Excel 120 valori
aleatoare cuprinse în intervalul (1.50, 2.10) cu formula „= a+RAND()*(b-a)”, unde
a=1.50 și b=2.10 .

Definirea ipotezei H0: datele statistice (variabila aleatoare X) sunt o variabilă aleatoare
repartizată normal N(0,1), pentru un nivel de încredere de 1−α = 0.95 (95%).
Se vor parcurge următorii pași:

1. Se determină Xmin și Xmax prin sortarea valorilor sau folosind în Excel,


funcțiile MIN() și MAX();
2. Se calculează numărul de clase cu formula lui H. A. Sturges, r = [1+ 3.322 ∗
lgn], unde [ ] este funcția partea întreagă (Exemplu, n=120,
r=1+3.322*LOG10(120) = 8 clase).
3. Se determină amplitudinea variaţiei, notată cu A, și este diferenţa dintre cea
mai mare valoare posibilă şi cea mai mică valoare posibilă, din setul de date:
A = Xmax – Xmin = 0.59; Se determină mărimea intervalelor de grupare a
datelor, notată cu K= A/r, deci K = 0.07431;
4. Se determină limitele pentru fiecare grupă și se va stabili cea mai mică
valoare şi cea mai mare valoare pentru fiecare grupă; prin urmare, intervalele
vor fi [Xmin , Xmin + K ], (Xmin + K, Xmin + 2K], ... (Xmin +(r-1)K, Xmax];

Tabelul 23. Valoarea limitelor (intervalelor) celor 8 clase


Clasa 1 1.50 1.58
Clasa 2 1.59 1.63
Clasa 3 1.64 1.69
Clasa 4 1.71 1.79
Clasa 5 1.80 1.88
Clasa 6 1.89 1.92
Clasa 7 1.93 1.99
Clasa 8 2.00 2.09

5. Se determină frecvenţele pentru fiecare interval. În gruparea datelor statistice


pe intervale este util să se construiască o distribuţie a frecvenţelor absolute
cumulate şi o distribuţie a frecvenţelor relative cumulate, pentru analiza şi
264 MARIN VLADA

interpretarea datelor statistice. Dacă a1 , a2 , ... , ar sunt frecvențele absolute pe


intervale, iar f1 , f2 , ... , fr sunt frecvențele relative pe interval, se va utiliza
funcția COUNT().

Tabelul 24. Grupe, frecvențe și probabilități


Nr. crt. Grupe Frecvențe fi
1 1.50-1.58 14 0.116667
2 1.59-1.63 14 0.116667
3 1.64-1.69 16 0.133333
4 1.71-1.79 18 0.15
5 1.8-1.88 15 0.125
6 1.89-1.92 13 0.108333
7 1.93-1.99 14 0.116667
8 2.00-2.09 16 0.133333
Suma 120 1

Observație. În acest capitol, la descrierea numerelor reale, delimitatorul pentru partea


zecimală este « . » (punctul), această opțiune este setată prin sistemul de operare utilizat.
Alternativa este utilizarea « , » (virgulei) pentru delimitarea părții zecimale. Dacă se
utilizează un fișier Excel, de la un sistem de operare la altul, automat, se face conversia
corespunzătoare setării din sistemul de operare „sursă” în cel „destinație”.

Fig. 177. Histogramă


Statistică şi Informatică pentru chimie medicală şi farmaceutică 265

6. Determinarea indicatorilor statistici, media M[X], dispersia D[X]2 și abaterea


medie patratică D[X]:
1 n 1 n
M[X ]   i
n i 1
x , D 2
[ X ]   ( xi  M [ X ]) 2 , D[ X ]  D 2 [ X ].
n i 1

Pentru valorile generate, avem următoarele rezultate: M[X] = 1.788583333


D2[X] = 0.02654882, D[X] = 0.162938106, obținute folosind funcțiile AVERAGE() și
STDEVP().
7. Se face transformarea de variabilă z = (x - μ ) / σ, și folosind această
transformare, pentru repartiția normală, se poate determina probabilitatea pi
corespunzătoare intervalului (xi, xi+1), cu ajutorul funcției Laplace:

1 x
e
t 2 / 2
F ( x)  dt.
2 0

Vom avea, valorile (zi)i=1,8 calculate cu valorile extremității stângi a intervalului


(clasei). Pentru calculul probabilităților (pi)i=1,8 se va utiliza formula
„=NORMDIST(z,0,1,FALSE)”, care calculează F(z), probabilitatea funcției de repartiție F(z).

Observație. Funcția NORMDIST(x,0,1,TRUE) calculează densitatea de probabilitate f(x).

Fig. 178. Transformarea Z

8. Se calculează probabilitățile corespunzătoare intervalelor/claselor. Ținând


seama de proprietățile funcției de repartiție F(x), avem F(-∞)= 0, F(-t)=1-F(t),
F(∞)=1, și astfel p1 = F(z1)-F(-∞) = F(z1), p8 = F(∞) - F(z8) = 1-F(z8), iar
pentru i=2,7, avem pi = F(zi) - F(zi-1).
8
(a  8 pi ) 2
9. Se calculează valoarea dată de formula  c 2   i  1131.2545.
i 1 8 pi
266 MARIN VLADA

xi ai Zi Pi =F(Pi) Pi+1 – Pi χc2


1.50 14 -1.77112 0.08312782 0.083128 267.3918657
1.59 14 -1.21877 0.18982871 0.106701 202.4674368
1.64 16 -0.9119 0.263231935 0.073403 404.5353777
1.71 18 -0.48229 0.355141101 0.091909 405.3877309
1.80 15 0.070068 0.397964187 0.042823 627.1144974
1.89 13 0.622424 0.328688544 -0.06928 -331.495437
1.93 14 0.867916 0.273739587 -0.05495 -474.30793
2.00 16 1.297527 0.828080217 0.554341 30.16096462
Suma Σ 1131.254505

10. Se calculează valoarea funției χ2 pentru v grade de libertate și un nivel de


încredere de 1-α = 0.95, adică se utilizează formula
χ2=CHIINV(0.95,v) = 2.167349919,
unde v= m-1 =7, m fiind numărul de intervale/clase. Se verifică relația
χ2 ≤ χc2 , și cum avem 2.167349919 < 1131.254505, deduce,

CONCLUZIA: Repartiția studiată SE ACCEPTĂ ca fiind o repartiție normală.

Referințe
1. Marius Bulgaru, Prelucrarea statistică a șirurilor de date. Eliminarea valorilor aberante,
Universitatea Tehnică Cluj-Napoca, www.cermi.utcluj.ro/doc/Lucr_05.pdf.
2. Sorana D. Bolboacă, Informatică medicală și Biostatistică. Estimarea parametrilor statistici,
Universitatea de Medicină și Farmacie, Cluj-Napoca.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 267

4
Modele de aproximare
liniare și neliniare

4.1 Modele matematice în analiza datelor

În activitatea practică din diverse domenii ştiinţifice, economice, sociale etc., apar
cele mai complexe probleme, care trebuie rezolvate. Ştiinţele şi cercetarea ştiinţifică s-au
dezvoltat influenţate de complexitatea acestor probleme şi de proiectele societăţii umane.
Tezaurul conoaşterii umane este influenţat de ştiinţă şi tehnică, de cultură şi artă, şi în
special de modul de rezolvare a problemelor nerezolvate din societatea umană.
Astfel de probleme apar în chimie, biologie şi medicină, în fizică şi geologie, în
economie şi sociologie etc. Pentru studierea şi analiza proceselor şi fenomenelor aceste
activităţi reclamă metode şi tehnici valide şi eficiente, astfel că modele utilizate să
elimine căt mai mult incertitudinile şi aproximările.
În cercetare şi în analiza datelor experimentale din diverse domenii ştiinţifice,
trebuie să se realizeze proceduri de calcul şi modele care să conducă la concluzii privind
interpretarea măsurărilor, calculelor şi rezultatelor modelelor teoretice sau empirice
(aproximative).
Modelele matematice (liniare sau neliniare) ce estimează evoluţia proceselor sau
fenomenelor sunt exprimate de:
 Modele teoretice – acestea se bazează pe diverse legi şi principii ale
domeniului teoretic; sunt modele raţionale ce se determină prin funcţii şi legi
obţinute prin raţionamente teoretice și care exprimă funcţii şi ecuaţii ale unor
teorii studiate în domeniul respectiv: chimie, fizică, biologie etc.
268 MARIN VLADA

 Modele empirice (de aproximare) – acestea au la bază un suport teoretic


pentru a utiliza observaţii (măsurări) empirice ale unor parametri, care
definesc procesele şi fenomenele, în vederea realizării de calcule şi
aproximări (fitare) ale datelor.

Modele teoretice

Exemplu. Legea densităţii de probabilitate Gauss privind distribuţia erorilor de măsurare


(numită şi clopotul lui Gauss), distribuţia normală standard N(0,1), având media 0 şi
dispersia 1:
h 1
f ( x)   e (h x2 )
2
, x  (,) , h  (precizia),
 2
şi lim f ( x)  lim f ( x)  0 .
x x

Exemplu. Ecuaţia Eyring–Polanyi (1935), chemical kinetics (teoria stării de traziţie –


“transition state theory”) – descrie dependenţa de temperatură a ratei de reacţie într-o
reacţie bimoleculară. Principiile teoriei stării de tranzitie: există un echilibru
termodinamic între starea de tranziţie şi starea de reactanţi în partea de sus a barierei de
energie; rata de reacţie chimică este proporţională cu concentraţia de particule în stare de
tranziţie de înaltă energie. Modelul dat de ecuaţia Eyring este folosit în studiul gazelor
prin reacţii condensate şi mixte (Ref.: Peter Keusch, University of Regensburg,
http://www.demochem.de/eyr-e.htm):
‡ ‡
k B  T  RT
H S
k e e R ,
h

unde variabila dependentă k este funcţie de temperatura T şi de parametri S‡ (entropia de


activare), H‡ (entalpia de activare), şi
kB = constanta Boltzmann [1.381 · 10-23 J · K-1 ]
T = temperatura absolută, în grade Kelvin [K]
h = constanta Planck [6.626 · 10-34 J · s ]
R = constanta universală a gazelor = 8.3144621 [ J · mol-1 · K-1]
S‡ = entropia de activare [J · mol-1 · K-1 ]
H‡ = entalpia de activare [kJ · mol-1 ]

Prin logaritmare, ecuaţia Eyring se transformă într-un model liniar:

kB H ‡ 1 S ‡
ln k  ln T   
h R T R

k H ‡ 1 k S ‡
ln    ln B  .
T R T h R
Statistică şi Informatică pentru chimie medicală şi farmaceutică 269

Modele empirice de aproximare

Exemplu. Ecuaţia Arrhenius – ecuaţia se poat aplica numai la cinetica reacţiilor de gaz
şi se bazează pe observaţia empirică a faptului că o reacţie se desfăşoară cu o creştere a
ratei de reacţie la o temperatură mai ridicată:
Ea

k  Ae RT
,
unde A factor și Ea este energia de activare,
Ea
Ea  H ‡  RT ln k    ln A (forma liniară).
RT

Exemplu. The Beer-Lambert Law – Legea lui Beer


(Spectrofotometrie): A = ε L C, unde A este absorţia, ε
(epsilon) este absorbtivitatea molară, care depinde de
lungimea de undă a luminii ce patrunde într-un material
absorbant pe o distanță L, iar C este concentrația
analitului; ε se mai numește și coeficient de extincție.

Sursa: David N. Blauch, Beer's Law:


http://www.chm.davidson.edu/vce/spectrophotometry/beerslaw.html,
http://teaching.shu.ac.uk/hwb/chemistry/tutorials/molspec/beers1.htm.

Fig. 179. Virtual Chemistry Experiments by David N. Blauch –


http://www.chm.davidson.edu/vce/
270 MARIN VLADA

Metode și modele de aproximare

Presupunem că trebuie să se studieze variabila Y (dependentă) în funcţie de


variabila X (independentă), adică dependenţa Y = f(X). De exemplu, dacă X reprezită
parametrul „temperatură”, iar Y parametrul „presiune”, în acest caz variabila Y se
exprimă ca o funcţie de o singură variabilă. Considerăm că s-au determinat (prin
observații, măsurări) n perechi de valori (xi,yi), i=1,…,n corespunzătoare celor două
variabile, pentru care se doreşte să se studieze asocierea şi relaţia dintre ele. O primă
apreciere asupra distribuţiei comune o vom avea dacă realizăm diagrama de împrăştiere
a valorilor, de fapt reprezentarea într-un sistem de axe XOY pentru punctele având
coordonatele (x, y). Se poate utiliza Excel, diagrama tip X Y Scatter.
Analiza vizuală a organizării şi formei norului de puncte obţinut poate oferi
indicii importante asupra relaţiei dintre variabile. Datele vor susţine ipoteza asocierii între
variabile, dacă forma norului de puncte se apropie de o curbă dată cu expresie analitică
cunoscută. Astfel, se pot aprecia asocieri liniare, curbilinii etc. Dacă în norul de puncte
nu se poate distinge o tendinţă, se va spune că variabilele nu sunt corelate. Diversitatea
proceselor şi fenomenelor studiate determină obţinerea unei mari diversităţi de tendinţe:
liniare şi neliniare (curbilinii).
În figurile următoare sunt ilustrate câteva tendinţe ale acestor asocieri.
Y Y

X X
a) asociere liniară pozitivă b) asociere liniară negativă

Y Y

X X
c) fără (nu există) asociere d) asociere neliniară (curbilinie)

Fig. 180. Diferite tipuri de asociere pentru variabilele X şi Y


Statistică şi Informatică pentru chimie medicală şi farmaceutică 271

Pentru a sintetiza (estima) modul în care schimbările variabilei Y sunt asociate cu


schimbările variabilei X, se utilizează metoda matematică „Metoda celor mai mici pătrate
– MCMP” (concepută de Carl Friedrich Gauss, în anul 1795, și publicată de Legendre,
1805). Aplicată în cazurile a) și b), asocierea dintre X şi Y este reprezentată printr-o
dreaptă trasată printre punctele diagramei de împrăştiere. Dreapta estimată (dreapta de
regresie), notată f(x) = ax + b, unde a și b sunt coeficienți ce urmează a fi determinați/
estimați. În acest caz, aceasta dreaptă este „cea mai bună”, în sensul că exprimă cel mai
central drum printre puncte: linia pentru care suma pătratelor distanţelor (pe verticală)
dintre puncte şi dreaptă, este minimă.

Y f(x) = ax + b

Fig. 181. Dreapta de regresie în cazul a)

Distanţele/lungimile yi – f(xi), i=1,…,n sunt considerate ca erori (reziduuri) dintre


valorile măsurate şi valorile estimate.

Y f(x) = ax + b

x1 x2 x3 x4 x5 X

Fig. 182. Valorile măsurate şi valorile estimate. Erorile yi – f(xi), i=1,n

Dreapta de regresie f(x) = ax + b realizează valoarea minimă a pătratelor


erorilor (parametri dreptei a şi b urmează a fi determinaţi prin MCMP),

n
S   [ yi  f ( xi )]2 ,
i 1
272 MARIN VLADA

în sensul că orice altă dreaptă produce o sumă de pătrate mai mare. Este de amintit, faptul
că o proprietate a mediei aritmetice, este aceea că suma pătratelor diferenţelor de la medie
are o valoare minimă. Astfel, se poate spune că după cum media reprezintă punctul de
echilibru pentru o distribuţie univariată de scoruri, la fel dreapta de regresie reprezintă
punctul de echilibru într-o distribuţie bivariată. Utilitatea dreptei de regresiei este aceea
că serveşte ca bază pentru predicţia valorilor lui Y asociate valorilor lui X.

În cazul asocierii neliniare (curbilinie), curba care estimează asocierea dintre


varabilele Y şi X va fi exprimată prin intermediul unor parametri, care urmează a fi
determinați prin MCMP. În practică, în funcţie de natura datelor experimentale şi
procesul analizat, trebuie să se determine „evoluţia” procesului pe baza datelor
experimentale. Aceasta este reprezentată şi estimată de modele matematice date de funcţii
liniare sau neliniare (curbe).

Corelaţie, covarianță și abaterile standard – măsuri de asociere a variabilelor

Definiție. Coeficientul de corelaţie (Correlation coefficient, Pearson) este o măsură a


asocierii liniare dintre două variabile, cu alte cuvinte a gradului în care reprezentarea
bivariată sub forma unei diagrame de împrăştiere, se apropie de o dreaptă. Notând cu X şi
Y cele două variabile şi cu xi, yi, i=1,…,n, valorile variabilelor, formula de calcul este

 x i  x  yi  y 
1 n 1 n
rXY 
n
i 1
n
,x   i
n i 1
x , y   yi .
n i 1
.
 x  x     yi  y 
2 2
i
i 1 i 1

Coeficientul de corelaţie18 este o valoare din intervalul [–1,+1], cu semnificaţia


de asociere pozitivă/negativă, după semnul coeficientului, şi de lipsă de asociere pentru
rXY = 0. În Excel, se apelează funcţia CORREL(Array1, Array2), unde Array1, Array2
sunt, respectiv, zonele care conţin valorile celor două variabile (trebuie să aibă, evident,
acelaşi număr de valori), adică X şi Y.

Definiție. Coeficientul de covarianţă (Covariance) este o măsură a asocierii liniare


n

 x i  x  yi  y 
dintre două variabile X şi Y, Cov X , Y   i 1
, unde x şi y reprezintă
n
mediile vectorilor X şi Y. În Excel, se apelează funcţia COVAR(Array1, Array2), unde
Array1, Array2 sunt, respectiv, zonele care conţin valorile celor două variabile (trebuie să
aibă, evident, acelaşi număr de valori), adică X şi Y.

18
Conceptul statistic de corelaţie și termenul de „regresie” au fost inventate de către Francis
Galton (1822-1911), în secolul al XIX-lea pentru a descrie un fenomen biologic. A promovat pe
scară largă regresia folosind conceptul de medie.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 273

Definiție. Abaterile standard (standard deviation) este o măsură a abaterilor valorilor


n

 x  x
2
i

unei variabile X față de media valorilor (populație), adică S X  i 1


.
n

Pentru calculul abaterilor standard SX se apelează funcţia STDEVP(number1,


number2, …), number1, number2, … are 1 to 30 number arguments corresponding to a
population.

Proprietate. Calculul coeficientului de corelaţie al celor doi vectori de date se poate


exprima şi folosind formula de mai jos:
Cov( X , Y )
rXY 
S X SY ,
unde Cov(X,Y) este covarianţa celor doi vectori X si Y, iar SX , SY sunt abaterile standard
pentru X, respectiv Y.

Exemplu. Pentru un set de date ce reprezintă valorile a două variabile aleatoare X şi Y,


vom calcula în trei moduri coeficientul de corelaţie rXY : a) folosind funcţia CORREL
(X,Y) din Excel, b) folosind Excel pentru calculele directe ale formulei de mai sus, şi c)
folosind covarianţa COVAR (X,Y) din Excel. Se dau seturile de date X șiY.

Tabelul 25. Tabelul valorilor pentru X și Y. Calculul corelației folosind Excel

Valori
Varianta a) Corelaţia 0.775901 identice!
Varianta b) Corelaţia 0.775901
Varianta c) Corelaţia 0.775901
Corelaţia
274 MARIN VLADA

(X,Y)
Medie X Medie Y
13.8 10.03771
Suma C Suma D Suma E
57.6555 13 424.7427
Numărător Numitor
57.6555 74.30784

A B C D E
-1.2 -9.61406 11.53687 1.44 92.43017
-1.1 -8.34566 9.180231 1.21 69.65011
-1 -7.07439 7.074386 1 50.04693
-0.9 -5.81329 5.231962 0.81 33.79435
-0.8 -4.57554 3.660432 0.64 20.93556
-0.7 -3.37425 2.361972 0.49 11.38554
-0.6 -2.22234 1.333405 0.36 4.938799
-0.5 -1.13243 0.566217 0.25 1.282406
-0.4 -0.11667 0.04667 0.16 0.013613
-0.3 0.813378 -0.24401 0.09 0.661584
-0.2 1.646889 -0.32938 0.04 2.712245
-0.1 2.373869 -0.23739 0.01 5.635252
0 2.985289 0 0 8.91195
0.1 3.473193 0.347319 0.01 12.06307
0.2 3.830792 0.766158 0.04 14.67496
0.3 4.052551 1.215765 0.09 16.42317
0.4 4.134267 1.653707 0.16 17.09216
0.5 4.073128 2.036564 0.25 16.59037
0.6 3.867761 2.320656 0.36 14.95957
0.7 3.518267 2.462787 0.49 12.3782
0.8 3.02624 2.420992 0.64 9.158127
0.9 2.394767 2.15529 0.81 5.734909
1 1.628419 1.628419 1 2.651749
1.1 0.733221 0.806543 1.21 0.537613
1.2 -0.28339 -0.34007 1.44 0.080312

Vectorii intermediari:
A  X  X ; B  Y  Y ; C  A  B ; D  A2 ; E  B 2
 în cazul a) se apelează funcţia CORREL(Array1,Array2), unde Array1,
Array2 sunt, respectiv, zonele care conţin valorile celor două variabile
(trebuie să aibă, evident, acelaşi număr de valori), adică X şi Y. Mai jos, este
fereastra oferită prin apelul funcţiei CORREL. Se va indica, pe rând, fiecare
argument în parte: X și Y. Rezultatul obţinut este următorul: rXY = 0.775901.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 275

 în cazul b) trebuie să se realizeze calculul direct, adică este nevoie să se


utilizeze 5 vectori A, B, C, D, E definiţi ţinând seama de expresia din
formula coeficientului de corelaţie rXY .

Deasupra tabelului de mai sus în care se calculează cei 5 vectori, se calculează


valorile intermediare din structura expresiei coeficientului de corelaţie şi se va obţine
acelaşi rezultat rXY = 0.775901.

C=A*B A B

 x i  x  yi  y 
1 n 1 n
rXY  i 1
,x  i x , y   yi .
 n 2 
n
2
n i 1 n i 1
  xi  x     yi  y  
 i 1  i 1 

D=A2 E=B2

 în cazul c). Calculul coeficientului de corelaţie al celor doi vectori de date se


poate exprima, şi folosind formula de mai jos:
Cov( X , Y )
rXY  ,
S X SY
unde Cov(X,Y) este covarianţa celor doi vectori X și Y, iar SX , SY sunt abaterile standard
pentru X, respectiv Y. Avem:

n n

 xi  x  y  y
2 2
i
SX  i 1
şi SY  i 1
.
n n
În acest fel, şi în cazul c) se va obţine acelaşi rezultat rXY = 0.775901.

Pentru diverse probleme complexe care necesită anumite calcule statistice,


trebuie să se cunoască şi să se înţeleagă semnificaţia termenilor şi calculelor statistice
corespunzătoare, şi apoi să se utilizeze instrumentele statistice (Analysis ToolPak,
Analysis ToolPak – VBA, Solver Add-in etc.) oferite de programul Excel. Acest lucru este
valabil şi în cazul problemelor ce necesită rezolvarea ecuaţiilor şi a sistemelor.
Trebuie să se utilizeze meniul Tools  Add-Ins (va apărea submeniul Data
Analysis în meniul Tools).
276 MARIN VLADA

4.2 Metoda celor mai mici pătrate (MCMP)


Istoricul metodei MCMP (The Method of Least Squares Fitting)

În anul 1809, matematicianul german Carl Friedrich Gauss (1777-1855) a


publicat metoda lui de calcul a orbitelor corpurilor cerești. În această lucrare el a pretins
că a fost în posesia metodei celor mai mici pătrate, începând cu anul 1795
(http://mathworld.wolfram.com/LeastSquaresFitting.html). De obicei, Metoda celor mai
mici pătrate (MCMP) este atribuită lui Carl Friedrich Gauss19 (calculul orbitelor
corpurilor cerești, anul 1795), dar se ştie, că aceasta a fost publicată, pentru prima dată de
Adrien Marie Legendre20, în anul 1805 [Bretscher, O., 1995], iar mai târziu, în anul 1809,
și de Carl Friedrich Gauss.
Astăzi, pentru această metoda se folosește și denumirea „metoda de regresie”,
termenul de „regresie” fiind inventat de către Francis Galton (1822-1911), în secolul al
XIX-lea, pentru a descrie un fenomen biologic. De asemenea, a introdus conceptul
statistic de corelaţie şi a promovat pe scară largă regresia folosind conceptul de medie
[Bulmer M., Francis Galton, 2003].

Definiție. Analiza de regresie (Regression Analysis) este o metodă matematică simplă,


concepută pentru investigarea relațiilor dintre două variabile X și Y, variabila Y fiind
variabila dependentă de variabila X, acestea descriind un proces sau un fenomen. Pornind
de la valorile experimentale ale variabilelor X și Y, metoda are ca scop determinarea unui
model liniar sau neliniar, pentru aproximarea evoluției dependenței Y= f(X), funcția f
fiind o curbă (nu neapărat o linie dreaptă), care va realiza o aproximare (fitare, fitting)
pentru setul de puncte (xi, yi), i=1,n, valorile măsurate ale variabilelor X și Y.
Aproximarea cea mai bună este obținută prin criterii optime (goodness-of-fit) și prin
alegerea unui model (funcție) cel mai adecvat, conform unui criteriu bine definit.

Cel mai frecvent tip de regresie este regresia liniară, dar în natură există și multe
alte tipuri de regresii neliniare: polinomiale de grad 2,3, ..., 6, exponențiale, logaritmice,
putere etc.
Deși, această analiză (metodă) este oferită de Statistică, realizarea unei aplicații
de succes privind utilizarea analizei de regresie, necesită un echilibru al rezultatelor
teoretice, cu reguli empirice, și cu o judecată subiectivă. Prin analiza de regresie se
explică principiile care stau la baza analizei datelor experimentale, subliniind analiza
datelor, mai degrabă, decât teoria statistică. Astăzi, această analiză de regresie este
actualizată prin progresele recente din domeniu, oferind analize de profunzime privind
date de diagnosticare în medicină, sau în alte domenii, analiza seriilor de timp,
multicoliniaritate și regresia logistică, acesta întâlnite în mod obișnuit în lumea reală.

19
Carl Friedrich Gauss (1777-1855) - German mathematician who contributed significantly to
many fields, including number theory, algebra, statistics, analysis, differential geometry, geodesy,
geophysics, mechanics, electrostatics, astronomy, matrix theory, and optics.
20
Legendre, Adrien-Marie (1805), Nouvelles méthodes pour la détermination des orbites des
comètes [New Methods for the Determination of the Orbits of Comets] (in French), Paris: F. Didot
Statistică şi Informatică pentru chimie medicală şi farmaceutică 277

Fiecare dintre metodele descrise prin analiza de regresie pot fi efectuate cu


pachete software statistice performante și disponibile sub diverse forme. Cele mai
frecvente sunt oferite de programul Excel prin „Add Tredline” (Regession type).

Fig. 183. Fereastra „Add Tredline” (Regession type) oferită de Excel

Metoda – Formularea problemei

Definiție. Fiind date valorile observate/măsurate pentru două variabile aleatoare X şi Y,


variabila Y dependentă (variabilă-efect) de variabila X (variabilă-cauză), fie acestea
(xi,yi), i=1,…,n. Prin funcţie de regresie /model matematic se va înţelege acea funcţie
unidimensională, Y = f(X) care aproximează cel mai bine setul de date observate, unde
f: DX  DY, DX este domeniul de valori pentru X, iar DY este domeniul de valori pentru Y.
De regulă, criteriul ales este dat de metoda celor mai mici pătrate (MCMP), adică acea
funcţie f pentru care se minimizează suma pătratelor erorilor dintre valorile măsurate şi
cele estimate (procedeu de fitare), adică suma

n
S   [ y i  f ( xi )] 2 .
i 1

Dacă f este o funcţie liniară (model liniar), atunci se obţine regresia liniară,
reprezentată grafic printr-o dreaptă (dreapta de regresie). Dreapta de regresie, împreună
cu abaterile standard ale variabilelor X şi Y, sau cu coeficientul de corelaţie, pot constitui
o rezumare rezonabilă a distribuţiei comune a celor două variabile X și Y. Descrierea
modelului liniar este mai bună atunci când diagrama de împrăştiere are formă de elipsă.
278 MARIN VLADA

Dacă f este o funcţie neliniară (model neliniar), atunci se obţine regresia neliniară,
reprezentată grafic printr-o curbă (curba de regresie): polinom de gradul 2, 3, ...,
exponețială, logaritmică, putere, sinusoidă etc.

Distanţele/lungimile yi – f(xi), i=1,…,n sunt considerate ca erori (reziduuri) dintre


valorile măsurate şi valorile estimate.

f(x) – funcție ce
Y estimează evoluția
procesului

x1 x2 x3 x4 x5 X

Fig. 184. Valorile măsurate şi valorile estimate, Erorile/Distanţele yi – f(xi), i=1,n

Dependenţa funcţională a unei variabile aleatoare Y (dependentă-efect) faţă de


altă variabilă X (independentă-cauză) poate fi studiată empiric, pe cale experimentală,
efectuîndu-se o serie de măsurări asupra variabilei Y pentru diferite valori ale variabilei
X. Rezultatele se pot prezenta sub formă de tabel sau grafic. Problema care apare în acest
caz, este de a găsi reprezentarea analitică a dependenţei funcţionale căutate (procedeu de
fitare), adică de a alege o expresie (formulă sau model matematic) care să descrie
rezultatele experimentului printr-un model matematic.
Formula (modelul matematic-expresia analitică) se alege dintr-o mulţime de
formule determinate (modele de aproximare liniare și neliniare), de exemplu:
 y = ax + b (dreapta),
 y = ax2 + bx + c (parabola),
 y = ax3 + bx2 + cx + d (polinom gradul 3),
 y = ax4 + bx3 + cx2 + dx + e (polinom gradul 4),
 y = a + b ln x (logaritm),
 y = aebx (exponenţiala),
 y = a / ( 1 - c e-bx ) (scădere exponențială); y = a / ( 1 + c e-bx ) (logistic),
 y = a exp(-(x- c)/ b)2 (modelul gaussian)
 y = a xb (putere),
 y = a sin( bx + c) + d (sinusoida).
Statistică şi Informatică pentru chimie medicală şi farmaceutică 279

Pin urmare, problema constă în a determina parametrii a, b, c etc., în timp ce


formula (expresia analitică) este cunoscută dinainte, ca urmare a unor considerente
teoretice sau după forma prezentării grafice a datelor, în mod empiric.
Să considerăm, cazul general, când funcția f se definește cu p parametri
necunoscuți, şi astfel vom nota dependenţa funcţională prin
y = f(x; a1, a2, …, ap).
Parametrii a1, a2,…, ap nu se pot determina exact, pe baza valorilor empirice y1,
y2,…,yn ale funcţiei, deoarece acestea din urmă conţin erori aleatoare. Problema
reprezintă obţinerea unei estimări „suficient de bune”.
Dacă toate măsurările valorilor varabilei Y sunt y1, y2,…,yn, atunci estimaţiile
parametrilor a1, a2,…, ap se determină din condiţia ca suma pătratelor abaterilor valorilor
măsurate yk , față de cele calculate f(xk; a1, a2,…, ap), să ia valoarea minimă (Legendre,
1805), adică sa fie minimă expresia (funcția S(a1, a2,..., ap) fiind considerată o funcție cu
p variabile, S: Rp  R):
n
S  [ y k  f ( xk ; a1 , a2 ,..., a p )]2 .
k 1
Consideraţia formulată se păstrează şi în general, pentru determinarea
parametrilor unei funcţii f, de mai multe variabile (2, 3 etc.), adică Z, o variabilă
dependentă (efect) şi mai multe variabile independente (cauze). De exemplu, pentru
variabila Z (efect), care depinde de două variabile independente (cauze) X şi Y, adică
Z=f(X,Y), estimaţiile parametrilor a0, a1,…, ap se determină din condiţia ca expresia
n
S  [ z k  f ( xk , y k ; a1 , a2 ,..., a p )]2 să fie minimă.
k 1
Determinarea valorilor parametrilor a1, a2,..., ap, se face prin aplicarea condiţiilor
de obtinere a valorii minime, în derivatele parţiale ale funcţiei S, considerată în variabilele
a1, a2,..., ap , adică funcţia cu p variabile S(a1, a2,..., ap).
Deoarece valorile (xi ,yi), i=1,..., n sunt cunoscute, expresia S este de fapt, o
functie de p variabile, S(a1, a2,..., ap), unde S: Rp  R. Din analiza matematică, se
cunoaște faptul că determinarea extremelor funcției S, și anume, căutarea valorilor
necunoscute a1, a2,..., ap, pentru care S(a1, a2,..., ap) atinge valoarea minimă, se realizează
prin sistemul de ecuații în care derivatele parțiale ale lui S sunt nule.
Determinarea acestor valori înseamnă rezolvarea sistemului de p ecuaţii cu
p necunoscute:
S S S
 0,  0 ,…,  0.
a1 a 2 a p

Referințe
1. M. Vlada, Informatică aplicată. Modele de aproximare, software şi aplicaţii, Editura
Universităţii din Bucureşti, 2012.
2. Chatterjee, S., Hadi, A. and Price, B., Regression Analysis by Example, 3rd ed. New York:
Wiley, 2000.
3. Larry, D. Schroeder, David, L. Sjoquist, Paula, E. Stephan, Understanding Regression Analysis:
An Introductory Guide, 2nd Edition, SAGE Publications, 2017.
280 MARIN VLADA

4.3 Modele liniare. Dreapta de regresie


Regresia liniară (Linear Regression)

În cazul modelului liniar (cel mai simplu) se studiază numai două variabile
X (cauză), Y (efect), şi se doreşte găsirea dependenţei Y = f(X), unde f(x) = ax + b este o
dependenţă liniară (funcţie de gradul I), cu 2 parametrii a şi b.

Teoremă. Dacă pentru variabilele X (cauză), Y(efect) se cunosc n probe (măsurări,


observaţii) prin valorile datelor (xi ,yi), i=1,..., n, modelul liniar f(x)= a x+ b este
determinat de coeficienţii a și b, având următoarele expresii:

Sx S y  nSxy 1
a
(Sx )  nSxx
2
şi b 
n

S y  aS x 
n n n n

x y
i 1
i i  Sxy x
i 1
2
i  Sxx x
i 1
i  Sx y
i 1
i  Sy
.

Demonstraţie. În urma celor n probe (măsurări, observaţii) se cunosc datele (xi ,yi),
i=1,..., n şi trebuie să se determine coeficienţii a şi b, astfel încât suma

n
S    y i  (ax i  b) să fie minimă.
2

i 1

Y f(x) = ax + b

x1 x2 x3 x4 x5 X

Fig. 185. Erorile/Distanţele yi – f(xi), i=1,n

Deoarece valorile (xi ,yi), i=1,..., n sunt cunoscute, expresia S este o functie de 2
variabile, S(a,b), unde S: R2  R. Din analiza matematică, se cunoaște faptul că
determinarea extremelor funcției S, și anume, căutarea valorilor necunoscutele a și b,
pentru care S(a,b) atinge valoarea minimă, se realizează prin sistemul de ecuații în care
derivatele parțiale ale lui S sunt nule. Condiţiile de obţinere a parametrilor a şi b sunt:
Statistică şi Informatică pentru chimie medicală şi farmaceutică 281

 S
 a  0
 , ceea ce conduce la sistemul de 2 ecuaţii cu 2 necunoscute:
 S  0
 b
 n  n n n

2  y i  (ax i  b)( x i )  0 2 x i y i  2 ax i  2 bx i  0


2

 i 1  i 1 i 1 i 1
 n   n n n
2  y  (ax  b)  0 2 y  2 ax  2 b  0
 
i 1
i i
  i 
 i 1 i 1
i 
i 1

Se notează:
n n n n

 x i y i  Sxy
i 1
 x2i  Sxx
i 1
 x i  Sx
i 1
y
i 1
i  Sy

și sistemul de ecuaţii devine:


Sxy  aSxx  bSx  0

 .

S y  aS x  nb  0
Se obţin următoarele expresii pentru cei doi coeficienți a şi b:
Sx S y  nSxy 1
a
(Sx )  nSxx
2
şi b 
n

S y  aS x 
Cei doi parametri ai funcţiei model f(x) = ax + b reprezintă:
 a – panta dreptei de regresie, adică a=tg(α), unde α este unghiul dintre
graficul funcţiei f şi axa OX (axa absciselor);
 b – valoarea pe axa OX unde graficul funcţiei f intersectează axa OY (axa
ordonatelor).
Trebuie să facem observaţia că indiferent de gradul de împrăştiere al punctelor,
întotdeauna se poate găsi o dreaptă de regresie, dar în cazul unei dispersii mari aceasta
devine inutilă. De aceea, un studiu preliminar al distribuţiei punctelor (norul de puncte) se
impune cu necesitate.

Definiție. Coeficientul de determinare R2 (R-squared value on chart) pătratul


coeficientului de corelaţie multiplă, exprimă calitatea unei drepte de regresie privind
performanța modelarii observațiilor (calitatea fitării). Acest coeficient are valori în
intervalul [0,1] şi se calculează cu relaţia:
n n

[ yi  f ( xi )]2 [ y i  f ( xi )]2
R2  1 i 1
n
sau R 2  1  i 1
2
.
1 n 
[ y
n
 y]   n  f ( xi )  f ( xi )
2
i
i 1 i 1  i 1 
Valoarea 1 pentru acest coeficient are semnificaţia că funcţia model f explică
întreaga variabilitate (dependență) a lui Y, iar valoarea 0, are semnificaţia că nu există
nici o relaţie liniară între variabila Y şi variabila X. O valoare de 0,5 a lui R2 poate fi
282 MARIN VLADA

interpretată, în sensul că aproximativ 50% din variaţia variabilei Y poate fi determinată


de către variabila independentă X.

Definiție. Indicatorul RMSE (Root Mean Square Error) sau RMSD (Root Mean Square
Deviation), eroarea medie pătrată a rădăcinii sau deviația medie pătrată, este unul
dintre cei mai utilizați indicatori statistici în domeniile Meteorologie, GIS (Geographic
Information System) etc. Indicatorul RMSE măsoară cât de mare este eroarea ce există
între două seturi de date, care compară o valoare estimată cu o valoare observată sau
cunoscută. Dacă valorile observate/cunoscute sunt date de variabila Y  ( yi ) i 1,n și
valorile estimare sunt Yˆ  ( yˆ i ) i 1,n , atunci formula pentru acest indicator este:

1 n
RMSE  
n i 1
( yi  yˆ i ) 2 .

De exemplu, un punct de altitudine LiDAR – Light Detection and Ranging,


(valoarea estimată) poate fi comparat cu o măsurare realizată la sol (valoarea observată).

Fig. 186. LiDAR. Sursa: http://gisgeography.com/lidar-light-detection-and-ranging/

Din studiile realizate folosind indicatorul RMSE se constată ca erorile sunt imparțiale
și urmează o distribuție normală Gauss. Vom exemplifica acest aspect printr-o aplicație.

Aplicație. Vom presupune datele valorilor măsurate (xi ,yi), i=1,..., n corespunzătoare
variabilelor X și Y, cu dependența Y =f(X), de la secțiunea următoare „Exemple şi aplicaţii
practice”, pag. 285. În urma utilizarii programului Excel și apariţiei graficului
(determinarea modelului liniar), care reprezintă dreapta de regresie, se obţin următoarele
rezultate:

y = f(x) = -83.636x + 1317.6, a = -83.636, b = 1317.6 și R2 = 0.999.

Prin urmare, vom considera ca valorile estimate pentru Y sunt valorile f(yi),
i=1,..., n, și să calculăm pentru această estimare indicatorul RMSE.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 283

Tabelul 26. Pătratele abaterilor față de valorile estimate


X Y f(X) [Y-f(X)]^2
0,1 1310 1309,236 0,583085
0,2 1300 1300,873 0,76178
0,3 1293 1292,509 0,240885
0,4 1283 1284,146 1,312399
0,5 1276 1275,782 0,047524
0,6 1267 1267,418 0,175059
0,7 1260 1259,055 0,893403
0,8 1251 1250,691 0,095357
0,9 1243 1242,328 0,452122
1 1233 1233,964 0,929296

Fig. 187. Norul de puncte pentru erori

Vom verifica dacă erorile urmează o distribuție normală Gauss. Pentru valorile
(yi), i=1,..., n vom calcula: probability density function (PDF), NORMDIST (y, mean,
standard_dev, FALSE) cumulative distribution function (CDF), NORMDIST (y, mean,
standard_dev,TRUE), unde mean=AVERAGE(Y) și standard_dev = STDEV(Y).
284 MARIN VLADA

Tabelul 27. Calculul valorilor PDF și CDF


Y [Y-f(X)]^2 PDF CDF
=NORMDIST(F32;F$44;
1310 0,583085 0,004989 0,935298 H$44;FALSE)
1300 0,76178 0,0084 0,868972
1293 0,240885 0,011024 0,800974
=NORMDIST(F32;F$44;
1283 1,312399 0,014236 0,673714 H$44;TRUE)
1276 0,047524 0,015519 0,56897
1267 0,175059 0,015497 0,427922
1260 0,893403 0,014185 0,323438
1251 0,095357 0,011316 0,207958
1243 0,452122 0,008325 0,129352
1233 0,929296 0,00493 0,063708

Fig. 188. Densitatea de probabilitate (PDF)


Statistică şi Informatică pentru chimie medicală şi farmaceutică 285

Fig. 189. Funcția de repartiție. Distribuția cumulativă (CDF)

Referințe
1. Root Mean Square Error RMSE in GIS ,
http://gisgeography.com/root-mean-square-error-rmse-gis/
2. T. Chai and R.R. Draxler, Root mean square error (RMSE) or mean absolute error (MAE)?-
Arguments against avoiding RMSE in the literature Geosci. Model Dev. 7, 1247-1250, 2014,
http://www.statisticshowto.com/rmse/
4. RMSE: Root Mean Square Error, http://www.statisticshowto.com/rmse/
5. Chapter 9, the SD of the Prediction Errors (RMSE), University of Illinois, http://www.stat.
illinois.edu/courses/stat100/Notes/Chap9.pdf

Exemple şi aplicaţii practice

Folosind programul Excel să se determine drepta de regresie pentru două


variabile X şi Y (de exemplu, în cadrul unui proces electric: variabila intensitate I(mA) şi
variabila Tensiune U(mV) ce depinde de aceasta) şi să se obţină calitatea aproximării
(fitării) prin calculul coeficientului de determinare R2.
Într-o foaie de calcul Excel, să presupunem că apar valorile măsurate pentru
variabilele X şi Y. Pentru obţinerea dreptei de regresie şi a coeficientului de determinare
R2 , trebuie să se parcurgă următorii 2 paşi:

Pasul 1. Reprezentarea norului de puncte (diagrama de împrăştiere) pentru variabilele


X şi Y. Pentru acest lucru trebuie să se selecteze valorile aflate în cele 2 coloane ale celor
2 variabile, se acţionează Insert  Chart şi se alege tipul de grafic XY (Scatter)
(Standard Types), de unde din cele 5 variante de grafice, se optează pentru prima variantă
(Scatter-Compares pairs of values); se parcurg etapele pentru a genera graficul respectiv
(acesta apare în fig. 190).
286 MARIN VLADA

Dreapta de regresie

1320

1310

1300

1290
1280
Y

1270 Y
1260

1250
1240

1230
1220
0 0.2 0.4 0.6 0.8 1 1.2
X

Fig. 190. Alegerea graficului de tip XY (Scatter) (norul de puncte)

Pasul 2. Determinarea şi reprezentarea dreptei de regresie. Se selectează graficul obţinut


la pasul 1 (norul de puncte) şi se acţioneaza Chart  Add Trendline, de unde se alege
tipul Linear (Standard Types). Eticheta Add Trendline Options este prezentată în figura
următoare (fig. 191) şi permite definirea altor atribute ale Liniei de trend: Display
equation on chart – marcarea boxei de control are efectul trecerii pe grafic a ecuaţiei
estimate, Display R-squared value on chart – este utilă pentru afişarea coeficientului de
determinare R2 (pătratul coeficientului de corelaţie multiplă).

Desplay
-Ecuation
-R-squared value

Fig. 191. Alegerea modelului şi opțiunilor pentru display


Statistică şi Informatică pentru chimie medicală şi farmaceutică 287

În urma apariţiei graficului, care reprezintă dreapta de regresie, se obţin


următoarele rezultate:

y = f(x) = -83.636x + 1317.6, a = -83.636, b = 1317.6 și R2 = 0.999.

X Y Dreapta de regresie

0.1 1310 1320


y = -83.636x + 1317.6
0.2 1300 1310
R2 = 0.999
0.3 1293 1300

1290
0.4 1283
1280
0.5 1276 Series1
Y

1270
Linear (Series1)
0.6 1267 1260

0.7 1260 1250


1240
0.8 1251
1230
0.9 1243
1220
1 1233 0 0.2 0.4 0.6 0.8 1 1.2
X

Fig. 192. Setul de valori şi dreapta de regresie (modelul liniar)

Trebuie să precizăm că programul Excel oferă prin Trendline mai multe tipuri de
regresii (modele liniare şi neliniare):
 Linear – modelul liniar (regresia simplă) y = a + bx.
 Polynomial – modelul polinomial de ordin 2, 3, 4, 5 sau 6.
y  a0  a1 x  a2 x 2    ak x k .
 Logarithmic – modelul logaritmic y = a + b ln x.
 Exponential – modelul exponenţial y = aebx
 Power – modelul putere y = a xb.
 Moving Average – modelul de tip MA (medii glisante), în care se calculează o
serie nouă cu valori obţinute ca medie aritmetică a valorilor din seria iniţială:
yn = (xn + xn-1 + … + xn-k+1)/k,
unde k este ordinul modelului. Este modelul prin care se elimină influenţele pe
termen foarte scurt sau scurt. Pentru o alegere corectă, se poate utiliza
informaţia cunoscută din cercetări anterioare, sau cea furnizată vizual de
aspectul norului de puncte.

Exemplu. Pentru dozarea unui antibiotic într-un lichid biologic, se propun două metode:
o metodă radio-imunologică (R-I) şi o metodă imuno-enzimatică (I-E). Se se realizeze
testarea comparativă a celor două metode. Datele pentru cele două metode sunt prezentate
în tabelul de mai jos (fig. 193): coeficientul de corelaţie între vectorii R-I (X) şi I-E (Y),
dreapta de regresie şi coeficientul de determinare.
288 MARIN VLADA

Coeficientul de corelaţie se obţine apelând funcţia Excel CORREL (X,Y) =


0.964795. În urma apariţiei graficului, care reprezintă dreapta de regresie, se obţin
următoarele rezultate:

y = f(x) = 0.8983 x + 0.146, a = 0.8983, b = 0.146 și R2 = 0.9308.

X Y
Comparatia metodelor R-I si I-E
0.56 0.60
0.65 0.67 4
1.11 1.08 3.5
1.29 1.25
3
1.42 1.44
Metoda I-E: Y

2.5
1.52 1.53
1.84 1.96 2 Series1

2.18 2.21 1.5


2.19 2.23
1
2.40 2.44
0.5
3.01 2.95
3.21 2.25 0
0 1 2 3 4
3.57 3.71
Metoda R-I: X
3.70 3.46
Fig. 193. Norul de puncte – grafic tip X Y (Scatter)

Comparatia metodelor R-I si I-E

4
y = 0.8983x + 0.146
3.5
R2 = 0.9308
3
Metoda I-E: Y

2.5
Series1
2
Linear (Series1)
1.5

0.5

0
0 1 2 3 4
Metoda R-I: X

Fig. 194. Dreapta de regresie - Trendline Linear, R2 = 0.9308

Exemplu. Se presupune că se dau măsurări (observaţii) ale variabilei dependente Y faţă


de variabila X. Să se determine modelele: exponenţial şi logaritmic.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 289

Domeniul valorilor
X Y
Rezolvare:
1 60
 Modelul exponenţial: 2 50
y = 48.336e0.0836x, R2 = 0.876 ; 3 60
 Modelul logaritmic: 4 70
y = 18.505Ln(x) + 47.345, R2 = 0.6989 5 70
6 80
7 90
8 95

Fig. 195. Modelul exponenţial Fig. 196. Modelul logaritmic

4.4 Modele neliniare. Metoda regresiei


De regulă, multe modele sunt liniare, dar în natură sunt multe procese și
fenomene care au o evoluție neliniară. Astfel de probleme apar în chimie, biologie şi
medicină, în fizică şi geologie, în economie şi sociologie etc. Pentru studierea şi analiza
proceselor şi fenomenelor aceste activităţi reclamă metode şi tehnici valide şi eficiente,
astfel că modele utilizate să elimine căt mai mult incertitudinile şi aproximările.

Regresia neliniară (Nonlinear Regression)

Date fiind valorile observate pentru două variabile aleatoare X şi Y, fie acestea
(xi,yi), i=1,…,n, prin funcţie de regresie se va înţelege acea funcţie Y = f(X) care
aproximează cel mai bine setul de date observate. De regulă, criteriul ales este dat de
metoda celor mai mici pătrate (MCMP), adică acea funcţie f pentru care se minimizează suma
patratelor erorilor între valorile măsurate şi cele estimate (procedeu de fitare), adică suma:
n
S   [ yi  f ( xi )]2 .
i 1
290 MARIN VLADA

Dacă f este o funcţie neliniară, atunci se obţine regresia neliniară, reprezentată


grafic printr-o curba de regresie.

Modelul logaritmic

Modelul logaritmic f(x)= a +b ln(x)

În cazul modelului logaritmic se studiază


numai două variabile X (cauză), Y(efect) şi
se doreşte găsirea dependenţei Y = f(X),
unde f(x) = a + b lnx este o dependenţă
neliniară (funcţie logaritmică), cu p=2
parametri a şi b.

Teoremă. Dacă pentru variabilele X


(cauză), Y(efect) se cunosc n probe
(măsurări, observaţii), prin valorile datelor (xi ,yi), i=1,..., n, modelul logaritmic f(x)= a
+ b ln(x) este determinat de coeficienţii a și b având următoarele expresii:

 n n  n  n 
  yi  (ln xi )2    ln xi   yi ln xi 
a   i 1  i 1  i 1  i 1
2

n
 n

n (ln xi )2    ln xi 
i 1  i 1 
n n n
 yi ln xi  a  ln xi y i  na
b i 1
n
i 1
sau b  i 1
n
.
 (ln x )
i 1
i
2
 ln x
i 1
i

Demonstraţie. În urma celor n probe (măsurări, observaţii) se cunosc datele (xi ,yi),
i=1,..., n, şi trebuie să se determine coeficienţii a şi b astfel încât suma
n
S (a, b)   [ yi  (a  b ln xi )]2
i 1
să fie minimă.
Vom avea următoarele calcule:
[ yi  (a  b ln xi )] 2  a 2  2ab ln xi  2ayi  2byi ln xi  b 2 (ln xi ) 2  yi ,
2

prin urmare,
n
S (a, b)   [ yi  (a  bLn xi )] 2 
i 1
n n n n n
 na 2  2ab ln xi  2a yi  2b  yi ln xi   b 2  ln xi    yi2 .
2

i 1 i 1 i 1 i 1
Statistică şi Informatică pentru chimie medicală şi farmaceutică 291

Derivatele parţiale ale funcţiei S(a,b) sunt:

S n n
 2na  2b ln xi  2 y i
a i 1 i 1

S n n n
 2a  ln xi  2 ( y i ln xi )  2b (ln xi ) 2 .
b i 1 i 1 i 1

Condiţiile de determinare a parametrilor a şi b sunt:


 S
 a  0
 , ceea ce conduce la sistemul de 2 ecuaţii cu 2 necunoscute:

 0S
 b

n n
2na  2b ln xi  2 y i  0
i 1 i 1
n n n
2a  ln xi  2 ( y i ln xi )  2b (ln xi ) 2  0
i 1 i 1 i 1

Pentru rezolvarea acestui sistem se înmulţeşte prima ecuaţie cu expresia


n n

 (ln xi ) 2 , iar a doua ecuaţie cu expresia


i 1
 ln x
i 1
i , după care din prima ecuaţie se scade

a doua ecuaţie. Se va obţine următoarea ecuaţie:

n n n n n n
2na (ln xi ) 2  2a( ln xi ) 2  2 ( y i ln xi )( ln xi )  2( y i ) (ln xi ) 2  0 ,
i 1 i 1 i 1 i 1 i 1 i 1

n n n n
( y i ) (ln xi )  ( ln xi )( y i ln xi ) 2

a i 1 i 1
n
i 1
n
i 1
,
n (ln xi )  ( ln xi ) 2 2

i 1 i 1

şi prin urmare, din a doua ecuaţie, respectiv prima ecuaţie, avem determinat coeficientul b:

n n n

y i ln xi  a  ln xi y i  na
b i 1
n
i 1
sau b  i 1
n
.
 (ln x )
i 1
i
2
 ln x
i 1
i
292 MARIN VLADA

Aplicaţie. Pentru variabilele X și Y avem următoarele măsurări (observaţii):

Tabelul 19. Valorile măsurate pentru variabilele X și Y


X Y
0.1 1310
0.2 1300
0.3 1293
0.4 1283
0.5 1276
0.6 1267
0.7 1260
0.8 1251
0.9 1243
1 1233

Pentru a realiza calculul direct al coeficienţilor a şi b, conform teoremei, vom


realiza în Excel, calculele din tabelul de mai jos:

Tabelul 20. Calcule pentru coeficienții modelului logaritmic


X Y Ln X Y ln X (lnX)2
0.1 1310 -2.30259 -3016.39 5.301898
0.2 1300 -1.60944 -2092.27 2.59029
0.3 1293 -1.20397 -1556.74 1.449551
0.4 1283 -0.91629 -1175.6 0.839589
0.5 1276 -0.69315 -884.456 0.480453
0.6 1267 -0.51083 -647.216 0.260943
0.7 1260 -0.35667 -449.41 0.127217
0.8 1251 -0.22314 -279.153 0.049793
0.9 1243 -0.10536 -130.963 0.011101
1 1233 0 0 0
Suma 12716 -7.92144 -10232.2 11.11083

În celula B44, de exemplu, se scrie formula:


„=(B41*E41-C41*D41) /(10*E41-C41*C41)”;
pentru calculul expresiei lui a, iar în celul B45 se scrie formula:
„=(B41-10*B44)/C41”;
pentru calculul, expresiei lui b (a doua expresie).

Se obţin următoarele valori:


a = 1245.508 și b = -32.9391, f(x)= 1245.508 -32.9391 ln(x), R2 = 0.9083.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 293

1330
y = -32.939Ln(x) + 1245.5
1320
R2 = 0.9083
1310

1300

1290

1280 Series1
1270 Log. (Series1)

1260

1250

1240

1230

1220
0 0.2 0.4 0.6 0.8 1 1.2

Fig. 197. Curba exponențială obținută cu Excel

Mai jos este o captură de ecran cu prelucrările realizate în programul Excel


(valorile pentru a şi b obţinute, conform teoremei, sunt identice cu valorile obţinute prin
aplicarea modelului logaritmic dat de programul Excel):

Fig. 198. Foaia de calcul din programul Excel


294 MARIN VLADA

Modelul exponenţial

Modelul exponenţial f(x)= aebx


În cazul modelului exponenţial se studiază numai
două variabile X (cauză), Y(efect), şi se doreşte
găsirea dependenţei Y = f(X), unde f(x) = a ebx,
este o dependenţă neliniară (funcţie exponenţială)
cu p=2 parametri, a şi b.

Teoremă. Dacă pentru variabilele X (cauză),


Y(efect) se cunosc n probe (măsurări,
observaţii), prin valorile datelor (xi ,yi), i=1,...,
n, modelul exponenţial f(x) = a ebx este
determinat de coeficienţii a şi b, având
următoarele expresii:

n n n

 xi  ln yi  n ( xi ln yi )
b i 1 i 1
n
i 1
n
şi a= ep , unde
( xi ) 2  n xi
2

i 1 i 1

n n n n

 ( xi ln yi )  b xi
2
 ln yi  b xi
sau p 
i 1 i 1
p i 1
n
i 1
.
n
x
i 1
i

Demonstraţie. În urma celor n probe (măsurări, observaţii), se cunosc datele (xi ,yi),
i=1,..., n, şi trebuie să se determine coeficienţii a şi b astfel încât suma,
n
S (a, b)  [ yi  a e bxi ]2
i 1
să fie minimă. Analog, calculelor de la teorema precedentă se poate realiza demonstraţia
pentru determinarea coeficienţilor a şi b. Calcululee şi rezolvarea sistemului de ecuaţii
sunt mai laborioase. În cele ce urmează, vom aplica o altă metodă, şi anume, vom face
transformările necesare pentru a aplica modelul liniar. De aceea, datele celor două
variabile X şi Y, (xi ,yi), i=1,..., n, vor fi transformate astfel (xi , lnyi), i=1,..., n, iar modelul
exponenţial va fi transformat într-un model liniar astfel:

g(x) = ln(f(x), adică g(x) = bx + lna,

prin urmare, este vorba de un model liniar g(x) cu coeficienţii b (panta) şi lna (termenul
liber), care trebuie aplicat datelor (xi , lnyi), i=1,..., n. Din acest motiv, în expresiile
coeficienţilor, obținute pentru modelul liniar, se va substitui yi cu lnyi . Să presupunem că
Statistică şi Informatică pentru chimie medicală şi farmaceutică 295

modelul liniar căutat, este notat cu h(x) = x + , atunci, dacă expresiile pentru
coeficienţii  şi  sunt determinate, pentru modelul iniţial (exponenţial), avem:
b =  şi a = e .
Dacă vom considera un model liniar , notat prin h(x) = ax + b (pentru comoditate
a nu se confunda coeficienţii a şi b cu cei de la funcţia g), sistemul de ecuaţii ce rezultă
din anularea derivatelor parţiale ale modeluluil h (dreapta de regresie), conduce la
următoarele:
 n  n n n

2  y i  (ax i  b)( x i )  0       bx i  0


2
 2 x y
i i 2 ax i 2
 i 1  i 1 i 1 i 1
 n   n n n
2  y  (ax  b)  0 2 y  2 ax  2 b  0
 
i 1
i i
  i 
 i 1 i 1
i 
i 1

Se notează:
n n n n

x y
i 1
i i  Sxy x
i 1
2
i  Sxx x
i 1
i  Sx y
i 1
i  Sy ,

iar sistemul de ecuaţii devine:


Sxy  aSxx  bSx  0

 .
S
 y  aS x  nb  0
Se obţin următoarele expresii pentru cei doi parametri a şi b:
Sx S y  nSxy 1 S  aS xx
a
(Sx )  nSxx
2
şi b 
n
S y  aS x sau b  xySx
.

Cei doi parametri ai funcţiei model h(x) = ax + b s-au obţinut pentru datele (xi
,yi), i=1,..., n, de aceea, prin substituirea yi cu lnyi vom obţine:

n n n n n

 x  ln y  n ( x ln y )  ( x ln y )  a  x
2
i i i i i i i
a i 1 i 1
2
i 1
, b i 1
n
i 1
sau
 
x
n n
  xi   n xi
2
i
 i 1  i 1 i 1
n n

 ln yi  a xi
b i 1 i 1

n
Concluzie. În cazul modelului exponenţial pentru datele (xi ,yi), i=1,..., n, trebuie
să se determine coeficienţii a şi b, prin transformări asupra datelor iniţiale şi asupra
modelului exponenţial, pentru a se aplica modelul liniar. Se vor urma următoarele etape:
1. datele celor două variabile X și Y, (xi ,yi), i=1,..., n, vor fi transformate, astfel:
(xi , lnyi), i=1,..., n;
2. modelul exponenţial va fi transformat într-un model liniar, astfel:
g(x) = ln(f(x) = bx + lna;
296 MARIN VLADA

3. se determină modelul liniar, notat cu h(x) = x + , care se aplică datelor


transformate;
4. coeficienţii b şi a sunt determinaţi pentru modelul iniţial (exponenţial),
folosind relaţiile b =  şi a = e.

Aplicaţie. Vom aplica modelul exponenţial pentru variabilele X şi Y de mai sus.

Tabelul 28. Transformarea (logaritmarea) valorilor variabilei Y


X Y Ln Y
0.1 1310 7.177782
0.2 1300 7.17012
0.3 1293 7.16472
0.4 1283 7.156956
0.5 1276 7.151485
0.6 1267 7.144407
0.7 1260 7.138867
0.8 1251 7.131699
0.9 1243 7.125283
1 1233 7.117206

Conform pasului 3 se aplică modelul liniar datelor transformate şi astfel se obţine

y = -0.0658x + 7.184, coeficientul de determinare R2 = 0.999.

La pasul 4, coeficienţii a şi b sunt determinaţi pentru modelul iniţial


(exponenţial), folosind relaţiile b =  şi a = e, adică b = –0.0658 şi a = e7.184 = 1318.218.

7.19
y = -0.0658x + 7.184
R2 = 0.999
7.18

7.17

7.16

Series1
7.15
Linear (Series1)

7.14

7.13

7.12

7.11
0 0.2 0.4 0.6 0.8 1 1.2

Fig. 199. Modelul liniar folosit pentru modelul exponenţial


Statistică şi Informatică pentru chimie medicală şi farmaceutică 297

Pentru a argumenta şi compara rezultatele obţinute, conform etapelor de mai sus,


vom aplica modelul exponenţial datelor iniţiale (xi ,yi), i=1,..., n, cu ajutorul programului
Excel, şi astfel se obţine:

y = 1318.2e-0.0658x, coeficientul de determinare R2 = 0.999.

1320
y = 1318.2e-0.0658x
1310
R2 = 0.999
1300

1290

1280
Series1
1270
Expon. (Series1)
1260

1250

1240

1230

1220
0 0.2 0.4 0.6 0.8 1 1.2

Fig. 200. Curba exponențială obținută cu programul Excel

Pentru a realiza calculul direct al coeficienţilor a şi b, conform teoremei, vom


realiza în Excel, calculele din tabelul de mai jos:

Tabelul 29. Calculul direct al coeficienților pentru modelul exponenţial

X Y Ln Y X^2 XLnY
0.1 1310 7.177782 0.01 0.717778
0.2 1300 7.17012 0.04 1.434024
0.3 1293 7.16472 0.09 2.149416
0.4 1283 7.156956 0.16 2.862783
0.5 1276 7.151485 0.25 3.575743
0.6 1267 7.144407 0.36 4.286644
0.7 1260 7.138867 0.49 4.997207
0.8 1251 7.131699 0.64 5.705359
0.9 1243 7.125283 0.81 6.412755
1 1233 7.117206 1 7.117206
5.5 12716 71.47853 3.85 39.25891
298 MARIN VLADA

Pentru calculul expresiei coeficientului b, în celula C45, se scrie formula


„=(A43*C43-10*E43)/(A43*A43-10*D43)”, iar pentru calculul expresiei coeficientului
a, în celula C46, se scrie formula „=EXP((E43-C45*D43)/A43)”, respectiv, în celula D46,
se scrie formula „=EXP((C43-C45*A43)/10)”:

b −0.06579
a 1318.218 1318.218

Mai jos (fig. 201), este captura ecranului cu prelucrările realizate în programul
Excel (valorile pentru a şi b obținute, conform teoremei, sunt identice cu valorile
obţinute, prin aplicarea modelului exponenţial oferit de programul Excel):

Fig. 201. Foaia de calcul din Excel

Tipuri de modele exponenţiale

În practică, la studiul diverselor procese şi fenomene, apare o mare varietate de


modele exponenţiale. Diversitatea acestor modele neliniare este funcţie de varietatea
domeniile: chimie, fizică, medicină, biologie, sociologie, economie etc. Mai jos,
prezentăm câteva din aceste modele exponenţiale (Fig. 202, 203, 204).
Statistică şi Informatică pentru chimie medicală şi farmaceutică 299

f(x) = a ebx , b > 0, f(x) = a ebx , b< 0,


Exponential Growth Exponential Decay

Fig. 202. Forma exponențială convexă (crescătoare și descrescătoare)

f(x) = a(1- ebx ) b < 0, f(x) = a/(1+ c ebx ) b < 0,


Exponential Decay Logisitics Growth Model

Fig. 203. Forma exponențială concavă (crescătoare) și forma de creșterea logistică


300 MARIN VLADA

f(x) = a exp(-(x- c)2/ b2), f(x) = (ak1/(k1 – k2))(e-K2 x – e-K1 x),


Gaussian Model Absortion-Elimination Model (Bateman)
Fig. 204. Modelul de tip Gauss și modelul de absorbție – eliminare

Aplicaţie. Să se determine modelul exponenţial, pentru variabilele X (cauză, Timp), Y (efect,


Temperatură), cănd se cunosc n=14 probe (măsurări, observaţii), prin valorile datelor (xi ,yi),
i=1,..., n, modelul exponenţial fiind f(x) = a ebx , determinat de coeficienții a şi b.

Tabelul 30. Tabelul măsurărilor pentru cele două variabile

Timp Temp
(min) ( º F)
0 179.5
5 168.7
8 158.1
11 149.2
15 141.7
18 134.6
22 125.4
25 123.5
30 116.3
34 113.2
38 109.1
42 105.7
45 102.2
50 100.5

Prin utilizarea programului Excel, se va obţine următorul model exponenţial:

y = 171.46e-0.0118x, coeficientul de determinare R2 = 0.9701, unde a = 171.46,


b = − 0.0118.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 301

200
y = 171.46e-0.0118x
180 R2 = 0.9701

160

140

120
Series1
100
Expon. (Series1)
80

60

40

20

0
0 10 20 30 40 50 60

Fig. 205. Modelul exponențial, R2 = 0.9701

4.5 Modele neliniare în Farmacocinetică

Matematica şi Informatica au schimbat esenţial metodele şi analiza pivind


evaluarea de laborator a medicamentelor şi monitorizarea clinică a tratamentelor
medicamentoase. Farmacocinetica este disciplina care a beneficiat din plin de
dezvoltarea teoriilor, metodelor şi tehnicilor din Matematică şi Informatică, prin
intermediul calculatorului. Astăzi, procedurile pentru testarea medicamentelor, includ
rezultate importante obţinute în cercetarea, privind utilizarea medicamentelor la tratarea
diverselor boli. Bioinformatica, Biostatistica şi Biofarmacia sunt discipline aplicative,
care oferă diverse metode şi analize privind domeniul Farmacocineticii.
În analiza şi practica din domeniul Farmacocineticii, se studiază efectul
administrării medicamentelor, în scopul tratării bolilor. Administrarea unui medicament
se realizează prin mai multe moduri (locul administrării), şi are efecte în funcţie de
substanţa activă a medicamentului asupra distribuirii acesteia în plasmă, urmând un
model farmacocinetic:

 monocompartimental – medicament administrat extravascular (intramuscular,


subcutan, rectal sau oral), care se distribuie numai în compartimentul central,
apos, intracelular şi extracelular, de la locul administrării substanţa activă,
302 MARIN VLADA

pentru a ajunge în plasmă, şi suferă un proces de absorbţie (funcţia de variaţie


C1(t)), după care se va realiza procesul de eliminare; se spune că
medicamentul se distribuie doar în compartimentul numit generic sânge, iar
concentraţia substanţei active în sânge, este dată de funcţia de variaţie C2(t);
 bicompartimental – medicament administrat extravascular care se distribuie în
două compartimente, numite generic sânge şi lipide; modelul este caracterizat
de funcţiile de variaţie C1(t), C2(t), C3(t), care reprezintă concentraţia
substanţei active la locul administrării, concentraţia substanţei active în sânge,
şi respectiv, concentraţia în lipide;
 tricompartimental – utilizat în cazul medicamentelor cu indice terapeutic
scăzut (de exemplu digoxina, Ref.: Prof. dr. Constantin Mircoiu), pentru care
medicamentul administrat extravascular, se distribuie în trei compartimente,
unde se studiază variaţia concentraţiei substanţei active în cele trei
compartimente: C1(t) , C2(t), C3(t).

„Considerarea organismului ca un singur compartiment reprezintă o simplificare


drastică. Astfel, pentru a se absorbi bine, substanţele medicamentoase ar trebui sa fie
solubile în membranele celulare şi deci lipofile, iar pentru a rămâne în sânge în
concentraţii mai mari, ar trebui să fie hidrofile. Practic toate medicamentele sunt
amfifile, având o parte hidrofilă şi o parte lipofilă. Ca urmare a caracterului parţial
lipofil, ele se vor repartiza şi în lipidele organismului şi nu vor mai respecta modelul
monocompartimental.” (Prof. dr. Constantin Mircoiu, Universitatea de Medicină şi
Farmacie „Carol Davila” din Bucureşti).
În teza sa de doctorat, din anul 2010, Flavian Ştefan Rădulescu utilizează modele
monocompartimentale şi bicompartimentale la studiul diverselor medicamente: Diltiazem,
Dezacetil-Diltiazem, N-Desmetil-Diltiazem, Loratadina, Descarboetoxi-Loratadina,
Tramadol, O-Desmetil-Tramadol. Mai jos (tabelul 31), se prezintă rezultatele obţinute de
cercetările din teza de doctorat, prin comparaţie între modelul monocompartimental şi cel
bicompartimental.
„Datele experimentale au fost fitate cu soluţia unui model mono- şi, respectiv,
bicompartimental, atât pentru medicamentul părinte, cât si pentru metabolitul activ. În
cazul mianserinului şi al risperidonei, datele experimentale nu au putut fi fitate,
constatându-se un proces de absorbţie mult mai rapid decât cel considerat în
planificarea experimentului. Astfel, concentraţiile plasmatice maxime au fost raportate la
timpi corespunzători primelor probe prelevate după administrarea medicaţiei de studiu.
Rezultatele modelării compartimentale ilustrează astfel multitudinea căilor alternative de
metabolizare (reacţii succesive sau paralele).” (Flavian Ştefan Rădulescu, Studiul
farmacocineticii medicamentelor cu metaboliţi activi prin analiza compartimentală şi prin
modele de farmacocinetică fiziologică, Teză de doctorat – coordonator științific:
Prof. Dr. Constantin Mircioiu, Universitatea de Medicină şi Farmacie „Carol Davila” din
Bucureşti, 2007).
Statistică şi Informatică pentru chimie medicală şi farmaceutică 303

Tabelul 31. Substanțe active studiate (Flavian Ştefan Rădulescu [13])

Modelul monocompartimental

În acest caz, se studiază un medicament administrat extravascular


(intramuscular, subcutan, rectal sau oral), care se distribuie numai în compartimentul
central, apos, intracelular şi extracelular. Prin acţiunea de administrare a substanţei
active, se poate aproxima că, medicamentul urmează un model farmacocinetic
monocompartimental, dacă între sânge şi apă intracelulară şi extracelulară se stabileşte
foarte rapid un echilibru. Modelul farmacocinetic monocompartimental se poate
reprezenta schematic astfel:

(locul administrării) ka (sânge) ke


C1 C2

C1(t) C2(t)
Fig. 206. Modelul monocompartimental

Prin administrarea medicamentului, în locul administrării C1 (concentraţia iniţială


a medicamentului este C0), se declanşează un proces de absorbţie (viteza de absorbţie
este exprimată prin constanta de absorbţie ka), prin care substanţa activă este îndepărtată
din depozitul creat la locul de administrare, şi totodată să apară în plasmă (în sânge, unde
la prima administrare, concentraţia iniţială este 0). De asemenea, se declaşează un proces
de eliminare (viteza de eliminare este exprimată prin constanta de eliminare ke), prin care
substanţa activă este îndepărtată din plasmă.
304 MARIN VLADA

Se cunosc:
 C0 – concentraţia iniţială a medicamentului în locul administrării;
 Momentul iniţial determinat de C1(0)= C0 si C2(0)= 0;
 ka – constanta de absorbţie;
 ke – constanta de eliminare.

Se cere determinarea modelelor C1(t), C2(t), care reprezintă evoluţia în timp a


concentraţiei substanţei active. Pentru determinarea acestor modele, se va ajunge la
rezolvarea unui sistem de ecuaţii diferenţale, pentru care se va utiliza transformata
Laplace. În continuare, vom scoate în evidenţă proprietăţile şi rolul transformatei
Laplace.
Aplicaţii ale transformatei Laplace (operator liniar) se utilizează în:
 matematică – teoria probabilitaţilor, rezolvarea ecuaţiilor şi sistemelor
diferenţiale şi integrale (transformă operaţiile de derivare în operaţii algebrice);
 fizică – optică, oscilatori armonici, dispozitive optice, sisteme mecanice;
 inginerie electrică – automatică, circuite electrice, prelucrarea semnalelor și
mecatronică;
 teoria sistemelor – evoluţia şi comportamentul sistemelor, modele de simulare.

Definiţie. O funcţie f : [0, )  R se numeşte funcţie original, dacă este derivabilă şi are
proprietatea:

M  0 si K  0, astfel ca f (t )  M e , t  [0, )
kt

(k = indice de creştere a funcţiei f).

Exemplu.

f : [0, )  R , f t   c0 e0.3t .

Definiţie. Transformata Laplace a funcţiei original f : [0, )  R este un operator liniar


definit de funcţia


£[f(t)] = 
0
f (t ) e  p t dt ,


şi se notează L f ( p)   f (t ) e  p t dt , L f : R  R , adică Lf = £[f(t)] numită funcţia
0
imagine.

Teoremă. Dacă se consideră funcţiile original f , g : [0, )  R , atunci au loc


următoarele proprietăţi ale transformatei Laplace:
Statistică şi Informatică pentru chimie medicală şi farmaceutică 305

1. £[f(t) ± g(t)] = £[f(t)] ± £[g(t)] (teorema transformării liniare);


1  p
2. £[f(at)](p) = £[f(t)]   (teorema scalării);
a a
3. £[eatf(t)](p) = Lf (p-a) (teorema translaţiei);
4. £[ f (x) ](p) = pLf (p) – f(0) (teorema derivatei I);
5. £[ f (x) ](p) = p2 Lf (p) – p f (0) – f (0) (teorema derivatei II);
1
6. £[eat](p) = ;
pa
1
7. £[e-at](p) = .
pa

t
Exemplu. Dacă f(t) = e este o funcţie original, atunci transformata Laplace
corespunzătoare (imaginea funcţiei f) este:


 f t  e
 pt
£[f(t)]  dt  L f ( p) =
0
  
t  pt  1  1
= 0 e e dt   e  ( p   )t
dt    e pt   
0  p  0
p

L f ( p)   f (t ) e  p t dt =
1
.
0 p

Teoremă. Modelul monocompartimental. Pentru un model monocompartimental, în care


se studiază un medicament administrat extravascular, există un proces de absorbţie
(funcţia de variaţie C1(t), concentraţia substanţei active) şi un procesul de eliminare
(funcţia de variaţie C2(t), concentraţia substanţei active).

Dacă se cunosc:
 C0 – concentraţia iniţială a medicamentului în locul administrării;
 Momentul iniţial determinat de C1(0)= C0 și C2(0)= 0;
 ka – constanta de absorbţie;
 ke – constanta de eliminare,
atunci, la locul administrării substanţei active, funcţia de variaţie C1(t) în procesul de
absorbţie, este

C1 t   c0 ekat ,
iar în sânge, funcţia de variaţie C2(t), în procesul de eliminare, este

C2 t   
k a c0 kat ket
ke  k a
e e .
306 MARIN VLADA

Demonstraţie. Pentru comoditatea scrierii, vom face următoarele notaţii:


f(t) = C1(t), g(t) = C2(t).
În domeniul Farmacocineticii, conform axiomelor farmacocineticii liniare,
cantitatea de substanţă activă ce părăseşte un compartiment, este proporţională cu
cantitatea existentă în acel compartiment.
Prin urmare, variaţia concentraţiei în timp, poate fi descrisă de următorul sistem
de ecuaţii diferenţiale:

 f (t )  k a f (t )
 (1)
 g (t )  k a f (t )  k e g (t )

sistem ce va fi rezolvat aplicând metoda transformatei Laplace. Dacă ţinem seama de


proprietăţile teoremei de la pag. 305, vom folosi următoarele proprietăţi:

 £[ f (x) ](p) = pLf (p) – f(0) (teorema derivatei I);


 £[f(t) ± g(t)] = £[f(t)] ± £[g(t)] (teorema transformării liniare);
1
 £[e-at](p) = .
pa
Prin aplicarea transformatei Laplace ecuaţiilor sistemului (1), vom obţine:

 pL f  C 0   k a L f  ( p  k a ) L f  C0
   (2)
 pLg  k a L f  k e L g  k a L f  ( p  k e ) L g  0

sistem cu 2 ecuaţii şi 2 necunosctute (imaginile funcţiilor f şi g) Lf şi Lg .

a) determinarea lui Lf .
C0
Din prima ecuaţie, se determină Lf = şi conform proprietaţii 7 de la
p  ka
teorema de mai sus, transformata Laplace, care are această expresie, este funcţia
f(t) = c0 e  . Prin urmare, funcţia de variaţie C (t) în procesul de absorbţie este:
 ka t
1

 
C1 t   c0 ekat

Funcţia de variaţie C1(t), în procesul de absorbţie, are următoarea evoluţie, arătată


mai jos, pentru cazul particular:
 C0 = 10;
 ka = 0.3 (constanta de absorbţie).

 .
C1 t   c0 ekat
Statistică şi Informatică pentru chimie medicală şi farmaceutică 307

Fig. 207. Utilizare software: https://www.wolframalpha.com


plot (10*(EXP(–0.3*x)), x=0..30)

Funcţia de variaţie C1(t) are o evoluţie, de la o valoare maximă (iniţială) a


concentraţiei (C0 = 10), la valori ce scad exponenţial spre 0.

b) determinarea lui Lg .

Pentru a determina Lg , se va folosi regula lui Cramer:

p  ka C0
 ka 0 k a C0
Lg   
p  ka 0 ( p  k a )( p  k e )
 ka p  ke

 A B  k a C0  1 1 
 k a C0       .
 p  k a p  ke  ke  k a  p  k a p  ke 
308 MARIN VLADA

1
Ţinând seama de proprietatea £[e-at](p) = , se deduce că, în procesul de
pa
eliminare, funcţia de variaţie C2(t) este:

C2 t   
ka c0 kat ket
ke  k a
e e .
În domeniul farmacocineticii, această curba se numeşte curba de absorbţie-eliminare.

Fig. 208. Utilizare software: http://web2.0calc.com/


(3/(0.03–0.3))*(EXP(–0.3*x)-EXP(–0.03*x)),x=0..120

Fig. 209. Utilizare software: programul Excel


Statistică şi Informatică pentru chimie medicală şi farmaceutică 309

Funcţia de variaţie C2(t), în procesul de eliminare, are o evoluţie din origine


(0,0), creşte până la o valoare maximă a concentraţiei, apoi scade exponenţial spre 0.
Formula de calcul pentru tabelarea funcţiei:
=(3/(0.03-0.3))*(EXP(-0.3*B450)-EXP(-0.03*B450)).

Tabelul 32. Valori pentru t și C2(t)


t C2(t) 34 4.006197 69 1.402064
0 0 35 3.887891 70 1.360627
1 2.551415 36 3.773057 71 1.320414
2 4.366143 37 3.661598 72 1.28139
3 5.63735 38 3.55342 73 1.243519
4 6.508069 39 3.448429 74 1.206768
5 7.084198 40 3.346534 75 1.171102
6 7.444126 41 3.247645 76 1.136491
7 7.645865 42 3.151674 77 1.102903
8 7.732332 43 3.058537 78 1.070307
9 7.735266 44 2.968149 79 1.038675
10 7.678124 45 2.880432 80 1.007977
11 7.578229 46 2.795306 81 0.978187
12 7.448362 47 2.712695 82 0.949277
13 7.297944 48 2.632524 83 0.921222
14 7.133903 49 2.554723 84 0.893996
15 6.961324 50 2.479221 85 0.867574
16 6.783929 51 2.405949 86 0.841933
17 6.604431 52 2.334843 87 0.81705
18 6.424796 53 2.265839 88 0.792903
19 6.246439 54 2.198873 89 0.769469
20 6.070365 55 2.133887 90 0.746728
21 5.897283 56 2.070821 91 0.724659
22 5.727677 57 2.00962 92 0.703242
23 5.56187 58 1.950226 93 0.682458
24 5.400063 59 1.892589 94 0.662288
25 5.242372 60 1.836654 95 0.642715
26 5.088848 61 1.782373 96 0.62372
27 4.939495 62 1.729696 97 0.605286
28 4.794285 63 1.678576 98 0.587397
29 4.653166 64 1.628966 99 0.570037
30 4.516069 65 1.580823 100 0.55319
31 4.382914 66 1.534103
32 4.253613 67 1.488763
33 4.128072 68 1.444763

Aplicaţie. Metoda reziduurilor – determinarea ka şi ke. Se consideră cazul unui


medicament administrat oral, care iniţial a realizat în intestin o concentraţie iniţială
310 MARIN VLADA

C0=10µg/ml. Conform teoremei de mai sus, în ipoteza unui model monocompartimental,


concentraţia în sânge este dată de variaţia concentraţiei substanţei active în timp,
exprimată de expresia:

C t  
k a c0
k a  ke

e  ket  e  k a t  T[min]
1
C(t) [µg/ml]
2.551415
3 5.63735
Se presupune că se dau măsurări (observaţii) ce apar în 7 7.645865
tabelul alăturat. 16 6.783929
30 4.516069
Ipoteza de lucru: ka  ke pentru un t (variabila timp) 57 2.00962
suficient de mare. Pe baza măsurărilor date în tabel, se 83 0.921222
cer valorile (parametrilor) constantelor ka şi ke, ce 85 0.867574
determină modelul variaţiei concentraţiei substanţei 93 0.682458
: active în sânge.

t ln C
a) determinarea constantei de eliminare – ke . 16 1.914556
30 1.507642
Se determină timpul în care se obţine concentraţia 57 0.697945
maximă (maximulul funcţiei), pentru a aplica modelul liniar pentru 83 -0.08205
„coada” curbei de variaţie a concentraţiei, deci pentru Ln C(t). 85 -0.14205
93 -0.38205

Ln C(t)
y = -0.0299x + 2.3984
R2 = 1
2.5

1.5

1 ln C
Linear (ln C)

0.5

0
0 20 40 60 80 100

-0.5

Fig. 210. Graficul funcției Ln C(t)

Dacă se reprezintă grafic Ln C(t), panta dreptei obţinute, este chiar valoarea ke .
Statistică şi Informatică pentru chimie medicală şi farmaceutică 311

Dreapta de regresie, pentru valorile din tabelul de mai sus, se determină folosind
programul Excel.

Rezultatul este următorul:


y= −0.0299x + 2.3984, coeficientul de determinare R2 = 1.
Panta dreptei găsite este valoare căutată a constantei de eliminare ke, adică avem
ke = –0.0299.

b) determinarea constantei de absorbţie – ka .

Având în vedere ipoteza de lucru, şi anume: ka  ke , pentru un t (variabila timp)


suficient de mare, se face aproximarea:

C1 t  
k a  ke
 
k a c0 kat
e  A e  k t  , unde A  ka c0
a
.
k a  ke

Prin logaritmarea lui C1, se obţine ln C1 (t )  ln A  ka t . Dacă se reprezintă


grafic ln C1 (t ) , panta dreptei obţinute, este chiar valoarea ka.

Se presupune că se dau observaţii, în partea de început, pentru timpi, până la


atingerea concentraţiei maxime:

t C1
1 0.823131
3 0.451744
7 0.136063

Se face logaritmarea pentru a aplica modelul liniar utilizat în programul Excel:

t C1 Ln C1 0
0 2 4 6 8
1 0.823131 –0.19464 y = -0.3x + 0.1054
R2 = 1
3 0.451744 –0.79464 -0.5

7 0.136063 –1.99464
-1
Series1
Linear (Series1)
-1.5

-2

-2.5

Fig. 211. Graficul fucției Ln C1(t)


312 MARIN VLADA

Rezultatul este următorul: y = –0.3x +0.1054, iar coeficientul de determinare


este R2 = 1. Panta dreptei găsite este valoare căutată a constantei de absorbţie ka, adică
avem ka= –0.3.

Referinţe
1. Lucian Boiculese – Biostatistica teme, Şcoala doctorală, UMF Iaşi.
2. David W. A. Bourne, Pharmacokinetics and Biopharmaceutics, (Java Applets – On line Graphs,
JavaScript Calculators Online), http://www.boomer.org/c/p1/
3. David W. A. Bourne, Mathematical modeling of pharmacokinetic data, Technomic Publishing Co.,
ISBN 1-56676-204-9, 1995.
4. Ion Crăciun , http://www.mec.tuiasi.ro/diverse/sem_cdif_mec.pdf
5. Sorin Istrail, http://cs.brown.edu/~sorin/pdfs/venter2.pdf
6. James Jones, http://people.richland.edu/james/lecture/m116/logs/models.html
7. Peter Keusch, University of Regensburg, http://www.demochem.de/eyr-e.htm
8. Dalia Simona Miron, Constantin Mircioiu, Seminarii de matematici aplicate în Farmacie, Editura
Tehnoplast, Bucureşti 2010.
9. Constantin Mircioiu, Roxana Colette Sandulovici, Statistică aplicată în farmacie şi studii clinice, Ediţia
II, Editura Universitară „Carol Davila” Bucureşti, 2009.
10. Joseph W. Ochterski, Thermochemistry in Gaussian, http://www.gaussian.com/g_whitepap/thermo.
html,Saeid Nourian
11. Marjorie Olmstead, http://courses.washington.edu/phys431/index.php
12. Saeid Nourian, http://calculator.runiter.com/graphing-calculator/
13. Flavian Ştefan Rădulescu, Studiul farmacocineticii medicamentelor cu metaboliţi activi prin analiza
compartimentală şi prin modele de farmacocinetică fiziologică, Teză de doctorat (coord. şt.: Prof. dr.
Constantin Mircioiu), Universitatea de Medicină şi Farmacie „Carol Davila” Bucureşti, 2007.
14. Online 3D, http://www.livephysics.com/ptools/online-3d-function-grapher.php
15. M. Vlada, „Modele neliniare. Teorie şi aplicaţii”, În Lucrările celei de-a X-a Conferință de Învățământ
Virtual, Editura Universității din București, CNIV 2012, ISSN 1842-4708, 2012, pp. 57-65.

4.6 Aplicație. Problema călugărului


Vom descrie câteva idei prin care vom atrage atenția asupra schimbării de
paradigmă, în domeniul rezolvării de probleme. Așa cum, limbile naturale sunt într-o
continuă evoluție, schimbare și se dezvoltă, astfel o limbă este ca un organism viu, tot
așa, și științele sunt într-o continuă evoluție, schimbare și se dezvoltă. Științele sunt
considerate limbaje ale cunoașterii, care oferă teorii, metode, tehnici și instrumente pentru
a modela și prelucra cunoașterea. Se pornește de la concluzia că, 78% dintre elevi nu
consideră curriculumul corelat la așteptările, nevoile şi interesele lor, iar 60% consideră
că, în forma actuală, curriculumul nu îi pregătește pentru piața muncii. Se evidențiază, cu
un exemplu, prin care elevii au posibilitatea să înțeleagă și să poată vedea utilitatea
teoriilor și a metodelor oferite de matematică și informatică.
Procesul învățării se va schimba, iar prin atractivitatea acestor cautări și aplicații
în rezolvarea problemelor, elevii vor avea o altă perspectivă, privind domeniul
cunoașterii. Astăzi, se descriu și se memoreaza lecții teoretice, și apoi, se fac fel și fel de
exerciții, pe care elevii nici nu le văd că au legatură cu realitatea, cu activitatea practică.
Ca metodă, mult mai natural ar fi ca la o lecție sau în manual, să se înceapă cu enunțul
unei probleme, sau contextul în care apar o serie de probleme, să se analizeze și să se
discute probleme, pentru ca apoi, să se explice teoria sau metodele ce se vor aplica pentru
rezolvare.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 313

Problemă. Un călugăr trăiește într-o mănăstire din vârful unui munte. Periodic,
dimineața, la o anumită oră, trebuie să coboare pe un drum, într-o localitate de la
poalele muntelui, unde va înnopta. Dimineața următoare, la aceeași oră, din ziua
precedentă, acesta se va întoarce la mănăstire pe același drum. Să se demonstreze că
există un loc de pe drumul parcurs de călugăr, prin care trece la aceeași oră, la ducere și
la întoarcere. (© M. Vlada, 2016)

Rezolvare. Analizând cu atenție enunțul problemei (la școală și în universități, se tratează


cu superficialitate definițiile și enunțurile și, de aici se ajunge la înțelegerea greșită a
problemelor și teoriilor), se poate întreba, dacă problema este o problemă de matematică,
de fizică, de geografie, sau de ce nu, de informatică.

Fig. 212. Manăstirea Arnota, Râmnicu Vâlcea,


Sursa: http://www.ramnicuvalceaweek.ro/?p=16711

De fapt, este vorba de o schimbare de atitudine a profesorilor față de învățare.


Enunțul problemei îl găsisem, în timpul liceului, într-o carte de matematică, la capitolul
„proprietatea lui Darboux”. Prin urmare, se poate spune că este o problemă de
matematică. Dar, vom vedea cum va fi rezolvată. E mult timp de atunci. Recent, mi-am
propus să găsesc enunțul problemei. Cum era firesc, am apelat la Google (se zice că
acceptă orice întrebare!). Fără suscces. Planul B a fost să merg la Biblioteca Facultății de
Matematică, și să caut în 2-3 cărți, pe care le bănuiam că ar conține enunțul. Dezamăgire!
Nu am găsit. Nu mai aveam inspirație să concep planul C, D etc. După câteva căutari de
strategie (nu cum face Google), m-am hotărât: voi fi capabil să reinventez enunțul, și să
rezolv problema!
Experiența din această activitate de rezolvare, mi-a aratat că am ajuns la enunțul
problemei, în același timp în care am terminat rezolvarea ei. De fapt, așa se întâmplă în
activitatea de cercetare. Multe au fost cazurile, când credeam că am juns să spun, că am
reușit să descopăr enunțul. Trebuie să recunosc: am ajuns la două enunțuri ce erau greșite.
S. Marcus spunea: „să-i lăsăm pe elevi să caute singuri soluția, chiar dacă fac
greșeli, deoarece prin acest proces de căutare și de corectare a ceea ce s-a greșit, se
ajunge la învățarea adevărată, și nu la o învățare superficială, prin metoda memorării și
prin utilizarea inteligenței altora”. E drept că, am citit dintr-un studiu american că
„învățăm mai mult din succese, decât din eșecuri”. Probabil că, „eșecul”, aici nu are
sensul „greșelilor”, din activitatea de căutare a unei rezolvări.

Metoda. Teoretic, trebuie să analizăm evoluția în timp a procesului în cele două etape de
parcurgere a distanței, care trebuie să fie parcursă, între cele două puncte ale drumului
314 MARIN VLADA

parcurs. Dacă notăm cu Y variabila timp, iar cu X variabila distanța parcursă, atunci
această evoluție (depentența) se exprimă matematic printr-o funcție f: R  R, y=f(x),
unde aplicația f este necunoscută și trebuie determinată. Aplicația f modelează prima
etapă (de ducere). Analog, pentru etapa a doua (de întoarcere), vom nota funcția g: R 
R, y=g(x), unde aplicația g este necunoscută și trebuie determinată.
Practic, pentru a determina cele două funcții (evoluția timpului în cele două
etape), vom utiliza metoda folosită și în determinarea orbitelor planetelor din sistemul
solar. Orbita unui corp ceresc este traiectoria urmată de acel corp prin spațiul cosmic. În
astronomie, există cele 3 legi ale lui Kepler ce descriu mișcările planetelor în jurul
soarelui (a se vedea capitolul 1).
Se va folosi Metoda celor mai mici pătrate (MCMP, Legendre, 1805) pentru
dependenţa funcţională a unei variabile Y (dependenţă-efect) faţă de altă variabilă X
(independentă-cauză), care poate fi studiată empiric, pe cale experimentală. Date fiind
valorile observate pentru două variabile aleatoare X şi Y, fie acestea (xi,yi), i = 1,…, n.
Prin funcţie de regresie se va înţelege acea funcţie Y = f(X) care aproximează cel mai bine
setul de date observate. De regulă, criteriul ales este dat de metoda celor mai mici pătrate
(MCMP), adică acea funcţie f pentru care se minimizează suma pătratelor erorilor dintre
valorile măsurate şi cele estimate (procedeu de fitare), adică suma:
n
S   [ yi  f ( xi )] 2
i 1

Pentru aceste date experimentale, în cazul nostru, vom simula valori pentru
distanța (variabila x) și timp (variabila y), atât pentru etapa I, dependența y=f(x), cât și
pentru etapa II , dependența y=g(x). Pentru cei care vor să nu aibă nelămuriri în cele ce
urmează, precizăm că dacă la simularea lui f, pentru timp (y), valorile sunt crescătoare,
în schimb, la simularea lui g, pentru timp (y), valorile sunt descrescătoare. Explicație: „un
loc de pe drumul parcus” trebuie să fie unic determinat față de un reper fix, de exemplu
„mănăstire”, iar în reprezentarea grafică a celor două funcții f și g, să fie originea
sistemului cartezian XOY. Dacă în cazul lui g, valorile pentru timp (y), sunt crescătoare,
ar fi o modelare greșită, deoarece ar însemna ca g să simuleze tot plecarea de la
mănăstire. În tabelul 33 sunt prezentate aceste valori ce simulează evoluțiile f și g.
Tabelul 33. Valori experimentale pentru cele două evoluții f și g
Evoluția timpului la Evoluția timpului la Evoluția timpului la D/I
ducere întoarcere
Distanța Timp-d Distanța Timp-d Timp-i
0 0 Distanța Timp-i 0 0 60
10 5 0 60 10 5 55
20 7 10 55 20 7 43
30 10 20 43 30 10 35
40 13 30 35 40 13 24
50 16 40 24 50 16 20
60 20 50 20 60 20 15
70 25 60 15 70 25 10
80 30 70 10 80 30 7
90 33 80 7 90 33 6
100 38 90 6 100 38 5
110 50 100 5 110 50 3
120 60 110 3 120 60 0
120 0
Statistică şi Informatică pentru chimie medicală şi farmaceutică 315

Calculele pentru aplicarea MCMP sunt implementare în programul Excel, care


oferă serviciul „Tredline” în cazul unor date experimentale, ce urmează să aproximeze
modelul/evoluția.

Fig. 213. Rezultate obținute cu programul Excel pentru f

Fig. 214. Rezultate obținute cu Excel pentru g

Fig. 215. Rezultate obținute cu Excel pentru f și g (simultan)


316 MARIN VLADA

Rezultate.
Determinarea locului din drumul parcus, când călugărul trece la aceeași oră, se
obține prin intersecția graficelor f și g, care sunt reprezentate în fig. 215. Evident, trebuie
găsite rădăcinile ecuației h(x) = 0, unde funcția
h(x)= f(x) – g(x) = 0.002*x*x – 1.176*x +59,18.

Fig. 216. Graficele celor două parabole f și g folosind calculatorul științific


http://web2.0calc.com

Metoda 1 – calcul direct: x1 = 532,4239921;


x2 = 55,57600792.
Metoda 2 – folosind Goal Seek din Excel,
Inițial: x = 50
h(x) = 0,000763387
Final: x = 55,57520747

Soluția: distanța = 55,57 față de locul mănăstirii


(în această simulare nu am utilizat unități de
măsură pentru valori).

Sinteza rezolvării:
 Se simulează evoluția timpului la ducere, respectiv, la întoarcere. Folosind
regresia neliniară (Excel) se determină funcțiile f(x) și g(x), funcții continue
ce au proprietatea lui Darboux.
 Folosind calculatorul științific http://web2.0calc.com se obțin graficele celor
două parabole f și g (fig. 216). Intersecția celor două grafice indică valoarea
locului (punctului) căutat. Se determină prin meteda 1-direct, și metoda 2,
folosind Goal Seek din Excel.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 317

Verificare suplimentară:
Verificarea evoluției timpului de parcurcere (ducere, întoarcere) folosind un alt
software, și anume limbajul JavaScript și biblioteca de primitive grafice: wzjsgraphics.js
by Walter Zorn, 2009.
Referință: http://unibuc.ro/prof/vlada_m/Computer_Graphics.php

Fig. 217. Reprezentarea grafică a evoluțiilor


f și g folosind JavaScript și biblioteca Walter Zorn

PROGRAMUL JavaScript

<html>
<head>
// Problema calugarului: Evolutia timpului, la ducere si la
intoarcere, f(d) = 0.002d*d + 0.117d + 2.670; g(d)= 0.004d*d -
1.059d + 61.85, d din [0, 120] (M. Vlada 2016)
<script type="text/javascript" src="wz_jsgraphics.js"> // by
Walter Zorn, 2009 </script>
</head>
<body>
<script language="JavaScript"> // M. Vlada 12.09.2016
var ob=new jsGraphics();
var d=120; // distanta
ob.setColor("#000000"); // culoare black
//Axele
ob.drawLine ( 100, 500, 900, 500);
ob.drawLine ( 100, 500, 100, 30);
// se genereaza graficele f si g prin discretizarea intervalului
[0, 120], pasul=1.0
var dx=120 ; var dy=80 ; var hx= 800 ; var hy= 470;
318 MARIN VLADA

var x1 = 0 ; var y1 = 2.67 ;


var x3 = 0 ; var y3 = 61.85 ;
ob.setColor("#ff0000"); // culoare red
for(i=1; i <=d; i++)
{
var x2 = i ; var y2 = 0.002*i*i +0.117*i+2.67;
var x4 = i ; var y4 = 0.004*i*i -1.059*i+61.85;
var x11 = 100 + Math.floor((x1-0)/dx*hx); var y11 = hy - 30 -
Math.floor((y1-0)/dy*hy) ;
var x22 = 100 + Math.floor((x2-0)/dx*hx); var y22 = hy - 30 -
Math.floor((y2-0)/dy*hy) ;
var x33 = 100 + Math.floor((x3-0)/dx*hx); var y33 = hy - 30 -
Math.floor((y3-0)/dy*hy) ;
var x44 = 100 + Math.floor((x4-0)/dx*hx); var y44 = hy - 30 -
Math.floor((y4-0)/dy*hy) ;
ob.drawLine (x11, y11, x22, y22);
ob.drawLine (x33, y33, x44, y44);
x1 = x2 ; y1=y2 ; x3= x4 ; y3=y4;
}
ob.paint();
</script>
</body>
</html>

Observație.
Problema admite și o altă rezolvare, doar prin „reconstituirea” realității, și anume, prin
utilizarea unor produse software care să simuleze cele două etape? Rezolvarea va fi corectă?

Referințe
[1] Daniel Ford and Josh Batson, Languages of the World (Wide Web), News on Google Research,
2011, https://research.googleblog.com/2011/07/languages-of-world-wide-web.html, accesat 2016
[2] M. Vlada, Matematica pentru elevi, abstractă sau utilă ?, În Lucrările celei de-a XI-a Conferință de
Învățământ Virtual, Editura Universității din București, ISSN 1842-4708, 2013, pp. 107-114.
[3] M. Vlada, O. Istrate, Concursul „Didactica Nova” – curriculum academic inovativ, în
Lucrările celei de-a XI-a Conferință de Învățământ Virtual, Editura Universității din București,
ISSN 1842-4708, 2013, pp. 19-24.
[4] M. Vlada, Structuri şi obiecte matematice cu aplicaţii în chimie şi fizică, în Lucrările celei de-a
XI-a Conferință de Învățământ Virtual, Editura Universității din București, ISSN 1842-4708,
2013, pp.102-106.
[6] M. Vlada, Modele neliniare. Teorie şi aplicaţii, în Lucrările celei de-a X-a Conferință de
Învățământ Virtual, Editura Universității din București, CNIV 2012, ISSN 1842-4708, 2012,
pp. 57-65.
[7] M. Vlada, Informatică aplicată. Modele de aproximare, software şi aplicaţii, Editura
Universităţii din Bucureşti, print, ISBN 778-606-16-0190-5, 257 pag., 2012.
[8] M. Vlada, Noi abordări în rezolvarea problemelor – exemple, în Lucrările celei de-a XIV-a
Conferință de Învățământ Virtual, Editura Universității din București, CNIV 2016, ISSN 1842-
4708, online, http://c3.icvl.eu/papers2016/cniv/documente/pdf/sectiuneaA/sectiuneaA_lucrarea4.
pdf, pp. 49-57, 2016.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 319

5
Proiecte şi aplicații
practice
Motto:
„Cel care dobândeşte cunoaşterea, dar nu o pune în practică, este ca acela care ară pământul, dar nu-l seamănă.”
Ralph Waldo Emerson
„Raţiunea nu lucrează instinctiv, ci cere încercări, practică şi învăţare
pentru a progresa treptat de la un nivel de înţelegere la celălalt.”
Immanuel Kant
„Trebuie să învăţăm cât timp trăim. Nu pentru şcoală, ci pentru viaţă învăţăm.
Ce nebunie să înveţi lucruri de prisos, când e atâta lipsă de timp!”
Seneca
„Învăţătura este frumuseţea cea mai aleasă a omului, avere ascunsă şi tăinuită;
învăţătura procură plăceri; ea dă glorie şi bucurie; învăţătura este învăţătorul învăţătorilor.”
Bhartrhari
„Este esenţial ca studentul să dobândească o înţelegere şi un sentiment viu al valorilor.
El trebuie să aibă un simţ puternic al lucrurilor frumoase şi bune din punct de vedere moral,
în caz contrar, şi posedând o cunoaştere specializată, el va semăna mai degrabă
cu un câine bine dresat decât cu o persoană dezvoltată armonios.”
Albert Einstein

Ştiinţele sunt modele şi reprezentări virtuale ale cunoaşterii:


 Ştiinţele au apărut ca urmare a necesităţii omului de a-şi organiza
CUNOAŞTEREA, în scopul măsurării, comparaţiei, analizei şi operaţiilor ce
trebuie realizate, în diverse activităţi de existenţă şi de adaptare în natură. În
acest proces complex al evoluţiei omului şi evoluţiei cunoaşterii, s-a conturat
şi definit necesitatea omului de a rezolva problemele folosind diverse teorii,
metode şi tehnici: raţionament, experiment etc.
 Exemple: geometrie (măsurarea pământului), algebră (numărare şi calcule),
geologie (studiul pământului), biologie (studiul organismelor vii), chimie
320 MARIN VLADA

(studiul substanţelor: kēme vine de la cuvântul egiptean, care însemnă


pământ), fizică (studiul materiei), cibernetică (studiul sistemelor), astronomie
(studiul cosmosului) etc.
Rezolvarea problemelor se poate realiza la nivel: de amator, de specialist, de
expert. Evident că, rezultatele şi efectele pot fi diferite în cele trei cazuri. Experienţa în
rezolvarea problemelor are un rol primordial în acest caz. Din aceste motive, sistemele
educaţionale din diverse ţări ale lumii caută soluţii pentru un echilibru între pregătirea
teoretică şi pregătirea aplicativă (ativităţi practice). Teoriile pedagogice şi psihologice
tradiţionale trebuie să se adapteaze la impactul calculatorului în viaţa omului.
Experimentul, lucrul în echipa, stilurile de învăţare, modalităţile de formare a
competenţelor, vor reprezenta pentru sistemele educaţionale provocări continue, având în
vedere nivelul general de dezvoltare.
„Research in education demonstrates that, by working hard, virtually all students
are capable of high achievement. People can become smart by working hard at the right
kinds of learning tasks.” Source: Institute for Learning, University of Pittsburgh –
http://www.instituteforlearning.org/

5.1 Determinarea modelelor liniare şi neliniare


Aplicaţie. Analiza datelor experimentale-Modele de aproximare. Exemple: modele
liniare şi modele neliniare (Software Excel 2007-2010):
 PASUL 1: determinarea norului de puncte (se va face o copie pentru fiecare
model de la pasul 2);
 PASUL 2: se determină modelele de aproximare (expresia analitică şi
coeficientul de determinare R2).
Se presupune că se dau măsurări (observaţii) ale variabilei dependente Y faţă de
variabila independentă X:

Pasul 1: norul de puncte (X Y Scatter)


•se selectează domeniul valorilor X și Y, Insert  Valorilor observate
Diagrame  Prin Puncte (X Y Scatter)
X Y
•se face copie a diagramei prin puncte
1 60
Pasul 2: determinarea modelelor pentru fiecare model. 2 50
Se execută următoarele acţiuni: 3 60
•se execută „Paste” pentru diagrama „prin puncte” 4 70
•se selectează diagrama, apoi Aspect Analiză  Linie
5 70
tendinţă (Trendline)
- din meniul dat se face click pe „Mai multe opţiuni …” 6 80
- din fereasta „Formatare” se alege modelul (tendinţa) 7 90
şi se validează „Afişare ecuaţie” şi „Afişare abaterea 8 95
medie patratică”

Folosind versiunea 2007-2010 a programului Excel vom determina toate


modelele oferite de acest program.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 321

Pasul 1: Determinarea norului de puncte

Fig. 218. Foaia de calcul din Excel

Norul de puncte

Fig. 219. Norul de puncte


Pasul 2: se determină modelele de aproximare (expresia analitică şi coeficientul de
determinare R2)
322 MARIN VLADA

Fig. 220. Foaia de calcul din Excel

Y
100
90
80
70
60
50 Y
40 y = 6.0119x + 44.821
L inear
30 R 2 = 0.8946
(Y )
20
10
0
0 2 4 6 8 10

Fig. 221. Modelul liniar (dreapta), y = 6.0119x + 44.821, R2 = 0.8946


Statistică şi Informatică pentru chimie medicală şi farmaceutică 323

Fig. 222. Modelul exponenţial, y = 48.336e0.0836x, R2 = 0.876

Fig. 223. Modelul logaritmic, y = 18.505Ln(x) + 47.345, R2 = 0.6989

Fig. 224. Modelul polinom gr. II, y = 0.625x2 + 0.3869x + 54.196, R2 = 0.9333
324 MARIN VLADA

Fig. 225. Modelul polinom gr. III, y = –0.2399x3 + 3.8636x2 – 11.968x + 66.071,
R2 = 0.9534

Fig. 226. Modelul


polinom gr. IV, y = 0.0994x4 – 2.0297x3 + 14.673x2 –36.769x + 82.946, R2 = 0.964

Fig. 227. Modelul polinom gr. V, y = –0.1074x5 + 2.5153x4 – 22.072x3 + 89.565x2 -


158.66x + 148.75, R2 = 0.9942
Statistică şi Informatică pentru chimie medicală şi farmaceutică 325

Fig. 228. Modelul polinom gr. VI,


y = 0.0104x6 – 0.3886x5 + 5.4888x4 – 37.626x3 + 131.3x2 – 211.86x + 173.13,
R2 = 0.9947

Fig. 229. Modelul putere y = 49.875x0.26, R2 = 0.6995

Concluzii. Analiza rezultatelor, comparația după criteriul dat de R2.

Model R2 Concluzie Pol. gr. 3 0.953 DA


Liniar 0.894 NU Pol. gr. 4 0.964 DA
Exp. 0.876 NU Pol. gr. 5 0.994 DA
Ln 0.698 NU Pol. gr. 6 0.994 DA
Pol. gr. 2 0.933 DA
Max(R2) 0.994
Putere 0.699 NU
326 MARIN VLADA

5.2 Parametrizarea şi rezolvarea problemelor


Atât în teorie, cât şi în practică, problemele se pot clasifica în clase de probleme,
clase ce necesita teorii, metode, tehnici specifice pentru rezolvare. Odată cu apariţia
calculatorului, şi cu dezvoltarea algoritmicii (algoritmi de calcul) şi programării (limbaje
de programare), s-au creat programe specializate pentru rezolvarea problemelor specifice
domeniilor. În Informatică (domeniul dezvoltării algoritmilor şi programelor) sunt
cunoscute proprietăţile pe care trebuie să le îndeplinească forma finală a unui algoritm ce
rezolvă o clasă de probleme:
 corectitudine – furnizarea de soluţii corecte bazate pe teorii, metode şi tehnici;
 generalitate – algoritmul nu este conceput pentru rezolvarea unei probleme
particulare, ci este elaborat pentru rezolvarea unei clase sau categorii largi de
probleme;
 claritate şi verificabilitate – nu există ambiguităţi în fluxul de calcul, şi există
posibilitatea ca toţi paşii algoritmului să fie verificaţi cu date de test sau date
reale;
 finitudine şi optimalitate – pentru orice date de intrare acceptate, rezultatul
calculelor se obţine după un număr finit de paşi (nu conduce la cicluri în
execuţie), iar complexitatea algoritmului este dată de numărul minim de paşi
pentru obţinera soluţiilor;
 eficienţa – pentru obţinerea soluţiilor se utilizează eficient memoria de către
structurile de date folosite, iar timpul de execuţie nu este foarte mare, ci
rezonabil (de ordinul secundelor, minutelor).
Utilizarea calculatorului în diverse domenii de activitate, reclamă folosirea de
algoritmi şi programe, care să rezolve o mare diversitate de probleme, mai simple sau
mai complexe. S-au dezvoltat programe specializate pentru rezolvarea problemelor
complexe din diverse domenii de activitate, s-au dezvoltat sisteme informatice ce
implementează informatizarea tuturor activităţilor unui proces (firme sau organizaţii,
companii mari, sisteme mari economice, sociale etc.).
În domeniul chimiei, fizicii, biologiei, medicinii etc., procesele şi fenomenele pot
fi descrise şi controlate dacă exista studii ale acestora, care să conducă la diverse soluţii
ce trebuie să fie implementate în vederea rezolvării problemelor complexe ale acestora.
În matematică, în cazul „generalizării” unei probleme, pot să apară soluţii şi
rezolvări foarte complexe, faţă de cazul particular, sau chiar să nu existe soluţii de
rezolvare pentru cazul general. Este o obligaţie a cercetătorilor dintr-un anumit domeniu
de activitate, să studieze procesele şi fenomenele într-un context general, pentru ca apoi
să compare evoluţia pentru cazurile particulare. Experienţa şi competenţele unui
cercetător sau specialist, sunt cele care contribuie primordial la rezolvarea diverselor
probleme din activitatea ştiinţifică. De altfel, rezultatele obţinute în domeniul cercetării
contribuie la extinderea clasei de probleme rezolvate pentru un anumit domeniu de
activitate.

Definiție. Parametrizarea enunţului unei probleme reprezintă descrierea enunţului iniţial


al problemei sub forma unui enunţ general, care să înlocuiască descrierea particulară cu
înlocuirea (substituirea) constantelor sau valorilor din enunţ cu nume de parametri. Astfel
că, enunţul problemei va genera o clasă întreagă de probleme ce trebuie să fie rezolvate
Statistică şi Informatică pentru chimie medicală şi farmaceutică 327

printr-un algoritm (flux de calcul) sau program, care respectă raţionamentul de rezolvare
pentru cazul particular al problemei.

5.2.1 Problema celor n vase cu azot

Două vase de azot (N), ce au volumele V1 = 4 10-3, V2 = 8 10-3, aflate la


temperatura de T = 300 grade K(Kelvin), sunt conectate printr-un furtun de dimensiuni
neglijabile prevăzut cu un robinet care iniţial este închis. Iniţial, în vasul 1, presiunea
azotului este P1 = 3 105 N/m2, iar în vasul 2, presiunea este P2 = 2 105 N/m2, robinetul
fiind inchis.

Să se determine:
a) masa totală a gazului aflat în cele două vase şi masa de gaz din fiecare vas,
după deschiderea robinetului, temperatura fiind neschimbată în cele două
vase;
b) presiunea finală din fiecare vas, după inchiderea robinetului, şi dacă vasul 1
este încălzit la temperatura T1 = 400 K;
c) viteza termică şi concentraţia moleculară din cele două vase, după ce
robinetul s-a închis, iar vasul 1 s-a încălzit la temperatura T1.

Se cunosc:
 μ = 28 Kg/ kmol masa moleculară a gazului (N);
 R = 8.31 103 J/ (Kmol · K) constanta gazelor perfecte;
 NA = 6.023 10 26 molecule/ Kmol Numărul lui Avogadro.

Aplicația 1. Parametrizarea şi rezolvarea problemei

Cazul: n vase cu azot


Un număr de n (n>1) vase de azot (N), ce au volumele Vi , i=1,n, aflate la
temperatura de T grade K (Kelvin), sunt conectate printr-un furtun de dimensiuni
neglijabile, prevăzut cu un robinet, care iniţial este închis. Iniţial, în vase, presiunile sunt
Pi , i=1,n (N/m2), robineţii fiind închişi.

Să se determine:
a) masa totală a gazului aflat în vase şi masa de gaz din fiecare vas, după
deschiderea robineţilor, temperatura fiind neschimbată în cele n vase;
b) presiunea finală din fiecare vas, după închiderea robineţilor, şi dacă vasul 1
este încălzit la temperatura T1 (K);
c) viteza termică şi concentraţia moleculară din cele n vase, după ce robineţii
s-au închis, iar vasul 1 s-a încălzit la temperatura T1.

Se cunosc:
 μ = 28 Kg/ kmol masa moleculară a gazului (N);
 R = 8,31 103 J/ (Kmol · K) constanta gazelor perfecte;
 NA = 6,023 10 26 molecule/ Kmol · Numărul lui Avogadro.
328 MARIN VLADA

Rezolvare. Stabilirea fluxului de calcul

Problema celor n ( n  2 ) vase cu azot.


a) Se utilizează ecuaţia termică de stare a gazului ideal:
m
pV  RT ,

unde p = presiune, V = volum, m = masa gazului,  = masa moleculară a gazului,
R = constanta gazelor perfecte, T = timp.
Prin urmare, avem următoarea formulă:

m ( pV ) .
RT
 masa totală a gazului din cele n vase, înainte de deschiderea robinetelor:
n
 n

(1) m  m
i 1
i 
RT
 p V , deoarece mi  RT
i 1
i i piVi , i  1, n .

 dupa deschiderea robinetelor, presiunea în cele n vase se echilibrează, devine


aceeaşi, şi anume p, iar masa totală a gazului rămâne aceeaşi, adică,
p n
(2) m 
RT
V i 1
i , unde p este presiunea de echilibru.

 prin identitatea, conform cu (1) și (2), avem:


n

p n
 n  pV i i

V i =  p V , rezultă
i i p i 1
n
,
V
RT i 1 RT i 1
i
i 1
adică presiunea de echilibru, după deschiderea robintelor.
 după deschiderea robinetelor, masele de gaz în fiecare din cele n vase, sunt
date de:
n

  Vi pV i i
Vi Vi
mi  pVi  i 1
n
m n
, adică mi  m n
, i=1,n.
V V V
RT RT
i i i
i 1 i 1 i 1
b) Se închid toate robinetele dintre cele n vase. Vasul numărul 1 este încălzit la
temperatura de 400K.
 deoarece în vasele 2, 3, … n, temperatura nu s-a modificat (T=300K),
presiunea în aceste vase este aceeaşi indentică cu valoarea ce era înainte de
închiderea robinetelor, adică presiunea de echilibru:
n

 pV i i
p2 = p3= … = p n  i 1
n
.
V
i 1
i
Statistică şi Informatică pentru chimie medicală şi farmaceutică 329

 în vasul 1 (încălzit la temperatura T1 = 400K), încălzirea se face la volum


p1 p 2
constant (transformare izocoră – Legea Charles:   const . ), deci
T1 T2
T1
p1  p , unde p este presiunea de echilibru.
T
c) calculul pentru viteza termică şi concentraţia moleculară
 viteza termică din vasul 1, după închiderea robinetelor şi încălzirea la
temperatura T1 = 400, este dată de formula:
1
Vt1  3RT1 .

 vitezele termice pentru vasele 2, 3, … n , înainte de deschiderea robinetelor,
sunt date de:
1
Vti  3RT , i  2, n , T=300K.

 concentraţia de molecule (numărul de molecule din unitatea de volum) Cmol
se obţine cunoscând masa de gaz din vas. Dacă m1 este masa de gaz din vasul
1, într-un Kmol există NA (numărul lui Avogadro) molecule, deci în
m1 m1
 Kmoli vor exista N A molecule, prin urmare, avem:
 
1 m  molecule 
Cmol  N A 1  .
V1   m3 
Observaţie. Concentraţia moleculară este aceeaşi pentru fiecare vas din cele n vase cu azot.

FLUXUL DE CALCUL
Fluxul de calcul: algoritmul de calcul – ordinea de executare a calculelor rezultată din
raţionamentul de rezolvare.
 masa totală a gazului din cele n vase, înainte de deschiderea robinetelor
 n
m
RT
 pV i 1
i i ; calcul intermediar

 presiunea de echilibru,după deschiderea robinetelor


n

pV i i
p i 1
n
; calcul intermediar
V
i 1
i

 masele de gaz în fiecare vas, după deschiderea robinetelor


Vi
mi  m n
, i=1,n
V
i 1
i
330 MARIN VLADA

 presiunea în vasul 1, după încălzire la T1 = 400K


T1
p1  p , p = presiunea de echilibru
T
 presiunile în vasele 2, 3, … n
pi  p , p = presiunea de echilibru
 viteza termică din vasul 1
1
Vt1  3RT1 , T1 = 400

 vitezele termice pentru vasele 2, 3, … n
1
Vti  3RT , i  2, n , T=300K

 concentraţiile moleculare
1 m  molecule 
Cmol  NA i  , i=1,n
Vi   m3 

Rezolvarea folosind programul Excel

Tabelul 34. Calcule realizate în foaia de calcul din programul Excel


Cazul cu 6 vase cu azot (n=6)

Date cunoscute Calcule intermediare


T 300 Nr. vas Volum Presiune Vol · Pres
T1 400 1 4.00E-03 3.00E+05 1.20E+03
miu 28 2 8.00E-03 2.00E+05 1.60E+03
R 8.31E+03 3 7.00E-03 4.00E+05 2.80E+03
*10
Na 6.023 ^26 4 5.00E-03 1.00E+05 5.00E+02
5 6.00E-03 2.00E+05 1.20E+03
6 7.00E-03 3.00E+05 2.10E+03
Sume 3.70E-02 9.40E+03
Masa totală 1.05576E-01
Pres. ech. 2.54054E+05
Statistică şi Informatică pentru chimie medicală şi farmaceutică 331

Fig. 230. Utilizarea programului Excel pentru rezolvare

Tabelul 35. Tabelul calculelor în programul Excel

Aplicaţia 2. Utilizarea programului Excel pentru calcule matriciale şi rezolvarea


sistemelor de ecuaţii.
332 MARIN VLADA

Tabelul 36. Operații cu matrice folosind programul Excel

CALCULE MATRICIALE & REZOLVAREA SISTEMELOR DE ECUATII

Se vor utiliza functiile: MDETERM (), MINVERSE (), MMULT ()

Pentru afisarea rezultatelor (tip array) se utilizeaza combinatia de taste <ctrl>+<shift>+<enter>


1. Calculul determinantului unei matrice - MDETERM ()
2. Calculul inversei unei matrice - MINVERSE ()
3. Calculul puterilor unei matrice - MMULT ()
4. Rezolvarea unui sistem linear de ecuatii - MMULT ()

5 8 5 4
A= 6 14 4 45
9 2 4 7
2 7 1 7

1. Calculul determinantului unei matrice


det(A)= 5051

2. Calculul inversei unei matrice


-0.14571 -0.047317363 0.176797 0.210651
-1
A 0.00495 -0.026925361 -0.0291 0.199366
0.348248 0.065531578 -0.1277 -0.49258
-0.01307 0.031082954 -0.00317 -0.04633

3. Calculul puterilor unei matrice


2
A 126 190 81 443
240 567 147 997
107 157 76 203
75 165 49 379

3385 6931 2157 12722


A3 7919 17131 5053 34483
2567 4627 1670 9446
2564 5661 1610 10721

103368 217482 65999 429588


256824 554673 162814 1079323
A4 74519 154776 47469 296295
82718 178033 52625 351318
Statistică şi Informatică pentru chimie medicală şi farmaceutică 333

Tabelul 37. Rezolvarea matriceală a unui sistem liniar folosind Excel


4. Rezolvarea unui sistem linear de ecuatii

Rezolvarea unui sistem liniar cu 4 ecuatii si 4 necunoscute


sistem A*X=B, A-matrice 4 x 4
-1
solutia X = A * B

Sistemul este dat de urmatoarele ecuatii: Matricea sistemului:


3x - 7y + z + 5t = 2 3 -7 1 5
x + 4y - 11z - t = 23 A = 1 4 -11 -1
x - 14y - 32z + 3t=0 1 -14 -32 3
12x + 4y - 3z + 9t=13 12 4 -3 9

Vectorul termenilor liberi:


B = 2
23
0
13

Rezolvarea sistemului
Inversa matricei sistemului
-3.0578 -3.207197383 0.909487 1.039258
-1
A 1.043621 1.194111232 -0.34678 -0.33152
-0.22028 -0.280261723 0.051254 0.074155
3.539804 3.652126499 -1.04144 -1.10251

-66.37077426
-1
X = A *B 25.24209378
-5.92257361
76.74591058
Verificarea solutiei
Vectorul termenilor liberi:
2 B = 2
A*X=B 23 23
5.68434E-14 0
13 13

Temă. Rezolvarea sistemelor de ecuatii liniare de tip Cramer folosind programul Excel și
comparația cu rezolvarea matriceală.

Problemă. Fie un sistem Cramer de dimensiune n reprezemtat prin formula explicită a


ecuațiilor și prin forma matriceală.
334 MARIN VLADA

Tabelul 38. Forma explicită și matriceală a sistemului


I. Forma explicită a ecuațiilor II. Forma matriceală a sistemului
a) b)
n A X = B, unde
a
j 1
1j x j  b1 A = matricea sistemului,
X = vectorul necunoscutelor,
n n B = vectorul termenilor liberi
a
j 1
2j x j  b2   aij x j  bi , i  1, n
j 1
A  aij
i , j 1, n

… X  xi i 1, n
n

a
j 1
nj x j  bn B  bj
j 1, n

Exemplu. Fie sistemul de ecuații de dimensiune n=5,


2x1 – x2 +11x3 –x4 +x5= 21
5x1 +13x2 –9x3 +2x4 –2x5= 7
x1 –23x2 +4x3 –10x4 +2x5= 3
10x1 +3x2 +4x3 +7x4 –32x5= -23
–23x1 +3x2 +4x3 –2x4 +56x5= 12

Rezolvare.
Metoda I. Rezolvare folosind metoda lui Cramer și funcții Excel pentru operații
matriceale:
- se verifică valoarea det(A); dacă aceasta valoare este nenulă, det(A)≠0, atunci soluțiile
sistemului sunt:
dxi
xi  , i  1, n ,
det( A)
unde dxi este este determinantul obţinut din matricea sistemului prin înlocuirea coloanei
coeficienţilor lui xi cu coloana termenilor liberi.
B=vectorul
A=matricea sistemului termenilor liberi
2 –1 11 –1 1 21
5 15 -9 2 -2 7
A= 1 –23 4 –10 2 B= 3
10 3 4 7 –32 –23
–23 3 4 –2 56 12

detA = –99758
Statistică şi Informatică pentru chimie medicală şi farmaceutică 335

Pentru calculul determinantului det(A) se


apelează funcția MDETERM (array) din
Excel.
MDETERM(array), Array is a numeric
array with an equal number of rows and
columns. Se selectează celula B43 și în
caseta de formulă se scrie formula:
„=MDETERM(B37:F41)”
sau cu mouse-ul se indică domeniul
B37:F41, unde sunt stocate elementele
matricei A. Soluțiile sistemului sunt:
dxi
xi  , i  1, n ,
det( A)
unde dxi este este determinantul obţinut
din matricea sistemului prin înlocuirea
coloanei coeficienţilor lui xi cu coloana
termenilor liberi.

Se calculează determinanții dxi , i=1,5.

21 –1 11 –1 1
7 15 –9 2 –2
dx1= 3 –23 4 –10 2 det(dx1) 742537
–23 3 4 7 –32
12 3 4 –2 56

2 21 11 –1 1
5 7 –9 2 –2
dx2= 1 3 4 –10 2 det(dx2) -607317
10 –23 4 7 –32
–23 12 4 –2 56

2 –1 21 –1 1
5 15 7 2 –2
dx3= 1 –23 3 –10 2 det(dx3) -282758
10 3 –23 7 –32
–23 3 12 –2 56
336 MARIN VLADA

2 –1 11 21 1
5 15 –9 7 –2
dx4= 1 –23 4 3 2 det(dx4) 1465641
10 3 4 –23 –32
–23 3 4 12 56

2 –1 11 –1 21
5 15 -9 2 7
dx5= 1 –23 4 –10 3 det(dx5) 388670
10 3 4 7 –23
–23 3 4 –2 12

SOLUȚIA x1 = –7.44338
x2 = 6.087903
x3 = 2.834439
x4 = –14.692
x5 = –3.89613

Metoda II. Rezolvare folosind Metoda matriceală și funcții Excel pentru operații
matriceale.
Analog, ca la Metoda I, se verifică valoarea det(A). Dacă aceasta valoare este
nenulă, det(A)≠0, atunci sistemul este de tip Cramer.

Proprietate. Dacă sistemul are det(A)≠0, atunci soluția sistemului se determină


folosind formula X=inv(A) *B .
METODA. Pornind de la forma matriceală a sistemului Cramer, A*X = B, se înmulțește
această egalitate, membrul stâng și membrul drept, cu inv(A), se obtine inv(A)*A*X =
inv(A)*B, și cum inv(A)*A = I, I=matricea unitate, rezultă X = inv(A)*B.
Prin urmare, pentru calculul valorilor vectorului soluțiilor X, trebuie să se
determine inversa matricei A și apoi se înmulțesc matriceal inv(A)*B. Vom folosi funcțiile
din Excel: MINVERSE (), determină inversa unei matrice; MMULT (), determină
înmulțirea a două matrice.
 MINVERSE(array), Array is a numeric array with an equal number of rows
and columns.
 MMULT(array1, array2), Array1, array2 are the arrays you want to multiply.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 337

1. Pentru calculul inv(A), se selectează domeniul unde va returna funcția MINVERSE()


rezultatul, adică domeniu B132:F136; se apelează funcția MINVERSE() prin formula
„=MINVERSE(B132:F136)”, după care se apasă simultan tastele Ctrl+Shift+CR.
2. Pentru calculul inv(A)*B, se selectează domeniul unde va returna funcția MMULT()
rezultatul, adică domeniu H185:H189; se apelează funcția MMULT() prin formula
„=MMULT(B185:F189,H132:H136)”, după care se apasă simultan tastele
Ctrl+Shift+CR.
Tabelul 39. Foaia de calcul din programul Excel
2 –1 11 –1 1 21
5 15 –9 2 –2 7
A= 1 –23 4 –10 2 B= 3
10 3 4 7 –32 –23
–23 3 4 –2 56 12

detA = –99758
–0.10371 0.581347 0.523216 0.678422 0.391598 –7.44338
0.122797 –0.22825 -0.27309 –0.36755 –0.21062 6.087903
invA
= 0.102849 -0.0973 –0.08914 –0.10213 –0.06049 X= 2.834439
–0.26486 0.600072 0.596213 0.940195 0.542122 –14.692
–0.06598 0.279376 0.257182 0.339201 0.213657 –3.89613

Verificare B=AX 21
SOLUȚIA
7
B= 3
–23
12

5.2.2 Problema celor 5 pahare Berzelius

În 5 pahare Berzelius s-au amestecat diferite substanțe cunoscute, în proporții


diferite, necunoscându-se volumul din fiecare substanță. Să se determine volumul pentru
fiecare din cele 5 substanțe, dacă se cunosc doar următoarele date:
1. în primul pahar se introduc, 2 volume din prima substanță, un volum din a
doua, 3 volume din a treia, 7 volume din a patra și 5 volume din a 5-a,
obținându-se 15 ml soluție;
2. în al doilea pahar se introduc, 3 volume din prima substanță, 5 volume din a
doua, 2 volume din a treia, 4 volume din a patra și 8 volume din a 5-a,
obținându-se 20 ml soluție;
338 MARIN VLADA

3. în al treilea pahar se introduc, 5 volume din prima substanță, 4 volume din a


doua, 6 volume din a treia, 6 volume din a patra și 1 volum din a 5-a,
obținându-se 22 ml soluție;
4. în al patrulea pahar se introduc, 6 volume din prima substanță, 2 volume din a
doua, 4 volume din a treia, 5 volume din a patra și 2 volume din a 5-a,
obținându-se 16 ml soluție;
5. în al cincilea pahar se introduc, 1 volum din prima substanță, 3 volume din a
doua, un volum din a treia, 2 volume din a patra și 3 volume din a 5-a,
obținându-se 5 ml soluție.
Indicație. Rezolvarea problemei se reduce la rezolvarea unui sistem de 5 ecuații cu
5 necunoscute:
2x+y+3z+7t+5u=15
3x+5y+2z+4t+8u=20
5x+4y+6z+6t+u=22
6x+2y+4z+5t+2u=16
x+3y+z+2t+3u=5

Inversa matricei A (matricea sistemului): Soluția sistemului:


0.190751 –0.10983 –0.39306 0.317919 –0.06358 x =0.069364
–0.26268 0.033398 0.447013 –0.28966 0.23571 y =0.247913
–0.42903 0.294155 0.321773 0.02569 –0.11625 z =0.106615
0.39499 –0.26782 -0.04624 –0.11946 0.090559 t =0.204239
0.157354 0.104689 –0.36802 0.188182 –0.12653 u =0.430957

Aplicaţia 3. Scenarii - Repetarea unor calcule pentru mai multe seturi de date. Tabelarea
unei funcţii de mai multe variabile f : Rn → R.

Definiţie. Un scenariu reprezintă o foaie de calcul ce conţine valoarea unei funcţii de mai
multe variabile y = f(x1 , x2 , … , xn) pentru un set de valori ale argumentelor x1 , x2 , … , xn.
Pentru o funcţie de n variabile (argumente) se pot ataşa mai multe scenarii, fiecare
scenariu având ataşat un nume distinct.

Exemplu. Pentru generarea unor scenarii, să presupunem că zilnic, în cadrul unui proces
tehnologic, trebuie să se măsoare valoarea unui parametru (de exemplu, temperatura,
presiunea etc.) în diverse locuri, de exemplu la 4 aparate de măsură. Vom nota cele patru
măsurări prin x1, x2, x3, x4. Se cere ca zilnic, să se calculeze deviaţia standard estimată
(rădăcina pătrată a dispersiei estimate) corespunzătoare celor 4 valori. Dacă x1, x2,…, xn
sunt aceste valori, dispersia estimată a valorilor x1, x2,…, xn este notată cu SX. Prin urmare,
trebuie să se calculeze valori ale funcţiei de n variabile f(x1, x2,…, xn), unde

 x  x 
n
2
i
1 n
f : R n  R, f ( x1 ,..., xn )  S X  i 1
n 1
,x   xi .
n i1
Statistică şi Informatică pentru chimie medicală şi farmaceutică 339

Într-o foaie de calcul vom memora în celulele B2 :B5 valorile parametrului


măsurate la început, scenariu numit Curent Values. Deviaţia standard estimată (rădăcina
pătrată a dispersiei estimate) corespunzătoare celor 4 valori se calculează în celula B7,
prin introducerea formulei =STDEV(B2 :B5).
Pentru crearea mai multor scenarii (în esenţă, acest scop îl are comanda Scenario
Manager), se selectează Date  What-if-Analysis  Scenario Manager care determină
deschiderea ferestrei de dialog Scenario Manager.

Fig. 231. Fereastra Scenario Manager din Excel


Gestionarea (crearea, afişarea, editarea) scenariilor se face prin următoarele acţiuni:
1. după ce în foaia de calcul s-a memorat un set de valori (de exemplu, în
regiunea B2 :B5), şi s-a introdus într-o celulă formula pentru calculul
corespunzător (de exemplu, în celula B7), se utilizează meniul Date  What-
if-Analysis pentru a selecta comanda Scenario Manager; se va deschide
ferestra de dialog Scenario Manager, care oferă mai multe butoane (Add,
Delete, Edit, Merge, Summary, inclusiv Show, Close) cu ajutorul cărora se pot
realiza prelucrări asupra scenariilor;
2. în fereastra de dialog Scenario Manager se acţionează butonul Add (adăugare
scenariu) prin care se cere crearea unui nou scenariu; se afişeaza fereastra de
dialog Add Scenario, în care utilizatorul trebuie să indice un nume pentru
scenariu (Scenario name), zona de celule care intră în calcul (Changing cells),
opţional comentariu (Comment), şi opţiuni de protecţie (Protection); în linia
Changing cells se tastează, sau se indică cu mouse-ul, referinţa la celulele,
care conţin valorile ce vor intra în calcul; pentru desemnarea celulelor
neadiacente cu mouse-ul, în timpul selectării celulelor, se va ţine apăsată tasta
<Ctrl>; dacă este activată opţiunea Prevent chages, scenariul generat este
protejat la ştergere şi la editare (în acest caz şi foaia de calcul trebuie să fie
protejată prin Protect Sheet); în final, se acţioneaza butonul OK, prin care se
va afişa fereastra de dialog Scenario Values;
340 MARIN VLADA

3. fereasta de dialog Scenario Values oferă specificarea valorilor corespunzătoare


celulelor, care trebuie să se modifice, şi care reprezintă argumentele funcţiei
(formulei) ce se evaluează ; în liniile corespunzătoare, se vor introduce noile
valori ale argumentelor, numărul maxim de argumente fiind 32; în final, se
va acţiona butonul OK, care determină revenirea la fereastra principală
Scenario Manager, sau se va acţiona butonul Add, pentru a se afişa fereastra
de dialog Add Scenario, pentru crearea unui nou scenariu;

Fereastra principală pentru gestionarea scenariilor Scenario Manager oferă


butoane, care au funcţii bine definite:
 Add – adăugarea de noi scenarii prin afişarea ferestrei de dialog Add Scenario;
 Delete – ştergerea scenariului, care a fost selectat din lista Scenarios;
 Edit – afişarea ferestrei de dialog Edit Scenario, care este identică cu ferestra Add
Scenario, şi care permite editarea scenariului selectat (numele, referinţele la celulele
care se modifică, comentariile), modificările efectuate sunt urmărite şi sunt afişate în
partea inferioară a ferestrei, în zona destinată comentariilor;
Statistică şi Informatică pentru chimie medicală şi farmaceutică 341

 Merge – interclasarea în foaia de calcul actuală a diferitelor scenarii, care se află în


diverse agende de lucru, deschise simultan, şi care trebuie să aibă aceeaşi structură;
prin acţionarea butonului Merge se afişeaza ferestra de dialog Merge Scenarios care
oferă casetele Book şi Sheet, și care se indică numele agendelor de lucru şi numelor
scenariilor ce trebuie interclasate;
 Summary – crearea unui raport într-
o foaie separată a agendei de lucru
activă; se pot crea două tipuri de
rapoarte, sumarul scenariilor, şi un
tabel pivot corespunzător
scenariilor; ferestra afişată oferă
două botoane de validare (Scenario
summary, Scenario Pivot Table) şi
caseta Result cells. Dacă se
validează butonul Scenario
summary, se creează un raport, care
afişeaza toate scenariile definite
(valorile de intrare şi rezultatele
corespunzătoare), în cazul în care agenda de lucru este gestionată în regim
monoutilizator; dacă se validează butonul Scenario Pivot Table, se va genera un
tabel pivot, care conţine şi un control de tip listă ascunsă; elementele listei permit
filtrarea rezultatelor în rapor cu numele utilizatorului, acest lucru se face dacă
agenda de lucru este partajată între mai multi utilizatori; linia Result cells conţine
referinţa sau referinţele la acele celule, pentru care se doreşte recalcularea
rezultatelor pentru scenariul aplicat; prin crearea celor două rapoarte, automat se
creează două foi de calcul, cu numele corespunzătoare tipului de raport:

Scenario
Pivot Table

Foaia de calcul
Scenario Pivot Table

Fig. 232. Scenario Pivot Table


342 MARIN VLADA

Raport
Scenario Summary
Summary

Fig. 233. Scenario Summary

5.3 Teme practice pentru Laborator


Statistică & Informatică pentru chimie medicală și farmaceutică – TEME și
aplicații practice pentru Laborator (M. Vlada, 2017).

Laborator 1
Tema 1. Calcule statistice, funcții matematice și statistice – facilități oferite de Excel
Ref.: M, Vlada, C3-C5-Informatica.pdf,
a) ∑ (Autosum)  Excel www.unibuc.ro/prof/vlada_m
b) Sum (...) Excel
c) fx  Excel , AVERAGE (...) Excel ,
- Într-un tabel, să se genereze pe orizontală și pe verticală, serii de numere consecutive
folosind Edit  Fill  Series. Să se utilizeze funcțiile indicate în a)-c) și să se verifice
rezultatele.
Suma Verificare
1 2 3 … 20
2
3 ∑ (Autosum)

… n( n  1)
Gauss
AVERAGE () 2
20
Media SUM () /n
Verificare
Statistică şi Informatică pentru chimie medicală şi farmaceutică 343

Tema 2. Indicatori statistici: corelația (Pearson), covarianța, abaterea standard

- Se consideră datele (măsurările) a două variabile aleatoare/seturi de date X și Y,


X=(xi)i=1,n și Y=(yi)i=1,n, adică (xi ,yi), i=1,..., n. Să se calculeze corelația dintre vectorii
X și Y cu formula:

 A, B 
rXY  , A  X  X,B  Y Y.
,
|| A ||  || B ||

a) folosind funcția CORREL (X,Y)  Excel ,


b) folosind covarianța COVAR(X,Y)  Excel și abaterea standard STDEVP (X)
 Excel (Observație. Nu se utilizează STDEV, aceasta va fi pentru un eșantion statistic)
n

 x i  x  yi  y 
, Cov X , Y  
Pentru calculul Sx și Sy nu Cov( X , Y ) i 1
se utilizează STDEV,
rXY  ,
S X SY n
deoarece în formulă, la
n n

 x  x y  y
numitor, are expesia (n-1). 2 2
i i
SX  i 1
SY  i 1
,
n n
unde Cov(X,Y) este covarianța , SX , SY sunt abaterile standard. Folosiți HELP  Excel ,
c) folosind Excel pentru calculele directe: se utilizează calculele intermediare
(vectori)

A  X  X ; B  Y  Y ; C  A  B ; D  A2 ; E  B 2
Laborator 2
Calcule și reprezentări grafice

Tema 1. Puterile lui 2: Puterile 2k, k > 0. Folosind Fill (generare Series) Să se genereze
într-un tabel valori pentru k de la 1 la 200.

Pentru k > 30 să se determine numărul cifrelor şi cifrele puterii 2k (de exemplu, să se


verifice că 2100 are 31 de cifre şi 2100 = 1267650600228229401496703205376, iar 21000
are 302 cifre). Verificare pentru 2200, 2300.

a) folosind operatorul putere „^”, adică 2^k; b) folosind funcția POWER


()  Excel ; c) folosind http://web2.0calc.com/ (Web 2.0 Scientific Calculator)
d) folosind www.wolframalpha/examples/Math.html (Knowledge Computable platform).

k 2^k POWER(2,k)
1 2 2
… … …
344 MARIN VLADA

Tema 2. Reprezentarea grafică a funcțiilor

a) f : [-10, 10]  R , f(x) = x*sin (x), pasul de discretizare interval, p=0.1


b) f : [-2, 2]  R, f(x) = e-x*x (clopotul lui Gauss), pasul de discretizare, p=0.1
c) C2 : [0, 120]  R, pasul de discretizare interval, p=1

C2 t   
k a c0 kat ket
ke  k a
e e 
(curba de absorbție-eliminare în Farmacocinetică), unde C0 =10, ka =0.3, ke =0.03.
1. folosind tabelerea funcției și programul Excel (DEFINIȚIE. Tabelarea unei
funcții înseamnă generarea unui tabel cu 2 coloane, în care prima conține
valori ale argumentului x generate cu pasul p=1 , 0.1 sau 0.01, și a doua, ce
conține valorile f(x) ale funcției în aceste valori ale lui x)
2. folosind http://web2.0calc.com/ (Web 2.0 Scientific Calculator)
3. folosind http://www.wolframalpha.com/examples/PlottingAndGraphics.html
4. folosind http://www.mathe-fa.de/ro
1. Să se genereze pentru argumentul x, respectiv t, într-un tabel pe verticală, serii
de numere consecutive folosind Edit  Fill  Series, cu pasul pas = 0.1. Se vor calcula
valorile funcției în aceste valori generate, după care să se realizează graficul folosind
Chart Line Excel .
2. Comenzi pentru programele care realizează reprezentări grafice –
http://web2.0calc.com și
http://www.wolframalpha.com/examples/PlottingAndGraphics.html:
 comanda: plot (x*sin(x), x=−50..50), respectiv plot x*sin(x) from x=−50 to 50
 comanda: plot (exp(−x*x),x=−2..2)
 comanda: plot ((3/(0.03−0.3))*(exp(−0.3*x)-exp(−0.03*x)), x=0..120)

Laborator 3
Rezolvarea de probleme și prelucrarea datelor

Aplicație Indicele de masă corporală (IMC) (Body mass index – BMI) este un indicator
statistic al greutății (G) unei persoane, raportate la înălțimea (H) persoanei respective.

Formula are ca rezultat o cantitate exprimată în kg/m2:


G [kg]
IMC  .
H 2 [ m]
S-au definit nivele de risc pentru a indica o stare, funcție de valoarea IMC:
1. Sub-ponderal – dacă IMC < 18.5;
2. Normal-ponderal – dacă 18.5 ≤ IMC < 25.0;
3. Supra-ponderal – dacă 25.50 ≤ IMC < 30.0;
4. Obezitate I – dacă 30.0 ≤ IMC < 35.0;
5. Obezitate II – dacă 35.0 ≤ IMC < 40.0;
6. Obezitate III – dacă IMC ≥ 40.0.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 345

Exemplu. Pentru 100 de persoane să se genereze aleator valori de greutate (cuprinse între
30 și 130) și de înăltime (cuprinse între 1.4 și 2.10). În tabelul următor să se calculeze
IMC și să se determine nivelul acestui indice.

Separat, în 2 coloane se generează aleator valori pentru G și H, folosind funcția


RAND(), cu formula „=a+RAND()*(b-a)”, intervalul de generare fiind [a,b]. Formula se
bazează pe bijecția f : [0,1]  [a,b], f(t) = a+ t(b-a); f(0) = a și f(1) = b. Pentru a nu se
modifica valorile generate la orice acțiune din Excel, acestea se copiază prin Paste
SpecialValues, în coloanele corespunzătoare din tabel. Pentru determinarea nivelului
IMC se va utiliza funcția IF(logical_test,value_if_true,value_if_false).

G- H- Stare-
Nr. crt. IMC=G/H^2
greutate inaltime indice
1 67 1.8 20.679012 Norm-P
2 35 1.5 15.555556 Sub-P D10
… … … … …

Celula E10 va conține formula „=IF(D10<18.5,"Sub-P",IF(D10<25,"Norm-P",


IF(D10<30, "Supra-P",IF(D10<35,"Obez-I",IF(D10<40,"Obez-II","Obez-III")))))”

Interpretare date: a) să se calculeze corelația CORREL (), pentru (G,H), (G,IMC),


(H,IMC); b) să se sorteze după valorile indicelui IMC, pentru a include persoanele în
nivelele IMC. Folosind funcția COUNTIF(range,criteria) să se determine numărul
persoanelor pe aceste nivele.

Nr. Se selectează cele 3 coloane și


IMC-stare Min Max
persoane se utilizează Charts: 2-D
Sub-P 10 18.5 ? Column
Normal-P 18.5 25 ?
Supra-P 25 30 ? Se selectează coloanele 1 și 4
și se utilizează Charts: 2-D
Obez-I 30 35 ?
Pie
Obez-II 35 40 ?
Obez-II 40 50 ?

Laborator 4
Reprezentarea și interpretatrea datelor folosind diagrame (Charts)

Aplicație. Testarea facilităților oferite de programul Excel în reprezentarea și


interpretarea grafică a datelor. Folosind seturile de date din tabel, să se elaboreze cât mai
multe diagrame (Charts), pentru care au sens reprezentările și interpretările rezultate.

Exemplu. a) Vânzări de medicamente pe cele 4 trimestre, în anii 2014-2016; b) Nivelul


tensiunii arteriale.
346 MARIN VLADA

Trimestru An 2014 An 2015 An 2016 Nivel Diastolică Sistolică


Trim 1 2000 2200 2500 Foarte scazuta 40 70
Trim 2 1600 2500 2200 Hipotensiune 60 90
Trim 3 1500 2100 2200 Normala 80 120
Trim 4 2400 2800 3000 Usor crescuta 90 140
Hipertensiune 100 190

Tutorial de utilizare.

Meniul principal Chart Tools. Dacă se realizează click-dublu pe suprafața unei


diagrame, se activează meniul principal Chart Tools, care oferă instrumente de prelucrare
prin cele 2 meniuri:
1. Design – cu submeniurile Type, Data, Chart Layouts, Chart Styles;
2. Layout – cu submeniurile Curent selection, Insert, Labels, Axes, Background,
Analysis, Properties.

Facilitățile meniului Design asupra structurii diagramei. Meniul Desing oferă


adăugarea/modificarea diverselor elemente din structura diagramei:
1. Alegerea tipului (Type) – Change Chart Type, Save as Template;
2. Modificare/adăugare Date – Switch Row/Column, indicarea seturilor de date
pentru axa X și axa Y;
3. Alegerea structurii diagramei se face prin submeniul Chart Layouts – se aleg
componentele dorite în structura diagramei;
4. Alegerea stilului pentru diagramă – Chart Styles.

Facilitățile meniului Layuot asupra structurii diagramei:


1. Submeniul Labels – instrumente pentru adăugarea/modificarea componetelor
din structura unei diagrame: Chart Title, Axis Titles, Legend, Data Labels, Data
Table.
2. Submeniul Axes – instrumente pentru axele X (principală) și Y, pentru grila
fiecărei axe.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 347

Laborator 5
Rezolvarea de probleme folosind Excel

Tema 1. Rezolvarea problemei lui Gauss.

Un vas conţine 2000 litri dintr-un lichid cu o concetraţie de 80 % alcool. În fiecare zi


se scot din vas 15 litri şi se înlocuiesc cu alţi 12 litri dintr-un lichid, a cărui concentraţie
în alcool, este de numai 40 %. După câte zile concentraţia lichidului din vas ajunge la
50 % ?

 parametrizare (constante  variabile);


 procesul de calcul (fluxul de calcul); 2000 l, alcool 80%
 rezolvarea folosind programul Excel.
15 l, alcool 80%

12 l. alcool 40%

Într-o coloană se vor genera 200 valori consecutive, pentru x = numărul de


operații.

Referință: Online – http://www.unibuc.ro/prof/vlada_m/docs/2012/ian/16_20_37_19C3-C5-


Informatica.pdf

Tema 2. Rezolvarea problemei celor n vase cu azot .

(Ref.: www.unibuc.ro/prof/vlada_m/docs/2012/apr/09_22_14_22App-demo-2.doc).

a) cazul n=2
b) cazul general n > 1

- parametrizare (constante  variabile) și raționamentul de rezolvare;


- procesul de calcul (fluxul de calcul);
- rezolvarea folosind programul Excel.

Referință: M. Vlada, Informatică aplicată, cap. 2, Editura Universității din București, 2012.
348 MARIN VLADA

Online - http://www.unibuc.ro/prof/vlada_m/docs/2012/ian/16_20_37_19C3-C5-
Informatica.pdf

Laborator 6
Prelucrarea statistică a datelor experimentale: gruparea în clase/intervale

- Fiind dat un set de date X=(xi)i=1,n, Gruparea statistică a unui set de date este o
prelucrare a datelor printr-o centralizare a datelor pe intervale de variație/clase. Pentru n
mare, numărul de clase r se determină astfel ca 2r > n, sau cu formula lui H. A. Sturges
r = [1+ 3,322 ∗ lgn], unde [.] este funcția partea întreagă. Mărimea intervalelor de
grupare a datelor este notată cu K= [A/r], unde A=xmax – xmin este numită amplitudine.
- Intervalul de variaţie reprezintă diferenţa dintre limita inferioară şi limita
superioară a clasei respective.
- Determinarea celor r intervale/clase:
[xmin, xmin + K ], (xmin + K, xmin + 2K ], ... (xmin +(r-1)K, xmax].
- Frecvența absolută pentru o valoare xi, notată ai, din setul de date reprezintă
numărul de apariții a acestei valori în sirul de date, iar frecvența relativă este dată de
raportul fi = ai / n, unde n este numărul de valori ale setului de date.
- Histograma este reprezentarea grafică (Chart 2-D Column) a distribuției de
frecvențe relative pentru un set de date.

Tema 1. Se consideră 100 de medicamente pentru care se cunoaște prețul de achiziție/


vânzare. Presupunem că valorile de preț sunt cuprinse în intervalul [4,270], valori întregi.
Să se realizeze gruparea în clase de variație și să elaboreze histograma distribuției de
frecvențe.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 349

- Vom codifica medicamentele cu numerele de ordine 1-100. Vom genera


aleator/intâmplător 100 de valori întregi, în intervalul 4-270, folosind functia RAND(),
oferită de programul Excel, scriind formula =a+RAND()*(b-a). Aceste valori se vor sorta
crescător.
- Se determină r și cele r intervale de variație. Se va genera tabelul claselor și
frecvențele corespunzătoare
- Pentru coloana „Frecvențe” vom folosi funcția COUNT(), și se va calcula,
pentru fiecare interval/clasă, numărul de valori ce apar în setul de date. Se va realiza
Histograma.

Suma Suma
Frecvențe
Nr. crt. Grupe Frecvențe ai frecvențe frecvențe
relative ai/n
absolute relative
1 5-42 13 0,13 13 0,13
2 43-80 10 0,1 23 0,23
3 81-118 17 0,17 40 0,4
4 119-156 11 0,11 51 0,51
5 157-194 16 0,16 67 0,67
6 195-232 15 0,15 82 0,82
7 233-270 18 0,18 100 1
Suma 100 1

Concluzii. Cele mai puține medicamente, în numar de 10, au prețurile în intervalul


43−80, iar cele mai multe, în număr de 18, au prețuri în ultimul interval 233−270.
Conform ultimei coloane (suma frecvențe relative), 51% din numărul de medicamente au
prețuri mai mici decât 157.

Tema 2. Pentru 200 de studenți se cunosc notele la un examen. Să se realizeze gruparea


statistică și histograma notelor pentru intervalele/clasele 5-6, 7-8, 8-9, 9-10.

Laborator 7
Prelucrarea statistică a datelor experimentale: distribuții de probabilitate și funcții de
repartiție
Tema 1. Pentru un număr n = 75 de studenți, să se genereze aleator note de la 3 la 10. Să
se calculeze numărul studenților ce au primit o anumită notă (fi, frecvența notelor).
Frecvența notelor determină probabilitatea de a obține o anumită notă, p = fi / n . Să se
calculeze probabilitatea de apariție a unei note și să se reprezinte grafic distribuția
acestora (Chart 2-D Column și Pie).

Nota Frecvența Probabilitate Procente


3 7 0.093 9.33%
… … … …
350 MARIN VLADA

Tema 2. Rezultatul aleatoriu al măsurării, pentru o variabila X=(xi)i=1,n, devine


o variabilă continuă, dacă este exprimată printr-un număr infinit de măsurări, și anume
n∞, iar probabilitatea ca o valoare oarecare x să aibă valoarea xi este P(x=xi) = pi, unde
0≤ pi ≤1. Histograma (în cazul discret, n=finit) este înlocuită (cazul continuu, n = infinit)
cu cu un număr infinit de dreptunghiuri, care descriu repartiția probabilității prin definirea
funcției de probabilitate f(x) (sau densitatea de probabilitate a variabilei aleatoare X),
unde

f ( x)  0,  f (u )du  1, lim f ( x)  lim f ( x)  0 , și f(x)=F’(x).
 x  x 

Funcția de repartiție, notată F(x): R [0,1] se exprimă prin integrala (aria cuprinsă între
curba funcției de probabilitate f(x), între -∞, până la x, și axa OX). Pentru o valoare dată
x  (,) , conform definiţiei funcţiei de repartiţie, probabilitatea ca X < x este dată
de relaţia:
x

F(x) = P ( X < x ) =  f (u )du .




Grafice diverse. Folosind www.wolframalpha.com, www.web2.0calc.com și


www.mathe-fa.de
a) Repartiția normală Gauss N(μ, σ2) – clopotul lui Gauss. Pentru aceeași
dispersie =1, curbele densităţii de probabilitate cu medii diferite =0,1,2. Curbele
densităţii de probabilitate cu aceeaşi medie (=1), dar dispersii diferite =0.5,1,2. Pentru
N(0,1) avem funcția NORMDIST().
b) Repartiţia Weibull (Legea exponenţială), Repartiția Gamma (Γ), Repartiția
χ2 - hi patrat (Helmert-Laplace), Repartiția Snedecor-Legea Fisher.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 351

Laborator 8
Prelucrarea datelor experimentale: Estimarea parametrilor și testarea ipotezelor
statistice

Tema 1.
-Repartitia normală standard: pentru a) se va folosi funcția NORMSINV(p) ce
calculează valoarea zα; pentru b) se va folosi funcția NORMSDIST(z) ce culculează
p=(1−α).
-Repartiția χ2: pentru a) se va utiliza CHIINV(α,v) care calculează valoarea
limitei, dacă se dă ca argumente valoarea riscului α și v=numărul gradelor de libertate;
pentru b) se va utiliza funcția CHIDIST(x,v), care calculează valoarea riscului α, dacă se
dă ca argumente valoarea x și v=numărul gradelor de libertate.
-Repartiția Student: pentru a) se va utiliza funcția TINV(2α,v), care calculează
valoarea limitei tα, dacă se dă ca argumente valoarea lui 2α (funcția TINV() este
implementată pentru cazul distribuție bilaterale), v=numărul gradelor de libertate; pentru
b) se va utiliza funcția TDIST(tα,v,ind), care calculează valoarea riscului α, dacă se dă ca
argumente valoarea lui tα, v=numărul gradelor de libertate și ind=1, în cazul repartiției
Student cu risc unilateral, respectiv ind=2, în cazul repartiției Student cu risc bilateral.

Aplicație. La Facultatea de Chimie s-a realizat măsurarea greutății tuturor studenților din
facultate, în număr de 457 de studenți, și s-a obținut media greutății μ= 54.4 kg. Această
valoare este contestată de profesorul de sport. Pentru a face un test statistic, se
selecționează un eșantion aleator de 100 de studenți și se găsește că media
M[X]= 53.75 kg. Este această valoare suficientă pentru a respinge afirmația cu nivelul de
semnificație α = 0.05 (5%)?

Pentru repartițiile: normală, χ2, Student,


Fisher.
a) Determinarea intervalului de
semnificație/incredere: Se dă
probabilitatea / nivelul de semnificație
(1-α) (sau valoarea de risc α) și se cere să
se determine parametrului statistic –
limitele intervalului de semnificație
pentru funcția de repartiție
corespunzătoare.

b) Determinarea
probabilității/nivelului de semnificație
(1-α): Se dă parametrul statistic –
limitele intervalului de semnificație
pentru funcția de repartiție
corespunzătoare, și se cere să se
determine probabilitatea / nivelul de
semnificație (1-α)
(sau valoarea de risc α).
352 MARIN VLADA

Etapa 1: Definirea ipotezelor statistice H0: μ = 54.4 Kg ; H1: μ ≠ 54.4 Kg.

Etapa 2: Metoda de verificare a ipotezelor constă din identificarea unui test statistic,
specificarea valorii lui α, determinarea regiunii critice și a valorii critice. Se determină
eroarea standard de estimare, intervalul de semnificație (-Zα/2, Zα/2), adică Zα/2=1.96. Se
va apela funcția NORMSINV(0.025) = −1.959963985.

Etapa 3: Gradul de încredere /scorul standard pentru mediile eșantioanelor este


Ztext = 1.204. Valoarea testului statistic nu este în regiunea critică.

Decizia: Nu respingem ipoteza H0. Justificarea deciziei: Valoarea testului nu este în


dezacord cu H0, la nivelul de risc α = 0.05. Aceasta nu înseamnă că H0 este adevărată.
Concluzie: Media M[X]= 53.75 Kg nu contravine ipotezei că media este 54.4 Kg, când
dispersia este 5.4 Kg. O decizie de respingere a lui H0 înseamnă că valoarea testului
implică faptul că H0 este falsă și indică H1.

Laborator 9
Analiza datelor experimentale: procedeul de modelare/fitare

Tema 1. Modele de aproximare (liniare-dreaptă de regresie, neliniare-curbe): suport


teoretic

Studiul variabilei depentente Y în funcție de variabila X, Y = f(X), (X și Y au n


valori măsurate), f reprezintă modelul (funcție), adică funcția de evoluție a lui Y față de X.

 Tipuri de asociere a datelor măsurate, tipul modelului (funcției) f: f(x)=ax+b


(dreapta); f(x)=ax2+bx+c (polinom gr. 2, 3, ..., 6); f(x)=aebx (exponențială);
f(x)=a+bln(x) (logaritmică).
 Suportul matematic: Metoda celor mai mici patrate (MCMP)
n
- se determină coeficienții a,b, ... , astfel că suma S  [ y
i 1
i  f ( xi )] 2 să fie

minimă (valoarea minimă a pătratelor erorilor) – S(a, b, ...) și sistemul dS/da=0,


dS/db=0, ...

Tema 2. Procedeul de modelare (fitare): asocierea datelor, determinarea modelelor,


comparații.

Pasul 1. Reprezentarea norului de puncte (diagrama de împrăștiere) pentru variabilele


X și Y. Pentru acest lucru trebuie să se selecteze valorile aflate în cele 2 coloane ale celor
2 variabile, se acționează Insert  Chart, și se alege tipul de grafic XY (Scatter)
(Standard Types), de unde, din cele 5 variante de grafice, se optează pentru prima
variantă (Scatter-Compares pairs of values); se parcurg etapele pentru a genera graficul
respectiv, și care va apărea în foaia de calcul;
Statistică şi Informatică pentru chimie medicală şi farmaceutică 353

Pasul 2. Determinarea și reprezentarea modelului. Se selectează graficul obținut la pasul


1 (norul de puncte) și se acționează Chart  Add Trendline, de unde, se alege tipul
modelului, de exemplu Linear (Standard Types) etc.;
a) se alege modelul (se aleg pe rând toate modelele; pasul 2 se repetă plecând
de la o copie a norului de puncte).
b) ATENȚIE! Eticheta Add Trendline Options permite definirea altor atribute
ale liniei de dendință:
- Display equation on chart – marcarea boxei de control are efectul trecerii pe
grafic a ecuaţiei estimate,
- Display R-squared value on chart – este utilă pentru afişarea coeficientului
de determinare R2 (pătratul coeficientului de corelaţie multiplă).
n n

 [ yi  f ( xi )]2  [ y  f ( x )]
i i
2

R2  1  i 1
n
, R2  1  i 1
2
1 n 
 [ yi  y ]2
n

i 1
  n  f ( xi )  f ( xi )
i 1  i 1 
- Să se realizeze tema 2 pentru 2 exemple semnificative, și pentru fiecare
exemplu, să se compare modelele după criteriul coeficientului de determinare R2.
- Să se calculeze direct, pentru modelul liniar, valorile coeficienților a și b
conform formulelor de calcul și să se compare cu valorile obținute de programul Excel.

Referință: M. Vlada, Informatică aplicată, cap. 2 și online -


http://www.unibuc.ro/prof/vlada_m/docs/2012/ian/16_20_37_19C3-C5-Informatica.pdf

Laborator 10
Analiza datelor experimentale: Modele de aproximare neliniare

Tema 1. Modelul logaritmic f(x)= a +b ln(x)

Dacă pentru variabilele X(cauză), Y(efect) se cunosc n probe (masurări,


observații) prin valorile datelor (xi ,yi), i=1,..., n, modelul logaritmic f(x) = a + b ln(x)
este determinat de coeficienții a și b având următoarele expresii:
354 MARIN VLADA

 n n  n  n 
  yi  (ln xi )2    ln xi   yi ln xi 
a   i 1  i 1  i 1  i 1
2

n
 n

n (ln xi )2    ln xi 
i 1  i 1 
n n n

 yi ln xi  a  ln xi y i  na
b i 1
n
i 1
sau b  i 1
n

 (ln xi )
i 1
2
 ln x
i 1
i

Folosind un exemplu de date pentru variabilele X și Y, să se determine:


a) Modelul și coeficienții a și b prin intermediul programului Excel:
Chart  Add Trendline
b) Direct, valorile coeficienților a și b conform formulelor de mai sus.

Tema 2. Modelul exponențial f(x)= aebx

Dacă pentru variabilele X (cauză), Y (efect) se cunosc n probe (măsurări,


observații) prin valorile datelor (xi ,yi), i=1, ..., n, modelul exponențial f(x) = a ebx este
determinat de coeficienții a și b având următoarele expresii:

n n n

 xi  ln yi  n ( xi ln yi )
b i 1 i 1
2
i 1
și a= ep , unde
 n
 n
  xi   n xi
2

 i 1  i 1

n n n n

 ( xi ln yi )  b xi
2
 ln yi  b xi
sau p 
i 1 i 1
p i 1
n
i 1
n
x
i 1
i

- Folosind un exemplu de date pentru variabilele X și Y, să se determine:


a) Modelul și coeficienții a și b prin intermediul programului Excel: Chart
 Add Trendline
b) Direct, valorile coeficienților a și b, conform formulelor de mai sus.
Referință:
M. Vlada, Informatică aplicată, cap. 2 și online - http://www.unibuc.ro/prof/vlada_m/docs/
2012/ian/16_20_37_19C6-C8-Informatica.pdf
Statistică şi Informatică pentru chimie medicală şi farmaceutică 355

Laborator 11
Operații matriceale, rezolvări de sisteme și ecuații; Editarea structurilor chimice

Tema 1. Calcule matriceal, rezolvarea sistemelor și ecuațiilor

a) Operații cu matrice A   m.n ( R )


- se vor utiliza funcțiile MDETERM(), MINVERSE(), MMULT () Excel .
- În cazul în care destinația unui rezultat este un tablou (array), după scrierea
formulei EXCEL, nu se execută OK, ci se utilizează combinația de taste
CTRL + SHIFT + ENTER.

b) Rezolvarea matriceală a sistemelor liniare

c) Rezolvarea ecuațiilor folosind Goal Seek, Solver  Excel

Exemplu: f(x) = 75, unde f(x) = x2 + sin(x). Pentru a determina o valoare a lui x
când f(x)=75, se va selecta Date  What-if-Analysis Goal Seek, care va afişa fereastra
Goal Seek.
356 MARIN VLADA

Tema 2. Utilizarea programelor pentru editarea formulelor și a reacțiilor chimice.

- Editarea formulelor și a reacțiilor chimice. Produse software: ISIS / Symyx /


ChemSketch / JSDraw / BIOVIO Draw R2/ ChemDraw.

Referință: M. Vlada, Informatică aplicată, cap. 2 și online -


http://www.unibuc.ro/prof/vlada_m/docs/2012/ian/16_20_37_19C9-C10-Informatica.pdf

Utilizarea de software pentru rezolvarea problemelor de chimie. Software pentru


chimie (Chemistry Software)

1. ISIS Draw / Symyx Draw - A chemical structure drawing program for


Windows by MDL Information Systems - https://symyx-draw.en. softonic.
com/, ISIS/Draw - An Introductory Guide - http://bbruner.org/ obc/isis.htm,
Symyx Draw - An Introductory Guide - http://bbruner.org/obc/ symyx.htm ,
Bob Bruner's Chemistry and Molecular Biology Resources - http://bbruner.
org/, http://isis-draw-for-windows.software.informer.com/2.5/, http://mdl-isis-
draw.updatestar.com/en
2. Software for Life Sciences, JSDraw - Scilligence is a leading innovator of
cross-platform, mobile cheminformatics and bioinformatics solutions. Its
informatics tools have been widely adopted by pharmaceutical, biotech, and
chemical industries, universities, research institutes and government agencies.
A Javascript Framework for Cheminformatics and Bioinformatics -
http://www.scilligence.com/web/jsdraw.aspx, http://www.scilligence.com/ web/
home.aspx
3. ChemSketch, ACD/ChemSketch - Freeware is a drawing package that allows
you to draw chemical structures including organics, organometallics,
polymers, and Markush structures - http://www.acdlabs.com/ resources/
freeware/chemsketch/ , http://www.acdlabs.com/resources/freeware/
4. BIOVIA Draw - “Dassault Systèmes BIOVIA provides a scientific
collaborative environment for advanced biological, chemical and materials
experiences that help science- and process-driven companies develop better
products faster and more cost effectively in regulated and non-regulated
environments”. Ref.: http://accelrys.com/about/
5. “ChemDraw is the most robust suite of scientifically intelligent chemistry
productivity tools ensuring the efficient design and visualization of molecules,
reactions, biological entities and pathways in a publication-ready format –
leading to deeper understanding of research outputs for faster decision
making. Ref.: http://www.cambridgesoft.com/.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 357

Exemple de proiecte prezentate de studenți

Exemple de proiecte prezentate de studenții din anul I (2016/2017) la Colocviul de la


cursul de „Statistică Matematică și Informatică”, specializarea Chimie medicală
(înființată în anul 2016), Facultatea de Chimie - Universitatea din București.

Fișa disciplinei (online): https://www.scribd.com/document/339663507/Statistica-si-


Informatica-by-M-Vlada
Teme și aplicații Laborator (online):
https://www.scribd.com/document/342096077/Statistic%C4%83-Informatic%C4%83-
Chimie-Medical%C4%83-Teme-Laborator-by-M-Vlada

Legendă: FCn = Foia de calcul n=1,2,3.

Mihăilescu Răzvan, anul I (chimie medicală)- Proiect prezentare Prezi, https://prezi.


com/view/vvpWa9h5N9FYwSmyvnKP/; Teodoru Dragoș-Vlad, anul I (chimie medicală)
- Proiect prezentare Prezi, https://prezi.com/p/2e-eebatwpxx/; Mărtinaș Delia, anul I
(chimie medicală) - Proiect prezentare Prezi, https://prezi.com/ p/jd41eanrwlv0/;
Olănescu Florentina, anul I (chimie medicală) - Proiect prezentare Prezi, https://prezi.
com/jvoyl3n9smxc/elemente-de-statistica-matematica-si-informatica/; Popa Adrian, anul I
(chimie)- Proiect prezentare Prezi, https://prezi.com/p/sm82mc3nyy8d/.

Evaluarea (Colocviul) la cursul de STATISTICĂ & INFORMATICĂ

A) Întrebări referitoare la subiectele de la Curs + Laborator: erori si propagarea


erorilor, parametrizarea și rezolvarea problemelor (Excel), Indicatori statistici, gruparea în
clase, Eliminarea valorilor aberante, Funcții de probabilitate și funcții de repartiție,
Estimarea și testarea ipotezelor statistice, Metoda celor mai mici pătrate (MCMP),
Modele de aproximare liniare (dreapta de regresie) și neliniare, comparația modelelor
(coeficientul R2), rezolvarea ecuațiilor și a sistemelor, tabelarea funcțiilor și scenarii în
Excel, reprezentarea moleculelor, structurilor și reacțiilor chimice folosind prodesele
software ISIS/ Symyx / ChemSketch / JSDraw / BIOVIO Draw / ChemDraw.

B) Susținerea „face to face” și prezentarea unui Proiect ce va cuprinde (enunțuri


+ rezolvări):
1. FC-1 (foaia de calcul 1) – parametrizarea și rezolvarea unei probleme folosind
Excel. Calcule folosind indicatori statistici;
2. FC-2 (foaia de calcul 2) – Aplicație privind prelucrarea statistică a datelor
experimentale: gruparea în clase/intervale; eliminarea valorilor aberante;
estimarea și testarea ipotezelor statistice;
3. FC-3 (foaia de calcul 3) – o problemă ce necesită modele de aproximare
liniare/neliniare (căutarea din cele 9 modele oferite de Excel);
4. O prezentare PPT sau Prezi, de 7-8 slide-uri, primele să reprezinte o sinteză de
conținut pentru FC-1, FC-2, FC-3, iar ultimele să cuprindă reprezentări pentru
molecule și reacții chimie folosind ISIS / Symyx / ChemSketch / JSDraw /
BIOVIO Draw.
358 MARIN VLADA

Observație. Conținutul digital al proiectului se va descărca prin e-mail la Laboratorul de


informatică.

5.4 Rezultate ale proiectului DEMODEF


Utilizarea statistical software (EpiInfo și SPSS) în analiza informaţiilor din
proiectul DEMODEF „Detecţia şi monitorizarea deficienţelor somatice şi psiho-
comportamentale la copil şi adolescent”.

Proiectul DEMODEF este un proiect de Cercetare-Dezvoltare CEEX


(nr. 106/2006) finanţat de ANCS (Autoritatea Naţională pentru Cercetare Ştiinţifică), care
a avut ca obiectiv general „Detecţia şi monitorizarea deficienţelor somatice şi psiho-
comportamentale la copil şi adolescent (vârsta între 10 - 18 ani), în vederea realizării unui
studiu pilot care să determine modificare percepţiei şi responsabilizarea tuturor
resorturilor implicate în procesul complex de creştere şi dezvoltare a copilului şi
adolescentului, pentru o generaţie de adulţi tineri sanătoşi” [1].
Proiectul propus a fost un studiu în dinamică, pe parcursul a doi ani. Perioada de
vârstă critică la care s-a efectuat acest studiu asigură depistarea cât mai precoce şi
aplicarea cât mai rapidă a tratamentului corectiv, existând un timp optim, propice pentru a
obţine ameliorări notabile. Acesta este şi motivul pentru care perioada de vârsta aleasă a
fost 10-14-18 ani, perioadă în care deficienţele fizice, apar şi se agravează. După
investigaţia iniţială s-au propus programe corective, a căror eficienţă va putea fi
evidenţiată la investigaţiile următoare.
Proiectul a investigat, în dinamică, populaţia şcolară aflată în perioada de
creştere, perioadă în care valorile antropometrice ale individului, se modifică în strânsă
legatură cu vârsta şi cu deficienţele constatate. S-a studiat elementele semnificative legate
de creşterea şi dezvoltarea locomotorie şi psiho-comportamentală, pentru identificarea
tulburărilor funcţionale şi ale deficienţelor. Astfel, la nivelul aparatului locomotor s-a
urmări deficienţele cele mai importante ale: coloanei vertebrale, cutiei toracice, soldului,
genunchiului şi labei piciorului. Din punct de vedere psiho-medical s-au cercetat
următoarele grupe de parametri: cognitivi, emoţionali, comportamentali, patologici şi de
climat socio-familial, nivelul proceselor cognitive (atenţie, memorie, inteligenţă),
tulburări afective (anxietate, depresie, labilitate emoţională), tulburări patologice (ticuri,
tulburări de vorbire, tulburări psihosomatice, de somn şi de tip asteniform), tulburări de
personalitate, tulburări comportamentale cu prejudiciu personal (exemplu, fumatul) şi cu
caracter antisocial (furt, vagabondaj, violenţă, diverse acte delictuale).
Datele obţinute prin acest studiu au permis elaborarea unor programe, atât cu
caracter profilactic, cât şi terapeutic, de aplicat pe scară largă la această grupă de
populaţie, în vederea optimizării stării de sănătate şi asigurării unei dezvoltări cât mai
armonioase a copiilor şi adolescenţilor.
Proiectul a fost realizat de şase parteneri (universităţi, institute şi unităţi de
cercetare-dezvoltare) şi coordonat ştiinţific de prof. dr. Adriana Sarah Nica,
Universitatea de Medicină şi Farmacie „Carol Davila” Bucureşti [1,2]. Noutatea
proiectului constă în încercarea de a grupa o serie de parametri ai dezvoltării psiho-
comportamentale a copilului, într-un studiu corelat cu inter-relaţia acestor copii cu
Statistică şi Informatică pentru chimie medicală şi farmaceutică 359

principalii reprezentanţi ai mediului familial şi şcolar (profesori, colegi). Datele obţinute


în urma acestor evaluări au fost organizate într-o bază de date utilizată la o analiză
statistică detaliată, care determină variaţia fiecărui parametru luat în studiu şi posibila
corelaţie dintre deficienţele analizate. De asemenea, faţă de cercetările anterioare pe
această temă, studiul se realizează pe un eşantion de aproximativ 1000 de subiecţi.
Pe plan intern, în anul 2001, s-a realizat o investigaţie (INMF şi CCEFS) pe un lot
de 600 de elevi (14-18 ani), iar pe plan internaţional, în anul 2005 s-a realizat o investigaţie
(Zwaannswjk şi colaboratori) pe un lot de 2449 copii şi adolescenţi (4-17 ani). Mai recent,
în S.U.A., s-a realizat o investigaţie pe un lot de 9878 elevi, aceasta fiind incompletă,
deoarece s-au utilizat doar răspunsurile părinţilor pentru unele prelucrări statistice, în
cazul chestionarului SDQ (Strengths and Difficulties Questionnaire) [1]

Crearea chestionarelor şi introducerea


datelor

Conform etapelor cercetării şi


planului de realizare ale proiectului au fost
definite următoarele modele:
 Model de investigaţie clinico-
funcţională, antropometrică şi
psiho-comportamentală, la copii
şi la adolescenţi (vârsta 10-18 ani);
 Model de evaluare a deficienţelor clinico-functionale, antropomentrice şi
psiho-comportamentală, la copii şi la adolescenţi (vârsta 10-18 ani);
În cazul investigaţiilor psiho-comportamentale s-a utilizat referinţa: Goodman R.,
Renfrew D., Mullick M. (2000), Predicting type of psychiatric disorder from Strengths and
Difficulties Questionnaire (SDQ) scores in child mental health clinics in London and
Dhaka. European Child and Adolescent Psychiatry, 9, 129-134. Chestionarul şi
algoritmul SDQ calculează scoruri pentru: emotional symptoms (tulburări emoţionale);
conduct problems (probleme de conduită); hyperactivity scale (hiperactivitate); peer
problems scale (probleme de relaţionare); prosocial scale (comportament prosocial); total
difficulties score (scor total de dificultăţi); impact scor (scorul de impact – evaluează
impactul generat de disfuncţionalitate socială şi de dificultăţile în general suferite de
copil) [3,4].
SDQ analizează răspunsurile date de elev, diriginte şi părinte corespunzătoare
aceluiaşi set de intrebări. Răspunsurile la aceste întrebări au determinat un număr de 25
de variabile, împreună cu valorile luate de acestea. Algoritmul SDQ oferă şi calculul
predictiv, care utilizează scorurile generate de răspunsurile date de elev, diriginte şi
părinte. Sunt analizate următoarele categorii de dificultăţi: dificultăţi de comportament;
dificultăţi emoţionale; dificultăţi hiperactivităţi; dificultăţi psihiatrice.

Utilizarea statistical software Epi Info

Răspunsurile din chestionare au fost preluate prin intermediul fişierelor de tip


chestionar (view-uri) create pentru introducerea datelor cu ajutorul programului Epi Info.
Acesta este un program specific prelucrărilor statistice, utilizat iniţiat pentru
360 MARIN VLADA

epidemiologie de catre CDC (Centers for Disease Control and Prevention, S.U.A.) [5].
Fişierele create de acest program sunt compatibile cu Microsoft Access, SQL and ODBC
databases, Visual Basiv 6.0, WWW, HTML. „With Epi Info™ and a personal computer,
epidemiologists and other public health and medical professionals can rapidly develop a
questionnaire or form, customize the data entry process, and enter and analyze data.
Epidemiologic statistics, tables, graphs, and maps are produced with simple commands
such as READ, FREQ, LIST, TABLES, GRAPH, and MAP. Epi Map displays geographic
maps with data from Epi Info™.” [5].
Epi Info este un pachet de programe destinat prelucrării de date organizate sub
formă de chestionare şi pentru sistematizarea rezultatelor studiilor pentru a fi incluse în
comunicări şi rapoarte. Conceput, în primul rând pentru aplicaţii în epidemiologie, Epi
Info poate fi folosit cu succes în prelucrarea datelor din domeniul medical, şi din afara
acestuia, pachetul incluzând facilităţi de gestiune a datelor şi de statistică de tipul celor
oferite de programele SAS, SPSS [7,8], facilităţi cuprinse într-un singur sistem al cărui
avantaj principal, este faptul că este permisă copierea şi libera distribuire [6]. Detalii şi
indicaţii de utilizare pot fi găsite în lucrarea [6].
Principalele comenzi / componente ale programului Epi Info sunt următoarele:
 Make View, care este un editor de text folosit pentru a defini câmpurile
utilizate în introducerea datelor, pe una sau mai multe pagini ale unui
chestionar (View);
 Enter Data, care afişează chestionarele construite cu Make View, controlează
procesul de introducere a datelor utilizând setările şi codurile specificate în
Make View; are şi posibilităţi de căutare a înregistrărilor;
 Analyze Data, care este folosit pentru analizarea datelor înregistrate în
fişierele create nu numai cu Epi Info, dar şi cu dBase, FoxPro, Excel etc.
Aceste fişiere pot conţine liste, frecvenţe, tabele, diagrame, date specifice
studiilor epidemiologice;
 Create Maps, care este un instrument folosit pentru crearea hărţilor
epidemiologice;
 Create Reports, care este folosit pentru generarea rapoartelor.
Pentru crearea unui fişier-chestionar se va folosi Make View. Se vor utiliza
comenzile: FileNewFile name (numele bazei de date: nume_EPI)OpenName the
View („Chest1” ca nume dat chestionarului). În pagina din partea stângă se găsesc trei
opţiuni referitoare la gestiunea paginilor din chestionar (Add Page – adăugarea unei noi
pagini la sfârşitul celor deja existente, Insert Page – adăugarea unei pagini noi între două
deja existente, Delete Page – eliminarea paginii curente) precum şi comanda Program
care face posibilă programarea anumitor operaţii de verificare, ducând astfel la evitarea
erorilor,care pot apărea la introducerea datelor [6].
Introducerea de câmpuri în pagina curentă a chestionarului, conform indicaţiei
afişate, se efectuează cu un clic pe butonul din dreapta al mouse-lui, în poziţia în care se
doreşte apariţia câmpului respectiv (pentru fixarea poziţiei este utilă grila). Ca urmare, va
apărea caseta de dialog Field Definition, în care se vor introduce caracteristicile
câmpului: numele, tipul, dimensiunea, limitările valorilor, codificări, valorile legale etc.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 361

Fig. 234. Un fişier-chestionar şi caseta de dialog Field Definition

Introducerea datelor se poate realiza direct din meniul File, acționând Enter Data.
Alte posibilităţi, după părăsirea modulului Make View, din pagina principală Epi Info, fie
se alege direct modulul Enter Data, fie se comandă Enter Data din meniul Programs. În
acest caz, se deschide chestionarul creat, alegându-se proiectul şi view-ul corespunzător.
Se vor introduce iniţial cel puţin 4 înregistrări.

Fig. 235. Chestionarul pentru fiecare fișă

Pentru a efectua analiza statistică primară a datelor se foloseşte modulul Analyze


Data. În cadrul acestui modul se folosesc mai multe comenzi care se pot alege din
fereastra de comenzi, din partea stângă. Rezultatele execuţiei comenzilor sunt afişate în
fereastra din dreapta-sus (intitulată Analysis Output). În fereastra din dreapta jos
(intitulată Program Editor) se vor afişa comenzile/seturile de comenzi care au fost
executate anterior; de asemenea, se pot introduce noi comenzi, în regim de linie de
comandă. Comenzile pe care le putem alege sunt grupate, în fereastra din stânga, în
câteva grupe. Astfel, distingem comenzile de lucru cu datele (grupate în „Data”), cele ce
operează asupra variabilelor (grupate evident în „Variables”), comenzile de selecţie
(grupate în „Select/If”), comenzile de analiză statistică primară (grupate în „Statistics”) etc.
362 MARIN VLADA

Fig. 236. Foile de calcul Excel corespunzătoare algoritmului SDQ

Read (Import) este comanda utilizată la începutul oricărei sesiuni de lucru, în


modulul Analysis. Este folosită pentru preluarea datelor dintr-un fişier, date ce vor fi
folosite pentru prelucrările ulterioare (până la o nouă comandă Read). Formatul implicit
al datelor este Epi 2000, dar acesta poate fi schimbat, astfel încât este posibil să se preia
date şi din alte tipuri de fişiere (de exemplu diverse versiuni de Excel, diverse versiuni de
FoxPro, Paradox sau chiar documente hipertext). Programul Epi Info este însoţit de mai
multe „proiecte” pentru exemplificare şi auto-învăţare, dintre care cel mai simplu este
Sample.mdb.
Pentru analiza și calculele statistice asupra datelor din fişiere, se utilizează grupul
„Statistic” ce oferă comenzile List, Frequencies, Means, Graph. Comanda Graph, din
grupul „Statistics”, este folosită pentru a realiza reprezentări grafice ale variabilelor dintr-un
fişier de date.
În cadrul proiectului DEMODEF, pentru chestionarul SDQ, s-au creat trei
chestionare-fişier, conform răspunsurilor primite de la elev, diriginte, respectiv părinte (în
total pentru fiecare chestionar s-au creat 915 înregistrări). Aceste informaţii din fişiere
s-au folosit pentru calcule statistice realizate cu programele Epi Info, SAS, SPSS şi Excel.
În cazul chestionarului SDQ a fost nevoie de conversia fişierelor în baze de date Excel.
Răspunsurile obţinute de la elevi, diriginți, respectiv părinți, s-au stocat în baze de date
separate, şi anume, în foile de calcul corespunzătoare acestor informaţii.

Rezultate şi analiza investigaţiilor

În vederea studierii fenomenului obezității, și folosind o bază de date în care s-au


înregistrat 464 de măsurări, privind greutatea (masa corporală) elevilor (fete și băieți),
s-au obținut următoarele rezultate.
Statistică şi Informatică pentru chimie medicală şi farmaceutică 363

Tabelul 40. Tabelul rezultatelor privind studiul obezității


Nr.
Normal 349
Supraponderal 59
ELEVI Subponderal 18
Obez 38
Nr. Elevi 464
Normal 198
Supraponderal 20
FETE Subponderal 11
Obez 10
Fete 239
Normal 151
Supraponderal 39
BĂIEȚI Subponderal 7
Obez 28
Băieți 225

ELEVI: FETE + BAIETI

Obez; 38; 8%
Subpond; 18; 4%

Suprapond; 59;
13%
Normal
Suprapond
Subpond
Obez

Normal; 349; 75%

Fig. 237. Procentele celor 4 stări privind masa corporală

Dificultăţi de comportament

Calculul predictiv. Algoritmul SDQ oferă şi calculul predictiv ce utilizează


scorurile generate de răspunsurile date de elev, diriginte şi părinte. Sunt analizate
următoarele categorii de dificultăţi: dificultăţi de comportament; dificultăţi emoţionale;
dificultăţi hiperactivităţi; dificultăţi psihiatrice.
364 MARIN VLADA

Pe baza volorilor obţinute din răspunsurile stocate în bazele de date, conform


algoritmului SDQ, s-au generat scorurile corespunzătoare celor 7 parametri investigaţi.
Rezultatele acestor calcule sunt prezentate în tabelele următoare. Ca exemplificare, pentru
interpretarea lor în fig. 238 sunt prezentate graficele corespunzătoare „scorului total de
dificultăţi”.

Răspunsuri Elevi
Stare_ Stare_ Stare_ Stare_ Stare_ Stare_ Stare_
dif em Con hyp Pee soc imp
Normal 758 795 723 788 761 719 503
La limită 108 55 97 67 121 61 55
Anormal 49 65 95 60 33 135 357

Răspunsuri Diriginţi
Stare_ Stare_ Stare_ Stare_ Stare_ Stare_ Stare_
dif em con hyp Pee soc imp
Normal 652 784 718 793 704 407 771
La limită 140 70 56 60 95 142 39
Anormal 123 61 141 62 116 366 105

Răspunsuri Părinţi
Stare_ Stare_ Stare_ Stare_ Stare_ Stare_ Stare_
dif em con hyp Pee soc imp
Normal 716 680 724 798 656 504 713
La limită 75 79 57 68 82 53 64
Anormal 124 156 134 49 177 358 138
Nr. Elevi 915 915 915 915 915 915 915

Total DIFFICUTIES

Anormal, 49,
5%

La limita,
108, 12%

Normal, 758,
83%

Normal La limita Anormal


Statistică şi Informatică pentru chimie medicală şi farmaceutică 365

Stare_dif

800

700

600

500

400

300

200

100

0
Normal La limita Anormal

elevi parinti diriginti

Fig. 238. Graficele pentru „Scorul total de dificultăţi”

Pe baza scorurilor obţinute din răspunsurile date de elev, diriginte şi părinte, s-a
implementat şi calculul predictiv dat de algoritmul SDQ, şi care calculează valorile
pentru cele 4 categorii de dificultăţi: dificultăţi de comportament; dificultăţi emoţionale;
dificultăţi hiperactivităţi; dificultăţi psihiatrice.

Formulele care calculează aceste valori sunt următoarele:

=IF(OR(AND(F4=2,E4=2),AND(F4=2,E4=1)),2,IF(OR(AND(F4=0,E4=1),AND(F4=1,
E4=0),AND(F4=1,E4=1),AND(F4=2,E4=2)),1,IF(OR(C4>=0,D4>=0,E4>=0),0,3)))

=IF(OR(AND(elevi!AT4>=6,elevi!BF4>=2),AND(profesori!AI4>=4,profesori!AU4>=2)
,AND(parinti!AI4>=5,parinti!AU4>=2)),2,IF(OR(parinti!AI4>=4,profesori!AI4>=3,ele
vi!AT4>=5),1,IF(OR(parinti!AI4>=0,profesori!AI4>=0,elevi!AT4>=0),0,3)))

=IF(OR(AND(parinti!AH4>=5,parinti!AU4>=1),AND(profesori!AH4>=5,profesori!AU
4>=1),AND(elevi!AS4>=6,elevi!BF4>=1)),1,IF(K4>=1,2,IF(OR(AND(K4=1,H4=2),AN
D(K4=1,G4=2)),1,IF(OR(parinti!AH4>=0,profesori!AH4>=0,elevi!AS4>=0),0,3))))

=IF(OR(I4>=2,,H4>=2,G4>=2),2,IF(OR(I4>=1,H4>=1,G4>=1),1,IF(OR(I4>=0,H4>
=0,G4>=0),0,3)))
366 MARIN VLADA
Statistică şi Informatică pentru chimie medicală şi farmaceutică 367

Fig. 239. Graficele pentru calculul predictiv (4 categorii de dificultăţi)

Referințe
[1] Proiectul DEMODEF, http://demodef.googlepages.com/, accesare 2017.
[2] Universitatea de Medicină şi Farmacie „Carol Davila” Bucureşti, http://umfcd.ro, accesare 2017.
[3] Goodman R, Renfrew D, Mullick M, Predicting type of psychiatric disorder from Strengths
and Difficulties Questionnaire (SDQ) scores in child mental health clinics in London and Dhaka,
European Child and Adolescent Psychiatry, 9, pp.129-134, 2000.
[4] SDQ (Strengths and Difficulties Questionnaire), http://www.sdqinfo.com/, accesare 2017
[5] Epi Info – CDC, www.cdc.gov/epiinfo/, accesare 2017.
[6] Tiberiu Spircu, Informatică Medicală şi Biostatisctică, Editura UMF „Carol Davila”,
Bucureşti, 2006.
[7] SAS - Predictive analytics software, http://www.sas.com/, accesare 2017.
[8] SPSS - Statistical Package for the Social Sciences, http://www.spss.com/, accesare 2017.
Bibliografie generală
1. Abdul Rahman Al-Mousa, Conceptul de presiune de perfuzie oculară și identificarea acesteia
ca factor de risc în dezvoltarea și progresul glaucomului, Teză de doctorat, Universitatea de
Medicină şi Farmacie „Gr.T.Popa” Iaşi, 2012.
http://www.umfiasi.ro/ScoalaDoctorala/TezeDoctorat/Teze%20Doctorat/Rezumat%20ABDU
L%20RAHMAN%20AL%20MOUSA.pdf
2. A. Adăscăliței, M. Vlada, Didactică cu programe software educaţionale, Blended-Learning și
Moodle, Prima Conferinţă Naţională Moodle în Educaţie, 16 mai 2015, Liceul Tehnologic „V.
Sav”, ISJ Roman.
3. S. D. Anghel, Fizica plasmei şi aplicaţii, Universitatea „Babeș Bolyai” Cluj-Napoca.
http://www.phys.ubbcluj.ro/~anghels/teaching/Plasma/Capitole_curs/CAP3.pdf
4. Ştefan Balint, Loredana Tănasie, Modele clasice în ştiinţe, Notiţe de curs Master. Informatică
aplicată în ştiinţe, tehnică şi economie, Universitatea de Vest din Timisoara, 2015.
5. Ştefan Balint, Lecții de mecanică teoretică. Mișcarea punctului material, Tipografia
Universității de Vest din Timișoara, 1995.
6. Ștefan Balint, Loredana Tănasie, Statistică – Notițe de curs, Universitatea de Vest din
Timișoara, Statistica.pdf
7. Gabriela Balan, Aspecte clinice, terapeutice şi prognostice ale sindromului ascitic în ciroza
hepatică, Teză de doctorat, UMF Iasi, 2011, http://www.umfiasi.ro/ScoalaDoctorala/
TezeDoctorat/Teze%20Doctorat/Rezumat%20Balan%20Gabriela.pdf
8. Kai Oliver Arras, An Introduction To Error Propagation, 1998, http://www.nada.kth.se/~kai-
a/papers/arrasTR-9801-R3.pdf
9. Lucian Boiculese, Biostatistică teme, Şcoala doctorală, Universitatea de Medicină şi Farmacie
din Iaşi
10. L. Boiculese, C. Dascălu, G. Dimitriu, M. Moscalu, A. Doloca, Metode Descriptive și
Elemente de Analiză Statistica a datelor medicale. Exemple practice în Excel și Access,
Editura Performantica, Iași, 2009
11. David W. A. Bourne, Pharmacokinetics and Biopharmaceutics, (Java Applets - On line
Graphs, JavaScript Calculators Online), http://www.boomer.org/c/p1/
12. Sorana D. Bolboacă, Informatică medicală și Biostatistică. Estimarea parametrilor statistici,
prezentare ppt, Universitatea de Medicină și Farmacie, Cluj-Napoca, http://sorana.
academicdirect.ro/pages/doc/MV2012/MVRom01.pdf, http://www.info.umfcluj.ro/ro/did-ro/
biostat-ro/mg1ro-ro/itemlist/category/203-cursuri2, http://www.info.umfcluj.ro/ro/component/
k2/item/790-curs-7-introducere-in-statistica-medicala
13. Sorana D. Bolboacă, Informatică medicală și Biostatistică. Estimarea parametrilor statistici,
Universitatea de Medicină și Farmacie, Cluj-Napoca.
14. Marius Bulgaru, Prelucrarea statistică a șirurilor de date. Eliminarea valorilor aberante,
Universitatea Tehnică Cluj-Napoca, www.cermi.utcluj.ro/doc/Lucr_03.pdf
15. Marius Bulgaru, Prelucrarea statistică a șirurilor de date. Eliminarea valorilor aberante,
Universitatea Tehnică Cluj-Napoca, www.cermi.utcluj.ro/doc/Lucr_05.pdf
16. Nicoleta Breaz, Marian Crăciun, Păstorel Gaşpar,. Maria Miroiu, Iuliana Paraschiv-Munteanu.
Modelarea.matematică prin Matlab, 2011, http://www.edumanager.ro/community/ documente/
probabilitati%20si%20statistica.pdf
17. David W. A. Bourne, Mathematical modeling of pharmacokinetic data, Technomic Publishing
Co., ISBN 1-56676-204-9, 1995.
18. Achimas Cadariu A., Metodologia cercetării ştiinţifice medicale, Ed. Universitară „Iuliu
Haţieganu”, Cluj Napoca, http://www.info.umfcluj.ro/, 1999.
19. Lucia Căbulea, Nicoleta Breaz, Interpretarea statistică a informaţiilor. Elememnte de data
mining şi prognoză, Modul de instruire nr.7, Universitatea „1 decembrie 1918” Alba Iulia.
370 MARIN VLADA

20. Valentin Clocotici, Dicţionar explicativ de statistică (online), Universitatea “A.I.Cuza” Iaşi,
http://profs.info.uaic.ro/~val/statistica/StatGloss.htm
21. CNIV and ICVL Projects, www.cniv.ro (romanian project), www.icvl.eu (international
project)
22. CNIV, http://www.cniv.ro/2009/elearning
23. CGAL – Computational Geometry Algorithms Library, http://www.cgal.org/
24. Leonard Mihaly Cozmuta, Prelucrarea datelor experimentale, http://chimie-biologie.ubm.ro/
Cursuri%20on-line/MIHALY%20COZMUTA%20LEONARD/Prelucrarea%
20datelor%20experimentale.pdf
25. Emil Dragomirescu, Dana Vlădoiu (2008), Manual de instruire a profesorilor pentru
utilizarea platformelor de eLearning, Editura Litera Internaţional, Bucureşti, 2008.
26. Eppstein D., http://www.ics.uci.edu/~eppstein/index.html
27. Fellows, N. J. (1994). „A window into thinking: Using student writing to understand conceptual
change in science learning”. Journal of Research in Science Teaching, 31(9), 985-1001
28. R. Faria, V. Alves, F. Ferraz, J. Neves, H. Vicente, J. Neves, „A Case Base Approach to
Cardiovascular Diseases using Chest X-ray Image Analysis”, în Proceedings of ICAART 2017
- 9th International Conference on Agents and Artificial Intelligence - Editors Jaap van den
Herik, Ana Paula Rocha and Joaquim Filipe, vol. 2, 24-26 feb. 2017, Porto-Portugal, pp. 266-274
29. Fernandes, F., Vicente, H., Abelha, A., Machado, J., Novais, P., Neves J., 2015. „Artificial
Neural Networks in DiaCbetes Control”, în Proceedings of the 2015, Science and Information
Conference – SAI 2015, 362-370.
30. Blanco, X., Rodríguez, S., Corchado, J.M., Zato, C., 2013. „Case-based reasoning applied to
medical diagnosis and treatment”, în Distributed Computing and Artificial Intelligence –
Advances in Intelligent Systems and Computing, Volume 217, 137-146.
31. Figueiredo, M., Esteves, L., Neves, J., Vicente, H., 2016. „A data mining approach to study
the impact of the methodology followed in chemistry lab classes on the weight attributed by
the students to the lab work on learning and motivation”. Chemistry Education Research and
Practice, 17: 156-171.
32. Daniel Ford and Josh Batson, Languages of the World (Wide Web), News on Google
Research, 2011, https://research.googleblog.com/2011/07/languages-of-world-wide-web.html,
accesat 2016
33. Gaskins, I. W., Guthrie, J. T., Satlow, E., Ostertag, J., Byrne, J. & Connor, B. (1994).
Integrating instruction of science, reading, and writing: Goals, teacher development, and
assessment. Journal of Research in Science Teaching, 31(9), 1039-1056
34. Goodman, J. E. and O'Rourke, J., eds., Handbook of Discrete and Computational Geometry
(2nd Ed.). CRC Press, 2004
35. Anderson Greg, How to write a paper in Scientific Journal style and format, Bates College
Department of Biology, http://www.bates.edu/~ganderso/, 2009, http://abacus.bates.edu/~
ganderso/biology/resources/writing/HTWtoc.html
36. Huth J., Brogan M., Dancik B, Kommedahl T., Nadziejka D., Robinson P., Swanson W. 1994.
Scientific format and style: The CBE manual for authors, editors, and publishers. Cambridge:
Cambridge University Press
37. Huth J., Brogan M., Dancik B., Kommedahl T., Nadziejka D., Robinson P., Swanson W.
1994. Scientific format and style: The CBE manual for authors, editors, and publishers.
Cambridge: Cambridge University Press.
38. Sorin Istrail, http://cs.brown.edu/~sorin/pdfs/venter2.pdf
39. Dumitru Luca, Cristina Stan, Mecanică Clasică, Universitatea Al. I. Cuza Iași, Universitatea
Politehnica București, 2007.
40. James Jones, http://people.richland.edu/james/lecture/m116/logs/models.html
41. Peter Keusch, University of Regensburg, http://www.demochem.de/eyr-e.htm
Statistică şi Informatică pentru chimie medicală şi farmaceutică 371

42. Cornelia Mesaroş, Studii prin metode atomice şi moleculare a unor probe biologice, Teză de
doctorat, Universitatea „Babes Bolyai” Cluj-Napoca, Facultatea de Fizica, 2010,http://
doctorat.ubbcluj.ro/sustinerea_publica/rezumate/2010/fizica/MESAROS_CORNELIA_RO.pdf
43. Mihai Miron, Liliana Miron, Măsurări electrice și electronice, Brașov. 2003, http://www.
afahc.ro/invatamant/electro/mee.pdf
44. Constantin Mircioiu, Roxana Colette Sandulovici, Statistica aplicată în farmacie şi studii
clinice, Ediţia II, Editura Universitară „Carol Davila” Bucureşti, 2009.
45. Dalia Simona Miron, Constantin Mircioiu, Seminarii de matematici aplicate în Farmacie,
Editura Tehnoplast, Bucureşti 2010.
46. Saeid Nourian, http://calculator.runiter.com/graphing-calculator/
47. Rigas Nikolaos, Studiu clinic asupra eficienţei terapeutice a unor inhibitori de dipeptidil
peptidază 4, în diabetul zaharat tip 2, Teză de doctorat, UMF Craiova, 2012
48. Joseph W. Ochterski, Thermochemistry in Gaussian, http://www.gaussian.com/g_whitepap/
thermo.htm
49. Marjorie Olmstead, http://courses.washington.edu/phys431/index.php
50. D. Moore and G. McCabe, Introduction to the Practice of Statistics, W. H. Freeman and Co.,
London, 2003.
51. A. Tihonov, A.A. Samarsk, Ecuațiile Fizicii Matematice, Editura Tehnică, 1956.
52. Traian Petrișor, Curs de fizică, Universitatea Tehnică Cluj-Napoca, http://www.msl.utcluj.ro/
Curs_Fizica_I.html, 2011
53. Teoria haosului, https://ro.wikipedia.org/wiki/Teoria_haosului
54. Modele matematice în meteorologie, http://www.ijmet.org/wp-content/uploads/2014/09/361. pdf
55. Flavian Ştefan Rădulescu, Studiul farmacocineticii medicamentelor cu metaboliţi activi prin
analiza compartimentală şi prin modele de farmacocinetică fiziologică, Teză de doctorat
(coord. şt.: Prof. Dr. Constantin Mircioiu), Universitatea de Medicină şi Farmacie „Carol
Davila” Bucureşti, 2007.
56. Day Robert A., How to Write & Publish a Scientific Paper, 5th edition, Orynx Press, 1998.
57. O'Rourke, J., Computational Geometry in C (2nd Ed.). Cambridge University Press. ISBN
0-521-64976-5, 1998
58. Online 3D, http://www.livephysics.com/ptools/online-3d-function-grapher.php
59. Anca Mihaela Stupu, Studii privind posibilităţile de diagnostic şi tratament în patologia
parodontală la tânăr (copil și adolescent), Teză de doctorat, UMF Iași, 2012,
http://www.umfiasi.ro/ScoalaDoctorala/TezeDoctorat/Teze%20Doctorat/Rezumat%20STUPU
%20ANCA%20MIHAELA.pdf
60. Peter J. Steinbach, Two-Dimensional Distributions of Activation Enthalpy and Entropy from
Kinetics by the Maximum Entropy Method, Biophysical Journal Volume 70 March 1996,
pp. 1521-1528, http://www.ncbi.nlm.nih.gov/pmc/articles/PMC1225079/pdf/biophysj00049-
0431.pdf
61. Sabina Ştefan, Fizica atmosferei, vremea şi clima, Editura Universitatii din Bucuresti, 2004,
425 pag., ISBN 973-575-961-6 (Premiul „Ştefan Hepites” al Academiei Romane),
http://www.fizica.net/Fizica/Admitere/Master/doc/2009/StudiuFAPPM.pdf
62. Sabina Ştefan, N. Rîmbu, Dinamica Atmosferei – Culegere de probleme, Editura Universităţii
din Bucureşti, 250 pag. ISBN 973-575-379-0
63. Scilligence: Software for Life Science: http://www.olncloud.com/oln/jsdraw/Demo.htm,
http://www.scilligence.com/web/jsdrawapis.aspx
64. Vlada, Marin, Informatică aplicată. Modele de aproximare, software şi aplicaţii, Editura
Universităţii din Bucureşti, print, ISBN 778-606-16-0190-5, 257 pag., 2012.
65. Vlada, Marin, New Technologies in Education and Research. Models and Methodologies,
Technologies and Software Solutions, Lambert Academic Publishing, ISBN 978-3-8433-
6391-4, 260 pag., 2010.
372 MARIN VLADA

66. Vlada, Marin, „Contribuția acad. Gheorghe Mihoc (1906-1981) la dezvoltarea școlii
matematice românești – 110 ani de la naștere”, Academia Română, revista Diviziei de Istoria
Științei a CRIFST al Academiei Române, Comitetul Român de Istoria şi Filosofia Ştiinţei şi
Tehnicii (CRIFST), Studii şi comunicări / DIS, vol. IX, 2016.
67. Vlada, Marin, Informatică, Universitatea din Bucureşti, Ed. Ars Docendi, Bucureşti, 1999.
68. Vlada, Marin, „Concepul de algoritm – abordare modernă”, în Gazeta de informatică, vol.
13/2 şi 3, pp. 25-30, pp. 35-39, Agora, Cluj Napoca, 2003.
69. Vlada, Marin, „Matematica pentru elevi, abstractă sau utilă?”, în Lucrările celei de-a XI-a
Conferință de Învățământ Virtual, Editura Universității din București, ISSN 1842-4708,
2013, pp. 107-114.
70. Vlada, Marin, O. Istrate, „Concursul „Didactica Nova” – curriculum academic inovativ”, în
Lucrările celei de-a XI-a Conferință de Învățământ Virtual, Editura Universității din
București, ISSN 1842-4708, 2013, pp. 19-24
71. Vlada, Marin, „Structuri şi obiecte matematice cu aplicaţii în chimie şi fizică”, în Lucrările
celei de-a XI-a Conferință de Învățământ Virtual, Editura Universității din București, ISSN
1842-4708, 2013, pp. 102-106
72. Vlada, Marin, „Modele neliniare. Teorie şi aplicaţii”, în Lucrările celei de-a X-a Conferință
de Învățământ Virtual, Editura Universității din București, CNIV 2012, ISSN 1842-4708,
2012, pp. 57-65.
73. M. Vlada, „Noi abordări în rezolvarea problemelor – exemple”, în Lucrarile celei de-a XIV-a
Conferinta de Invatamant Virtual, VIRTUAL LEARNING – VIRTUAL REALITY, MODELS &
METHODOLOGIES, TECHNOLOGIES, SOFTWARE SOLUTIONS, 29 octombrie 2016,
Editura Universitatii din Bucuresti, ISSN 1842-4708, pag. 49-57, 2016, http://c3.icvl.eu/
papers2016/cniv/documente/pdf/sectiuneaA/sectiuneaA_lucrarea4.pdf
74. Vlada, Marin, „Discipolii acad. Grigore C. Moisil și pionieri ai informaticii românești”, în
Lucrarile celei de-a XIV-a Conferinta de Invatamant Virtual, VIRTUAL LEARNING –
VIRTUAL REALITY, MODELS & METHODOLOGIES, TECHNOLOGIES, SOFTWARE
SOLUTIONS, 29 octombrie 2016, Editura Universitatii din Bucuresti, ISSN 1842-4708, pp.
19-33, http://c3.icvl.eu/papers2016/cniv/documente/pdf/sectiuneaA/sectiuneaA_lucrarea1.pdf
75. Vlada, Marin, „Manuale digitale, o premieră în România – despre confuzii şi clarificări”, în
Lucrarile celei de-a XII-a Conferinta de Invatamant Virtual, VIRTUAL LEARNING –
VIRTUAL REALITY, MODELS & METHODOLOGIES, TECHNOLOGIES, SOFTWARE
SOLUTIONS, 24-25 octombrie 2014, Editura Universitatii din Bucuresti, ISSN 1842-4708,
pp. 37-44, 2014, http://www.c3.cniv.ro
76. Vlada, Marin, Adascalitei Adrian, „Computers: as digital facilities for scientific research and
as tools for enhanced learning in higher education”, în The 10th International Scientific
Conference eLearning and software for Education, Bucharest, Advanced Distributed Learning
Department, „Carol I” National Defense University, eLSE 2014, Bucharest, April 24-25,
2014, volume 2, Editura Universitatii Nationale de Aparare „Carol I” (ISSN: 2066-026X print
2066-8821 online), pp. 537-544, 2014, www.elseconference.eu, http://adl.unap.ro
77. Vlada, Marin, „The New Culture of Learning – Thinking is Evolution of Learning Over
Time”, în The 11th International Scientific Conference eLearning and software for
Education, Bucharest, Advanced Distributed Learning Department, „Carol I” National
Defense University, eLSE 2014, Bucharest, April 23-24, 2015, volume 1, Editura Universitatii
Nationale de Aparare „Carol I” (ISSN: 2066-026X print 2066-8821 online), pp. 360-367,
2014, www.elseconference.eu, http://adl.unap.ro
78. Vlada, Marin, „Nonlinear Models. Theory, Software and Applications”, în The 9th
International Scientific Conference eLearning and software for Education, Bucharest,
Advanced Distributed Learning Department, „Carol I” National Defense University, eLSE
2013 (www.elseconference.eu/, http://adl.unap.ro), Bucharest, April 25-26, 2013, Editura
Statistică şi Informatică pentru chimie medicală şi farmaceutică 373

Universitatii Nationale de Aparare „Carol I” (ISSN: 2066-026X print 2066-8821 online),


pp. 494-501, 2013.
79. Marin Vlada, Constantin Cucoş, Adrian Adăscăliţei, Ioan Rusu, Ionuţ Nica, „Utilizarea
Mediilor Virtuale de Instruire în Universităţi”, în Lucrarile celei de-a XII-a Conferinta de
Invatamant Virtual, VIRTUAL LEARNING – VIRTUAL REALITY, MODELS &
METHODOLOGIES, TECHNOLOGIES, SOFTWARE SOLUTIONS, 24-25 octombrie 2014,
Editura Universitatii din Bucuresti, ISSN 1842-4708, pp. 79-87, 2014, http://www.c3.cniv.ro
80. Marin Vlada, D.M. Popovici, „Realitatea Virtuală (Virtual Reality), tehnologie modernă a
informaticii aplicate”, în CNIV-2004, Noi tehnologii de E-Learning, Conferinţa Naţională de
Învăţământ Virtual, Software Educaţional, Ediţia a II-a, 29-31 octombrie 2004, Editura
Universităţii din Bucureşti, 2004.
81. Vlada, Marin (2009) „Utilizarea Tehnologiilor eLearning: cele mai importante 10 initiative şi
proiecte din Romania”, în Elearning.Romania. Bucharest: TEHNE – Centre for Innovation in
Education. Available online: http://www.elearning.ro.
82. Vlada, Marin, Adăscăliţei, A. and Jugureanu, Radu (2009), „Trends of eLearning: Learning –
Knowledge – Development”, în eLSE 2009 – The 5th International Scientific Conference
„eLearning and Software for Education”, Bucharest, April 09-10, 2009, „Carol I” National
Defense University, Romania, Available Online: http://elseconference.eu/
83. Wolfram, https://www.wolframalpha.com/examples/PlottingAndGraphics.html
84. Woodford Peter F. ed., Scientific writing for graduate students: a manual on the teaching of
scientific writing. New York: Rockefeller University Press, 1968.
85. 3D, http://www.calculator-grapher.com/graphers/function-grapher-2-var.htl
86. http://ebooks.unibuc.ro/Fizica/Sabina/2.pdf
87. http://www.phys.ubbcluj.ro/~daniel.andreica/pdf/Mec-CURS/01-INTRODUCERE-IN-
CALCULUL-ERORILOR.pdf
88. http://www.phys.ubbcluj.ro/~dana.maniu/Laborator%20Optica/Calcul%20de%20erori.pdf
89. http://www.utgjiu.ro/math/mbuneci/book/mn2007/c04.pdf
90. http://cs.upm.ro/~bela.finta/.files/carti/Numerika.
ANEXĂ
Funcții Excel (2007, 2010, 2013, 2016)
Sursa:
https://support.office.com/ro-ro/article/Func%C8%9Bii-Excel-dup%C4%83-categorie-5f91f4e9-7b42-46d2-
9bd1-63f26a86c0eb
https://support.office.com/ro-ro/article/Func%C8%9Bii-Excel-%C3%AEn-ordine-alfabetic%C4%83-
b3944572-255d-4efb-bb96-c6d90033e188

Funcții Excel (după categorie) – se aplică la: Excel 2016 Excel 2013 Excel 2010 Excel 2007:
 Cele mai populare 10 funcții; Funcții statistice; Funcții matematice și trigonometrice; Funcții
logice; Funcții de căutare și de referință; Funcții de baze de date; Funcții financiare; Funcții de
inginerie; Funcții de informații; Funcții text; Funcții de dată și oră; Funcții de compatibilitate;
Funcții de cub; Funcții definite de utilizator instalate cu programe de completare; Funcții web.

Cele mai populare 10 funcții


Cele 10 funcții Excel despre utilizate cel mai mult.
Funcție Descriere
Funcția
Utilizați această funcție pentru a aduna valorile din celule.
SUM
Utilizați această funcție pentru a returna o valoare dacă o condiție este adevărată și o altă
Funcția IF
valoare dacă este falsă. Iată un videoclip despre utilizarea funcției IF.
Funcția Utilizați această funcție atunci când trebuie să căutați într-un singur rând sau într-o singură
LOOKUP coloană și să găsiți o valoare aflată în aceeași poziție în alt rând sau în altă coloană.
Utilizați această funcție atunci când trebuie să găsiți ceva într-un tabel sau într-o zonă, pe un
Funcția rând. De exemplu, căutați numele unei angajate după numărul său de angajat sau găsiți
VLOOKUP numărul său de telefon prin căutarea numelui de familie (ca într-o agendă telefonică). Urmăriți
acest videoclip despre utilizarea funcției VLOOKUP.
Utilizați această funcție pentru a căuta un element într-o zonă de celule, apoi a returna poziția
Funcția
relativă a acelui element din zonă. De exemplu, dacă zona A1:A3 conține valorile 5, 7 și 38,
MATCH
formula =MATCH(7;A1:A3;0) returnează numărul 2, deoarece 7 este al doilea element din zonă.
Utilizați această funcție pentru a selecta de la una până la 254 de valori bazate pe un index
Funcția
numeric. De exemplu, dacă valoare1 până la valoare7 sunt zilele săptămânii, CHOOSE
CHOOSE
returnează una din zile când un număr cuprins între 1 și 7 este utilizat ca argument index_num.
Utilizați această funcție pentru a returna numărul seriei secvențiale care reprezintă o anumită
dată. Această funcție este utilă în situațiile în care anul, luna și ziua sunt furnizate de formule
Funcția
sau referințe la celule. De exemplu, este posibil să aveți o foaie de lucru care conține date
DATE
calendaristice într-un format pe care Excel nu îl recunoaște, cum ar fi AAAALLZZ. Utilizați
funcția DATEDIF pentru a calcula numărul de zile, luni sau ani dintre două date calendaristice.
Funcția
Utilizați această funcție pentru a returna numărul de zile dintre două date.
DAYS
Funcțiile
Funcțiile FIND și FINDB găsesc un șir text într-un al doilea șir text, apoi returnează numărul
FIND,
poziției de început a primului șir text începând cu primul caracter al celui de-al doilea șir text.
FINDB
Funcția Utilizați această funcție pentru a returna o valoare sau referința unei valori dintr-un tabel sau o
INDEX zonă.
376 MARIN VLADA

Funcții statistice

Funcție Descriere
Returnează media aritmetica a abaterilor absolute ale punctelor de date de
Funcția AVEDEV
la valoarea lor medie
Funcția AVERAGE Returnează media aritmetică a argumentelor
Returnează media aritmetică a argumentelor, inclusiv numere, texte și valori
Funcția AVERAGEA
logice
Returnează valoarea medie (media aritmetică) a tuturor celulelor dintr-o
Funcția AVERAGEIF
zonă care îndeplinesc un anumit criteriu
Returnează valoarea medie (media aritmetică) a tuturor celulelor care
Funcția AVERAGEIFS
îndeplinesc mai multe criterii
Funcția BETA.DIST
Returnează funcția de distribuție cumulativă beta

Funcția BETA.INV Returnează inversa funcției de distribuție cumulativă pentru o distribuție


beta specificată
Funcția BINOM.DIST
Returnează probabilitatea unei variabile discrete de distribuție binomială

Funcția BINOM.DIST.RANGE Returnează probabilitatea unui rezultat de încercare, utilizând o distribuție


binominală.
Funcția BINOM.INV Returnează cea mai mică valoare pentru care distribuția binomială
cumulativă este mai mare sau egală cu o valoare criteriu
Funcția CHISQ.DIST
Returnează funcția de densitate a probabilității cumulative beta

Funcția CHISQ.DIST.RT
Returnează probabilitatea cu o coadă a distribuției hi-pătrat

Funcția CHISQ.INV
Returnează funcția de densitate a probabilității cumulative beta

Funcția CHISQ.INV.RT
Returnează inversa probabilității cu o coadă a distribuției hi-pătrat

Funcția CHISQ.TEST
Returnează testul de independență

Funcția CONFIDENCE.NORM
Returnează intervalul de încredere pentru o medie a populației

Funcția CONFIDENCE.T Returnează intervalul de încredere pentru o medie a populație, utilizând o


distribuție t Student
Funcția CORREL Returnează coeficientul de corelație între două seturi de date
Funcția COUNT Contorizează numerele din lista de argumente
Funcția COUNTA Contorizează valorile din lista de argumente
Funcția COUNTBLANK Contorizează numărul de celule goale dintr-o zonă
Statistică şi Informatică pentru chimie medicală şi farmaceutică 377

Funcție Descriere
Contorizează numărul de celule ale unei zone care corespund unui criteriu
Funcția COUNTIF
dat
Funcția COUNTIFS Contorizează numărul de celule dintr-o zonă care întrunesc mai multe criterii
Funcția COVARIANCE.P
Returnează covarianța, media produselor abaterilor pereche

Funcția COVARIANCE.S Returnează covarianța eșantion, media produselor abaterilor pentru fiecare
pereche de puncte de date din două seturi de date
Funcția DEVSQ Returnează suma pătratelor abaterilor
Funcția EXPON.DIST
Returnează distribuția exponențială

Funcția F.DIST
Returnează distribuția de probabilitate F

Funcția F.DIST.RT
Returnează distribuția de probabilitate F

Funcția F.INV
Returnează inversa distribuției de probabilitate F

Funcția F.INV.RT
Returnează inversa distribuției de probabilitate F

Funcția F.TEST
Returnează rezultatul unui test F

Funcția FISHER Returnează transformarea Fisher


Funcția FISHERINV Returnează inversa transformării Fisher
Returnează o valoare dintr-o tendință liniară Notă: în Excel 2016, această
funcție este înlocuită cu FORECAST.LINEAR ca parte a noilor funcții de
Funcția FORECAST
prognoză, dar rămâne disponibilă pentru compatibilitate cu versiunile
anterioare.
Funcția FORECAST.ETS Returnează o valoare viitoare pe baza valorilor existente (istorice), utilizând
versiunea AAA a algoritmului ETS (Exponential Triple Smoothing) Notă:
această funcție nu este disponibilă în Excel 2016 pentru Mac.
Funcția Returnează un interval de încredere pentru valoarea prognozată, la data
FORECAST.ETS.CONFINT țintă specificată Notă: această funcție nu este disponibilă în Excel 2016
pentru Mac.
Funcția Returnează lungimea modelului repetitiv pe care îl detectează Excel pentru
FORECAST.ETS.SEASONALITY seria de timp specificată Notă: această funcție nu este disponibilă în Excel
2016 pentru Mac.
Funcția FORECAST.ETS.STAT Returnează o valoare statistică, rezultat al prognozei serie de timp Notă:
această funcție nu este disponibilă în Excel 2016 pentru Mac.
Funcția FORECAST.LINEAR Returnează o valoare viitoare pe baza valorilor existente Notă: această
funcție nu este disponibilă în Excel 2016 pentru Mac.
Funcția FREQUENCY Returnează o distribuție a frecvenței ca matrice verticală
378 MARIN VLADA

Funcție Descriere
Funcția GAMMA
Returnează valoarea funcției gamma.

Funcția GAMMA.DIST
Returnează distribuția gama

Funcția GAMMA.INV
Returnează inversa distribuției cumulative gama

Funcția GAMMALN Returnează logaritmul natural al funcției gama, Γ(x)


Funcția GAMMALN.PRECISE
Returnează logaritmul natural al funcției gama, Γ(x)

Funcția GAUSS
Returnează cu 0,5 mai puțin decât distribuția normală cumulativă standard

Funcția GEOMEAN Returnează media geometrică


Funcția GROWTH Returnează valori dintr-o tendință exponențială
Funcția HARMEAN Returnează media armonică
Funcția HYPGEOM.DIST Returnează distribuția hipergeometrică
Funcția INTERCEPT Returnează intersecția liniei de regresie liniară
Funcția KURT Returnează coeficientul Kurt al unui set de date
Funcția LARGE Returnează a k-a cea mai mare valoare dintr-un set de date
Funcția LINEST Returnează parametrii unei tendințe liniare
Funcția LOGEST Returnează parametrii unei tendințe exponențiale
Funcția LOGNORM.DIST
Returnează distribuția cumulativă lognormală

F