Sunteți pe pagina 1din 132

UNIVERSITATEA “LUCIAN BLAGA” DIN SIBIU

FACULTATEA DE ŞTIINłE
CATEDRA DE ECOLOGIE ŞI PROTECłIA MEDIULUI

Conf. dr. Ioan SÎRBU

MODELAREA PROCESELOR ECOLOGICE

Suport de curs şi aplicaŃii practice

Sibiu
2010
I. Sîrbu - Modelarea proceselor ecologice (2010) 2

Notă

Acest material a fost parŃial publicat şi poate fi citat astfel:

Sîrbu, I., 2009 - Bazele modelării proceselor şi sistemelor ecologice.


Editura UniversităŃii "Lucian Blaga” din Sibiu, 175 pg.

ISBN 978-973-739-787-4

Se află în pregătire următorul volum:

Sîrbu, I., Olosutean, H., 2010 - Modelare ecologică; aplicaŃii în


Mathcad. Editura UniversităŃii "Lucian Blaga” din Sibiu (in
press).

ATENłIE:

În afară de acest material, pentru examenul teoretic (dar şi pentru


cel practic) se vor mai pregăti din volumul "Ecologie practică" (I.
Sîrbu şi A.M. Benedek, 2004, 2009) capitolele: V. Tabele şi grafice
(pp. 73 - 79), VII. Alte elemente de statistică aplicate în ecologie (pp.
96 - 102; fără Transformarea datelor); IX. Testarea ipotezelor (pp.
111-120) şi XX. Metode de ordonare şi clasificare a sistemelor
ecologice; construirea dendrogramelor (pp. 219 - 228). Aceste teme
sunt fie recapitulative, fie au fost predate la seminarii şi laboratoare la
această disciplină, făcând parte integrantă din materia de examen!
I. Sîrbu - Modelarea proceselor ecologice (2010) 3

CUPRINS

1. INTRODUCERE; DEFINIłIA ŞI NECESITATEA MODELĂRII _____ 5

2. PRINCIPIILE ŞI ALGORITMUL CERCETĂRII


ECOLOGICE CLASICE _____ 7

3. ABORDĂRI ACTUALE ÎN PROIECTAREA CERCETĂRILOR


DE ECOLOGIE; ROLUL MODELELOR ECOLOGICE _____ 13

4. PRINCIPII, METODE ŞI SISTEME DE MANAGEMENT


A DATELOR ECOLOGICE _____ 23

5. ALGORITMUL ŞI PRINCIPIILE MODELĂRII ECOLOGICE _____ 42

6. ELEMENTELE CONSTITUENTE ŞI
CLASIFICAREA MODELELOR ECOLOGICE _____ 49

7. MODELE CONCEPTUALE
ŞI TRECEREA SPRE MODELELE CANTITATIVE _____ 54

8. INTRODUCERE ÎN MODELAREA STATISTICĂ


PE CALCULATOR _____ 60
I. Sîrbu - Modelarea proceselor ecologice (2010) 4

9. MODELE STATISTICE ŞI MODELE TEORETICE;


EVITAREA ERORILOR DE MODELARE _____ 80

10. MODELARE STATISTICĂ NELINIARĂ;


APLICAłII ÎN PROGRAMUL STATISTICA _____ 86

11. MODELARE ÎN MATHCAD _____ 99

12. MODELAREA DINAMICII POPULAłIONALE


PRIN ECUAłII RECURENTE _____ 114

13. ACTIVITATE INDEPENDENTĂ; PROBLEME _____ 124

14. BIBLIOGRAFIE SELECTIVĂ _____ 130


I. Sîrbu - Modelarea proceselor ecologice (2010) 5

1. INTRODUCERE;
DEFINIłIA ŞI NECESITATEA MODELĂRII

În conformitate cu dicŃionarul Oxford de ecologie modelul este o


reprezentare a realităŃii, care prezintă în manieră simplificată principalele
trăsături ale unor aspecte ale lumii reale, pentru a le face mai uşor de înŃeles şi a
facilita avansarea de prognoze (Allaby, 2005). În conformitate cu DEX al limbii
române un model înseamnă o reprezentare simplificată a unui proces sau a unui
sistem; este un sistem teoretic sau material, cu ajutorul căruia pot fi studiate
indirect proprietăŃile şi transformările altui sistem, mai complex, cu care modelul
prezintă analogii.
Vom aborda modelul ecologic ca pe o reprezentare rezumativă a unei
entităŃi reale, a unui lucru, idei sau condiŃii, care descrie şi sintetizează structura,
dinamica şi/sau funcŃiile unui sistem sau ale unui proces ecologic. Acestea pot fi
foarte de simple, de exemplu o expresie verbală cu privire la însuşirea unui
subiect, sau o diagramă, cum ar fi două dreptunghiuri înzestrate cu o anumită
semnificaŃie, legate între ele printr-o săgeată, care indică o relaŃie. La cealaltă
extremă, modelele ecologice pot fi oricât de complexe, de exemplu programe
imense care rulează pe reŃele de calculatoare interconectate, la care lucrează
instituŃii cu sute de oameni, din cele mai diverse specialităŃi. Procesul de
modelare este un şir de etape, care trebuie parcurse, pentru a converti o idee mai
întâi într-un model conceptual şi apoi într-o reprezentare cantitativă. Modelarea
ecologică este încadrată variabil, undeva între o simplă şi frecvent ignorată
metodă a ecologiei, şi (polul opus) un domeniu de vârf care necesită specialişti
“modelatori”, definindu-se astfel un domeniu distinct al ecologiei. Probabil
adevărul este undeva pe la mijloc.
Modelarea este o procedură care însoŃeşte inevitabil orice studiu. Ea nu
înseamnă neapărat calcul, dar cel mai frecvent implică sau se exprimă (şi) prin
limbaj matematic, respectiv reclamă utilizarea adecvată a tehnologiei informaŃiei.
Modelarea este o activitate universală; toŃi practicienii, uneori şi teoreticienii,
creează şi testează modele de cele mai diferite forme, idei şi expresii. Dacă
excludeŃi modelul dintr-o cercetare de ecologie, veŃi fi nişte simpli colecŃionari
de fapte sau de date primare (W. Silvert, 2001).
Ecologia modernă este eşafodată prin trei mari planuri de abordare a
problemelor complexe, care definesc provocările prezentului şi viitorului,
constituind totodată arsenalul tematic, teoretic şi metodologic din care îşi extrage
identitatea şi forŃa: ele poartă numele de regula celor trei M. Adică 1.
Monitoring, 2. Modelare şi 3. Management.
Modelarea serveşte la descrierea, sinteza şi explicarea fenomenelor
ecologice, este un aparat ştiinŃific prin care distilăm principalele trăsături
emergente ale sistemelor, pe care experimentăm în spaŃiul virtual. Ea este
indispensabilă pentru orientarea şi planificarea studiilor, testarea ipotezelor
I. Sîrbu - Modelarea proceselor ecologice (2010) 6

multiple de lucru, simulare şi prognoză, dar - mai ales - ca unealtă eficientă în


managementul ecologic şi criteriu pentru susŃinerea deciziilor de mediu. Nu mai
există domeniu al ecologiei şi al ştiinŃelor conexe, în care modelarea să nu joace
un rol esenŃial. Cu toate aceste afirmaŃii, trebuie înŃeles că modelele ecologice nu
sunt, şi nu trebuie să fie, un rezultat final al cercetării sau un scop în sine.
Modelele sunt şi trebuie să fie folositoare, să susŃină cercetarea, managementul şi
politicile de mediu şi să prefigureze noile sarcini care le stau în faŃă. Nu în ultimă
instanŃă ele ne ajută să construim un mediu abstract, virtual, în care să
experimentăm şi să găsim căi sau soluŃii rezonabile, cu multă vreme înainte de a
interveni asupra mediului, prin implementarea unor măsuri mai mult sau mai
puŃin inspirate. Modelarea ne ajută să ne comportăm în spiritul deontologiei
profesionale.
Acest material prezintă o selecŃie de principii, tehnici şi metode utilizate în
modelarea proceselor şi sistemelor ecologice. Este un text cu rol atât didactic, cât
şi ştiinŃific, având ca scop creşterea performanŃelor profesionale a celor care au
studiat deja biologia plantelor şi animalelor, ecologia generală, a populaŃiilor şi
sistemelor suprapopulaŃionale, hidrobiologie şi multe altele, care cunosc tehnicile
şi metodele aplicate în ecologie, respectiv cei care au deja o bază solidă de
cunoştinŃe şi doresc să acceadă la un nou nivel profesional, respectiv al
dezvoltării intelectuale. Nu în ultimă instanŃă este un bun procedeu de a vă
evalua: un ecolog modern trebuie să ştie să modeleze; pentru aceasta trebuie să
cunoască acceptabil sistematică, ecologie, matematică şi informatică, respectiv
să-şi dezvolte continuu cunoştinŃele şi aptitudinile în aceste direcŃii.
I. Sîrbu - Modelarea proceselor ecologice (2010) 7

2. PRINCIPIILE ŞI ALGORITMUL CERCETĂRII


ECOLOGICE CLASICE
(adaptat după Krebs, 1989; Sîrbu şi Benedek, 2004, 2009)
"Nu confundaŃi importanŃa scopului sau rafinamentul metodelor voastre cu valoarea
muncii pe care o întreprindeŃi. Rezultatele, şi nu doar scopurile sau mijloacele, trebuie să fie
demne de admiraŃie." (Hans Selye)

Cercetarea ecologică este un studiu planificat, în abordare sistemică, în


scopul cunoaşterii structurii, dinamicii şi/sau a funcŃiilor sistemelor ecologice.
Orice studiu poate fi abordat prin prisma a trei metode: cea teoretică, de
laborator sau de teren. Toate acestea sunt interdependente. Probleme apar atunci
când rezultatele obŃinute în urma unei abordări nu verifică pe cele obŃinute printr-
o alta. Deoarece toate sistemele şi procesele ecologice există sau se desfăşoară în
natură, înseamnă că terenul va fi întotdeauna stadiul etalon sau baza la care vom
raporta celelalte rezultate. Ecologia este o ştiinŃă empirică şi de aceea nu poate fi
realizată numai pe hârtie sau la calculator (Krebs, 1989). Laboratorul este o
reprezentare simplificată a naturii, un model al terenului, unde se simulează
procesele care se desfăşoară în natură, selectându-se un număr redus de variabile
de stare şi de proces. Avantajele laboratorului sunt legate de posibilitatea de
urmărire şi control al acŃiunii unui număr redus de variabile, provocarea
artificială a fenomenelor şi divizarea sistemelor complexe în subsisteme pe care
se poate experimenta mai uşor. Dezavantajele metodei constau în faptul că nu se
pot surprinde toate relaŃiile din natură, numeroşi factori rămân necuantificaŃi, nu
se Ńine seama de o mare parte din constrângerile care apar în mediu, iar domeniile
de variaŃie a variabilelor de control sunt adesea diferite faŃă de cele naturale.
Abordarea teoretică se face pe baza unui mare număr de investigaŃii şi date
experimentale, şi are ca scop generalizarea şi surprinderea legităŃilor generale ale
fenomenelor ecologice. Probleme apar atunci când teoria se bazează pe un număr
redus de date din natură sau când generalizările nu Ńin seama de limitările impuse
de abordările anterioare.
Alegerea temei poate fi un proces extrem de simplu pentru un tânăr
(subiectul poate fi oferit de un profesor, de exemplu) sau o mare bătaie de cap,
atunci când studentul este obişnuit să-şi pună întrebări sau, mai ales, când caută
singur tema de cercetare. Este bine să subliniem de la început că rezultatele sunt
singurele care justifică importanŃa temei alese, şi nu tehnicile şi metodele, cu
excepŃia cazurilor în care cercetarea aduce sau propune ca rezultat tehnici noi.
Dar nici în ecologie nu se aplică principiul “scopul scuză mijloacele”. Prea des
apar rezultate (multe discutabile) care s-au realizat prin sacrificarea nejustificată a
multor vieŃuitoare, frecvent pentru a demonstra ceea ce deja se cunoaşte. Aceste
fapte contravin eticii profesionale. Când afirmăm că rezultatul contează, aceasta
nu implică orice preŃ. Un rezultat bun este totodată şi deontologic. Impunerea
unei teme importante, dar pe care studentul are puŃine sau deloc şanse să o
I. Sîrbu - Modelarea proceselor ecologice (2010) 8

rezolve, nici nu îl promovează şi nici nu justifică eforturile depuse. Cel mai


adesea este păcat de timp şi de bani. Sindromul de "importanŃă intenŃională
nejustificată" se confundă adesea cu cel al "săririi etapelor". Adesea apar studenŃi
care cer sfaturi în legătură cu decizia lor de a studia: întregul ecosistem lacustru
X (alŃii ne cer să "facă un lac" ...), ecoetologia ursului sau a lupului, zborul
păsărilor şi de a realiza modelarea acestuia, dar mai ales mult plăcuta şi curtata
ecologie teoretică sau managementul sistemelor ecologice etc. Fără îndoială că
aceste intenŃii sunt nobile, chiar dacă nu strălucesc prin realism, cel puŃin pentru
studenŃii din primii ani. Nu odată, pe la simpozioane, studentul care se recomandă
cercetător al echilibrului naturii (şi nu adesea păcăleşte teoreticienii de duminică)
consideră că este mai remarcabil decât cel care a venit cu o lucrare de structură a
comunităŃilor de macrozoobentos dintr-un râu oarecare, când de fapt cel din urmă
aduce date utile şi valoroase, pe când primul, în general, va avea o expunere de
tipul unui referat bibliografic, fără a aduce vreo idee nouă.
Tema poate apare ca urmare a investigării unei zone sau a unui grup prea
puŃin cunoscut, sau care a fost studiat cu multă vreme în urmă. Sau poate răsări ca
urmare a ridicării unor probleme rezultate din observaŃii contradictorii sau care
nu beneficiază de răspunsuri univoce. De multe ori este esenŃial nu atât să se vadă
sau descrie ceva nou ci să se stabilească relaŃii solide, validate, între ceea ce era
deja cunoscut şi informaŃiile noi. Crearea legăturii poate fi mai importantă chiar
decât noul adus. Prea des, lipsa de documentare sau ignorarea rezultatelor
celorlalŃi, conduce atât pe specialiştii consacraŃi cât şi pe studenŃi la o cheltuială
inutilă de timp şi efort în studiul a ceea ce este de multă vreme cunoscut.
Studiile ecologice pot fi de tip explorativ sau demonstrativ (adică bazate pe
ipoteze şi verificarea acestora).
Studiile explorative sunt extrem de necesare, mai ales în acele zone puŃin
sau deloc studiate sub anumite aspecte (grupe sistematice sau funcŃionale puŃin
cunoscute). Cunoaşterea biologică este extrem de neuniformă, atât din punct de
vedere al repartiŃiei geografice cât şi al domeniilor acoperite. Este explicabil
faptul că grupele de succes (aici în sensul de populare), cum sunt păsările de
exemplu, sunt mult mai bine cunoscute decât cele ignorate (vietăŃi mici,
nevertebrate cu viaŃă retrasă, cu sistematică mult mai dificilă). În mod
corespunzător găsim în orice Ńară mult mai mulŃi ornitologi (inclusiv proiecte,
fonduri şi date de profil) decât malacologi sau briologi, de exemplu. Aşa se
explică faptul că acumularea inegală de cunoştinŃe duce la exigenŃe şi domenii de
acoperire foarte dezechilibrate. În unele domenii ecologul poate intra în munca de
amănunt, în timp ce zone geografice şi unele grupe sistematice încă mai aşteaptă
primele liste faunistice, respectiv cataloage de specialitate.
Orice informaŃie care acoperă un gol este un bun ştiinŃific şi un rezultat
care se cere salutat. Unii îşi închipuie, în mod eronat, că un studiu care implică
tehnică de vârf în genetică sau biochimie este în mod necesar superior unui studiu
care lămureşte relaŃiile filetice între anumiŃi taxoni sau alcătuieşte un prim
catalog sistematic sau zoogeografic, de exemplu. Există o anumită reticenŃă (în
bună parte explicabilă) faŃă de stilul de cercetare odinioară larg răspândit, anume
I. Sîrbu - Modelarea proceselor ecologice (2010) 9

cel de a alcătui liste de specii în anumite arii (aşa numitele studii floristice sau
faunistice). Când ecologul se rezumă exclusiv la asemenea liste, mai ales în arii
cunoscute sub aspectul grupului cu pricina, sau publică la infinit subtabele
taxonomice pentru diviziuni ale unor arii, reticenŃa este justificată. Nu însă şi
atunci când într-adevăr aria respectivă este necunoscută sub aspectul grupului
investigat. Pe de altă parte, depinde foarte mult cum se alcătuiesc aceste liste şi
cum se clasifică prezenŃa-absenŃa speciilor în funcŃie de diferiŃii factori ai
mediului. Pornind de la listele de specii se pot realiza o serie de analize de
biogeografie, cenologie, de nişe ecologice etc., aşa cum se va vedea în capitolele
care vor urma. Un bun specialist al unui grup poate sesiza foarte multe informaŃii
relevate de absenŃa sau prezenŃa anumitor specii într-un habitat, deoarece nici o
vietate nu trăieşte absolut oriunde, preferinŃele acesteia pentru mediu şi toleranŃa
la diferiŃii factori putând fi utilizate în sensul invers: al caracterizării stării
mediului pe baza cunoaşterii speciilor prezente. Orice informaŃie, fie cât de
simplă, poate fi utilizată de specialist într-o multitudine de modalităŃi. Evident,
studiul are foarte mult de câştigat atunci când includem date despre abundenŃa
taxonilor, descriem structura sau urmărim dinamica diferitelor comunităŃi, iar în
analizele de productivitate şi energetică, evaluăm în mod necesar şi date despre
creştere, biomasă, flux energetic etc. Deoarece viaŃa poate fi înŃeleasă numai în
contextul mediului integrator, o multitudine de factori ai acestuia pot fi de
asemenea monitorizaŃi (temperatură, reacŃia solului, oxigenul dizolvat, prezenŃa
unor elemente toxice etc.) şi identificate legăturile de tip cauză - efect sau a celor
de tip corelativ.
Prin contrast, există un curent tot mai puternic de absolutizare a datelor
cantitative, adică valori ale parametrilor ecologici (densităŃi, abundenŃe relative,
efective, indici de diversitate etc.) pe baza unui număr redus de probe sau zile
petrecute în teren. Acestea pot fi recunoscute, în general, prin parametri lipsiŃi de
probabilităŃi de semnificaŃie, prin numărul redus de specii relativ la grupul studiat
(în probe cantitative puŃine apar mai ales speciile abundente şi foarte rar cele cu
densitate scăzută sau caracteristice unor microhabitate mai rare sau dispersate în
aria de interes), precum şi lipsa unor concluzii care să zică ceva (se caracterizează
cine este mai abundent, se oferă o serie de valori, dar nu se poate interpreta nimic
de ordin sintetic sau cauzal legat de acestea). Unii înŃeleg, în mod eronat,
ecologia numai ca o "biologie matematizată" şi care consideră că multă
alergătură, dar de scurtă durată, colectarea câtorva probe şi oferirea de valori
pentru unii parametri ecologici ai populaŃiilor sau comunităŃilor înseamnă
exclusiv cercetare ecologică. Numeroase lucrări conŃin o grămadă de date
valorice care nu pot fi nici folosite mai departe (prin comparaŃie în cazul unui
studiu viitor) şi nici verificate (estimări lipsite de coeficienŃi de precizie, limite de
confidenŃă sau alte măsuri ale semnificaŃiei). Orice bun ecolog ştie că investigaŃia
unei arii, tronson de râu, lac etc. se realizează pe baza atât a probelor cantitative
cât şi a celor calitative (ultimele având o şansă mult mai mare de a releva
prezenŃa unor specii rare sau care preferă microhabitate care nu fac adesea
obiectul investigaŃiilor cantitative). Analiza grupului şi ariei de referinŃă trebuie
I. Sîrbu - Modelarea proceselor ecologice (2010) 10

să se facă prin alocarea unui timp suficient pentru strângerea informaŃiilor, fapt
care necesită echipament şi aptitudini pentru munca de teren.
Este evident că evaluarea modificărilor (frecvent prea puŃin evidente) în
starea mediului se realizează infinit mai bine pe baza datelor cantitative şi nu prin
prezenŃa-absenŃa speciilor, dar acest proces nu se face la întâmplare. Există un
algoritm stabilit pentru evaluarea parametrilor ecologici şi ai celor de mediu,
precum şi tehnici de comparare a acestora.
Un alt aspect al cercetării explorative este că adesea numai după iniŃierea
unui anumit program de cercetare apar semnele de întrebare şi ipotezele care
leagă această abordare de cercetarea demonstrativă. Ceea ce este foarte clar la
început (în faza de planificare) poate suferi nenumărate modificări, sau chiar
anulări ale unor aspecte ale proiectului. Cercetătorul trebuie adesea să modifice în
mod adecvat orice element al planului şi să adapteze tehnica şi metodele la noile
condiŃii.
Nici cercetarea explorativă şi nici cea demonstrativă (ipotetic-deductivă)
nu trebuie absolutizate; cel mai adesea se manifestă împreună sau se completează
reciproc. De multe ori s-a văzut că ipoteze şi demonstraŃii s-au realizat pe baza
unui număr foarte mare de date obŃinute în decursul multor ani de investigaŃii de
tip explorativ.

• Algoritmul clasic al cercetării ipotetic - deductive

Cercetarea ipotetic - deductivă începe cu o întrebare sau o problemă


care apare cel mai adesea pe seama unei observaŃii. Dacă observaŃia nu este
corectă sau întrebarea a fost pusă în mod eronat, rezultă o problemă falsă şi toate
etapele ulterioare sunt sortite eşecului. O întrebare, pentru simplul motiv că este
pusă, nu înseamnă că devine neapărat şi legitimă. Conform legii lui Katz "este
mult mai uşor să se inventeze o problemă, decât să se sesizeze una reală şi să fie
formulată corect". Odată formulată problema, ecologul are sarcina să o pună într-
un context sistemic, analizând-o prin prisma unei multitudini de întrebări, ca: este
această problemă importantă şi semnificativă din perspectivă ecologică?, ce
implicaŃii poate avea obŃinerea rezolvării ei?, care este nivelul de integrare la care
trebuie să o raportăm?, este cercetarea fezabilă sub aspectul echipei de specialişti
şi a fondurilor disponibile?, este aceasta o problemă locală sau are valabilitate
mai generală? etc. Progresând în acest sens se obŃine o imagine a problemei.
ÎnŃelegând problema în complexitatea ei (fără a uita că pe parcursul cercetării pot
apare oricând elemente noi sau putem elimina altele ca nesemnificative în
context), ecologul sugerează un răspuns posibil, care se numeşte ipoteză. După
Krebs (1989), ştiinŃa modernă operează printr-un sistem dualist format din
ipoteze şi date. Prin urmare, orice studiu trebuie văzut ca un ansamblu de idei şi
informaŃii din lumea reală. Ipotezele fără date nu sunt de nici un folos şi invers.
Orice ipoteză trebuie să avanseze una sau mai multe prognoze. Ipotezele sunt
testate prin observaŃii şi determinări care urmăresc dacă se verifică sau nu
prognozele. Definim experimentul ca orice set de observaŃii care testează o
I. Sîrbu - Modelarea proceselor ecologice (2010) 11

ipoteză. Experimentele pot fi naturale sau artificiale (de exemplu de laborator).


Protocolul pentru etapele ce trebuie parcurse în procesul de verificare a ipotezelor
se numeşte design experimental, şi include totalitatea metodelor care trebuie
utilizate, programul de colectare a probelor, parametrii ecologici urmăriŃi,
periodicitatea de colectare a datelor, resursele umane şi financiare alocate,
rezultatele scontate, tehnicile de calcul aplicate etc. Foarte important este
programul de colectare a probelor. Cel mai adesea este imposibil să se studieze
structura sau funcŃiile întregului sistem ecologic, motiv pentru care cercetătorul
trebuie să extragă un număr limitat de informaŃii pe baza căruia să poată
caracteriza întregul din care provin.
În urma prelucrării probelor se obŃin date (informaŃii) care vor fi analizate
şi utilizate în testarea ipotezelor. În această etapă trebuie să cunoaştem diferitele
tipuri de teste, algoritmul utilizării acestora, limitările şi condiŃiile de aplicare. Se
cunosc extrem de multe cazuri de concluzii false, bazate pe insuficienta
aprofundare a tehnicii de testare, a alegerii nejudicioase a testelor şi interpretarea
eronată a rezultatelor. Dacă respingem ipotezele de lucru, ne întoarcem la
observaŃie sau la imaginea problemei şi o luăm de la capăt.
Dacă am obŃinut la acest nivel confirmarea, se trece la secvenŃa finală a
cercetării. În primul rând se caută legităŃile generale ale fenomenului studiat în
limitele impuse de complexitatea abordării. Este la fel de greşit să se încerce o
generalizare prea largă a fenomenului, pe cât şi să se restrângă numai la cazul
particular studiat. Aceste lucruri pot fi evitate prin explicarea şi identificarea
cauzelor care determină fenomenul particular. După cum scria P.M. Bănărescu
(1973) "ştiinŃa nu înseamnă filatelie; ştiinŃă înseamnă a explica". Nu trebuie însă
uitat că toate sistemele şi procesele ecologice au o istorie evolutivă, iar acest fapt
constituie o bogată dar controversată sursă de explicaŃii. La întrebarea "de ce este
sistemul astfel alcătuit?" sau "de ce procesul se desfăşoară în aceste condiŃii în
acest fel şi nu în altul?" sunt printre cele mai importante dar şi mai dificile
întrebări la care ecologia modernă trebuie să caute un răspuns. EvoluŃia este greu
de cunoscut şi imposibil de experimentat.
În sfârşit, ultima etapă a cercetării este cea de valorificare a rezultatelor.
Valorificarea trebuie văzută aici în sens larg, în primul rând din perspectivă
ştiinŃifică (publicare de exemplu), apoi de popularizare şi mediatizare, şi numai în
ultimul rând economică. Ecologia este în primul rând o ştiinŃă. De aceea nu
trebuie redusă la un mod de rentabilizare a proceselor şi fenomenelor naturale
pentru folosinŃele umane. Adesea ceea ce pare o rentabilizare a unui proces pe
termen scurt, produce o pierdere gravă pe termen mediu sau lung (de exemplu
campaniile de otrăvire a prădătorilor de vârf, arderea jneapănului etc., toate
motivate economic dar care au adus prejudicii imense naturii şi societăŃii umane).
Este simplu să cădem în greşeala identificării aparente a unei logici superioare
naturii, uitând că aceasta din urmă a avut timp milioane de ani să experimenteze
pe baza legităŃilor universale şi ale evoluŃiei. După cum se exprima atât de
inspirat B. Commoner (1980): "Natura se pricepe cel mai bine".
I. Sîrbu - Modelarea proceselor ecologice (2010) 12

OBSERVAłIE

PROBLEMĂ

IMAGINE

IPOTEZE

PROGNOZE

DESIGN EXPERIMENTAL

PROGRAMUL DE COLECTARE A PROBELOR


alegerea dimensiunii probei unitare şi a probei statistice,
colectarea probelor, obŃinerea datelor, analiza, prelucrarea şi interpretarea acestora

TESTAREA IPOTEZELOR

NU Sunt confirmate
prognozele?

DA
EXPLICAłII

VALORIFICARE

Fig. 2.1. Algoritmul clasic al cercetării ecologice ipotetic-deductive


(adaptat după Green, 1979).

În fig. 2.1 redăm sub forma unui algoritm principalele etape ale unei
cercetări ecologice demonstrative (adaptat după Green, 1979). Fără îndoială,
acesta este conceput extrem de simplist. Există numeroase elemente şi secvenŃe
care se pot ataşa, în funcŃie de complexitatea obiectivelor cercetării. Atunci când
sistemul studiat se comportă ca un model determinist, algoritmul poate fi redus la
o secvenŃă liniară. Dacă însă operăm după un model stocastic (probabilistic) este
necesară introducerea de secvenŃe ramificate, funcŃie de evoluŃia probabilistică a
fenomenelor.
Acesta este algoritmul clasic, care a suferit numeroase modificări prin
trecerea la noile abordări, paradigme şi tehnici aplicate în ecologia ultimelor
câteva decenii.
I. Sîrbu - Modelarea proceselor ecologice (2010) 13

3. ABORDĂRI ACTUALE ÎN PROIECTAREA


CERCETĂRILOR DE ECOLOGIE;
ROLUL MODELELOR ECOLOGICE
(adaptat după W.K. Michener, 2000)

În acest capitol expunem succint completări aduse materialului


antemenŃionat, care vor pregăti totodată introducerea în modelarea ecologică şi
relaŃia dintre aceasta şi cercetările de profil.

3.1. Abordări actuale în strategia elaborării studiilor de ecologie


Până relativ recent cele mai multe studii de ecologie s-au realizat de către
cercetători solitari, sau de grupuri mici, pe suprafeŃe sau volume reduse de habitat
(litri sau decimetri cubi de apă sau sol, unul sau câŃiva metri pătraŃi), în perioade
scurte de timp (ore, zile sau – în cel mai bun caz – luni, respectiv sezoane),
precum şi prin evaluarea unui număr redus de parametri ecologici (de obicei sub
5 categorii). Problemele actuale grave ale societăŃii umane şi mediului în care
aceasta este integrată, cum ar fi cauzele şi efectele încălzirii globale, reducerea
biodiversităŃii, epuizarea resurselor etc., impun necesitatea depăşirii limitelor
studiilor convenŃionale şi abordări noi în investigaŃiile ecologice.

Tim p = o zi - 3 a n i
2
S p aŃiu = cm - 10 0 m
P a ra m e tri e co lo gic i = 1 -5
Tim p
Tim p > 3 a n i
S p aŃiu > 1 0 0 m 2
P a ra m e tri e co lo gic i > 5

N r. p a ra m e tri
e c o lo g ici

Sp a Ń iu
Fig. 3.1. Model conceptual al expansiunii abordărilor cercetării ecologice, la scară
temporală, spaŃială şi tematică (după W.K. Michener, 2000). Paralelipipedul mic semnifică
concepŃia clasică, cel mare sugerează tendinŃe în expansiunea modernă.
I. Sîrbu - Modelarea proceselor ecologice (2010) 14

Subiecte din ce în ce mai complexe, ale căror cauze şi efecte se fac


resimŃite pe o perioadă lungă de timp, respectiv care se raportează la scară
spaŃială mare, au determinat o trecere treptată a cercetării spre echipe mari,
multidisciplinare, alocarea unui interval mai lung de timp pentru obŃinerea,
interpretarea şi înŃelegerea semnificaŃiilor datelor ecologice. Abordarea
problemelor complexe impune o schimbare adecvată şi corelată a scărilor de
timp, spaŃiu şi parametrii evaluaŃi, ultima numindu-se şi "scara sau abordarea
tematică”. Modelul conceptual al expansiunii în spaŃiul tridimensional (3D) a
abordărilor în ecologie este redat în Fig. 3.1.

D isc ip lin e a le B D i sc ip lin e


m e d iu lu i fi z ic so cia le

D
A C

D isc ip li n e
e co lo g ice

Fig. 3.2. Exemplu de abordare a unei cercetări actuale complexe, aflată la intersecŃia mai
multor domenii, necesitând colaborarea şi acŃiunea sinergică a specialiştilor (după W.K.
Michener, 2000). Studiu de caz:
Tema generală a studiului ar putea fi: PRINCIPII ŞI METODE DE MANAGEMENT A
VIITURILOR ŞI INUNDAłIILOR.
Subteme posibile definite pe discipline ale mediului: interacŃiuni dintre curgerea apei,
scurgerea superficială, debite, eroziune, amenajări hidrotehnice etc.
Discipline ecologice: succesiuni ale comunităŃilor vegetale din albiile râurilor, funcŃiile
ecologice ale luncii inundabile etc.
Discipline sociale: aspecte sociale şi economice ale managementului inundaŃiilor;
Domenii de intersecŃie:
A - interacŃiuni între vegetaŃie (în mod special ariile împădurite) şi atenuarea
viiturilor;
B - managementul ariilor în care sunt necesare inundaŃii controlate pentru a satisface
cerinŃele sociale;
C- beneficii şi pagube produse de viituri şi inundaŃii asupra ecosistemelor afectate şi a
folosinŃelor umane;
D - managementul peisajelor edificate de ecosisteme lotice ("riverscapes" în engleză);
harta regimurilor de viituri şi inundaŃii în diferitele arii geografice, politice şi sociale.

Abordările multidisciplinare sunt necesare, deoarece problemele


actuale nu mai sunt ancorate într-un singur plan al cunoaşterii, nu aparŃin unei
I. Sîrbu - Modelarea proceselor ecologice (2010) 15

singure ştiinŃe, având implicaŃii şi efecte dintre cele mai complexe asupra naturii,
a calităŃii mediului, a economiei şi societăŃii umane. Din acest motiv studiile
moderne sunt obligate să integreze cel puŃin trei planuri majore de abordare,
constituind tot atâtea domenii din care se recrutează specialiştii necesari, şi
anume: discipline ecologice, cele ale mediului (incluzând aici fizica, chimia,
geologia, geografia, climatologia, hidrologia etc.), precum şi discipline sociale.
Această intersecŃie disciplinară este ilustrată în Fig. 3.2 şi este exemplificată
printr-un studiu de caz.
Complexitatea noilor întrebări şi probleme abordate determină modificări
majore în planificarea şi designul cercetărilor moderne de ecologie. Abordarea
clasică a studiilor demonstrative implică identificarea unei probleme, edificarea
imaginii acesteia, alcătuirea ipotezelor, design experimental adecvat (de teren,
laborator sau ambele), colectarea şi analiza datelor, testarea ipotezelor printr-o
tehnică adecvată, adoptarea deciziilor, interpretarea şi valorificarea rezultatelor.
Acest gen de proiect se alcătuieşte şi se implementează de regulă, de către un
număr redus de cercetători, frecvent chiar de unul singur. Tema se raportează
aproape întotdeauna la scări reduse, în termeni spaŃial, temporal şi tematic. O altă
caracteristică a acestor studii o constituie faptul că datele sunt considerate ca scop
final, alcătuirea rapoartelor şi publicarea acestora fiind punctul terminus al
întregii activităŃi. Odată publicate rezultatele finale, datele primare şi
intermediare sunt – cel mai frecvent – păstrate exclusiv de către ecolog pe
parcursul vieŃii acetuia, după care (sau cel mai frecevnt cu mult înainte) ele se
pierd iremediabil.
Prin contrast cu scenariul clasic prezentat anterior, o tendinŃă în ecologia
viitorului este necesitatea de a accesa date din cele mai diverse domenii ale
cunoaşterii, obŃinute de specialişti heterogeni, în cadrul unor proiecte cu scopuri
oricât de diferite. Deşi cercetarea individuală nu îşi va pierde forŃa şi nici
importanŃa, problemele complexe la care omenirea trebuie să facă faŃă vor
necesita date cu mult mai multe şi mai diverse, decât cele care pot fi obŃinute,
analizate, gestionate şi interpretate de către un singur om. Ecologia este nevoită
să treacă spre abordări interdisciplinare, spre necesitatea accesului cât mai facil şi
liber la date inteligibile, bine păstrate, bine gestionate şi de bună calitate.

3.2. Formularea modernă a întrebărilor şi ipotezelor

• Paradigma nouă şi modelele conceptuale


Paradigmele în ecologie reprezintă modalităŃile prin care ecologii percep
natura, cuprinzând crezurile, abordările şi presupunerile acestora. Ele există în
cadrul fiecărui capitol sau ramură majoră a ecologiei. Din perspectiva tranziŃiilor,
două ne vor reŃine atenŃia, şi anume cea a echilibrului naturii, prin opoziŃie cu
paradigma fluxului naturii. Prima a fundamentat o mulŃime dintre studiile
clasice de valoare majoră, fiind una dintre fundaŃiile importante ale majorităŃii
manualelor didactice. Prin prisma acesteia sistemele ecologice sunt capabile de
autoreglare, tind spre puncte fixe de echilibru, succesiunile sunt unidirecŃionale,
I. Sîrbu - Modelarea proceselor ecologice (2010) 16

perturbările reprezintă excepŃii, iar efectul acŃiunii oamenilor este în general


neglijat. Prin contrast, fluxul naturii consideră sistemele ca fiind supuse
contrângerilor unor factori externi, cu rare stări de echilibru punctiform,
succesiunile sunt excepŃional deterministe, disturbările antropogene sunt
evenimente comune, iar influenŃele antropice asupra ecosistemelor sunt aproape
omniprezente. În mod necesar problemele, întrebările şi ipotezele care sunt
ridicate în studiile aparŃinând celor două categorii de abordări sunt diferite.
Indiferent de abordare la baza tuturor studiilor stau modelele conceptuale,
care reprezintă transpunerea ideilor îmtr-o formă grafică, o expresie ideatică
fizică, schematică, ce indică prin simboluri structura, funcŃiile, relaŃiile şi
entităŃile care fundamentează sistemul sau procesul studiat, ghidând totodată
demersul ştiinŃific.

• Formularea ipotezelor de lucru


Formularea ipotezelor este o necesitate în ştiinŃă, fiind un proces iterativ. O
ipoteză bazată pe un anumit model conceptual avansează (cel puŃin) o prognoză,
ea fiind declarată de obicei ca opoziŃia logică, pe care o definim drept ipoteză
nulă. Experimentul este apoi conceput şi desfăşurat pentru a testa ipotezele, adică
pentru a verifica dacă prognozele sunt sau nu îndeplinite. Indiferent de rezultat
(pozitiv sau negativ), ceea ce s-a obŃinut va duce mai departe cunoaşterea, dacă
toŃi paşii au fost corect definiŃi şi parcurşi. Testarea ipotezelor este un proces
continuu: oricare este rezultatul unui studiu demonstrativ, interpretările trebuie să
conducă mai departe la alte ipoteze, alte experimente şi teste.
Pentru construirea unor ipoteze realiste şi logice Bernstein şi Goldfarb
(1995, ap. Michener, 2000) au enunŃat şase caracteristici metodologice care
trebuie considerate:
1. efectul sau tipul cauzalităŃii procesului ecologic studiat;
2. componentele (indivizi, populaŃii, comunităŃi) şi caracteristicile
habitatului;
3. relaŃii sau interacŃiuni dintre componente;
4. scara spaŃială;
5. scara temporală;
5. rezultate, dovezi sau clase de date validate.
Există o serie de alte consideraŃii care vor influenŃa rezultatele studiului,
dintre care amintim istoria subiectului particular, cum ar fi folosinŃele din trecut
ale terenului, impactul antropic etc. Nu în ultimă instanŃă abordarea subiectului
studiat, pe diferite planuri de organizare, poate concura la producerea unor
rezultate mult mai semnificative. Se sugerează astfel o abordare simultană, pe cel
puŃin trei niveluri, ale oricărui subiect, şi anume: (1) nivelul de facto, din care
face parte acesta (de exemplu cel al populaŃiei sau cel al comunităŃii particulare
studiate), apoi (2) nivelul subiacent, pentru a elucida mecanismele fenomenului
(în cazul populaŃiei vom considera însuşirile sau comportamentul indivizilor, în
cazul comunităŃii vom studia relaŃiile şi raporturile cantitative dintre populaŃiile
I. Sîrbu - Modelarea proceselor ecologice (2010) 17

constituente etc.), şi (3) nivelul imediat supraordonat pentru a releva rolul,


contextul şi semnificaŃiile ecologice mai largi ale fenomenului.

Începe aici

OBSERVAłII

MODELE
Digrame conceptuale
şi teorii

IPOTEZE
Prognoze bazate
pe modele

IPOTEZA NULĂ
Opusul logic al ipotezelor

EXPERIMENT
Testul critic al
ipotezei nule

Păstrează ipoteza nulă INTERPRETARE Respinge ipoteza nulă

Respinge ipotezele de Păstrează ipotezele de


lucru şi modelul lucru şi mo delul
Nu te opri aici

Fig. 3.3. Model conceptual pentru dezvoltarea ipotezelor multiple, incluzând experimente,
interpretări şi feedback pentru formularea de noi ipoteze (după Underwood, 1997 ap.
Michener, 2000).

• Ipotezele de lucru multiple


Modelele conceptuale servesc ca bază pentru formularea ipotezelor.
Procedeul clasic, al formulării ipotezelor singulare, este mai nou atacat. Prin
formularea unei singure ipoteze direcŃia de cercetare este impusă în mod strict, iar
teoria tinde să devină părtinitoare. Este astfel determinată o limitare a posibilelor
răspunsuri, iar ecologul tinde să devină prizonierul propriei sale teorii.
Un factor important în dezvoltarea unui design experimental este ideea
necesităŃii construirii unui set de ipoteze de lucru multiple (fig. 3.3). Diferite
surse argumentează că oamenii de ştiinŃă tind să posede ipoteze preferate pentru
explicarea proceselor naturale. Ei tind să fie subiectivi atunci când verifică aceste
I. Sîrbu - Modelarea proceselor ecologice (2010) 18

ipoteze, eliminând sau ignorând datele care le infirmă şi supraestimând pe cele


care le confirmă. Pentru a ne feri de această continuă sursă de erori şi părtinire, se
sugerează considerarea mai multor ipoteze de lucru, alternative, la posibilele
răspunsuri avansate într-un studiu.
După Platt (1964, ap. Franklin şi col., 2001) alcătuirea acestor ipoteze
multiple, urmate de constituirea unui set esenŃial de experimente care le verifică,
apoi excluderea majorităŃii acestora, poartă denumirea de inferenŃă puternică,
fiind un motor al progresului ştiinŃei. S-a argumentat că testarea ipotezelor poate
fi benefic înlocuită prin procedura de testare a modelelor, aceasta fiind abordarea
cheie a simulării şi modelării ecologice.
Un model conceptual pentru alcătuirea ipotezelor este redat în Fig. 3.3.
(după Underwood, 1997 ap. Michener, 2000).

3.3. Abordări alternative în studiile de ecologie

Există o gamă largă de categorii de abordări conceptuale şi metodologice


în studiile de ecologie. Dintre cele mai des folosite, care frecvent nu se exclud
reciproc, ci sunt complementare, amintim experimentul concentrat pe subiect,
studiile pe termen lung, studii retrospective, studii comparative pe scară largă,
substituŃiile spaŃiu – timp, modelele de simulare, precum şi cele bazate pe
restaurarea sau reconstrucŃia ecologică.

A. Experimentul concentrat pe subiect


Există largă varietate de categorii de experimente concepute în ecologie
pentru verificarea diferitelor ipoteze. La modul cel mai simplu un experiment
implică studiul efectelor acŃiunii unui factor (sau a mai multora) asupra unei părŃi
a unui sistem ecologic, şi compararea acestora cu părŃi sau sisteme asupra cărora
evenimentul aflat sub incidenŃa studiului nu acŃionează. Mai simplu înseamnă să
comparăm probe supuse unui efect (probe experimentale) cu probe martor.
Designul experimental este pe cât de divers, pe atât de laborios: includem aici
dimensionarea judicioasă în timp şi spaŃiu a studiului, dimensionarea corectă a
probei unitare, selectarea probelor statistice (replicarea probelor unitare),
colectarea probelor (respectiv a datelor) din teren sau laborator, prelucrarea,
analiza şi sinteza datelor prin tehnici statistice consacrate, testarea ipotezelor şi
adoptarea deciziilor, toate acestea desfăşurându-se după un protocol elastic în
ceea ce priveşte forma, dar totuşi relativ rigid, în ceea ce priveşte algoritmul
(pentru informaŃii suplimentare a se vedea Sîrbu şi Benedek, 2004). Designul de
eşantionare (programul de dimensionare şi colectare a probelor) este de maximă
importanŃă şi totodată critic pentru întregul studiu. Cele mai multe erori s-au făcut
ca urmare a conceperii şi implementării unui sistem defectuos al programului de
colectare a probelor. După Tilman (1989, ap. Michener, 2000) sunt patru
probleme conceptuale majore, care sunt prea des neglijate, în cadrul studiilor care
implică design experimental, şi în mod special a celor care se desfăşoară primar
în teren: (1) neglijarea dinamicii tranziŃiilor (dinamica complexă a sistemelor în
I. Sîrbu - Modelarea proceselor ecologice (2010) 19

timpul trecerii de la o stare naturală, calitativ superioară la una alterată), (2)


neglijarea efectelor indirecte a multor factori de mediu, (3) heterogenitatea
mediului în spaŃiu şi – mai ales – în timp, (4) necunoaşterea istoriei ariei, a
habitatului sau a sistemului ecologic în ansamblu. Aceste probleme conceptuale,
la care se adaugă scara temporală redusă a majorităŃii studiilor clasice, conduc
frecvent la date false sau la interpretarea eronată a rezultatelor.

B. Studii pe termen lung


Prin "termen lung" se înŃelege o perioadă de câŃiva ani (prin convenŃie mai
mult de trei), până la câteva decenii, de obicei mai puŃin de un secol. Aceasta este
o scară temporală potrivită celor mai multe categorii de studii ecologice, având ca
subiect probleme complexe de actualitate, cu repercusiuni asupra naturii, a
mediului şi societăŃii umane. În acestea sunt incluse evenimente rare, cele care se
desfăşoară cu viteză redusă, cele eratice, episodice, cu variabilitate
(heterogenitate a expresiei) mare, respectiv evenimente subtile (puŃin evidente) şi
complexe. Succesiunile ecologice sunt greu de studiat direct, fie ele naturale sau
iniŃiate antropogen, la o altă scară decât cea a deceniilor. Cu toate avantajele
acestei abordări studiile pe termen lung în ecologie sunt extrem de puŃine, faŃă de
câte ar fi necesare. Motivele sunt cel mai adesea legate de limitările de personal
calificat şi de fonduri: majoritatea cercetătorilor sunt motivaŃi atât pe plan psihic,
cât şi pe cel profesional, să obŃină rezultate cât mai valoroase într-un timp cât mai
scurt. Fondurile sunt un alt element critic: cele mai multe surse nu sunt dispuse să
finanŃeze o cercetare cu un interval temporal de desfăşurare prea lung, din diverse
motive, cum ar fi necesitatea raportării de noi şi noi rezultate, satisfacerea
forurilor care deŃin şi gestionează banii, schimbări de natură politică şi
reconfigurarea perpetuă a priorităŃilor etc. Este mare păcat că acest gen de studii,
imperativ necesare, este împovărat de capriciile epocii moderne: goana după
rezultate imediate, profit, supraestimarea cercetării aplicate în detrimentul celei
fundamentale, stabilirea unor legături detrimentale de tipul modelor între politică
- economie şi ştiinŃă.
În unele cazuri, studiile pe termen lung pot fi înlocuite cu studii
comparative sau cu cele retrospective.

C. Studii retrospective
În cadrul acestora se reconstituie succesiunea din trecut a evenimentelor,
printr-o serie de tehnici bazate pe dovezi păstrate în cele mai variate forme.
Amintim aici reconstituirile evolutive bazate pe ceasuri moleculare, studiile de
dendrocronologie, reconstituirea paleoclimatului pe baza analizei speleotemelor,
extragerea şi studiul carotelor din gheŃari (de suprafaŃă sau din peşteri) şi
interpretarea datelor microbiologice, a microfosileor, respectiv analiza fizico-
chimică a gheŃii din diferitele straturi, stratificarea fosilelor etc. Toate acestea pot
constitui (uneori) un substitut al studiilor pe termen lung, referindu-se însă la
trecut şi nu la viitor. Ele nu aduc răspunsuri ale problemelor emergente şi în curs
de agravare, dar oferă o bază de referinŃă, un fel de "probă martor temporală",
I. Sîrbu - Modelarea proceselor ecologice (2010) 20

facilitând cunoaşterea tendinŃelor şi a vitezei schimbărilor. Din acest motiv sunt


prea rar metode substitutive; cel mai des sunt corelative sau aditive.

D. Studii comparative
Studiile comparative derulate la scară spaŃială largă măresc potenŃialul
explicativ şi predictiv în ecologie. Semnifică analiza şi interpretarea efectelor,
diferenŃiate în timp şi spaŃiu, a unui factor sau unei cauze cu rezultate
heterogene, prin compararea rezultatelor independente şi a răspunsurilor
diferitelor sisteme ecologice afectate de aceasta. Altfel spus, comparăm
structural, dinamic şi funcŃional diferite sisteme ecologice, situate în arii diferite,
care au fost supuse aceleiaşi perturbări. Acestea pot surprinde în spaŃiu, ceea ce
studiile pe termen lung sesizează în timp, şi anume rezultatele unor procese
complexe, iniŃiate în perioade diferite, respectiv răspunsuri variate la acŃiunea
aceloraşi factori disturbatori. Aceste studii pot fi experimente planificate sau
sinteze post-facto a studiilor preexistente (cum ar fi de exemplu sinteza tuturor
lucrărilor publicate cu privire la unul şi acelaşi subiect). Avantajele sunt evidente
şi în linii mari au fost enunŃate, dezavantajele sunt legate de lipsa posibilităŃii de
evidenŃiere a mecanismelor şi a cauzalităŃii, care poate fi relevată prin
experimente concentrate în timp real.

E. Substituirea timpului cu spaŃiul


O succesiune, de exemplu, se poate studia prin surprinderea stadiilor
diferite, în habitate diferite ale aceluiaşi tip de ecosistem, asupra căruia factorul
declanşator a acŃionat diferenŃiat (de exemplu incendii de vechimi diferite vor
caracteriza arii cu stadii succesionale diferite, ecologul având şansa de a
reconstitui sincron succesiunea ca şi cum s-ar fi desfăşurat în timp). Acest gen de
studii se pot desfăşura numai în cazurile în care se demonstrază că spaŃiul poate
constitui un substitut pentru timp. Ele se bazează pe premiza că secvenŃele
spaŃiale sunt omologe cu cele temporale, iar tendinŃele temporale se pot extrapola
din cronosecvenŃe (situri sau probe de vârste diferite). Ele dau rezultate foarte
bune în investigaŃiile de paleoclimatologie, paleoecologie, reconstituirea
evoluŃiei, a succesiunilor ecologice etc., dar nici acestea nu constituie modalităŃi
explicative pentru elucidarea mecanismelor răspunzătoare de efectele studiate.

F. Studii de simulare
Se bazează pe modele matematice ale proceselor şi sistemelor ecologice,
care se alcătuiesc la un nivel adecvat de complexitate, implementate pe
calculator, utilizând softuri de specialiate, asupra cărora ecologii execută
nenumărate experienŃe virtuale în scopul de a cunoaşte, imita şi prognoza
comportamentul unui sistem, ca urmare a modificărilor unui număr nedefinit de
forŃe şi elemente. Rularea acestor modele produce o simulare a dinamicii
fenomenelor, indicând probabilistic răspunsurile posibile ale sistemelor reale, dar
într-un mediu virtual.
I. Sîrbu - Modelarea proceselor ecologice (2010) 21

Pentru a realiza managementul unui sistem ecologic complex (caracterizat


printr-un număr mare de variabile de stare şi de proces, prin relaŃii de tip cauză-
efect numeroase şi interconectate), este necesară construirea unui model şi
simularea traiectoriilor acestuia în variate condiŃii ale diferiŃilor parametri.
După Cox (2002) un mediu de simulare este constituit din două părŃi.
Prima este un set de ecuaŃii matematice care descriu structura şi relaŃiile dintre
diferitele compartimente ale unui ecosistem. A doua este o tehnică matematică şi
informatică, ce permite urmărirea trăsăturilor cantitative ale dinamicii sistemului
(deci a traiectoriei acestuia) în timp.
Simularea este extrem de benefică pentru a evita experimente nedorite,
rezultate regretabile sau erori de implementare a unor proiecte de redresare sau
reconstrucŃie ecologică. Pentru a fi util un asemenea demers este necesar ca
modelul şi mediul de simulare să fie cât mai aproape de însuşirile reale ale
sistemelor, în caz contrar abordarea conducând la un eşec major.

G. Studii bazate pe restaurarea şi reconstrucŃia ecologică


Ecologia are mult de câştigat de pe urma proiectelor de restaurare,
redresare sau reconstrucŃie ecologică, deoarece numeroase teorii şi ipoteze, de la
cele mai simple privind creşterea numerică a populaŃiei, până la cele care
încearcă să relaŃioneze biodiversitatea de rezistenŃa sau rezilienŃa sistemelor
ecologice, pot fi urmărite în regim controlat. Orice demers de acest gen poate fi
asimilat cu un experiment, care poate fi abordat, urmărit şi interpretat ca oricare
altă temă de cercetare sau studiu de profil.

3.4. Specificarea domeniului de studiu

Dimensionarea şi definirea domeniului de studiu este principala problemă


a designului experimental şi a implementării acestuia.
ÎnŃelegerea fenomenelor ecologice necesită monitorizarea pe termen
lung a trăsăturilor şi proceselor de importanŃă majoră, în unităŃi de probe
martor şi experimentale, dimensionate şi alese în mod adecvat, la o scară
optimă spaŃială şi temporală, prin utilizarea corectă a metodelor de colectare
a probelor şi ale analizei statistice. Selectarea domeniului de studiu se referă
la alegerea subiectului, a scărilor de abordare, la dimensionarea justă a
experimentelor şi probelor, la alegerea numărului necesar de parametri care
vor fi utilizaŃi în studiu. Nu există nici o reŃetă care să dea răspunsuri univoce la
aceste probleme. Cu toate acestea există principii generale, pe care orice ecolog
le respectă pentru a dimensiona în mod corect efortul şi domeniul de studiu:
- Se dezvoltă cât mai mult înŃelegerea procesului sau a fenomenului, printr-o
documentare cât mai exhaustivă, prin toate mijloacele posibile.
- Pe baza a ceea ce s-a realizat în trecut, a experienŃei acumulate (pozitive şi
negative), a resurselor disponibile, ecologul selectează scara spaŃială, temporală
şi tematică, astfel încât obiectivele să fie atinse şi să existe şansa de a oferi un
răspuns la problema ridicată.
I. Sîrbu - Modelarea proceselor ecologice (2010) 22

- SpaŃial ne interesează dimensiunile sistemului, localizarea şi alegerea probelor,


colectarea, prelucrarea şi analiza lor.
- Temporal ne interesează frecvenŃa minimă şi cea optimă pentru colectarea
informaŃiilor din teren, periodicitatea replicărilor şi intervalul de timp absolut
alocat studiului particular.
- Tematic ne fixăm asupra acelor parametri ecologici şi fizico-chimici care pot
conduce în mod optim la rezolvarea problemei.
- Cel mai des limitările de personal, tehnică, timp (în sensul de termene limită) şi
bani, sunt printre cele mai importante argumente care impun selectarea (în mare
parte) a domeniului de studiu.
Oricum am alege şi orice strategie am adopta, bazată pe necesităŃi şi
limitările impuse în mod obiectiv, selectarea domeniului de studiu este pe departe
cea mai importantă sarcină şi tot odată cea mai mare provocare în cadrul unui
proiect de cercetare.
Pentru o benefică selecŃie a acestui domeniu, alte trei consideraŃii pot avea
un impact major: puterea statistică, standardizarea şi studiile pilot.
Puterea statistică reprezintă capacitatea experimentului de a detecta
efectele acŃiunii factorilor (a experimentelor) la o anumită scară spaŃio-temporală,
respectiv semnifică posibilitatea de respingere corectă a ipotezei nule. Evaluarea
puterii statistice este critică pentru selectarea unui design experimental,
necesitând specificarea corectă a nivelului de semnificaŃie (probabilităŃilor de
eroare), a dimensiunii probei, a limitelor de confidenŃă şi a acurateŃiei aparatului
matematic folosit.
Analizele şi interpretările în cadrul studiilor de ecologie sunt frecvent
facilitate dacă sunt folosite metode standardizate. Acestea se referă însă mai
ales la parametrii fizico-chimici şi mai rar la cei ecologici. Dar apar din ce în ce
mai multe tehnici noi, aparate, instrumente, indici sau metode standardizate
pentru diferite studii, care permit fie reducerea la limite neglijabile a erorilor, fie
– mai frecvent – obŃinerea la scară largă, a erorilor sistematice, care permit
compararea rezultatelor diverselor studii, realizate în întreaga lume.
Executarea unor studii pilot este extrem de benefică, în mod special
înainte de a evalua sau a concepe orice design experimental sau oricare program
de colectare a probelor. Studiile pilot sunt extrem de necesare în domenii mai
puŃin cunoscute sau la lansarea unor ipoteze cu caracter ridicat de originalitate.
Aceste studii permit inclusiv formarea şi rodajul echipei, verificare aparatelor şi a
tehnicii, identificarea problemelor necunoscute accesorii, pot da indicaŃii foarte
utile asupra dimensionării probelor, a replicării, a costurilor viitoare etc. Ori de
câte ori este posibil se recomandă iniŃierea şi desfăşurarea unei investigaŃii pilot
(W.K. Michener, 2000).
I. Sîrbu - Modelarea proceselor ecologice (2010) 23

4. PRINCIPII, METODE ŞI SISTEME DE MANAGEMENT A


DATELOR ECOLOGICE

4.1. Principii ale managementului datelor ecologice


(adaptat după J.W. Brunt, 2000)

Datele şi informaŃiile ecologice sunt produsul fundamental al cercetării


ştiinŃifice de profil. În ştiinŃele mediului multe informaŃii au statut de unicitate,
adesea fiind imposibilă replicarea lor în condiŃii identice; multe fenomene sunt
rare sau simpla barieră deontologică, care solicită sacrificarea unui număr cât mai
mic de exemplare, protejarea speciilor rare sau vulnerabile, respectiv deranjarea
cât mai redusă a sistemelor investigate, împiedică de asemenea replicarea în orice
condiŃii a eşantioanelor. Multe proiecte, în mod special cele care se desfăşoară pe
termen lung, necesită date de calitate, inteligibile şi utile, pentru a servi scopului
pentru care sunt implementate. Este extrem de grav să aflăm după ani şi ani, că
datele din trecut nu pot fi utilizate, sau condiŃiile în care au fost obŃinute nu
corespund cu cele adoptate mai recent, motiv pentru care informaŃiile nu pot fi
comparate şi nici folosite.
Datele care rezultă din studiile de ecologie trebuie să fie utile, să ofere
soluŃii la problemele investigate, să fie clare, inteligibile, să poată fi accesate, dar
să fie securizate împotriva degradării calităŃii lor, intenŃionate sau nu. Două
principii esenŃiale pot facilita managementul iniŃial de succes al datelor:
1. începutul să fie făcut la scară mică, modest, simplu şi flexibil;
2. ecologii să se implice în procesul de management al datelor (să nu considere că
este numai sarcina unor tehnicieni sau informaticieni, de exemplu).
Primul principiu se referă la evitarea tehnologiilor sofisticate, la
construirea bazelor de date accesibile unor utilizatori diferiŃi şi care să poată fi
recunoscute de softuri variate. Flexibilitatea este de asemenea esenŃială din cauza
heterogenităŃii echipamentelor de calcul, a modalităŃilor variate prin care ecologii
percep, utilizează şi analizează informaŃiile.
Al doilea principiu se referă la orientarea sistemului de management al
datelor spre oameni şi soluŃionarea problemelor analizate de aceştia; sistemul de
gestiune depinde de integrarea ecologilor, care au rolul de a defini obiectivele
sistemului de date, de a stabili priorităŃile şi alocarea resurselor. Aceste sisteme
trebuie să reflecte obiectivele şi priorităŃile programului de cercetare.
Componentele managementului datelor, precum şi relaŃiile dintre acestea şi
cercetare sunt redate în Fig 4.1.
I. Sîrbu - Modelarea proceselor ecologice (2010) 24

IniŃierea studiului

Design date şi metadate

ObŃinerea şi controlul
calităŃii datelor

Stocarea şi menŃinerea
datelor

Prelucrarea şi asigurarea
calităŃii datelor

Analiza şi interpretarea
datelor

Acces şi arhivare

Publicare (valorificarea rezultatelor)

Fig. 4.1. Componentele sistemului de management al datelor şi relaŃiile


acestuia cu cercetarea

Managementul datelor trebuie privit ca un proces care începe cu


conceperea şi planificarea proiectului de cercetare, se continuă cu obŃinerea
informaŃiilor, prelucrarea, controlul şi asigurarea calităŃii lor, analiza,
interpretarea şi se termină cu publicarea rezultatelor, arhivarea şi distribuirea
informaŃiei la toŃi potenŃialii utilizatori, din lumea ştiinŃifică, administraŃie,
educaŃie etc. O bună gestiune a informaŃiilor la nivel instituŃional poate facilita
cercetarea, iniŃiază noi proiecte, contribuie la dezvoltarea de programe instructive
şi educative etc.
Gestiunea unitară şi adecvată a informaŃiilor devine din ce în ce mai
importantă, pe măsură ce obiectivele cercetării ecologice devin tot mai complexe
şi mai pretenŃioase. Aceste sisteme s-au dezvoltat mai ales în ultimii 30 de ani, pe
seama unor proiecte de mare anvergură dintre care amintim Programul Biosferei
(Biosphere Program IBP) sau Programul de Cercetare Ecologică pe Termen-
I. Sîrbu - Modelarea proceselor ecologice (2010) 25

Lung a SUA (US Long-Term Ecological Research – LTER), respectiv al Europei


(Europe Long-Term Ecosystem Research Network).
RaŃiunile pentru conceperea şi implementarea unui sistem de management
al datelor ecologice sunt dintre cele mai diverse:
- păstrarea datelor pentru o perioadă mai lungă decât cea a vieŃii cercetătorilor;
- facilitarea recuperării datelor istorice, greu sau deloc accesibile;
- ajută pregătirea datelor în vederea realizării de cataloage, bănci de date, revizii
şi publicaŃii;
- asigură accesul la date pentru o comunitate ştiinŃifică mult mai largă, mai ales
dacă sunt introduse într-un format accesibil prin internet;
- reduc timpul şi efortul cercetătorilor interesaŃi de subiect, care localizează,
accesează şi investighează datele existente în diferite scopuri profesionale;
- creşte complexitatea scopului şi a obiectivelor viitoarelor proiecte implementate
la scară largă;
- permite achiziŃiile automate de date pentru modelarea ecologică.

Scopul primar al oricărui sistem de implementare a managementului


datelor este asigurarea organizării şi menŃinerii calităŃii acestora un timp
îndelungat, în cadrul unui buget rezonabil. A doua cerinŃă este facilitarea
accesului la date pentru cercetători şi alte persoane interesate, fără a afecta
integritatea datelor. În paralel a treia sarcină este asigurarea securităŃii datelor
prin arhivare, pentru a le proteja de accidente umane sau de altă natură. A patra
cerinŃă este asigurarea de asistenŃă pentru cei care se ocupă de controlul şi
menŃinerea calităŃii acestor date.

• CerinŃe ale implementării sistemului de management al datelor

După cum s-a văzut în schema anterioară un sistem de management al


datelor implică obŃinerea (achiziŃia) datelor, menŃinerea (păstrarea, depozitarea),
prelucrarea, analiza, arhivarea, precum şi facilitarea accesului la date şi rezultate.
Din punct de vedere organizaŃional aceste activităŃi includ dezvoltarea
infrastructurii, a personalului, politicilor şi procedurilor instituŃionale. Cele 6
cerinŃe ale acestui sistem, constituind tot atâtea activităŃi necesare pentru
implementarea lui la nivel instituŃional, sunt:
1. inventarierea şi compilarea datelor existente şi a resurselor, precum şi stabilirea
priorităŃilor de implementare;
2. designul adecvat al datelor şi organizarea acestora în seturi (baze unitare), care
să faciliteze păstrarea, accesarea şi prelucrarea;
3. definirea de proceduri pentru achiziŃia datelor, asigurarea calităŃii şi controlul
calităŃii lor (AC/CC).
4. dezvoltarea de protocoale pentru documentarea datelor şi – mai ales – a
metadatelor;
5. protocoale pentru arhivare şi menŃinerea cataloagelor tipărite şi electronice;
I. Sîrbu - Modelarea proceselor ecologice (2010) 26

6. dezvoltarea procedurilor şi structurilor administrative, astfel încât


responsabilităŃile să fie clar delimitate.

Designul datelor trebuie realizat înainte de obŃinerea acestora şi trebuie să


reflecte designul experimental. Dacă acesta este clar şi reflectă calitatea datelor
ecologice obŃinute, facilitează introducerea lor într-un format electronic,
prelucrarea statistică a lor şi dezvoltarea arhivelor, respectiv a metadatelor.
Designul se referă la organizarea logică a datelor într-un format de tip tabel, în
cadrul căruia coloanele reprezintă variabile definite unitar, care fac obiectul unui
inventar, respectiv al unei legende separate, care să poată fi citită de diferite
softuri în vederea prelucrării şi analizei. Tabelele trebuie să prezinte datele ca
variabile dependente şi independente. În cazul existenŃei multor variabile
(ecologice, ale mediului fizico-chimic, sociale, economice etc.) este necesară
introducerea unor atribute care să poată stabili relaŃii între diferitele fişiere sau
tabele. Astfel, în funcŃie de necesităŃi, tabelele pot fi ulterior unite sau alipite pe
baza acestor atribute de relaŃionare. Procedura de desemnare a unei structuri
precise a tabelelor de date, pentru implementarea lor într-un sistem de
management al bazelor de date (SMBD), se numeşte normalizare.
Softurile pentru aceste deziderate sunt multe; depinde de necesitatea
cercetătorilor şi de obiectivele proiectelor să aleagă acele programe care
corespund cel mai bine scopului pentru care au fost create. Uneori este necesară
utilizarea unui sistem de management al fişierelor de date, care este inclus în cele
mai multe sisteme de operare, sau poate fi găsit în pachete de softuri specializate
pe gestiunea datelor. O altă variantă, adresată ecologilor cu preocupări în
programare şi operarea calculatoarelor, este constituirea nu numai a bazei de date
ci şi a programelor de gestiune ale acesteia, cum ar fi, de exemplu, FoxPro,
Oracle, MS SQL, Microsoft Access etc., cele două alcătuind împreună o bancă
de date. Cel mai simplu este păstrarea datelor în softuri pentru prelucrarea foilor
de lucru sau de calcul (spreadsheets, în engleză), cum sunt Excel sau Lotus 1-2-3,
care realizează o gamă limitată de analize, dar adesea suficientă pentru unii
utilizatori (însă cu foarte mici şi puŃine aplicaŃii în modelarea ecologică). Trebuie
avut grijă cu aceste softuri, deoarece ele nu menŃin consistenŃa internă a
articolelor (fiecare coloană poate fi manipulată independent de fiecare rând), spre
deosebire de programele specializate pe gestionarea băncilor de date. Un aspect
pozitiv, totuşi, merită subliniat: aceste softuri sunt compatibile, în ceea ce
priveşte recunoaşterea datelor şi a variabilelor, cu cele capabile să realizeze
modelare ecologică performantă. Este recomandabil ca neofiŃii să menŃină şi să
trimită datele în foi de calcul, mai degrabă decât în alte formate, urmând ca cei
care se ocupă de modelare să le transpună într-un soft adecvat.
Dacă datele au o componentă spaŃială, se poate apela la un tip particular de
SMBD şi anume sistemul de informaŃii geografice (Geographic Information
Systems – GIS).
I. Sîrbu - Modelarea proceselor ecologice (2010) 27

Necestitatea de accesare şi diseminare a informaŃiilor determină ca multe


(dacă nu toate) dintre aceste sisteme să fie totodată parte a unor sisteme
informaŃionale bazate pe internet.

• Controlul şi asigurarea calităŃii datelor (CC/AC)

Acestea sunt mecanisme proiectate în scopul evitării introducerii de erori


în seturile de date, proces care se mai numeşte contaminarea datelor. Există
două tipuri fundamentale de contaminare: prin adăugare şi prin omisiune.
Erorile adăugate se realizează prin includerea de date incorecte sau alterate, ca
urmare a unei mari varietăŃi de cauze: transcriere greşită din caietul de teren,
rateuri ale instrumentelor etc. Acestea sunt comune şi relativ uşor de identificat,
respectiv de corectat. Erorile prin omisiune (lipsa unor date, informaŃii) sunt mult
mai greu de detectat, adesea rămân necunoscute, fiind produse – de exemplu –
prin pierderea unor probe sau prin documentare incompletă, fapte care pot afecta
major interpretarea şi calitatea rezultatelor.
Procedurile de CC sunt eficiente pentru reducerea erorilor adăugate. Sunt
mecanisme aplicate înainte de obŃinerea datelor şi care cotrolează modul în care
acestea sunt achizionate şi înregistrate. Un exemplu sunt fişele standard de teren,
care necesită completarea tuturor câmpurilor şi categoriilor de informaŃii
solicitate. Un altul este cazul bazelor de date care solicită anumite răspunsuri (de
exemplu Da – Nu) pentru continuarea rulării programului de introducere a
datelor, precum şi semnalarea articolelor incomplete etc.
Procedurile de AC sunt utilizate pentru a detecta atât omisiunile cât şi
adăugările. O modalitate simplă este reprezentarea grafică a norului de puncte
experimentale pentru a identifica valorile aberante. Metode mai avansate sunt
programe statistice, care verifică unitatea şi calitatea datelor.
Controlul şi asigurarea calităŃii datelor ecologice implică patru activităŃi:
1. definesc şi impun standarde pentru formate, coduri, unităŃi de măsură şi
metadate;
2. verificarea unor modele neobişnuite sau nerezonabile în date;
3. verificarea prin comparaŃie a valorilor statistice, descriptive sau de altă natură,
a seturile de date;
4. evaluarea calităŃii generale a datelor prin tehnici speciale.

• Documentarea datelor (Metadate)

Metadatele reprezintă informaŃii despre date, altfel spus ele sunt


documentaŃia (de obicei scrisă literal) structurală, logică şi metodologică a unui
set de date. Ele descriu nu numai informaŃiile conŃinute de o BD, ci descriu şi
condiŃiile, aparatura, tehnica, metoda, numărul şi dimensiunea probelor, condiŃiile
de mediu etc. Adică sunt toate informaŃiile care permit înŃelegerea, replicarea şi
compararea datelor respective cu studii ulterioare. Aceste informaŃii sunt parte
I. Sîrbu - Modelarea proceselor ecologice (2010) 28

constituentă a oricărui SMBD, motiv pentru care trebuie codificate, relaŃionate şi


integrate în orice set de date ecologice.

• Politica de acces a datelor

Este la latitudinea diferitelor echipe de cercetare şi instituŃii să definească


strategiile pentru accesarea datelor de către persoane terŃe. Uneori este explicită
necesitatea achiziŃiei (obŃinerea contra cost) a datelor, fapt realizat de multe (dacă
nu cumva cele mai multe) dintre instituŃiile guvernamentale. Alteori, mai ales în
cazul băncilor de date ştiinŃifice, este permis accesul liber la metadate, dar este
necesară solicitarea accesului condiŃionat la datele propriu-zise. Acest fapt
implică recunoaşterea surselor şi citarea corespunzătoare a informaŃiilor,
respectiv a echipei şi a proiectului care au generat informaŃiile de specialitate.
Există cazuri în care datele pot fi folosite la doi ani după punerea lor în circulaŃie,
în ideea de a da timp autorilor să publice rezultatele. Nu există o singură
strategie: fiecare cercetător, grup sau instituŃie are libertatea de a decide condiŃiile
de accesare, utilizare şi citare a informaŃiilor.

4.2. Baze ştiinŃifice de date ecologice


(adaptat după J.H. Porter, 2000)

O bază ştiinŃifică de date este o colecŃie computerizată de informaŃii,


organizate astfel încât să fie accesibile pentru investigaŃii şi interogări ulterioare,
precum şi pentru asistenŃa şi susŃinerea studiilor pe termen lung. Bazele de date
permit interogarea seturilor diferite şi heterogene de informaŃii, precum şi
utilizarea acestora în noi modalităŃi, cum ar fi de exemplu în studiile
interdisciplinare sau cele de sinteză. Ele prezintă mult mai multe avantaje decât
facilitarea acesului la date. De exemplu, accesul mai multor specialişti permite
detectarea erorilor posibile şi contribuie la menŃinerea calităŃii superioare a
datelor. Alt avantaj este legat de costuri: este mai ieftin să salvăm date, decât să le
obŃinem din nou, presupunând că acest din urmă fapt este posibil. Nu în ultimă
instanŃă, bazele de date permit interogarea diverselor resurse informative, care
susŃin procese de luare a deciziilor.
Există o serie de deosebiri între bazele ştiinŃifice de date şi cele economice
sau din mediul afacerilor. ŞtiinŃă înseamnă, printre altele, să punem noi şi noi
întrebări, motiv pentru care sistemele de gestiune a informaŃiilor trebuie să fie
flexibile şi adaptabile la o serie de noi interogări. Datele în ştiinŃă nu fac obiectul
schimbării şi nici a înlocuirii, cu excepŃia corecturilor ocazional necesare. În
afaceri bazele de date sunt exploatate în special prin sinteze sub forma unor
rapoarte standardizate, ceea ce nu este cazul în cercetare. O altă deosebire este
faptul că datele ecologice sunt extrem de diverse şi heterogene; chiar cele puŃine,
obŃinute de un singur individ, necesită metadate complexe pentru a putea fi
înŃelese şi reutilizate. Aceeaşi diversitate o regăsim şi printre utilizatori: aceştia
aparŃin unor numeroase domenii de specializare şi prezintă necesităŃi diferite,
I. Sîrbu - Modelarea proceselor ecologice (2010) 29

motiv pentru care BD trebuie organizate astfel încât să întrunească în linii mari
aşteptările acestora.
Dezvoltarea unei baze de date este un proces evolutiv: ea va deservi o
comunitate dinamică de utilizatori, va permite actualizări şi complicări în funcŃie
de dezvoltarea informaŃiilor şi a solicitărilor celor interesaŃi. În realizarea unei
BD trebuie să răspundem la patru întrebări, iar răspunsurile trebuie să fie
satisfăcătoare pentru ca aceasta să deservească scopul pentru care a fost creată:
1. De ce este necesară această bază?
2. Cine vor fi utilizatorii ei?
3. La care întrebări va trebui să răspundă baza de date?
4. Ce motivaŃii sunt disponibile pentru cei care produc datele?

Nu există o corelaŃie directă între volumul datelor (raportat la un set) şi


complexitatea acestora, respectiv necesităŃile metadatelor. Unele, de exemplu
imaginile satelitare, au un volum imens, însă complexitatea lor este extrem de
scăzută, spre deosebire de informaŃiile care provin din analizele carotelor de sol
sau gheaŃă, care prezintă complexitate mare dar volum redus. Ambele atribute
sunt mari la informaŃii ale sistemelor GIS (Fig. 4.2).

Mare

Imagini satelitare

Sisteme GIS

Date climatice

Volumul datelor Studii de biodiversitate


(raportat la un
set de date)
Date economice

Date populaŃionale
Productivitate primară

SecvenŃe ale genelor Carote de sol sau gheaŃă

Mic(ă) Complexitate/ necesităŃile metadatelor Mare

Fig. 4.2. RelaŃia dintre volumul datelor şi complexitatea acestora


I. Sîrbu - Modelarea proceselor ecologice (2010) 30

• Categorii de baze de date (BD)

Există mai multe tipuri de baze de date, fiecare ilustrând diferite modalităŃi
de organizare a informaŃiilor, a necesităŃilor legate de interogare, accesare şi
utilizare ulterioară. Caracteristicile acestora sunt descrise sintetic în Tab. 4.1.

Tab. 4.1. Clasificarea bazelor ştiinŃifice de date

Categorie Caracteristici
BD bazate pe sisteme de fişiere - Simplitate: poate utiliza software
Utilizează fişiere şi directoare pentru generalizat, cum ar fi procesoare de texte
organizarea informaŃiilor; nu este sau organizatoare de fişiere;
considerată o BD tipică. - IneficienŃă: creşterea numărului de
fişiere într-un director duce la scăderea
vitezei de interogare;
- CapacităŃi reduse: puŃine posibilităŃi de
prelucrare, căutare şi analiză.
BD ierarhice - Păstrarea eficientă a datelor cu structură
Păstrează datele într-un sistem organizat ierarhică;
în niveluri: de exemplu o bază de date - Optimă pentru baze de imagini;
sistematice, cu configuraŃia arborelui - Relativ rigidă: necesită un proces de
filogenetic; planificare detaliată.
BD tip reŃea - Mai puŃine constrângeri decât BD
Păstrează datele în unităŃi interconectate, ierarhice;
cu puŃine contrângeri asupra tipului şi - Legăturile sunt definite ca parte a
numărului de legături; structurii BD;
- ReŃelele pot deveni haotice dacă nu sunt
planificate corespunzător;
BD relaŃionale - Larg răspândite, adaptate la tehnologia
Datele sunt păstrate sub formă de tabele, actuală (IT);
legăturile dintre ele realizându-se prin - Eficiente pentru interogare şi generarea
atribute sau variabile de relaŃionare. de rapoarte şi sinteze;
Exemple: BD realizate în software ca - InterfeŃe standardizate;
SQL, DBASE, FoxPro etc. - PosibilităŃi restrânse pentru structuri de
date;
BD orientate pe obiecte - Moderne, tehnologii în plină dezvoltare;
Păstrează datele în obiecte (proceduri - largă amplitudine de posibilităŃi de
relativ independente), fiecare conŃinând definire a structurii datelor;
un set de metode pentru accesarea şi - pot utiliza şi defini multe tipuri de
prelucrarea datelor. obiecte;
- nu sunt la fel de eficiente ca BD
relaŃionale pentru elaborarea de sinteze şi
rapoarte.

Bazele ierarhice de date prezintă informaŃiile organizate rigid, pe anumite


niveluri, fiecare articol fiind legat de un singur nivel superior, dar poate avea mai
multe articole subordonate. Sunt comun folosite în bazele de date biosistematice,
pentru ilustrarea relaŃiilor filogenetice. Bazele de date relaŃionale sunt printre cele
mai utilizate în ştiinŃă, folosind totodată softuri populare. Ele permit specificarea
I. Sîrbu - Modelarea proceselor ecologice (2010) 31

legăturilor pe baza a însăşi valorilor datelor. Aceasta permite o mare flexibilitate


în gestiune, adăugare de informaŃii noi, relaŃii şi exploatări dintre cele mai
diverse, explicându-se astfel popularitatea lor. Bazele de date orientate pe obiecte
sunt în plină emergenŃă, ele permiŃând, printre altele, extinderea heterogenităŃii
tipurilor de date cu structuri complexe (de exemplu integrarea de imagini, hărŃi
etc.). Ele sunt realizate de obicei în limbaje orientate pe obiecte, cum ar fi C++
sau JAVA. Indiferent de tipul BD ales, un mare avantaj al ultimilor ani este
posibilitatea de interacŃiune cu reŃeaua mondială de informaŃii (World Wide
Web sau www). Aceasta permite construirea de BD interactive, respectiv
adunarea informaŃiei printr-o reŃea difuză de contribuitori (cercetători din cele
mai diverse locaŃii), şi accesul mult mai rapid şi simplu la informaŃii, respectiv la
rapoartele generate automat prin programe de gestiune orientate pe obiecte.
Un alt aspect este necesitatea relaŃionării resurselor de informaŃie.
Maximizarea utilităŃii BD reclamă mult mai mult decât simpla creare de BD
individuale. Abordările integrative în cercetare solicită combinarea datelor din
cele mai diverse categorii şi surse. Utilizatorii beneficiază astfel de posibilitatea
căutării de informaŃii din BD multiple, pe baza unui singur raport.
Dacă alegem drept criteriu de clasificare natura conŃinutului, BD se pot
împărŃi în profunde (adânci) şi largi. Cele adânci sunt specializate pe o singură
temă sau câteva categorii de date şi se caracterizează prin însuşiri de căutare,
interogare şi analiză sofisticate. Aici putem include baze de date pentru un anumit
grup sistematic (de exemplu un gen, o familie sau chiar o singură specie), sau
GenBank, BD care conŃine arhiva proiectului genomului uman şi multe altele etc.
BD largi tind să conŃină toate informaŃiile legate de un anumit subiect, domeniu
de cercetare sau cunoaştere. Aici sunt incluse BD geofizice sau cele ale
cosmosului (de exemplu cele gestionate de NASA). DiferenŃele dintre BD adânci,
respectiv a celor largi, sunt redate sintetic în Tab. 4.2.

Tab. 4. 2. Caracteristici comparative între bazele de date "adânci" şi a celor "largi"

BD “ADÂNCI” BD “LARGI”
- specializate pe o singură sau câteva - conŃin multe categorii diferite de date;
categorii de date;
- număr foarte mare de informaŃii despre - multe informaŃii diverse, dar relativ
o categorie de date; puŃine, raportate la o anumită categorie;
- oferă unelte sofisticate pentru interogare - multe unelte pentru localizarea datelor,
şi analiză; dar în mod caracteristic nu posedă
proceduri pentru analiză;
- uneltele de gestiune operează primar - uneltele de gestiune operează primar
asupra conŃinutului datelor. asupra conŃinutului metadatelor.

Alte exemple sunt bazele orientate pe anumite proiecte, cum ar fi cele ale
cercetărilor pe termen lung (un bun exemplu este chiar BD a LTER). În sfârşit
multe alte baze, cum ar fi cele ale cercetătorilor individuali, nu pot fi încadrate la
nici una dintre categoriile antemenŃionate. Nivelul dezvoltării acestora variază în
limite foarte largi, la fel şi calitatea, respectiv cantitatea metadatelor asociate.
I. Sîrbu - Modelarea proceselor ecologice (2010) 32

Nici o BD nu există izolat de comunitatea utilizatorilor. Pentru a satisface


exigenŃele acestora, anumite cerinŃe trebuie respectate pentru ca oricare colecŃie
de informaŃii să atingă scopul pentru care a fost realizată:
1. Să conŃină date necesare sau solicitate de cel puŃin un grup de utilizatori;
2. Datele să fie actualizate permanent, să fie cât mai complete, şi să existe
motivaŃii sau beneficii pentru cei care le produc;
3. InformaŃile rezultate din gestiunea acestora trebuie să fie atractive pentru
utilizatori;
4. Nivelul sofisticării tehnologice a sistemului trebuie să fie pe măsura celui
al utilizatorilor;
5. Să existe mecanisme prin care BD să răspundă cerinŃelor şi întrebărilor
puse de utilizatori şi să identifice cele pe care aceştia nu şi le pun.
6. Pentru ca o BD să aibă succes, toate aceste cerinŃe trebuie satisfăcute!

4.3. Metadate
(după W.K. Michener, 2000)

Foarte puŃine dintre datele din caietele de teren, laborator, foi de lucru,
tabele sau fişierele personale ale cercetătorilor sunt autoexplicative. Cei mai mulŃi
ecologi se bazează pe însemnări şi memorie pentru a-şi aminti semnificaŃiile şi
condiŃiile în care acestea au fost obŃinute, informaŃii care sunt complet
inaccesibile altor specialişti sau potenŃiali beneficiari. Din aceste motive este
imperativ necesară construirea metadatelor, adică informaŃiile anexe şi conexe
datelor, care relevă semnificaŃia şi valoarea lor. Acestea includ documentaŃia cu
privire la conŃinutul seturilor de date, context, calitatea informaŃiilor, structura şi
accesibilitatea lor.
Metadatelor li se acordă o atenŃie din ce în ce mai sporită din partea
comunităŃii ştiinŃifice, a structurilor instituŃionale, politice, economice şi sociale.
Tot mai mult se recunoaşte valoarea arhivelor de date, calitativ superioare,
validate şi securizate, pentru abordarea problemelor cu efecte pe scară largă şi de
factură complexă, pentru monitoringul pe termen lung al proceselor ecologice şi
rezolvarea crizelor de mediu. Metadate inteligibile reprezintă cheia pentru
descifrarea şi utilizarea colecŃiilor de BD, a resurselor informaŃionale, susŃinând
utilizarea şi interpetarea amplă şi pe termen lung a datelor ecologice.
Datele ecologice primare sau brute sunt aproape întotdeauna sintetizate
prin prelucrare, ecologul publicând, raportând sau înscriind într-o bază de date
valori sintetice, de obicei statistice. Acestea sunt mai departe prelucrate, analizate
şi interpretate, astfel încât produsul final al demersului ştiinŃific este de obicei o
sinteză, care nu relevă nici cantitativ şi nici calitativ toată semnificaŃia datelor
primare. Prin urmare multă informaŃie, nerelevantă poate pentru un cercetător sau
o echipă, la un moment dat, se pierde iremediabil în timp, împreună cu contextul
şi semnificaŃiile particulare ale datelor originale. Generalizând acest fenomen,
putem recunoaşte că orice informaŃie se degradează şi la un moment dat tinde să
I. Sîrbu - Modelarea proceselor ecologice (2010) 33

se piardă în decursul timpului, proces care poartă denumirea de entropie a


informaŃiei (Michener, 2000). Acest fapt se datorează multor procese continue
(cum ar fi degradarea graduală a oricărui suport informativ, inclusiv a memoriei
personale) sau discrete (schimbări de carieră, încheieri sau abandonări ale
proiectelor, pensionări, decese în echipă, accidente etc). Cele mai multe
informaŃii conexe dispar imediat după predarea raportului, publicarea lucrării sau
terminarea finanŃării proiectului, sau pot fi datorate pierderii notiŃelor de teren
(respectiv abandonarea intenŃionată a acestora), a deteriorării memoriei
calculatoarelor etc. Un exemplu de variaŃie a entropiei informaŃionale în timp este
redat schematic în Fig. 4.3 (după Michener, 2000).
Momentul publicării
ConŃinut
informaŃional
Detalii specifice

Detalii generale

Pensionare sau
schimbarea carierei

Accidente

Deces

Timp

Fig. 4.3. Exemplu de entropie informaŃională în timp (degradarea normală a conŃinutului


informaŃional asociat cu date şi metadate). Accidente sau schimbări în tehnologia informaŃiei
(linie întreruptă) pot elimina accesul la datele primare în orice moment (după Michener,
2000).

Prin urmare, există cel puŃin trei beneficii de pe urma metadatelor. În


primul rând entropia informaŃiei este mult întârziată, ca urmare crescând
longevitatea informaŃiei originare. Chiar dacă datele primare sunt păstrate
corespunzător, din diverse motive semnificaŃia, condiŃiile de colectare şi toate
celelalte informaŃii contextuale se pierd iremediabil în absenŃa metadatelor. Al
doilea motiv este legat de posibilitatea de reutilizare a informaŃiei, în alte scopuri,
de către proprietarul datelor, la lungă vreme după obŃinerea acestora, sau de către
alŃi cercetători, facilitând comunicarea, documentarea şi compararea diferitelor
I. Sîrbu - Modelarea proceselor ecologice (2010) 34

rezultate şi proiecte. În sfârşit date bine documentate permit expansiunea scării şi


a complexităŃii de abordare a problemelor ecologice, susŃinând studii comparative
ample, în timp şi spaŃiu. Astfel, metadatele permit seturilor de date concepute
pentru un singur scop, să fie utilizate în scopuri şi proiecte diferite, multiple, în
mod repetat, o lungă perioadă de timp. În acest fel, o mare parte din semnificaŃia
ascunsă a datelor, imposibil de înŃeles de către autorul lor, poate fi relevată de
altcineva, altcândva şi într-un alt context, sau la multă vreme de la publicarea
originală. Nu în ultimă instanŃă, relevarea şi diseminarea documentării datelor
prin internet poate servi la cunoaşterea specialiştilor, la constituirea de echipe şi
studii noi, poate conduce inclusiv la beneficii economice (prin contactarea de
către viitorul beneficiar a autorului care deŃine datele, dar le-a făcut cunoscute
numai prin intermediul metadatelor). În linii mari se poate afirma că longevitatea
datelor ecologice este direct proporŃională cu disponibilitatea, claritatea şi
exhaustivitatea metadatelor asociate.
Atributele descriptive ale metadatelor pot fi dintre cele mai variate, un
posibil set fiind propus în ştiinŃă de Michener şi col. (1997, ap. Michener, 2000).
Acest sistem cuprinde un set de 5 clase de descriptori, fiecare cu mai mulŃi
indicatori.

Categorii şi subcategorii de parametri descriptori ai metadatelor:


1. Descriptori ai seturilor de date - atribute fundamentale ale setului,
cum ar fi titlul, numele autorilor, rezumat, cuvinte-cheie etc.
2. Descriptori ai începuturilor cercetării – orice informaŃie care explică
geneza unui set particular de date (ipoteze, caracterizarea fizico-
geografică a ariei investigate, poziŃia staŃiilor de prelevare a probelor,
design experimental, metode de cercetare utilizate, perioada de timp
alocată studiului, programul de colectare a probelor, aspecte legate de
sistematică etc.).
3. Descriptori ai stării setului de date şi ai accesibilităŃii acestora – în
ce stare se află informaŃiile şi care sunt condiŃiile de accesare ale
acestora, strategia şi perioadele de actualizare ale bazei, modalităŃile de
verificare, locaŃia şi mediul de stocare, persoane de contact, restricŃii
etc., dar nu în ultimă instanŃă condiŃii de citare sau chiar costuri impuse
de autori.
4. Descriptori ai structurii datelor - toate atributele relaŃionate de
structura fizică a fişierelor de date, cum ar fi: identitatea fişierelor sau
codurile, dimensiunea lor (nr. de articole, dimensiunea memoriei
ocupate etc.), format şi mod de stocare, informaŃii despre variabilele
utilizate (identitate, definiŃii, unităŃi de măsură), precizia de estimare,
erori posibile etc.
5. Descriptori suplimentari – adrese şi contacte alternative, procedurile
de asigurare şi menŃinere a calităŃii datelor, softuri şi algoritmi de
procesare şi arhivare, publicarea rezultatelor, istoria utilizării datelor
etc.
I. Sîrbu - Modelarea proceselor ecologice (2010) 35

Necesitatea dezvoltării acestor descriptori, ca de altfel a ansamblului


conceptual legat de metadate, derivă din necesitatea de găsire a răspunsurilor la
următoarele întrebări, ridicate în procesul de documentare sau identificare a unui
set specific de date, şi anume:
1. Ce date relevante există cu privire la un anumit subiect?
2. De ce au fost acele informaŃii obŃinute şi sunt potrivite pentru o anumită
utilizare?
3. Cum se pot obŃine acele date?
4. Cum sunt organizate şi structurate datele?
5. Ce informaŃii adiŃionale sunt disponibile, care ar facilita utilizarea şi
interpretarea lor?
Evident nu există un răspuns model pentru fiecare dintre aceste întrebări,
după cum nu există metadate universale; am enunŃat doar un ghid posibil, care
acoperă o serie de categorii informaŃionale de specialitate, care trebuie adaptate
în funcŃie de seturile reale. Cu toate acestea este recomandat să se dezvolte în
viitor standarde pentru metadate, care ar facilita munca de documentare şi
cercetarea, mai ales în cazul realizării cataloagelor sau pentru descoperirea
resurselor informaŃionale electronice. În mod corespunzător sunt tot mai multe
iniŃiative pe plan mondial, de dezvoltare a unor softuri şi aplicaŃii standardizate,
care să suporte stocarea şi căutarea metadatelor prin diversele motoare
disponibile prin internet. Oricum, se recomandă ca datele şi metadatele să fie în
cea mai mare măsură independente de software şi hardware pentru a putea face
faŃă la schimbările inevitabile din tehnologia informaŃiei. Este de preferat ca
metadatele disponibile prin internet să fie la rândul lor înscrise sub forma unei
baze de date într-un soft larg folosit, cu implementarea opŃiunii de expunere a lor
într-o gamă oarecare de alte sisteme informatice (de exemplu la simpla alegere,
acestea să poată fi redate sub forma unui document, ca tabel, sau într-unul dintre
programele larg răspândite de gestiune a datelor).
Repet şi subliniez că o cerinŃă fundamentală a metadatelor este să faciliteze
nu numai accesul şi înŃelegerea datelor la care se referă, ci să permită integrarea,
modelarea, relevarea de noi semnificaŃii şi sinteza acestora în cadrul altor
proiecte. O altă latură esenŃială pentru realizarea tuturor acestor deziderate este
arhivarea datelor şi a metadatelor.

4.4. Arhive de date ecologice


(adaptat după Olson şi McCord, 2000)

O arhivă de date este o colecŃie electronică de seturi de date şi metadate


asociate, stocate astfel încât să permită localizarea, obŃinerea, înŃelegerea şi
utilizarea informaŃiilor. În plus datele din arhivă sunt securizate împotriva erorilor
umane şi a dezastrelor naturale, fiind păstrate astfel încât să facă faŃă la continua
dezvoltare tehnologică. Prin urmare, o arhivă trebuie să corespundă necesităŃilor
de menŃinere şi înŃelegere a datelor. Planificarea unei arhive este executată sub
imperativul a trei criterii:
I. Sîrbu - Modelarea proceselor ecologice (2010) 36

1. scopul datelor stocate;


2. capacităŃile de căutare şi acces;
3. resursele pentru operare şi menŃinere.
Arhivele nu sunt nişte simple colecŃii de date şi nu au rolul exclusiv de
depozitare a informaŃiei, ci asigură perpetuarea acesteia, păstrarea pe termen lung
a semnificaŃiilor datelor înscrise, servind ca bază pentru noi cercetări şi sursă
pentru alte abordări. Arhivele sunt un motor al cercetării viitoare, sunt funcŃionale
şi esenŃiale pentru dezvoltarea continuă a ştiinŃei. FuncŃiile şi componentele unei
bune arhive de date sunt redate în Tab. 4.3.

Tab. 4.3. FuncŃiile şi componentele unei arhive de date

FuncŃii Componente
Adăugare de date - Definirea unui cadru - ghid;
- Verificare şi confirmare calitatea datelor, transferul şi
formatul acestora;
- Revizie date/metadate;
- Organizarea datelor pentru arhivare;
Păstrarea - Copiere şi securizare;
(menŃinerea) - Sisteme de stocare;
datelor - Migrare spre noi medii de stocare şi noi tehnologii;
Localizarea - Sistem de indexare (standarde pentru cuvinte cheie);
datelor - InterfeŃe pentru utilizatori;
- Extragerea seturilor de interes;
Oferta de date - Alegerea căilor (media): via www, CD - DVD, tipărite etc.
Dezvoltarea Hardware, software, mediul de stocare şi legăturile prin reŃele.
sistemului
AsistenŃa - AsistenŃă şi statistică asupra utilizatorilor;
utilizatorilor - Corectări şi actualizări;
- Reclame şi promovare;
- FinanŃare pe termen lung.

Fluxul şi rolul informaŃiei din perspectivă ştiinŃifică urmează două căi: cea
a cercetărilor primare, care s-a dezvoltat în sute de ani de practică, şi cea a
cercetărilor secundare (ulterioare cercetării primare, realizate de alŃii, pe baza
informaŃiilor produse de cercetătorii originari) care se bazează pe refolosirea
datelor preexistente, o cale cu vârstă de abia 20-30 de ani de experienŃă şi care
necesită o continuă dezvoltare.
Un bun exemplu îl constituie Centrul NaŃional de Date Climatice (NCDC)
din AdministraŃia NaŃională Oceanografică şi Atmosferică a SUA (NOAA), care
are cel mai vechi centru de date operaŃional (din 1951), cel mai lung timp de
achiziŃie a informaŃiilor (din sec. XIX), cel mai mare volum de date arhivate (se
adaugă 55 GB în fiecare zi) şi cel mai mare număr de utilizatori (cca. 170 000
cereri anuale), asigurând astfel o perspectivă istorică de calitate asupra climatului,
fiind o componentă esenŃială pentru documentarea studiilor referitoare la
încălzirea globală. Acest centru trimite periodic rapoarte şi seturi de date la alte
I. Sîrbu - Modelarea proceselor ecologice (2010) 37

instituŃii, pentru diferite proiecte, dar şi pentru stocarea, respectiv distribuirea


internaŃională a informaŃiei.
O variantă este stocarea unor cataloage care conŃin adrese şi linkuri spre
bănci de date şi arhive de metadate, fără a conŃine date propriu-zise. De exemplu
AgenŃia Europeană de Mediu posedă Catalogul Surselor de Date (CDS), care este
un sistem ce permite localizarea informaŃiilor legate de mediu şi calitatea
acestuia. În acesta se prezintă sursele şi tipurile de date din Europa, în ce format
sunt disponibile, unde se găsesc şi cum se pot accesa, oferind astfel meta-
informaŃii pentru utilizatori. În mod similar funcŃionează şi Indexul NaŃional al
Datelor de Mediu din SUA (NEDI).
Din păcate procesul de arhivare este la fel de laborios ca şi cel de publicare
a rezultatelor unui studiu. Arhivarea este larg neglijată, cele mai multe proiecte
evitând acest proces, din diverse cauze. Amintim dintre acestea lipsa unei
legislaŃii de profil sau a unui sistem de recunoaştere oficială. Încă este o muncă
cu puŃine beneficii sau stimuli pentru cercetători, deşi se lucrează în ultima vreme
la o listă de propuneri şi o strategie pentru încurajarea considerării arhivării
datelor ca parte implicită a oricărui proiect sau program de cercetare. Unele
societăŃi de ecologie din lume încep să acorde un cadru formal şi să încurajeze
realizarea acestui deziderat. Un pas înainte este obligativitatea impusă de multe
proiecte şi finanŃatori, de realizare a unui site web pentru orice cercetare majoră,
care să prezinte - cel puŃin - obiectivele şi metadatele asociate rezultatelor
studiului.
Fluxul informaŃional trece prin diverse stadii: începe cu cercetătorul care
colectează, procesează, analizează şi publică datele, trece în timp spre alŃii care
diseminează, verifică, integrează, realizând alte analize şi servind ca parte din alte
publicaŃii. În decursul acestui proces temporal, semnificaŃia distală, importanŃa şi
interesul în informaŃii se poate schimba radical. Astfel vorbim de o maturizare a
datelor asociate cu marile proiecte complexe, interdisciplinare, asemănătoare cu
etapele ontogenetice ale oricărei fiinŃe: cea juvenilă, adolescentă şi de maturitate.
După Strebel şi col. (1994, ap. Olson şi McCord, 2000) faza juvenilă a datelor
implică colectarea şi procesarea acestora. În faza de adolescenŃă datele sunt
revizuite de alŃii, fac obiectul unor analize critice şi reinterpretări, iar faza adultă
este una de sine stătătoare, independentă, în care datele sunt folosite împreună cu
multe altele pentru cele mai diverse folosinŃe şi obiective, cum ar fi în cercetări
pe termen lung, studii comparative la scară largă, substituŃii spaŃiu-timp, sinteze
etc. Factorul cheie al acestui proces, motorul şi principalul motiv, este evitarea pe
cât posibil a entropiei informaŃiei.
Utilizarea datelor ecologice se va extinde prin sinteze viitoare şi studii de
evaluare, care vor trata probleme pe scări largi temporale şi spaŃiale. Multe dintre
descoperirile viitorului vor depinde de agregate ale unor volume mari de date. În
paralel vom asista la dezvoltarea şi creşterea continuă a importanŃei arhivelor,
invers corelată cu scăderea costurilor tehnologiilor de calcul. Pentru a încuraja
atingerea acestor deziderate sunt sugerate următoarele acŃiuni:
- asigurarea motivaŃiilor pentru facilitarea accesului la date şi arhive;
I. Sîrbu - Modelarea proceselor ecologice (2010) 38

- recunoaşterea arhivelor ca produse valoroase ale proiectelor de cercetare;


- stabilirea unei politici universale pentru citarea datelor şi recunoaşterea
meritelor;
- stabilirea de standarde şi ghiduri pentru elaborarea metadatelor;
- dezvoltarea centrelor de distribuŃie şi arhivare a datelor;
- asigurarea de asistenŃă instituŃională şi finanŃare pe termen lung pentru arhive;

4.5. Transformarea datelor în informaŃii şi cunoaştere


(adaptat după Michener, 2000)

• Categorii de analize a datelor ecologice

Proiectarea experimentelor pe baza strategiei programului de eşantionare,


în scopul testării ipotezelor de lucru şi interpretarea rezultatelor, poate fi un
algoritm liniar cu succes garantat în multe discipline empirice, dar nu neapărat în
ecologie. Motivele sunt legate de complexitatea sistemelor şi a proceselor
ecologice, de interferenŃa multor factori, în mod special a celor cu acŃiune
indirectă sau intermediată, a comportamentului stochastic a celor mai multe
componente etc. De aceea managementul şi procesarea datelor în ecologie se
execută printr-un ansamblu de tehnici alternative, adesea complementare, pentru
a verifica ipotezele multiple de lucru, a evalua calitatea datelor şi a rezultatelor
obŃinute. Dintre cele mai importante prelucrări şi analize, pe care le execută o
echipă de specialişti, amintesc aici pe cele mai importante.

A. Reducerea datelor
Este o activitate larg răspândită, mai ales în cazul proceselor cu desfăşurare
sau cu monitorizare continuă, care necesită agregarea datelor sau descrierea lor
prin parametri sintetici ai dinamicii proceselor particulare. Cei mai cunoscuŃi sunt
parametri cantitativi ai seriilor de timp. De exemplu vom calcula temperaturi
medii zilnice, lunare sau anuale, respectiv vom raporta un fenomen la suma
precipitaŃiilor /mm (sau l/m2) pentru a defini variabile independente, cum ar fi
într-o analiză de regresie.

B. Transformarea datelor
Se realizează cel mai frecvent pentru a creşte semnificaŃia acestora. Nu
vom raporta densitatea unei populaŃii la dimensiunea aparatului de colectare a
probelor, ci, prin transformare cu regula de trei simplă, vom reda numărul de
indivizi sau biomasa acestora raportată - de exemplu - la un litru sau la metru
pătrat (deci o expresie standard sau cu semnificaŃie mai generală). Multe
conversii sunt necesare pentru a standardiza scările de reprezentare ale valorilor
variabilelor ecologice şi ale mediului, pentru a creşte semnificaŃia lor şi a permite
comparaŃii cu alte studii. O serie de alte transformări se realizează pentru a aplica
unele teste sau prelucrări statistice, pentru a reprezenta grafic valori care variază
pe scări de magnitudine diferită, sau pentru standardizarea domeniului de variaŃie
I. Sîrbu - Modelarea proceselor ecologice (2010) 39

(de exemplu prin logaritmare, extragerea radicalului, sau formule mai complexe
de standardizare). Unele transformări sunt complicate, realizându-se în mai mulŃi
paşi, fapt care necesită menŃinerea unor bune metadate şi legende asupra acestora,
astfel încât să poată fi reconstituite datele primare pentru analize viitoare.

C. Analiza grafică
“Un desen spune mai mult decât o mie de cuvinte” este o expresie perfect
valabilă şi în ecologie. MulŃimea şi heterogenitatea datelor nu au nici o relevanŃă
dacă nu sunt, sau nu pot fi, reprezentate grafic şi interpretate (inclusiv) pe această
cale. Ele facilitează înŃelegerea rezultatelor, permit sesizarea semnificaŃiei
fenomenelor, indică modele în structura şi valorile datelor, permit la un anumit
nivel identificarea valorilor aberante şi a erorilor etc. Cele mai multe lucrări de
ecologie, chiar şi în prezent, se realizează în primul rând pe seama reprezentării
grafice a datelor, sau mai degrabă a parametrilor statistici ai şirurilor de date, şi a
interpretării modelelor astfel evidenŃiate. Identificarea modelelor şi a
semnificaŃiei datelor, pe seama interpretării reprezentării grafice a lor, se numeşte
analiză exploratorie a datelor şi este una dintre tehnicile de bază ale cercetării
ecologice, inclusiv ale modelării. Există o mare varietate de clase de grafice,
fiecare adresându-se unui anumit tip de seturi de date. Modul în care se
construiesc graficele se bazează pe reguli stricte (a se vedea Sîrbu şi Benedek,
2004, pp. 73 - 79)

D. Analiza statistică a datelor


Deoarece cele mai multe studii de ecologie se bazează pe eşantioane,
respectiv pe un program de colectare şi analiză a probelor, statistica este aproape
omniprezentă şi obligatorie în această disciplină. Ea este implicată în analiza şi
descrierea seturilor de date (statistica descriptivă), respectiv în sesizarea de
modele, analogii, comparaŃii, teste etc., toate acestea definind statistica
inferenŃială. Dintre cel mai des întâlnite şi folosite tehnici statistice, amintim:
- statistica descriptivă; calculul şi reprezentarea unor parametri ca media
(aritmetică, geometrică, armonică), varianŃa, abaterea standard, eroarea de
estimare, amplitudinea, suma, coeficientul de variaŃie, de asimetrie şi de
aplatizare-boltire etc.
- compararea seturilor de date prin intermediul parametrilor statistici şi
populaŃionali, utilizând teste statistice;
- analize de regresie şi corelaŃie pentru verificarea relaŃiilor dintre variabile;
- evaluarea şi raportarea erorilor de măsură a unor parametri şi a limitelor de
confidenŃă;
- analiza de asociere aplicată în ecologia comunităŃilor;
- descrierea comunităŃilor prin intermediul parametrilor structurali, compararea
lor prin indici de similitudine, lăŃimea şi suprapunerea nişelor ecologice,
ordonarea şi clasificarea prin tehnici de ierarhie matematică etc.
- teste statistice parametrice şi neparametrice pentru verificarea celor mai diverse
ipoteze de lucru, singulare sau multiple;
I. Sîrbu - Modelarea proceselor ecologice (2010) 40

- reducerea variabilelor prin analiza componentelor principale şi analiză


factorială;
- clasificarea datelor prin analiza funcŃiei discriminante;
- descrierea, identificarea tendinŃelor şi a periodicităŃii fenomenelor cu
desfăşurare temporală, respectiv analiza seriilor de timp, etc. (există multe alte
domenii aplicate ale statisticii în ecologie);

E. Modelarea ecologică
Modelul este o reprezentare a unei entităŃi reale, a unui lucru, idei sau
condiŃii. Procesul de modelare este un şir de etape, care trebuie parcurse, pentru
a converti o idee, mai întâi într-un model conceptual şi apoi într-o reprezentare
cantitativă. Modelarea în ecologie permite descrierea, sinteza, caracterizarea şi
experimentarea în spaŃiu virtual, a proceselor şi sistemelor ecologice. Ea
facilitează explicarea cauzalităŃii fenomenelor, permite alegerea şi implementarea
măsurilor de management şi asistă luarea deciziilor de mediu.
ToŃi ecologii practicieni şi majoritatea teoreticienilor, cel puŃin la un
anumit moment, pe parcursul unui studiu, trebuie să reprezinte imaginativ ideile,
elementele observate, datele investigaŃiei, relaŃiile dintre acestea, să reprezinte
grafic structura sau dinamica unui sistem etc. În toate aceste activităŃi,
reprezentările, conceptualizările, adesea formule şi ecuaŃii sunt implicate în mod
necesar.
Modelele pot fi definite în mod grafic, informal (fără ecuaŃii: de
exemplu un mod alternativ, preliminar, este definirea verbală a modelului urmat
de reprezentarea sa grafică sau schematică) sau formal, prin expresiile
matematice corespunzătoare şi programe de calculator.

• Aspecte practice ale tranziŃiei de la date la cunoaştere

Valoarea intrinsecă a datelor ecologice este direct relaŃionată de capacitatea


noastră de a accede la un nou nivel, mai elevat, al înŃelegerii informaŃiilor şi al
cunoaşterii. Baza de cunoaştere sporeşte prin căutarea şi identificarea de modele
şi legităŃi generale ale ecologiei, precum şi prin explicarea acestora. Acest fapt
solicită integrarea şi sinteza a numeroase studii şi a unor volume imense de date,
fapt care reprezintă provocări pentru viitorul acestui domeniu. Pe de o parte se
impune trecerea la un nou nivel de management şi sinteză a datelor, pe de alta se
reclamă generarea unor noi unelte de analiză şi înŃelegere a acestor informaŃii. Un
pas a fost realizat prin înfiinŃarea Centrului NaŃional al SUA pentru Analiză şi
Sinteză Ecologică (www.nceas.ucsb.edu), dar drumul este încă lung pentru restul
Ńărilor.
Transformarea datelor în cunoaştere nu este un proces simplu, şi nici unul
care se generează automat. Date înseamnă caractere şi numere, care nu posedă
semnificaŃie intrinsecă, decât pentru cei care le obŃin. InformaŃia este un nivel
superior, prin care datele primesc atribute care le explică şi le conferă înŃeles. În
sfârşit cunoaşterea semnifică înŃelegerea obŃinută prin descoperirea, percepŃia şi
I. Sîrbu - Modelarea proceselor ecologice (2010) 41

integrarea informaŃiei; mai abstract înseamnă erudiŃie. Cunoaşterea trebuie să


conducă la noi abordări şi definirea de noi probleme pentru ştiinŃa fundamentală
şi cea aplicată. Nu în ultimul rând, valoarea ei se stabileşte şi prin măsura în care
înŃelegerea descoperirilor ştiinŃifice poate fi utilizată în procesul de luare a
deciziilor, în managementul resurselor şi dezvoltarea politicilor de cele mai
diverse aspecte. Devine din ce în ce mai importantă comunicarea şi schimbul de
informaŃii între oamenii din cele mai diverse specializări, pentru a deschide
cuceririle ştiinŃei spre alte sfere şi a câştiga posibilitatea traducerii cuceririlor
acesteia în folosul naturii şi a societăŃii umane deopotrivă. Acest deziderat se
poate realiza prin diverse metode, care vor fi studiate la masterat de către doritori
(şi supravieŃuitori).
Se afirmă din ce în ce mai des necesitatea înfiinŃării unor infrastructuri
informaŃionale unitare, atât la nivel naŃional, cât mai ales internaŃional sau chiar
mondial, care să conŃină informaŃii din toate domeniile de intersecŃie ale
ecologiei, şi care să poată fi utilizate pentru soluŃionarea problemelor. În acest
moment asemenea idei par utopice, dar viaŃa şi mediul viitorului vor necesita
obligatoriu înfiinŃarea şi funcŃionarea unor asemenea structuri. Realizarea acestui
deziderat va reclama o infuzie substanŃială de fonduri, personal calificat, gândire
creativă şi tehnologie.
Sunt cel puŃin 7 paşi ai managementului informaŃiilor ecologice, relaŃionaŃi
cu managementul resurselor, care trebuie parcurşi în viitor:
1. Alocarea unei proporŃii rezonabile de resurse din fiecare proiect şi
finanŃare pentru managementul datelor şi al informaŃiilor rezultate din cercetarea
ştiinŃifică. În cele mai multe cazuri, acest demers este în mod grav şi nejustificat
subfinanŃat sau chiar neglijat, conducând la pierderi de date.
2. Dezvoltarea şi aderarea la standarde pentru date şi metadate, precum şi
la protocoale de bună calitate şi folosinŃă.
3. FinanŃarea actualizării, regenerării şi recuperării datelor pentru oprirea
procesului de entropie informaŃională.
4. Restabilirea continuă a priorităŃilor, a evaluării utilităŃii datelor, a
obiectivelor cercetării şi necesităŃilor managementului. Utilizarea acestor
informaŃii pentru revizia programelor de cercetare pe termen lung şi asigurarea
fluxului continuu al datelor.
5. Cooperare şi coordonarea dintre oameni, departamente, agenŃii şi
instituŃii, în vederea eliminării redundanŃei, a reducerii eforturilor şi cheltuielilor
privitoare la obŃinerea şi managementul datelor precum şi pentru dezvoltarea
sistemelor.
6. Dezvoltarea continuă a arhivelor şi relaŃionarea lor.
7. Dezvoltarea unor programe exhaustive de educaŃie şi instruire în IT şi
modelare ecologică, în scopul asigurării bazei ştiinŃifice de resurse a viitorului.
I. Sîrbu - Modelarea proceselor ecologice (2010) 42

5. ALGORITMUL ŞI PRINCIPIILE MODELĂRII ECOLOGICE

Modelele ecologice pot fi definite în mod grafic, informal (fără ecuaŃii:


de exemplu un mod alternativ, preliminar, este definirea verbală a modelului) sau
formal, prin expresiile matematice corespunzătoare şi programe asociate pe
calculator (Silvert, 2001). Ilustrarea grafică a unui model se poate realiza printr-o
diagramă conceptuală (de exemplu circulaŃia energiei printr-un nivel trofic,
circuitul apei sau al unui element oarecare în natură etc.).
Abordarea clasică, obişnuită în procesul de modelare, începe cu
caracterizarea şi definirea procesului sau a sistemului, avansarea unor ipoteze
despre structură şi funcŃii, traducerea acestora într-un sistem formal (de exemplu
prin ecuaŃii) şi transpunerea pe calculator, într-un program accesibil, rularea şi
colectarea rezultatelor. Urmează verificarea potrivirii dintre datele reale şi cele
avansate de model, şi recalibrarea modelului pentru a reduce posibilele
nepotriviri dintre valorile experimentale şi cele aşteptate.
Câteodată acest algoritm este posibil şi eficient, însă nu totdeauna, atât din
motive obiective (legate de specificul sistemului ecologic analizat), cât şi
subiective (pregătirea cercetătorului, disponibilul tehnic şi informaŃional etc.). De
multe ori pornim de la datele personale sau cele obŃinute de un alt cercetător şi
construim singuri ecuaŃiile modelului. Alteori, este recomandat să pornim de la
anumite ecuaŃii prestabilite de alŃii şi să utilizăm datele experimentale pentru
calcularea de parametri sintetici sau derivaŃi. Dar, din ce în ce mai des, modelarea
nu mai implică lucrul cu ecuaŃii, sau cel puŃin nu presupune că cercetătorul este
obligat să le definească singur, în termeni matematici. O variantă este să lase
calculatorul să se descurce cu ceea ce modelatorul cunoaşte numai conceptual sau
informal, utilizând programe care permit un oarecare grad de independenŃă, care
operează cu proceduri şi obiecte relativ independente. Procesul de modelare nu
are o singură reŃetă şi nu se poate reduce la un singur algoritm; totul se adaptează
la scopul şi obiectivele cercetării, la categoria de studiu în derulare, tipul,
calitatea şi cantitatea datelor. De aceea mai jos redau mai degrabă un ghid, în
sensul unei serii de indicaŃii, şi nu o colecŃie de reguli cu rol de rigidizare sau
standardizare a demersului.
Algoritmul modelării începe ca oricare alt subiect de cercetare cu
definirea problemei, etapă crucială a oricărei teme. Definirea scopului, a
obiectivelor, respectiv a ceea ce vrem să obŃinem de la modelul pe care îl
construim, trebuie să fie delimitat în termeni de subsisteme, timp şi spaŃiu,
precum şi adaptat la acele informaŃii pe care suntem în stare să le obŃinem.
În acest proces primul răspuns pe care îl căutăm este cel la întrebarea: “în
care scop construim acest model”? Acesta ne ajută să înŃelegem motivul
demersului nostru, putem stabili liniile de elaborare a etapelor şi ne imaginăm la
ce va ajuta în final unealta construită (idem). Dacă nu ştim ce vrem de la
modelul pe care dorim să-l realizăm, foarte probabil nu vom obŃine nici un
I. Sîrbu - Modelarea proceselor ecologice (2010) 43

model. Să nu uităm principii ale cercetării care au implicaŃie directă şi în acest


domeniu, dintre care amintesc (parafrază după Krebs, 1989):
- Nu tot ce poate fi modelat, merită să fie modelat!
- Consideră şi evaluează numai acele variabile şi date care răspund la
întrebările puse!
Evaluarea complexităŃii pe care o adoptăm este o altă problemă. Adesea
se consideră că un model este cu atât mai bun, cu cât este mai complex, respectiv
include mai multe variabile, ecuaŃii şi subsisteme (dacă se poate toate cu putinŃă
de decelat sau imaginat). Această abordare este extrem de populară mai ales
printre partizanii holismului, sau cei care văd ecologia mai ales prin perspectiva
ansamblului proprietăŃilor emergente ale ecosistemelor. ConcepŃia holistă este
numai una dintre cele posibile şi nu neapărat cea mai adecvată problemei
particulare supuse studiului. Pe de o parte, definirea gradului de complexitate
depinde de tipul de sistem sau proces; nu orice obiect al cercetării implică sau
suportă abordări holiste. Pe de altă parte, abordarea reducŃionistă este cel puŃin la
fel de importantă în ecologie; sistemul se descrie şi explică, şi prin cunoaşterea
structurii şi a funcŃiilor subsistemelor constituente. Ambele puncte de vedere sunt
la fel de importante, se completează, şi nu pot fi substituite reciproc. În sfârşit,
nu este deloc obligatorie modelarea unui întreg sistem sau proces amplu, cum nu
este implicită selectarea tuturor factorilor: ecologul poate evalua, de exemplu, o
singură variabilă dependentă (dinamica temporală a abundenŃei unei populaŃii,
diluarea unui poluant, producŃia unei fitocenoze etc.) în relaŃie cu un număr
limitat de variabile independente semnificative (salinitatea solului, distanŃa faŃă
de sursa de poluare, concentraŃiile de azotaŃi şi fosfaŃi din sol etc.). În nici un caz
să nu se considere că scopul modelării este înglobarea tuturor variabilelor şi
factorilor, pentru a se simula şi explica funcŃionarea unui întreg ecosistem, aşa
cum cred prea mulŃi diletanŃi, în mod eronat.
Argumentul practic împotriva unei complexităŃi prea mari este centrat în
creşterea potenŃialului de eroare. Fiecare model include o eroare posibilă (adesea
cunoscută, sau cel puŃin estimată) pe care încercăm să o menŃinem la un nivel
tolerat. Cu cât sunt mai multe ecuaŃii care aproximează procesele evaluate, cu atât
eroarea creşte. Complexitatea este direct corelată cu gradul de nedeterminare,
dificultatea simulării, şi adesea este invers corelată cu relevarea semnificaŃiei şi a
potenŃialului de verificare a rezultatelor. Jørgensen (1988, 2001) sugerează
includerea în model exclusiv a factorilor, variabilelor şi parametrilor care au o
influenŃă majoră sau chiar determinantă asupra subiectului de interes.
Complexitatea depinde şi de cantitatea şi calitatea informaŃiei care este disponibilă.
Niciodată creşterea complexităŃii modelului, a numărului de ecuaŃii sau a
programului pe calculator, nu trebuie să fie un scop în sine. Celebre sunt, în acest
sens, legea lui D.B. Lee (1973): “calculatoare mai mari, suportă greşeli mai mari”
(modele mai complexe produc erori mai elevate) precum şi comentariul aferent al
lui Silvert (2001): “s-au cheltuit în decursul timpului milioane de dolari, pentru a
se demonstra valabilitatea legii lui Lee”.
I. Sîrbu - Modelarea proceselor ecologice (2010) 44

Prin urmare selectarea complexităŃii depinde de tipul problemei, a sistemului


sau procesului supus analizei, şi a datelor disponibile.
Scara la care definim modelul poate fi oricât de mică sau de mare; nu există
scări “bune”, “adevărate”, respectiv nici “false” sau “contraindicate” la modul
absolut. Dar este sigur că, un subiect particular se pretează mai bine la a fi analizat
la o anumită scară şi prea puŃin la o alta. De asemenea, nu există nici o relaŃie între
scara spaŃială şi complexitatea modelului (W. Silvert, 2001).
Conceptualizarea este etapa în care transpunem problema particulară într-o
imagine sau idee de ansamblu, cum ar fi de exemplu sub forma unei diagrame,
care conŃine informaŃii despre parametri şi despre relaŃiile dintre aceştia
(matematice sau de altă natură). Transpunerea grafică a ideilor, a etapelor şi
vizualizarea relaŃiilor între diferitele categorii de variabile, formează modelul
conceptual. Prin adăugarea de valori, evaluări cantitative ale proceselor şi
elaborarea de ecuaŃii, obŃinem modelul cantitativ.
Construirea modelului se referă la alcătuirea acestuia, în termeni de idei,
concepte, expresii fizice, ecuaŃii matematice, respectiv programe pe calculator.
Modelele se pot construi în două feluri: de la bază la vârf sau invers.
Modelul bază - vârf se realizează prin asamblarea de submodele, respectiv de cât
mai multe elemente constituente sau procese care se desfăşoară într-un sistem.
Acestea tind să fie foarte complicate, deoarece teoretic totul poate fi inclus; se
consideră a fi bune pentru înŃelegerea funcŃionării sistemului, dar nu dau rezultate
prea bune în scopul pentru au fost create (W. Silvert, 2001). Modelele vârf - bază
pleacă de la funcŃii generale, de la comportamentul întregului sistem sau de la
proprietăŃile emergente. Cele mai multe sunt de tip statistic. Acestea sunt modele
empirice, se bazează pe date experimentale, nu presupun obligatoriu considerarea
mecanismelor subiacente, iar ca domeniu de valabilitate sunt adesea restricŃionate
la subiectul particular analizat.
Atunci când rezultatele obŃinute prin model nu verifică datele
experimentale, sau - şi mai rău - când prognozele nu se adeveresc nici pe departe,
cel mai adesea este blamat modelul, dar aceasta nu este singura cauză posibilă.
Sunt trei posibilităŃi de fapt: model eronat, date experimental- observaŃionale
greşite sau ambele. Trebuie înŃeles faptul că datele obŃinute prin experimente sau
observaŃii sunt supuse unui şir de erori potenŃiale, ele fiind la rândul lor numai o
reprezentare a realităŃii şi nici pe departe realitatea însăşi. Într-o altă ordine de
idei, matematica poate fi perfectă, dar aparatul de măsură nu a fost calibrat, sau
eroarea sistematică diferă la cei care execută măsurătorile.
Dacă am ajuns la etapa implementării acestuia pe calculator, pasul care
urmează în mod logic este rularea modelului de cât mai multe ori, pentru a se
evalua construcŃia obŃinută. El se rulează cu o varietate de condiŃii modificate ale
parametrilor de intrare, în scopul urmăririi modului în care se comportă în situaŃii
cât mai diverse.
Validarea şi verificarea modelului se execută în secvenŃa următoare a
algoritmului. Evaluarea rezultatelor înseamnă validarea lor, adică corespondenŃa
cu valorile reale (observate sau experimentale, în cazul în care acestea există), dacă
I. Sîrbu - Modelarea proceselor ecologice (2010) 45

sunt logice, posibile, îndeplinesc sau nu ceea ce ne-am putea aştepta de la modelul
realizat, precum şi dacă le-am interpretat corect. Dacă modelul nu trece de acest
examen, este necesară întoarcerea la o etapă anterioară a algoritmului, şi reluarea
procesului ori de câte ori este necesar. Există o deosebire certă între verificare şi
validare: primul termen semnifică testarea logicii interne a modelului, constând
mai ales dintr-o evaluare subiectivă a modului în care s-a alcătuit şi cum se
comportă acesta (uneori se vorbeşte în jargonul de specialitate şi de depanarea
modelului). Validarea se realizează prin compararea rezultatelor modelului cu
datele reale, care rezultă din analiza directă a sistemului analizat.
Un model bun (validat) va fi cel care oferă rezultate, ce se potrivesc cu
fenomenele şi valorile proceselor reale, şi care au o logică ştiinŃifică.
Adesea se realizează şi analiza senzitivităŃii, care investighează cum s-ar
modifica concluziile dacă parametrii, datele iniŃiale şi/sau ecuaŃiile ar fi diferite.
Această analiză este utilizată pentru investigarea robusteŃii modelului, dar şi
pentru a ghida cercetarea viitoare, respectiv pentru a sesiza importanŃa diferitelor
elemente constituente ale modelului în ceea ce priveşte contribuŃia la rezultate.
Am amintit anterior două mituri false ale modelării: relaŃia dintre valoarea
modelului şi complexitatea acestuia, precum şi absenŃa legăturii dintre scara de
raportare a sistemului sau procesului şi complexitate.
Un alt mit este cel al relaŃiei absolute între utilitate şi adevăr. Este bine de
ştiut că un model poate să nu fie absolut adevărat (deci valabil în toate condiŃiile)
şi totuşi să fie extrem de util. De exemplu, legile lui Newton au fost multă vreme
considerate infailibile, până în 1905, odată cu apariŃia teoriei lui Einstein, când au
fost contestate. Teoriile newtoniene sunt astăzi recunoscute ca fiind valabile
numai pentru obiecte care se mişcă încet şi cu energie redusă, dar sunt în
continuare mai mult utilizate în viaŃa practică decât teoriile lui Einstein.
În schema algoritmului de modelare (Fig. 5.1) am ales numai etapele
principale care se referă la categorii de modele ce implică şi formule, respectiv
care pot fi transpuse pe calculator. Este evident că alte categorii (modelele
grafice, multe modele statistice care presupun operarea cu ajutorul unui program
prestabilit etc.) nu includ în mod obligatoriu unele etape ale acestui algoritm, iar
altele necesită secvenŃe suplimentare, inclusiv ramificaŃii condiŃionate de
rezultatele intermediare (de exemplu la modelele stocastice). Dar unele etape,
cum ar fi: definirea problemei, crearea imaginii acesteia, evaluarea calităŃii
datelor existente, verificarea modelului şi validarea rezultatelor fac parte din
aproape toate procesele de modelare.
Modelarea este un proces iterativ. Dacă un model a fost validat,
nu înseamnă că va fi abandonat. Date noi, idei, includerea altor variabile,
redeschid de fiecare dată problema dezvoltării şi conduc la modificarea perpetuă
şi evoluŃia oricărui model. Un model mai bun înseamnă o simulare mai realistă,
prognoze mai bune, acurateŃe sporită a rezultatelor, uneori includerea mai multor
detalii şi tendinŃa spre o cât mai bună apropiere de fenomenele naturale.
Jørgensen (1988) susŃine însă că pentru un interval dat de timp, resursele limitate
vor opri mai devreme sau mai târziu evoluŃia oricărui model.
I. Sîrbu - Modelarea proceselor ecologice (2010) 46

O caracteristică a modelării este absenŃa a ceea ce se numeşte un model


universal (deci cu valoare generală pentru o categorie de sisteme sau procese
ecologice). Chiar dacă apar în literatura de specialitate expresii ca: “modelul
populaŃiei” sau “al lacului” etc., aceasta nu înseamnă că există un singur model,
reprezentativ sau ideal, la care se raportează sistemele particulare studiate sau o
categorie definitorie. Printr-o categorie de model vom înŃelege aspectul central al
abordării metodologice (de exemplu modelul matricial se referă la faptul că
abordarea se face prin algebră matricială; modelul diferenŃial nu implică o
anumită ecuaŃie ci o abordare cu un anumit specific matematic a fenomenelor
care sunt monitorizate în timp continuu etc.).

Definirea problemei

Selectarea complexităŃi şi scării

Ipoteze

Model conceptual

Model cantitativ

Prognoze

Selectare software şi implementare pe calculator

Rulare şi verificare

Validare

Analiza de senzitivitate

Valorificare

Fig.5.1. Algoritmul simplificat al procedurii de modelare

Modelele trebuie să fie folositoare, adică să fie prea rar un scop în sine.
Ele sunt construite pentru a testa, verifica, simula sau prognoza, respectiv pentru
a ne ajuta să înŃelegem mai bine modul în care funcŃionează sistemele, şi se
desfăşoară procesele ecologice. Modelarea nu este pasul final al unui program
experimental, ci este o parte integrată în munca de cercetare.
Valorificarea modelului îmbracă numeroase aspecte, similare cu cele care
decurg din utilizarea rezultatelor cercetării. Unele modele sunt construite ca
aparat ştiinŃific, ne ajută să înŃelegem şi să explicăm, iar valorificarea poate
însemna publicarea şi popularizarea rezultatelor. Altele sunt dezvoltate ca unelte
I. Sîrbu - Modelarea proceselor ecologice (2010) 47

de management, iar valorificarea va consta în implementarea rezultatului în


lumea reală, în scop protectiv, ameliorativ sau economic.
Prezentarea rezultatelor nu este deloc o etapă de neglijat în complexul
finalizării unui studiu. Un model nu este folositor dacă rezultatele sunt ascunse,
ignorate sau sunt de neînŃeles. Ceea ce am obŃinut trebuie făcut cunoscut şi altora.

♦ Ce software utilizăm?

Este întrebarea care apare mai devreme sau mai târziu în orice studiu cu
pretenŃii, precum şi în evoluŃia capacităŃilor cercetătorului. Este bine să
subliniem, că nu există şi nu poate exista un singur răspuns la aceasta, deoarece
sunt cel puŃin două categorii de motivaŃii: de ordin subiectiv şi obiectiv. Cele
subiective sunt legate de reguli ale cercetării ecologice, care afirmă că: “cel mai
bun software este cel pe care îl cunoşti”, apoi “cea mai bună tehnică de calcul
este cea la care ai acces nelimitat”, precum şi “este preferabil ca un ecolog să
înveŃe să opereze decât să programeze” (Sîrbu şi Benedek, 2004). Este evident că
un limbaj sau program pe care nimeni din echipă nu-l ştie, nu are nici o şansă să
rezolve problema, indiferent cât este de nou sau sofisticat. Snobismul modei
dezvoltării neîncetate a calculatorului personal, veşnica vânare a unui echipament
mai performant, programe mai diverse şi mai noi, a avea permanent ultima placă
video etc., sunt fără îndoială utile unui informatician sau unui pasionat al
jocurilor, dar sunt preocupări prea puŃin potrivite unui ecolog practicant. Pe lângă
confuzia între scop şi mijloace, implică şi pierdere de timp şi alocarea
nejustificată a resurselor. Mult mai folositoare este alocarea de timp pentru
cunoaşterea aprofundată a modului de utilizare corectă a acelor programe, care
într-adevăr ne ajută să progresăm în cercetare şi în folosirea rezultatelor, precum
şi actualizarea lor şi a echipamentului hard atunci când este necesar şi oportun.
Apelarea la un informatician sau (în funcŃie de natura problemei) un
matematician, poate da uneori rezultate, dar atenŃie la bariera de comunicare şi
de reprezentare a intenŃiilor. Includerea unui specialist din alt domeniu este
benefică pentru echipă, numai dacă există dorinŃa de comunicare bidirecŃională şi
traducerea tuturor etapelor în entităŃi cu semnificaŃie similară pentru ambele părŃi.
Un alt element care trebuie Ńinut sub control, este faptul că înŃelegem prea puŃin
despre oamenii implicaŃi în alte specialităŃi. Orice biolog sau ecolog ar trebui să
ştie ce înseamnă specializare în cadrul domeniului (deşi ecologii, mai ales
teoreticienii holişti, tind uneori să uite spre paguba lor aceasta), dar consideră alte
discipline ca fiind omogene. Şi matematicienii, respectiv informaticienii, sunt
specializaŃi, ceea ce nu înseamnă că ştiu neapărat multe despre puŃin, ci faptul că
ştiu mult mai mult despre unele lucruri şi semnificativ mai puŃin despre oricare
altele. Este o mare deosebire între calitatea/cantitatea informaŃiilor pe care o
persoană le deŃine şi potenŃialul acesteia de a selecta informaŃia relevantă într-un
anumit context (marea problemă a celor care predau la alte specializări).
De aceea pentru un program de cercetare includerea într-o echipă de
biologi (ecologi) a unui oarecare matematician este la fel de inutilă, precum
I. Sîrbu - Modelarea proceselor ecologice (2010) 48

includerea în structura unei instituŃii ştiinŃifice a unui biolog, sau într-un institut
de cercetare a unui specialist în bentos. ExcepŃia o constituie acele instituŃii (nu
neapărat cu pretenŃii ştiinŃifice) care antrenează dialogul dintre domenii, în care
intervine individul de altă specialitate în buna desfăşurare a activităŃii generale.
Există şi argumente obiective pe care le avem în vedere atunci când
selectăm software-ul. Când suntem puşi în situaŃia de a alege, ne confruntăm cu o
plajă mărginită de două extreme. Astfel, pe de o parte există limbaje de
programare generală (de tipul C ++, Visual Basic, Pascal etc.) care permit
individului un control complet asupra procesului de modelare, dar care reclamă
cunoştinŃe apreciabile de informatică şi matematică. La cealaltă extremă sunt
programele grafice de tipul STELLA, Simulink sau ModelMaker, care permit
utilizatorului să selecteze din meniuri şi galerii de icoane elementele necesare
construirii modelului, lăsând calculatorul să se ocupe de toate detaliile. La acestea
dezavantajele sunt legate de limitarea potenŃialului de modelare, a opŃiunilor
utilizatorului, lipsa de elasticitate a procesului şi constrângerea la ceea ce este
deja preprogramat. Calea de mijloc (pe care de altfel o adoptăm în studiul
modelării la catedra noastră) o constituie sistemele de programe care includ
funcŃii şi proceduri (inclusiv grafice) care permit evitarea multor detalii de ordin
informatic şi matematic, dar care lasă o gamă largă de posibilităŃi alternative
cercetătorului. Printre variantele de acest gen, flexibile şi facil de studiat,
amintesc sistemele de programe de tipul Systat, SPSS sau Statistica (pentru
modelare statistică) şi Mathcad pentru o serie largă de categorii de modele
matematice.
I. Sîrbu - Modelarea proceselor ecologice (2010) 49

6. ELEMENTELE CONSTITUENTE ŞI CLASIFICAREA


MODELELOR ECOLOGICE

6.1. Elementele modelelor ecologice

În formulare matematică un model ecologic este alcătuit din 5 elemente


sau componente (după Jørgensen şi Bendoricchio, 2001).

a. Variabile şi funcŃii externe

Sunt forŃe externe (factori ai mediului, variabile independente etc.), care nu


aparŃin sistemului sau procesului ecologic analizat, dar care influenŃează sau
determină starea şi dinamica acestuia. Se studiază influenŃa acestora asupra
oricărui aspect (structură, funcŃii, dinamică) al subiectului investigat. ForŃele
externe supuse modificărilor antropogene se mai numesc şi "funcŃii de control"
(de exemplu poluanŃi, nutrienŃi, deversări de ape reziduale etc.). Multe altele nu
sunt supuse controlului nostru (variabile climatice, radiaŃii cosmice etc.).

b. Variabile de stare

Sunt mărimi care descriu sistemul sau procesul, relevând structura şi


funcŃiile acestuia. Selectarea lor este extrem de importantă pentru acurateŃea
modelului.

c. EcuaŃii matematice

Sunt utilizate pentru reprezentarea proceselor, respectiv a modificării în


timp şi spaŃiu ale structurii şi funcŃiilor sistemelor ecologice. Ele descriu relaŃiile
dintre funcŃiile externe şi variabilele de stare, precum şi dintre acestea din urmă.
Acelaşi tip de proces poate fi identificat în contexte diferite, motiv pentru care
frecvent există posibilitatea utilizării aceleiaşi ecuaŃii în mai multe categorii de
modele, aplicate altor sisteme. Alteori detalii sau relaŃii diferite reclamă utilizarea
unor ecuaŃii alternative. Descrierea şi formularea matematică a proceselor
definesc submodelele.

d. Parametrii

Sunt coeficienŃi utilizaŃi în reprezentarea matematică a proceselor. Ei


asigură legătura dintre ecuaŃiile modelului şi datele reale. Uneori pot fi
consideraŃi constante pentru anumite părŃi ale sistemului ecologic. Alteori sunt
redaŃi printr-un domeniu de variaŃie, a unei amplitudini, şir de probabilităŃi, sau
I. Sîrbu - Modelarea proceselor ecologice (2010) 50

sunt deduşi din ecuaŃii empirice construite pe baza datelor reale (de exemplu
ecuaŃii de regresie).

e. Constante universale

Sunt valori deduse din legi ale naturii, fixe, imuabile, care apar adesea şi în
multe modele ecologice. Amintim aici numărul π, e (baza logaritmului natural,
numărul lui Euler), constanta lui Avogadro, constanta solară, masele atomice ale
elementelor chimice etc.

6.2. Clasificarea categoriilor de modele ecologice

Modelele pot fi clasificate în funcŃie de abordare, alcătuire, scop şi tipul


rezultatelor obŃinute.
După natura funcŃiei pentru care au fost create, distingem modele cu scop
ştiinŃific, respectiv cu rol de management.
Dacă rezultatele modelului depind de factori aleatori sau probabilistici,
vorbim de modele stocastice, iar dacă rezultatele depind numai de valorile
iniŃiale introduse, atunci ele sunt modele deterministe.
Modelele care includ detalii relevante asupra componentelor, sunt
denumite reducŃioniste, pe când cele care lucrează cu însuşirile emergente ale
sistemelor, la nivelul întregului, se numesc modele holiste.
Dacă variabilele care definesc sistemul nu sunt dependente de timp vorbim
de modele statice, iar dacă este analizată modificarea variabilelor în timp
(eventual şi/sau în spaŃiu), vorbim de modele dinamice.
Modificarea timpului se poate urmări printr-un şir discret de valori, caz în
care vom utiliza cel mai frecvent ecuaŃii recurente (modele discrete), sau vom
monitoriza dinamica unui fenomen în timp continuu, ecuaŃiile utilizate fiind de
tip diferenŃial. Ultimele urmăresc transformarea permanentă, continuă, a
sistemului în timp, pe când cele discrete compară starea sistemului sau valoarea
procesului la un anumit moment, cu valorile înregistrate într-un număr de
diviziuni anterioare.
Analiza transformării structurii sau a valorii funcŃiilor în timp semnifică
trasarea traiectoriei sistemului. Aceste traiectorii se pot modela prin ecuaŃii, ele
pot fi deterministe sau stocastice, existând prin urmare o gamă largă de categorii
de abordări. Unele sisteme tind către un nivel staŃionar (“steady-state” în
engleză), dacă acesta nu se modifică într-un interval de timp considerat, dar
aceasta nu implică o stare (sau traiectorie) de echilibru. În starea staŃionară toate
ratele proceselor sau cele ale funcŃiilor particulare sunt constante, spre deosebire
de starea de echilibru în care acestea sunt egale cu zero.
Alte sisteme dinamice nu au nivel staŃionar, dar pot dezvolta cicluri limită
(se vor studia la modelele dinamicii populaŃionale).
Nu în ultimul rând, un model dinamic poate conŃine variabile care se
modifică atât în timp cât şi în spaŃiu, eventual şi după alŃi gradienŃi (altitudine,
I. Sîrbu - Modelarea proceselor ecologice (2010) 51

salinitate, umiditate etc.), caz în care vorbim de modele distributive, care sunt
definite frecvent prin ecuaŃii diferenŃiale parŃiale. Analiza dinamicii temporale nu
trebuie neapărat realizată prin ecuaŃii deterministe. De exemplu, există
posibilitatea descrierii şi caracterizării dinamicii fenomenelor prin analiza
seriilor de timp, domeniu al statisticii matematice.
Modelele integrate urmăresc dinamica proceselor sau a sistemelor pe o
perioadă mai lungă (de exemplu un an sau un deceniu), iar variabilele sunt
reprezentate prin valori medii pe intervale finite de timp. Ele sunt utilizate în
special la construirea de modele energetice, ale bugetului trofic, cele climatice, de
productivitate şi altele.
Dacă procesul se poate descrie sub forma unei ecuaŃii de gradul I (polinom
de gradul I), modelele se numesc liniare, iar dacă cel puŃin o relaŃie nu este în
această formă, definim modele neliniare.
Modelele pot fi cauzale (sau de tip cutie albă) dacă datele de intrare,
stările sistemului şi rezultatele sunt relaŃionate prin legături de tip cauză - efect,
sau pot fi modele de tip cutie neagră (necauzale) dacă se iau în considerare
numai datele de intrare şi cele de ieşire, fără a fi analizat mecanismul intim al
sistemului.
Utilizând criteriul naturii componentelor definite ca variabile de stare,
putem alcătui o altă clasificare. Astfel, dacă sistemul este descris în termeni de
număr de indivizi conspecifici, modelul este de tip populaŃional (câteodată se
utilizează şi cuvântul biodemografic). Un model care descrie şi caracterizează
comunitatea sau ecosistemul va fi definit ca atare (modele cenotice sau
ecosistemice), referitor la nivelul de organizare inclus în analiză, un model al
fluxului energetic este considerat bioenergetic, iar dacă se referă la circulaŃia
materiei în natură, definim modele biogeochimice.
Modele bazate pe indivizi (MBI) implică o abordare diferită de cele
expuse anterior. Acestea urmăresc dezvoltarea sau funcŃionarea sistemului prin
analiza comportamentului indivizilor constituenŃi, şi nu prin acordarea unor
valori medii, care exprimă contribuŃia tuturor, aşa cum o fac cele mai multe
categorii. Se realizează simulări, care evaluează consecinŃele la nivelul întregului
sistem a interacŃiunilor locale ale elementelor constituente. Elementele pot fi
indivizi biologici (plante, animale), dar şi autovehicule în trafic, populaŃii sau
specii care interacŃionează etc. Sunt tehnici de modelare care necesită mult calcul
matematic, se realizează exclusiv pe calculator şi se bazează pe teoria
automatelor celulare. Asemenea modele sunt alcătuite din mediul în care se
desfăşoară interacŃiunea, un număr oarecare de indivizi în sens larg (nu în mod
necesar biologici), care la rândul lor sunt definiŃi în termeni de comportament
(reguli procedurale) şi parametri caracteristici. Însuşirile şi efectele acŃiunilor
fiecărui individ sunt urmărite în timp. Unele MBI sunt explicit spaŃiale, în sensul
că indivizii sunt asociaŃi cu locaŃii şi deplasări în spaŃiul geometric. Alte modele
sunt pur funcŃionale sau reflectă efectul interacŃiunilor între grupuri de elemente
definite după anumite criterii.
I. Sîrbu - Modelarea proceselor ecologice (2010) 52

Tab. 6.1. Clasificarea principalelor categorii de modele aplicate în ecologie (modificat


după Jørgensen, 1988; W. Silvert, 2001)

Categoria de modele Caracteristici


ŞtiinŃifice - scopul este legat de explicare şi cunoaştere
Management - scop de gestiune şi control a unui proces sau sistem
Formale - (de obicei) exprimate prin ecuaŃii matematice
Informale - nu sunt exprimate prin ecuaŃii
Deterministe - depind numai de datele de intrare
Stocastice - rezultatele depind de distribuŃii probabilistice sau de
factori aleatori
ReducŃioniste - includ cât mai multe detalii şi subsisteme
Holiste - utilizează principii şi funcŃii generale, emergente ale
sistemului ca întreg
Statice - independente de timp
Dinamice - variabilele sunt funcŃii de timp, eventual şi spaŃiu sau alŃi
parametri independenŃi care variază
Dinamice în timp continuu - urmăresc procesul fără întrerupere în timp, fiind modelate
Dinamic în timp discret cel mai adesea prin ecuaŃii diferenŃiale
- sistemul se studiază la anumite momente de timp, care
alcătuiesc un şir discret; ecuaŃiile utilizate de obicei fiind de
tip recurent.
Dinamice distributive - definite prin modificarea graduală a mai multor variabile,
adesea independente, exprimate prin ecuaŃii diferenŃiale
parŃiale
Dinamice integrate - definite la scară temporală lungă, exprimate prin valori
medii ale variabilelor de stare şi proces
Liniare - sunt considerate ecuaŃii de gradul I
Neliniare - ecuaŃii de grad superior sau funcŃii neliniare
Cauzale (cutie albă) - datele de intrare şi rezultatele sunt conectate prin relaŃii de
tip cauză - efect
Necauzale (cutie neagră) - sunt comparate intrările cu ieşirile, fără analiza
mecanismului intim cauzal
PopulaŃionale Modele care descriu structura şi/sau funcŃionarea sistemelor
SuprapopulaŃionale supraindividuale la diferite niveluri de organizare
(Cenotice) (populaŃie, comunitate sau asociaŃie, biocenoză, ecosistem,
Ecosistemice (Holiste) biom, biosferă respectiv ecosferă etc., supra- şi subdiviziuni
Modele ale bio(eco)sferei ale acestora).
Bioenergetic - descriu şi caracterizează fluxul energetic
Biogeochimic - circuitul materiei sau cicluri ale unor elemente şi substanŃe
în natură
Modele bazate pe indivizi - analizează comportamentele elementelor constituente ca
(MBI) bază explicativă pentru funcŃionarea întregului;
Agregative - grupează elementele constituente după anumite criterii.
I. Sîrbu - Modelarea proceselor ecologice (2010) 53

Automatele celulare sunt sisteme dinamice în care spaŃiul, timpul şi


variabilele de stare ale sistemului sunt discrete. Fiecare celulă a unei matrici sau a
unei reŃele rectangulare îşi modifică starea în timp după o anumită regulă, care
este locală şi deterministă.
Modelele tratează rar, asemenea categoriei precedente, elementele
constituente ale sistemului ca fiind individuale, în ceea ce priveşte aportul
manifestării lor la explicarea funcŃiilor întregului. De cele mai multe ori sistemele
sunt considerate ansambluri de grupe de elemente, caracterizate printr-un grad de
organizare (populaŃii, niveluri trofice, categorii funcŃionale etc.). Această grupare,
după diferite criterii, defineşte modelele de tip agregativ. Ele pot fi de tip
sistematic (grupare pe specii, genuri, familii etc.), structural (sex, vârstă, structură
genetică etc.), funcŃional (trofice, categorii de folosinŃe etc.).
Modelele spaŃiale sunt cele care includ distribuŃia, agregarea şi mişcarea
în spaŃiu a sistemelor supraindividuale.
Modelarea orientată pe obiecte implică grupe de submodele (obiecte)
care au un grad relativ de autonomie, în sensul că pot fi descrise o singură dată, şi
apoi asamblate în modele mai complexe în funcŃie de necesităŃi. De exemplu,
modelul creşterii logistice a unei populaŃii poate fi definit o singură dată sub
forma unei rutine scrise într-un program oarecare, după care aceasta este chemată
în oricare model superior care implică date despre dinamica numerică a unor
populaŃii particulare. Datele şi condiŃiile de intrare pot fi diferite, dar mecanismul
de creştere logistică este acelaşi. Cele mai multe programe şi limbaje moderne
suportă acest tip de modelare, care este din ce în ce mai utilizat.
În tabelul 6.1 sunt redate sintetic principalele categorii de modele, grupate
după diferitele criterii şi caracterizate sumar, în scopul alcătuirii unei imagini de
ansamblu asupra problematicii clasificării. Există şi alte categorii de modele, care
nu se pot prezenta sub formă dichotomică sau prin comparaŃie, în mod special
cele care s-au dezvoltat cu precădere în ultimele decenii. Dintre acestea amintim:
modelele spaŃiale, modele fractale, cele bazate pe metode tip Monte-Carlo,
modele de optimizare, cele bazate pe teoria jocurilor, pe teoria haosului sau a
catastrofei, şi altele.
I. Sîrbu - Modelarea proceselor ecologice (2010) 54

7. MODELE CONCEPTUALE ŞI TRECEREA SPRE


MODELELE CANTITATIVE

7.1. Modele conceptuale

Procesul de conceptualizare, trecerea de la o idee la expresia imaginativă a


acesteia, este un pas esenŃial în cercetare. Construirea modelelor conceptuale este
o parte integrantă a oricărui studiu. Acestea sunt de obicei scheme sau diagrame,
de exemplu formate din blocuri (care reprezintă etape, sarcini, comenzi, întrebări,
declaraŃii etc.) legate prin săgeŃi (care indică relaŃiile dintre blocuri şi ordinea de
parcurgere a etapelor). În blocuri sunt incluse şi variabilele de stare, care descriu
condiŃiile în care se află compartimentele sistemului ecologic analizat. Un bun
model conceptual ajută ecologul să formuleze ipoteze, să evalueze necesarul de
date pentru verificarea acestora, să dimensioneze studiul în timp şi spaŃiu etc.
Complexitatea modelelor creşte repede cu progresul unei cercetări, motiv
pentru care este necesar să ne concentrăm asupra întrebărilor la care dorim să
răspundem. Acesta este încă un motiv pentru a alcătui un bun model conceptual,
care ne va ajuta astfel să nu ne pierdem în amănunte insignifiante în context şi să
ne limităm la ceea ce este relevant.
Există mai multe categorii de modele conceptuale, dintre care le amintesc
pe cele mai importante:

• Modele verbale
Semnifică descrierea verbală a structurii unui model, a componentelor şi
legăturilor dintre acestea. Se utilizează mai frecvent la procese simple.

• Scheme şi desene
Foarte des folosite în toate domeniile ecologiei, atât ca metodă ştiinŃifică,
cât şi pentru expunere didactică sau popularizare. Există o mare varietate de
grafice, scheme, desene care includ o serie de detalii, reprezentări ale unor
structuri şi funcŃii particulare etc. În ştiinŃă desenul se utilizează pentru ilustrarea
sintetică a caracteristicilor realităŃii investigate, pentru a reliefa şi reprezenta
semnificaŃia datelor experimentale, a evidenŃia tendinŃe şi dinamici repetitive etc.

• Diagrame în blocuri (tip cutie)


De obicei se realizează prin ansambluri de blocuri interconectate prin
săgeŃi. Fiecare bloc (sau cutie) are o formă geometrică oarecare definită printr-un
chenar, indicând tipul de informaŃie sau proces care se desfăşoară, în jurul unui
text sau simbol care va constitui o componentă a modelului, iar săgeŃile sau liniile
indică legăturile dintre acestea. În funcŃie de prezenŃa sau absenŃa factorilor
cauzali şi explicativi distingem:
- modele tip bloc negru (sau cutie neagră)
I. Sîrbu - Modelarea proceselor ecologice (2010) 55

În acestea se Ńine seama numai de intrări şi de ieşiri, adică de valorile de la


începutul procesului/ compartimentului şi cele care rezultă în urma acestuia, fără
să ne intereseze cauzalitatea şi mecanismul dintre aceste două categorii. Se aplică
mai ales la studii de caz, la relaŃii de tip statistic, şi în general nu se pot extrapola
la alte sisteme.
- modele tip bloc alb (sau cutie albă)
Sunt modele constituite pe baza expresiei relaŃiilor cauzale între procesele
analizate. Între datele de intrare şi cele de ieşire sunt intercalate reguli, de tipul
ecuaŃiilor matematice. Odată definite şi validate, aceste relaŃii se pot aplica (cu
modificările de rigoare) şi la alte sisteme sau procese similare.
- modele tip cutie (bloc) gri
În realitate sunt cele mai comun utilizate, constituind o combinaŃie a
categoriilor antemenŃionate. Acestea conŃin relaŃii cauzale, dar includ şi legături
empirice sau statistice pentru unele procese.
O variantă a modelelor cu blocuri sunt cele de tip I/O adică intrare - ieşire
(Input/ Output) care conŃin date suplimentare pentru fiecare cutie, la începerea
şi la finalul procesului particular analizat.
Indiferent de tipul modelului, formele geometrice ale blocurilor pot fi alese
astfel încât să mărească sugestivitatea procesului reprezentat. Se poate opta,
pentru forme utilizate în algoritmii de calculator, sau forme speciale, cum sunt de
exemplu, cele utilizate de E. P. Odum (1971) la descrierea structurii energetice a
sistemelor ecologice (ilustrând prin diferite forme intrarea energiei, transferul,
pierderile, consumul etc.). În literatură există o mare varietate de definiŃii şi
posibilităŃi de reprezentare grafică.

• Modelele matriciale
Se indică prin algebră matricială legătura dintre elementele constituente ale
unui sistem. Cea mai simplă formă de expresie este reprezentarea unei legături,
fără a se preciza nici valoarea acesteia (intensitatea sau evaluarea cantitativă de
orice fel), şi nici direcŃia (cine asupra cui acŃionează). O variantă este simpla
construcŃie cu valori de tip 1 şi 0, unde 1 semnifică existenŃa relaŃiei iar 0 absenŃa
acesteia. În exemplul de mai jos considerăm 4 elemente (să presupunem că
acestea ar fi populaŃii ale unei comunităŃi), între care există (1) sau nu (0) relaŃii
de competiŃie:

A B C D
A 1
B 1 1
C 0 1 0
D 0 0 1 1

Aceasta este o matrice simetrică, triunghiulară, valorile de 1 pe diagonala


principală indicând o relaŃie (competiŃie) intraspecifică sau interspecifică. Astfel
constatăm că perechile de populaŃii între care există relaŃii competitive sunt: între
I. Sîrbu - Modelarea proceselor ecologice (2010) 56

A şi B, între B şi C, precum şi între C şi D, singura în interiorul căreia nu am


decelat competiŃie intraspecifică, fiind populaŃia C. Reprezentarea acestei matrici,
sub forma unui model conceptual grafic, se poate face printr-un graf neorientat:

B C

Un alt model ne indică cine asupra cui acŃionează, caz în care matricea nu
trebuie să fie simetrică, iar reprezentarea va fi de tipul unui digraf orientat. De
exemplu, fie o comunitate în care valorile de 1 indică cine cu cine se hrăneşte
(cine prădează pe cine), iar într-un caz întâlnim şi fenomene de canibalism:

de la (prădează pe...):
A B C D
A 1 0 0 0
către: B 1 0 1 0
(este C 0 0 0 1
prădat) D 0 1 1 0

B C

În alte modele matriciale nu interesează numai existenŃa şi direcŃia


legăturii, ci şi valoarea acesteia, de exemplu probabilitatea de trecere dintr-o stare
în alta, procentul de materie care trece de la un compartiment la altul etc., caz în
care matricea poate fi reprezentată sub forma unui digraf numeric orientat
(similar cu cel expus mai sus, dar pe fiecare săgeată se scrie valoarea ponderii
legăturii sau orice evaluare cantitativă). Numeroase structuri şi procese ecologice
se pot defini şi reprezenta sub forma unor digrafuri numerice orientate, aceasta
fiind totodată o trecere de la modelul conceptual spre unul cantitativ.
I. Sîrbu - Modelarea proceselor ecologice (2010) 57

7.2. Trecerea de la modelul conceptual la modelul cantitativ

Un model cantitativ este un set de expresii matematice şi valori ataşate


blocurilor şi săgeŃilor modelelor conceptuale. Cele mai multe categorii de
modele, prezentate la clasificare, sunt totodată şi cantitative.
Să presupunem că dorim modelarea ratei de consum C a unui prădător
(variabila dependentă) ca funcŃie de disponibilitatea prăzii P (variabila
independentă). Putem decela cel puŃin trei ecuaŃii care corespund la tot atâtea
ipoteze (adaptat după L. J. Jackson şi col., 2000):

1.)C = a * P
b*P
2.)C =
1+ c*P
3.)C = d * P * e −f *P

Reprezentările grafice ale acestor modele sunt redate mai jos.

Modelul 1:
15
12.03

10
C( P )
5

0.03 0
0 1 2 3 4
0.01 P 4

Modelul 2:

0.4

C( P )
0.2

0
0 1 2 3 4
P
I. Sîrbu - Modelarea proceselor ecologice (2010) 58

Modelul 3:

0.5
C( P )

0
0 1 2 3 4
P

În modelul 1 rata de consum creşte liniar cu disponibilitatea prăzii. La tipul


2 consumul creşte la valori mici ale P, după care se saturează la valori mari ale
acesteia, iar în cel de-al treilea model C creşte la valori mici, dar descreşte la
valori mari ale lui P (de exemplu ca urmare a intervenŃiei apărării sociale la
pradă). Aceste trei modele sunt testate pe date reale, prin tehnici care vor fi
studiate la capitolul dedicat modelării statistice, iar coeficienŃii implicaŃi (a, b, c,
d, f) primesc valori, li se evaluează eroarea standard şi semnificaŃia. De asemenea
vom evalua coeficienŃi de determinare, care vor sugera în ce măsură variaŃia
variabilei dependente este explicată de către cea independentă. Urmează
validarea modelelor, adică vom evalua prin diferite simulări şi teste, care dintre
modele şi în ce condiŃii verifică cel mai bine şirul de date reale (experimentale
sau observate).
Prin urmare, evaluarea parametrilor semnifică identificarea valorilor pentru
acei coeficienŃi care intervin în construcŃia ecuaŃiilor modelului cantitativ. Sursa
de informaŃie depinde de modul în care va fi folosit modelul. Uneori evaluarea
parametrilor constituie un scop în sine, caz în care modelul va fi rulat de multe
ori pe calculator, dându-se un număr oarecare de valori, sau chiar domenii, în
care variabilele vor fluctua la întâmplare. Dacă modelul se referă la un sistem
particular, despre care avem deja date experimentale, acestea vor fi utilizate
pentru a estima parametrii, care vor fi unic definiŃi, procedeu caracteristic pentru
modelele statistice. Există însă şi posibilitatea de a nu dispune de date reale, caz
în care estimările lor se vor realiza printr-un proces iterativ, în cadrul căruia se va
compara permanent rezultatul rulării modelului cu cel care se constată prin
observarea sistemului, până când se ajunge la o relativă identitate (corespondenŃă
a rezultatelor). Acesta este un procedeu de calibrare a modelului, care se poate
realiza prin cercetare sistematică sau prin încercare şi eroare.
După ce am selectat cea mai “bună formă” a modelului (în sensul de
adecvată condiŃiilor studiate) vom putea avansa interpretări de ordin ecologic şi
trage concluzii pe baza acestora, fenomen care se numeşte detecŃie ecologică
(Hillborn şi Mangel, 1997, ap. J.J. Leland şi col., 2000).
În multe cazuri modelele empirice sunt restricŃionate la subiectul analizat,
deoarece se bazează pe datele disponibile din lumea reală şi pe construirea de
relaŃii între acestea. Alte modele predictive pot fi însă complexe, generalizabile,
I. Sîrbu - Modelarea proceselor ecologice (2010) 59

incluzând descrieri formale cu valabilitate mai largă, relaŃii cauzale şi prognoze


bazate pe un număr mai mare de date şi variabile independente.
Dacă am hotărât că modelul cantitativ poate şi merită să fie formulat în
termeni de ecuaŃii, vom căuta cele mai bune categorii, modalităŃi de soluŃionare a
acestora şi vom evalua parametri pentru fiecare, înainte de a ne grăbi să le
transcriem într-un sistem de programe sau a le codifica într-un limbaj oarecare.
Unele ecuaŃii sunt construite de ecolog (în special în modelele statistice, precum
şi în multe tehnici deterministe), altele se aleg din literatura de specialitate,
cunoscându-se faptul că anumite expresii descriu cu o bună acurateŃe procesul
particular studiat. Selectarea ecuaŃiei poate fi impusă de domeniul matematic,
care se pretează la analiza condiŃiilor cercetării.
Am amintit anterior că urmărirea desfăşurării fenomenelor în timp se poate
realiza prin cel puŃin trei categorii de tehnici: metode statistice de tipul analizei
seriilor de timp, ecuaŃii deterministe în timp discret (recurente) sau în timp
continuu (ecuaŃii diferenŃiale).
De exemplu, dacă o variabilă x are valoarea xt la momentul t şi xt+1 la
momentul (t+1), atunci o ecuaŃie recurentă care descrie un proces ce se urmăreşte
în intervale discrete de timp, poate avea forma generală:

xt+1 = f(xt)

unde: f este funcŃia care descrie variaŃia.


De exemplu f(x)= 23.7 - 4.5*x
Dacă cunoaştem valoarea xt putem prognoza fără probleme şi corect valoarea lui
xt+1.
În timp continuu, un proces care se desfăşoară va avea, de exemplu,
ecuaŃia generală de forma:

d
g (t ) = e t + 1.8
dt

unde: derivata în raport cu timpul a unei funcŃii ce descrie un fenomen


particular este redată de o anumită expresie matematică. Rezultatul unei
asemenea ecuaŃii, spre deosebire de penultima, va fi tot o funcŃie, care nu este
obligatoriu unică. Prin urmare rezultatul va fi de tip deschis (şi nu închis, adică o
anumită valoare a lui xt+1, ca mai sus) şi poate fi reprezentat sub forma graficului
funcŃiei respective (traiectoria sistemului). Rezolvarea ecuaŃiilor şi a sistemelor
de ecuaŃii diferenŃiale, modelarea traiectoriei sistemelor ecologice şi alte aplicaŃii
ale acestora se vor studia într-un capitol viitor.
I. Sîrbu - Modelarea proceselor ecologice (2010) 60

8. INTRODUCERE ÎN MODELAREA STATISTICĂ PE


CALCULATOR

În acest capitol vom descrie şi parcurge principalii paşi în utilizarea unui


sistem de programe, care ne ajută în analiza şi prelucrarea datelor ecologice,
precum şi în dezvoltarea modelelor statistice.
SYSTAT (v. 10.2) este un sistem de programe, conceput pentru analiza
statistică a datelor, cu variate aplicaŃii în toate domeniile. Cunoaşterea unui
număr redus de comenzi şi funcŃii este suficientă pentru construirea unui număr
semnificativ de modele cu diferite grade de complexitate. Sistemul de programe
este conceput în module, corespunzătoare în mare capitolelor sau subdiviziunilor
statisticii. Intrarea în program se face fie prin icoana vizibilă pe desk-top.
Comenzile şi funcŃiile se pot tasta în modulul de comenzi interactive sau
accesa din meniurile pop-up. În cazul în care se scriu explicit, fiecare comandă se
scrie pe câte o linie, la sfârşitul acesteia tastându-se Enter.

8.1. Editarea şi transformarea datelor

Fereastra de editare a datelor se deschide prin selectarea din meniul


principal:
File → New → Data (pentru a deschide o foaie de calcul nouă)
sau:
File → Open → Data → Nume fişier (pentru a deschide un fişier existent)
Între fereastra de editare şi cea de comandă/afişare rezultate se trece prin
selecŃia ferestrelelor situate pe barade jos: Untitled SYSTAT Output Organizer,
respectiv Untitled - SYSTAT Data.
În fereastra de editare fiecare coloană este considerată o variabilă care
trebuie declarată la începutul lucrului, iar fiecare rând este un articol (case) care
are un număr curent implicit. Variabilele pot fi de mai multe tipuri, în ecologie
având importanŃă cele numerice şi variabilele text (şir de caractere alfanumerice).
Odată definite, variabilele pot fi oricând redenumite, dar nu li se mai poate
schimba tipul. Deosebirea dintre declararea celor două tipuri este semnul $ care
încheie numele unei variabile de tip şir de caractere. Eticheta unei variabile
începe în mod obligatoriu cu o literă. De asemenea trebuie avut în vedere că
variabile diferite au în mod obligatoriu nume diferit. Pentru acelaşi caracter, litera
mare este echivalentă cu litera mică.
Exemple de nume de variabile numerice:
V1, DENSITATE, X1, XX1, XXX1, XXX2, XXX3
Exemple de nume de variabile şir de caractere:
D$, D1$, D11$, XXX1$, NUME$, VARSTA$
Datele se înscriu în fereastra de editare numai după ce au fost declarate
variabilele în prima linie a viitorului tabel. Pentru a defini variabilele daŃi dublu
I. Sîrbu - Modelarea proceselor ecologice (2010) 61

clic pe linia de declaraŃii (unde vedeŃi VAR00001, VAR00002 etc.), apare


fereastra de Variable Properties în care scrieŃi şi selectaŃi ceea ce doriŃi.
Defilarea se face prin săgeŃi, tasta Home (vă poziŃionează pe primul câmp
al articolului), tasta End (duce cursorul pe ultima celulă), respectiv Page Up şi
Page Down.
Odată introdusă o valoare într-o celulă, aceasta se părăseşte prin tasta
Enter sau săgeată în jos. Deosebirea este că în primul caz cursorul se deplasează
spre dreapta (avantajos când datele primare sunt introduse pe linii), în timp ce în
al doilea caz datele se înscriu obligatoriu pe coloane.
Dacă se greşeşte la introducerea datelor, schimbarea unei înregistrări se
face prin simpla poziŃionare pe celula cu pricina, introducerea noii valori sau
înregistrări şi părăsirea celulei cu Enter sau Săgeată. Noua valoare va înlocui
automat pe cea precedentă. În mod similar dacă se doreşte schimbarea numelui
unei variabile, utilizatorul se poziŃionează pe etichetă, introduce noul nume şi
părăseşte celula.
Pentru a salva un fişier se selectează icoana cunoscută din MS Office sau
se tastează CTRL+S, sau se părăseşte fereastra de editare şi se scrie în cea de
comandă :
> SAVE nume-fişier
Numărul de zecimale implicit pentru date (atât la introducere cât şi în
rezultate) este 3, fapt care se poate schimba prin modificarea câmpului
corespunzător din fereastra de proprietăŃi ale variabilei.
De reŃinut că în SYSTAT puteŃi scrie deopotrivă cu majuscule sau
minuscule comenzile sau declaraŃiile de variabile.
Selectarea unei variabile se realizează prin simpla poziŃionare pe numele
acesteia şi selectarea ei (clic stânga). Asemănător se procedează pentru selecŃia
unui articol, executând un clic pe numărul curent al lui. SelecŃia mai multor
articole, respectiv variabile, se realizează prin "clic and drag".
După ce variabila sau articolul au fost selectate, ele se pot copia (din
meniul Edit → Copy sau Ctrl+C, apoi Paste sau Ctrl+V), se pot şterge (Cut sau
Delete - prima şterge complet articolul sau variabila, a doua şterge înregistrările
din câmpuri), se pot muta etc. De asemenea se pot insera articole (Edit → Insert
Case) sau se pot insera variabile (Edit → Insert Variable). Cu opŃiunile Find
variable respectiv Find in column, vă puteŃi poziŃiona pe o anumită coloană,
respectiv găsi o anumită valoare.
OperaŃii şi transformări ale variabilelor se realizează din fereastra de
comenzi/afişare rezultate. Indiferent ce dorim să facă o variabilă, cuvântul cheie
este LET. Cu aceasta putem combina, aplica o funcŃie, transforma variabile, sau
putem crea alte variabile noi. Acelaşi lucru îl obŃinem dacă selectăm din meniul
de Data opŃiunea Transform, urmată de Let.
Expresia generală este:
LET (variabilă) = (expresie)
I. Sîrbu - Modelarea proceselor ecologice (2010) 62

Transformarea condiŃionată se realizază asemănător cu combinaŃia IF...


THEN LET .... (fie în meniul de comenzi interactive, fie din meniul Data →
Transform → If Then Let), expresia generală fiind
IF (condiŃie logică) THEN LET (variabilă) = (expresie).
Pentru a vedea cum funcŃionează aceste comenzi, să considerăm un
exemplu. Un ecolog a analizat un număr de 40 probe, fiecare de câte 1 m2, la
malul unui lac. A identificat două specii de gastropode la limita între apă şi uscat,
şi anume Galba truncatula şi Physa acuta. În prima variantă cunoaşte numărul de
exemplare din fiecare pătrat. Baza de date este redată mai jos.
Cercetătorul intră în programul SYSTAT, deschide o foaie de lucru,
declară variabilele în manieră codificată (fără să uite să-şi noteze undeva codurile
utilizate, inclusiv viitorul nume al fişierului, pentru a putea accesa datele
oricând), de exemplu GT pentru Galba truncatula şi PA pentru Physa acuta.
După declararea variabilelor ecologul se va deplasa pe prima linie şi prima
coloană (Case 1) începând înregistrarea datelor.

Case GT PA
1 0 6
2 0 7
3 12 5
4 145 23
5 23 0
6 0 0
7 0 1
8 0 14
9 0 12
10 58 14
11 0 85
12 0 26
13 0 23
14 58 25
15 0 14
16 12 12
17 0 8
18 12 5
19 56 0
20 8 0
21 4 5
22 56 15
23 52 21
24 84 37
25 57 19
26 51 36
27 85 18
28 26 12
29 24 29
30 12 24
31 23 31
32 0 15
I. Sîrbu - Modelarea proceselor ecologice (2010) 63

33 0 21
34 0 0
35 25 63
36 84 23
37 61 21
38 186 25
39 245 12
40 368 2

După introducerea datelor, fişierul se salvează cu numele LAC. Din acest


moment denumirea lac este rezervată exclusiv pentru acest fişier.
Dacă se revine asupra fişierului, încărcarea acestuia se face fie prin File →
Open → selecŃie lac, fie din modulul de comandă cu cuvântul rezervat USE
nume_fişier, adică:
> USE LAC
Dacă aŃi modificat fişierul (de exemplu prin completarea sau actualizarea
valorilor) nu uitaŃi să-l salvaŃi din nou!
Din diferite motive, cercetătorul poate vrea să aplice unele transformări sau
calcule pe datele brute din fişierul de mai sus. Cu ajutorul comenzii LET puteŃi
realiza multe calcule automate. De exemplu:
> LET MELCI = GT + PA
va introduce în fişier o nouă variabilă (MELCI) care conŃine suma valorilor
de densitate ale variabilelor GT şi PA.
> LET GT = LOG(GT)
va înlocui valorile originale ale variabilei GT cu valorile logaritmate în
bază naturală.
Poate doriŃi să păstraŃi în fişier atât valorile variabilei originale cât şi cele
logaritmate, caz în care se utilizează un nume diferit pentru variabila transformată
(de exemplu GTLOG):
> LET GTLOG = LOG(GT)
PuteŃi selecta numeroase funcŃii matematice din meniul pop-up care apare
prin selectarea opŃiunii Transform → Let.
Operatorii utilizaŃi sunt cei obişnuiŃi în informatică. Nu uitaŃi că virgula, în
numerele reale, se înlocuieşte cu punctul.

Operatori şi semnificaŃii
+ sumă
- diferenŃă
* înmulŃire
/ divizare
^ exponent
< mai mic decât
> mai mare decât
= egal
<> diferit de
I. Sîrbu - Modelarea proceselor ecologice (2010) 64

<= mai mic sau egal decât


=> mai mare sau egal decât

FuncŃiile sunt alese prin cuvinte rezervate iar variabila se pune în


paranteze rotunde (ca în exemplul de mai sus).
Principalele funcŃii care ne stau la dispoziŃie sunt:
SQR rădăcină pătrată
LOG logaritm natural
EXP funcŃia exponenŃială
ABS valoare absolută
SIN sinus
COS cosinus
TAN tangent
Ori de câte ori uităm sintaxa unei expresii sau vreun nume rezervat, putem
cere ajutor, fie din meniul pop-up al versiunilor superioare, fie tastând HELP în
lina de comandă. Dacă nu dorim un ajutor general, ci specific, legat de o anumită
expresie sau funcŃie, tastăm:
>HELP expresie
Ştergerea unui articol se mai poate face din fereasrta de comenzi prin
cuvântul DELETE nr.curent al liniei. De exemplu
>DELETE 23
are ca efect ştergerea datelor incluse în linia 23 (proba cu numărul curent 23).
Ştergerea unei variabile se mai poate face cu comanda DROP
nume_variabilă.
De exemplu comanda
>DROP GT
are ca efect ştergerea variabilei în care sunt incluse datele de densitate ale speciei
Galba truncatula. Dacă aŃi şters ceva din greşeală, cel mai simplu mod de a
recupera datele este să nu salvaŃi fişierul, ci să ieşiŃi din modul, reintraŃi şi
încărcaŃi din nou datele originale.
Comenzi condiŃionate se pot introduce folosind perechea IF, THEN.
Operatorii logici sunt:
AND - şi
OR - sau
NOT - negaŃie logică
De exemplu următoarea linie de comandă
>IF GT = 0 AND PA = 0 THEN LET MELCI$ = ‘proba_nula’
are ca urmare căutarea articolelor care satisfac ambele condiŃii (adică densitatea
ambelor specii să fie 0) şi introduce o variabilă şir, nouă, care va conŃine expresia
‘proba_nula’ pentru articolele astfel selectate.
Părăsirea modulului de editare (pentru a schimba modulul sau a închide
calculatorul) se face cu comanda:
> QUIT
sau prin selectarea x din colŃul dreapta sus (ca în MS Office).
I. Sîrbu - Modelarea proceselor ecologice (2010) 65

Ordinea evaluării expresiilor este de la stânga la dreapta şi de sus în jos,


în funcŃie de valoarea operatorilor, în mod similar cu condiŃiile notaŃiilor
matematice. Şi aici, utilizarea parantezelor rotunde are aceeaşi semnificaŃie pe
care o au şi în matematică.
Ieşirea din fişierul salvat şi aducerea unui ecran gol, pentru a introduce
datele unui nou fişier, se face prin comanda NEW sau combinaŃia de taste
Ctrl+N.
Listarea fişierului de date, de exemplu pentru a fi copiat în word, se face
cu comanda LIST.
Fişierul existent poate fi reordonat (adică se schimbă ordinea de scriere a
articolelor) în funcŃie de un criteriu pe care îl numim cheie de sortare sau de
indexare. Programul permite reordonarea articolelor în sensul ascendent al
valorilor unei (unor) variabile definite drept chei. Cuvântul rezervat pentru
aranjare este SORT. De exemplu expresiile:
>SORT GT
determină aranjarea în ordine crescătoare a densităŃii speciei G. truncatula, iar
> SORT GT, PA
determină aranjarea articolelor în ordinea crescătoare a densităŃii speciei G.
truncatula, iar pentru aceleaşi valori ale acesteia, articolele sunt rearanjate în
ordinea crescătoare a densităŃii speciei P. acuta. În această dublă aranjare,
variabila GT este cheie primară, iar PA este cheie secundară.
Se observă că o comandă sau funcŃie poate include o variabilă, mai multe
(care se despart pe aceeaşi linie prin virgulă), sau toate.
Standardizarea variabilelor este extrem de utilă în analize multivariate, de
exemplu în tehnici de clasificare şi de analiză a dendrogramelor, motiv pentru
care uneori trebuie să standardizăm datele. Acest lucru se face foarte simplu prin
comanda STANDARDIZE. Prin această comandă valorile originale ale
variabilelor sunt înlocuite cu scorurile z.
De exemplu:
> STANDARDIZE
determină standardizarea datelor tuturor variabilelor, iar:
> STANDARDIZE nume_variabilă_1, nume_variabilă_2
are ca efect standardizarea celor două variabile apelate.

8.2. OperaŃii cu fişiere

Două sau mai multe fişiere pot fi unite (alipite) pe orizontală. Pentru
aceasta se selectează Data → Merge → (selecŃie fişiere şi selecŃie variabile) →
Save file (nume fişier nou).
Expresia generală este:
MERGE fişier1 (listă 1 variabile) fişier2 (listă 2 variabile)
Dacă există variabile comune celor două fişiere, se vor înscrie datele variabilei
corespunzătoare din cel de-al doilea fişier. Dacă dorim potrivirea articolelor după
un anumit protocol se poate opta pentru o variabilă cheie anume.
I. Sîrbu - Modelarea proceselor ecologice (2010) 66

Prin comanda:
MERGE fişier (listă variabile)
putem obŃine un nou fişier care va conŃine numai anumite variabile din cel
vechi, într-o nouă ordine.
O altă opŃiune este să unim două fişiere pe verticală. În acest caz este
necesar ca fişierele să aibă aceleaşi variabile, situate în aceeaşi ordine. Se
selectează Data → Append → (nume fişiere)
Expresia generală este:
APPEND fişier1 fişier2
articolele din fişier 2 vor fi adăugate după ultimul articol din fişier 1. Nu
uitaŃi să selectaŃi opŃiunea Save file pentru a păstra în memorie fişierul nou.
TranspoziŃia fişierului (transformarea liniilor în coloane) este adesea
necesară, cum ar fi în analize de corelaŃii sau de clasificare ierarhică, fapt care se
execută cu comanda TRANSPOSE nume fişier, sau selecŃia din meniurile
corespunzătoare:
Data → Transpose → (selecŃie variabile) → Save file → (nume fişier
nou).

8.3. Modulul de statistică univariată

Modulul de statistică se poate accesa din fereastra de comenzi cu expresia


STATS. Comanda pentru analiza statistică este STATISTICS. De exemplu:

> STATS
> USE LAC
> STATISTICS /ALL
va avea ca efect apariŃia următoarelor rezultate (o selecŃie din cele care apar
efectiv):
GT PA

N OF CASES 40 40
MINIMUM 0.000 0.000
MAXIMUM 368.000 85.000
RANGE 368.000 85.000
MEAN 45.675 17.725
VARIANCE 5585.251 282.922
STANDARD DEV 74.735 16.820
STD. ERROR 11.817 2.660
SKEWNESS(G1) 2.717 2.014
KURTOSIS(G2) 7.906 5.462
SUM 1827.000 709.000
C.V. 1.636 0.949

În comanda precedentă ALL semnifică selectarea tuturor analizelor


statistice descriptive conŃinute de rutină.
I. Sîrbu - Modelarea proceselor ecologice (2010) 67

Acelaşi lucru se poate obŃine prin selecŃia din meniuri:


Statistics → Descriptive Statistics → Basic Statistics → (selecŃie variabile) →
(selecŃie opŃiuni, respectiv parametri statistici)
Această cale este de preferat atunci când dorim să selectăm numai anumite
opŃiuni din cele care ne stau la dispoziŃie.
SemnificaŃiile rezultatelor (dacă sunt alese toate opŃiunile):
N OF CASES - număr de valori ale variabilei şir, fără cele lipsă.
Acest parametru indică dimensiunea probei (a numărului de valori valabile
pentru care s-au calculat parametri statistici). Se face distincŃia dintre valoarea 0
(zero) care este valabilă (intră în probă) şi valoarea lipsă (semnalată prin punct .)
care nu este considerată un câmp valabil.
MINIMUM - valoarea cea mai mică
MAXIMUM - valoarea cea mai mare
RANGE - amplitudine
SUM - sumă
MEDIAN - mediana
MEAN - medie aritmetică
95% CI Upper - limita superioară de confidenŃă a mediei la probabilitatea de
0.95.
95% CI Lower - limita inferioară de confidenŃă a mediei la probabilitatea de 0.95.
STD. ERROR - eroarea standard a mediei aritmetice
STANDARD DEV - abaterea standard
VARIANCE - varianŃa
C.V. - coeficient de variaŃie
SKEWNESS (G1) - coeficient de asimetrie
SE SKEWNESS - eroarea standard a coeficientului de asimetrie
KURTOSIS (G2) - coeficient de aplatizare/boltire
SE KURTOSIS - eroarea standard a coeficientului de aplatizare/boltire.

Comanda SATISTICS consideră implicit toate variabilele dintr-un fişier.


Dacă se execută analize numai pentru anumite variabile, acestea se declară prin
etichetele lor, despărŃite de virgulă:
> STATISTICS nume_veriabilă_1, nume variabilă_2 ....

Tabelul de mai jos conŃine date biometrice ale speciei Unio crassus,
exemplarele fiind colectate din două staŃii de pe Crişul Alb, şi anume de la Ineu şi
Chişineu -Criş (au fost selectate la întâmplare câte 50 de exemplare măsurate în
fiecare dintre staŃii). Etichetele variabilelor au următoarele semnificaŃii: GFA -
masa scoicii, fără apă în cavitatea paleală, L - lungimea maximă, H - înălŃimea în
dreptul umbonelui, LAT - lăŃimea, S - codul numeric al staŃiei (S=1 pentru Ineu şi
S=2 pentru Chişineu-Criş).
I. Sîrbu - Modelarea proceselor ecologice (2010) 68

Date biometrice la Unio crassus din râul Crişul Alb

GFA L H LAT S

CASE 1 58.91 83.40 40.00 29.30 1.00


CASE 2 40.84 74.00 34.50 26.10 1.00
CASE 3 29.44 66.50 32.30 24.50 1.00
CASE 4 40.84 74.00 35.00 27.20 1.00
CASE 5 30.40 67.20 34.50 24.50 1.00
CASE 6 46.13 77.00 35.00 27.40 1.00
CASE 7 46.13 77.00 36.70 26.20 1.00
CASE 8 50.87 79.50 37.60 27.00 1.00
CASE 9 15.91 54.40 28.00 19.50 1.00
CASE 10 38.36 72.50 34.50 23.50 1.00
CASE 11 28.76 66.00 30.80 22.40 1.00
CASE 12 43.25 75.40 34.60 27.00 1.00
CASE 13 38.19 72.40 35.00 24.30 1.00
CASE 14 32.38 68.60 32.00 23.80 1.00
CASE 15 13.05 51.00 25.50 17.10 1.00
CASE 16 24.10 62.30 32.70 22.30 1.00
CASE 17 34.45 70.00 34.00 24.20 1.00
CASE 18 25.50 63.20 32.30 22.10 1.00
CASE 19 42.50 73.00 36.40 26.80 1.00
CASE 20 39.00 75.50 34.00 25.20 1.00
CASE 21 30.00 67.50 32.30 22.50 1.00
CASE 22 38.00 73.60 33.20 25.00 1.00
CASE 23 43.00 72.00 35.80 25.30 1.00
CASE 24 46.50 79.60 36.30 26.80 1.00
CASE 25 49.90 79.00 39.00 24.60 1.00
CASE 26 50.68 79.40 37.00 27.40 1.00
CASE 27 26.50 69.30 32.40 24.60 1.00
CASE 28 12.14 49.80 25.20 19.40 1.00
CASE 29 30.00 65.20 32.50 23.50 1.00
CASE 30 40.00 71.00 34.00 26.40 1.00
CASE 31 36.00 71.00 35.00 25.40 1.00
CASE 32 34.00 69.00 34.30 24.30 1.00
CASE 33 58.50 80.00 40.70 30.20 1.00
CASE 34 44.50 71.30 36.00 25.00 1.00
CASE 35 49.00 76.20 34.80 29.20 1.00
CASE 36 48.00 76.70 35.00 28.70 1.00
CASE 37 38.00 76.10 34.00 27.00 1.00
CASE 38 29.00 67.10 31.00 23.30 1.00
CASE 39 51.00 79.00 36.80 28.60 1.00
CASE 40 40.00 74.20 34.40 26.00 1.00
CASE 41 36.50 71.50 33.50 24.70 1.00
CASE 42 40.00 74.20 34.50 26.60 1.00
CASE 43 33.00 70.00 34.30 24.70 1.00
CASE 44 40.00 72.30 34.00 27.00 1.00
CASE 45 35.00 68.00 31.50 25.00 1.00
CASE 46 34.50 66.60 33.10 25.40 1.00
CASE 47 44.00 73.30 33.80 27.00 1.00
CASE 48 41.00 74.30 35.00 27.40 1.00
CASE 49 26.00 63.00 32.40 22.00 1.00
CASE 50 45.00 75.30 36.30 27.70 1.00
CASE 51 13.00 50.30 24.60 18.80 2.00
CASE 52 28.00 63.00 27.60 23.50 2.00
CASE 53 9.00 46.00 25.00 16.30 2.00
CASE 54 21.50 56.70 27.50 21.80 2.00
CASE 55 21.00 57.10 28.60 21.40 2.00
CASE 56 6.00 38.30 21.00 13.20 2.00
CASE 57 22.00 60.50 28.50 21.20 2.00
CASE 58 24.00 60.50 30.40 21.80 2.00
I. Sîrbu - Modelarea proceselor ecologice (2010) 69

CASE 59 19.00 58.20 28.00 21.50 2.00


CASE 60 7.00 41.10 20.70 13.80 2.00
CASE 61 23.00 56.90 29.50 21.00 2.00
CASE 62 32.00 63.20 31.10 23.60 2.00
CASE 63 25.00 63.00 29.00 21.50 2.00
CASE 64 21.00 53.00 28.00 22.70 2.00
CASE 65 6.50 41.60 21.60 14.80 2.00
CASE 66 17.00 54.00 26.70 19.60 2.00
CASE 67 18.00 57.40 27.40 21.20 2.00
CASE 68 21.00 61.10 29.00 22.20 2.00
CASE 69 20.00 55.30 27.70 22.60 2.00
CASE 70 23.50 59.00 28.00 21.60 2.00
CASE 71 15.50 54.30 26.50 19.20 2.00
CASE 72 7.00 40.60 22.60 15.00 2.00
CASE 73 19.50 59.00 27.10 20.60 2.00
CASE 74 19.00 60.00 28.70 21.20 2.00
CASE 75 15.50 52.50 26.40 20.00 2.00
CASE 76 20.50 58.20 28.00 18.30 2.00
CASE 77 21.00 55.20 28.00 20.50 2.00
CASE 78 7.50 45.00 23.00 14.60 2.00
CASE 79 25.00 60.30 28.60 22.20 2.00
CASE 80 16.00 54.30 26.20 18.20 2.00
CASE 81 7.50 42.00 22.60 15.60 2.00
CASE 82 3.00 31.70 16.60 11.30 2.00
CASE 83 2.50 29.10 15.20 9.40 2.00
CASE 84 10.00 50.20 26.00 17.30 2.00
CASE 85 6.50 39.30 20.70 14.50 2.00
CASE 86 7.00 41.50 21.70 14.20 2.00
CASE 87 4.00 32.60 18.00 12.00 2.00
CASE 88 23.50 61.00 29.30 23.00 2.00
CASE 89 19.00 56.00 28.80 21.00 2.00
CASE 90 16.00 52.30 25.40 19.40 2.00
CASE 91 21.50 60.00 29.00 22.00 2.00
CASE 92 3.00 29.00 16.20 10.60 2.00
CASE 93 21.50 58.60 28.70 21.20 2.00
CASE 94 18.00 55.40 27.00 21.20 2.00
CASE 95 5.00 38.30 20.00 14.30 2.00
CASE 96 14.50 55.00 27.40 19.60 2.00
CASE 97 8.00 44.00 22.10 15.50 2.00
CASE 98 15.00 50.10 28.40 19.40 2.00
CASE 99 17.00 51.10 28.00 20.10 2.00
CASE 100 15.50 53.70 23.70 19.60 2.00

Dacă se doreşte realizarea unor prelucrări diferenŃiate pe staŃii, sau grupe


de date, atunci se include în prima linie de comandă numele variabilei de grupare.
Aceasta trebuie să conŃină numere naturale în calitate de identificator de grup
(din acelaşi motiv am ales codificarea staŃiilor în Tab. 2 sub formă de numere
naturale), iar această trebuie să fie sortată (adică articolele sunt aranjate în
ordinea crescătoare a identificatorilor de grup). Comanda este BY
nume_variabilă.
Dacă, de exemplu, în fişierul de mai sus dorim să realizăm unele calcule
diferenŃiat pe cele două staŃii, utilizăm comanda: BY S. Atunci toate analizele
comandate prin Statistics se vor realiza diferenŃiat pentru clasa de date din S=1 şi
- separat - pentru cele din S=2.
I. Sîrbu - Modelarea proceselor ecologice (2010) 70

8.4. Testul t-Student pentru două medii

Modulul de statistică descriptivă oferă posibilitatea aplicării unor teste,


dintre care reŃinem pe cel care ne va fi extrem de folositor în analizele ecologice,
şi anume testul t-Student pentru verificarea semnificaŃiei diferenŃei dintre
două medii aritmetice.
Pentru a rula acest test trebuie să existe o cheie de grupare, toate datele
unui fişier aparŃinând astfel, obligatoriu, la una din două grupe (ca de exemplu
datele din fişierul XX, care sunt fie din staŃia S 1 fie din S 2). De asemenea
fişierul a fost sortat în prealabil după cheia respectivă. Comanda pentru realizarea
testului este TTEST, cu expresia:
> TTEST
> Use (nume fişier)
> TEST variabila_1, variabila_2 ...,variabila_n * cheie (variabila de grupare)
De exemplu în fişierul XX dacă dorim să verificăm semnificaŃia
diferenŃelor dintre mediile variabilelor masă (GFA) şi lungime totală (L) dintre
loturile aparŃinând celor două staŃii, vom scrie expresiile:
> TTEST
> USE XX
> TEST GFA,L * S
care vor avea ca rezultat redarea următoarelor rezultate:

Two-sample t test on GFA grouped by S

Group N Mean SD
37.77 10.20
1 50
15.64 7.43
2 50

Separate Variance t = 12.40 df = 89.6 Prob = 0.00


Difference in Means = 22.13 95.00% CI = 18.59 to 25.68

Pooled Variance t = 12.40 df = 98 Prob = 0.00


Difference in Means = 22.13 95.00% CI = 18.59 to 25.68

Two-sample t test on L grouped by S

Group N Mean SD
71.17 6.93
1 50
51.33 9.42
2 50

Separate Variance t = 11.99 df = 90.0 Prob = 0.00


Difference in Means = 19.84 95.00% CI = 16.55 to 23.13

Pooled Variance t = 11.99 df = 98 Prob = 0.00


Difference in Means = 19.84 95.00% CI = 16.55 to 23.12

Rezultatele sunt redate explicit pentru cele două variabile şi staŃii, cea mai
importantă valoare în context, este cea redată prin abrevierea PROB situată în
I. Sîrbu - Modelarea proceselor ecologice (2010) 71

dreapta - jos. Valori mai mari de nivelul de semnificaŃie ales (de obicei 0.05)
semnifică diferenŃe nesemnificative între medii. Mai sus observăm că în ambele
cazuri mediile diferă semnificativ. Prin urmare bivalvele prezintă medii
semnificativ mai mari atât în ceea ce priveşte masa cât şi lungimea, la staŃia
situată în amonte (la Ineu).
Interpretarea probabilităŃii testelor. Prin comparaŃie cu testele pe care
le-am studiat la ecologie, rezultatele celor aplicate în Systat redau (pe lângă multe
alte rezultate intermediare, pe care le putem ignora de altfel) direct probabilitatea
(Prob) ca ipoteza nulă să fie adevărată. Prin urmare, pentru a le interpreta, trebuie
să ne reamintim care este ipoteza nulă. Regula de aur este că aceasta implică
întotdeauna o egalitate, adică afirmă că practic nu se întâmplă nimic (mediile nu
diferă, distribuŃiile sunt egale, tratamentul nu are efect etc.), motiv pentru care se
mai numeşte şi ipoteza de repaus. Când vedem o probabilitate mică
(convenŃional sub 0.05) concluzionăm că este o şansă mult prea redusă de a
susŃine această ipoteză, motiv pentru care negăm ipoteza nulă.
Testul t se poate apela în diferite variante şi din meniuri, astfel:
Statistics → t-test → two groups → (selecŃie variabile şi variabila de grupare
cu două valori)
produce un test t independent sau pentru două probe (valorile unei
variabile separate în două pe baza unei variabile de grupare);
Statistics → t-test → paired ... → (selecŃie variabile, fără variabila de
grupare)
produce un test t dependent pentru mediile a două variabile care descriu
acelaşi grup;
Statistics → t-test → One Sample ... → (selecŃie variabile şi redare
valoare prognozată)
pentru a realiza un test t pentru o probă, între valoarea medie a unei
variabile şi o valoare presupusă sau prognozată pentru aceasta.

8.5. Modulul de teste neparametrice

Testele neparametrice sunt utilizate atunci când nu putem presupune că


datele ecologice sunt descrise prin vreo distribuŃie matematică cunoscută. Mai
simplu, utilizăm teste neparametrice atunci când avem puŃine date (n<30),
respectiv când lucrăm cu probe statistice mici. Modulul neparametric se
accesează prin comanda NPAR, sau din meniuri.
Testele neparametrice se aleg în funcŃie de tipul şi aranjarea datelor
primare. Astfel modulul permite realizarea testului Kolmogorov-Smirnov (pentru
o probă), testul semnelor al lui Wilcoxon (pentru două probe relaŃionate),
Friedman (pentru mai multe probe relaŃionate), Kolmogorov - Smirnov sau Mann
- Whitney (pentru două probe independente), Kruskal - Wallis (mai multe probe
independente).
I. Sîrbu - Modelarea proceselor ecologice (2010) 72

Ca în toate rutinele, comanda HELP urmată de o expresie specifică, va


aduce pe ecran explicaŃii cu privire la testul solicitat, precum şi gramatica
explicită a acestuia.
Dacă avem un număr redus de probe şi dorim să aflăm în ce măsură există
diferenŃe semnificative între mediile a două grupe de date, putem rula testul
Mann-Whitney. Este extrem de util atât în unele sectoare ale ecologiei, cât mai
ales în fiziologie, ecotoxicologie sau genetică, unde adesea, din cauza limitărilor
materiale, se lucrează cu un număr redus de probe.
Să presupunem că studiem efectul unei combinaŃii de substanŃe Y într-o
anumită concentraŃie, asupra creşterii unor plantule aparŃinând unei specii de
cultură. Pentru această analiză avem un lot de plantule de aceeaşi vârstă, separate
în două grupe: proba martor (care creşte în absenŃa tratamentului cu Y) şi proba
supusă acŃiunii substanŃei cu pricina.
Fişierul de date primare (PLANTULE.sys) va conŃine prin urmare o
variabilă care descrie creşterea plantulelor într-o anumită perioadă de timp, în cm
(variabila P) şi o variabilă de grupare, sau cheie, care desparte datele în funcŃie de
proba la care aparŃin (martor sau cea supusă acŃiunii substanŃei Y):
P T
CASE 1 4.500 1.000
CASE 2 4.900 1.000
CASE 3 5.000 1.000
CASE 4 5.000 1.000
CASE 5 4.500 1.000
CASE 6 3.400 1.000
CASE 7 5.100 1.000
CASE 8 4.800 2.000
CASE 9 2.300 2.000
CASE 10 4.500 2.000
CASE 11 3.300 2.000
CASE 12 3.800 2.000
CASE 13 4.100 2.000
CASE 14 5.000 2.000
CASE 15 3.200 2.000
CASE 16 2.800 2.000

Pentru a afla dacă există diferenŃe semnificative între medii (cu alte
cuvinte, dacă substanŃa are sau nu un efect asupra creşterii plantulelor) se
tastează:
> NPAR
> USE PLANTULE
> KRUSKAL P * T
iar rezultatul va fi următorul ecran:
I. Sîrbu - Modelarea proceselor ecologice (2010) 73

KRUSKAL-WALLIS ONE-WAY ANALYSIS OF VARIANCE FOR 16 CASES

DEPENDENT VARIABLE IS P
GROUPING VARIABLE IS T

GROUP COUNT RANK SUM

1.000 7 79.000
2.000 9 57.000

MANN-WHITNEY U TEST STATISTIC = 51.000


PROBABILITY IS 0.038
CHI-SQUARE APPROXIMATION = 4.311 WITH 1 DF

Rezultatele se referă la precizarea dimensiunii probei, a variabilei


dependente (P) respectiv de grupare (T), suma rangurilor fiecărei grupe, valoarea
parametrului statistic al testului Mann-Whitney, probabilitatea (! cea mai
importantă parte a rezultatului; restul poate fi ignorat) care ne indică semnificaŃia
diferenŃei. A se reaminti că ipoteza nulă statutează egalitatea mediilor. Dacă s-a
ales un nivel critic de 0.05, devine evident faptul că probabilitatea calculată mai
sus (0.038) este mai mică, motiv pentru care respingem ipoteza nulă şi afirmăm,
la nivelul de asigurare ales, diferenŃe semnificative între cele două probe. Altfel
spus, la nivelul de probabilitate de 0.05 recunoaştem că soluŃia de Y are un efect
semnificativ inhibitor asupra creşterii plantulelor aparŃinând speciei de interes.
Modulul de teste neparametrice se poate apela şi prin meniuri (Statistics
→ Non parametric tests → ...), putându-se selecta o varietate de alte aplicaŃii.

8.6. Grafice

FacilităŃile grafice sunt diverse şi foarte uşor de aplicat. Graficul se alege şi


construieşte adecvat datelor de care dispunem. Le putem clasifica după utilitate
sau formă, respectiv semnificaŃie. După utilitate le împărŃim în grafice
intermediare sau de lucru (care ne ajută în timpul procesului de analiză a datelor,
ca unealtă în selectarea aplicaŃiilor) şi grafice de prezentare a rezultatelor. După
semnificaŃie şi formă distingem grafice de tip nor de puncte, drepte sau curbe de
regresie (cel mai adesea cele două tipuri apar împreună), histograme (care pot
prezenta o mare varietate de date, cele mai uzuale în analizele statistice fiind
distribuŃiile de frecvenŃe pe clase de variaŃie), grafice tip box-plot (descriu
variabilele în ceea ce priveşte mediana, limitele de confidenŃă şi amplitudinea)
etc.
În procesul de modelare este benefic să vizualizăm din când în când datele,
deoarece aceasta ne poate oferi informaŃii despre tipul de model pe care trebuie
să-l construim. De exemplu, dacă dorim să modelăm relaŃia între masa scoicilor
din tabelul referitor la Unio crassus (fişierul XX.sys) şi lungime, intrăm în
modulul grafic (la versiuni inferioare se utilizează comanda GRAPH), încărcăm
fişierul (cu comanda USE) după care vizualizăm datele prin comanda:
> PLOT GFA * L
I. Sîrbu - Modelarea proceselor ecologice (2010) 74

unde PLOT are ca efect crearea unui grafic bidimensional de tip nor de puncte.

65

55

45

35
GFA

25

15

-5
25 35 45 55 65 75 85 95

8.7. CorelaŃii şi distanŃe

Modulul de analiză a corelaŃiilor se accesează din meniuri prin selecŃia:


Statistics → Correlations → Simple → (selectare variabile) → (selecŃie tip
analiză şi date).
SelecŃia tipului de analiză sau date utilizate se referă la variabile continue
(opŃiunile fiind analiza de corelaŃie Pearson, de covarianŃă etc.), matrici de
distanŃe (de exemplu calculează distanŃe euclidiene, Bray-Curtis etc.), ranguri,
sau variabile binare (care conŃin valori de 1 şi 0; acestea se pot utiliza în
ecologie pentru analiza de similitudine pe date calitative, cum ar fi prezenŃa-
absenŃa speciilor etc.).
O variantă mai simplă este utilizarea comenzii de intrare în modul:
> CORR.
Există numeroase posibilităŃi matematice de analiză corelativă. Astfel se
pot realiza, de exemplu, matrici cu coeficienŃi de covarianŃă (prin comanda
COVARIANCE), coeficienŃi de corelaŃie de tip Pearson (PEARSON), matrici
de distanŃe euclidiene (EUCLIDEAN), precum şi indici pentru date binare, de
tipul coeficientului dichotomic Jaccard (S3), coeficientul dichotomic simplu (S4),
coeficienŃii Anderberg (S5), Tanimoto (S6) etc.
În analiza de corelaŃie se pot solicita matricile de probabilităŃi ale
semnificaŃiilor coeficienŃilor, prin adăugarea unei comenzi suplimentare. De
exemplu, dacă dorim să realizăm o analiză de corelaŃie între variabilele
biometrice lungime, lăŃime şi înălŃime, ale fişierului XX.sys, trebuie să procedăm
astfel:
I. Sîrbu - Modelarea proceselor ecologice (2010) 75

> CORR
> USE XX
> SAVE (nume fişier nou)
> PEARSON L, LAT, H / PROB
În seriile de comenzi de mai sus, am intrat în modulul de corelaŃii, am
încărcat fişierul XX.sys şi am accesat o analiză de corelaŃii de tip Pearson pentru
cele trei variabile precizate prin etichetele lor (despărŃite de virgulă), după care
am cerut şi o analiză de semnificaŃie (/ PROB) care va crea o a doua matrice de
probabilităŃi. CoeficienŃii semnificativi vor avea probabilităŃi mai mici de 0,05
(reamintesc că sub această probabilitate vom respinge ipoteza nulă care statutează
că fiecare coeficient este nesemnificativ, adică nu diferă semnificativ de zero).
PEARSON CORRELATION MATRIX
L H LAT

L 1.000
H 0.976 1.000
LAT 0.971 0.956 1.000

BARTLETT CHI-SQUARE STATISTIC: 577.750 DF= 3 PROB= .000

MATRIX OF PROBABILITIES
L H LAT

L 0.000
H 0.000 0.000
LAT 0.000 0.000 0.000

NUMBER OF OBSERVATIONS: 100

În toate cazurile (perechile de variabile analizate) coeficienŃii de corelaŃie


sunt extrem de semnificativi (probabilităŃile de semnificaŃie sunt mult situate sub
valoarea critică de 0.05), pozitivi şi mari (toŃi sunt peste 0.95). Cea mai strânsă
corelaŃie se înregistrează între L şi H.

8.8. Analiza de regresie liniară generală

Modulul pentru modele de regresie liniare (MGLH) este printre cele mai
utile în procesul de modelare a fenomenelor ecologice. Acest modul realizează
analize ale unor regresii de tip Y = a + bX. Dacă relaŃia îmbracă forma unei curbe
exponenŃiale sau logaritmice, acest lucru se poate rezolva prin schimbarea scării
variabilelor.
De exemplu, dacă dorim să realizăm o analiză de regresie între variabila
GFA şi L din fişierul XX. sys, simpla observaŃie a aranjării datelor în figura de
tip PLOT realizată mai sus, ne informează că este inutilă căutarea unui model de
tip liniar pe date originale. Acest lucru se corectează prin dubla logaritmare a
ambelor variabile, ceea ce se poate face fie în modulul DATA, fie în EDIT. În
ultimul caz procedăm astfel:
> USE XX
I. Sîrbu - Modelarea proceselor ecologice (2010) 76

> SAVE LXX


> LET GFA = LOG(GFA)
> LET L = LOG (L)
a doua linie a servit la salvarea unei copii a fişierului original cu datele
transformate ale celor două variabile. Apoi intrăm în modulul MGLH şi cerem o
analiză de semnificaŃie a modelului de interes. Tipul modelului se precizează
prin:
> MGLH
> MODEL nume_variabilă_dependentă = expresie
iar pentru a accesa analiza se tastează pe linia următoare:
> ESTIMATE
În exemplul nostru, vom tasta următoarea secvenŃă:
> MGLH
> USE XXL
> MODEL GFA = CONSTANT + L
> ESTIMATE
care va avea ca efect producerea următoarei ferestre. Aparent este foarte
complicată, pentru utilizatorul începător, din cauza faptului că prezintă mai multe
rezultate intermediare şi unele teste. Pentru ecolog este suficient să cunoască
câteva valori, cele care au semnificaŃie maximă pentru modelul căutat.

DEP VAR: GFA N: 100 MULTIPLE R: .990 SQUARED MULTIPLE R: .981


ADJUSTED SQUARED MULTIPLE R: .980 STANDARD ERROR OF ESTIMATE: 0.100

VARIABLE COEFFICIENT STD ERROR STD COEF TOLERANCE T P(2 TAIL)

CONSTANT -9.132 0.174 0.000 . -52.586 0.000


L 2.988 0.042 0.990 1.000 70.480 0.000

ANALYSIS OF VARIANCE

SOURCE SUM-OF-SQUARES DF MEAN-SQUARE F-RATIO P

REGRESSION 49.418 1 49.418 4967.447 0.000


RESIDUAL 0.975 98 0.010

Coeficientul de determinare (SQUARED MULTIPLE R:) este foarte


mare (0.981) semnalând o puternică dependenŃă a variabilei ln(GFA) de ln(L).
STANDARD ERROR OF ESTIMATE semnifică eroarea standard a modelului,
iar COEFFICIENT, prezentând valorile coeficienŃilor ecuaŃiei de regresie, scrişi
în dreptul variabilelor (VARIABLE) permit scrierea explicită a formei
matematice a acestui model. În sfârşit, pe ultima coloană verificăm dacă P (2
TAIL) care conŃine probabilităŃile, sunt mai mici decât valoarea critică (aşa cum
se constată în exemplul de faŃă), aceasta indicând faptul că valorile sunt
semnificative din punct de vedere statistic. Astfel raportăm rezultatul:
ln(GFA) = -9.132 + 2.988 ln(L)
r2 = 0.981; eroare standard = 0.1; α < 0.05
Modelele pe care le căutăm pot fi uni- sau multivariate. În mod analog cu
modelarea statistică neliniară, evaluăm semnificaŃia acestora prin: r2 (să fie cât
I. Sîrbu - Modelarea proceselor ecologice (2010) 77

mai mare), eroarea standard a estimării (să fie cât mai mică), precum şi prin
probabilităŃile de semnificaŃie ale parametrilor ecuaŃiei de regresie (care trebuie
să fie cât mai mici, în orice caz sub valoarea critică aleasă de obicei la 0.05; dacă
rezultă valori mai mari căutăm un alt tip de model).
Calculatorul estimează orice tip de model conceput de utilizator. Dacă, de
exemplu, am logaritmat şi variabilele H, respectiv LAT, am putea căuta modele
mai bune decât cel obŃinut anterior, prin diferite expresii, care vor fi urmate
(fiecare în parte) de comanda ESTIMATE:
> MODEL GFA = CONSTANT + L + LAT
este un model bivariat, de tip aditiv
> MODEL GFA = CONSTANT + L*LAT
model bivariat în care se înmulŃesc variabilele independente, sau
> MODEL GFA = L * LAT * H
care este un model trivariat de tip multiplicativ, fără constantă (în cazul de faŃă,
se va dovedi cel mai bun model!).
Ori de câte ori realizăm o analiză de acest tip, să nu uităm să precizăm sub
ecuaŃie valoarea coeficientului de determinare (r2), a erorii standard şi a
probabilităŃii de semnificaŃie.

8.9. Construirea dendrogramelor

După cum s-a arătat în capitolul teoretic, construirea dendrogramelor face


parte din analiza de clasificare ierarhică. În SYSTAT apelarea modulului de
clasificare ierarhică se realizează prin comanda CLUSTER (în fereastra de
comenzi) sau prin selectarea din meniuri:
Statistics → Classification → Hierarchical clustering ...
după care se selectează variabilele, dacă se doreşte ierarhizarea articolelor
sau a variabilelor, tip de amalgamare, distanŃa, eventual selectarea variantei de
dendrogramă polară etc.
Să presupunem că am editat un fişier (CHEST.sys) care conŃine rezultatele
unei anchete asupra a 5 loturi de oameni (A, B, C, D şi E), fiecare chestionat
asupra unor probleme de gestiune casnică a deşeurilor. Indivizii din fiecare lot au
răspuns cu da sau nu la câte 5 întrebări. S-a calculat procentul de indivizi din
fiecare lot care au dat răspunsuri afirmative la aceste întrebări, fapte care denotă o
atitudine responsabilă faŃă de problema igienei. Fişierul este redat mai jos:
A B C D E

Întrebare 1 14.500 65.000 24.000 5.500 45.000


Întrebare 2 22.900 14.000 22.100 4.500 61.300
Întrebare 3 0.500 6.100 13.500 3.600 24.100
Întrebare 4 12.300 5.500 14.800 2.500 12.900
Întrebare 5 75.000 12.500 15.900 1.120 14.000
I. Sîrbu - Modelarea proceselor ecologice (2010) 78

Pentru a analiza cum se situează, prin comparaŃie, cele 5 loturi de indivizi, putem
construi dendrograma pe baza distanŃelor euclidiene. Pentru aceasta se accesează
modulul de clasificare se tastează comanda:
> CLUSTER
> USE CHEST
> JOIN / COLS
care va afişa pe ecran:
SINGLE LINKAGE METHOD (NEAREST NEIGHBOR)
TREE DIAGRAM
DISSIMILARITIES
-100.000 0.000
B --------------------------------------------------+
+----+
A ----------------+ ¦ ¦
+---------------------------------+ ¦
E ----------------+ ¦
++
C -------------------------------------------------------+¦
+---
D --------------------------------------------------------+

în care se prezintă dendrograma realizată la distanŃă euclidiană, prin metoda


grupării la cel mai apropiat vecin, scara fiind redată în termeni de disimilaritate.
Se poate observa (şi comenta corespunzător) că loturile A şi E sunt cele mai
asemănătoare în ceea priveşte atitudinea faŃă de problema deşeurilor, iar C, dar în
special D, sunt cele mai diferite ca mentalitate.
Modulul posedă diverse opŃiuni pentru construirea dendrogramelor. De
exemplu, matricile se pot clasifica pe linii (JOIN / ROWS), iar metoda de grupare
poate fi realizată la distanŃă medie:
> JOIN / ROWS LINKAGE = AVERAGE
sau completă
LINKAGE = COMPLETE
DistanŃa implicită este cea euclidiană, iar metoda de grupare se realizează
implicit prin cel mai apropiat vecin.
Dacă datele sunt de tip binar (specii prezente - absente), fişierul având forma:
S1 S2 S3 S4

CASE 1 1.000 1.000 0.000 1.000


CASE 2 0.000 0.000 1.000 0.000
CASE 3 0.000 0.000 1.000 1.000
CASE 4 1.000 1.000 0.000 0.000
CASE 5 0.000 1.000 0.000 1.000
CASE 6 0.000 1.000 0.000 0.000
CASE 7 0.000 0.000 1.000 0.000
CASE 8 1.000 1.000 0.000 1.000
CASE 9 0.000 0.000 1.000 1.000
CASE 10 0.000 0.000 1.000 0.000
CASE 11 0.000 0.000 1.000 1.000
CASE 12 1.000 1.000 0.000 1.000
CASE 13 0.000 1.000 0.000 0.000
CASE 14 0.000 1.000 0.000 0.000
CASE 15 0.000 1.000 1.000 0.000
I. Sîrbu - Modelarea proceselor ecologice (2010) 79

unde liniile reprezintă anumite specii (în total 15 identificate), iar coloanele
structura specifică (pe baza prezenŃei =1 sau absenŃei =0) a acestora, se
construieşte o matrice de similitudine printr-un indice dichotomic (de exemplu
Jaccard) în modulul de corelaŃii (CORR). Presupunem că fişierul de mai sus este
salvat sub denumirea de COM.sys. Atunci calcularea matricii de similitudine pe
baza indicelui Jaccard (S3) se realizează prin secvenŃa:
> CORR
> USE COM
> SAVE COM1
> S3
prin care matricea corespunzătoare a fost salvată sub denumirea de COM1.
Aceasta va avea expresia:

S1 S2 S3 S4

CASE 1 1.000 . . .
CASE 2 0.444 1.000 . .
CASE 3 0.000 0.067 1.000 .
CASE 4 0.375 0.333 0.273 1.000

Construirea dendrogramei prin metoda de grupare la distanŃă medie, se execută


prin secvenŃa:
> CLUSTER
> USE COM1
> JOIN / COLS LINKAGE = AVERAGE
având ca efect apariŃia pe ecran a următorului grafic:

S3

S2

S1

S4

0.0 0.1 0.2 0.3 0.4 0.5 0.6 0.7


Distances
I. Sîrbu - Modelarea proceselor ecologice (2010) 80

9. MODELE STATISTICE ŞI MODELE TEORETICE;


EVITAREA ERORILOR DE MODELARE

Statistica este un limbaj al ştiinŃei, care ne permite să înŃelegem natura


(Zimmerman, 1995 ap. Franklin et al., 2001).
Lumea este caracterizată prin incertitudine: toate sistemele şi procesele
prezintă şi fluctuaŃii cu caracter imprevizibil, de "zgomot". Ca urmare sistemele
observaŃionale, dintre noi şi natură (lumea reală), conŃin atât de multe surse de
incertitudine, încât chiar dacă procesele sunt deterministe, previzibile,
observaŃiile sunt de obicei nesigure. Dacă înŃelegem teoria ca o forŃă ce trece
dincolo de date, care înglobează cazurile particulare în ansambluri integratoare,
atunci putem afirma că orice model, indiferent de forma şi construcŃia lui, este o
formă a teoriei ecologice (Mangel şi col., 2001). În această abordare putem
identifica o nouă clasificare a modelelor: teoretice şi statistice.
Modelele statistice sunt utilizate pentru obŃinerea, analiza şi interpretarea
datelor. Acestea utilizează în special metode statistice inferenŃiale, cum ar fi de
exemplu definirea şi estimarea parametrilor pe baza datelor reale. Modelul
statistic cel mai comun are un singur parametru populaŃional - media (µ), pe care
o estimăm pe baza parametrului statistic corespunzător (media aritmetică a şirului
de date) şi a limitelor de confidenŃă (a se revedea Sîrbu şi Benedek, 2004). Pe
măsură ce înaintam în studiul ecologiei, am învăŃat să realizăm analize de
regresie (univariată şi liniară), de corelaŃie, precum şi primii paşi în testarea
ipotezelor (teste parametrice, cum ar fi t-Student pentru două medii, testul w/s
pentru normalitatea unei distribuŃii, F-Fischer pentru două varianŃe, χ2 pentru
două distribuŃii de frecvenŃe, Z pentru proporŃii, precum şi un test neparametric,
şi anume Wilcoxon-Mann-Whitney) şi altele, cum ar fi tehnici de clasificare şi
ierarhie matematică, analiza de asociere etc. Toate acestea sunt totodată şi modele
statistice.
Modelele statistice nu iau în considerare mecanismele intime ale
proceselor; ele stabilesc relaŃii între variabile sau categorii de fenomene, fără
analiza cauzalităŃii lor. După G.C. White (2001) modelele statistice au trei
funcŃii importante. În primul rând ele pot fi testate şi verificate prin datele reale.
În al doilea rând, dacă le acceptăm ca unelte abstracte utile pentru descrierea
fenomenelor naturale, le putem folosi pentru analiza calităŃii datelor reale de care
dispunem. În sfârşit utilizarea modelelor şi datelor pentru estimarea parametrilor,
poate releva funcŃii şi însuşiri emergente ale sistemelor, stabili prognoze ale
dinamicii proceselor, sau poate orienta mangementul resurselor naturale.
Prin urmare modelele statistice sunt de tip "post-hoc", adică sunt realizate
după ce datele au fost colectate.
Prin contrast, modelele teoretice includ descrierea mecanismelor, a
relaŃiilor cauzale dintre fenomene, conducând astfel spre prognoze, înainte ca
datele să fie colectate (Mangel şi col., 2001). Altfel spus, ele sunt de tip "ante-
hoc". Când utilizarea modelelor de acest gen nu produce convergenŃa
I. Sîrbu - Modelarea proceselor ecologice (2010) 81

prognozelor cu rezultatele, înseamnă că trebuie să reconsiderăm modelul teoretic,


logica acestuia, precum şi calitatea datelor disponibile.
Modelele statistice sunt frecvent agregative, adică grupează categoriile de
elemente după expresii medii ale însuşirilor sau performanŃelor lor. Acest fapt
îndeamnă la prudenŃă, mai ales atunci când traiectoria sistemelor este influenŃată
de variabilitatea sau comportamentul individual al elementelor constituente. De
exemplu, multe modele ale unor însuşiri emergente, cum ar fi cele de creştere
populaŃională, energetica comunităŃilor etc., depind explicit de ratele de creştere,
mortalitate, natalitate, reproducere, strategii comportamentale active de selectare
şi exploatare a teritoriului, şi multe altele. Aceste însuşiri individuale prezintă o
relativă autonomie, producând potenŃial modificări însemnate în rezultatele
modelului sistemului care le integrează (idem).
Atunci când modelele (fie ele teoretice sau statistice) sunt utilizate pentru
planificarea măsurilor de management a resurselor naturale, trebuie considerate
cele două paradoxuri ale lui Ludwig (1995, ap. Mangel şi col., 2001), care
relaŃionează incertitudinile din natură de cele ale modelelor, şi anume:
1. Managementul productivităŃii durabile nu poate fi optim;
2. Modelele eficiente de management nu pot fi realiste.
Sursele acestor două paradoxuri sunt legate de problemele ridicate de
statistică şi relaŃiile dintre modele şi date. Una dintre implicaŃiile acestora, şi în
mod special al celui de-al doilea paradox, este şi aceea conform căreia:
"consideraŃiile statistice invalidează toate modelele, cu excepŃia celor mai
simple, agregative, ca unelte eficiente de management".
Este benefic ca în procesul de modelare să tratăm separat întrebări de tipul
"de ce" (distale/ funcŃionale), de "cum" (proximale/ mecaniciste). Primele se
adresează cauzelor fenomenelor, fiind fundamentate prin teoria evoluŃiei prin
selecŃie naturală sau artificială. Modelele care se ocupă de întrebări proximale, se
concentrează asupra modului în care operează un mecanism şi cum se realizează
un proces (idem).
Acele modele care sunt simultan cele mai explicative (adică ne ajută să
înŃelegem datele) şi totodată cele mai bune predictive (prognozează rezultate
înainte de a avea dovezile din lumea reală, ne ajută să identificăm noi date prin
extrapolarea rezultatelor viitoarelor experienŃe) sunt totodată şi cele mai valabile,
respectiv utile, pentru scopul în care au fost alcătuite.
După cum am mai afirmat în acest manual, modelele statistice sunt cel mai
frecvent limitate la procesul sau sistemul particular studiat, respectiv sunt valabile
pentru seturile disponibile de date experimentale. Ele nu sunt generalizabile şi
nici - un alt termen de specialitate - transpozabile (adică nu pot fi aplicate la un
alt set de date, decât în eventualitatea unor modificări adecvate a parametrilor,
respectiv a recalibrării eficiente). Prin contrast, modelele teoretice, care includ
descrierea mecanismelor intime, sunt transpozabile şi - în limitele definirii unor
anumite seturi de variabile independente, cu domeniile aferente de variaŃie - sunt
şi generalizabile. Oricum, aceste considerente pot fi supuse şi diverselor excepŃii
I. Sîrbu - Modelarea proceselor ecologice (2010) 82

sau critici; depinde de modul în care definim problema, de datele disponibile, şi


de cum ştim să extrapolăm rezultatele.

• Evitarea erorilor de modelare

Criteriile stabilite mai sus ne permit să distingem baze obiective pentru


selectarea unor modele din ce în ce mai valabile, dar nu spun nimic despre
tehnicile de evitare a erorilor, respectiv despre capcanele care pot apare în
modelarea statistică.
O primă regulă - generală - este aceea că mai multe variabile şi - implicit -
parametri, acumulează o cantitate mai mare de nedeterminare şi de variaŃii
accidentale ("zgomote"), prin urmare scad precizia modelului. Altfel spus,
acurateŃea şi precizia modelului va creşte până la un anumit număr de variabile şi
parametri independenŃi, după care va tinde să scadă accelerat cu numărul
acestora. Concluzia este aceea de selectare a unui număr optim, şi (preferabil)
redus, de parametri, precum şi evitarea celor care implică prea multă incertitudine
(Mangel şi col., 2001). Astfel se aplică cel de-al doilea paradox al lui Ludwig,
care mai poate fi enunŃat (şi) prin principiul imperativ: "modelele trebuie
păstrate în variante simple, până când apar motive serioase să le
complicăm".
O a doua idee este cea de a dispune totdeauna de mai multe ipoteze de
lucru pentru analiza şi modelarea aceluiaşi set de date. Altfel spus, să nu ne
limităm niciodată la o singură abordare, respectiv un singur tip de model, ci să
încercăm să abordăm concepŃii diferite, şi expresii matematice variate, pentru a
avea o bază mai largă de selecŃie.
Din principiul precedent se deduce logic următorul, care sugerează ca
întotdeauna să avem în vedere modele alternative. Problema selectării unui
model valabil este numai parŃial legată de complexitate (de exemplu de numărul
de variabile independente incluse). La fel de importantă este selectarea a ce
anume se include (care sunt variabilele independente semnificative în context).
Întotdeauna trebuie să avem în vedere că este posibil ca modelului să-i lipsească
una sau mai multe trăsături cheie ale sistemului, care explică mai bine
comportarea acestuia, decât variabilele considerate până în prezent. Astfel, este
benefică testarea presupunerilor şi a condiŃiilor de plecare, şi nu numai a
prognozelor oferite de model prin compararea acestora cu datele reale.
Un alt aspect, care nu trebuie uitat, este că modelele statistice au un
domeniu de aplicabilitate limitat, şi sunt greu de utilizat la alte sisteme sau
procese, respectiv în alte condiŃii. Este uşor să greşim atunci când preluăm un
model prefabricat, din literatură sau debarcat de pe internet, şi să încercăm să-l
folosim - de obicei pe date mai puŃine şi variabile mai mult sau mai puŃin diferite
- într-un alt habitat şi alte condiŃii ale mediului.
Confuziile dintre modelele statistice şi cele teoretice constituie o sursă
inepuizabilă de erori. Adesea modelul statistic este excelent, explică şi
prognozează un anumit fenomen cu dezvoltare clară spaŃio-temporală, după care
I. Sîrbu - Modelarea proceselor ecologice (2010) 83

autorii cad în greşeala considerării acestuia drept model teoretic (deci


transpozabil şi generalizabil). Însă nu trebuie subestimată posibilitatea dezvoltării
judicioase a legăturilor dintre cele două categorii de modele: adesea un model
statistic bun ne poate conduce la o serie de raŃionamente şi analize, care vor
releva explicativ relaŃiile intime, cauzale, sau mecanismele legăturilor de tip
statistic descoperite. Prin urmare, deşi nu sunt sinonime (şi nu pot fi niciodată),
nu înseamnă că cele două abordări nu sunt legate între ele, sau - mai practic - că
nu s-ar sprijini reciproc în calitate de unelte eficiente în cadrul aceluiaşi demers
(idem). Pentru a construi un model eficient sunt necesare seturi de date valabile,
specificarea mecanismelor şi a proceselor, precum şi a parametrilor, dintre care
unele sau altele pot lipsi în anumite etape ale unui studiu. Nu trebuie să uităm că
modelele sunt (printre altele) metode care permit conducerea, organizarea şi
orientarea cercetărilor viitoare din laborator sau teren. Ele nu se confundă cu
adevărul, ci sunt "minciuna care ne ajută să vedem adevărul", după cum se
exprima metaforic Fagerstrøm (1987, ap. Mangel şi col., 2001).
Un factor important în dezvoltarea modelelor statistice este ideea
necesităŃii construirii unui set de ipoteze de lucru multiple. Diferite surse
argumentează că oamenii de ştiinŃă tind să posede ipoteze preferate pentru
explicarea proceselor naturale. Ei tind să fie subiectivi atunci când verifică aceste
ipoteze, eliminând sau ignorând datele care le infirmă şi supraestimând pe cele
care le confirmă. Aceasta este un alt fel de a spune că şi oamenii de ştiinŃă sunt
supuşi aceloraşi forŃe ca toată omenirea: dacă sunt puşi în faŃa unei explicaŃii care
pare satisfăcătoare, comode şi logice, sunt motivaŃi să creadă pur şi simplu în
aceasta. Pentru a ne feri de această continuă sursă de erori şi părtinire, se
sugerează considerarea totdeauna a multor altor ipoteze de lucru, alternative la
posibilele răspunsuri avansate într-un studiu.
După cum am mai amintit într-un capitol anterior, Platt (1964, ap. Franklin
şi col., 2001) scria că, "necesitatea alcătuirii unui sistem ipoteze multiple,
alternative, urmate de construirea unui set esenŃial de experimente care să le
verifice, apoi excluderea majorităŃii lor, poartă denumirea de inferenŃă
puternică, fiind un motor al progresului ştiinŃei". S-a argumentat că testarea
ipotezelor poate fi benefic înlocuită prin procedura de testare a modelelor, aceasta
fiind abordarea cheie a procesului astfel definit.

• Regresiile univariate liniare


Acest subcapitol este o scurtă recapitulare a unei teme studiate la ecologia
sistemelor suprapopulaŃionale (a se vedea Sîrbu şi Benedek, 2004), care se refera
la analiza de regresie şi corelaŃie, ca metodă de identificare şi cuantificare a
relaŃiilor dintre variabile. Ea este succint expusă, pentru a readuce în memorie
noŃiuni de bază, generalizabile, dar şi pentru a servi ca rampă de lansare pentru
studiul unor modele statistice mai larg aplicate.
Un model statistic de tipul unei relaŃii de regresie (o funcŃie) implică
existenŃa unei variabile independente (fie aceasta X) şi a uneia dependente (pe
I. Sîrbu - Modelarea proceselor ecologice (2010) 84

care o putem nota cu Y). Cu alte cuvinte X determină, condiŃionază sau îl


influenŃează pe Y, respectiv variaŃia lui Y este cauzată (şi de) cea a lui X.
Un pas logic este reprezentarea grafică, de obicei sub forma unui nor de
puncte, a perechilor experimentale de date, de tipul (xi, yi), unde i este numărul
curent al probei sau al observaŃiei unitare, un increment care ia valori de la 1 la n
(n fiind numărul total de probe unitare, sau dimensiunea statistică a probei;
numărul total de observaŃii). În funcŃie de forma norului de puncte, putem deja
discrimina teoretic între diferitele ecuaŃii care ar putea descrie relaŃia particulară.
Dacă distingem un nor care se dezvoltă predominant după o axă dreaptă, putem
sugera că relaŃia dintre cele două variabile îmbracă forma unui polinom de gradul
I. Altfel spus am putea distinge un model de tipul:
Y = a + b*X
unde: a şi b sunt parametrii care trebuie estimaŃi, adică acele mărimi care
fac obiectul principal al modelării statistice, legând datele experimentale de
ecuaŃia teoretică (adică modelul statistic). Şi iată că astfel se obŃine, practic, un
prim model statistic. Algoritmul de modelare este următorul (a se revedea pentru
detalii Sîrbu şi Benedek, 2004):
Construirea dreptei de regresie presupune parcurgerea următoarelor
etape:
a. Fixarea variabilei dependente şi a celei independente; verificarea
suplimentară a naturii relaŃiei între cele două variabile.
b. Verificarea (sau presupunerea) îndeplinirii a trei condiŃii: xi sunt măsurate
fără eroare, natura relaŃiei dintre X şi Y este într-adevăr liniară, iar pentru
oricare valoare a lui X, valorile lui Y sunt normal distribuite în jurul mediei
lor.
c. Trasarea “norului de puncte”, fiecare punct Ai având coordonatele (xi, yi).
Determinarea parametrilor ecuaŃiei dreptei care trece cel mai aproape de
toate punctele norului se poate face, de exemplu, prin utilizarea metodei celor
mai mici pătrate.
d. Se notează:

SP = ∑( xi − X )( yi − Y )
SSX = ∑( xi − X )2
SSY = ∑( yi − Y )2

Atunci parametrii ecuaŃiei de regresie se calculează după expresiile:


SP
b=
SSX
a = Y − bX

unde: b este coeficientul de regresie (panta dreptei de regresie), iar a este


intercepŃia ordonatei de către abscisă (valoarea lui Y, atunci când X este zero).
I. Sîrbu - Modelarea proceselor ecologice (2010) 85

d. Se poate trasa dreapta de regresie prin norul de puncte, eventual peste


aceasta, sau separat, se poate scrie şi ecuaŃia corespunzătoare (expresia
matematică a modelului).
De reŃinut este faptul că întotdeauna pe dreapta de regresie se află valoarea
medie a lui Y pentru o valoare dată a variabilei X. Regresia are valoare numai
între limitele intervalului de calcul, adică între xmin şi xmax, ecuaŃia neavând
valoare de prognoză pentru valori ale lui X situate în exteriorul acestui interval.
e. Se calculează coeficientul de determinare (r2) care indică “intensitatea
legăturii dintre variabile”, altfel spus (şi mai corect), proporŃia din variaŃia
variabilei dependente, care este explicată de către variabila independentă. Acest
coeficient variază între 0 şi 1 (uneori se exprimă în procente, caz în care fracŃia se
înmulŃeşte cu 100); legătura este cu atât mai puternică (şi implicit modelul este
mai bun), cu cât este mai aproape de valoarea maximă.

SP 2
r =
2

SSX * SSY

f. Testarea semnificaŃiei regresiei.


Există posibilitatea ca relaŃia să fie numai aparentă, cauzele putând fi
efectul de probă, erori de colectare şi interpretare a datelor etc. Dacă dreapta de
regresie este în realitate paralelă cu abscisa, atunci modelul nu este valabil pentru
populaŃia de date. Presupunem că b (coeficientul de regresie) este un estimator al
coeficientului populaŃional (β) şi că regresia nu este semnificativă (adică β=0).
Ipoteza alternativă presupune o diferenŃă semnificativă între β şi 0. Atunci se
poate aplica testul t pentru verificarea semnificaŃiei coeficientului de regresie,
după formulele:
b
t=
sb
unde :
SSX * SSY − SP 2
sb =
SSX 2 * (n − 2)

Dacă valoarea t calculată este mai mare decât valoarea critică din tabelul
testului t-Student, la nivelul α= 0.05 şi (n-2) grade de libertate, respingem ipoteza
nulă, fapt care semnifică o regresie semnificativă.
g. Determinarea limitelor de confidenŃă ale coeficientului de regresie se
realizează prin intermediul expresiei:
β = b ± t ∗ sb
I. Sîrbu - Modelarea proceselor ecologice (2010) 86

10. MODELARE STATISTICĂ NELINIARĂ;


APLICAłII ÎN PROGRAMUL STATISTICA

În termenii cei mai generali, modelarea statistică va evalua relaŃii între una
sau mai multe variabile independente şi o variabilă dependentă, în mod similar cu
cele expuse la analiza de regresie. În fapt, modelarea neliniară este o generalizare
a metodei regresiilor multiple. Deosebirea constă în faptul că prima lasă libertatea
cercetătorului de a defini natura şi forma relaŃiei între cele două categorii de
variabile; “neliniar” implică orice formă a funcŃiei care exprimă aceste relaŃii. Un
model general, multivariat, are forma:

y = F(x1, x2, ..., xn)

unde: F este funcŃia care determină relaŃia dintre cele n variabile


independente şi variabila dependentă sau de răspuns y.
Estimarea neliniară ne permite să specificăm orice tip de regresie continuă
sau discontinuă; univariată sau nu, unele modele pot fi predefinite în softurile
adecvate, dar cercetătorul poate opta pentru orice descriere formală a acestei
relaŃii.
Modele statistice pot fi parametrice (în exemplul de mai sus am inclus
condiŃia evaluării unor coeficienŃi de tipul a şi b, care relaŃionează modelul de
datele reale), sau pot fi neparametrice, adică se referă numai la datele
experimentale.
Prin urmare, un model de regresie generală implică existenŃa unui set de
date experimentale-pereche pentru fiecare probă (experiment, evaluare, interval
de timp etc.), existând câte un set de informaŃii referitoare la variabila dependentă
(Yi) şi valorile corespunzătoare (în acelaşi timp, loc sau domeniu de referinŃă)
pentru variabilele independente (X1i, X2i, ...,Xki), unde i ia valori succesive de la 1
la n (număr de probe sau observaŃii). Modelul de regresie generală este o ecuaŃie
propusă de ecolog, iar - prin utilizarea unor softuri adecvate şi algoritmi pe
măsură - se generează valorile parametrilor (coeficienŃilor) care stabilesc legătura
optimă dintre ecuaŃie (model) şi datele reale.
Cu cât sunt mai multe observaŃii (seturi de date; adică cu cât n este mai
mare), cu atât acurateŃea estimării parametrilor va fi mai ridicată. Dacă obŃinem
un model bun, putem utiliza relaŃia matematică în sens invers: cel de prognoză a
uneia dintre variabile (indiferent dacă este dependentă sau independentă), în
funcŃie de celelalte.
Dacă există o relaŃie perfectă între datele reale şi cele prognozate de model
(care se pot calcula din relaŃia matematică obŃinută), atunci pentru orice valori ale
variabilelor independente, se poate preciza cu siguranŃă valoarea exactă a
variabilei dependente. Geometric, acest fapt se poate constata atunci când datele
reale sunt plasate exact pe graficul funcŃiei de regresie. De obicei acest lucru nu
se constată (din cauza variabilităŃii generale a fenomenelor, a incertitudinilor, a
I. Sîrbu - Modelarea proceselor ecologice (2010) 87

considerării unui număr mult mai redus de variabile decât cel care determină un
proces, cauze legate de erori de măsură etc.).
În majoritatea cazurilor va exista o diferenŃă între valorile observate, reale,
ale variabilei dependente şi cele deduse sau prognozate de model. DiferenŃa
dintre valoarea reală (observată) şi cea prognozată (teoretică) este eroarea
estimării, fiind cunoscută şi ca "deviaŃie" sau - mai frecvent - "reziduală".
Putem astfel distinge un alt mod de a discrimina între modelele valabile, şi anume
un model este cu atât mai "bun" cu cât suma rezidualelor este mai mică.
Un obiectiv esenŃial al analizei de regresie este determinarea valorilor
parametrilor care minimizează suma acestor reziduale pentru un set de observaŃii
(experimente). Acest deziderat se poate realiza printr-o varietate de tehnici, poate
cea mai simplă şi frecvent aplicată fiind metoda pătratelor minime (utilizate şi în
exemplul anterior, la regresia liniară univariată).
După tipul de expresie matematică distingem modele liniare sau neliniare
(care îmbracă oricare altă formă decât cea a polinoamelor de gradul I, sau a
combinaŃiilor liniare ale acestora); respectiv distingem modele uni- sau
multivariate.
Astfel o ecuaŃie de regresie liniară, generală, multivariată, poate lua forma:

Y = a + b1x1 + b2x2 + ... + bnxn

unde: a este constanta sau intercepŃia ordonatei (valoarea lui Y atunci când
toate variabilele independente sunt 0), b1...bn sunt coeficienŃii de regresie, în
număr egal cu variabilele independente. Altfel spus coeficienŃii b explică cu cât
se modifică variabila Y, atunci când cele independente variază cu o unitate.
Analiza de regresie presupune în primul rând evaluarea acestor parametri,
precum şi a gradului (a proporŃiei) în care variabilele independente explică
variaŃia variabilei dependente, fapt ilustrat - din nou - prin parametrul r2
(coeficientul de determinare). Repet faptul că un prim criteriu, extrem de
important, când alegem dintre diferitele modele, este cel de maximalizare a r2 (cu
cât r2 este mai aproape de 1, cu atât modelul este mai valabil, într-o primă
abordare).
În expresia matematică descrisă anterior, pentru ecuaŃia liniară
multivariată, se observă că fiecare variabilă independentă acŃionează aditiv,
independent de celelalte, în explicarea variaŃiei variabilei dependente. Acestea
sunt modele fără interacŃiuni, în ceea ce priveşte variabilele independente,
cunoscute şi ca modele de efecte principale.
Unele modele (şi implicit ecuaŃii) includ şi combinaŃii ale variabilelor
independente, cum ar fi de exemplu:

Y = a + b1x1 + b2x2 + b3x1x2


sau:
Y = a + b1x12 + b2x22 + b3x1x2x32
I. Sîrbu - Modelarea proceselor ecologice (2010) 88

ImplicaŃiile interacŃiunilor sunt denumite şi efecte moderatoare, deoarece


includ interacŃiuni rezultante ale variabilelor independente, care pot acŃiona în
sens ameliorativ asupra explicării variabilei dependente. Alegerea categoriei de
model şi - prin aceasta - a ecuaŃiei corespunzătoare, nu este un algoritm impus de
calculator, şi nici nu se cunosc reŃete sigure, certe. Este mai degrabă un aspect
care Ńine de joc, dar şi de experienŃa ecologului. În asemenea demersuri
modelatorul petrece un timp îndelungat la calculator, propunând diverse categorii
de ecuaŃii, selectând semnificaŃia acestora (validitatea modelului) pe seama unui
set de criterii obiective. Prin urmare discriminarea între valoarea diverselor
modele propuse este obiectivă, dar propunerea acestora (alegerea, scrierea
ecuaŃiilor, includerea variabilelor independente, ca şi forma lor - cu sau fără
interacŃiuni) este la libera alegere a ecologului.
După valoarea coeficientului de determinare, un al doilea criteriu pentru
stabilirea validităŃii unui model, este testul t pentru semnificaŃia coeficienŃilor
(în cazul unui model multivariat) de regresie. În toate cazurile de testare, ipoteza
nulă afirmă că panta dreptei (coeficientul de regresie) este nesemnificativă, în
speŃă că valoarea coeficientului populaŃional pe care acesta îl aproximează, este
de fapt 0. Aceste informaŃii sunt redate sub forma probabilităŃii care rezultă din
aplicarea testului de către programul corespunzător. Cu cât aceste valori (redate
prin nivelul de semnificaŃie, care se poate nota - în funcŃie de softul utilizat - cu p
sau cu α) sunt mai mici (şi în speŃă mai mici de 0.05 sau - dacă modelatorul nu
este prea exigent, mai mici de 0.1) cu atât parametrii respectivi sunt mai
semnificativi. Altfel spus, la valori ale nivelului de semnificaŃie α mai mici de
0.05, considerăm că probabilitatea ca ipoteza nulă să fie adevărată (care afirmă că
coeficientul populaŃional este zero) este atât de mică, încât nu poate fi susŃinută,
prin urmare regresia este valabilă la nivelul termenului respectiv.
Un alt criteriu simplu de aplicat şi extrem de practic (însă nu neapărat şi
foarte corect) este să eliminăm din model toate variabilele sau combinaŃiile
pentru care aceste probabilităŃi sunt mai mari de 0.05.
Cele mai frecvente modele statistice neliniare utilizate în ecologie sunt de
tipul:
- polinomiale: (exemplu) Y = a + bX12 + cX23
Reamintim că gradul unui polinom este cea mai mare putere la care este
ridicată o variabilă din ecuaŃie.
- exponenŃiale: (exemplu) Y = a + b*ex1
- cu componente periodice: (exemplu) Y = a + b*sin(x1) + c*cos(x2)
- combinate (oricare combinaŃie a celor expuse mai sus, şi multe altele).

♦ Modele polinomiale

Regresia polinomială este un model care apare în mod obişnuit în studiile


de biologie şi ecologie. Dacă studiem, de exemplu, o relaŃie între rata de
dăunători care mor (MORT - variabila dependentă) ca urmare a unui şir de
I. Sîrbu - Modelarea proceselor ecologice (2010) 89

concentraŃii ale unui insecticid (CON), putem obŃine într-un studiu de caz
următoarele valori:

Nr. MORT CON


1 .850 1000.000
2 .250 101.000
3 .940 1024.000
4 .120 45.000
5 .560 248.000
6 .480 205.000
7 .710 951.000
8 .250 118.000
9 .960 1011.000
10 .110 12.000

Reprezentând norul de puncte observăm că relaŃia este de natură neliniară.


Selectând o funcŃie de regresie polinomială de gradul 2, de tipul:
MORT = a + b1 * CON + b2 * (CON ) 2
se poate obŃine, utilizând un soft adecvat, următorul nor de puncte (reprezentarea
datelor reale), ecuaŃie de regresie şi grafic al funcŃiei (expresia modelului):

MORT=0.0685+0.0021*CON-0.0000012*CON 2

1.2

1.0

0.8

0.6

0.4
MORT

0.2

0.0

-0.2

-0.4

-0.6
-200 0 200 400 600 800 1000 1200
CON
I. Sîrbu - Modelarea proceselor ecologice (2010) 90

Se observă faptul că modelul a fost evaluat de calculator, care a generat


valori pentru fiecare coeficient (a=0.0685; b1=0.0021 şi b2= -0.0000012). Testul
t indică faptul că toŃi cei trei coeficienŃi de regresie sunt semnificativi (α<0.05),
iar coeficientul de determinare R (sau r2) este 0.97, prin urmare modelul este bun
şi semnificativ.
Dar un ecolog poate să meargă mai departe (să nu se mulŃumească cu
prima estimare) şi să mai încerce un model, de exemplu un polinom de gradul 3:

MORT = a + b1 * CON + b2 * (CON ) 2


Din evaluarea acestui model propus, rezultă următoarea ecuaŃie,
reprezentată printr-un grafic şi indicatorii de semnificaŃie:

MORT=-0.0034+0.0036*CON-0.0000075*CON 2+0.0000000048*CON 3

2.0

1.5

1.0

0.5
MORT

0.0

-0.5

-1.0

-1.5
-200 0 200 400 600 800 1000 1200
CON

ToŃi parametrii sunt, din nou, semnificativi, dar coeficientul de determinare


R este 0.989, ceea ce semnifică faptul că acest model este mai bun decât cel
precedent. Acest simplu exemplu arată şi modul în care se caută (prin încercare şi
eroare, cu răbdare) în mod iterativ un model mai valid, în mod iterativ. De
asemenea se observă că graficul funcŃiei celui de-al doilea model trece mai
aproape de punctele experimentale, un alt bun indiciu care atestă valoarea
aprecierii vizuale prin analiză exploratorie.
Aceste categorii de modele sunt neliniare prin variabilele selectate,
respectiv a expresiei în care acestea au fost folosite.
I. Sîrbu - Modelarea proceselor ecologice (2010) 91

• Modele exponenŃiale

Acestea sunt modele neliniare din cauza parametrilor şi contrastează cu


exemplul anterior, prin faptul că funcŃia este explicit diferită de cea liniară, nu
atât prin natura variabilelor cât a parametrilor implicaŃi. De exemplu, considerând
relaŃia dintre rata de creştere (C - variabila dependentă; cm/lună) şi vârstă (V -
variabila independentă; ani) la o populaŃie oarecare, putem defini un model de
creştere exponenŃială.

C V
1 1.000 .500
2 .800 1.000
3 .600 2.500
4 .700 4.500
5 .600 6.000
6 .500 8.000
7 .400 12.000
8 .200 15.000
9 .100 18.000
10 .050 25.000

Vom putea alege o expresie a relaŃiei de tipul:

C = a * e ( b1*V )
în care a şi b sunt coeficienŃii ecuaŃiei, iar numărul e este baza logaritmilor
naturali (numărul lui Euler). Rezultatul va arăta astfel:

C = 0.949*e-0.013*V

parametri a şi b1 fiind semnificativi la nivelul ales (α<0.05), iar coeficientul de


determinare având valoarea de 0.96 (foarte aproape de valoarea maximă a
domeniului de variaŃie). Reprezentarea grafică a modelului statistic neliniar este
redată mai jos.
Natura acestui model nu mai este liniară; această trăsătură rezidă din însăşi
definiŃia funcŃiei care reprezintă relaŃia dintre cele două variabile.
I. Sîrbu - Modelarea proceselor ecologice (2010) 92

1.2

1.0

0.8

0.6
C

0.4

0.2

0.0
-2 0 2 4 6 8 10 12 14 16 18 20 22 24 26
V

♦ Modele pentru variabile binare.


În numeroase cazuri variabila dependentă este binară, adică poate lua
numai unul din două răspunsuri (1 sau 0; de exemplu studenŃii promovează sau
nu examenul, iau sau nu bursă, sunt sau nu pe locuri bugetare etc.). Apar astfel
modele în care este necesară decelarea relaŃiei între una sau mai multe variabile
continue independente şi o variabilă dependentă binară.

Unitate 1 Unitate2
NR. A QI NR. A QI
1 1.000 .890 1 1.000 .590
2 1.000 .910 2 1.000 .890
3 1.000 .780 3 1.000 .580
4 0.000 .230 4 0.000 .120
5 0.000 .150 5 0.000 .780
6 0.000 .840 6 0.000 .910
7 0.000 .730 7 0.000 .260
8 0.000 .610 8 0.000 .530
9 1.000 .840 9 1.000 .480
10 1.000 .790 10 1.000 .910
11 0.000 .360 11 0.000 .260
12 0.000 .210 12 0.000 .580
13 0.000 .150 13 0.000 .730
14 0.000 .150 14 0.000 .610
15 0.000 .200 15 0.000 .450
16 0.000 .160 16 0.000 .910
17 1.000 .790 17 1.000 .820
18 1.000 .990 18 1.000 .460
19 1.000 .890 19 1.000 .480
20 1.000 .730 20 1.000 .660

Să analizăm două cazuri de unităŃi de învăŃământ superior care acordă


studenŃilor bursă (A = 1) sau nu acordă (A = 0), în funcŃie şi de un test care
I. Sîrbu - Modelarea proceselor ecologice (2010) 93

verifică o serie de capacităŃi reunite sub denumirea de coeficient de inteligenŃă


(variabila independentă QI), test la care studenŃii iau punctaje prin valori continue
în domeniul 0.0 (cel mai rău răspuns) şi 1.0. Desigur, bursele se acordă şi în
funcŃie de alte criterii, dar un cercetător ar putea fi interesat dacă instituŃiile
acordă sau nu o pondere importantă inteligenŃei studenŃilor. Extrasele din două
şiruri sunt redate mai sus (am selectat la întâmplare 20 de cazuri din fiecare
unitate).
Pentru a rezolva această problemă, putem alege funcŃii de răspuns
continuu, adică să considerăm o funcŃie de regresie care prognozează un răspuns
în domeniul cuprins între 0 şi 1, cum este de exemplu modelul de regresie
logistică. Astfel, se estimează parametrii ecuaŃiei de regresie, între variabila
dependentă (y) şi una sau mai multe variabile independente (x1, x2, ... xn), ecuaŃie
definită prin formula generală:

exp(b 0 + b1 x 1 + ... + b n x n )
y=
1 + exp(b 0 + b1 x 1 + ... + b n x n )

unde, analog cu exemplele precedente, exp(expresie) = eexpresie


Se poate observa cu uşurinŃă că oricum variază, şi în orice amplitudine,
variabilele independente xi, variabila prognozată y va lua valori cuprinse numai
între 0 şi 1.
Rezultatele rulării modelului sunt redate mai jos.
Cazul 1.
Clasificarea cazurilor
Observate Prognozate Prognozate Procent
0 1 corect
0 9 2 81.8182%
1 0 9 100.0000%
χ2 = 17.89; α < 0.001
Concluzie: model corect (coeficienŃi semnificativi).

Din acest tabel reiese o corectitudine a prognozelor de 82% în cazul


studenŃilor care nu iau bursă, prin criteriul QI, precum şi o prognoză de 100%
pentru cei care iau. Valori mici ale domeniului critic (α) de asemenea informează
asupra validităŃii modelului (testul chi-pătrat indică faptul că nu există deosebiri
semnificative între distribuŃia aşteptată şi constatată de frecvenŃe).
EcuaŃia modelului şi expresia grafică a acestuia sunt redate mai jos:
I. Sîrbu - Modelarea proceselor ecologice (2010) 94

Model: Logistic regression (logit)


y=exp(-12.769327+(17.594565)*x)/(1+exp(-12.769327+(17.594565)*x))
1.2

1.0

0.8

0.6
A

0.4

0.2

0.0

-0.2
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
QI

Cazul 2. Clasificarea cazurilor (prognozate şi observate) indică:


Observate Prognozate Prognozate Procent
0 1 corect
0 7 4 63.63636
1 6 3 33.33333
2
χ = 0.88; α = 0.347
Cu prognoze corecte ale studenŃilor care nu iau burse de 64%, respectiv de
33% a celor care reuşesc aceasta, precum şi pe baza valorii critice mult prea mari
(α = 0.347), rezultă că modelul este incorect (coeficienŃi nesemnificativi).
Graficul de mai jos de asemenea redă această lipsă de semnificaŃie a relaŃiei:
Model: Logistic regression (logit)
y=exp(-1.3748407+(1.936842)*x)/(1+exp(-1.3748407+(1.936842)*x))
1.2

1.0

0.8

0.6
A

0.4

0.2

0.0

-0.2
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
QI
I. Sîrbu - Modelarea proceselor ecologice (2010) 95

Modelul logistic general de regresie poate fi exprimat ca:

b0
y=
1 + b1 exp(b 2 x )

Spre deosebire de modelul logistic prezentat anterior, cel general permite o


variaŃie a lui y într-un interval definit de utilizator, care poate fi altul decât [0, 1].
Acest tip de model este extrem de util pentru înŃelegerea şi simularea creşterii
logistice a populaŃiilor, aşa cum se va vedea într-un alt capitol din publicaŃia de
faŃă.

♦ Modele discontinue de regresie

În procedura de modelare neliniară avem posibilitatea evaluării relaŃiei de


dependenŃă, care se schimbă în funcŃie de domeniul de variaŃie al variabilei (sau
variabilelor) independente. De exemplu, rata de prădare sau consum evidenŃiată
prin studii de teren pentru un anumit prădător (c = variabila dependentă) creşte
după o anumită funcŃie până la o densitate P1 a prăzii, şi după o altă funcŃie
atunci când densitatea (d = variabila dependentă) este mai mare de această
valoare. Atunci putem specifica o ecuaŃie de regresie discontinuă, de tipul:

c = b0 + b1 * d * (d< P1) + b2 * d * (d ≥ P1)

În această formulă de regresie discontinuă, expresiile (d< P1) şi (d ≥ P1)


sunt condiŃii logice, care prin evaluare sunt echivalate cu 0 pentru fals şi 1 pentru
adevăr. Astfel, dacă densitatea prăzii este mai mică decât P1 (punctul de
inflexiune), termenul (d< P1) = 1 şi (d ≥ P1) = 0, motiv pentru care ecuaŃia se va
transforma în:
c = b0 + b1 * d
În mod corespunzător, se modifică ecuaŃia când densitatea prăzii este mai
mare de P1. În exemplul anterior, pentru simplificare, am utilizat ecuaŃii de
gradul I (funcŃii liniare), dar cele expuse sunt valabile pentru oricare alte funcŃii.
Un model posibil pentru funcŃia discontinuă de regresie prezentată anterior
este: c

P1 d
I. Sîrbu - Modelarea proceselor ecologice (2010) 96

În alte ocazii, la o anumită valoare a variabilei independente, se


înregistrează un salt în valoarea celei dependente (o rupere de continuitate a
funcŃiei de regresie), cum rezultă din exemplul de mai jos:

P0 d

Într-un asemenea caz se specifică un nou coeficient de “intercepŃie”, pentru


modelul care urmează din punctul discontinuităŃii funcŃiei. Un caz, ca cel
prezentat mai sus, va avea o ecuaŃie de tipul:

c = (b0 + b1 * d) * (d < P0) + (b3 + b2 * d) * (d ≥ P0)

unde b3 este noul coeficient de intercepŃie, care reprezintă valoarea funcŃiei


de regresie imediat de după salt.

♦ Procedurile de estimare neliniară


Anterior am analizat în detaliu procedura de evaluare a parametrilor
ecuaŃiei de regresie liniare, şi am definit-o pe aceasta ca “dreapta care trece cel
mai aproape de toate punctele”, respectiv cea pe care se află “valorile medii ale
variabilei dependente; pentru oricare valoare a variabilei independente, valorile
celei dependente sunt normal distribuite în jurul mediei”. Tehnica prezentată se
mai numeşte procedura de estimare prin cele mai mici pătrate, extrem de
utilă, facilă, dar nicidecum singura. Această tehnică se bazează pe minimizarea
sumei diferenŃelor pătrate dintre valorile observate (experimentale) ale variabilei
dependente şi cele prognozate de către model.
FuncŃia de estimare prin cele mai mici pătrate este o particularizare a ceea
ce cunoaştem sub denumirea generală de funcŃie de pierdere (loss function, în
engleză). Denumirea are o logică: în orice regresie, simplă sau multiplă, liniară
sau neliniară, estimăm parametrii, astfel încât să minimizăm variaŃia reziduală din
jurul punctului prognozat, situat pe graficul funcŃiei de regresie. Putem spune că
scopul este de a minimiza pierderea de acurateŃe a prognozei noastre, respectiv
de a găsi cele mai mici valori pentru funcŃia care o descrie. Există mai multe căi
I. Sîrbu - Modelarea proceselor ecologice (2010) 97

pentru a reduce pierderile la un minimum. Reamintim că prin reziduale se înŃeleg


diferenŃele dintre valorile prognozate de o ecuaŃie de regresie şi cele observate.

• Metoda pătratelor minime ponderate


Metoda, amintită anterior, presupune că variaŃia erorii în jurul valorilor
estimate ale variabilei dependente, este aceeaşi pentru toate valorile variabilei
independente (deci eroarea este egală pentru întregul model, în fiecare punct al
funcŃiei). În mod real această presupunere este adesea neconformă cu realitatea.
Un exemplu care apare permanent în studiile biometrice este norul de puncte de
formă triunghiulară. Norul prezintă o bază mai largă la valori mai mici ale
dimensiunii (sau masei) corpurilor, parte şi din cauza variabilităŃii individuale la
vârste juvenile, dar reflectă şi erori ale aparatului de măsură. Punctele tind să fie
mai apropiate, prin contrast, spre celălalt capăt al domeniului de variaŃie (desigur
această tendinŃă apare statistic, nu este o constantă a studiilor de acest gen). Prin
urmare, eroarea de estimare scade cu creşterea domeniului de măsură, din diferite
motive. Pentru a calcula această funcŃie de pierdere în mod diferenŃiat, putem
opta pentru metoda pătratelor minime ponderate, care are expresia:

 1 
Pierdere = (Observat − Pr ognozat ) 2 *  2 
x 

Pierderea specifică mai întâi pătratul diferenŃei dintre valoarea observată şi


cea prognozată a variabilei dependente, după care ponderează această diferenŃă
prin raportarea la inversul pătratului valorii variabilei independente. Acest proces
se repetă pentru fiecare punct din nor, după care funcŃia se calculează prin
însumarea valorilor obŃinute.

♦ Algoritmi care minimizează funcŃiile de pierdere


Putem să decidem asupra modalităŃii de minimizare a funcŃiei de pierdere,
precum şi de estimare a erorii standard a parametrilor. Algoritmul quasi -
Newton, sau cel cunoscut sub denumirea de Gauss-Newton, sunt extrem de
eficienŃi şi recomandaŃi pentru a rezolva această problemă, fără mare durere de
cap. Ei aproximează derivata de ordinul 2 a funcŃiei de pierdere, pentru a
identifica valoarea minimă a acesteia.
Dintre procedurile alternative care ne stau la dispoziŃie, amintim (fără a
mai intra în amănunte): tehnica minimului local, procedura simplex, modelul
Hooke-Jeeves, Rosenbrock, matricea hessiană şi erorile standard etc.

♦ Evaluarea calităŃii modelului


După cum am mai scris, există mai multe metode pentru a afla dacă un
model este semnificativ, în sensul potrivirii valorilor prognozate cu cele
observate, respectiv pentru evaluarea erorilor şi a semnificaŃiei coeficienŃilor.
I. Sîrbu - Modelarea proceselor ecologice (2010) 98

Putem de exemplu evalua proporŃia de varianŃă explicată de către


model. Astfel, putem obŃine valori cu privire la varianŃa totală a variabilei
dependente (suma totală de pătrate, ST), proporŃia de varianŃă datorată
rezidualelor (suma de pătrate a erorilor, SE) şi proporŃia de varianŃă datorată
modelului de regresie (suma de pătrate a regresiei: SR = ST - SE). Raportul SR /
ST explică proporŃia de varianŃă înregistrată de model în variabila dependentă,
motiv pentru care această rată este echivalentă cu coeficientul de determinare (R
sau r2 care ia valori între 0 şi 1).
Verificarea semnificaŃiei diferenŃei dintre distribuŃia de frecvenŃe
observată şi cea prognozată, prin testul χ2. Se aplică pentru evaluarea potrivirii
dintre valorile prognozate şi cele observate în modelul de tip logistic al
variabilelor binare. Parametrul statistic χ2 se calculează şi raportează la gradele de
libertate, egale cu numărul de variabile independente ale modelului. Dacă nivelul
α asociat testului chi-pătrat este semnificativ, putem susŃine că parametri regresiei
sunt statistic semnificativi (a se revedea exemplele precedente, de la modelul
logistic).
Reprezentarea valorilor observate în funcŃie de cele prognozate.
Permite vizualizarea acestei relaŃii sub forma unui nor de puncte; cu cât prognoza
este mai bună, cu atât punctele sunt dispuse mai aproape de forma unei drepte
(ilustrând o relaŃie liniară de dependenŃă). Modelul este cu atât mai nesatisfăcător,
cu cât relaŃia se abate mai mult de la forma unei drepte.
De exemplu, în modelul exponenŃial realizat între creştere şi vârstă (C şi V;
redat anterior), graficul valorilor prognozate în funcŃie de cele observate, este:

Valori Observate vs. Prognozate


1.1

0.9

0.7
Valori Obsevrate

0.5

0.3

0.1

-0.1
0.0 0.2 0.4 0.6 0.8 1.0
Valori Prognozate

Reprezentarea grafică a funcŃiei de regresie permite vizualizarea norului


de puncte experimentale (a datelor observaŃionale), printre care trece graficul
funcŃiei de regresie neliniară, modelată după unul dintre algoritmii expuşi
anteriori. Acest tip de grafic constituie reprezentarea cea mai directă şi evidentă a
rezultatelor, generându-se o imagine de ansamblu asupra modelului obŃinut.
I. Sîrbu - Modelarea proceselor ecologice (2010) 99

11. MODELARE ÎN MATHCAD

Produsul MathCAD este elaborat de firma MathSoftInc Cambridge, MA,


SUA, fiind special conceput pentru modele matematice mai sofisticate, calcule cu
grad ridicat de dificultate, realizarea proiectelor complexe, având numeroase
facilităŃi grafice şi de prezentare a rezultatelor. Vom lucra cu versiunea 2001
Professional.

Simboluri şi combinaŃii de taste utilizate în MathCAD

Pentru a obŃine ... ... tastaŃi: semnificaŃie:


:= : definiŃie sau atribuire
a,b .. c a, , ,b, ; , c domeniu de variaŃie redat ca: a valoare iniŃială, b
valoarea următoare, iar c este valoarea finală
(x) ‘ , x sau (,x,) paranteză
x! x,! factorial
ab a,^,b ridicare la putere
|x| |,x modul, valoare absolută, determinant
x+y x,+,y adunare
m/n m,/,n împărŃire
a.b a,*,b înmulŃire
-c -,c minus; număr negativ
a>b a,> ,b mai mare decât
a<b a,<,b mai mic decât
≡ Sfift + ~ definiŃie globală
xi x,[,i indice
xi,j x , [ , ( , i , j ,) indici dubli
MT M , Alt + ! matrice transpusă
∑x Alt + $ , x sumă vectorială
x \,x radical

∫ f (x )dx x , & , f (x) integrală nedefinită


d x , ? , f(x) derivată
f(x)
dx
v Alt+ - vectorizare
∑ xi
i
i,$,x sumă după valorile indicelui i din x

∏x
i
i
i,#,x produs după valorile indicelui i de x

Versiunile noi operează în mod similar cu Microsoft Office, operatorul


putând selecta comenzi şi funcŃii fie din meniurile pop-up, fie prin scrierea
explicită a comenzilor. Deoarece semnificaŃia tastelor şi a combinaŃiilor acestora
a rămas similară în toate versiunile, vom începe această temă prin expunerea
simbolurilor şi a semnificaŃiilor acestora (după manualul original, precum şi E.
Scheiber şi D. Lixăndroiu, 1994).
I. Sîrbu - Modelarea proceselor ecologice (2010) 100

FuncŃii Mathcad mai des utilizate în ecologie


ObservaŃii: în tabelul de mai jos: x, y reprezintă numere reale, n este un număr natural, v este
un vector iar M o matrice
Apelarea funcŃiei SemnificaŃie
sin (x) sinus de z
cos (x) cosinus de x
tan (x) tg x
asin (x) arcsin x
acos (x) arccos x
atan (x) arctan x
exp (x) ex
ln (x) logaritm natural din x (ln x)
log (x) logaritm zecimal din x (lg x)
rnd (x) număr aleator cuprins între 0 şi x
length (v) numărul elementelor vectorului v
max (v) cel mai mare element al lui v
min (v) cel mai mic element al vectorului v
rows (M) numărul liniilor matricei M
cols (M) numărul coloanelor matricei M
augument (M1, M2) matricea obŃinută prin alăturarea matricilor M1 şi
M2, cu acelaşi număr de linii
identity (n) matricea unitate de ordin n
sort (v) ordonează crescător elementele vectorului v
csort (M, n) aranjează liniile matricii M astfel încât
elementele coloanei n să fie în ordine crescătoare
rsort (M, n) aranjează coloanele matricii M astfel încât
elementele liniei n să fie în ordine crescătoare
mean (v) media aritmetică a elementelor vectorului v
var (v) varianŃa elementelor lui v
stdev (v) abaterea standard a elementelor lui v
corr (vx, vy) coeficientul de corelaŃie Pearson aplicat
vectorilor de date vx şi vy
linterp (vx, vy, x) returnează valoarea în x a funcŃiei afine de
interpolare, determinată de vectorii vx şi vy
cspline (vx, vy) redă coeficienŃii funcŃiei spline cubice de
interpolare determinată de vectorii vx şi vy,
funcŃia fiind cubică la extremităŃi
lspline (vx, vy) redă coeficienŃii funcŃiei spline cubice de
interpolare determinată de vectorii vx şi vy,
funcŃia fiind liniară la extremităŃi
pspline (vx, vy) redă coeficienŃii funcŃiei spline cubice de
interpolare determinată de vectorii vx şi vy,
funcŃia fiind parabolică la extremităŃi
interp (vs, vx, vy, x) returnează valoarea în x a funcŃiei spline cubice
de interpolare determinată de vectorii de date vx
şi vy; vs reprezintă vectorul cu coeficienŃii
funcŃiei spline calculate în cspline, lspline sau
pspline
I. Sîrbu - Modelarea proceselor ecologice (2010) 101

Pentru a facilita înŃelegerea modului de tastare, vom uni cu simbolul + tastele


care se apasă simultan, iar cu operatorul virgulă (,) separăm tastele care se apasă
în ordine. Astfel: Shift + 4 semnifică apăsarea simultană a celor două taste, pe
când Esc, *, Enter impune apăsarea în ordine secvenŃială a tastelor Esc, apoi *,
urmate de Enter. Pentru cei cărora le place mai degrabă să lucreze cu meniuri
decât să înveŃe cele câteva comenzi, le rămâne selectarea funcŃiilor şi operatorilor
exclusiv din oferta generoasă de comenzi prezentate în stil pop-up.
Toate comenzile de sistem şi de fişiere sunt similare cu cele utilizate de
produsele Microsoft Office, icoanele şi cuvintele-cheie fiind identice.

11.1. CALCULE

Calculele numerice în MathCAD se efectuează prin operatori de atribuire


sau definire, expresii matematice şi operatori de afişare.
Operatorii de atribuire / definire sunt definiŃi prin := (care se obŃine prin
tastarea a două puncte :)
variabilă := expresie
funcŃie (variabile separate prin virgulă) := expresie
variabilă ≡ expresie
ultima fiind expresia pentru operatorul de definire globală (adică având ca
domeniu de valabilitate întregul fişier).
Expresiile matematice sunt redate utilizând variabilele, funcŃiile şi
parametrii definiŃi anterior, utilizând operatorii matematici şi combinaŃiile de
taste redate în tabelele prezentate anterior.
Operatorul de afişare (întoarcerea rezultatului) este dat de semnul =, în
formatul:
variabilă =
expresie =
funcŃie (listă variabile) =

Calculele simple se pot scrie explicit, urmate de semnul =, fapt care va


determina evaluarea şi afişarea rezultatului acestora. De exemplu tastarea
următoarei secvenŃe pentru calcularea indicelui de similitudine procentuală
Czekanowski (virgula indică operaŃii succesive):
(,( , 2 , * , 12 , ), / , ( , 36 , + , 39 , ),) , * , 100 , =
produce pe ecran:

2 ⋅ 12
⋅ 100 = 32
36 + 39

Semnul egal implică evaluarea expresiei matematice definite anterior. În


exemplul anterior am comparat două comunităŃi, formate din 36, respectiv 39 de
specii, dintre care 12 sunt comune. Calculatorul a evaluat expresia de similitudine
I. Sîrbu - Modelarea proceselor ecologice (2010) 102

la 32%. Aceeaşi prelucrare se poate reda prin definirea unor parametri, în felul
următor:

c := 12
a := 36
b := 39

2⋅c
Is := ⋅ 100
a+b

Is = 32

Cu alte cuvinte, am definit prin operatori de atribuire valorile parametrilor


identificaŃi prin a, b şi c, am definit expresia lui Is, urmată de solicitarea de
afişare a rezultatului.
Identificatorii trebuie să înceapă cu o literă, care poate fi urmată de alte
litere, cifre sau semne speciale.
Variabilele numerice de tip şir, se definesc prin:
- un increment i, care ia valori întregi succesive de la 1 la n (de exemplu n = 8)
- variabila xi care este redată sub forma unei expresii matematice în i sau explicit.
Evident variabila şir conŃine atâtea valori câte au fost prevăzute prin n. Dacă
variabila este definită explicit, separatorul între termenii şirului este dat de tasta
virgulă (,)
Expresia generală pentru o variabilă şir este:
indice := valoare1, valoare 2 .. valoare finală
(diferenŃa dintre valoare 1 şi valoare 2 va desemna incrementul, iar cele două
puncte care urmează valorii 2 desemnează repetarea incrementului până la
valoare finală; pentru a obŃine cele două puncte se tastează ;)
variabilă_şir indice := valori
sau
variabilă_şir indice := expresie

Într-un vector sau o matrice valoarea iniŃială a indicilor este 0. Dacă se


doreşte ca valoarea iniŃială (prima probă, prima măsurătoare să fie 1 - aşa cum se
preferă adesea în ecologie, trebuie să precizăm acest lucru printr-o definiŃie
globală a parametrului inclus ORIGIN.
Altfel spus, atunci când calculele vor începe cu prima valoare a unei
variabile şir (definită prin indicele i care ia valori întregi succesive de la 1 la n)
precizăm în linia de comandă:
ORIGIN ≡ 1
Exemplu: un ecolog a colectat şi prelucrat 31 de probe (de dimensiuni
egale, alese randomizat) prin metoda suprafeŃelor. Numărul de indivizi din
fiecare probă va fi inclus în variabila şir xi. În acest caz, operatorul tastează
următoarea secvenŃă:
I. Sîrbu - Modelarea proceselor ecologice (2010) 103

n := 31

i := 1, 2 .. 31
x :=
i

12
0
5
7
0
0
6
0
8
14
15
24
23
62
150
42
58
78
53
21
0
25
26
84
36
45
82
5
36
74
4

unde: valorile variabilei xi sunt rezultate în urma numărării indivizilor din probele
colectate.
Să presupunem că dorim acum să calculăm media aritmetică a densităŃii,
varianŃa şi abaterea standard a şirului xi. Există posibilitatea de a scrie în mod
explicit ecuaŃiile (ca în partea teoretică), sau de a cere apelarea unor funcŃii
implicite ale programului. În cel de-al doilea caz, vom tasta şi solicita afişarea,
prin:
mean (x) = 31.09
var (x) = 1153.96
stdev (x) = 33.97
I. Sîrbu - Modelarea proceselor ecologice (2010) 104

Eventual putem calcula şi alŃi parametri, cum ar fi, de exemplu eroarea


standard a mediei (Err), eroarea de estimare a mediei (D) şi indicele de distribuŃie
spaŃială (ID), prin definirea următoarelor expresii:

var(x )
Err :=
n
Err
D :=
mean( x )
var(x )
ID :=
mean ( x )
Err = 6.10
D = 0.196
ID = 37.11

Dacă în document dorim să includem spaŃii pentru text, în versiunile


superioare scriem pur şi simplu explicaŃiile dorite, iar în versiunile inferioare,
marcăm spaŃiul pentru text cu ghilimele. De exemplu, dacă dorim după operatorul
de afişare Err să precizăm semnificaŃia acestuia, vom tasta:
Err =
“Err semnifică eroarea standard a mediei”
Textul inclus între ghilimele nu va fi interpretat ca o expresie matematică şi nici
drept comandă, ci va fi ignorat de către calculator.

11.2. GRAFICE

Dacă se doreşte realizarea unei reprezentări grafice plane (bidimenionale)


se selectează simbolul din meniu, după care se înscriu în spaŃiile rezervate
variabilele şi/sau funcŃiile care se reprezintă, precum şi domeniile lor de variaŃie
(valorile minime şi maxime), ca în exemplul de mai jos.
Să presupunem că am realizat un model de tip regresie liniară univariată,
aşa cum am învăŃat la operarea programului prezentat anterior sau la capitolul de
teorie.
Fie:
x = variabila independentă, cu domeniul de variaŃie cuprins între 12.1 şi 86.9
f(x) = funcŃia de regresie definită între valorile variabilei dependente y şi ale celei
independente x, cu expresia:
f(x) = 2.4 + 0.04 * x2
Pentru a reprezenta grafic această funcŃie se tastează următoarea secvenŃă:
I. Sîrbu - Modelarea proceselor ecologice (2010) 105

x := 12.1.. 86.9
2
f ( x) := 2.4 + 0.04⋅ x

300

200

f ( x)

100

20 40 60 80
x
Pentru a afla oricare estimată a variabilei dependente din funcŃia de
regresie, utilizatorul tastează o valoare oarecare din domeniul de variaŃie al lui x,
în cadrul expresiei funcŃiei f(x). De exemplu pentru a estima valoarea variabilei
dependente la x = 59.65, se tastează:
f (59.65) =
care va returna automat rezultatul, astfel că pe ecran apare:
f (59.65) = 144.725
Pentru a modifica parametri graficului (dimensiune, marcarea norului de
puncte, culoarea graficului funcŃiei etc.) în versiunile inferioare se poziŃionează
cursorul în interiorul graficului şi se tastează f, iar în versiunile superioare se
execută “dublu - clic” cu tasta stângă a mouse-ului, după care se operează în
interiorul meniurilor oferite.
În cazul unei regresii duble se apelează fereastra pentru grafice în spaŃiul
3D, din meniul corespunzător.
Exemplu:
2 3
f ( x, y ) := 0.13 + 0.06⋅ x + 0.1⋅ y

i := 0 .. 78

j := 2 .. 40

x := 12 + i
i

y := 0 + j
j

M
i, j ( i j)
:= f x , y

unde f(x,y) este o ecuaŃie de regresie bivariată evaluată în programul SYSTAT, i


şi j sunt doi incremenŃi adaptaŃi la modul de variaŃie al celor două variabile
independente. Cotele suprafeŃei de regresie sunt incluse în matricea M, ca noduri
într-o reŃea dreptunghiulară de puncte (xi , yi). În spaŃiul marcat (colŃul stânga -
I. Sîrbu - Modelarea proceselor ecologice (2010) 106

jos) al ferestrei de definire a graficului, se înscrie numai identificatorul de


matrice, în cazul nostru M, iar rezultatul va arăta astfel:

M
De asemenea, prin accesarea meniurilor se pot modifica numeroşi
parametri ai graficului (se poate roti în toate dimensiunile, mări sau micşora,
schimba axele, scările etc.).

11.3. MODELE DEFINITE PRIN FUNCłII DE INTERPOLARE

În ecologie interpolarea, reprezentarea grafică şi calcularea estimatei


funcŃiei de interpolare într-un punct, care nu aparŃine reŃelei de noduri, este una
dintre cele mai utile aplicaŃii ale sistemului MathCAD.
Extrem de bune sunt funcŃiile de interpolare spline. Date fiind n puncte (xi,
yi) funcŃiile spline cubice au forma:

Pi ( x) = c 0i + c i ( x − x i ) + c 2i ( x − x i ) 2 + c 3i ( x − x i ) 3

unde i ia valori naturale succesive în domeniul 1, 2 .. n.


În exemplul de mai jos este evaluată o funcŃie spline cubică f(x) care
trasează forma albiei unui râu, în secŃiune transversală, pe baza unei serii de
măsurători, se calculează aria secŃiunii transversale a râului, lungimea graficului
(a albiei în secŃiune), iar introducerea unei estimate a vitezei momentane medii de
curgere a apei, permite evaluarea debitului.
I. Sîrbu - Modelarea proceselor ecologice (2010) 107

ORIGIN ≡ 1 n := 8
În calculele de mai jos:
i := 1 .. n n = numãrul de noduri (puncte în care s-au mãsurat adâncimile),
vx := vy := vx = distanta în sectiune transversalã, fatã de un mal
i i
(pozitia nodului in metri, fata de punctul de referinta)
0.0 0 vy = adâncimea mãsuratã în nodul definit prin vx
5.0 .45 f(x) = functia de interpolare
8.3 1.0 g = aria sectiunii transversale de râu
9.2 1.20 h = lungimea graficului (a albiei in sectiune transversalã)
v = viteza medie a apei la un anumit moment
10.4 1.50
12.8 .80
18.7 .56
22.9 0

s := lspline( vx, vy )
f ( x) := interp ( s , vx, vy , x)
x := 0.0, 0.1.. 22.9

f ( x)

x
22.9 22.9
⌠ ⌠
g :=  f ( x) dx  2
⌡ h := 
d 
1 +  f ( x)  dx
0

⌡  dx 
0
v := 1.3

p := g ⋅ v

g = 13.539 h = 23.237 p = 17.6

f ( 10) = 1.435 Posibilitatea evaluãrii valorii functiei de interpolare intr-un punct care nu apartine
retelei de noduri; în acest caz adâncimea estimatã la distanta de 10 m = 1.435 m
I. Sîrbu - Modelarea proceselor ecologice (2010) 108

11. 4. PROBLEME ŞI DEMONSTRAłII

1. Alcătuirea unei rutine pentru calcularea indicilor de biodiversitate mai


des utilizaŃi (biodiversitatea de tip α)

ORIGIN ≡ 1
S semnificã numãrul de specii, X este variabila sir care contine numãrul
S := 10 de indivizi prin care este reprezentatã fiecare specie în probe,
i := 1 .. S N = numarul total de indivizi din probe.
X :=
i
Înurmãtoarele formule d1 = indicele Margalef, d2 = indicele Menhinick
15
H = Shannon-Wiener, E = echitabilitate, simp = Simpson
11
3870
În aceste formule s-a utilizat fie logaritmul zecimal, fie în baza 2 pentru
101
6
ilustrarea modului de schimbare a bazei
41
148
129
9
1885

N := ∑ Xi p :=
i
X
i
i N

S−1 d2 :=
S
d1 :=
log( N) N

 log( p i) 
H := − ∑ p ⋅
i  log ( 2) 

∑ Xi⋅( Xi − 1)
i

log( S) i
l2 := simp :=
log( 2) N⋅ ( N − 1)

H
E :=
l2

N = 6215 d1 = 2.373 d2 = 0.127 H = 1.397 E = 0.421 simp = 0.481


I. Sîrbu - Modelarea proceselor ecologice (2010) 109

2. În tabelul de mai jos sunt sunt redate valorile medii ale diversităŃii specifice
(calculate prin indicele Simpson, codificat prin vy) pentru comunităŃile bentonice dintr-
un râu. StaŃiile (de la S1 la S8) sunt poziŃionate prin distanŃa vx faŃă de izvor (în km). Să
se traseze graficul funcŃiei spline de interpolare a diversităŃii în relaŃie cu distanŃa faŃă
de izvor, şi să se estimeze diversitatea la distanŃele de 10, 20, 30, 40, 50 şi 60 km.
S1 S2 S3 S4 S5 S6 S7 S8
vx 0,01 12 25 31 45 55 60 79
vy 0,02 0,12 0,10 0,45 0,58 0,40 0,65 0,79

ORIGIN ≡ 1
n := 8
i := 1 .. n
vy := vx :=
i i

0.02 0.01
0.12 12
0.10 25
0.45 31
0.58 45
0.40 55
0.65 60
0.79 79

s := lspline( vx, vy )
f ( x) := interp ( s , vx, vy , x)
x := 0.0, 0.01.. 79 Variatia indicelui Simpson

f ( x)

x, vx
f ( 10) = 0.13 f ( 20) = 0.017 f ( 30) = 0.391

f ( 40) = 0.667 f ( 50) = 0.417 f ( 60) = 0.65


I. Sîrbu - Modelarea proceselor ecologice (2010) 110

3. Rutină pentru analiza asocierii dintre specii (pentru partea teoretică a se


revedea Sîrbu şi Benedek, 2004)

a := 48 b := 23
c := 19 d := 22

n := a + b + c + d
2
n ⋅  a⋅ d − b ⋅ c − 
n 

hip :=
  2 
( a + c) ⋅ ( b + d ) ⋅ ( a + b ) ⋅ ( c + d )

Valoarea critica a testului la nivelul de asigurare de 0,05 este de 3,84: asocierea este semnificativa
numai daca valoarea calculata hip este mai mare!

hip = 4.045

coeficienti de asociere - 1. CCM: coeficientul contingentei medii patratice

hip
CCM :=
n + hip

2. C1, 2, 3 = coeficientii lui Cole si erorile standard: Daca ad >=bc atunci C1, e1

a⋅ d − b ⋅ c
C1 :=
( a + b ) ⋅ ( b + d)

( a + c) ⋅ ( c + d )
e1 :=
n⋅ (a + b)⋅ (b + d)

Daca bc>ad si d>=a atunci C2, e2


a⋅ d − b ⋅ c
C2 :=
( a + b) ⋅ ( a + c)

( b + d) ⋅ ( c + d )
e2 :=
n ⋅ ( a + b ) ⋅ ( a + c)

Daca bc>ad si a>d atunci C3, e3


a⋅ d − b ⋅ c
C3 :=
( b + d ) ⋅ ( c + d)

( a + b ) ⋅ ( a + c)
e3 :=
n⋅ (b + d)⋅ ( c + d)
I. Sîrbu - Modelarea proceselor ecologice (2010) 111

Indicele de afinitate - Fager

na := a + c nb := a + b
2⋅ a
iab :=
na + nb

( na + nb ) ⋅ ( 2⋅ a − 1)
tt :=  − 1 ⋅ na + nb − 1
 2⋅ na ⋅ nb 

t := tt

gl := na + nb − 2
************************************************************************************************
Rezultate - pentru tabelul de contingenta

3
hip = 4.045 a⋅ d = 1.056 × 10 b⋅ c = 437
CCM = 0.187 d = 22 a = 48

C1 = 0.194 C2 = 0.13 C3 = 0.336

e1 = 0.088 e2 = 0.059 e3 = 0.152

Rezultate pentru analiza de afinitate: iab=indicele Fager, t=valoare test,


gl= grade de libertate:

t = 4.424 gl = 136 iab = 0.696

Daca t calculat este mai mare decat valoarea critica la nivelul de asigurare ales
si gl grade de libertate, afinitatea este semnificativa.
************************************************************************************************
I. Sîrbu - Modelarea proceselor ecologice (2010) 112

4. Rutină pentru evaluarea lăŃimii şi suprapunerii nişelor ecologice

Acest exemplu serveşte şi pentru deprinderea modului de definire şi


operare cu matrici. Pentru a defini o matrice, se alege simbolul corespunzător din
meniul de calcul. Apare o fereastră (Insert Matrix) în care se introduc numărul de
rânduri (Rows) şi de coloane (Columns), după care se inserează matricea în locul dorit
(OK) şi se completează cu valorile corespunzătoare.
În exemplul de mai jos considerăm o matrice de 7 resurse, exploatate în comun
de o comunitate formată din 5 populaŃii.
În matricea care apare ne deplasăm cu săgeŃi sau cu Enter, şi umplem spaŃiile
definite prin pătrate negre, cu valorile corespunzătoare. Restul rutinei de mai jos este
autoexplicativă. Pentru partea teoretică a se revedea Sîrbu şi Benedek, 2004.

ORIGIN ≡ 1 n := 7 k := 5

j := 1 .. n i := 1 .. k h := 1 .. k
 0.15 0.05 0.12 0.43 0.17 0.08  0
 
0 0 0.94 0.06 0 0 0
  a :=
p :=  0.41 0.16 0.10 0.05 0.05 0 0.23  j
 0 0.48 0.02 0 0 0.5 0  0.05
  0.07
 0.01 0.02 0.01 0 0.24 0.31 0.41 
0.01
0.12
0.29
0.14
p = 0.15 accesarea unui termen al matricii
1, 1 0.32

S :=
i ∑ pi , j verificarea sumei pe linii a matricii de resurse
j

1
 
1
 
S = 1
1
 
1
I. Sîrbu - Modelarea proceselor ecologice (2010) 113

EVALUAREA LATIMII NISELOR


1
B :=
∑ (p i , j)
i 2 Indicele Levins - B

B −1
i
BA := Indicele Levins - B standardizat
i n−1

FT :=
i ∑ p ⋅a
i, j j
Indicele Smith
j

REZULTATE:

B = BA = FT =
i i i
3.852 0.475 0.735
1.127 0.021 0.182
3.823 0.47 0.75
2.08 0.18 0.462
3.102 0.35 0.904

EVALUAREA SUPRAPUNERII NISELOR ECOLOGICE

Indicele Pianka

∑ p i , j⋅ p h , j
j
O :=
i, h

∑ (p i , j) ∑ (p h , j)
2
⋅
2
  
 j  j 

Indicele standardizat HS

∑ (a j⋅ p ⋅p
i, j h , j )
j
HS :=
∑ (a j⋅ p i , j) ⋅ ∑ (a j⋅ p h , j)
i, h


 j  j 

 1 0.289 0.428 0.188 0.24 


 
0.289 1 0.201 0.029 0.018
 
O =  0.428 0.201 1 0.222 0.395 
 0.188 0.029 0.222 1 0.419 
 
 0.24 0.018 0.395 0.419 1 

 1 0.498 0.51 0.346 0.487 


 0.498 1

0.21 0.033 0.015
 
HS =  0.51 0.21 1 0.173 0.778 
 0.346 0.033 0.173 1 0.389 
 
 0.487 0.015 0.778 0.389 1 
I. Sîrbu - Modelarea proceselor ecologice (2010) 114

12. MODELAREA DINAMICII POPULAłIONALE PRIN


ECUAłII RECURENTE

Pentru a caracteriza o populaŃie, putem evalua o serie de parametri


ecologici cantitativi sau calitativi, cum ar fi: abundenŃa populaŃiei, efectivul,
densitatea (ecologică, brută sau absolută), natalitatea (sau orice alt mecanism prin
care apar indivizi în interiorul unei populaŃii, excluzând imigrarea), mortalitatea,
distribuŃia pe clase de vârstă (structura de vârstă) sau dimensiuni, distribuŃia
spaŃială, dinamica populaŃională (variaŃii ale parametrilor cantitativi ai abundenŃei
sau efectivului în timp) etc. (a se revedea Sîrbu şi Benedek, 2004).
Definim rata absolută a natalităŃii (Ba) ca raportul între numărul indivizilor
născuŃi (∆b) sau intraŃi în populaŃie prin ecloziune, diviziune etc., într-un anumit
interval de timp (∆t), iar rata relativă a natalităŃii (Bs) este raportul între indivizii
nou apăruŃi în interiorul populaŃiei şi intervalul de timp considerat, multiplicat cu
efectivul populaŃiei (N) sau un număr standard (100 sau 1000 de indivizi la
populaŃiile speciilor asexuate, respectiv de femele la cele cu reproducere
sexuată):
∆b
Ba =
∆t
∆b
Bs =
N∆t
Corespunzător definim rata absolută a mortalităŃii (Ma) ca raportul între
numărul de indivizi decedaŃi într-un anumit interval de timp (∆m/∆t), iar rata
relativă a mortalităŃii raportează, analog, parametrul anterior la efectivul
populaŃional (N) sau un număr standard (100 sau 1000 de indivizi):
∆m
Ma =
∆t
∆m
Ms =
N∆t
Pentru a urmări dinamica unei populaŃii sunt necesare date privitoare la
procesele demografice care se desfăşoară (natalitate, mortalitate, imigraŃie,
emigraŃie), a consecinŃelor acestora şi a factorilor care le influenŃează. Pentru a
cunoaşte efectivul populaŃiei la un anumit moment (Nt) este necesară cunoaşterea
dimensiunii populaŃiei într-un stadiu de timp anterior (Nt-1), la care se adaugă
numărul de indivizi imigraŃi în intervalul de timp (I) şi cei care au apărut (B) în
interiorul populaŃiei (prin naştere, eclozare sau oricare alt mecanism biologic),
scăzându-se numărul de indivizi decedaŃi (M) şi cei emigraŃi (E). Prin urmare,
ecuaŃia generală ar fi:

Nt = Nt-1 + B + I - M - E
I. Sîrbu - Modelarea proceselor ecologice (2010) 115

Acesta este un prim model matematic al dinamicii populaŃiei, care are


avantajul traducerii unui fenomen complex într-o ecuaŃie clară şi obiectivă. Ea
poate fi manipulată ca orice ecuaŃie matematică, conducând la o flexibilitate care
depăşeşte orice model conceptual. Dezavantajul metodei constă în faptul că
determinarea directă a acestor parametri este posibilă numai în cazuri foarte rare,
atunci când populaŃia poate fi monitorizată în întregime. Cel mai frecvent, pentru
a afla valorile fluctuaŃiilor numerice ale indivizilor unei populaŃii se apelează la
diferite metode estimative şi indirecte. O metodă directă este construirea şi
interpretarea tabelelor de viaŃă şi de fecunditate. Pentru a readuce în memoria
cititorului principiile acestei metode, redăm mai jos tehnica simplificată de
construire a unui tabel dinamic de viaŃă (care urmăreşte procesele demografice
de-a lungul unei generaŃii, în absenŃa migraŃiei) pentru o specie cu generaŃii
discrete. Tehnica integrală de calcul este redată de I. Sîrbu şi A.M. Benedek
(2004) motiv pentru care nu se insistă aici mai mult decât este necesar.
Să considerăm exemplul de mai jos (tab. 12.1), în care se urmăreşte
mortalitatea specifică de vârstă, pe parcursul a 6 stadii de dezvoltare, a unei
generaŃii de Chortippus brunneus (după Richard şi Waloff 1954, ap. Begon şi col.
1986).

Tab. 2.1. Tabel dinamic de viaŃă al unei generaŃii de Chorthippus brunneus


(după Richard şi Waloff 1954, ap. Begon şi col. 1986).

x ax lx dx qx Fx mx l xm x
Ouă (0) 44000 1.000 0.920 0.92 - - -
Stadiul 1 3513 0.080 0.022 0.28 - - -
Stadiul 2 2529 0.058 0.014 0.24 - - -
Stadiul 3 1922 0.044 0.011 0.25 - - -
Stadiul 4 1461 0.033 0.003 0.11 - - -
AdulŃi 1300 0.030 0.030 1.00 22617 17 0.51

În acest tabel stadiul, vârsta sau intervalul de timp, este codificat prin x, iar
variabilele specifice de stadiu prin indicele subscript x (de exemplu ax sau l x).
Variabilele din acest tabel au următoarea semnificaŃie:
 ax = numărul de indivizi în viaŃă la începutul fiecărui stadiu. Aceste valori sunt
specifice fiecărei populaŃii şi an, făcând comparaŃiile directe imposibile. De
aceea se lucrează cu valori standard, care se trec în coloana următoare, şi
anume:
 l x = proporŃia de indivizi din stadiul iniŃial care au supravieŃuit la începutul
stadiului x:
lx = ax / ao
 d x = proporŃia de indivizi eliminaŃi din populaŃie în fiecare stadiu, adică:
(l x - l x+1)
I. Sîrbu - Modelarea proceselor ecologice (2010) 116

 q x = rata mortalităŃii specifice de vârstă (stadiu), adică raportul d x / l x.


Această rată este caracteristică pentru fiecare populaŃie şi poate fi înŃeleasă ca
probabilitatea de deces a unui individ în decursul unui stadiu x.
Până în acest punct ne-am ocupat numai de numărul de indivizi şi am
înregistrat variaŃiile numerice ale acestora prin variabile standardizate, pentru a
permite găsirea unei proceduri de realizare a unor studii comparative.
Tabelul de fecunditate începe cu coloana următoare, în care sunt
înregistraŃi numărul de urmaşi produşi de generaŃia parentală în decursul stadiului
x.
 Fx = este coloana în care se înscrie numărul de urmaşi produşi de lotul studiat
în stadiul x.
 m x = numărul mediu de urmaşi produşi de fiecare individ supravieŃuitor din
stadiul x. Altfel spus, m x = Fx / a x
 l xmx = este produsul între valorile din coloanele lx şi mx, semnificând numărul
mediu de urmaşi produşi de fiecare individ din stadiul 0 (iniŃial) în decursul
etapei x.
Dacă notăm cu Rx produsul mxlx definim un parametru sintetic al tabelelor
de viaŃă, şi anume rata netă de modificare (sau reproducere) a populaŃiei.
Aceasta redă factorul de multiplicare al mărimii populaŃiei la sfârşitul unei
generaŃii parentale (de câte ori se poate multiplica mărimea unei populaŃii în
decursul unei generaŃii). Cu alte cuvinte am obŃinut un prim model populaŃional,
care exprimă determinist dinamica acesteia, de forma:

Nt+1 = RtNt

care este o ecuaŃie recurentă de ordinul 1, din cauza faptului că relaŃionează


dimensiunea populaŃiei la momentul (t+1) de cea înregistrată la un interval
anterior de timp (t). În exemplul de mai sus Rt este valoarea ultimei celule ale
produsului mxlx = 0.51, semnificând că dimensiunea populaŃiei a scăzut la cca. o
jumătate faŃă de anul precedent.
O ecuaŃie recurentă de ordinul 2 ar implica calcularea dinamicii în două
etape, cunoscând efectivele populaŃiei la momentele (t) şi (t-1), adică Nt şi Nt-1,
precum şi ratele fundamentale Rt-1 (dintre momentul t şi t-1), precum şi Rt (dintre
t+1 şi t), adică:

Nt+1 = RtNt + Rt-1Nt-1


În mod corespunzător o ecuaŃie de diferenŃă sau recurentă de ordinul 3 ar
implica parametri evaluaŃi în trei stadii de timp ale studiului etc. Pornind de la
acest exemplu de evaluare a dinamicii populaŃionale pe baza tabelelor de viaŃă şi
de fecunditate, să urmărim dezvoltarea altor categorii de modele, pe care le vom
realiza din ce în ce mai complex, în scopul apropierii de cazuri cât mai generale,
care aproximează mai corect fenomenele din natură.
După cum am mai specificat, urmărirea unui fenomen în timp se poate face
în mod continuu sau în mod discret (în ultimul caz exemplul este chiar tabelul de
I. Sîrbu - Modelarea proceselor ecologice (2010) 117

viaŃă precedent). EcuaŃiile matematice care descriu modificările în timp continuu


sunt ecuaŃii diferenŃiale, iar cele care caracterizează schimbările în intervale
discrete de timp sunt ecuaŃii recurente sau de diferenŃe.
Dezvoltarea modelului dinamicii populaŃionale se va baza pe tehnica
expusă de Gillman şi Hails (1997).
În exemplul anterior, în care am analizat efectul direct al fecundităŃii şi
supravieŃuirii asupra modificării numerice a populaŃiei, am obŃinut o ecuaŃie care
constituie un model determinist (depinde explicit numai de parametri de intrare)
independent de densitate (probabilitatea de supravieŃuire a indivizilor din
fiecare clasă nu depinde de interacŃiunile intraspecifice, condiŃionate de
abundenŃa acestora). Dacă redefinim rata netă de creştere sau de modificare
numerică a populaŃiei (care Ńine seama de produsul dintre supravieŃuire şi
fecunditate) printr-un termen general, pe care îl definim fie prin expresia rata
finită de creştere a populaŃiei λ (Gillman, Hails, 1997) sau prin expresia
adaptată după May (1981, ap. idem) factorul multiplicativ de creştere pe
generaŃie, obŃinem ecuaŃia generală:
Nt+1 = λNt
care este tot o ecuaŃie recurentă de ordinul 1, unde λ este constantă în timp şi se
poate calcula pe oricare stadiu corespondent al două generaŃii succesive (fiind un
model determinist, independent de densitate). Dacă aceste condiŃii sunt
îndeplinite şi λ este mai mic decât unitatea, va surveni extincŃia deterministă a
populaŃiei.
Invers, cunoscând efectivul populaŃiei la momentul (t+1) şi cel de la
momentul (t), din ecuaŃia anterioară se poate calcula valoarea ratei finite de
creştere, prin ecuaŃia:
Nt +1
λ=
Nt
Exemplu: dacă într-un studiu realizat prin metoda tabelelor de viaŃă asupra
unei specii vegetale (terofită anuală), am numărat pe suprafaŃa de probă 23450 de
seminŃe germinate în anul 1 şi în anul următor (în acelaşi stadiu) 36459, rata
finită de creştere a populaŃiei se calculează prin relaŃia:
λ = 36459 / 23450 = 1.55.
Este evident că această abordare a dinamicii populaŃionale este extrem de
simplă. În realitate abundenŃa unei populaŃii (fie în termeni de efectiv sau
densitate) are implicaŃii majore asupra capacităŃii de supravieŃuire şi de
fecunditate a indivizilor, prin efectele mecanismelor de reglare intraspecifică
(competiŃie, stress, probabilitatea de a găsi un partener pentru reproducere etc.).
Totodată λ este dependent de fluctuaŃiile mediului, variaŃii în timp şi spaŃiu ale
parametrilor abiogeni, fapt care implică renunŃarea la ideea de valoare constantă
şi trecerea la o distribuŃie de probabilităŃi a valorilor pe care le poate avea în
timp. Reglarea populaŃională dependentă de densitate va modifica
corespunzător modelul enunŃat, prin faptul că mortalitatea creşte cu abundenŃa
(efectivul sau densitatea) populaŃiei. Dacă notăm cu s proporŃia indivizilor care
I. Sîrbu - Modelarea proceselor ecologice (2010) 118

supravieŃuiesc (echivalentul parametrului lx din tabelele de viaŃă), iar cu N o


măsură a abundenŃei populaŃiei, care se poate exprima în moduri variate (cum ar
fi efectivul, densitatea ecologică sau brută, densitatea absolută etc.), am putea
identifica cel puŃin trei categorii majore de relaŃii între supravieŃuire şi abundenŃă
(modele dependente de densitate), redate în Fig. 12.1.
s
1

3
Nmax
0 N
Fig. 12.1. Trei modele potenŃiale de dependenŃă între fracŃia indivizilor care
supravieŃuiesc într-o unitate de timp (s) şi densitatea sau abundenŃa populaŃiei (N); după
Gillman şi Hails, 1997.

Cel mai simplu model evidenŃiat de Fig. 12.1 este relaŃia liniară dintre
fracŃia de supravieŃuire s şi abundenŃă N (modelul 2). Reamintim că ecuaŃia
generală a dreptei este:

f(x) = a + bx

unde x este variabila independentă, b este panta dreptei iar a este


intercepŃia.
Dacă notăm intercepŃia ordonatei de către dreaptă cu 1 (valoarea
probabilităŃii de supravieŃuire a unui individ la limita minimă a densităŃii) iar
panta dreptei de regresie cu m, putem rescrie ecuaŃia generală a dreptei ca:

s = 1 - mN

Acest model presupune că există un Nmax, valoarea maximă a densităŃii,


dincolo de care populaŃia este incapabilă să supravieŃuiască (în grafic intercepŃia
abscisei de către dreaptă), deci la care s=0. De asemenea există şi o densitate
minimă Nmin la care s ≈ 1 sub care de asemenea populaŃia dispare.
Gradientul sau panta dreptei m se poate analoga cu tangenta unghiului
format de segmentele definite prin s, Nmax, O, ceea ce conduce la relaŃia:
1
m=
N max
I. Sîrbu - Modelarea proceselor ecologice (2010) 119

Prin înlocuirea lui m în ecuaŃia generală a modelului dependent de


densitate, rezultă:

s = 1 - (1 / Nmax) N

s = 1 - N / Nmax

care, repetăm, caracterizează relaŃia dintre probabilitatea de supravieŃuire a unui


individ (sau fracŃia de supravieŃuire a indivizilor) şi efectivul (abundenŃa)
populaŃiei.
Putem acum să construim un nou model al dinamicii populaŃiei, care va
evalua efectivul la momentul (t+1), ca funcŃie de efectivul din momentul anterior
(t), de rata finită de modificare a populaŃiei (λ), dar care Ńine seama şi de efectele
dependente de densitate (s ca funcŃie de N), adică:

 Nt 
N t +1 = N t λ1 − 
 N max 

care este ecuaŃia logistică discretă a dinamicii populaŃionale, dependentă


de densitate. Uzual nu se aplică notaŃia Nmax pentru valoarea maximă a densităŃii
sau abundenŃei, ci aceasta este înlocuită cu litera K, având aceeaşi semnificaŃie,
dar care se mai poate defini şi drept capacitatea de suport. Aceasta mai
semnifică densitatea maximă a unei specii, care poate fi susŃinută (suportată) de
un habitat particular. MulŃi consideră că acest parametru caracterizează atât
specia particulară, cât şi calitatea habitatului (abundenŃa şi disponibilitatea
resurselor acestuia). Uneori se operează cu inversul capacităŃii de suport, care se
notează cu α = 1/K
Prin urmare, dacă:
N max = K
respectiv
1
α=
K

atunci obŃinem ecuaŃiile echivalente:

 N 
N t +1 = λN t 1 − t 
 K 

respectiv:
I. Sîrbu - Modelarea proceselor ecologice (2010) 120

λN 2t
N t +1 = λN t (1 − αN t ) = λN t −
K

Am scris aceste relaŃii nu pentru a ne juca cu expresii matematice, ci pentru


a ilustra faptul, că modelul dependent de densitate nu este liniar ci în mod evident
neliniar, deci un polinom de gradul 2. Reamintim aici că un model polinomial (o
funcŃie polinomială) are forma generală:

f(x) = a0 + a1x + a2x2 + ...+ anxn

unde n este un număr natural; n ≥ 0. Ordinul sau gradul acestui model este cea
mai mare putere a lui x în expresia funcŃiei.
Având ecuaŃia dinamicii populaŃionale dependente de densitate, putem
realiza numeroase simulări pe calculator (în programul MathCAD de exemplu) ,
dând valori parametrilor λ, K şi Nt, respectiv urmărind modul în care aceştia se
reflectă în variaŃiile valorii aşteptate Nt+1.

Problemă. Să se construiască în MathCAD o serie de grafice care să simuleze


dinamica populaŃională anuală pentru diferite valori ale lui λ, la K=100 şi K=200,
pentru un interval de timp de 21 de ani şi efectiv iniŃial constant, utilizându-se
modelul logistic discret.

Rezolvare. Se tastează secvenŃa de mai jos:

K1 := 100 K2 := 200 λ := 2 t := 1 .. 20

N1 := 30 D1 := 30

 Nt   Dt 
Nt+1 := λ ⋅Nt ⋅ 1 −  Dt+1 := λ ⋅Dt ⋅ 1 − 
 K1   K2 

prin care modelăm dinamica populaŃională a două sisteme caracterizate prin


valori diferite ale capacităŃii de suport (K1 şi K2). Apelarea modulului de grafică
bidimensională, va produce graficul din Fig. 12.2.
I. Sîrbu - Modelarea proceselor ecologice (2010) 121

120
120

100

Nt
80
Dt
60

40
30
0 5 10 15 20
0 t 21

Fig. 12.2. Model logistic discret al dinamicii populaŃionale la λ=2.0

Dinamica modelului populaŃional la λ=2 aproximează o creştere logistică,


ce se încheie cu un echilibru staŃionar al efectivului în timp, care depinde de
valoarea lui K. Păstrând aceleaşi date ale problemei, dar alegând λ = 3.0 obŃinem
Fig. 12.3.

150
150

Nt 100

Dt

50

30
0 5 10 15 20
0 t 21

Fig. 12.3. Model logistic discret al dinamicii populaŃionale la λ=3.0

care indică un echilibru dinamic ce se caracterizează prin oscilaŃii periodice între


două valori ale densităŃii: se mai numesc şi cicluri limită în două puncte.
Mărind valoarea lui λ la 3.5 vom obŃine graficul de mai jos, care
corespunde cu un echilibru ciclic în patru puncte (Fig. 12.4)
I. Sîrbu - Modelarea proceselor ecologice (2010) 122

200
200

150
Nt

Dt
100

50
30
0 5 10 15 20
0 t 21

Fig. 12.4. Model logistic discret al dinamicii populaŃionale la λ=3.5

Pentru λ = 4 dispare echilibrul ciclic, iar fluctuaŃiile aparent prezintă un


model întâmplător, care este denumit dinamică haotică. În toate cazurile K nu
afectează dinamica ci doar nivelul la care este realizat echilibrul sau dinamica
haotică (Fig. 12.5)

210 200

150
Nt

Dt 100

50

0 0
0 5 10 15 20
0 t 21

Fig. 12.5. Model logistic discret al dinamicii populaŃionale la λ=4.0

Dinamica haotică a unui fenomen nu înseamnă faptul că acel fenomen este


un produs al întâmplării. Multe procese “haotice” pot fi rezultate ale unor
fenomene previzibile, deterministe, aşa cum se vede şi din exemplul de mai sus.
Nu este întotdeauna simplu să se distingă între randomizare sau stochasticitate şi
dinamica haotică (a se revedea cele expuse la analiza seriilor de timp).
I. Sîrbu - Modelarea proceselor ecologice (2010) 123

Până acum am considerat dependenŃa de densitate a probabilităŃii de


supravieŃuire, ca fiind o funcŃie liniară. În cazul în care această dependenŃă nu
este liniară, ci corespunde cu curba de tip 3 din Fig. 12.1, atunci fracŃia
indivizilor supravieŃuitori (s) scade cu abundenŃa sau densitatea populaŃiei (N)
după o funcŃie negativă exponenŃială, de tipul:

s = e-aN

unde parametrul a se poate considera ca intensitatea dependenŃei de densitate.


Este evident faptul că s scade cu atât mai accentuat, cu cât a este mai mare, aşa
cum rezultă din simularea în Mathcad (Fig. 12.6).

a1 := 0.001 a2 := 0.01 a3 := 0.1


N := 10 , 20 .. 500
− a1 ⋅N − a2 ⋅N − a3 ⋅N
s1N := e s2N := e s3N := e

1
1

s1 N

s2 N
0.5
s3 N

0 0
0 100 200 300 400 500
0 N 500

Fig. 12.6. Simularea relaŃiei dintre abundenŃă N şi probabilitatea de supravieŃuire s la


diferite valori ale exponentului a.

EcuaŃia modelului de dinamică populaŃională cu dependenŃă neliniară de


densitate, devine:

Nt+1 = λNte-aNt

aceasta fiind tot o ecuaŃie recurentă neliniară de ordinul I, cunoscută sub


denumirea de ecuaŃia Ricker (1954, ap. Gillman şi Hails, 1997).
Evaluarea parametrilor λ şi a din date reale (experimentale) se realizează
cel mai bine prin exprimarea ecuaŃiei sub forma unei drepte de regresie astfel:
ambii termeni ai ecuaŃiei se împart la Nt şi se logaritmează expresia, rezultând
ecuaŃiile echivalente:
I. Sîrbu - Modelarea proceselor ecologice (2010) 124

N t +1 N 
= λe −aN t ⇔ ln t +1  = ln(λ ) − aN t
Nt  Nt 
Prin urmare, datele demografice experimentale se pot reprezenta sub forma
unei drepte de regresie de tipul ecuaŃiei de mai sus, după care estimăm ln(λ) din
intercepŃia ordonatei de către dreapta de regresie (lnλ) iar panta dreptei sau
coeficientul de regresie va fi egal cu parametrul a.
Pînă în acest moment am considerat populaŃia ca având generaŃii discrete,
sau că procesul de reproducere se desfăşoară în mod discret în cadrul unor
populaŃii cu generaŃii suprapuse. În natură însă, aceste trăsături acoperă doar o
parte din posibilităŃi: numeroase specii nu îşi sincronizează reproducerea, care
poate fi astfel considerată ca un proces continuu. Evident modelele de tip recurent
nu mai sunt valabile în acest caz; noul model pe care îl căutăm va trebui să se
raporteze la un timp continuu, şi astfel vom dezvolta modelele diferenŃiale, pe
care le vom studia la masterat.

13. ACTIVITATE INDEPENDENTĂ;


PROBLEME

Integrând cele expuse anterior şi din bibliografia indicată, studenŃii ar


trebui să fie capabili să rezolve pe calculator problemele de mai jos (care
simulează modul în care se va desfăşura partea practică a examenului). Succes!

Problema 1.
În tabelul de mai jos sunt redate valorile unor parametri fizico-chimici şi ai
biodiversităŃii comunităŃilor acvatice din 9 staŃii de prelevare a probelor,
amplasate de-a lungul râului Cibin (după A. Bănăduc, 2005).
Codurile utilizate au următoarele semnificaŃii:
RF = reziduu fix, DO = deficit de oxigen, CBO5 = consum chimic de oxigen
după 5 zile, CMN = consum chimic de oxigen prin metoda permanganatului de
potasiu, MA = indicele Margalef, ISIM = indicele Simpson inversat.
SemnificaŃiile codurilor staŃiilor: S1 - Râu Mare amonte de confluenŃa cu
Dăneasa; S2 - Cheile Cibinului, S3 - amonte lacul Gura Râului, S4 - aval baraj
Gura Râului, S5 - aval Orlat, S6 - amonte Sibiu, S7 - aval Sibiu, S8 - aval Mohu,
S9 - amonte vărsare în Olt.
RF DO CBO5 CMN MA ISIM

S1 124.440 16.320 1.990 3.780 11.170 0.919


S2 142.800 15.130 3.490 7.740 13.254 0.933
S3 111.220 13.130 1.840 3.370 10.695 0.930
S4 148.890 14.760 3.240 5.590 8.971 0.899
S5 222.440 23.100 4.180 7.310 6.216 0.836
S6 217.330 31.230 5.010 8.310 7.668 0.909
S7 209.110 31.270 5.130 9.260 4.281 0.859
S8 555.330 58.700 12.750 17.570 2.695 0.672
S9 294.440 25.210 7.400 14.330 5.290 0.779
I. Sîrbu - Modelarea proceselor ecologice (2010) 125

CerinŃele problemei:
1. Să se discute posibilităŃile de reprezentare grafică a acestor valori.
2. Să se discute posibilităŃile de prelucrare a datelor.
3. Să se efectueze analiza de corelaŃie între valorile celor doi indici de
biodiversitate, şi o analiză similară între parametrii CBO5 şi CMN.
4. Să se efectueze analiza de regresie între CBO5 şi MA, şi o analiză similară
între CMN şi ISIM.
5. Să se calculeze matricea cu valorile standardizate ale variabilelor.
6. Pe baza matricii cu valori standardizate să se calculeze matricea de distanŃe
euclidiene între staŃiile de colectare a probelor (S1, S2 ... S9).
7. Să se reprezinte grafic matricea de distanŃe euclidiene printr-o dendrogramă,
utilizând metoda de grupare la distanŃă medie.

Problema 2. În tabelul de mai jos sunt redate valorile indicelui de abundenŃă


relativă a principalelor grupe de macronevertebrate bentonice de-a lungul râului
Mureş (S1 - Izvorul Mureşului, S2 - Senetea, S3 - RăstoliŃa, S4 - Ungheni, S5 -
Gura Arieş, S6 - Sântimbru, S7 - VinŃu de Jos, S8 - Pecica). Aceste date relevă
starea ecologică a râului şi calitatea apei şi sedimentelor, având valoare în
caracterizarea impactului antropic asupra ecosistemelor riverane (după Sîrbu şi
col., 2002).

Taxon / StaŃie S1 S2 S3 S4 S5 S6 S7 S8
Hydroidea 0,00 0,00 0,00 0,00 0,45 0,00 0,45 0,10
Plathelminthes 3,46 0,00 0,00 0,00 0,00 0,00 0,00 0,10
Nemathelminthes 0,00 0,00 0,28 0,45 0,18 0,04 0,57 4,47
Oligochaeta 19,04 9,46 3,50 63,29 18,89 63,29 53,31 14,94
Hirudinea 0,00 0,00 0,00 0,34 0,00 0,00 0,00 0,00
Mollusca 0,58 0,17 1,83 0,68 0,36 0,00 0,00 0,10
Amphipoda 56,35 57,54 0,08 0,00 0,00 0,00 0,00 0,00
Hydracarina 0,19 0,62 2,87 0,00 0,09 0,00 0,00 0,00
Collembola 0,00 0,17 0,00 0,00 0,00 0,00 0,06 0,00
Ephemeroptera 4,61 8,77 3,82 7,87 6,83 5,24 2,93 0,81
Odonata 0,00 0,00 0,00 0,00 0,18 0,08 0,06 0,00
Plecoptera 1,54 1,99 0,12 0,34 0,00 0,00 0,00 0,00
Trichoptera 0,19 1,16 33,24 0,00 2,61 0,60 2,99 0,51
Coleoptera 9,81 13,43 0,72 0,00 0,00 0,04 0,00 0,00
Chironomidae 3,65 6,07 51,47 27,03 68,71 30,27 38,80 78,77
Diptera 0,58 0,62 2,07 0,00 1,71 0,44 0,82 0,20

Pe baza acestor date să se compare între ele staŃiile de prelevare a probelor,


utilizându-se distanŃa medie euclidiană, să se reprezinte grafic sub forma unei
dendrograme prin metoda de grupare la distanŃă medie. Să se comenteze
rezultatul.
I. Sîrbu - Modelarea proceselor ecologice (2010) 126

Problema 3. Un studiu de variabilitate morfologică şi biometrică a fost realizat la


4 populaŃii de Holandriana holandri în vederea urmăririi modului în care
variabilitatea intraspecifică variază ecologic şi geografic, precum şi pentru
verificarea statutului taxonomic al subspeciilor citate în România (după Sîrbu,
1998). Fiecare individ are o fişă de diagnoză, iar tabelul de mai jos redă procentele
de indivizi din loturile studiate care prezintă caracterul codificat corespunzător.
Codurile caracterelor sunt următoarele (...) Pentru penultimul anfract: SMPA – şir
mamelonar, CPA – carenă, Pentru ultimul anfract: SMSUA – şir mamelonar
superior, CSUA – carenă superioară, LSUA – linie superioară, SMMUA – şir
mamelonar median, CMUA – carenă mediană, NORN – nu există ornamentaŃii, E3
– trei dungi brune în exterior, E2 – două, respectiv E1 – o singură dungă brună
spirală, I3 – trei dungi brune în transparenŃa peretelui palatal al aperturii, I2 – două,
I1 – o dungă vizibilă prin transparenŃă. EX3INT – trei dungi vizibile atât în
exterior cât şi prin transparenŃă, EX2INT – acelaşi lucru dar pentru două dungi,
NDB – nu există dungi brune, etc. etc.

S1 S2 S3 S4
V$ C_GRAD C_VRANI N_SASCA L_TRIK
SMPA 23.070 24.560 8.600 1.660
CPA 3.840 24.560 3.220 3.320
LPA 17.290 3.510 0.000 1.660
SMSUA 44.200 29.820 54.840 1.660
CSUA 1.910 3.510 19.350 0.000
SMMUA 5.750 5.260 19.350 0.000
CMUA 3.830 10.520 58.060 0.000
LXMUA 17.290 5.260 3.220 3.320
LINUA 28.830 26.310 36.560 0.000
INFLUA 0.000 1.750 7.520 6.660
SFSUP 84.610 59.650 89.240 1.660
SFMED 80.750 43.860 87.100 3.320
SFINF 28.830 26.310 36.560 0.000
NEMORN 5.760 33.330 6.450 91.670
E3 9.610 5.260 11.830 100.000
I3 1.920 5.260 6.450 100.000
E2 40.380 10.520 51.610 0.000
I2 55.760 17.540 65.590 0.000
E1 3.850 0.000 0.000 0.000
I1 7.690 0.000 1.070 0.000
NDB 32.700 77.190 17.200 0.000

Problema cere să se compare loturile analizate prin construirea unei matrici


de distanŃe euclidiene şi să se reprezinte grafic sub forma unei dendrograme
(metoda de grupare la distanŃă medie). Să se calculeze pentru fiecare lot valoarea
indicelui de diversitate (morfologică) după formula Shannon-Wiener. Să se
comenteze rezultatele obŃinute.
I. Sîrbu - Modelarea proceselor ecologice (2010) 127

Problema 4. Dinamica spaŃială a poluării cu doi compuşi chimici oarecare (în


mg/m3 sol), redată prin distanŃa faŃă de o sursă industrială (în km), este :
DistanŃa faŃă de sursă : 0, 0.2, 0.5, 1, 2, 4, 8, 12, 12.2, 16.5, 20
Compus 1 : 89.9, 80.5, 56.4, 61.3, 60.9, 34.6, 12.4, 12.5, 10.2, 2.0, 1.0
Compus 2 : 45.3, 21.1, 16.3, 16.9, 16.6, 10.4, 8.2, 4.1, 3.6, 2.9, 0.
- Să se modeleze dinamica prin interpolare cu funcŃii spline cubice.
- Să se evalueze în ambele cazuri unde se estimează reducerea la jumătate a
concentraŃiei, în funcŃie de distanŃa faŃă de sursă.

Problema 5. Să se construiască în MathCAD rutine pentru aplicarea şi calcularea


parametrilor prin Metoda distanŃelor (Ecologie practică, cap. VIII; Sîrbu şi
Benedek, 2004).

Problema 6. În aplicaŃia de mai jos DIST semnifică distanŃa faŃă de o sursă de


poluare (în km), PB este concentraŃia de plumb (în mg/kg sol), CU concentraŃia
de cupru, Zn de zinc, iar DENS este densitatea unei populaŃii aparŃinând unei
specii edafice sensibile la poluare (în nr. indivizi / dm3 sol).
StaŃii PB CU ZN DENS DIST
s1 2.200 4.120 12.450 0.000 0.5
s2 2.200 3.190 11.450 0.140 1
s3 2.100 1.000 10.300 1.500 1.5
s4 2.600 2.000 10.040 0.400 2
s5 1.400 2.410 10.000 0.100 2.5
s6 1.300 3.000 8.540 1.500 3
s7 1.100 2.150 9.120 1.500 3.5
s8 0.600 2.100 8.430 1.800 4
s9 0.900 1.900 8.200 5.800 4.5
s10 1.100 1.400 8.000 5.300 5
s11 0.300 1.340 8.000 10.400 5.5
s12 0.100 1.120 2.160 12.200 6
s13 0.400 0.960 0.130 15.200 6.5
s14 0.200 0.350 0.120 13.700 7
s15 0.200 0.320 0.050 38.160 7.5

1- Să se reprezinte grafic variaŃia variabilelor cu distanŃa faŃă de sursa de poluare.


2- Să se afle principalii parametri statistici descriptivi pentru fiecare variabilă.
3- Să se alcătuiască matricea de corelaŃii între concentraŃiile de metale grele şi să
se verifice semnificaŃia coeficienŃilor.
4- Să se afle modele statistice de regresie între DENS şi metalele grele (atât
modele uni- cât şi multivariate).
5- Să se modeleze dinamica spaŃială a variabilelor în funcŃie de distanŃa faŃă de
sursă prin interpolare cu funcŃii spline cubice pe porŃiuni.
I. Sîrbu - Modelarea proceselor ecologice (2010) 128

Problema 7. În metoda transectelor, estimatorul lui Hayne pentru densitate (DH)


este dat de expresia:
nR
Dˆ H =
2L
unde: n = numărul de indivizi aparŃinând unei anumite specii, identificaŃi la o
parcurgere a transectului; L = lungimea transectului; R = media inverselor
1 n 1
distanŃelor de vizualizare (media armonică) = ∑ ; ri = distanŃa de vizualizare
n i =1 ri
a fiecărui individ i (i ia valori succesive naturale în intervalul dintre 1 şi n).
Definim varianŃa estimatorului lui Hayne [var(DH)], respectiv eroarea
standard [ES(DH)] prin expresiile:

 n
1  
2



∑  
 − R 
1 i =1  ri  
var(Dˆ H ) ≈ Dˆ H  +
2


n R n(n − 1) 
2

 
 

ES ( Dˆ H ) = var(Dˆ H )

iar limitele de confidenŃă (L1,2) ale densităŃii medii se calculează după expresiile:

L1, 2 = Dˆ H ± tα ES ( Dˆ H )

unde: tα = valoarea critică din tabelul t-Student la nivelul de asigurare ales (uzual
0.05) şi (n-1) grade de libertate = 1,64.

Şirul distanŃelor de vizualizare (în metri) a exemplarelor unei specii


oarecare, în timpul parcurgerii unui transect de L = 1000 m, este redat mai jos (n
= 38 indivizi):
ri = {12, 36, 10, 19, 51, 15, 68, 45, 36, 28, 87, 46, 52, 12, 16, 45, 69, 24, 15, 79,
31, 53, 26, 84, 15, 2, 65, 31, 19, 51, 63, 28, 16, 24, 23, 9, 17, 25} (metri).

Să se afle densitatea, varianŃa, eroarea standard şi limitele de confidenŃă.


Calculele se efectuează mai întâi în metri, iar valorile finale se raportează
la km , prin înmulŃirea valorilor estimatorilor cu 106.
2
I. Sîrbu - Modelarea proceselor ecologice (2010) 129

EXERCIłII - MODELARE NELINIARĂ (CU RĂSPUNSURI)


Problema 8. RelaŃia între producŃia primară algală f (mg/t) şi concentraŃia nutrienŃilor x (mg/l)
este redată prin cifrele de mai jos. Să se afle care dintre modele polinomiale de gradul I, II sau
III descrie cel mai bine această relaŃie neliniară.

x f(x)
1 14.8
4 160.0
9 1689.0
15 7775
42 170400
50 287500

răspuns: f=12.5 + 2.3*x3

Problema 9. În tabelul de mai jos x este variabila independentă iar f este cea dependentă. Care
dintre următoarele modele este cel mai adecvat descrierii fenomenului?
a. f=a+bx
b. f=a+bx3
c. f=a*bx
d. f=a*ex - asta este!
x f(x)
1 0.815
4 16.379
9 2431
15 980700

Problema 10. În tabelul de mai jos x şi y sunt variabile independente, iar f este funcŃia
bivariată f(x,y).

x y f(x, y)
1 1 0.665
5 5 1.923
9 9 -0.218
12 12 0.164
24 24 1.045
28 28 -7.777
32 32 -1.458
42 42 3.954
50 50 1.952
care dintre următoarele modele neliniare, aproximează cel mai bine această relaŃie?

a.) f ( x, y ) = a + b * sin 2 ( x) + c * cos 2 ( x)


1
b.) f ( x, y ) = a + b * (sin( x)) 2 −
cos( x 3 )
1 1
c.) f ( x, y ) = a − b * 2
+ c*
sin( x) cos( x) 2
răspuns: b
I. Sîrbu - Modelarea proceselor ecologice (2010) 130

14. BIBLIOGRAFIE SELECTIVĂ

1. Allaby, M., 2005 - Oxford Dictionary of Ecology. Oxford University Press


(Third edition).

2. Andrei, T., Stancu, S., Pele, D.T., 2002 - Statistică. Teorie şi aplicaŃii. Ed.
Economică, Bucureşti.

3. Begon, M., Harper, J.L., Townsend, C.R., 1986 - Ecology. Individuals,


Populations and Communities. Sinauer Associates Inc., Publ., Sunderland,
Massachusets.

4. Botnariuc, N., Vădineanu, A., 1982 - Ecologie. Ed. did. şi ped., Bucureşti.

5. Brunt, J.W., 2000 – Data Management Principles, Implementation and


Administration. Ecolgical Data: Design, Management and Processing. Eds. W.K.
Michener, J.W. Brunt. Methods in Ecology, Blackwell Science, Oxford,
Northampton: 25 – 47.

6. Cox, G.W., 2002 - General Ecology; Laboratory Manual (Eight Edition),


McGraw - Hill Publ.

7. Curtean-Bănăduc, A., 2005 - Râul Cibin. Caracterizare ecologică. Ed. Univ.


"Lucian Blaga" Sibiu, 242 pp.

8. Digby, P.G.N., Kempton, R.A., 1987 - Multivariate Analysis of Ecological


Communities. Chapman and Hall, London, New York.

9. Diggle, P.J., 1995 - Time Series. A Biostatistical Introduction. Clarendon


Press, Oxford University Press.

10. Dobson, A.P., Bradshaw, A.D., Baker, A.J.M., 1997 - Hopes for the Future:
Restoration Ecology and Conservation Biology. Science, 277 (5325): 515 - 522.

11. Drăgulescu, C., Sîrbu, I., 1997 - Practicum de Fitocenologie, Ed. Univ. "Lucian
Blaga" Sibiu.

12. Gillman, M., Hails, R., 1997 - An Introduction to Ecological Modelling;


Puting Practice into Theory. Methods in Ecology (eds. J.H. Lawton, G. E.
Likens). Blackwell Science.
I. Sîrbu - Modelarea proceselor ecologice (2010) 131

13. Gomoiu, M.T., Skolka, M., 2001 - Ecologie; Metodologii pentru studii
ecologice. Ovidius University Press, ConstanŃa.

14. Hair, J.F., Anderson, R.E., Tatham, R.L., Black, W.C., 1998 - Multivariate
Data Analysis. Prentice Hall, New Jersey.

15. Jeffries, C., 1989 - Mathematical Modeling in Ecology; a Workbook for


Students. Mathematical Modeling, 3, Birkhäuser - Boston, Basel, Berlin.

16. Johnson, R.A., Wichern, D.W., 1998 - Applied Multivariate Statistical


Analysis (Fourth Edition). Prentice Hall, New Jersey

17. Jørgensen, S.E., 1988 - Fundamentals of Ecological Modelling. Developments


in Environmental Modelling, 9. Elsevier; Amsterdam, Oxford, New York, Tokyo.

18. Jørgensen, S.E., Bendoricchio, G., 2001 - Fundamentals of Ecological


Modelling. (Third Edition) Developments in Environmental Modelling, 21.
Elsevier, Oxford.

19. Kanji, G.K., 1993 - 100 Statistical Tests. Sage Publications, London, Newbury
Park, New Delhi.

20. Krebs, C.J., 1989 - Ecological Methodology. Harper Collins Publishers, New
York.

21. Mangel, M., Fiksen, Øyvind, F., Giske, J., 2001 - Theoretical and Statistical
Models in Natural Resource Management and Research. Shenk, T.M., Franklin,
A.B., (Editors) - Modeling in Natural Resource Management. Development,
Interpretation, and Application. Island Press, Washington, Covelo, London: 57 -
73.

22. Michener, W.K., 2000 – (1) Research Design: translating ideas to data. (5)
Metadata. (7) Transforming data into information and knowledge. (8) Ecological
knowledge and future data challenges. Ecolgical Data: Design, Management and
Processing. Eds. W.K. Michener, J.W. Brunt. Methods in Ecology, Blackwell
Science, Oxford, Northampton: 1 – 24, 92 – 116, 142 – 174.

23. Odum, E.P., 1971 - Fundamentals of Ecology. W.B. Saunder’s Company,


Philladelphia, Toronto.

24. Olson, R.J., McCord, R.A., 2000 – Archiving Ecological Data and
Information. Ecolgical Data: Design, Management and Processing. Eds. W.K.
Michener, J.W. Brunt. Methods in Ecology, Blackwell Science, Oxford,
Northampton: 117 – 141.
I. Sîrbu - Modelarea proceselor ecologice (2010) 132

25. Porter, J.H., 2000 – Scientific Databases. Ecolgical Data: Design,


Management and Processing. Eds. W.K. Michener, J.W. Brunt. Methods in
Ecology, Blackwell Science, Oxford, Northampton: 48 – 69.

26. Ricklefs, R.E., 1993 - The Economy of Nature. ed. III, W.H. Freeman, New
York.

27. Saporta, G., Ştefănescu, V., 1996 - Analiza datelor şi informatică. Ed.
Economică, Bucureşti.

28. Silvert, W., 2001 - Modelling as a Discipline. Int. J. General Systems, 30 (3):
261 - 282.

29. Sinclair, A.R.E., Fryxell, J.M., Caughley, G., 2006 – Wildlife Ecology,
Conservation and Management (Second Edition), Blackwell Publishing.

30. Sîrbu, I., Benedek, A.M., 2004 - Ecologie practică. Editura UniversităŃii
"Lucian Blaga", Sibiu. (ediŃia a 2-a, 2009)

31. Sîrbu, I., 2009 - Ecologia comunităŃilor. Editura UniversităŃii "Lucian Blaga",
Sibiu.

32. Smith, R.L., 1986 - Elements of Ecology (second edition). Harper & Row,
Publishers, New-York.

33. Smith, R.L., 1990 - Ecology and Field Biology. Harper & Row, Publishers,
New York, Grand Rapids, Philadelphia, St. Louis, San Francisco, London,
Sydney, Tokyo.

34. Stugren, B., 1982 - Bazele ecologiei generale. Ed. Şt. şi Ped., Bucureşti.

35. Stugren, B., 1994 - Ecologie teoretică. Ed. Sarmis, Cluj-Napoca.

36. White, G.C., 2001 - Statistical Models: Keys to Understanding the Natural
World. Shenk, T.M., Franklin, A.B., (Editors) - Modeling in Natural Resource
Management. Development, Interpretation, and Application. Island Press,
Washington, Covelo, London: 35 - 56.