Sunteți pe pagina 1din 111

UNIVERSITATEA “LUCIAN BLAGA” DIN SIBIU

FACULTATEA DE ŞTIINłE
CATEDRA DE ECOLOGIE ŞI PROTECłIA MEDIULUI

Dr. Ioan SÎRBU

BAZELE MODELĂRII PROCESELOR ŞI


SISTEMELOR ECOLOGICE

Suport de curs şi aplicaŃii practice pentru studenŃii din anul III


Specializarea: Ecologie şi ProtecŃia Mediului

Sibiu
2008
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 2

CUPRINS

1. PRINCIPIILE ŞI ALGORITMUL MODELĂRII;


CATEGORII DE MODELE ECOLOGICE __________ 3

2. MODELE CONCEPTUALE __________ 16

3. TRECEREA DE LA MODELUL CONCEPTUAL


LA MODELUL CANTITATIV __________ 19

4. MODELARE STATISTICĂ PE CALCULATOR __________ 22

5. MODELARE ÎN MATHCAD __________ 42

6. ELEMENTE DE ANALIZĂ A SERIILOR DE TIMP __________ 57

7. MODELE RECURENTE APLICATE ÎN


ECOLOGIA POPULAłIEI __________ 74

8. MODELARE STATISTICĂ NELINIARĂ __________ 85

9. ACTIVITATE INDEPENDENTĂ; PROBLEME __________ 103

10. BIBLIOGRAFIE SELECTIVĂ _________ 110


I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 3

1. PRINCIPIILE ŞI ALGORITMUL MODELĂRII;


CATEGORII DE MODELE ECOLOGICE

Modelul este o reprezentare a unei entităŃi reale, a unui lucru, idei sau
condiŃii. Acestea pot fi foarte de simple, de exemplu o expresie verbală cu privire
la însuşirea unui subiect, sau două dreptunghiuri înzestrate cu o anumită
semnificaŃie, legate între ele printr-o săgeată care indică o relaŃie. Sau, modelele
pot fi oricât de complexe, de exemplu programe imense care rulează pe reŃele de
calculatoare interconectate, la care lucrează instituŃii cu sute de oameni, din cele
mai diverse specialităŃi. Procesul de modelare este un şir de etape, care trebuie
parcurse, pentru a converti o idee mai întâi într-un model conceptual şi apoi într-o
reprezentare cantitativă.
Modelarea ecologică este încadrată variabil, undeva între o simplă şi
frecvent ignorată metodă a ecologiei, şi (polul opus) un domeniu de vârf care
necesită specialişti “modelatori”, definindu-se astfel un domeniu distinct al
ecologiei. Probabil adevărul este undeva pe la mijloc. ToŃi ecologii practicieni,
cel puŃin la un anumit moment, pe parcursul unui studiu, trebuie să reprezinte
imaginativ ideile, elementele observate, datele investigaŃiei, relaŃiile dintre
acestea, să reprezinte grafic structura sau dinamica unui sistem etc. În toate aceste
activităŃi, reprezentările, conceptualizările, adesea formule şi ecuaŃii sunt
implicate în mod necesar.
Prin urmare modelarea este o procedură care însoŃeşte inevitabil orice
studiu. Modelarea nu înseamnă neapărat calcul, dar cel mai frecvent implică sau
se exprimă (şi) prin limbaj matematic.
Dar, sistemele experimentale sunt exemple foarte bune de modele
nematematice. Orice experiment, fie că se desfăşoară în laborator sau în teren,
este o imagine simplificată şi sintetică a realităŃii, dar nu se identifică cu realitatea
însăşi. Un experiment bine conceput şi implementat reflectă sau simulează un
proces care se desfăşoară în natură, fapt care este realizat în mod similar şi de
către un model bun. Ambele se bazează pe stabilirea cu acurateŃe a condiŃiilor de
lucru.
După cum scria W. Silvert (2001) este larg răspândit crezul, că numai
anumiŃi specialişti sunt “modelatori” buni, pentru aceasta cerându-se o mare
chemare pentru matematici şi deprinderi avansate de informatică, respectiv
operare şi programare a calculatorului. De fapt, modelarea este o activitate
universală; toŃi practicienii, uneori şi teoreticienii, creează şi testează modele de
cele mai diferite forme, idei şi expresii. Dacă excludeŃi modelul dintr-o cercetare
de ecologie, veŃi fi nişte simpli colecŃionari de fapte sau de date primare.
Modelele pot fi definite în mod grafic, informal (fără ecuaŃii: de
exemplu un mod alternativ, preliminar, este definirea verbală a modelului) sau
formal, prin expresiile matematice corespunzătoare şi programe asociate pe
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 4

calculator. Ilustrarea grafică a unui model se poate realiza printr-o diagramă


conceptuală (de exemplu circulaŃia energiei printr-un nivel trofic, circuitul apei
sau al unui element oarecare în natură etc.). Pentru amănunte legate de
modalităŃile de reprezentare grafică în ecologie, a se revedea Sîrbu şi Benedek
(2004; capitolul V).

♦ ALGORITMUL MODELĂRII

Abordarea clasică, obişnuită în procesul de modelare, începe cu


caracterizarea şi definirea procesului sau a sistemului, avansarea unor ipoteze
despre structură şi funcŃii, traducerea acestora într-un sistem formal (de exemplu
prin ecuaŃii) şi transpunerea pe calculator, într-un program accesibil. Urmează
verificarea potrivirii dintre datele reale şi cele avansate de model, şi recalibrarea
modelului pentru a reduce posibilele nepotriviri dintre valorile experimentale şi
cele aşteptate.
Câteodată acest algoritm este posibil şi eficient, însă nu întotdeauna, atât
din motive obiective (legate de specificul sistemului ecologic analizat), cât şi
subiective (pregătirea cercetătorului, disponibilul tehnic şi informaŃional etc.). De
multe ori pornim de la datele personale sau cele obŃinute de un alt cercetător şi
construim singuri ecuaŃiile modelului. Alteori este recomandat să pornim de la
anumite ecuaŃii prestabilite de alŃii şi să utilizăm datele experimentale pentru
calcularea de parametri sintetici sau derivaŃi. Dar, din ce în ce mai des modelarea
nu mai implică lucrul cu ecuaŃii, sau cel puŃin nu presupune că cercetătorul este
obligat să definească singur, în termeni matematici, problema investigată. O
variantă este să lase calculatorul să se descurce cu ceea ce modelatorul cunoaşte
numai conceptual sau informal, utilizând programe care permit un oarecare grad
de independenŃă. Procesul de modelare nu are o singură reŃetă şi nu se poate
reduce la un singur algoritm; totul se adaptează la scopul şi obiectivele cercetării,
la categoria de studiu în derulare, tipul, calitatea şi cantitatea datelor. De aceea
mai jos redau mai degrabă un ghid, în sensul unei serii de indicaŃii, şi nu o
colecŃie de reguli cu rol de rigidizare.

Algoritmul modelării începe ca oricare alt subiect de cercetare cu


definirea problemei, etapă crucială a oricărei teme. Definirea scopului, a
obiectivelor, respectiv a ceea ce vrem să obŃinem de la modelul pe care îl
construim, trebuie să fie delimitat în termeni de subsisteme, timp şi spaŃiu,
precum şi adaptat la acele informaŃii pe care suntem în stare să le obŃinem.
În acest proces primul răspuns pe care îl căutăm este cel la întrebarea: “în
care scop construim acest model”? Acesta ne ajută să înŃelegem motivul
demersului nostru, putem stabili liniile de elaborare a etapelor şi ne imaginăm la
ce va ajuta în final unealta construită. Dacă nu ştim ce vrem de la modelul pe
care dorim să-l realizăm, foarte probabil nu vom obŃine nici un model. Să nu
uităm principii ale cercetării care au implicaŃie directă şi în acest domeniu, dintre
care amintim:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 5

- Nu tot ce poate fi modelat, merită să fie modelat!


- Consideră şi evaluează numai acele variabile şi date care răspund la
întrebările puse!
Evaluarea complexităŃii pe care dorim să o adoptăm este o altă problemă.
Adesea se consideră că un model este cu atât mai bun, cu cât este mai complex,
respectiv include multe variabile, ecuaŃii şi subsisteme (dacă se poate toate cu
putinŃă de decelat sau imaginat). Această abordare este extrem de populară mai
ales printre partizanii holismului, sau cei care văd ecologia mai ales prin
perspectiva ansamblului proprietăŃilor emergente ale sistemelor. ConcepŃia
holistă este numai una dintre cele posibile şi nu neapărat cea mai adecvată
problemei particulare supuse studiului. Pe de o parte, definirea gradului de
complexitate depinde de tipul de sistem sau proces; nu orice obiect al cercetării
implică sau suportă abordări holiste. Pe de altă parte, abordarea reducŃionistă este
cel puŃin la fel de importantă în ecologie; sistemul se descrie şi explică şi prin
cunoaşterea structurii şi a funcŃiilor subsistemelor constituente. Ambele puncte de
vedere sunt la fel de importante, se completează şi nu pot fi substituite reciproc.
În sfârşit, nu este deloc obligatorie modelarea unui întreg sistem sau un proces
amplu, cum nu este implicită selectarea tuturor factorilor: ecologul poate evalua,
de exemplu, o singură variabilă dependentă (dinamica temporală a abundenŃei
unei populaŃii, diluarea unui poluant, producŃia unei fitocenoze etc.) în relaŃie cu
un număr limitat de variabile independente semnificative (salinitatea solului,
distanŃa faŃă de sursa de poluare, concentraŃiile de azotaŃi şi fosfaŃi din sol etc.).
În nici un caz să nu se considere că scopul modelării este înglobarea tuturor
variabilelor şi factorilor, pentru a se simula şi explica funcŃionarea unui întreg
ecosistem, aşa cum cred prea mulŃi diletanŃi.
Argumentul practic împotriva unei complexităŃi prea mari este centrat în
creşterea potenŃialului de eroare. Fiecare model include o eroare potenŃială
(adesea cunoscută, sau cel puŃin estimată) pe care ori de câte ori este posibil o
menŃinem la un nivel tolerat. Cu cât sunt mai multe ecuaŃii care aproximează
procesele evaluate, cu atât eroarea creşte. Complexitatea este direct corelată cu
gradul de nedeterminare, dificultatea simulării, şi adesea este invers corelată cu
relevarea semnificaŃiei şi a potenŃialului de verificare a rezultatelor. Jørgensen
(1988, 2001) sugerează includerea în model exclusiv a factorilor, variabilelor şi
parametrilor care au o influenŃă majoră sau chiar determinantă asupra subiectului
de interes. Complexitatea depinde şi de cantitatea şi calitatea informaŃiei care este
disponibilă.
Niciodată creşterea complexităŃii modelului, a numărului de ecuaŃii sau a
programului pe calculator, nu trebuie să fie un scop în sine. Celebre sunt, în acest
sens, legea lui D.B. Lee (1973): “calculatoare mai mari, suportă greşeli mai mari”
(modele mai complexe produc erori mai elevate) precum şi comentariul aferent al
lui Silvert (2001): “s-au cheltuit în decursul timpului milioane de dolari, pentru a
se demonstra valabilitatea legii lui Lee”.
Prin urmare selectarea complexităŃii depinde de tipul problemei, a sistemului
sau procesului supus analizei, şi a datelor disponibile.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 6

Scara la care definim modelul, poate fi oricât de mică sau de mare; nu există
scări “bune”, “adevărate”, respectiv nici “false” sau “contraindicate” la modul
absolut. Dar este sigur că un subiect particular se pretează mai bine la analiza sub o
anumită scară şi prea puŃin la o alta. Nu există nici o relaŃie între scara spaŃială şi
complexitatea modelului (W. Silvert, 2001).
Conceptualizarea este etapa în care transpunem problema particulară într-o
imagine sau idee de ansamblu, cum ar fi de exemplu sub forma unei diagrame,
care conŃine informaŃii despre parametri şi despre relaŃiile dintre aceştia
(matematice sau de altă natură). Transpunerea grafică a ideilor, a etapelor şi
vizualizarea relaŃiilor între diferitele categorii de variabile, formează modelul
conceptual. Prin adăugarea de valori, evaluări cantitative ale proceselor şi
elaborarea de ecuaŃii, obŃinem modelul cantitativ.
Construirea modelului se referă la alcătuirea acestuia, în termeni de idei,
concepte, expresii fizice, ecuaŃii matematice, respectiv programe pe calculator.
Modelele se pot construi în două feluri: de la bază la vârf sau invers.
Modelul bază - vârf se realizează prin asamblarea de submodele, respectiv de cât
mai multe elemente sau procese care se desfăşoară într-un sistem. Acestea tind să
fie foarte complicate, deoarece teoretic totul poate fi inclus; se consideră a fi bune
pentru înŃelegerea funcŃionării sistemului, dar nu dau rezultate prea bune pentru
scopul pentru au fost create (W. Silvert, 2001). Modelele vârf - bază pleacă de la
funcŃii generale, de la comportamentul întregului sistem sau de la proprietăŃile
emergente. Cele mai multe sunt de tip statistic. Acestea sunt modele empirice, se
bazează pe date experimentale, nu presupun obligatoriu considerarea
mecanismelor subiacente, iar ca domeniu de valabilitate sunt adesea restricŃionate
la subiectul particular analizat.
Atunci când rezultatele obŃinute prin model nu verifică datele
experimentale, sau - şi mai rău - când prognozele nu se adeveresc nici pe departe,
cel mai adesea este blamat modelul, dar aceasta nu este singura cauză posibilă.
Sunt trei posibilităŃi de fapt: model eronat, date experimental- observaŃionale
greşite sau ambele. Trebuie înŃeles faptul că datele obŃinute prin experimente sau
observaŃii sunt expuse unui şir de erori potenŃiale, ele fiind la rândul lor numai o
reprezentare a realităŃii şi nici pe departe realitatea însăşi. Într-o altă ordine de
idei, matematica poate fi perfectă, dar aparatul de măsură nu a fost calibrat, sau
eroarea sistematică diferă la cei care execută măsurătorile.
Dacă am ajuns la etapa implementării acestuia pe calculator, pasul care
urmează în mod logic este rularea modelului de cât mai multe ori, pentru a se
evalua construcŃia obŃinută. El se rulează cu o varietate de condiŃii modificate ale
parametrilor de intrare, în scopul urmăririi modului în care se comportă în situaŃii
cât mai diverse.
Validarea şi verificarea modelului se execută în secvenŃa următoare a
algoritmului. Evaluarea rezultatelor înseamnă validarea lor, adică corespondenŃa
cu valorile reale (observate sau experimentale, în cazul în care acestea există), dacă
sunt logice, posibile, îndeplinesc sau nu ceea ce ne-am putea aştepta de la modelul
realizat, precum şi dacă le-am interpretat corect. Dacă modelul nu trece de acest
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 7

examen, este necesară întoarcerea la o etapă anterioară a algoritmului, şi reluarea


procesului ori de câte ori este necesar. Există o deosebire certă între verificare şi
validare: primul termen semnifică testarea logicii interne a modelului, constând
mai ales dintr-o evaluare subiectivă a modului în care s-a alcătuit şi cum se
comportă acesta (uneori se vorbeşte în jargonul de specialitate şi de depanarea
modelului). Validarea se realizează prin compararea rezultatelor modelului cu
datele reale, care rezultă din analiza directă a sistemului analizat.
Un model bun (validat) va fi cel care oferă rezultate care se potrivesc
cu fenomenele şi valorile proceselor reale, şi care au o logică ştiinŃifică.
Adesea se realizează şi analiza senzitivităŃii, care investighează cum s-ar
modifica concluziile dacă parametrii, datele iniŃiale şi/sau ecuaŃiile ar fi diferite.
Această analiză este utilizată pentru investigarea robusteŃii modelului, dar şi
pentru a ghida cercetarea viitoare, respectiv pentru a sesiza importanŃa diferitelor
elemente constituente ale modelului în ceea ce priveşte contribuŃia la rezultate.
Am amintit anterior două mituri false ale modelării: relaŃia dintre valoarea
modelului şi complexitatea acestuia, precum şi legătura inexistentă dintre scara
de raportare a sistemului sau procesului şi complexitate.
Un alt mit este cel al relaŃiei absolute între utilitate şi adevăr. Este bine de
ştiut că un model poate să nu fie absolut adevărat (deci valabil în toate condiŃiile)
şi totuşi să fie extrem de util. De exemplu, legile lui Newton au fost multă vreme
considerate infailibile, până în 1905, odată cu apariŃia teoriei lui Einstein, când au
fost contestate. Teoriile newtoniene sunt astăzi cunoscute ca fiind valabile numai
pentru obiecte care se mişcă încet şi cu energie redusă, dar sunt în continuare mai
mult utilizate în viaŃa practică decât teoriile lui Einstein.
În schema algoritmului de modelare (Fig. 1.1) am ales numai etapele
principale care se referă la categorii de modele ce implică şi formule, respectiv
care pot fi transpuse pe calculator. Este evident că alte categorii (modelele
grafice, multe modele statistice care presupun operarea cu ajutorul unui program
prestabilit etc.) nu includ în mod obligatoriu unele etape ale acestui algoritm, iar
altele necesită secvenŃe suplimentare, inclusiv ramificaŃii condiŃionate de
rezultatele intermediare (de exemplu la modelele stochastice). Dar unele etape,
cum ar fi: definirea problemei, crearea imaginii acesteia, evaluarea calităŃii
datelor existente, verificarea modelului şi validarea rezultatelor fac parte din
aproape toate procesele de modelare.
Modelarea este un proces iterativ. Dacă un model a fost validat, nu
înseamnă că va fi abandonat. Date noi, idei, includerea altor variabile, redeschid
de fiecare dată problema dezvoltării şi conduc la modificarea perpetuă şi evoluŃia
oricărui model. Un model mai bun înseamnă o simulare mai realistă, prognoze
mai bune, acurateŃe sporită a rezultatelor, uneori includerea mai multor detalii şi
tendinŃa spre o cât mai bună apropiere de fenomenele naturale. Jørgensen (1988)
susŃine însă că pentru un interval dat de timp, resursele limitate vor opri mai
devreme sau mai târziu evoluŃia oricărui model.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 8

Definirea problemei

Selectarea complexităŃii

Ipoteze

Diagrama conceptuală

Model cantitativ

Prognoze

Rulare şi verificare

Validare

Analiza de senzitivitate

Valorificare

Fig.1.1. Algoritmul simplificat al procedurii de modelare

O caracteristică a modelării este aceea că nu există ceea ce se numeşte un


model universal (deci cu valoare generală pentru o categorie de sisteme sau
procese ecologice). Chiar dacă apar în literatura de specialitate expresii ca:
“modelul populaŃiei” sau “al lacului” etc., aceasta nu înseamnă că există un
singur model, reprezentativ sau ideal, la care se raportează sistemele particulare
studiate sau o categorie definitorie. Printr-o categorie de model vom înŃelege
aspectul central al abordării metodologice (de exemplu modelul matricial se
referă la faptul că abordarea se face prin algebră matricială; modelul diferenŃial
nu implică o anumită ecuaŃie ci o abordare cu un anumit specific matematic a
fenomenelor care sunt monitorizate în timp continuu etc.).
Modelele trebuie să fie folositoare, adică să fie prea rar un scop în sine.
Ele sunt construite pentru a testa, verifica, simula sau prognoza, respectiv pentru
a ne ajuta să înŃelegem mai bine modul în care funcŃionează sistemele, şi se
desfăşoară procesele ecologice. Modelarea nu este pasul final al unui program
experimental, ci este o parte integrată în munca de cercetare.
Valorificarea modelului îmbracă numeroase aspecte, similare cu cele care
decurg din utilizarea rezultatelor cercetării. Unele modele sunt construite ca
aparat ştiinŃific, ne ajută să înŃelegem şi să explicăm, iar valorificarea poate
însemna publicarea şi popularizarea rezultatelor. Altele sunt dezvoltate ca unelte
de management, iar valorificarea va consta în implementarea rezultatului în
lumea reală, în scop protectiv, ameliorativ sau economic.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 9

Prezentarea rezultatelor nu este deloc o etapă de neglijat în complexul


finalizării unui studiu. Un model nu este folositor dacă rezultatele sunt ascunse,
ignorate sau sunt de neînŃeles. Ceea ce am obŃinut trebuie făcut cunoscut şi altora.

♦ Ce software utilizăm?

Este întrebarea care apare mai devreme sau mai târziu în orice studiu cu
pretenŃii, precum şi în dinamica dezvoltării capacităŃilor cercetătorului. Este bine
să subliniem, că nu există şi nu poate exista un singur răspuns la aceasta,
deoarece sunt cel puŃin două categorii de motivaŃii: de ordin subiectiv şi obiectiv.
Cele subiective sunt legate de reguli ale cercetării ecologice, care afirmă: “cel
mai bun software este cel pe care îl cunoşti”, apoi “cea mai bună tehnică de
calcul este cea la care ai acces nelimitat”, precum şi “pentru un ecolog, a opera
este preferabil intenŃiei de a programa un calculator” (Sîrbu şi Benedek, 2004).
Este evident că un limbaj sau program pe care nimeni din echipă nu-l ştie, nu are
nici o şansă să rezolve problema indiferent cât este de nou. Snobismul modei
dezvoltării neîncetate a calculatorului personal, veşnica vânare a unui echipament
mai performant, programe mai diverse şi mai noi, a avea permanent ultima placă
video etc., sunt fără îndoială utile unui informatician sau unui exeget al jocurilor,
dar sunt prea puŃin potrivite unui ecolog practicant. Pe lângă confuzia între scop
şi mijloace, implică şi pierdere de timp şi alocarea nejustificată a resurselor. Mult
mai folositoare este alocarea de timp pentru cunoaşterea aprofundată a modului
de utilizare corectă a acelor programe, care într-adevăr ne ajută să progresăm în
cercetare şi în folosirea rezultatelor.
Apelarea la un informatician sau (în funcŃie de natura problemei) un
matematician poate da uneori rezultate, dar atenŃie la bariera de comunicare şi de
reprezentare a intenŃiilor. Includerea unui specialist din alt domeniu este benefică
pentru echipă, numai dacă există dorinŃa de comunicare bidirecŃională şi
traducerea tuturor etapelor în entităŃi cu semnificaŃie similară pentru ambele părŃi.
Un alt element care trebuie Ńinut sub control, este faptul că înŃelegem prea puŃin
despre oamenii implicaŃi în alte specialităŃi. Orice biolog sau ecolog ar trebui să
ştie ce înseamnă specializare în cadrul domeniului (deşi ecologii, mai ales
teoreticienii holişti, tind uneori să uite spre paguba lor aceasta), dar consideră alte
discipline ca fiind omogene. Şi matematicienii, respectiv informaticienii, sunt
specializaŃi, ceea ce nu înseamnă că ştiu neapărat multe despre puŃin, ci faptul că
ştiu mult mai mult despre unele lucruri şi semnificativ mai puŃin despre oricare
altele. Este o mare deosebire între calitatea/cantitatea informaŃiilor pe care o
persoană le deŃine şi potenŃialul acesteia de a selecta informaŃia relevantă într-un
anumit context (marea problemă a celor care predau la alte specialităŃi: de
exemplu matematicienii la ecologie).
De aceea pentru un program de cercetare includerea într-o echipă de
biologi (ecologi) a unui oarecare “matematician” este la fel de inutilă, precum
includerea în structura unei instituŃii ştiinŃifice a unui “biolog”, sau într-un
institut de cercetare a unui “specialist în bentos”. ExcepŃia o constituie acele
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 10

instituŃii (nu neapărat cu pretenŃii ştiinŃifice) care antrenează dialogul dintre


domenii, în care intervine individul de altă specialitate în buna desfăşurare a
activităŃii generale. Astfel, de exemplu specialistul în bentos poate tria probele pe
grupe sistematice supraspecifice (eventual urmate de expedierea materialului la
diferiŃii specialişti sistematicieni), matematicianul poate realiza prelucrarea
statistică şi reprezentarea grafică a datelor experimentale ale biologilor, iar
specialistul în calculator poate tasta revista instituŃiei şi cărŃile şefului.
Există şi argumente obiective pe care le avem în vedere atunci când
selectăm software-ul. Când suntem puşi în situaŃia de a alege, ne confruntăm cu o
plajă mărginită de două extreme. Astfel, pe de o parte există limbaje de
programare generală (de tipul C ++, Visual Basic, Pascal etc.) care permit
individului un control complet asupra procesului de modelare, dar care reclamă
cunoştinŃe apreciabilă de informatică şi matematică. La cealaltă extremă sunt
programele grafice de tipul STELLA, Simulink sau ModelMaker care permit
utilizatorului să selecteze din meniuri şi galerii de icoane elementele necesare
construirii modelului, lăsând calculatorul să se ocupe de toate detaliile. La acestea
dezavantajele sunt legate de limitarea potenŃialului de modelare, a opŃiunilor
utilizatorului, lipsa de elasticitate a procesului şi constrângerea la ceea ce este
deja preprogramat. Calea de mijloc (pe care de altfel o adoptăm în acest material)
o constituie sistemele de programe care includ funcŃii şi proceduri (inclusiv
grafice) care permit evitarea multor detalii de ordin informatic şi matematic, dar
care lasă o gamă largă de posibilităŃi alternative cercetătorului. Printre variantele
de acest gen, flexibile şi facil de studiat, amintim sistemele de programe de tipul
Systat (pentru modelare statistică) şi Mathcad pentru o serie largă de categorii de
modele, în care vom lucra cu precădere.

♦ CLASIFICAREA CATEGORIILOR DE MODELE

Modelele pot fi clasificate în funcŃie de abordare, alcătuire, scop şi tipul


rezultatelor obŃinute.
După natura funcŃiei pentru care au fost create, distingem modele cu scop
ştiinŃific şi cele cu rol de management.
Dacă rezultatele modelului depind de factori aleatori sau probabilistici,
vorbim de modele stochastice, iar dacă rezultatele depind numai de valorile
iniŃiale introduse, atunci ele sunt modele deterministe.
Modelele care includ detalii relevante asupra componentelor, sunt
denumite reducŃioniste, pe când cele care lucrează cu însuşirile emergente ale
sistemelor, la nivelul întregului, se numesc modele holiste.
Dacă variabilele care definesc sistemul nu sunt dependente de timp vorbim
de modele statice, iar dacă este analizată modificarea variabilelor în timp
(eventual şi/sau în spaŃiu), vorbim de modele dinamice. Modificarea timpului se
poate urmări printr-un şir discret de valori, caz în care vom utiliza cel mai
frecvent ecuaŃii recurente (modele discrete), sau vom monitoriza dinamica unui
fenomen în timp continuu, ecuaŃiile utilizate fiind de tip diferenŃial. Ultimele
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 11

urmăresc transformarea permanentă, continuă, a sistemului în timp, pe când cele


discrete compară starea sistemului sau valoarea procesului la un anumit moment
cu valorile înregistrate într-un număr de diviziuni anterioare.
Analiza transformării structurii sau a valorii funcŃiilor în timp, semnifică
trasarea traiectoriei sistemului. Aceste traiectorii se pot modela prin ecuaŃii, ele
pot fi deterministe sau stochastice, existând prin urmare o gamă largă de categorii
de abordări. Unele sisteme tind către un nivel staŃionar (“steady-state”), dacă
acesta nu se modifică într-un interval de timp considerat, dar aceasta nu implică o
stare (sau traiectorie) de echilibru. În starea staŃionară toate ratele proceselor sau
cele ale funcŃiilor particulare sunt constante, spre deosebire de starea de
echilibru în care acestea sunt egale cu zero.
Alte sisteme dinamice nu au nivel staŃionar, dar pot dezvolta cicluri limită
(se vor studia în semestrul 3).
Nu în ultimul rând, un model dinamic poate conŃine variabile care se
modifică atât în timp cât şi în spaŃiu, eventual şi după alŃi gradienŃi (altitudine,
salinitate, umiditate etc.), caz în care vorbim despre modele distributive, care
sunt definite frecvent prin ecuaŃii diferenŃiale parŃiale. Analiza dinamicii
temporale nu trebuie neapărat realizată prin ecuaŃii deterministe. De exemplu,
există posibilitatea descrierii şi caracterizării dinamicii fenomenelor prin analiza
seriilor de timp, domeniu al statisticii matematice.
Modelele integrate urmăresc dinamica proceselor sau a sistemelor pe o
perioadă mai lungă (de exemplu un an sau un deceniu), iar variabilele sunt
reprezentate prin valori medii pe intervale finite de timp. Ele sunt utilizate în
special la construirea de modele energetice şi ale bugetului trofic, cele climatice,
de productivitate şi altele, care se caracterizează adesea printr-o scară mare de
raportare.
Dacă procesul se poate descrie sub forma unei ecuaŃii de gradul I, modelele
se numesc liniare, iar dacă cel puŃin o relaŃie nu este în formă de dreaptă, definim
modele neliniare.
Modelele pot fi cauzale (sau de tip cutie albă) dacă datele de intrare,
stările sistemului şi rezultatele sunt relaŃionate prin legături de tip cauză - efect,
sau pot fi modele de tip cutie neagră (necauzale) dacă se iau în considerare
numai datele de intrare şi cele de ieşire, fără a fi analizat mecanismul intim al
sistemului.
Utilizând criteriul naturii componentelor definite ca variabile de stare,
putem alcătui o altă clasificare. Astfel, dacă sistemul este descris în termeni de
număr de indivizi conspecifici, modelul este de tip populaŃional (câteodată se
utilizează şi cuvântul biodemografic). Un model care descrie şi caracterizează
comunitatea sau ecosistemul va fi definite ca atare (modele cenotice sau
ecosistemice), referitor la nivelul de organizare inclus în analiză, un model al
fluxului energetic este considerat bioenergetic, iar dacă se referă la circulaŃia
elementelor sau substanŃelor în natură, definim modele biogeochimice.
Modele bazate pe indivizi (MBI) implică o abordare diferită de cele
expuse anterior. Acestea urmăresc dezvoltarea sau funcŃionarea sistemului prin
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 12

analiza comportamentului indivizilor constituenŃi, şi nu prin acordarea unor


valori medii, care exprimă contribuŃia tuturor, aşa cum o fac cele mai multe
categorii. Se realizează simulări, care evaluează consecinŃele la nivelul întregului
sistem a interacŃiunilor locale ale elementelor constituente (după C. Reynolds).
Elementele pot fi indivizi biologici (plante, animale), dar şi autovehicule în trafic,
populaŃii sau specii care interacŃionează etc. Sunt tehnici de modelare care
necesită mult calcul matematic, se realizează exclusiv pe calculator şi se bazează
pe teoria automatelor celulare. Asemenea modele sunt alcătuite din mediul în
care se desfăşoară interacŃiunea, un număr oarecare de indivizi în sens larg (nu în
mod necesar biologici), care la rândul lor sunt definiŃi în termeni de
comportament (reguli procedurale) şi parametri caracteristici. Însuşirile şi
efectele acŃiunilor fiecărui individ sunt urmărite în timp. Unele MBI sunt explicit
spaŃiale, în sensul că indivizii sunt asociaŃi cu locaŃii şi deplasări în spaŃiul
geometric. Alte modele sunt pur funcŃionale sau reflectă efectul interacŃiunilor
între grupuri de elemente definite după anumite criterii.
Automatele celulare sunt sisteme dinamice în care spaŃiul, timpul şi
variabilele de stare ale sistemului sunt discrete. Fiecare celulă a unei matrici sau a
unei reŃele rectangulare, îşi modifică starea în timp după o anumită regulă, care
este locală şi deterministă (după Gutowitz şi Langton).
Modelele tratează rar, asemenea categoriei precedente, elementele
constituente ale sistemului ca fiind individuale, în ceea ce priveşte aportul
manifestării lor la explicarea funcŃiilor întregului. De cele mai multe ori sistemele
sunt considerate ansambluri de grupe de elemente, caracterizate printr-un grad de
organizare (populaŃii, niveluri trofice, categorii funcŃionale etc.). Această grupare,
după diferite criterii, defineşte modelele de tip agregativ. Ele pot fi de tip
sistematic (grupare pe specii, genuri, familii etc.), structural (sex, vârstă, structură
genetică etc.), funcŃional (trofice, categorii de folosinŃe etc.).
Modelele spaŃiale sunt cele care includ distribuŃia, agregarea şi mişcarea
în spaŃiu a sistemelor supraindividuale.
Modelarea orientată pe obiecte implică grupe de submodele (obiecte)
care au un grad relativ de autonomie, în sensul că pot fi descrise o singură dată, şi
apoi asamblate în modele mai complexe în funcŃie de necesităŃi. De exemplu,
modelul creşterii logistice a unei populaŃii poate fi definit o singură dată sub
forma unei rutine scrise într-un program oarecare, după care aceasta este chemată
în oricare model superior care implică date despre dinamica numerică a unor
populaŃii particulare. Datele şi condiŃiile de intrare pot fi diferite, dar mecanismul
de creştere logistică este acelaşi. Cele mai multe programe şi limbaje moderne
suportă acest tip de modelare, care este din ce în ce mai utilizat.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 13

Tab. 1. Clasificarea principalelor categorii de modele aplicate în ecologie


(modificat după Jørgensen, 1988; W. Silvert, 2001)

Categoria de modele Caracteristici


ŞtiinŃifice - scopul este legat de explicare şi cunoaştere
Management - scop de gestiune şi control a unui proces sau
sistem
Formale - (de obicei) exprimate prin ecuaŃii matematice
Informale - nu sunt exprimate prin ecuaŃii
Deterministe - depind numai de datele de intrare
Stochastice - rezultatele depind de distribuŃii probabilistice
sau de factori aleatori
ReducŃioniste - includ cât mai multe detalii şi subsisteme
Holiste - utilizează principii şi funcŃii generale,
emergente ale sistemului ca întreg
Statice - independente de timp
Dinamice - variabilele sunt funcŃii de timp, eventual şi
spaŃiu sau alŃi parametri independenŃi care
variază
Dinamice în timp - urmăresc procesul fără întrerupere în timp,
continuu fiind modelate cel mai adesea prin ecuaŃii
diferenŃiale
Dinamic în timp discret - sistemul se studiază la anumite momente de
timp, care alcătuiesc un şir discret; ecuaŃiile
utilizate de obicei fiind de tip recurent.
Dinamice distributive - definite prin modificarea graduală a mai
multor variabile, adesea independente,
exprimate prin ecuaŃii diferenŃiale parŃiale
Dinamice integrate - definite la scară temporală lungă, exprimate
prin valori medii ale variabilelor de stare şi
proces
Liniare - sunt considerate ecuaŃii de gradul I
Neliniare - ecuaŃii de grad superior sau funcŃii neliniare
Cauzale (cutie albă) - datele de intrare şi rezultatele sunt conectate
prin relaŃii de tip cauză - efect
Necauzale (cutie - sunt comparate intrările cu ieşirile, fără
neagră) analiza mecanismului intim cauzal
PopulaŃionale Modele care descriu structura şi/sau
SuprapopulaŃionale funcŃionarea sistemelor supraindividuale la
(Cenotice) diferite niveluri de organizare (populaŃie,
Ecosistemice (Holiste) comunitate sau asociaŃie, biocenoză,
Modele ale ecosistem, biom, biosferă respectiv ecosferă
bio(eco)sferei etc., supra- şi subdiviziuni ale acestora).
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 14

Bioenergetic - descriu şi caracterizează fluxul energetic


Biogeochimic - circuitul materiei sau cicluri ale unor
elemente şi substanŃe în natură
Modele bazate pe - analizează comportamentele elementelor
indivizi constituente ca bază explicativă pentru
funcŃionarea întregului;
(MBI) - grupează elementele constituente după
Agregative anumite criterii.

În tabelul 1 sunt redate sintetic principalele categorii de modele, grupate


după diferitele criterii şi caracterizate sumar, în scopul alcătuirii unei imagini de
ansamblu asupra problematicii clasificării. În literatura de specialitate există o
sumedenie de alte clase de modele, multe fiind de amănunt, cum ar fi de exemplu
după tipul de ecuaŃie matematică utilizată sau după modul de aplicare în variatele
folosinŃe economice, acestea fiind derivate şi nu au relevanŃă pentru obiectivele
acestui material.
Există şi alte categorii de modele, care nu se pot prezenta sub formă
dichotomică sau prin comparaŃie, în mod special cele care s-au dezvoltat cu
precădere în ultimele decenii. Dintre acestea amintim: modelele spaŃiale, modele
fractale, cele bazate pe metode tip Monte-Carlo, modele de optimizare, cele
bazate pe teoria jocurilor, pe teoria haosului sau a catastrofei, şi altele.

ELEMENTELE MODELELOR

În formulare matematică un model ecologic este alcătuit din 5


elemente sau componente (după Jorgensen şi Bendoricchio, 2001).

1. Variabile şi funcŃii externe

Sunt forŃe externe (factori ai mediului, variabile independente etc.),


care nu aparŃin sistemului sau procesului ecologic analizat, dar care
influenŃează starea şi dinamica acestuia. Se studiază influenŃa acestora
asupra oricărui aspect (structură, funcŃii, dinamică) al subiectului investigat.
ForŃele externe supuse modificărilor antropogene se mai numesc şi "funcŃii
de control" (de exemplu poluanŃi, nutrienŃi, deversări de ape reziduale etc.).
Multe altele nu sunt supuse controlului nostru (variabile climatice, radiaŃii
cosmice etc.).

2. Variabile de stare

Sunt mărimi care descriu sistemul sau procesul, relevând structura şi


funcŃiile acestuia. Selectarea lor este extrem de importantă pentru
acurateŃea modelului.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 15

3. EcuaŃii matematice

Sunt utilizate pentru reprezentarea proceselor, respectiv a modificării


în timp şi spaŃiu ale structurii şi funcŃiilor sistemelor ecologice. Ele descriu
relaŃiile dintre funcŃiile externe şi variabilele de stare. Acelaşi tip de proces
poate fi identificat în contexte diferite, motiv pentru care frecvent există
posibilitatea utilizării aceleiaşi ecuaŃii în modele diferite. Alteori detalii sau
relaŃii diferite reclamă utilizarea unor ecuaŃii alternative. Descrierea şi
formularea matematică a proceselor definesc submodelele.

4. Parametri

Sunt coeficienŃi utilizaŃi în reprezentarea matematică a proceselor. Ei


asigură legătura dintre ecuaŃiile modelului şi datele reale. Uneori pot fi
consideraŃi constante pentru anumite părŃi ale sistemului ecologic. Alteori
sunt redaŃi printr-un domeniu de variaŃie, a unei amplitudini, şir de
probabilităŃi, sau sunt deduşi din ecuaŃii empirice construite pe baza datelor
reale.

5. Constante universale

Sunt valori deduse din legi ale naturii, fixe, imuabile, care apar adesea
şi în multe modele ecologice. Amintim aici numărul π, e (baza logaritmului
natural, numărul lui Euler), constanta lui Avogadro, constanta solară,
masele atomice ale elementelor chimice etc.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 16

2. MODELE CONCEPTUALE

Procesul de conceptualizare, trecerea de la o idee la expresia imaginativă a


acesteia, este un pas esenŃial într-o cercetare, motiv pentru care îi vom acorda o
atenŃie suplimentară.
Construirea modelelor conceptuale este o parte integrantă a oricărui studiu.
Acestea sunt de obicei scheme sau diagrame, de exemplu formate din blocuri
(care reprezintă etape, sarcini, comenzi, întrebări, declaraŃii etc.) legate prin
săgeŃi (care indică relaŃiile dintre blocuri şi ordinea de parcurgere a etapelor). În
blocuri sunt incluse şi variabilele de stare, care descriu condiŃiile în care se află
compartimentele sistemului ecologic analizat. Un bun model conceptual ajută
ecologul să formuleze ipoteze, să evalueze necesarul de date pentru verificarea
acestora, să dimensioneze studiul în timp şi spaŃiu.
Complexitatea modelelor creşte repede cu progresul unei cercetări, motiv
pentru care este necesar să ne concentrăm asupra întrebărilor la care dorim să
răspundem. Acesta este încă un motiv pentru a alcătui un bun model conceptual,
care ne va ajuta astfel să nu ne pierdem în amănunte insignifiante în context şi să
ne limităm la ceea ce este relevant.
Există mai multe categorii de modele conceptuale, dintre care enumerăm
pe cele mai importante:

a. Modele verbale
Semnifică descrierea verbală a structurii unui model, a componentelor şi
legăturilor dintre acestea. Se utilizează mai frecvent la procese simple.

b. Scheme şi desene
Foarte des folosite în toate domeniile ecologiei, atât ca metodă ştiinŃifică,
cât şi pentru expunere didactică sau popularizare. Există o mare varietate de
grafice, scheme, desene care includ o serie de detalii, reprezentări ale unor
structuri şi funcŃii particulare etc. În ştiinŃă desenul se utilizează pentru ilustrarea
sintetică a caracteristicilor realităŃii investigate, pentru a reliefa şi reprezenta
semnificaŃia datelor experimentale.

c. Diagrame în blocuri (tip cutie)


De obicei se realizează prin ansambluri de blocuri interconectate prin
săgeŃi. Fiecare bloc (sau cutie) are o formă geometrică oarecare definită printr-un
chenar, indicând tipul de informaŃie sau proces care se desfăşoară, în jurul unui
text sau simbol care va constitui o componentă a modelului, iar săgeŃile sau liniile
indică legăturile dintre acestea. În funcŃie de prezenŃa sau absenŃa factorilor
cauzali şi explicativi distingem:
- modele tip cutie neagră (sau blocuri negre)
În acestea se Ńine seama numai de intrări şi de ieşiri, adică de valorile de la
începutul procesului şi cele care rezultă în urma acestuia, fără să ne intereseze
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 17

cauzalitatea şi legătura dintre aceste două categorii. Se aplică mai ales la studii de
caz, la relaŃii de tip statistic, şi în general nu se pot extrapola la alte sisteme.
- modele tip cutie albă (blocuri albe)
Sunt modele constituite pe baza expresiei relaŃiilor cauzale între procesele
analizate. Între datele de intrare şi cele de ieşire sunt intercalate reguli, de tipul
ecuaŃiilor matematice. Odată definite şi validate, aceste relaŃii se pot aplica (cu
modificările de rigoare) şi la alte sisteme sau procese similare.
- modele tip cutie gri
În realitate sunt cele mai comun utilizate, constituind o combinaŃie a
categoriilor antemenŃionate. Acestea conŃin relaŃii cauzale, dar includ şi legături
empirice sau statistice pentru unele procese.
O variantă a modelelor cu blocuri, sunt cele de tip I/O adică intrare - ieşire
(Input / Output) care conŃin date suplimentare pentru fiecare cutie, la începerea şi
la finalul procesului particular analizat.
Indiferent de tipul modelului, formele geometrice ale blocurilor pot fi alese
astfel încât să mărească sugestivitatea procesului reprezentat. Se poate opta, de
exemplu, pentru forme utilizate în algoritmii de calculator, sau forme speciale,
cum sunt de exemplu, cele utilizate de P. Odum (1971) la descrierea structurii
energetice ale sistemelor ecologice (ilustrând prin diferite forme intrarea energiei,
transferul, pierderile, consumul etc.). În literatură există o mare varietate de
definiŃii şi posibilităŃi de reprezentare grafică.

d. Modelele matriciale
Indică prin algebră matricială legătura dintre elementele constituente ale
unui sistem. Cea mai simplă formă de expresie este indicarea unei legături, fără a
se preciza nici valoarea acesteia (intensitatea sau evaluarea cantitativă de orice
fel), şi nici direcŃionarea (cine asupra cui acŃionează). O variantă este simpla
construcŃie cu valori de tip 1 şi 0, unde 1 semnifică existenŃa relaŃiei iar 0 absenŃa
acesteia. În exemplul de mai jos considerăm 4 elemente (să presupunem că
acestea ar fi populaŃii ale unei comunităŃi) între care există (1) sau nu (0) relaŃii
de competiŃie:

A B C D
A 1
B 1 1
C 0 1 0
D 0 0 1 1

Aceasta este o matrice simetrică pătrată, valorile de 1 pe diagonala


principală indicând o relaŃie (competiŃie) intraspecifică. Astfel constatăm că
perechile de populaŃii între care există relaŃii competitive sunt: între A şi B, între
B şi C, precum şi între C şi D, singura în interiorul căreia nu am decelat
competiŃie intraspecifică, fiind populaŃia C. Reprezentarea acestei matrici, sub
forma unui model conceptual grafic, se poate face printr-un graf neorientat:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 18

B C

Un alt model poate ne indică cine asupra cui acŃionează, caz în care
matricea nu trebuie să fie simetrică, iar reprezentarea va fi de tipul unui graf
orientat. De exemplu, fie o comunitate în care valorile de 1 indică cine cu cine se
hrăneşte (cine prădează pe cine), Ńinând seama că rolurile se pot schimba, iar într-
un caz întâlnim şi fenomene de canibalism:
de la (prădează pe...):
A B C D
A 1 0 0 0
către: B 1 0 1 0
(este C 0 0 0 1
prădat) D 0 1 1 0

B C

În alte modele matriciale nu interesează numai existenŃa şi direcŃia


legăturii, ci şi valoarea acesteia, de exemplu probabilitatea de trecere dintr-o stare
în alta, procentul de materie care trece de la un compartiment la altul etc., caz în
care matricea poate fi reprezentată sub forma unui digraf numeric orientat
(similar cu cel expus mai sus, dar pe fiecare săgeată se scrie valoarea ponderii
legăturii sau orice evaluare cantitativă). Numeroase structuri şi procese ecologice
se pot defini şi reprezenta sub forma unor digrafuri numerice orientate, aceasta
fiind totodată o trecere de la modelul conceptual către unul cantitativ.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 19

3. TRECEREA DE LA MODELUL CONCEPTUAL LA


MODELUL CANTITATIV

Un model cantitativ este un set de expresii matematice şi valori ataşate


blocurilor şi săgeŃilor modelelor conceptuale. Cele mai multe categorii de modele
prezentate la clasificare, sunt totodată şi cantitative.
Să presupunem că dorim modelarea ratei de consum C a unui prădător
(variabila dependentă) ca funcŃie de disponibilitatea prăzii P (variabila
independentă). Putem decela cel puŃin trei ecuaŃii care corespund la tot atâtea
ipoteze (adaptat după L. J. Jackson şi col., 2000):

1.)C = a * P
b*P
2.)C =
1+ c*P
3.)C = d * P * e −f *P

Reprezentările grafice ale acestor modele sunt redate mai jos.

Modelul 1:

C( P )

Modelul 2:

C( P )

P
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 20

Modelul 3:

C( P )

În modelul 1. rata de consum creşte liniar cu disponibilitatea prăzii. La


tipul 2. consumul creşte la valori mici ale P, după care se saturează la valori mari
ale acesteia, iar în cel de-al treilea model C creşte la valori mici, dar descreşte la
valori mari ale lui P. Aceste trei modele sunt testate pe date reale, prin tehnici
care vor fi studiate la capitolul dedicat modelării statistice, iar coeficienŃii
implicaŃi (a, b, c, d, f) primesc valori, li se evaluează eroarea standard şi
semnificaŃia. De asemenea vom evalua coeficienŃi de determinare, care vor
sugera în ce măsură variaŃia variabilei dependente este explicată de către cea
independentă. Urmează validarea modelelor, adică vom evalua prin diferite
simulări şi teste, care dintre modele şi în ce condiŃii verifică cel mai bine şirul de
date reale (experimentale sau observate).
Prin urmare, evaluarea parametrilor semnifică identificarea valorilor pentru
acele constante care intervin în construcŃia ecuaŃiilor modelului cantitativ. Sursa
de informaŃie depinde de modul în care va fi folosit modelul. Uneori evaluarea
parametrilor constituie un scop în sine, caz în care modelul va fi rulat de multe
ori pe calculator, dându-se un număr oarecare de valori, sau chiar domenii în care
aceştia vor varia la întâmplare. Dacă modelul se referă la un sistem particular,
despre care avem deja date experimentale, acestea vor fi utilizate pentru a estima
parametri care vor fi unic definiŃi, procedeu caracteristic pentru modelele
statistice. Există însă şi posibilitatea de a nu dispune de date reale, caz în care
estimările lor se vor realiza printr-un proces iterativ, în cadrul căruia se va
compara permanent rezultatul rulării modelului cu cel care se constată prin
observarea sistemului, până când se ajunge la o relativă identitate (corespondenŃă
a rezultatelor). Acesta este un procedeu de calibrare a modelului, care se poate
realiza prin cercetare sistematică sau prin încercare şi eroare.
După ce am selectat cea mai “bună formă” a modelului (în sensul de
adecvată condiŃiilor studiate) vom putea avansa interpretări de ordin ecologic şi
trage concluzii pe baza acestora, fenomen care se numeşte detecŃie ecologică
(Hillborn şi Mangel, 1997, ap. J.J. Leland şi col., 2000).
În multe cazuri modelele empirice sunt restricŃionate la subiectul analizat,
deoarece se bazează pe datele disponibile din lumea reală şi pe construirea de
relaŃii între acestea. Alte modele predictive pot fi însă complexe, generalizabile,
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 21

incluzând descrieri formale cu valabilitate mai largă, relaŃii cauzale şi prognoze


bazate pe un număr mai mare de date şi variabile independente.
Dacă am hotărât că modelul cantitativ poate şi merită să fie formulat în
termeni de ecuaŃii, vom căuta cele mai bune categorii, modalităŃi de soluŃionare a
acestora şi vom evalua parametri pentru fiecare, înainte de a ne grăbi să le
transcriem într-un sistem de programe sau codifica într-un limbaj oarecare. Unele
ecuaŃii sunt construite de ecolog (în special în modelele statistice, precum şi în
multe tehnici deterministe), altele se aleg din literatura de specialitate,
cunoscându-se faptul că anumite modele cunoscute descriu cu o bună acurateŃe
procesul particular studiat. De exemplu, nu are foarte mult sens să inventăm noi
ecuaŃii pentru descrierea proceselor care se desfăşoară în fotosinteză, deoarece
deja există o sumedenie de modele validate, pe care le putem selecta în funcŃie de
datele disponibile şi scopul cercetării noastre. De asemenea, unii coeficienŃi care
apar în ecuaŃii trebuie evaluaŃi din datele proprii (de exemplu coeficienŃii de
corelaŃie, de regresie sau parametri statistici descriptivi), pe când alŃii sunt
constante universale (cum ar fi numărul lui Avogadro, numărul e sau π,
acceleraŃia gravitaŃională etc.).
Am amintit anterior că urmărirea desfăşurării fenomenelor în timp se poate
realiza prin cel puŃin trei categorii de tehnici: metode statistice de tipul analizei
seriilor de timp, ecuaŃii deterministe în timp discret (recurente) sau în timp
continuu (ecuaŃii diferenŃiale).
De exemplu, dacă o variabilă x are valoarea xt la momentul t şi xt+1 la
momentul (t+1), atunci o ecuaŃie recurentă care descrie un proces ce se urmăreşte
în intervale discrete de timp, poate avea forma generală:

xt+1 = f(xt)

unde: f este funcŃia care descrie variaŃia. De exemplu f(x)= 23.7 - 4.5*x
Dacă cunoaştem valoarea xt putem prognoza fără probleme şi corect valoarea lui
xt+1.
În timp continuu, un proces care se desfăşoară va avea ecuaŃia generală de
forma:

dx
= g( x)
dt

unde: dx/dt este rata modificării variabilei de stare, iar g este funcŃia care
descrie procesul care contribuie la această rată. Rezolvarea ecuaŃiilor şi a
sistemelor de ecuaŃii diferenŃiale, modelarea traiectoriei sistemelor ecologice şi
alte aplicaŃii ale acestora se vor studia într-un alt capitol, în semestrul 3.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 22

4. MODELARE STATISTICĂ PE CALCULATOR

În acest capitol vom descrie şi parcurge principalii paşi în utilizarea unui


sistem de programe, care ne ajută în analiza şi prelucrarea datelor ecologice,
precum şi în dezvoltarea modelelor statistice.
SYSTAT este un sistem de programe, conceput pentru analiza statistică a
datelor, cu largi aplicaŃii în toate domeniile. Cunoaşterea unui număr redus de
comenzi şi funcŃii este suficientă pentru construirea unui număr semnificativ de
modele cu diferite grade de complexitate. Sistemul de programe este conceput în
module, corespunzătoare în mare capitolelor sau subdiviziunilor statisticii.
Intrarea în program se face fie prin icoana vizibilă pe desk-top, fie din fişierul
care găzduieşte programul, căutându-se rutina Systat.com.
Comenzile şi funcŃiile se pot tasta în modulul de comandă sau accesa din
meniurile pop-up. În cazul în care se scriu explicit, fiecare comandă se scrie pe
câte o linie, la sfârşitul acesteia tastându-se Enter.

1. Editarea datelor

Modulul care permite editarea datelor se accesează prin comanda EDIT.


Între fereastra de editare şi cea de comandă se trece cu tasta Esc. Fiecare coloană
este considerată o variabilă care trebuie declarată la începutul lucrului, iar
fiecare rând este un articol (case) care are un număr curent implicit. Variabilele
pot fi de mai multe tipuri, în ecologie având importanŃă cele numerice şi
variabilele text. Odată definite, variabilele pot fi oricând redenumite, dar nu li se
mai poate schimba tipul. Deosebirea dintre declararea celor două tipuri este
semnul $ care încheie numele unei variabile de tip şir. Eticheta unei variabile
începe în mod obligatoriu cu o literă. De asemenea trebuie avut în vedere că
variabile diferite au în mod obligatoriu nume diferit.
Exemple de nume de variabile numerice:
V1, DENSITATE, X1, XX1, XXX1, XXX2, XXX3
Exemple de nume de variabile şir:
D$, D1$, D11$, XXX1$, NUME$, VARSTA$
Înregistrările într-o variabilă şir vor începe obligatoriu cu o literă.
Datele se înscriu în fereastra de editare numai după ce au fost declarate
variabilele în prima linie a viitorului tabel. În prima celulă (linia 1, coloana 1) se
ajunge oricând într-o sesiune de lucru prin tasta Home. Datele se introduc prin
importare (dintr-un alt fişier sau alt program) sau de la tastatură. Odată introdusă
o valoare într-o celulă, aceasta se părăseşte prin tasta Enter sau săgeată în jos.
Deosebirea este că în primul caz cursorul se deplasează spre dreapta (avantajos
când datele primare sunt introduse pe linii), în timp ce în al doilea caz datele se
înscriu obligatoriu pe coloane.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 23

Dacă se greşeşte la introducerea datelor, schimbarea unei înregistrări se


face prin simpla poziŃionare pe celula cu pricina, introducerea noii valori sau
înregistrări şi părăsirea celulei cu Enter sau Săgeată. Noua valoare va înlocui
automat pe cea precedentă. În mod similar dacă se doreşte schimbarea numelui
unei variabile, utilizatorul se poziŃionează pe etichetă, introduce noul nume şi
părăseşte celula.
În tabelul de date deplasarea se face ca într-o pagină de text: cu Page Up,
Page Down, Home (poziŃionare automată pe coloana 1, linia 1) sau End
(poziŃionare sub ultima linie introdusă şi prima coloană, utilă când datele se
introduc în mai multe sesiuni de lucru), sau oricare dintre săgeŃi.
Pentru a salva un fişier se părăseşte fereastra de editare şi se intră în cea de
comandă (prin tasta Esc) şi se tastează sau alege icoana corespunzătoare:
> SAVE nume-fişier
Dacă fişierul este actualizat în mai multe sesiuni, calculatorul vă întreabă
dacă sunteŃi sigur că vreŃi să înlocuiŃi vechea versiune (sau alte date înregistrate
în urmă) cu cea nouă. OpŃiunile care vă stau la dispoziŃie sunt de înlocuire (se
tastează Y pentru da/“yes”) sau (N pentru nu). Dacă aŃi tastat Y, vechiul fişier cu
acest nume va fi înlocuit cu cel activ în momentul lucrului.
Numărul de zecimale implicit pentru date (atât la introducere cât şi în
rezultate) este 3, fapt care se poate schimba prin comanda:
> FORMAT = nr. de zecimale dorit.
De exemplu dacă doriŃi să operaŃi cu numai o zecimală, veŃi tasta
> FORMAT = 1
De reŃinut că în SYSTAT puteŃi scrie deopotrivă cu majuscule sau
minuscule comenzile sau declaraŃiile de variabile.
OperaŃii şi transformări ale variabilelor se realizează din fereastra de
comenzi. Indiferent ce dorim să facă o variabilă, cuvântul cheie este LET. Cu
aceasta putem combina, aplica o funcŃie, transforma variabile, sau putem crea alte
variabile noi.
Pentru a vedea cum funcŃionează aceste comenzi, să considerăm un
exemplu. Un ecolog a analizat un număr de 40 probe, fiecare de câte 1 m2, la
malul unui lac. A identificat două specii de gastropode la limita între apă şi uscat,
şi anume Galba truncatula şi Physa acuta. În prima variantă cunoaşte numărul de
exemplare din fiecare pătrat. Baza de date este redată mai jos.
Cercetătorul intră în programul SYSTAT, deschide modulul de date (cu
comanda EDIT), declară variabilele în manieră codificată (fără să uite să-şi
noteze undeva codurile utilizate, inclusiv viitorul nume al fişierului, pentru a
putea accesa datele oricând), de exemplu GT pentru Galba truncatula şi PA
pentru Physa acuta. După declararea variabilelor utilizatorul tastează Home
pentru a se deplasa pe prima linie şi prima coloană (Case 1) începând
înregistrarea datelor.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 24

Tabelul 1. Systat EDIT


Case GT PA
1 0 6
2 0 7
3 12 5
4 145 23
5 23 0
6 0 0
7 0 1
8 0 14
9 0 12
10 58 14
11 0 85
12 0 26
13 0 23
14 58 25
15 0 14
16 12 12
17 0 8
18 12 5
19 56 0
20 8 0
21 4 5
22 56 15
23 52 21
24 84 37
25 57 19
26 51 36
27 85 18
28 26 12
29 24 29
30 12 24
31 23 31
32 0 15
33 0 21
34 0 0
35 25 63
36 84 23
37 61 21
38 186 25
39 245 12
40 368 2

După introducerea datelor, fişierul se salvează prin trecerea în modulul de


comandă (Esc) şi utilizarea comenzii:
> SAVE LAC
(presupunând că se doreşte salvarea fişierului sub numele de lac). Din
acest moment denumirea de lac este rezervată exclusiv pentru acest fişier.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 25

Dacă se revine asupra fişierului, încărcarea acestuia se face în modulul de


comandă cu cuvântul rezervat USE nume_fişier, adică:
> USE LAC
Dacă aŃi modificat fişierul nu uitaŃi să-l salvaŃi din nou.
Din diferite motive, cercetătorul poate vrea să aplice unele transformări sau
calcule pe datele brute din fişierul de mai sus. Cu ajutorul comenzii LET puteŃi
realiza multe calcule automate. De exemplu:
> LET MELCI = GT + PA
va introduce în fişier o nouă variabilă (MELCI) care conŃine suma valorilor
de densitate ale variabilelor GT şi PA.
> LET GT = LOG(GT)
va înlocui valorile originale ale variabilei GT cu valorile logaritmate în
bază naturală. Dacă, din orice motive, doriŃi baza 10 pentru logaritm, aplicaŃi
transformarea:
> LET GT = LOG(GT)/LOG(10)
Poate doriŃi să păstraŃi în fişier atât valorile variabilei originale cât şi cele
logaritmate, caz în care se utilizează un nume diferit pentru variabila transformată
(de exemplu GTLOG):
> LET GTLOG = LOG(GT)
Prin urmare forma generală a comenzii este:
>LET nume_variabilă = expresie matematică
Operatorii utilizaŃi sunt cei obişnuiŃi în informatică. Nu uitaŃi că virgula, în
numerele reale, se înlocuieşte cu punctul.

Operatori şi semnificaŃii
+ sumă
- diferenŃă
* înmulŃire
/ divizare
^ exponent
< mai mic decât
> mai mare decât
= egal
<> diferit de
<= mai mic sau egal decât
=> mai mare sau egal decât

FuncŃiile sunt alese prin cuvinte rezervate iar variabila se pune în


paranteze rotunde (ca în exemplul de mai sus).
Principalele funcŃii care ne stau la dispoziŃie sunt:
SQR rădăcină pătrată
LOG logaritm natural
EXP funcŃia exponenŃială
ABS valoare absolută
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 26

SIN sinus
COS cosinus
TAN tangent
Ori de câte ori uităm sintaxa unei expresii sau vreun nume rezervat, putem
cere ajutor, fie din meniul pop-up al versiunilor superioare, fie tastând HELP în
lina de comandă. Dacă nu dorim un ajutor general, ci specific, legat de o anumită
expresie sau funcŃie, tastăm:
>HELP expresie
Căutarea în baza de date se realizează cu comanda FIND. De exemplu
> FIND GT = 186
va determina poziŃionarea cursorului pe linia 38.
Ştergerea unui articol (adică a unui rând de date) se face prin comanda
DELETE nr.curent al liniei. De exemplu
>DELETE 23
are ca efect ştergerea datelor incluse în linia 23 (proba cu numărul curent 23).
Ştergerea unei variabile se face cu comanda DROP nume_variabilă.
De exemplu comanda
>DROP GT
are ca efect ştergerea variabilei în care sunt incluse datele de densitate ale speciei
Galba truncatula. Dacă aŃi şters ceva din greşeală, cel mai simplu mod de a
recupera datele este să nu salvaŃi fişierul, ci să ieşiŃi din modul, reintraŃi şi
încărcaŃi din nou datele originale. Versiunile superioare permit accesarea unor
utilităŃi de tipul Undo, respectiv Redo, pentru un număr oarecare de erori.
Comenzi condiŃionate se pot introduce folosind perechea IF, THEN.
Operatorii logici sunt:
AND - şi
OR - sau
NOT - negaŃie logică
De exemplu următoarea linie de comandă
>IF GT = 0 AND PA = 0 THEN LET MELCI$ = ‘proba_nula’
are ca urmare căutarea articolelor care satisfac ambele condiŃii (adică densitatea
ambelor specii să fie 0) şi introduce o variabilă şir, nouă, care va conŃine expresia
‘proba_nula’ pentru articolele astfel selectate.
Părăsirea modulului de editare (pentru a schimba modulul sau a închide
calculatorul) se face cu comanda:
> QUIT
Părăsirea oricărui alt modul, inclusiv închiderea sesiunii de lucru şi
părăsirea programului se poate realiza cu acest cuvânt rezervat. În versiunile
superioare mai există posibilitatea de închidere similară cu cea utilizată în
programele sub Windows (din meniurile pop-up).
Ordinea evaluării expresiilor este de la stânga la dreapta şi de sus în jos,
în funcŃie de valoarea operatorilor, în mod similar cu condiŃiile notaŃiilor
matematice. Şi aici, utilizarea parantezelor rotunde, are aceeaşi semnificaŃie pe
care o au şi în matematică.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 27

Ieşirea din fişierul salvat şi aducerea unui ecran gol, pentru a introduce
datele unui nou fişier, se face prin comanda NEW.

2. MODULUL DATA

Se apelează prin simpla tastare a comenzii


> DATA
în orice moment al sesiunii de lucru.
Încărcarea unui fişier particular se face cu comanda USE nume_fişier. De
exemplu:
>USE LAC
va încărca fişierul definit şi salvat anterior.
În modulul DATA se pot scrie rânduri succesive de comenzi şi expresii, care vor
fi executate numai la apariŃia cuvântului cheie rezervat RUN. ToŃi operatorii şi
funcŃiile disponibile (definite anterior) pot fi utilizate şi în acest modul.
Listarea fişierului de date se face cu comanda LIST urmată de comanda
de execuŃie (RUN). De exemplu dacă doriŃi să vedeŃi datele din fişierul LAC
tastaŃi:
> USE LAC
> LIST
> RUN
Ori de câte ori un ecran se umple de date, calculatorul vă cere să tastaŃi Enter
pentru a obŃine următorul ecran.
DirecŃionarea datelor sau a rezultatelor, se realizează cu comanda
OUTPUT. De exemplu:
> OUTPUT @
direcŃionează exportul către imprimantă
> OUTPUT *
readuce informaŃiile către ecran
> OUTPUT nume_fişier
direcŃionează rezultatele către un fişier cu extensia .dat.
De exemplu secvenŃa de comenzi:
>USE LAC
> IF GT = 0 AND PA = O THEN DELETE
>LET M = GT + PA
>SAVE LACNOU
>OUTPUT @
>RUN
va produce: încarcă fişierul LAC, în care şterge articolele care satisfac
condiŃia (densitate zero la ambele specii), defineşte o nouă variabilă M care va
conŃine sumele densităŃilor celor două specii din fiecare probă, va salva într-un
nou fişier prelucrările cerute (pentru a proteja datele originare), după care scoate
fişierul nou la imprimantă. Să nu uităm că la sfârşit trebuie să informăm
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 28

calculatorul să redirecŃioneze rezultatele înapoi, spre ecran, cu comanda


OUTPUT *, altfel vom avea surpriza că toate prelucrările vor fi scoase la
imprimantă.
Comenzile şi operatorii sunt similari cu cei discutaŃi în subcapitolul
precedent, dar posibilităŃile sunt mai numeroase. În acest modul putem utiliza
transformări şi calcule, sau expresii condiŃionale, respectiv logice:
>LET variabilă = expresie
sau
> IF expresie THEN LET var = expresie
Expresiile condiŃionale consecutive, vor avea forma:
IF ... THEN
ELSE IF .. THEN
ELSE
Alte câteva funcŃii sau calcule utile în studiile de ecologie pot fi realizate
prin cuvintele rezervate:
AVG: media aritmetică a unei variabile
SUM: suma valorilor unei variabile
MIN: valoarea minimă
MAX: valoarea maximă
STD: abaterea standard a unei variabile
MIS: numărul de valori care lipsesc dintr-o variabilă.
Fişierul existent poate fi reordonat (adică se schimbă ordinea de scriere a
articolelor) în funcŃie de un criteriu pe care îl numim cheie de sortare. Programul
permite reordonarea articolelor în sensul ascendent al valorilor unor variabile
definite drept chei, care însă nu pot fi în număr mai mare de 10. Cuvântul
rezervat pentru aranjare este SORT. De exemplu expresiile:
>SORT GT
determină aranjarea în ordine crescătoare a densităŃii speciei G. truncatula, iar
> SORT GT, PA
determină aranjarea articolelor în ordinea crescătoare a densităŃii speciei G.
truncatula, iar pentru aceleaşi valori ale acesteia, articolele sunt rearanjate în
ordinea crescătoare a densităŃii speciei P. acuta. În această dublă aranjare,
variabila GT este cheie primară, iar PA este cheie secundară.
Se observă că o comandă sau funcŃie poate include o variabilă, mai multe
(care se despart pe aceeaşi linie prin virgulă), sau toate.
Să nu uităm niciodată că pentru orice operaŃie definită, calculatorul nu va
începe execuŃia decât după comanda RUN, iar dacă dorim să salvăm ceea ce
rezultă în urma operaŃiilor, includem înainte de comanda de execuŃie o linie de
salvare (SAVE nume_fişier).
Standardizarea variabilelor este extrem de utilă în analize multivariate, de
exemplu în tehnici de clasificare şi de analiză a dendrogramelor, motiv pentru
care uneori trebuie să standardizăm datele. Acest lucru se face foarte simplu prin
comanda STANDARDIZE. Prin această comandă valorile originale ale
variabilelor sunt înlocuite cu scorurile z.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 29

De exemplu:
> STANDARDIZE
determină standardizarea datelor tuturor variabilelor, iar:
> STANDARDIZE nume_variabilă_1, nume_variabilă_2
are ca efect standardizarea celor două variabile apelate.
Tabelul 2 conŃine date biometrice ale speciei Unio crassus, exemplarele
fiind colectate din două staŃii de pe Crişul Alb, şi anume de la Ineu şi Chişineu -
Criş (au fost selectate la întâmplare câte 50 de exemplare măsurate în fiecare
dintre staŃii). Etichetele variabilelor au următoarele semnificaŃii: GFA - masa
scoicii, fără apă în cavitatea paleală, L - lungimea maximă, H - înălŃimea în
dreptul umbonelui, LAT - lăŃimea, S - codul numeric al staŃiei (S=1 pentru Ineu şi
S=2 pentru Chişineu-Criş).

Tab. 2. Date biometrice la Unio crassus din râul Crişul Alb

GFA L H LAT S

CASE 1 58.91 83.40 40.00 29.30 1.00


CASE 2 40.84 74.00 34.50 26.10 1.00
CASE 3 29.44 66.50 32.30 24.50 1.00
CASE 4 40.84 74.00 35.00 27.20 1.00
CASE 5 30.40 67.20 34.50 24.50 1.00
CASE 6 46.13 77.00 35.00 27.40 1.00
CASE 7 46.13 77.00 36.70 26.20 1.00
CASE 8 50.87 79.50 37.60 27.00 1.00
CASE 9 15.91 54.40 28.00 19.50 1.00
CASE 10 38.36 72.50 34.50 23.50 1.00
CASE 11 28.76 66.00 30.80 22.40 1.00
CASE 12 43.25 75.40 34.60 27.00 1.00
CASE 13 38.19 72.40 35.00 24.30 1.00
CASE 14 32.38 68.60 32.00 23.80 1.00
CASE 15 13.05 51.00 25.50 17.10 1.00
CASE 16 24.10 62.30 32.70 22.30 1.00
CASE 17 34.45 70.00 34.00 24.20 1.00
CASE 18 25.50 63.20 32.30 22.10 1.00
CASE 19 42.50 73.00 36.40 26.80 1.00
CASE 20 39.00 75.50 34.00 25.20 1.00
CASE 21 30.00 67.50 32.30 22.50 1.00
CASE 22 38.00 73.60 33.20 25.00 1.00
CASE 23 43.00 72.00 35.80 25.30 1.00
CASE 24 46.50 79.60 36.30 26.80 1.00
CASE 25 49.90 79.00 39.00 24.60 1.00
CASE 26 50.68 79.40 37.00 27.40 1.00
CASE 27 26.50 69.30 32.40 24.60 1.00
CASE 28 12.14 49.80 25.20 19.40 1.00
CASE 29 30.00 65.20 32.50 23.50 1.00
CASE 30 40.00 71.00 34.00 26.40 1.00
CASE 31 36.00 71.00 35.00 25.40 1.00
CASE 32 34.00 69.00 34.30 24.30 1.00
CASE 33 58.50 80.00 40.70 30.20 1.00
CASE 34 44.50 71.30 36.00 25.00 1.00
CASE 35 49.00 76.20 34.80 29.20 1.00
CASE 36 48.00 76.70 35.00 28.70 1.00
CASE 37 38.00 76.10 34.00 27.00 1.00
CASE 38 29.00 67.10 31.00 23.30 1.00
CASE 39 51.00 79.00 36.80 28.60 1.00
CASE 40 40.00 74.20 34.40 26.00 1.00
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 30

CASE 41 36.50 71.50 33.50 24.70 1.00


CASE 42 40.00 74.20 34.50 26.60 1.00
CASE 43 33.00 70.00 34.30 24.70 1.00
CASE 44 40.00 72.30 34.00 27.00 1.00
CASE 45 35.00 68.00 31.50 25.00 1.00
CASE 46 34.50 66.60 33.10 25.40 1.00
CASE 47 44.00 73.30 33.80 27.00 1.00
CASE 48 41.00 74.30 35.00 27.40 1.00
CASE 49 26.00 63.00 32.40 22.00 1.00
CASE 50 45.00 75.30 36.30 27.70 1.00
CASE 51 13.00 50.30 24.60 18.80 2.00
CASE 52 28.00 63.00 27.60 23.50 2.00
CASE 53 9.00 46.00 25.00 16.30 2.00
CASE 54 21.50 56.70 27.50 21.80 2.00
CASE 55 21.00 57.10 28.60 21.40 2.00
CASE 56 6.00 38.30 21.00 13.20 2.00
CASE 57 22.00 60.50 28.50 21.20 2.00
CASE 58 24.00 60.50 30.40 21.80 2.00
CASE 59 19.00 58.20 28.00 21.50 2.00
CASE 60 7.00 41.10 20.70 13.80 2.00
CASE 61 23.00 56.90 29.50 21.00 2.00
CASE 62 32.00 63.20 31.10 23.60 2.00
CASE 63 25.00 63.00 29.00 21.50 2.00
CASE 64 21.00 53.00 28.00 22.70 2.00
CASE 65 6.50 41.60 21.60 14.80 2.00
CASE 66 17.00 54.00 26.70 19.60 2.00
CASE 67 18.00 57.40 27.40 21.20 2.00
CASE 68 21.00 61.10 29.00 22.20 2.00
CASE 69 20.00 55.30 27.70 22.60 2.00
CASE 70 23.50 59.00 28.00 21.60 2.00
CASE 71 15.50 54.30 26.50 19.20 2.00
CASE 72 7.00 40.60 22.60 15.00 2.00
CASE 73 19.50 59.00 27.10 20.60 2.00
CASE 74 19.00 60.00 28.70 21.20 2.00
CASE 75 15.50 52.50 26.40 20.00 2.00
CASE 76 20.50 58.20 28.00 18.30 2.00
CASE 77 21.00 55.20 28.00 20.50 2.00
CASE 78 7.50 45.00 23.00 14.60 2.00
CASE 79 25.00 60.30 28.60 22.20 2.00
CASE 80 16.00 54.30 26.20 18.20 2.00
CASE 81 7.50 42.00 22.60 15.60 2.00
CASE 82 3.00 31.70 16.60 11.30 2.00
CASE 83 2.50 29.10 15.20 9.40 2.00
CASE 84 10.00 50.20 26.00 17.30 2.00
CASE 85 6.50 39.30 20.70 14.50 2.00
CASE 86 7.00 41.50 21.70 14.20 2.00
CASE 87 4.00 32.60 18.00 12.00 2.00
CASE 88 23.50 61.00 29.30 23.00 2.00
CASE 89 19.00 56.00 28.80 21.00 2.00
CASE 90 16.00 52.30 25.40 19.40 2.00
CASE 91 21.50 60.00 29.00 22.00 2.00
CASE 92 3.00 29.00 16.20 10.60 2.00
CASE 93 21.50 58.60 28.70 21.20 2.00
CASE 94 18.00 55.40 27.00 21.20 2.00
CASE 95 5.00 38.30 20.00 14.30 2.00
CASE 96 14.50 55.00 27.40 19.60 2.00
CASE 97 8.00 44.00 22.10 15.50 2.00
CASE 98 15.00 50.10 28.40 19.40 2.00
CASE 99 17.00 51.10 28.00 20.10 2.00
CASE 100 15.50 53.70 23.70 19.60 2.00
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 31

Dacă se doreşte realizarea unor prelucrări diferenŃiate pe staŃii, sau grupe


de date, atunci se include în prima linie de comandă numele variabilei de grupare.
Aceasta trebuie să conŃină numere naturale în calitate de identificator de grup
(din acelaşi motiv am ales codificarea staŃiilor în Tab. 2 sub formă de numere
naturale), iar această trebuie să fie sortată (adică articolele sunt aranjate în
ordinea crescătoare a identificatorilor de grup). Comanda este BY
nume_variabilă.
Dacă, de exemplu, în fişierul de mai sus dorim să realizăm unele calcule
diferenŃiat pe cele două staŃii, utilizăm comanda BY S.
Ştergerea variabilelor se face de asemenea cu comanda:
> DROP nume_variabilă.
Ştergerea articolelor se face cu comanda DELETE. De exemplu:
> DELETE 10, 15, 25
are ca efect ştergerea articolelor din liniile 10, 15 şi 25, iar:
> IF CASE > 75 THEN DELETE
are ca efect ştergerea articolelor care urmează celei de-a 75-a linii.
TranspoziŃia fişierului (transformarea liniilor în coloane) este adesea
necesară, în analize de corelaŃii sau de clasificare ierarhică, fapt care se execută
cu comanda TRANSPOSE, de asemenea din modulul DATA. De exemplu:
> USE XX
> SAVE XX1
> TRANSPOSE
> RUN
are ca efect: încărcarea fişierului XX, anunŃăm salvarea unei copii XX1 care va
conŃine noul fişier transpus, produs prin comanda specifică.
Manipularea fişierelor se poate face şi prin lipirea sau cumularea acestora.
Câteodată este necesară unirea lor pe orizontală, cu comanda:
> USE nume_fişier_1 nume_fişier_2
sau alipirea pe verticală, caz în care cele două fişiere trebuie să conŃină aceleaşi
variabile aranjate în aceeaşi ordine (pentru a exista suprapunere perfectă între
capetele de tabel), cu comanda:
>APPEND nume_fişier_1, nume_fişier_2

3. MODULUL DE STATISTICĂ UNIVARIATĂ

Modulul de statistică se accesează cu comanda STATS (sau din meniurile


pop-up). Comanda pentru analiza statistică este STATISTICS. De exemplu:

> STATS
> USE LAC
> STATISTICS /ALL

va avea ca efect apariŃia următoarelor rezultate:


I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 32

TOTAL OBSERVATIONS: 40
GT PA

N OF CASES 40 40
MINIMUM 0.000 0.000
MAXIMUM 368.000 85.000
RANGE 368.000 85.000
MEAN 45.675 17.725
VARIANCE 5585.251 282.922
STANDARD DEV 74.735 16.820
STD. ERROR 11.817 2.660
SKEWNESS(G1) 2.717 2.014
KURTOSIS(G2) 7.906 5.462
SUM 1827.000 709.000
C.V. 1.636 0.949

În comanda precedentă ALL semnifică selectarea tuturor analizelor


statistice descriptive conŃinute de rutină. În cazul în care se utilizează numai
anumite analize, acestea pot fi precizate după slash (/), în mod explicit.
SemnificaŃiile rezultatelor de mai sus:
N OF CASES - număr de valori ale variabilei şir
MINIMUM - valoarea cea mai mică
MAXIMUM - valoarea cea mai mare
RANGE - amplitudine
MEAN - medie aritmetică
VARIANCE - varianŃa
STANDARD DEV - abaterea standard
STD. ERROR - eroarea standard a mediei aritmetice
SKEWNESS (G1) - coeficient de asimetrie
KURTOSIS (G2) - coeficient de aplatizare/boltire
SUM - suma tuturor valorilor variabilei
C.V. - coeficient de variaŃie
Comanda SATISTICS consideră implicit toate variabilele dintr-un fişier.
Dacă se execută analize numai pentru anumite variabile, acestea se declară prin
etichetele lor, despărŃite de virgulă:
> STATISTICS nume_veriabilă_1, nume variabilă_2 ....
Analiza statistică descriptivă a datelor grupate după anumite chei se
realizează prin cuvântul rezervat BY nume_cheie
De exemplu daca dorim analiza descriptivă a datelor din fişierul XX.sys
defalcate pe cele două staŃii (S=1 şi S=2), atunci comenzile vor fi:
> USE XX
> BY S
> STATISTICS GT
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 33

Rezultă analizele separat pentru cele două staŃii; deoarece nu s-a inclus
specificarea ALL după STATISTICS, nu se vor reda toŃi parametrii, ci minimul,
maximul, media şi abaterea standard a variabilei GT. Să nu uităm că utilizarea
comenzii BY cheie, necesită o sortare anterioară a fişierului pe baza variabilei
cheie. Rezultatele vor fi:
THE FOLLOWING RESULTS ARE FOR:
S = 1.000
TOTAL OBSERVATIONS: 50
GFA
N OF CASES 50
MINIMUM 12.136
MAXIMUM 58.913
MEAN 37.774
STANDARD DEV 10.205

THE FOLLOWING RESULTS ARE FOR:


S = 2.000
TOTAL OBSERVATIONS: 50
GFA
N OF CASES 50
MINIMUM 2.500
MAXIMUM 32.000
MEAN 15.640
STANDARD DEV 7.435

Modulul de statistică descriptivă oferă posibilitatea aplicării unor teste,


dintre care reŃinem pe cel care ne va fi extrem de folositor în analizele ecologice,
şi anume testul t-Student pentru verificarea semnificaŃiei diferenŃei dintre
două medii aritmetice.
Pentru a rula acest test trebuie să existe o cheie de grupare, toate datele
unui fişier aparŃinând astfel, obligatoriu, la una din două grupe (ca de exemplu
datele din fişierul XX, care sunt fie din staŃia S 1 fie din S 2). De asemenea
fişierul a fost sortat în prealabil după cheia respectivă. Comanda pentru realizarea
testului este TTEST, cu expresia:
> TTEST variabila_1, variabila_2 ...,variabila_n * cheie
De exemplu în fişierul XX dacă dorim să verificăm semnificaŃia
diferenŃelor dintre mediile variabilelor masă (GFA) şi lungime totală (L) dintre
loturile aparŃinând celor două staŃii, vom scrie expresiile:
> USE XX
> TTEST GFA, L * S
care vor avea ca rezultat redarea următoarelor rezultate:
INDEPENDENT SAMPLES T-TEST ON GFA GROUPED BY S

GROUP N MEAN SD
1.000 50 37.774 10.205
2.000 50 15.640 7.435
POOLED VARIANCES T = 12.396 DF = 98 PROB = .000
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 34

INDEPENDENT SAMPLES T-TEST ON L GROUPED BY S

GROUP N MEAN SD
1.000 50 71.168 6.934
2.000 50 51.330 9.424
POOLED VARIANCES T = 11.990 DF = 98 PROB = .000

Rezultatele sunt redate explicit pentru cele două variabile şi staŃii, cea mai
importantă valoare în context, este cea redată prin abrevierea PROB situată în
dreapta - jos. Valori mai mari de nivelul de semnificaŃie ales (de obicei 0.05)
semnifică diferenŃe nesemnificative între medii. În cazurile de mai sus observăm
că în ambele cazuri mediile diferă semnificativ. Prin urmare bivalvele prezintă
medii semnificativ mai mari atât în ceea ce priveşte masa cât şi lungimea, la staŃia
situată în amonte (la Ineu).

3. MODULUL DE TESTE NEPARAMETRICE

După cum s-a menŃionat la partea teoretică a cursului, testele


neparametrice sunt utilizate atunci când nu putem presupune că datele ecologice
sunt descrise prin vreo distribuŃie matematică cunoscută. Mai simplu, utilizăm
teste neparametrice atunci când avem puŃin date (n< 30), respectiv când lucrăm
cu probe statistice mici. În versiunea de lucru, modulul neparametric se accesează
prin comanda NPAR, iar în versiunile superioare din meniuri.
Testele neparametrice se aleg în funcŃie de tipul şi aranjarea datelor
primare. Astfel modulul permite realizarea testului Kolmogorov-Smirnov (pentru
o probă), testul semnelor al lui Wilcoxon (pentru două probe relaŃionate),
Friedman (pentru mai multe probe relaŃionate), Kolmogorov - Smirnov sau Mann
- Whitney (pentru două probe independente), Kruskal - Wallis (mai multe probe
independente).
Ca în toate rutinele, comanda HELP urmată sau nu de o expresie specifică,
va aduce pe ecran explicaŃii cu privire la testul solicitat, precum şi gramatica
explicită a acestuia.
Dacă avem un număr redus de probe şi dorim să aflăm în ce măsură există
diferenŃe semnificative între mediile a două grupe de date, putem rula testul
Mann-Whitney. Este extrem de util atât în unele sectoare ale ecologiei, cât mai
ales în fiziologie, ecotoxicologie sau genetică, unde adesea, din cauza limitărilor
materiale, se lucrează cu un număr redus de probe.
Să presupunem că studiem efectul unei combinaŃii de substanŃe Y într-o
anumită concentraŃie, asupra creşterii unor plantule aparŃinând unei specii de
cultură. Pentru această analiză avem un lot de plantule de aceeaşi vârstă, separate
în două grupe: proba martor (care creşte în absenŃa tratamentului cu Y) şi proba
supusă acŃiunii substanŃei cu pricina.
Fişierul de date primare (PLANTULE.sys) va conŃine prin urmare o
variabilă care descrie creşterea plantulelor într-o anumită perioadă de timp, în cm
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 35

(variabila P) şi o variabilă de grupare, sau cheie, care desparte datele în funcŃie de


proba la care aparŃin (martor sau cea supusă acŃiunii substanŃei Y):
P T
CASE 1 4.500 1.000
CASE 2 4.900 1.000
CASE 3 5.000 1.000
CASE 4 5.000 1.000
CASE 5 4.500 1.000
CASE 6 3.400 1.000
CASE 7 5.100 1.000
CASE 8 4.800 2.000
CASE 9 2.300 2.000
CASE 10 4.500 2.000
CASE 11 3.300 2.000
CASE 12 3.800 2.000
CASE 13 4.100 2.000
CASE 14 5.000 2.000
CASE 15 3.200 2.000
CASE 16 2.800 2.000

Pentru a afla dacă există diferenŃe semnificative între medii (cu alte
cuvinte, dacă substanŃa are sau nu un efect asupra creşterii plantulelor) se
tastează:
> NPAR
> USE PLANTULE
> KRUSKAL P * T
iar rezultatul va fi următorul ecran:
KRUSKAL-WALLIS ONE-WAY ANALYSIS OF VARIANCE FOR 16 CASES

DEPENDENT VARIABLE IS P
GROUPING VARIABLE IS T

GROUP COUNT RANK SUM

1.000 7 79.000
2.000 9 57.000

MANN-WHITNEY U TEST STATISTIC = 51.000


PROBABILITY IS 0.038
CHI-SQUARE APPROXIMATION = 4.311 WITH 1 DF

Rezultatele se referă la precizarea dimensiunii probei, a variabilei


dependente (P) respectiv de grupare (T), suma rangurilor fiecărei grupe, valoarea
parametrului statistic al testului Mann-Whitney, probabilitatea (! cea mai
importantă parte a rezultatului; restul poate fi ignorat) care ne indică semnificaŃia
diferenŃei. A se reaminti că ipoteza nulă statutează egalitatea mediilor. Dacă s-a
ales un nivel critic de 0.05, devine evident faptul că probabilitatea calculată mai
sus (0.038) este mai mică, motiv pentru care respingem ipoteza nulă şi afirmăm,
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 36

la nivelul de asigurare ales, diferenŃe semnificative între cele două probe. Altfel
spus, la nivelul de probabilitate de 0.05 recunoaştem că soluŃia de Y are un efect
semnificativ inhibitor asupra creşterii plantulelor aparŃinând speciei de interes.

5. GRAFICE

FacilităŃile grafice sunt diverse şi foarte uşor de aplicat. Graficul se alege şi


construieşte adecvat datelor de care dispunem şi le putem clasifica după utilitate
sau formă, respectiv semnificaŃie. După utilitate le împărŃim în grafice
intermediare sau de lucru (care ne ajută în timpul procesului de analiză a datelor,
ca unealtă în selectarea aplicaŃiilor) şi grafice de prezentare a rezultatelor. După
semnificaŃie şi formă distingem grafice de tip nor de puncte (prezentate şi la
partea teoretică), drepte sau curbe de regresie (cel mai adesea cele două tipuri
apar împreună), histograme (care pot prezenta o mare varietate de date, cele mai
uzuale în analizele statistice fiind distribuŃiile de frecvenŃe pe clase de variaŃie),
grafice tip box-plot (descriu variabilele în ceea ce priveşte mediana, limitele de
confidenŃă şi amplitudinea) etc.
În procesul de modelare este benefic să vizualizăm din când în când datele,
deoarece aceasta ne poate oferi informaŃii despre tipul de model pe care trebuie
să-l construim. De exemplu, dacă dorim să modelăm relaŃia între masa scoicilor
din Tab. 2 (fişierul XX.sys) şi lungime, intrăm în modulul grafic (la versiunile
inferioare se utilizează comanda GRAPH), încărcăm fişierul (cu comanda USE)
după care vizualizăm datele prin comanda:
> PLOT GFA * L
unde PLOT are ca efect crearea unui rafic bidimensional de tip nor de puncte.

65

55

45

35
GFA

25

15

-5
25 35 45 55 65 75 85 95

L
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 37

6. MODULUL CORR (CORELAłII ŞI DISTANłE)

Modulul de analiză a corelaŃiilor se accesează prin comanda CORR.


Există numeroase posibilităŃi matematice de analiză corelativă. Astfel se pot
realiza, de exemplu, matrici cu coeficienŃi de covarianŃă (prin comanda
COVARIANCE), coeficienŃi de corelaŃie de tip Pearson (PEARSON), matrici
de distanŃe euclidiene (EUCLIDEAN), precum şi indici pentru date binare, de
tipul coeficientului dichotomic Jaccard (S3), coeficientul dichotomic simplu (S4),
coeficienŃii Anderberg (S5), Tanimoto (S6) etc.
În analiza de corelaŃie se poate solicita matricile de probabilităŃi ale
semnificaŃiilor coeficienŃilor, prin adăugarea unei comenzi suplimentare. De
exemplu, dacă dorim să realizăm o analiză de corelaŃie între variabilele
biometrice lungime, lăŃime şi înălŃime, ale fişierului XX.sys, trebuie să procedăm
astfel:
> CORR
> USE XX
> PEARSON L, LAT, H / PROB
În seriile de comenzi de mai sus, am intrat în modulul de corelaŃii, am
încărcat fişierul XX.sys şi am accesat o analiză de corelaŃii de tip Pearson pentru
cele trei variabile precizate prin etichetele lor (despărŃite de virgulă), după care
am cerut şi o analiză de semnificaŃie (/ PROB) care va crea o a doua matrice de
probabilităŃi. CoeficienŃii semnificativi vor avea probabilităŃi mai mici de 0,05.
PEARSON CORRELATION MATRIX
L H LAT

L 1.000
H 0.976 1.000
LAT 0.971 0.956 1.000

BARTLETT CHI-SQUARE STATISTIC: 577.750 DF= 3 PROB= .000

MATRIX OF PROBABILITIES
L H LAT

L 0.000
H 0.000 0.000
LAT 0.000 0.000 0.000

NUMBER OF OBSERVATIONS: 100

În toate cazurile (perechile de variabile analizate) coeficienŃii de corelaŃie


sunt extrem de semnificativi (probabilităŃile de semnificaŃie sunt mult situate sub
valoarea critică de 0.05), pozitivi şi mari (toŃi sunt peste 0.95). Cea mai strânsă
corelaŃie se înregistrează între L şi H.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 38

7. ANALIZA DE REGRESIE GENERALĂ

Modulul pentru modele de regresie (MGLH) este printre cele mai utile în
procesul de modelare a fenomenelor ecologice. Acest modul realizează analize
ale unor regresii de tip Y = a + bX, semnificaŃiile şi formulele fiind prezentate la
partea teoretică (a se vedea Sîrbu şi Benedek, 2004, Cap. X). Dacă relaŃia
îmbracă forma unei curbe exponenŃiale sau logaritmice, acest lucru se poate
rezolva prin schimbarea scării variabilelor.
De exemplu, dacă dorim să realizăm o analiză de regresie între variabila
GFA şi L din fişierul XX. sys, simpla observaŃie a aranjării datelor în figura de
tip PLOT realizată mai sus, ne informează că este inutilă căutarea unui model de
tip liniar pe date originale. Acest lucru se corectează prin dubla logaritmare a
ambelor variabile, ceea ce se poate face fie în modulul DATA, fie în EDIT. În
ultimul caz procedăm astfel:
> EDIT
> USE XX
> LET GFA = LOG(GFA)
> LET L = LOG (L)
> SAVE XXL
ultima linie a servit la salvarea unei copii a fişierului original cu datele
transformate ale celor două variabile. Apoi intrăm în modulul MGLH şi cerem o
analiză de semnificaŃie a modelului de interes. Tipul modelului se precizează
prin:
> MODEL nume_variabilă_dependentă = expresie
iar pentru a accesa analiza se tastează pe linia următoare:
> ESTIMATE
În exemplul nostru, vom tasta următoarea secvenŃă:
> MGLH
> USE XXL
> MODEL GFA = CONSTANT + L
> ESTIMATE
care va avea ca efect producerea următoarei ferestre. Aparent este foarte
complicată, pentru utilizatorul începător, din cauza faptului că prezintă mai multe
rezultate intermediare şi unele teste. Pentru ecolog este suficient să cunoască
câteva valori, cele care au semnificaŃie maximă pentru modelul căutat.
DEP VAR: GFA N: 100 MULTIPLE R: .990 SQUARED MULTIPLE R: .981
ADJUSTED SQUARED MULTIPLE R: .980 STANDARD ERROR OF ESTIMATE: 0.100

VARIABLE COEFFICIENT STD ERROR STD COEF TOLERANCE T P(2 TAIL)

CONSTANT -9.132 0.174 0.000 . -52.586 0.000


L 2.988 0.042 0.990 1.000 70.480 0.000

ANALYSIS OF VARIANCE

SOURCE SUM-OF-SQUARES DF MEAN-SQUARE F-RATIO P

REGRESSION 49.418 1 49.418 4967.447 0.000


RESIDUAL 0.975 98 0.010
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 39

CoeficienŃii de determinare (de exemplu SQUARED MULTIPLE R:) este


foarte mare (0.981) semnalând o puternică dependenŃă a variabilei ln(GFA) de
ln(L). STANDARD ERROR OF ESTIMATE semnifică eroarea standard a
modelului, iar COEFFICIENT, prezentând valorile coeficienŃilor ecuaŃiei de
regresie, scrişi în dreptul variabilelor (VARIABLE) permit scrierea explicită a
formei matematice a acestui model. În sfârşit, pe ultima coloană verificăm dacă P
(2 TAIL) care conŃine probabilităŃile, sunt mai mici decât valoarea critică (aşa
cum se constată în exemplul de faŃă), aceasta indicând faptul că valorile sunt
semnificative din punct de vedere statistic. Astfel raportăm rezultatul:
ln(GFA) = -9.132 + 2.988 ln(L)
r2 = 0.981; eroare standard = 0.1; α < 0.05
Modelele pe care le căutăm pot fi uni- sau multivariate. Evaluăm
semnificaŃia acestora prin: r2 (să fie cât mai mare), eroarea standard a estimării
(să fie cât mai mică), precum şi prin probabilităŃile de semnificaŃie ale
parametrilor ecuaŃiei de regresie (care trebuie să fie cât mai mici, în orice caz sub
valoarea critică aleasă de obicei la 0.05; dacă rezultă valori mai mari căutăm un
alt tip de model).
Calculatorul estimează orice tip de model conceput de utilizator. Dacă, de
exemplu, am logaritmat şi variabilele H, respectiv LAT, am putea căuta modele
mai bune decât cel obŃinut anterior, prin diferite expresii, care vor fi urmate
(fiecare în parte) de comanda ESTIMATE:
> MODEL GFA = CONSTANT + L + LAT
este un model bivariat, de tip aditiv
> MODEL GFA = CONSTANT + L*LAT
model bivariat în care se înmulŃesc variabilele independente, sau
> MODEL GFA = L * LAT * H
care este un model trivariat de tip multiplicativ, fără constantă.
Ori de câte ori realizăm o analiză de acest tip, să nu uităm să precizăm sub
ecuaŃie valoarea coeficientului de determinare (r2), a erorii standard şi a
probabilităŃii de semnificaŃie.

8. CONSTRUIREA DENDROGRAMELOR

După cum s-a arătat în capitolul teoretic, construirea dendrogramelor face


parte din analiza de clasificare ierarhică. În SYSTAT apelarea modulului de
clasificare ierarhică se realizează prin comanda CLUSTER.
Să presupunem că am editat un fişier (CHEST.sys) care conŃine rezultatele
unei anchete asupra a 5 loturi de oameni (A, B, C, D şi E), fiecare chestionat
asupra unor probleme de gestiune casnică a deşeurilor. Indivizii din fiecare lot au
răspuns cu da sau nu la câte 5 întrebări. S-a calculat procentul de indivizi din
fiecare lot care au dat răspunsuri afirmative la aceste întrebări, fapte care denotă o
atitudine responsabilă faŃă de problema igienei casnice. Fişierul este redat mai
jos:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 40

A B C D E

Întrebare 1 14.500 65.000 24.000 5.500 45.000


Întrebare 2 22.900 14.000 22.100 4.500 61.300
Întrebare 3 0.500 6.100 13.500 3.600 24.100
Întrebare 4 12.300 5.500 14.800 2.500 12.900
Întrebare 5 75.000 12.500 15.900 1.120 14.000

Pentru a analiza cum se situează, prin comparaŃie, cele 5 loturi de indivizi, putem
construi dendrograma pe baza distanŃelor euclidiene. Pentru aceasta se accesează
modulul de clasificare (CLUSTER) şi se tastează comanda:
> JOIN / COLS
care va afişa pe ecran:
SINGLE LINKAGE METHOD (NEAREST NEIGHBOR)
TREE DIAGRAM
DISSIMILARITIES
-100.000 0.000
B --------------------------------------------------+
+----+
A ----------------+ ¦ ¦
+---------------------------------+ ¦
E ----------------+ ¦
++
C -------------------------------------------------------+¦
+---
D --------------------------------------------------------+

în care se prezintă dendrograma realizată la distanŃă euclidiană, prin metoda


grupării la cel mai apropiat vecin, scara fiind redată în termeni de disimilaritate.
Se poate observa (şi comenta corespunzător) că loturile A şi E sunt cele mai
asemănătoare în ceea priveşte atitudinea faŃă de problema deşeurilor, iar C, dar în
special D, sunt cele mai diferite ca mentalitate.
Modulul posedă diverse opŃiuni pentru construirea dendrogramelor. De
exemplu, matricile se pot clasifica pe linii (JOIN / ROWS), iar metoda de grupare
poate fi realizată la distanŃă medie:
> LINKAGE = AVERAGE
sau completă
> LINKAGE = COMPLETE
DistanŃa implicită este cea euclidiană, iar metoda de grupare se realizează
implicit prin cel mai apropiat vecin.
Dacă datele sunt de tip binar (specii prezente - absente), fişierul având forma:
S1 S2 S3 S4

CASE 1 1.000 1.000 0.000 1.000


CASE 2 0.000 0.000 1.000 0.000
CASE 3 0.000 0.000 1.000 1.000
CASE 4 1.000 1.000 0.000 0.000
CASE 5 0.000 1.000 0.000 1.000
CASE 6 0.000 1.000 0.000 0.000
CASE 7 0.000 0.000 1.000 0.000
CASE 8 1.000 1.000 0.000 1.000
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 41

CASE 9 0.000 0.000 1.000 1.000


CASE 10 0.000 0.000 1.000 0.000
CASE 11 0.000 0.000 1.000 1.000
CASE 12 1.000 1.000 0.000 1.000
CASE 13 0.000 1.000 0.000 0.000
CASE 14 0.000 1.000 0.000 0.000
CASE 15 0.000 1.000 1.000 0.000

unde liniile reprezintă anumite specii (în total 15 identificate), iar coloanele
structura specifică (pe baza prezenŃei =1 sau absenŃei =0) a acestora, se
construieşte o matrice de similitudine printr-un indice dichotomic (de exemplu
Jaccard) în modulul de corelaŃii (CORR). Presupunem că fişierul de mai sus este
salvat sub denumirea de COM.sys. Atunci calcularea matricii de similitudine pe
baza indicelui Jaccard (S3) se realizează prin secvenŃa:
> CORR
> USE COM
> SAVE COM1
> S3
prin care matricea corespunzătoare a fost salvată sub denumirea de COM1.
Aceasta va avea expresia:

S1 S2 S3 S4

CASE 1 1.000 . . .
CASE 2 0.444 1.000 . .
CASE 3 0.000 0.067 1.000 .
CASE 4 0.375 0.333 0.273 1.000

Construirea dendrogramei prin metoda de grupare la distanŃă medie, se execută


prin secvenŃa:
> USE COM1
>LINKAGE = AVERAGE
> JOIN / COLS
având ca efect apariŃia pe ecran a următorului grafic:
AVERAGE LINKAGE METHOD
TREE DIAGRAM
DISSIMILARITIES
-0.500 0.000
S3 ---------------------------------------------------+
+--------
S4 -------------------+ ¦
+-------------------------------+
S1 -------+ ¦
+-----------+
S2 -------+
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 42

5. MODELARE ÎN MATHCAD

Produsul MathCAD este elaborat de firma MathSoftInc Cambridge, MA,


SUA, fiind special conceput pentru modele matematice mai sofisticate, calcule cu
grad ridicat de dificultate, realizarea proiectelor complexe, având numeroase
facilităŃi grafice şi de prezentare a rezultatelor. Vom lucra cu versiunea 2001
Professional.
Simboluri şi combinaŃii de taste utilizate în MathCAD

Pentru a obŃine ... ... tastaŃi: semnificaŃie:


:= : definiŃie sau atribuire
a,b .. c a, , ,b, ; , c domeniu de variaŃie redat ca: a valoare iniŃială, b
valoarea următoare, iar c este valoarea finală
(x) ‘ , x sau (,x,) paranteză
x! x,! factorial
ab a,^,b ridicare la putere
|x| |,x modul, valoare absolută, determinant
x+y x,+,y adunare
m/n m,/,n împărŃire
a.b a,*,b înmulŃire
-c -,c minus; număr negativ
a>b a,> ,b mai mare decât
a<b a,<,b mai mic decât
≡ Sfift + ~ definiŃie globală
xi x,[,i indice
xi,j x , [ , ( , i , j ,) indici dubli
MT M , Alt + ! matrice transpusă
∑x Alt + $ , x sumă vectorială
x \,x radical

∫ f (x )dx x , & , f (x) integrală nedefinită


d x , ? , f(x) derivată
f(x)
dx
v Alt+ - vectorizare
∑ xi
i
i,$,x sumă după valorile indicelui i din x

∏x
i
i
i,#,x produs după valorile indicelui i de x

Versiunile noi operează în mod similar cu Microsoft Office, operatorul


putând selecta comenzi şi funcŃii fie din meniurile pop-up, fie prin scrierea
explicită a comenzilor. Deoarece semnificaŃia tastelor şi a combinaŃiilor acestora
a rămas similară în toate versiunile, vom începe această temă prin expunerea
simbolurilor şi a semnificaŃiilor acestora (după manualul original, precum şi E.
Scheiber şi D. Lixăndroiu, 1994). Pentru a facilita înŃelegerea modului de tastare,
vom uni cu simbolul + tastele care se apasă simultan, iar cu operatorul virgulă (,)
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 43

separăm tastele care se apasă în ordine. Astfel: Shift + 4 semnifică apăsarea


simultană a celor două taste, pe când Esc, *, Enter impune apăsarea în ordine
secvenŃială a tastelor Esc, apoi *, urmate de Enter. Pentru cei cărora le place mai
degrabă să lucreze cu meniuri decât să înveŃe cele câteva comenzi, le rămâne
selectarea funcŃiilor şi operatorilor exclusiv din oferta generoasă de comenzi
prezentate în stil pop-up.
Toate comenzile de sistem şi de fişiere sunt similare cu cele utilizate de
produsele Microsoft Office, icoanele şi cuvintele-cheie fiind identice.

FuncŃii Mathcad mai des utilizate în ecologie


ObservaŃii: în tabelul de mai jos: x, y reprezintă numere reale, n este un număr natural, v este
un vector iar M o matrice
Apelarea funcŃiei SemnificaŃie
sin (x) sinus de z
cos (x) cosinus de x
tan (x) tg x
asin (x) arcsin x
acos (x) arccos x
atan (x) arctan x
exp (x) ex
ln (x) logaritm natural din x (ln x)
log (x) logaritm zecimal din x (lg x)
rnd (x) număr aleator cuprins între 0 şi x
length (v) numărul elementelor vectorului v
max (v) cel mai mare element al lui v
min (v) cel mai mic element al vectorului v
rows (M) numărul liniilor matricei M
cols (M) numărul coloanelor matricei M
augument (M1, M2) matricea obŃinută prin alăturarea matricilor M1 şi
M2, cu acelaşi număr de linii
identity (n) matricea unitate de ordin n
sort (v) ordonează crescător elementele vectorului v
csort (M, n) aranjează liniile matricii M astfel încât
elementele coloanei n să fie în ordine crescătoare
rsort (M, n) aranjează coloanele matricii M astfel încât
elementele liniei n să fie în ordine crescătoare
mean (v) media aritmetică a elementelor vectorului v
var (v) varianŃa elementelor lui v
stdev (v) abaterea standard a elementelor lui v
corr (vx, vy) coeficientul de corelaŃie Pearson aplicat
vectorilor de date vx şi vy
linterp (vx, vy, x) returnează valoarea în x a funcŃiei afine de
interpolare, determinată de vectorii vx şi vy
cspline (vx, vy) redă coeficienŃii funcŃiei spline cubice de
interpolare determinată de vectorii vx şi vy,
funcŃia fiind cubică la extremităŃi
lspline (vx, vy) redă coeficienŃii funcŃiei spline cubice de
interpolare determinată de vectorii vx şi vy,
funcŃia fiind liniară la extremităŃi
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 44

pspline (vx, vy) redă coeficienŃii funcŃiei spline cubice de


interpolare determinată de vectorii vx şi vy,
funcŃia fiind parabolică la extremităŃi
interp (vs, vx, vy, x) returnează valoarea în x a funcŃiei spline cubice
de interpolare determinată de vectorii de date vx
şi vy; vs reprezintă vectorul cu coeficienŃii
funcŃiei spline calculate în cspline, lspline sau
pspline

1. CALCULE

Calculele numerice în MathCAD se efectuează prin operatori de atribuire


sau definire, expresii matematice şi operatori de afişare.
Operatorii de atribuire / definire sunt definiŃi prin := (care se obŃine prin
tastarea a două puncte :)
variabilă := expresie
funcŃie (variabile separate prin virgulă) := expresie
variabilă ≡ expresie
ultima fiind expresia pentru operatorul de definire globală (adică având ca
domeniu de valabilitate întregul fişier).
Expresiile matematice sunt redate utilizând variabilele, funcŃiile şi
parametrii definiŃi anterior, utilizând operatorii matematici şi combinaŃiile de
taste redate în tabelele prezentate anterior.
Operatorul de afişare (întoarcerea rezultatului) este dat de semnul =, în
formatul:
variabilă =
expresie =
funcŃie (listă variabile) =

Calculele simple se pot scrie explicit, urmate de semnul =, fapt care va


determina evaluarea şi afişarea rezultatului acestora. De exemplu tastarea
următoarei secvenŃe pentru calcularea indicelui de similitudine procentuală
Czekanowski (virgula indică operaŃii succesive):
(,( , 2 , * , 12 , ), / , ( , 36 , + , 39 , ),) , * , 100 , =
produce pe ecran:

2 ⋅ 12
⋅ 100 = 32
36 + 39

Semnul egal implică evaluarea expresiei matematice definite anterior. În


exemplul anterior am comparat două comunităŃi, formate din 36, respectiv 39 de
specii, dintre care 12 sunt comune. Calculatorul a evaluat expresia de similitudine
la 32%. Aceeaşi prelucrare se poate reda prin definirea unor parametri, în felul
următor:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 45

c := 12
a := 36
b := 39

2⋅c
Is := ⋅ 100
a+b

Is = 32

Cu alte cuvinte, am definit prin operatori de atribuire valorile parametrilor


identificaŃi prin a, b şi c, am definit expresia lui Is, urmată de solicitarea de
afişare a rezultatului.
Identificatorii trebuie să înceapă cu o literă, care poate fi urmată de alte
litere, cifre sau semne speciale.
Variabilele numerice de tip şir, se definesc prin:
- un increment i, care ia valori întregi succesive de la 1 la n (de exemplu n = 8)
- variabila xi care este redată sub forma unei expresii matematice în i sau explicit.
Evident variabila şir conŃine atâtea valori câte au fost prevăzute prin n. Dacă
variabila este definită explicit, separatorul între termenii şirului este dat de tasta
virgulă (,)
Expresia generală pentru o variabilă şir este:
indice := valoare1, valoare 2 .. valoare finală
(diferenŃa dintre valoare 1 şi valoare 2 va desemna incrementul, iar cele două
puncte care urmează valorii 2 desemnează repetarea incrementului până la
valoare finală; pentru a obŃine cele două puncte se tastează ;)
variabilă_şir indice := valori
sau
variabilă_şir indice := expresie

Într-un vector sau o matrice valoarea iniŃială a indicilor este 0. Dacă se


doreşte ca valoarea iniŃială (prima probă, prima măsurătoare să fie 1 - aşa cum se
preferă adesea în ecologie, trebuie să precizăm acest lucru printr-o definiŃie
globală a parametrului inclus ORIGIN.
Altfel spus, atunci când calculele vor începe cu prima valoare a unei
variabile şir (definită prin indicele i care ia valori întregi succesive de la 1 la n)
precizăm în linia de comandă:
ORIGIN ≡ 1
Exemplu: un ecolog a colectat şi prelucrat 31 de probe (de dimensiuni
egale, alese randomizat) prin metoda suprafeŃelor. Numărul de indivizi din
fiecare probă va fi inclus în variabila şir xi. În acest caz, operatorul tastează
următoarea secvenŃă:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 46

n := 31

i := 1, 2 .. 31
x :=
i

12
0
5
7
0
0
6
0
8
14
15
24
23
62
150
42
58
78
53
21
0
25
26
84
36
45
82
5
36
74
4

unde: valorile variabilei xi sunt rezultate în urma numărării indivizilor din probele
colectate.
Să presupunem că dorim acum să calculăm media aritmetică a densităŃii,
varianŃa şi abaterea standard a şirului xi. Există posibilitatea de a scrie în mod
explicit ecuaŃiile (ca în partea teoretică), sau de a cere apelarea unor funcŃii
implicite ale programului. În cel de-al doilea caz, vom tasta şi solicita afişarea,
prin:
mean (x) = 31.09
var (x) = 1153.96
stdev (x) = 33.97
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 47

Eventual putem calcula şi alŃi parametri, cum ar fi, de exemplu eroarea


standard a mediei (Err), eroarea de estimare a mediei (D) şi indicele de distribuŃie
spaŃială (ID), prin definirea următoarelor expresii:

var(x )
Err :=
n
Err
D :=
mean( x )
var(x )
ID :=
mean ( x )
Err = 6.10
D = 0.196
ID = 37.11

Dacă în document dorim să includem spaŃii pentru text, în versiunile


superioare scriem pur şi simplu explicaŃiile dorite, iar în versiunile inferioare,
marcăm spaŃiul pentru text cu ghilimele. De exemplu, dacă dorim după operatorul
de afişare Err să precizăm semnificaŃia acestuia, vom tasta:
Err =
“Err semnifică eroarea standard a mediei”
Textul inclus între ghilimele nu va fi interpretat ca o expresie matematică şi nici
drept comandă, ci va fi ignorat de către calculator.

2. GRAFICE

Dacă se doreşte realizarea unei reprezentări grafice plane (bidimenionale)


se selectează simbolul din meniu, după care se înscriu în spaŃiile rezervate
variabilele şi/sau funcŃiile care se reprezintă, precum şi domeniile lor de variaŃie
(valorile minime şi maxime), ca în exemplul de mai jos.
Să presupunem că am realizat un model de tip regresie liniară univariată,
aşa cum am învăŃat la operarea programului prezentat anterior sau la capitolul de
teorie.
Fie:
x = variabila independentă, cu domeniul de variaŃie cuprins între 12.1 şi 86.9
f(x) = funcŃia de regresie definită între valorile variabilei dependente y şi ale celei
independente x, cu expresia:
f(x) = 2.4 + 0.04 * x2
Pentru a reprezenta grafic această funcŃie se tastează următoarea secvenŃă:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 48

x := 12.1.. 86.9
2
f ( x) := 2.4 + 0.04⋅ x

300

200

f ( x)

100

20 40 60 80
x
Pentru a afla oricare estimată a variabilei dependente din funcŃia de
regresie, utilizatorul tastează o valoare oarecare din domeniul de variaŃie al lui x,
în cadrul expresiei funcŃiei f(x). De exemplu pentru a estima valoarea variabilei
dependente la x = 59.65, se tastează:
f (59.65) =
care va returna automat rezultatul, astfel că pe ecran apare:
f (59.65) = 144.725
Pentru a modifica parametri graficului (dimensiune, marcarea norului de
puncte, culoarea graficului funcŃiei etc.) în versiunile inferioare se poziŃionează
cursorul în interiorul graficului şi se tastează f, iar în versiunile superioare se
execută “dublu - clic” cu tasta stângă a mouse-ului, după care se operează în
interiorul meniurilor oferite.
În cazul unei regresii duble se apelează fereastra pentru grafice în spaŃiul
3D, din meniul corespunzător.
Exemplu:
2 3
f ( x, y ) := 0.13 + 0.06⋅ x + 0.1⋅ y

i := 0 .. 78

j := 2 .. 40

x := 12 + i
i

y := 0 + j
j

M
i, j ( i j)
:= f x , y

unde f(x,y) este o ecuaŃie de regresie bivariată evaluată în programul SYSTAT, i


şi j sunt doi incremenŃi adaptaŃi la modul de variaŃie al celor două variabile
independente. Cotele suprafeŃei de regresie sunt incluse în matricea M, ca noduri
într-o reŃea dreptunghiulară de puncte (xi , yi). În spaŃiul marcat (colŃul stânga -
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 49

jos) al ferestrei de definire a graficului, se înscrie numai identificatorul de


matrice, în cazul nostru M, iar rezultatul va arăta astfel:

M
De asemenea, prin accesarea meniurilor se pot modifica numeroşi
parametri ai graficului (se poate roti în toate dimensiunile, mări sau micşora,
schimba axele, scările etc.).

3. MODELE DEFINITE PRIN FUNCłII DE INTERPOLARE

În ecologie interpolarea, reprezentarea grafică şi calcularea estimatei


funcŃiei de interpolare într-un punct, care nu aparŃine reŃelei de noduri, este una
dintre cele mai utile aplicaŃii ale sistemului MathCAD.
Extrem de bune sunt funcŃiile de interpolare spline. Date fiind n puncte (xi,
yi) funcŃiile spline cubice au forma:

Pi ( x) = c 0i + c i ( x − x i ) + c 2i ( x − x i ) 2 + c 3i ( x − x i ) 3

unde i ia valori naturale succesive în domeniul 1, 2 .. n.


În exemplul de mai jos este evaluată o funcŃie spline cubică f(x) care
trasează forma albiei unui râu, în secŃiune transversală, pe baza unei serii de
măsurători, se calculează aria secŃiunii transversale a râului, lungimea graficului
(a albiei în secŃiune), iar introducerea unei estimate a vitezei momentane medii de
curgere a apei, permite evaluarea debitului.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 50

ORIGIN ≡ 1 n := 8
În calculele de mai jos:
i := 1 .. n n = numãrul de noduri (puncte în care s-au mãsurat adâncimile),
vx := vy := vx = distanta în sectiune transversalã, fatã de un mal
i i
(pozitia nodului in metri, fata de punctul de referinta)
0.0 0 vy = adâncimea mãsuratã în nodul definit prin vx
5.0 .45 f(x) = functia de interpolare
8.3 1.0 g = aria sectiunii transversale de râu
9.2 1.20 h = lungimea graficului (a albiei in sectiune transversalã)
v = viteza medie a apei la un anumit moment
10.4 1.50
12.8 .80
18.7 .56
22.9 0

s := lspline( vx, vy )
f ( x) := interp ( s , vx, vy , x)
x := 0.0, 0.1.. 22.9

f ( x)

x
22.9 22.9
⌠ ⌠
g :=  f ( x) dx  2
⌡ h := 
d 
1 +  f ( x)  dx
0

⌡  dx 
0
v := 1.3

p := g ⋅ v

g = 13.539 h = 23.237 p = 17.6

f ( 10) = 1.435 Posibilitatea evaluãrii valorii functiei de interpolare intr-un punct care nu apartine
retelei de noduri; în acest caz adâncimea estimatã la distanta de 10 m = 1.435 m
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 51

PROBLEME ŞI DEMONSTRAłII

1. Alcătuirea unei rutine pentru calcularea indicilor de biodiversitate mai


des utilizaŃi (biodiversitatea de tip α)

ORIGIN ≡ 1
S semnificã numãrul de specii, X este variabila sir care contine numãrul
S := 10 de indivizi prin care este reprezentatã fiecare specie în probe,
i := 1 .. S N = numarul total de indivizi din probe.
X :=
i
Înurmãtoarele formule d1 = indicele Margalef, d2 = indicele Menhinick
15
H = Shannon-Wiener, E = echitabilitate, simp = Simpson
11
3870
În aceste formule s-a utilizat fie logaritmul zecimal, fie în baza 2 pentru
101
6
ilustrarea modului de schimbare a bazei
41
148
129
9
1885

N := ∑ Xi p :=
i
X
i
i N

S−1 d2 :=
S
d1 :=
log( N) N

 log( p i) 
H := − ∑ p ⋅
i  log ( 2) 

∑ Xi⋅( Xi − 1)
i

log( S) i
l2 := simp :=
log( 2) N⋅ ( N − 1)

H
E :=
l2

N = 6215 d1 = 2.373 d2 = 0.127 H = 1.397 E = 0.421 simp = 0.481


I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 52

2. În tabelul de mai jos sunt sunt redate valorile medii ale diversităŃii specifice
(calculate prin indicele Simpson, codificat prin vy) pentru comunităŃile bentonice dintr-
un râu. StaŃiile (de la S1 la S8) sunt poziŃionate prin distanŃa vx faŃă de izvor (în km). Să
se traseze graficul funcŃiei spline de interpolare a diversităŃii în relaŃie cu distanŃa faŃă
de izvor, şi să se estimeze diversitatea la distanŃele de 10, 20, 30, 40, 50 şi 60 km.
S1 S2 S3 S4 S5 S6 S7 S8
vx 0,01 12 25 31 45 55 60 79
vy 0,02 0,12 0,10 0,45 0,58 0,40 0,65 0,79

ORIGIN ≡ 1
n := 8
i := 1 .. n
vy := vx :=
i i

0.02 0.01
0.12 12
0.10 25
0.45 31
0.58 45
0.40 55
0.65 60
0.79 79

s := lspline( vx, vy )
f ( x) := interp ( s , vx, vy , x)
x := 0.0, 0.01.. 79 Variatia indicelui Simpson

f ( x)

x, vx
f ( 10) = 0.13 f ( 20) = 0.017 f ( 30) = 0.391

f ( 40) = 0.667 f ( 50) = 0.417 f ( 60) = 0.65


I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 53

3. Rutină pentru analiza asocierii dintre specii (pentru partea teoretică a se


revedea Sîrbu şi Benedek, 2004)

a := 48 b := 23
c := 19 d := 22

n := a + b + c + d
2
n ⋅  a⋅ d − b ⋅ c − 
n 

hip :=
  2 
( a + c) ⋅ ( b + d ) ⋅ ( a + b ) ⋅ ( c + d )

Valoarea critica a testului la nivelul de asigurare de 0,05 este de 3,84: asocierea este semnificativa
numai daca valoarea calculata hip este mai mare!

hip = 4.045

coeficienti de asociere - 1. CCM: coeficientul contingentei medii patratice

hip
CCM :=
n + hip

2. C1, 2, 3 = coeficientii lui Cole si erorile standard: Daca ad >=bc atunci C1, e1

a⋅ d − b ⋅ c
C1 :=
( a + b ) ⋅ ( b + d)

( a + c) ⋅ ( c + d )
e1 :=
n⋅ (a + b)⋅ (b + d)

Daca bc>ad si d>=a atunci C2, e2


a⋅ d − b ⋅ c
C2 :=
( a + b) ⋅ ( a + c)

( b + d) ⋅ ( c + d )
e2 :=
n ⋅ ( a + b ) ⋅ ( a + c)

Daca bc>ad si a>d atunci C3, e3


a⋅ d − b ⋅ c
C3 :=
( b + d ) ⋅ ( c + d)

( a + b ) ⋅ ( a + c)
e3 :=
n⋅ (b + d)⋅ ( c + d)
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 54

Indicele de afinitate - Fager

na := a + c nb := a + b
2⋅ a
iab :=
na + nb

( na + nb ) ⋅ ( 2⋅ a − 1)
tt :=  − 1 ⋅ na + nb − 1
 2⋅ na ⋅ nb 

t := tt

gl := na + nb − 2
************************************************************************************************
Rezultate - pentru tabelul de contingenta

3
hip = 4.045 a⋅ d = 1.056 × 10 b⋅ c = 437
CCM = 0.187 d = 22 a = 48

C1 = 0.194 C2 = 0.13 C3 = 0.336

e1 = 0.088 e2 = 0.059 e3 = 0.152

Rezultate pentru analiza de afinitate: iab=indicele Fager, t=valoare test,


gl= grade de libertate:

t = 4.424 gl = 136 iab = 0.696

Daca t calculat este mai mare decat valoarea critica la nivelul de asigurare ales
si gl grade de libertate, afinitatea este semnificativa.
************************************************************************************************
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 55

4. Rutină pentru evaluarea lăŃimii şi suprapunerii nişelor ecologice

Acest exemplu serveşte şi pentru deprinderea modului de definire şi


operare cu matrici. Pentru a defini o matrice, se alege simbolul corespunzător din
meniul de calcul. Apare o fereastră (Insert Matrix) în care se introduc numărul de
rânduri (Rows) şi de coloane (Columns), după care se inserează matricea în locul dorit
(OK) şi se completează cu valorile corespunzătoare.
În exemplul de mai jos considerăm o matrice de 7 resurse, exploatate în comun
de o comunitate formată din 5 populaŃii.
În matricea care apare ne deplasăm cu săgeŃi sau cu Enter, şi umplem spaŃiile
definite prin pătrate negre, cu valorile corespunzătoare. Restul rutinei de mai jos este
autoexplicativă. Pentru partea teoretică a se revedea Sîrbu şi Benedek, 2004.

ORIGIN ≡ 1 n := 7 k := 5

j := 1 .. n i := 1 .. k h := 1 .. k
 0.15 0.05 0.12 0.43 0.17 0.08  0
 
0 0 0.94 0.06 0 0 0
  a :=
p :=  0.41 0.16 0.10 0.05 0.05 0 0.23  j
 0 0.48 0.02 0 0 0.5 0  0.05
  0.07
 0.01 0.02 0.01 0 0.24 0.31 0.41 
0.01
0.12
0.29
0.14
p = 0.15 accesarea unui termen al matricii
1, 1 0.32

S :=
i ∑ pi , j verificarea sumei pe linii a matricii de resurse
j

1
 
1
 
S = 1
1
 
1
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 56

EVALUAREA LATIMII NISELOR


1
B :=
∑ (p i , j)
i 2 Indicele Levins - B

B −1
i
BA := Indicele Levins - B standardizat
i n−1

FT :=
i ∑ p ⋅a
i, j j
Indicele Smith
j

REZULTATE:

B = BA = FT =
i i i
3.852 0.475 0.735
1.127 0.021 0.182
3.823 0.47 0.75
2.08 0.18 0.462
3.102 0.35 0.904

EVALUAREA SUPRAPUNERII NISELOR ECOLOGICE

Indicele Pianka

∑ p i , j⋅ p h , j
j
O :=
i, h

∑ (p i , j) ∑ (p h , j)
2
⋅
2
  
 j  j 

Indicele standardizat HS

∑ (a j⋅ p ⋅p
i, j h , j )
j
HS :=
∑ (a j⋅ p i , j) ⋅ ∑ (a j⋅ p h , j)
i, h


 j  j 

 1 0.289 0.428 0.188 0.24 


 
0.289 1 0.201 0.029 0.018
 
O =  0.428 0.201 1 0.222 0.395 
 0.188 0.029 0.222 1 0.419 
 
 0.24 0.018 0.395 0.419 1 

 1 0.498 0.51 0.346 0.487 


 0.498 1

0.21 0.033 0.015
 
HS =  0.51 0.21 1 0.173 0.778 
 0.346 0.033 0.173 1 0.389 
 
 0.487 0.015 0.778 0.389 1 
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 57

6. ELEMENTE DE ANALIZĂ A SERIILOR DE TIMP

6.1. Aspecte teoretice

Analiza seriilor de timp (AST) este concentrată pe informaŃiile formate


din secvenŃe de măsurători, ordonate în timp, ale unor parametri sau fenomene.
Spre deosebire de toate celelalte analize precedente, prezentarea datelor în AST
se realizează într-un şir ordonat temporal, caracteristicile timpului imprimând
însuşirile reprezentării datelor: unidirecŃional şi ireversibil. Timpul este o
coordonată permanentă a investigaŃiilor ecologice, servind drept variabilă
independentă de raportare a proceselor. ProiecŃia variabilelor ecologice pe axa
timpului desemnează o formă de studiu a dinamicii fenomenelor, alcătuind seriile
de timp sau temporale. Acestea stau la baza analizei statistice, cantitative, a
schimbărilor.
O serie temporală (ST) este un set de date de tipul {xt: t = 1, ..., n} unde
indicele t este timpul la care a fost măsurată sau observată valoarea xt.
Intervalele de timp la care se efectuează măsurătorile nu trebuie să fie
egale. ObservaŃiile sau măsurătorile pot fi valori momentane, acumulative sau
statistice (de exemplu cantitatea de precipitaŃii dintr-un interval de timp,
producŃia medie într-o lună etc.).
Un prim obiectiv al AST este descrierea concisă a unei ST. Aceasta se
poate realiza prin unii parametri statistici descriptivi şi prin reprezentarea grafică
a seriilor de date. Prognoza reprezintă o analiză mai elevată, având ca scop
predicŃia fenomenului, iar monitorizarea are ca scop surprinderea modificărilor
în starea sau comportamentul sistemului analizat. În sfârşit, seriile se mai pot
analiza comparativ pentru a surprinde dependenŃa şi se pot modela prin tehnici
specifice.
Seriile de timp pot fi clasificate şi în funcŃie de existenŃa sau nu a unei
tendinŃe. Astfel, o serie de timp este staŃionară în sens larg, dacă media seriei
(xt) este constantă pe orice perioadă de timp. O ST care prezintă o anumită
tendinŃă se numeşte nestaŃionară, acestea putând avea tendinŃe liniare sau
neliniare.
xt

t
Exemplu de serie temporală staŃionară
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 58

xt

t
Serie temporală nestaŃionară cu tendinŃă liniară

O altă posibilitate de descriere a seriilor temporale o constituie prezenŃa


sau absenŃa unei periodicităŃi, adică intervale relativ egale de timp, în care
fenomenul urmărit prezintă o formă similară de variaŃie.
Prin urmare, principalele caracteristici care se urmăresc la o analiză de ST
sunt tendinŃa şi periodicitatea. Indentificarea tendinŃelor nu se poate realiza prin
tehnici de tip automat, dar există o serie de proceduri care pot contribui la
rezolvarea acestei probleme. De exemplu testul corelaŃiei seriale r ne permite să
verificăm semnificaŃia variaŃiilor aleatoare în cadrul unei serii (Sîrbu şi Benedek,
2004). Dacă seria este monoton crescătoare sau descrescătoare, simpla
reprezentare grafică poate releva natura tendinŃei. Însă în cazul unor variaŃii cu
caracter de "zgomot", sau dacă seriile prezintă erori, identificarea tendinŃei se
bazează pe aplatizare sau netezire.
Netezirea implică realizarea unor medii locale ale datelor, astfel încât
componentele nesistematice ale observaŃiilor individuale să se elimine reciproc.
Astfel, elementele primare sunt înlocuite cu media aritmetică simplă sau
ponderată a n elemente vecine, în care n este lăŃimea ferestrei de netezire. Uneori
se operează cu mediana în locul mediei. În acest fel se elimină "zgomotul" din
ST, iar datele vor fi convertite într-o curbă netedă, care nu va mai fi afectată de
valori extreme.
Un aspect esenŃial al modelării unei ST este identificarea unei ecuaŃii care
să descrie graficul funcŃiei de timp care a produs seria particulară. Multe serii
monotone pot fi aproximate printr-o funcŃie de tip regresie liniară. În cazul în
care modelul este de tip neliniar, adesea problema se poate rezolva prin
transformarea datelor în scop de eliminare a caracterului neliniar. Transformările
cele mai obişnuite sunt, din nou, funcŃiile logaritmice, exponenŃiale sau (mai rar)
polinomiale. Astfel, problema analizei seriale se transformă într-o analiză de
regresie, uni- sau multivariată.
DependenŃa ciclică sau periodică este definită ca o dependenŃă corelativă
de ordin k, între fiecare element i şi elementul k al unei ST, fiind măsurată prin
autocorelaŃie. Dacă eroarea de măsurare nu este prea mare, periodicitatea se poate
identifica vizual, ca un model care se repetă la fiecare k elemente. Modele de
autocorelaŃie, indicii ale prezenŃei periodicităŃii, pot fi vizualizate prin
corelograme. Acestea sunt grafice care ilustrează funcŃia de autocorelaŃie.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 59

Îndepărtarea dependenŃei seriale pentru o perioadă k se realizează prin


diferenŃierea seriei, adică prin conversia fiecărui element i al ST cu diferenŃa
dintre acesta şi elementul cu numărul de ordine (i-k). Această procedură de
transformare se aplică pentru relevarea periodicităŃii ascunse, precum şi pentru
transformarea ST într-o serie staŃionară, fapt necesar pentru unele tehnici de
analiză.
Compararea subseriilor are ca scop surprinderea semnificaŃiei
diferenŃelor dintre două sau mai multe diviziuni temporale în care s-a urmărit un
fenomen particular. Se aplică în mod special la ST în care tendinŃa raportată la o
perioadă îndelungată de timp nu relevă un model regulat, respectiv în cazuri în
care apar rupturi de nivel în reprezentarea ST.
xt
s2
I II

s1 s3
t
Serie temporală caracterizată prin două rupturi de nivel (I şi II)
În graficul de mai sus este reprezentată o serie temporală cu două rupturi
de nivel, fapt care o divizează în trei subserii (s1, s2 şi s3). Când apar asemenea
fenomene este benefic să cunoaştem dacă modificările sunt semnificative (adică
dacă există diferenŃe probabilistice între parametrii descriptivi ai subseriilor),
pentru a determina numărul de subperioade distincte din cadrul ST. Se vor
identifica parametrii fiecărei subperioade, după care se calculează indicatorii
sintetici. Ulterior se poate eventual evalua periodicitatea apariŃiei rupturilor în
cadrul seriei (Andrei şi col. 2002).
Să presupunem că avem o serie temporală xt în care bănuim existenŃa a
două perioade distincte (deci o ruptură de nivel). Verificarea semnificaŃiei
diferenŃelor între acestea se realizează în manieră similară cu cea a comparării
parametrilor statistici descriptivi.
Studiu de caz. VariaŃia efectivului unei populaŃii monitorizate timp de 16 ani
prezintă următoarele valori:

200

150
Efectiv (N)

100

50
Ani
0
1 2 3 5 6 7 8 10 11 12 13 15 16
N 120 68 112 84 135 110 160 56 42 31 46 95 66

Serie temporală cu salt de nivel care este testată pentru semnificaŃia distincŃiei dintre cele
două subperioade.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 60

În acest exemplu putem afirma că între anii 9 şi 10 o cauză a determinat o


mortalitate excesivă a populaŃiei.
Putem testa semnificaŃia diferenŃelor dintre cele două subperioade prin
descompunerea varianŃei totale.
Metoda implică calcularea mediei şi a varianŃei totale (a întregii serii), prin
următoarele formule(după Andrei şi col., 2002).:
16

∑x i
X = i =1
= 94.75
n
16

∑ (x i − X )2
sT2 = i =1
= 1887.13
n

unde n =16 în studiul de caz prezentat. Mediile pentru cele două


subperioade, în care n1 = 9 iar n2 = 7 ani, sunt de 121.78 respectiv 60.0, iar
varianŃele sunt definite prin:
9

∑ (x i − X1)2
s12 = i =1
= 1258.19
n1
16

∑ (x i − X 2 )2
s 22 = i =10
= 535.67
n2

varianŃa medie a subperioadelor este dată de expresia:

s12 n1 + s 22 n 2
s2 = = 942.09
n1 + n 2

Definim prin d2 varianŃa dintre subperioade:

( X 1 − X ) 2 n1 + ( X 2 − X ) 2 n 2
d2 = = 939.28
n1 + n2

VarianŃa totală v2 este suma:

v 2 = s 2 + d 2 = 1881.37

iar ponderea k a varianŃei datorate rupturii se calculează prin expresia:

d2
k = 2 * 100 = 50%
v
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 61

indicând o diferenŃă substanŃială între cele două subperioade.


Pentru a compara varianŃa datorată rupturii (d2) cu varianŃa întregii serii
(sT2) se utilizează testul F-Fischer, prin raportarea celor două varianŃe, fiecare
împărŃindu-se la numărul gradelor de libertate. Deoarece sunt două subperioade,
numărul gradelor de libertate pentru varianŃa d2 va fi GL1 = 1, iar gradele de
libertate pentru varianŃa întregii serii va fi GL2 = n-2 = 14.
În mod analog cu aplicaŃia studiată a testului F-Fischer (a se revedea Sîrbu
şi Benedek, 2004) ipoteza nulă presupune că cele două varianŃe nu diferă
semnificativ. Dacă valoarea calculată este mai mică decât valoarea critică la
nivelul de asigurare ales, pe coloana dată de GL1 şi pe linia GL2, nu respingem
ipoteza nulă. Astfel, formula devine:

d2
GL
F = 2 1 = 6,96
sT
GL2

valoare care, fiind mai mare decât cea critică, permite respingerea ipotezei
nule, prin urmare există diferenŃe semnificative între cele două subperioade.

 Descrierea seriilor temporale


În mod analog cu descrierea statistică a variabilelor de tip şir, cu care am
lucrat frecvent în ecologia practică, există o serie de indicatori care permit
prelucrarea primară a ST.

a. Indicatori absoluŃi
- Termenii absoluŃi ai seriei sunt termenii xt, fiecare reprezentând valoarea
nominală a procesului investigat la valoarea corespunzătoare de timp t. Uneori
aceştia mai sunt definiŃi şi prin date primare sau brute.
- Volumul agregat al seriei are semnificaŃie numai pentru unele ST, constând în
suma tuturor termenilor de tip xt pentru întreaga perioadă. Este evident faptul că
în multe cazuri nu are nici un sens calcularea acestui parametru (de exemplu
însumarea variaŃiilor efectivului populaŃional în timp), alteori este obligatoriu
pentru a defini o caracteristică globală a unui sistem (de exemplu cantitatea totală
de precipitaŃii raportate la un metru pătrat pentru un an). Prin urmare:
n

∑x
t =1
t = volum _ agregat

- DiferenŃe absolute se calculează prin executarea succesivă de diferenŃe între


valorile termenilor ST. DiferenŃele se pot realiza cu bază fixă, atunci când unul şi
acelaşi termen este scăzut din termenii succesivi ai seriei:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 62

xt - xk, unde xk desemnează un anumit termen al şirului, iar t ia valori succesive


(1, 2, ..., i, i+1, ... n).
DiferenŃele absolute cu bază mobilă presupun că valorile şirului nou
construit se formează prin diferenŃe între termeni succesivi ai şirului, indicând
dimensiunea variaŃiei fenomenului curent prin comparaŃie cu o perioadă
anterioară, de exemplu:
xt - xt-1 (unde t ia valori succesive, analog cu cele prezentate anterior; şirul fiind
format din diferenŃa între termenul la momentul t şi cel imediat anterior),
xt - xt-k (constituind diferenŃa succesivă între termenul t al ST şi cel înregistrat
într-o perioadă de t-k anterioară).

b. Indicatori relativi
Ne-am întâlnit cu această categorie de indicatori la analiza tabelelor de
viaŃă şi de fecunditate dinamice (a se revedea Sîrbu şi Benedek, 2004). Aceştia se
formează prin raportarea valorii curente la momentul t cu valoarea unui anumit
termen (de exemplu primul dintr-un şir), caz în care vorbim de indicatori relativi
cu bază fixă. De exemplu termenul coloanei lt a tabelului de viaŃă care semnifica
proporŃia de supravieŃuitori din cohorta originală, raporta efectivul cohortei la
momentul t (at), unde t lua valori succesive de-a lungul întregii generaŃii, la
efectivul momentului iniŃial (a0), adică:
at
lt =
a0

Dacă şirul se formează printr-o relaŃie între termeni succesivi, vorbim de


indicatori relativi în bază mobilă (de exemplu putem defini un parametru de tip:
ax+1/ax).
c. Indicatori medii
Constau în calcularea valorilor tendinŃei centrale a ST, după formule
analoge cu cele ale mediilor. După Andrei şi col. (2002) se pot calcula mai mulŃi
indicatori medii.
- Nivelul mediu al seriei se evaluează în cazul acelor serii care au termeni
însumabili, fie prin simpla aplicare a formulei mediei aritmetice a termenilor, fie
a mediei cronologice, în cadrul unui proces care se desfăşoară într-un flux
continuu de evenimente.
În al doilea caz se evaluează pentru fiecare perioadă de timp cuprinsă între două
momente succesive, valoarea medie a fenomenului particular, adică se determină
semisuma valorilor caracteristice din cele două momente, după care se calculează
media aritmetică ponderată, pe baza expresiei:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 63

n −1
xi + xi +1
∑ 2
ti
X = i =1
n

∑t
i =1
i

- Modificarea medie absolută se evaluează prin media aritmetică a diferenŃelor


absolute cu bază mobilă:
n −1

∑ (x t +1 − xt )
x n − x1
∆= t =1
=
(n − 1) n −1

- Indicele mediu al modificării se calculează prin media geometrică a indicilor


relativi cu bază mobilă :
n −1
xt +1 x
I = n−1 ∏ = n −1 n
i =1 xt x1

Uneori se exprimă şi ritmul mediu al modificării (R), ca diferenŃa dintre 1 şi


indicele mediu I:

R = 1− I

 Analiza tendinŃei unei ST

Din ce în ce mai frecvent termenul de tendinŃă este înlocuit, atât în vorbirea


curentă cât şi în textele de specialitate, cu echivalentul din limba engleză trend.
În materialul de faŃă vom utiliza termenul din limba română, pentru a înlătura
posibilele confuzii.
Problema se complică uneori prin existenŃa unor perioade cu caracter ciclic,
variaŃii determinate de răspunsul fenomenelor ecologice la perioade în care se
repetă condiŃiile de mediu, de exemplu, variaŃii diurne, sezoniere etc. Aceste
cicluri sunt uneori ascunse de variaŃii cu caracter accidental, sau aşa-numitele
“zgomote”, evidenŃiate prin modificări cu caracter discontinuu şi ruperi de nivel.
Prin urmare în AST se consideră că datele sunt constituite pe baza unui
model sistematic (un set de componente care se pot identifica) şi un zgomot
randomizat (eroare) care complică problema identificării modelului. Cele mai
multe tehnici de AST implică filtrarea zgomotului, pentru a reliefa componenta
sistematică.
În acest moment suntem în stare să înŃelegem şi să aplicăm analiza de
regresie, prezentată anterior. Variabila independentă va fi timpul, iar tot ceea ce
am învăŃat se poate aplica şi în AST. Putem reprezenta grafic ST pentru a
identifica necesitatea eventuală a unei transformări a datelor originale, construim
dreapta sau curba după exemplele date, evidenŃiem nivelul de semnificaŃie al
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 64

parametrilor acestora, calculăm coeficientul de determinare etc. În mod


corespunzător, putem obŃine regresii de tip liniar:
x(t) = a + bt
în care am înlocuit variabila dependentă Y (aşa cum a fost redată la capitolul
corepunzător) cu x(t), iar variabila independentă timp este redată prin t.
Sau poate rezulta o expresie obŃinută ca urmare a transformării datelor, de
tipul:
x(t) = a*tb
Prin urmare, multe ST pot fi aproximate printr-un model de tip liniar. În cazul
în care variaŃia monotonă are un caracter neliniar, datele sunt transformate, cel
mai adesea prin logaritmare, funcŃie exponenŃială sau (mai rar) funcŃii
polinomiale.

Netezirea
Se realizează pe baza unei modalităŃi de calculare a mediilor locale ale
datelor, astfel încât componentele nesistematice ale termenilor absoluŃi ai ST să
se anuleze reciproc. Metoda comună de netezire este calcularea unei medii
mobile, care înlocuieşte fiecare termen al şirului, cu mediana, media aritmetică
simplă sau ponderată a n elemente vecine, unde n reprezintă dimensiunea sau
lăŃimea “ferestrei de netezire”. Seriile cu erori mari de măsură sunt netezite prin
tehnici mai rar utilizate cum ar fi cu metoda distanŃei ponderate a celor mai mici
pătrate. ST cu erori relativ puŃine şi sistematice sunt netezite prin utilizarea
funcŃiilor spline cubice.

 InterdependenŃa termenilor seriilor temporale şi analiza periodicităŃii

InterdependenŃa termenilor ST este importantă pentru analiza componentelor


seriilor, dar şi pentru căutarea de modele. Aceasta presupune că fiecare termen
depinde (este explicat) de unul sau de mai mulŃi termeni din trecut. Aceasta
defineşte totodată inerŃia unui fenomen monitorizat în timp, respectiv conexiunea
cauzală probabilistică a termenilor seriei.
O analiză a interdependenŃei presupune calcularea coeficienŃilor de
autocorelaŃie. Primul contact pe care l-am avut cu această abordare, a constat din
verificarea existenŃei fluctuaŃiilor aleatoare într-o serie de date, cu ajutorul
testului r, prin evaluarea primului coeficient de autocorelaŃie. Amintim pe scurt
modul în care se utiliza acest test (după Sîrbu şi Benedek, 2004):
Ipoteza nulă afirmă că fluctuaŃiile unei serii au o natură aleatoare. Se
presupune că observaŃiile sunt independente unele faŃă de altele şi au fost
obŃinute în condiŃii similare.
Primul coeficient serial de corelaŃie pentru o serie de n termeni de tip xt (t
= 1, 2 .. n), este definit prin formula:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 65

n
 n −1
 ∑ (
x t − X x t +1 − X  )( )
r =  t =1 n 
n −1
 ∑ xt − X
2 

( )
t =1

Pentru n ≤ 30 valorile critice sunt date în tabelul testului r din Anexă.


Pentru n > 30 distribuŃia normală este considerată o aproximare rezonabilă şi
valorile pot fi extrase din tabelul respectiv. În ambele cazuri ipoteza nulă este
respinsă dacă valoarea statistică nu este inclusă în domeniul critic.
Pentru a aplica formula generală a coeficienŃilor de autocorelaŃie, pentru un
număr de k perioade care separă perechile de valori, se calculează două medii,
prin intermediul formulelor:
n−k

∑x t
X1 = t =1

n−k
n−k

∑x t +k
X2 = t =1

n−k

Coeficientul k de autocorelaŃie (rk) se calculează prin următoarea expresie:

n−k

cov( xt , xt + k ) ∑ (x t − X 1 )( xt + k − X 2 )
rk = = t =1

s xt s xt + k  n−k 2 
n−k
2
∑ t ( x − X 1 )  ∑ ( xt + k − X 2 ) 
 t =1   t =1 
Dacă n este suficient de mare, caz în care cele două medii sunt egale, sau
dacă seria este staŃionară, coeficientul de autocorelaŃie se calculează după
formula:
n− k

∑ (x t − X )( xt + k − X )
rk = t =1
n−k

∑ (x
t =1
t − X )2

Reprezentările grafice ale valorilor rk în funcŃie de k se numesc


corelograme (sau autocorelograme). În analiza acestora, să Ńinem minte că
coeficienŃii de autocorelaŃie consecutivi sunt dependenŃi unul de celălalt. Aceasta
implică faptul că o dependenŃă serială se poate modifica drastic după îndepărtarea
autocorelaŃiei de gradul 1, adică prin înlocuirea termenilor originali ai seriei cu o
diferenŃă mobilă cu pasul 1.
Îndepărtarea dependenŃei seriale de dimensiunea k, se poate realiza
prin înlocuirea fiecărui element de rang i al ST cu diferenŃa dintre acesta şi
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 66

elementul (i-k). Procedând în acest fel, se poate releva componenta periodică,


respectiv se poate transforma seria reală într-una staŃionară, fapt necesar pentru
unele tehnici de prelucrare a ST.

6.2. Analiza seriilor de timp pe calculator

Analiza seriilor temporale se poate realiza în modulul SERIES al


sistemului de programe SYSTAT. Acesta permite o gamă amplă de tehnici de
analiză, cum sunt: filtrarea liniară şi neliniară, analiza Fourier, descompunerea
periodică, netezirea periodică şi neperiodică, tehnica MARI (medie mobilă
autoregresivă integrată) etc. Redăm în cele ce urmează câteva dintre aplicaŃiile în
ecologie ale acestor analize.
Studiul de caz 1. În fişierul EF.sys edităm şi salvăm cu ajutorul comenzilor
cunoscute, un sistem pradă-prădător monitorizat pe seama efectivelor celor două
specii, timp de 16 ani. Datele primare sunt:

AN N P
CASE 1 81 145 70
CASE 2 82 151 62
CASE 3 83 139 65
CASE 4 84 126 80
CASE 5 85 150 74
CASE 6 86 164 72
CASE 7 87 151 84
CASE 8 88 145 71
CASE 9 89 159 68
CASE 10 90 189 85
CASE 11 91 165 83
CASE 12 92 158 64
CASE 13 93 178 70
CASE 14 94 198 64
CASE 15 95 183 59
CASE 16 96 177 66

unde: CASE nr.curent indică numărul curent al efectuării recensământului,


AN include ultimele două valori ale anului (81 semnifică 1981 de exemplu), N
codifică seria formată de efectivul populaŃiei pradă, iar P efectivul populaŃiei
prădător.
Studiul de caz 2. În fişierul F.sys edităm şi salvăm valorile unui parametru
fizico-chimic al unui râu oarecare (în termeni de concentraŃie), monitorizat lunar
timp de 36 de luni:
C
CASE 1 10
CASE 2 15
CASE 3 20
CASE 4 14
CASE 5 9
CASE 6 12
CASE 7 21
CASE 8 16
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 67

CASE 9 10
CASE 10 14
CASE 11 23
CASE 12 15
CASE 13 9
CASE 14 16
CASE 15 20
CASE 16 17
CASE 17 8
CASE 18 12
CASE 19 22
CASE 20 15
CASE 21 12
CASE 22 16
CASE 23 24
CASE 24 21
CASE 25 7
CASE 26 16
CASE 27 24
CASE 28 13
CASE 29 6
CASE 30 19
CASE 31 26
CASE 32 14
CASE 33 10
CASE 34 16
CASE 35 20
CASE 36 14

Intrăm în modulul de AST cu comanda SERIES, unde chemăm fişierul din


studiul nr. 1:
> USE EF
Pe ecran va apare:
VARIABLES IN SYSTAT RECT FILE ARE:
AN N P
Putem indica programului care este primul termen al seriilor (originea
temporală) respectiv perioada cu care dorim să lucreze. Dacă nu tastăm nimic în
acest sens, primul articol va fi implicit originea seriei, iar periodicitatea este dată
de ordinea termenilor şirului (în acest caz începutul va fi 1981, iar intervalul
implicit de timp este 1 an). Această comandă se poate reda şi prin expresia:
> ID 81,1
care va aduce pe ecran:
SERIES ORIGINATES AT: 81 PERIODICITY: 1
FIRST PERIOD: 1

Reprezentarea grafică a unei ST se poate face şi din acest modul, care a


fost conceput ca o unealtă eficientă şi interactivă pentru analiza serială, utilizând
expresia generală:
>PLOT nume_variabilă_1, nume variabilă 2 etc. / STANDARDIZE LAG = #
MIN = # MAX = # NOFILL CENTER
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 68

unde PLOT produce graficul, acesta este urmat de numele unei variabile,
sau mai multe, despărŃite prin virgule, specificările care urmează barei slash (/)
fiind opŃionale, iar # semnifică un număr întreg.
Dacă nu se specifică nimic, programul redă reprezentarea pentru 15
articole (termeni ai seriei). Dacă se doreşte includerea mai multor termeni, se
specifică prin opŃiunea LAG = nr. de termeni.
Cu opŃiunile MIN = număr şi MAX = număr se specifică o altă scară de
raportare decât cea implicită, iar comanda NOFILL reprezintă seria sub forma
unor puncte şi nu de bare orizontale. Cuvântul rezervat CENTER permite
reprezentarea termenilor prin poziŃia relativă faŃă de media seriei de timp, iar prin
STANDARDIZE sunt înlocuite valorile reale cu cele standardizate.
De exemplu, pentru reprezentarea integrală a seriei N din EF.sys, vom
tasta:
> PLOT N/ LAG = 16
care va aduce pe ecran:
PLOT OF N
NUMBER OF CASES = 16
MEAN OF SERIES = 161.125
STANDARD DEVIATION OF SERIES = 18.977

SEQUENCE PLOT OF SERIES

CASE VALUE 126.000 198.000


+----+----+----+----+----+----+----+----+----+----+
1 145.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦
2 151.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
3 139.000 ¦¦¦¦¦¦¦¦¦¦
4 126.000 ¦
5 150.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
6 164.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
7 151.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
8 145.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦
9 159.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
10 189.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
11 165.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
12 158.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
13 178.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
14 198.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
15 183.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
16 177.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦

Observarea cu atenŃie a acestui grafic, indică existenŃa unei tendinŃe crescătoare a


efectivului în timp, precum şi o periodicitate ciclică în jurul dreptei tendinŃei de
cca. 4 ani.

Transformările termenilor ST se realizează prin câteva opŃiuni, în


memoria activă a calculatorului, astfel încât oricare prelucrare ulterioară se va
face pe şirul termenilor modificaŃi. Pentru a readuce în prelucrări valorile
originale, fie se tastează comanda:
> CLEAR nume_variabilă
fie se reîncarcă fişierul original, cu expresia:
> USE nume_fişier
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 69

Dacă în urma unei transformări, dorim să păstrăm într-un alt fişier noile
valori, acest fapt se specifică prin utilizarea comenzii de salvare, urmat de un
nume nou:
> SAVE nume_fişier_nou
Principalele transformări pe care le utilizăm în modelarea ST sunt realizate
prin comenzile:
> MEAN nume_veriabilă
care elimină media din serie (prin diferenŃa dintre valoarea reală şi media
aritmetică),
> LOG nume_variabilă
transformă valorile reale prin logaritmarea acestora în bază naturală,
> TREND nume_variabilă
are ca efect eliminarea tendinŃei liniare a seriei.
Comanda:
>DIFFERENCE nume_variabilă
are ca efect înlocuirea valorilor reale cu diferenŃa dintre fiecare termen şi
cel precedent, având aplicaŃii practice în transformarea seriei într-una staŃionară.
Dacă dorim să realizăm diferenŃa între valoarea reală şi una situată anterior cu un
număr oarecare de paşi (de exemplu pentru eliminarea periodicităŃii), specificăm
intenŃia prin acordarea unui număr natural în dreptul cuvântului rezervat LAG, de
exemplu:
> DIFFERENCE nume_variabilă / LAG = 4
are ca efect executarea succesivă a diferenŃelor dintre termenul curent şi cel
situat cu 4 paşi înainte.
Dacă dorim raportarea tuturor termenilor şirului la o valoare constantă,
care serveşte ca bază de raportare, indicăm variabila şi numărul curent al valorii
dorite, prin comanda:
> INDEX nume_variabilă/ BASE = număr_curent
De exemplu:
> INDEX N / BASE = 1
va avea ca efect raportarea tuturor valorilor efectivului din EF.sys la prima
valoare a şirului din primul an de studiu.

Netezirea termenilor ST are ca scop eliminarea zgomotelor pentru a reliefa


modelul care stă la baza dinamicii fenomenului, prin expresia generală:
>SMOOTH nume_variabilă / MEAN = # MEDIAN = #
unde: # indică pasul ferestrei de netezire, MEAN şi MEDIAN indică
aplicarea mediei aritmetice respectiv a medianei pentru fiecare # termeni situaŃi
în jurul valorii actuale a seriei.
De exemplu în analiza fişierului EF.sys, expresiile:
>SMOOTH N/ MEAN = 4
>PLOT N /LAG = 16
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 70

vor avea ca efect înlocuirea datelor originale cu media succesivă a câte


patru termeni ai şirului (pentru eliminarea periodicităŃii de 4 ani), după care seria
transformată se reprezintă grafic, rezultând:
SERIES IS SMOOTHED
PLOT OF N
NUMBER OF CASES = 16
MEAN OF SERIES = 159.891
STANDARD DEVIATION OF SERIES = 14.132

SEQUENCE PLOT OF SERIES

CASE VALUE 140.250 184.000


+----+----+----+----+----+----+----+----+----+----+
1 145.000 ¦¦¦¦¦¦
2 151.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦
3 140.250 ¦
4 141.500 ¦¦
5 144.750 ¦¦¦¦¦¦
6 147.750 ¦¦¦¦¦¦¦¦¦
7 152.500 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
8 154.750 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
9 161.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
10 164.500 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
11 167.750 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
12 172.500 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
13 174.750 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
14 179.250 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
15 184.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
16 177.000 ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦
Efectul este de eliminare a fluctuaŃiilor ciclice, seria transformându-se într-
un model monoton, dar este evident faptul că primele şi ultimele valori ale
acesteia nu pot fi transformate.
Autocorelogramele se obŃin prin expresia generală:
>ACF nume_variabilă /LAG = #
Un grafic pentru studiul 1 de caz, se obŃine corespunzător prin comenzile:
>USE EF
>ACF N / LAG = 16
PLOT OF N
NUMBER OF CASES = 16
MEAN OF SERIES = 161.125
STANDARD DEVIATION OF SERIES = 18.977

PLOT OF AUTOCORRELATIONS

LAG CORR SE -1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0


+----+----+----+----+----+----+----+----+----+----+
1 .599 .250 ( ¦¦¦¦¦¦¦¦¦¦¦¦)¦¦
2 .227 .328 ( ¦¦¦¦¦¦ )
3 .281 .337 ( ¦¦¦¦¦¦¦¦ )
4 .361 .352 ( ¦¦¦¦¦¦¦¦¦¦ )
5 .094 .374 ( ¦¦¦ )
6 -.178 .376 ( ¦¦¦¦¦ )
7 -.199 .381 ( ¦¦¦¦¦ )
8 -.136 .387 ( ¦¦¦¦ )
9 -.264 .390 ( ¦¦¦¦¦¦¦ )
10 -.329 .401 ( ¦¦¦¦¦¦¦¦¦ )
11 -.327 .418 ( ¦¦¦¦¦¦¦¦¦ )
12 -.293 .433 ( ¦¦¦¦¦¦¦¦ )
13 -.203 .446 ( ¦¦¦¦¦¦ )
14 -.089 .451 ( ¦¦¦ )
15 -.044 .452 ( ¦¦ )
16 .000 .453 ( ¦ )
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 71

În care LAG indică ordinul coeficientului de autocorelaŃie, CORR valoarea


acestuia, SE eroarea standard a estimării, barele constituie reprezentarea grafică a
coeficienŃilor, faŃă de valoarea zero, iar parantezele indică domeniul de
confidenŃă.
Se observă că aceşti coeficienŃi sunt mai mari la început, apoi din ce în ce
mai mici, tipic pentru o serie cu tendinŃă. Valori apropiate tind să prezinte o
amplitudine similară, iar coeficienŃii situaŃi la distanŃă tind să prezinte valori
opuse (pozitive şi negative). Pentru a vedea ce se întâmplă dacă nu există tendinŃă
(prin eliminarea acesteia prin diferenŃă), vom tasta comenzile:
> USE EF
> DIFFERENCE N
> ACF N / LAG=16
PLOT OF N
NUMBER OF CASES = 15
MEAN OF SERIES = 2.133
STANDARD DEVIATION OF SERIES = 16.411

PLOT OF AUTOCORRELATIONS

LAG CORR SE -1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0


+----+----+----+----+----+----+----+----+----+----+
1 -.058 .258 ( ¦¦ )
2 -.749 .259 ¦¦¦¦¦¦(¦¦¦¦¦¦¦¦¦¦¦¦ )
3 -.041 .377 ( ¦¦ )
4 .662 .377 ( ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦ )
5 .029 .448 ( ¦ )
6 -.531 .448 ( ¦¦¦¦¦¦¦¦¦¦¦¦¦¦ )
7 -.042 .488 ( ¦¦ )
8 .382 .489 ( ¦¦¦¦¦¦¦¦¦¦ )
9 .017 .508 ( ¦ )
10 -.255 .508 ( ¦¦¦¦¦¦¦ )
11 -.025 .517 ( ¦ )
12 .108 .517 ( ¦¦¦ )
13 .012 .518 ( ¦ )
14 -.008 .518 ( ¦ )
15 .000 .518 ( ¦ )
16 .000 .518 ( ¦ )

Graficul de mai sus constituie opoziŃia celui obŃinut pe date reale (cu
tendinŃă prezentă). Acum vom putea mai bine înŃelege semnificaŃia unei
autocorelograme, aşa cum rezultă aceasta din studiul de caz nr. 2:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 72

>USE F
>ACF C / LAG= 36
PLOT OF C
NUMBER OF CASES = 36
MEAN OF SERIES = 15.444
STANDARD DEVIATION OF SERIES = 5.101

PLOT OF AUTOCORRELATIONS

LAG CORR SE -1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0


+----+----+----+----+----+----+----+----+----+----+
1 -.006 .167 ( ¦ )
2 -.845 .167 ¦¦¦¦¦¦¦¦¦¦¦¦¦(¦¦¦¦¦¦¦¦ )
3 .061 .260 ( ¦¦ )
4 .781 .260 ( ¦¦¦¦¦¦¦¦¦¦¦¦¦)¦¦¦¦¦¦
5 -.068 .319 ( ¦¦ )
6 -.738 .319 ¦¦¦(¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦ )
7 .106 .363 ( ¦¦¦ )
8 .662 .364 ( ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦ )
9 -.097 .396 ( ¦¦¦ )
10 -.575 .397 ( ¦¦¦¦¦¦¦¦¦¦¦¦¦¦¦ )
11 .105 .419 ( ¦¦¦ )
12 .531 .420 ( ¦¦¦¦¦¦¦¦¦¦¦¦¦¦ )
13 -.072 .438 ( ¦¦ )
14 -.483 .439 ( ¦¦¦¦¦¦¦¦¦¦¦¦¦ )
15 .057 .453 ( ¦¦ )
16 .461 .453 ( ¦¦¦¦¦¦¦¦¦¦¦¦ )
17 -.084 .466 ( ¦¦¦ )
18 -.438 .467 ( ¦¦¦¦¦¦¦¦¦¦¦ )
19 .076 .478 ( ¦¦ )
20 .351 .478 ( ¦¦¦¦¦¦¦¦¦ )
21 -.077 .485 ( ¦¦ )
22 -.334 .486 ( ¦¦¦¦¦¦¦¦¦ )
23 .069 .492 ( ¦¦ )
24 .276 .492 ( ¦¦¦¦¦¦¦ )
25 -.102 .497 ( ¦¦¦ )
26 -.223 .497 ( ¦¦¦¦¦¦ )
27 .064 .500 ( ¦¦ )
28 .168 .500 ( ¦¦¦¦¦ )
29 -.053 .502 ( ¦¦ )
30 -.114 .502 ( ¦¦¦ )
31 .017 .503 ( ¦ )
32 .056 .503 ( ¦¦ )
33 -.012 .503 ( ¦ )
34 -.026 .503 ( ¦ )
35 .008 .503 ( ¦ )
36 .000 .503 ( ¦ )

Care ne va indica o serie staŃionară (fără tendinŃă), dar cu periodicitate


evidentă. Programul ne pune la dispoziŃie şi posibilitatea urmăririi corelaŃiei
seriale între două serii distincte, de exemplu (în studiul de caz nr. 1, între
prădător şi pradă), fapt care se realizează prin comanda:
>CCF nume_variabilă_1 nume_variabilă_2
în cazul amintit, expresia particulară va fi:
>USE EF
>CCF N P
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 73

având ca rezultat:
PLOT OF CROSS CORRELATIONS

LAG CORR SE -1.0 -.8 -.6 -.4 -.2 .0 .2 .4 .6 .8 1.0


+----+----+----+----+----+----+----+----+----+----+
-7 .140 .333 ( ¦¦¦¦ )
-6 .333 .316 ( ¦¦¦¦¦¦¦¦¦ )
-5 .248 .302 ( ¦¦¦¦¦¦¦ )
-4 .244 .289 ( ¦¦¦¦¦¦¦ )
-3 .357 .277 ( ¦¦¦¦¦¦¦¦¦ )
-2 .046 .267 ( ¦¦ )
-1 -.191 .258 ( ¦¦¦¦¦ )
0 -.163 .250 ( ¦¦¦¦¦ )
1 -.172 .258 ( ¦¦¦¦¦ )
2 -.427 .267 ( ¦¦¦¦¦¦¦¦¦¦¦ )
3 -.451 .277 ( ¦¦¦¦¦¦¦¦¦¦¦¦ )
4 -.209 .289 ( ¦¦¦¦¦¦ )
5 -.171 .302 ( ¦¦¦¦¦ )
6 -.323 .316 ( ¦¦¦¦¦¦¦¦¦ )
7 -.143 .333 ( ¦¦¦¦ )

Acest grafic indică: existenŃa unor tendinŃe similare în cele două populaŃii,
existenŃa unor defazaje în timp (decalări ale efectivului), susŃinând ideea unei
corelaŃii cu tendinŃă inversă.
Prin urmare la ST staŃionare şi periodice, autocorelogramele tind să
prezinte forma unei frunze de ferigă cu baza în sus. Coloanele evidente, indicând
corelaŃii puternice, sunt opuse şi descrescătoare, negativ corelate. Între ele
coeficienŃii de autocorelaŃie au valori mici; deci valorile învecinate au
amplitudini foarte mari.
ST cu tendinŃă şi periodicitate valorile coeficienŃilor de autocorelaŃie
învecinaŃi sunt foarte similare, valorile îndepărtate prezentând tendinŃa de
corelaŃie negativă. Şirul coeficienŃilor tinde să fie monoton, fără salturi mari,
până la un punct, după care revine treptat spre zero.
ST staŃionare şi neciclice se caracterizează prin coeficienŃi de autocorelaŃie
extrem de mici (prin comparaŃie), rar depăşind 0,2, indiferent de semn. Nu se
decelează un model sau o formă distinctă a aranjării valorilor; coloanele sunt
distribuite în sens pozitiv sau negativ într-o aparentă dezordine, iar domeniul de
confidenŃă este îngust, prin comparaŃie cu modelele anterioare.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 74

7. MODELE RECURENTE APLICATE ÎN


ECOLOGIA POPULAłIEI

Pentru a caracteriza o populaŃie, putem evalua o serie de parametri


ecologici cantitativi sau calitativi, cum ar fi: abundenŃa populaŃiei, efectivul,
densitatea (ecologică, brută sau absolută), natalitatea (sau orice alt mecanism prin
care apar indivizi în interiorul unei populaŃii, excluzând imigrarea), mortalitatea,
distribuŃia pe clase de vârstă (structura de vârstă) sau dimensiuni, distribuŃia
spaŃială, dinamica populaŃională (variaŃii ale parametrilor cantitativi ai abundenŃei
sau efectivului în timp) etc. (a se revedea Sîrbu şi Benedek, 2004).
Definim rata absolută a natalităŃii (Ba) ca raportul între numărul indivizilor
născuŃi (∆b) sau intraŃi în populaŃie prin ecloziune, diviziune etc., într-un anumit
interval de timp (∆t), iar rata relativă a natalităŃii (Bs) este raportul între indivizii
nou apăruŃi în interiorul populaŃiei şi intervalul de timp considerat, multiplicat cu
efectivul populaŃiei (N) sau un număr standard (100 sau 1000 de indivizi la
populaŃiile speciilor asexuate, respectiv de femele la cele cu reproducere
sexuată):
∆b
Ba =
∆t
∆b
Bs =
N∆t
Corespunzător definim rata absolută a mortalităŃii (Ma) ca raportul între
numărul de indivizi decedaŃi într-un anumit interval de timp (∆m/∆t), iar rata
relativă a mortalităŃii raportează, analog, parametrul anterior la efectivul
populaŃional (N) sau un număr standard (100 sau 1000 de indivizi):
∆m
Ma =
∆t
∆m
Ms =
N∆t
Pentru a urmări dinamica unei populaŃii sunt necesare date privitoare la
procesele demografice care se desfăşoară (natalitate, mortalitate, imigraŃie,
emigraŃie), a consecinŃelor acestora şi a factorilor care le influenŃează. Pentru a
cunoaşte efectivul populaŃiei la un anumit moment (Nt) este necesară cunoaşterea
dimensiunii populaŃiei într-un stadiu de timp anterior (Nt-1), la care se adaugă
numărul de indivizi imigraŃi în intervalul de timp (I) şi cei care au apărut (B) în
interiorul populaŃiei (prin naştere, eclozare sau oricare alt mecanism biologic),
scăzându-se numărul de indivizi decedaŃi (M) şi cei emigraŃi (E). Prin urmare,
ecuaŃia generală ar fi:

Nt = Nt-1 + B + I - M - E
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 75

Acesta este un prim model matematic al dinamicii populaŃiei, care are


avantajul traducerii unui fenomen complex într-o ecuaŃie clară şi obiectivă. Ea
poate fi manipulată ca orice ecuaŃie matematică, conducând la o flexibilitate care
depăşeşte orice model conceptual. Dezavantajul metodei constă în faptul că
determinarea directă a acestor parametri este posibilă numai în cazuri foarte rare,
atunci când populaŃia poate fi monitorizată în întregime. Cel mai frecvent, pentru
a afla valorile fluctuaŃiilor numerice ale indivizilor unei populaŃii se apelează la
diferite metode estimative şi indirecte. O metodă directă este construirea şi
interpretarea tabelelor de viaŃă şi de fecunditate. Pentru a readuce în memoria
cititorului principiile acestei metode, redăm mai jos tehnica simplificată de
construire a unui tabel dinamic de viaŃă (care urmăreşte procesele demografice
de-a lungul unei generaŃii, în absenŃa migraŃiei) pentru o specie cu generaŃii
discrete. Tehnica integrală de calcul este redată de I. Sîrbu şi A.M. Benedek
(2004) motiv pentru care nu se insistă aici mai mult decât este necesar.
Să considerăm exemplul de mai jos, în care se urmăreşte mortalitatea
specifică de vârstă, pe parcursul a 6 stadii de dezvoltare, a unei generaŃii de
Chortippus brunneus (după Richard şi Waloff 1954, ap. Begon şi col. 1986).

Tab. 2.1. Tabel dinamic de viaŃă al unei generaŃii de Chorthippus brunneus


(după Richard şi Waloff 1954, ap. Begon şi col. 1986).

x ax lx dx qx Fx mx l xm x
Ouă (0) 44000 1.000 0.920 0.92 - - -
Stadiul 1 3513 0.080 0.022 0.28 - - -
Stadiul 2 2529 0.058 0.014 0.24 - - -
Stadiul 3 1922 0.044 0.011 0.25 - - -
Stadiul 4 1461 0.033 0.003 0.11 - - -
AdulŃi 1300 0.030 0.030 1.00 22617 17 0.51

În acest tabel stadiul, vârsta sau intervalul de timp, este codificat prin x, iar
variabilele specifice de stadiu prin indicele subscript x (de exemplu ax sau l x).
Variabilele din acest tabel au următoarea semnificaŃie:
 ax = numărul de indivizi în viaŃă la începutul fiecărui stadiu. Aceste valori sunt
specifice fiecărei populaŃii şi an, făcând comparaŃiile directe imposibile. De
aceea se lucrează cu valori standard, care se trec în coloana următoare, şi
anume:
 l x = proporŃia de indivizi din stadiul iniŃial care au supravieŃuit la începutul
stadiului x:
lx = ax / ao
 d x = proporŃia de indivizi eliminaŃi din populaŃie în fiecare stadiu, adică:
(l x - l x+1)
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 76

 q x = rata mortalităŃii specifice de vârstă (stadiu), adică raportul d x / l x.


Această rată este caracteristică pentru fiecare populaŃie şi poate fi înŃeleasă ca
probabilitatea de deces a unui individ în decursul unui stadiu x.
Până în acest punct ne-am ocupat numai de numărul de indivizi şi am
înregistrat variaŃiile numerice ale acestora prin variabile standardizate, pentru a
permite găsirea unei proceduri de realizare a unor studii comparative.
Tabelul de fecunditate începe cu coloana următoare, în care sunt
înregistraŃi numărul de urmaşi produşi de generaŃia parentală în decursul stadiului
x.
 Fx = este coloana în care se înscrie numărul de urmaşi produşi de lotul studiat
în stadiul x.
 m x = numărul mediu de urmaşi produşi de fiecare individ supravieŃuitor din
stadiul x. Altfel spus, m x = Fx / a x
 l xmx = este produsul între valorile din coloanele lx şi mx, semnificând numărul
mediu de urmaşi produşi de fiecare individ din stadiul 0 (iniŃial) în decursul
etapei x.
Dacă notăm cu Rx produsul mxlx definim un parametru sintetic al tabelelor
de viaŃă, şi anume rata netă de modificare (sau reproducere) a populaŃiei.
Aceasta redă factorul de multiplicare al mărimii populaŃiei la sfârşitul unei
generaŃii parentale (de câte ori se poate multiplica mărimea unei populaŃii în
decursul unei generaŃii). Cu alte cuvinte am obŃinut un prim model populaŃional,
care exprimă determinist dinamica acesteia, de forma:

Nt+1 = RtNt

care este o ecuaŃie recurentă de ordinul 1, din cauza faptului că relaŃionează


dimensiunea populaŃiei la momentul (t+1) de cea înregistrată la un interval
anterior de timp (t). În exemplul de mai sus Rt este valoarea ultimei celule ale
produsului mxlx = 0.51, semnificând că dimensiunea populaŃiei a scăzut la cca. o
jumătate faŃă de anul precedent.
O ecuaŃie recurentă de ordinul 2 ar implica calcularea dinamicii în două
etape, cunoscând efectivele populaŃiei la momentele (t) şi (t-1), adică Nt şi Nt-1,
precum şi ratele fundamentale Rt-1 (dintre momentul t şi t-1), precum şi Rt (dintre
t+1 şi t), adică:

Nt+1 = RtNt + Rt-1Nt-1


În mod corespunzător o ecuaŃie de diferenŃă sau recurentă de ordinul 3 ar
implica parametri evaluaŃi în trei stadii de timp ale studiului etc. Pornind de la
acest exemplu de evaluare a dinamicii populaŃionale pe baza tabelelor de viaŃă şi
de fecunditate, să urmărim dezvoltarea altor categorii de modele, pe care le vom
realiza din ce în ce mai complex, în scopul apropierii de cazuri cât mai generale,
care aproximează mai corect fenomenele din natură.
După cum am mai specificat, urmărirea unui fenomen în timp se poate face
în mod continuu sau în mod discret (în ultimul caz exemplul este chiar tabelul de
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 77

viaŃă precedent). EcuaŃiile matematice care descriu modificările în timp continuu


sunt ecuaŃii diferenŃiale, iar cele care caracterizează schimbările în intervale
discrete de timp sunt ecuaŃii recurente sau de diferenŃe.
Dezvoltarea modelului dinamicii populaŃionale se va baza pe tehnica
expusă de Gillman şi Hails (1997).
În exemplul anterior, în care am analizat efectul direct al fecundităŃii şi
supravieŃuirii asupra modificării numerice a populaŃiei, am obŃinut o ecuaŃie care
constituie un model determinist (depinde explicit numai de parametri de intrare)
independent de densitate (probabilitatea de supravieŃuire a indivizilor din
fiecare clasă nu depinde de interacŃiunile intraspecifice, condiŃionate de
abundenŃa acestora). Dacă redefinim rata netă de creştere sau de modificare
numerică a populaŃiei (care Ńine seama de produsul dintre supravieŃuire şi
fecunditate) printr-un termen general, pe care îl definim fie prin expresia rata
finită de creştere a populaŃiei λ (Gillman, Hails, 1997) sau prin expresia
adaptată după May (1981, ap. idem) factorul multiplicativ de creştere pe
generaŃie, obŃinem ecuaŃia generală:
Nt+1 = λNt
care este tot o ecuaŃie recurentă de ordinul 1, unde λ este constantă în timp şi se
poate calcula pe oricare stadiu corespondent al două generaŃii succesive (fiind un
model determinist, independent de densitate). Dacă aceste condiŃii sunt
îndeplinite şi λ este mai mic decât unitatea, va surveni extincŃia deterministă a
populaŃiei.
Invers, cunoscând efectivul populaŃiei la momentul (t+1) şi cel de la
momentul (t), din ecuaŃia anterioară se poate calcula valoarea ratei finite de
creştere, prin ecuaŃia:
Nt +1
λ=
Nt
Exemplu: dacă într-un studiu realizat prin metoda tabelelor de viaŃă asupra
unei specii vegetale (terofită anuală), am numărat pe suprafaŃa de probă 23450 de
seminŃe germinate în anul 1 şi în anul următor (în acelaşi stadiu) 36459, rata
finită de creştere a populaŃiei se calculează prin relaŃia:
λ = 36459 / 23450 = 1.55.
Este evident că această abordare a dinamicii populaŃionale este extrem de
simplă. În realitate abundenŃa unei populaŃii (fie în termeni de efectiv sau
densitate) are implicaŃii majore asupra capacităŃii de supravieŃuire şi de
fecunditate a indivizilor, prin efectele mecanismelor de reglare intraspecifică
(competiŃie, stress, probabilitatea de a găsi un partener pentru reproducere etc.).
Totodată λ este dependent de fluctuaŃiile mediului, variaŃii în timp şi spaŃiu ale
parametrilor abiogeni, fapt care implică renunŃarea la ideea de valoare constantă
şi trecerea la o distribuŃie de probabilităŃi a valorilor pe care le poate avea în
timp. Reglarea populaŃională dependentă de densitate va modifica
corespunzător modelul enunŃat, prin faptul că mortalitatea creşte cu abundenŃa
(efectivul sau densitatea) populaŃiei. Dacă notăm cu s proporŃia indivizilor care
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 78

supravieŃuiesc (echivalentul parametrului lx din tabelele de viaŃă), iar cu N o


măsură a abundenŃei populaŃiei, care se poate exprima în moduri variate (cum ar
fi efectivul, densitatea ecologică sau brută, densitatea absolută etc.), am putea
identifica cel puŃin trei categorii majore de relaŃii între supravieŃuire şi abundenŃă
(modele dependente de densitate), redate în Fig. 2.1.
s
1

3
Nmax
0 N
Fig. 7.1. Trei modele potenŃiale de dependenŃă între fracŃia indivizilor care
supravieŃuiesc într-o unitate de timp (s) şi densitatea sau abundenŃa populaŃiei (N); după
Gillman şi Hails, 1997.

Cel mai simplu model evidenŃiat de Fig. 7.1 este relaŃia liniară dintre
fracŃia de supravieŃuire s şi abundenŃă N (modelul 2). Reamintim că ecuaŃia
generală a dreptei este:

f(x) = a + bx

unde x este variabila independentă, b este panta dreptei iar a este


intercepŃia.
Dacă notăm intercepŃia ordonatei de către dreaptă cu 1 (valoarea
probabilităŃii de supravieŃuire a unui individ la limita minimă a densităŃii) iar
panta dreptei de regresie cu m, putem rescrie ecuaŃia generală a dreptei ca:

s = 1 - mN

Acest model presupune că există un Nmax, valoarea maximă a densităŃii,


dincolo de care populaŃia este incapabilă să supravieŃuiască (în grafic intercepŃia
abscisei de către dreaptă), deci la care s=0. De asemenea există şi o densitate
minimă Nmin la care s ≈ 1 sub care de asemenea populaŃia dispare.
Gradientul sau panta dreptei m se poate analoga cu tangenta unghiului
format de segmentele definite prin s, Nmax, O, ceea ce conduce la relaŃia:
1
m=
N max
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 79

Prin înlocuirea lui m în ecuaŃia generală a modelului dependent de


densitate, rezultă:

s = 1 - (1 / Nmax) N

s = 1 - N / Nmax

care, repetăm, caracterizează relaŃia dintre probabilitatea de supravieŃuire a unui


individ (sau fracŃia de supravieŃuire a indivizilor) şi efectivul (abundenŃa)
populaŃiei.
Putem acum să construim un nou model al dinamicii populaŃiei, care va
evalua efectivul la momentul (t+1), ca funcŃie de efectivul din momentul anterior
(t), de rata finită de modificare a populaŃiei (λ), dar care Ńine seama şi de efectele
dependente de densitate (s ca funcŃie de N), adică:

 Nt 
N t +1 = N t λ1 − 
 N max 

care este ecuaŃia logistică discretă a dinamicii populaŃionale, dependentă


de densitate. Uzual nu se aplică notaŃia Nmax pentru valoarea maximă a densităŃii
sau abundenŃei, ci aceasta este înlocuită cu litera K, având aceeaşi semnificaŃie,
dar care se mai poate defini şi drept capacitatea de suport. Aceasta mai
semnifică densitatea maximă a unei specii, care poate fi susŃinută (suportată) de
un habitat particular. MulŃi consideră că acest parametru caracterizează atât
specia particulară, cât şi calitatea habitatului (abundenŃa şi disponibilitatea
resurselor acestuia). Uneori se operează cu inversul capacităŃii de suport, care se
notează cu α = 1/K
Prin urmare, dacă:
N max = K
respectiv
1
α=
K

atunci obŃinem ecuaŃiile echivalente:

 N 
N t +1 = λN t 1 − t 
 K 

respectiv:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 80

λN 2t
N t +1 = λN t (1 − αN t ) = λN t −
K

Am scris aceste relaŃii nu pentru a ne juca cu expresii matematice, ci pentru


a ilustra faptul, că modelul dependent de densitate nu este liniar ci în mod evident
neliniar, deci un polinom de gradul 2. Reamintim aici că un model polinomial (o
funcŃie polinomială) are forma generală:

f(x) = a0 + a1x + a2x2 + ...+ anxn

unde n este un număr natural; n ≥ 0. Ordinul sau gradul acestui model este cea
mai mare putere a lui x în expresia funcŃiei.
Având ecuaŃia dinamicii populaŃionale dependente de densitate, putem
realiza numeroase simulări pe calculator (în programul MathCAD de exemplu) ,
dând valori parametrilor λ, K şi Nt, respectiv urmărind modul în care aceştia se
reflectă în variaŃiile valorii aşteptate Nt+1.

Problemă. Să se construiască în MathCAD o serie de grafice care să simuleze


dinamica populaŃională anuală pentru diferite valori ale lui λ, la K=100 şi K=200,
pentru un interval de timp de 21 de ani şi efectiv iniŃial constant, utilizându-se
modelul logistic discret.

Rezolvare. Se tastează secvenŃa de mai jos:

K1 := 100 K2 := 200 λ := 2 t := 1 .. 20

N1 := 30 D1 := 30

 Nt   Dt 
Nt+1 := λ ⋅Nt ⋅ 1 −  Dt+1 := λ ⋅Dt ⋅ 1 − 
 K1   K2 

prin care modelăm dinamica populaŃională a două sisteme caracterizate prin


valori diferite ale capacităŃii de suport (K1 şi K2). Apelarea modulului de grafică
bidimensională, va produce graficul din Fig. 7.2.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 81

120
120

100

Nt
80
Dt
60

40
30
0 5 10 15 20
0 t 21

Fig. 7.2. Model logistic discret al dinamicii populaŃionale la λ=2.0

Dinamica modelului populaŃional la λ=2 aproximează o creştere logistică,


ce se încheie cu un echilibru staŃionar al efectivului în timp, care depinde de
valoarea lui K. Păstrând aceleaşi date ale problemei, dar alegând λ = 3.0 obŃinem
Fig. 7.3.

150
150

Nt 100

Dt

50

30
0 5 10 15 20
0 t 21

Fig. 7.3. Model logistic discret al dinamicii populaŃionale la λ=3.0

care indică un echilibru dinamic ce se caracterizează prin oscilaŃii periodice între


două valori ale densităŃii: se mai numesc şi cicluri limită în două puncte.
Mărind valoarea lui λ la 3.5 vom obŃine graficul de mai jos, care
corespunde cu un echilibru ciclic în patru puncte (Fig. 7.4)
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 82

200
200

150
Nt

Dt
100

50
30
0 5 10 15 20
0 t 21

Fig.7.4. Model logistic discret al dinamicii populaŃionale la λ=3.5

Pentru λ = 4 dispare echilibrul ciclic, iar fluctuaŃiile aparent prezintă un


model întâmplător, care este denumit dinamică haotică. În toate cazurile K nu
afectează dinamica ci doar nivelul la care este realizat echilibrul sau dinamica
haotică (Fig. 7.5)

210 200

150
Nt

Dt 100

50

0 0
0 5 10 15 20
0 t 21

Fig. 7.5. Model logistic discret al dinamicii populaŃionale la λ=4.0

Dinamica haotică a unui fenomen nu înseamnă faptul că acel fenomen este


un produs al întâmplării. Multe procese “haotice” pot fi rezultate ale unor
fenomene previzibile, deterministe, aşa cum se vede şi din exemplul de mai sus.
Nu este întotdeauna simplu să se distingă între randomizare sau stochasticitate şi
dinamica haotică (a se revedea cele expuse la analiza seriilor de timp).
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 83

Până acum am considerat dependenŃa de densitate a probabilităŃii de


supravieŃuire, ca fiind o funcŃie liniară. În cazul în care această dependenŃă nu
este liniară, ci corespunde cu curba de tip 3 din Fig. 7.1, atunci fracŃia indivizilor
supravieŃuitori (s) scade cu abundenŃa sau densitatea populaŃiei (N) după o
funcŃie negativă exponenŃială, de tipul:

s = e-aN

unde parametrul a se poate considera ca intensitatea dependenŃei de densitate.


Este evident faptul că s scade cu atât mai accentuat, cu cât a este mai mare, aşa
cum rezultă din simularea în Mathcad (Fig. 7.6).

a1 := 0.001 a2 := 0.01 a3 := 0.1


N := 10 , 20 .. 500
− a1 ⋅N − a2 ⋅N − a3 ⋅N
s1N := e s2N := e s3N := e

1
1

s1 N

s2 N
0.5
s3 N

0 0
0 100 200 300 400 500
0 N 500

Fig. 7.6. Simularea relaŃiei dintre abundenŃă N şi probabilitatea de supravieŃuire s la


diferite valori ale exponentului a.

EcuaŃia modelului de dinamică populaŃională cu dependenŃă neliniară de


densitate, devine:

Nt+1 = λNte-aNt

aceasta fiind tot o ecuaŃie recurentă neliniară de ordinul I, cunoscută sub


denumirea de ecuaŃia Ricker (1954, ap. Gillman şi Hails, 1997).
Evaluarea parametrilor λ şi a din date reale (experimentale) se realizează
cel mai bine prin exprimarea ecuaŃiei sub forma unei drepte de regresie astfel:
ambii termeni ai ecuaŃiei se împart la Nt şi se logaritmează expresia, rezultând
ecuaŃiile echivalente:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 84

N t +1 N 
= λe −aN t ⇔ ln t +1  = ln(λ ) − aN t
Nt  Nt 
Prin urmare, datele demografice experimentale se pot reprezenta sub forma
unei drepte de regresie de tipul ecuaŃiei de mai sus, după care estimăm ln(λ) din
intercepŃia ordonatei de către dreapta de regresie (lnλ) iar panta dreptei sau
coeficientul de regresie va fi egal cu parametrul a.
Pînă în acest moment am considerat populaŃia ca având generaŃii discrete,
sau că procesul de reproducere se desfăşoară în mod discret în cadrul unor
populaŃii cu generaŃii suprapuse. În natură însă, aceste trăsături acoperă doar o
parte din posibilităŃi: numeroase specii nu îşi sincronizează reproducerea, care
poate fi astfel considerată ca un proces continuu. Evident modelele de tip recurent
nu mai sunt valabile în acest caz; noul model pe care îl căutăm va trebui să se
raporteze la un timp continuu, şi astfel vom dezvolta modelele diferenŃiale, pe
care le vom studia în materia din semestrul următor.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 85

8. MODELARE STATISTICĂ NELINIARĂ


(cu aplicaŃii în programul STATISTICA)

MODELE STATISTICE ŞI MODELE TEORETICE

Statistica este un limbaj al ştiinŃei, care ne permite să înŃelegem natura


(Zimmerman, 1995 ap. Franklin et al., 2001).
Lumea este caracterizată prin incertitudine; toate sistemele şi procesele
prezintăşi fluctuaŃii cu caracter imprevizibil, de "zgomot". Ca urmare sistemele
observaŃionale, dintre noi şi natură (lumea reală), conŃin atât de multe surse de
incertitudine, încât chiar dacă procesele sunt deterministe, previzibile,
observaŃiile sunt de obicei nesigure. Dacă înŃelegem teoria ca o forŃă ce trece
dincolo de date, care înglobează cazurile particulare în ansambluri integratoare,
atunci putem afirma că orice model, indiferent de forma şi construcŃia acestuia,
este o formă a teoriei ecologice (Mangel şi col., 2001). În această abordare putem
identifica o nouă clasificare a modelelor: teoretice şi statistice.
Modelele statistice sunt utilizate pentru obŃinerea, analiza şi interpretarea
datelor. Acestea utilizează în special metode statistice inferenŃiale, cum ar fi de
exemplu definirea şi estimarea parametrilor pe baza datelor reale. Modelul
statistic cel mai comun are un singur parametru populaŃional - media (µ), pe care
o estimăm pe baza parametrului statistic corespunzător (media aritmetică a şirului
de date) şi a limitelor de confidenŃă (a se revedea Sîrbu şi Benedek, 2004). Pe
măsură ce înaintam în studiul ecologiei, am învăŃat să realizăm analize de
regresie (univariată şi liniară), de corelaŃie, precum şi primii paşi în testarea
ipotezelor (teste parametrice, cum ar fi t-Student pentru două medii, testul w/s
pentru normalitatea unei distribuŃii, F-Fischer pentru două varianŃe, χ2 pentru
două distribuŃii de frecvenŃe, Z pentru proporŃii, precum şi un test neparametric,
şi anume Wilcoxon-Mann-Whitney).
Modelele statistice nu iau în considerare mecanismele intime ale
proceselor; ele stabilesc relaŃii între variabile sau categorii de fenomene, fără
analiza cauzalităŃii lor.
După G.C. White (2001) modelele statistice au trei funcŃii importante. În
primul rând ele pot fi testate şi verificate prin datele reale. În al doilea rând, dacă
le acceptăm ca unelte abstracte utile pentru descrierea fenomenelor naturale, le
putem folosi şi pentru analiza calităŃii datelor reale de care dispunem. În sfârşit
utilizarea modelelor şi datelor pentru estimarea parametrilor pot releva funcŃii şi
însuşiri emergente ale sistemelor, stabili prognoze ale dinamicii proceselor, sau
orienta mangementul resurselor naturale.
Prin urmare modelele statistice sunt de tip "post-hoc", adică sunt realizate
după ce datele au fost colectate.
Prin contrast, modelele teoretice includ descrierea mecanismelor, a
relaŃilor cauzale dintre fenomene, conducând astfel spre prognoze înainte ca
datele să fie colectate (Mangel şi col., 2001). Altfel spus, ele sunt de tip "ante-
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 86

hoc". Când utilizarea modelelor de acest gen nu produce convergenŃa


prognozelor cu rezultatele, înseamnă că trebuie să reconsiderăm modelul teoretic,
logica acestuia, precum şi calitatea datelor disponibile.
Modelele statistice sunt frecvent agregative, adică grupează categoriile de
elemente după expresii medii ale însuşirilor sau performanŃelor acestora. Acest
fapt îndeamnă la prudenŃă, mai ales atunci când traiectoria sistemelor este
influenŃată de variabilitatea sau comportamentul individual al elementelor
constituente. De exemplu, multe modele ale unor însuşiri emergente, cum ar fi de
creştere populaŃională, energetica comunităŃilor etc., depind explicit de ratele de
creştere, mortalitate, natalitate, reproducere, strategii comportamentale active de
selectare şi exploatare a teritoriului. Aceste însuşiri individuale prezintă o relativă
autonomie, producând potenŃial modificări însemnate în rezultatele modelului
sistemului care le integrează (idem).

Atunci când modelele (fie ele teoretice sau statistice) sunt utilizate pentru
planificarea măsurilor de management a resurselor naturale, trebuie considerate
cele două paradoxuri ale lui Ludwig (1995, ap. Mangel şi col., 2001), care
relaŃionează incertitudinile din natură cu cele ale modelelor, şi anume:
1. Managementul productivităŃii durabile nu poate fi optim;
2. Modelele eficiente de management nu pot fi realiste.
Sursele acestor două paradoxuri sunt legate de problemele ridicate de
statistică şi relaŃiile dintre modele şi date. Una dintre implicaŃiile acestora, şi în
mod special al celui de-al doilea paradox, este şi aceea conform căreia:
"consideraŃiile statistice invalidează toate modelele, cu excepŃia celor mai simple,
agregative, ca unelte eficiente de management".

Este benefic ca în procesul de modelare să tratăm separat întrebări de tipul


"de ce" (distale/funcŃionale), de "cum" (proximale/mecaniciste). Primele se
adresează cauzelor fenomenelor, fiind fundamentate prin teoria evoluŃiei prin
selecŃie naturală sau artificială. Modelele care se ocupă de întrebări proximale se
concentrează asupra modului în care operează un mecanism şi cum se realizează
un proces (idem).
Acele modele care sunt simultan cele mai explicative (adică ne ajută să
înŃelegem datele) şi totodată cele mai bune predictive (prognozează rezultate
înainte de a avea dovezile din lumea reală, ne ajută să identificăm noi date prin
extrapolarea rezultatelor viitoarelor experienŃe) sunt totodată şi cele mai valabile,
respectiv utile, pentru scopul alcătuirii lor.
După cum am mai afirmat în acest manual, modelele statistice sunt cel mai
frecvent limitate la procesul sau sistemul particular studiat, respectiv sunt valabile
pentru seturile disponibile de date experimentale. Ele nu sunt generalizabile şi
nici - un alt termen de specialitate - transpozabile (adică nu pot fi aplicate la un
alt set de date, decât în eventualitatea unor modificări adecvate a parametrilor,
respectiv a recalibrării eficiente). Prin contrast, modelele teoretice, care includ
descrierea mecanismelor intime, sunt transpozabile şi - în limitele definirii unor
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 87

anumite seturi de variabile independente, cu domeniile lor aferente de variaŃie -


sunt şi generalizabile. Oricum, aceste considerente pot fi supuse şi diverselor
excepŃii sau critici; depinde de modul în care definim problema, de datele
disponibile, şi de cum ştim să extrapolăm rezultatele.

REGRESIILE UNIVARIATE LINIARE

Acest subcapitol este o scurtă recapitulare a unei teme studiate la ecologia


sistemelor suprapopulaŃionale din anul precedent, care se refera la analiza de
regresie şi corelaŃie, pe care o utilizăm pentru a readuce în memorie noŃiuni de
bază, generalizabile, dar şi pentru a servi ca rampă de lansare pentru studiul unor
modele statistice mai generale.
Un model statistic de tipul unei relaŃii de regresie (o funcŃie) implică
existenŃa unei variabile independente (fie aceasta X) şi a uneia dependente (pe
care o putem nota cu Y). Cu alte cuvinte X determină, condiŃionază sau îl
influenŃează pe Y, respectiv variaŃia luiY este cauzată (şi de) cea a lui X.
Un pas logic este reprezentarea grafică, de obicei sub forma unui nor de
puncte, a perechilor experimentale de date, de tipul (xi, yi), unde i este numărul
curent al probei sau al observaŃiei unitare, un increment care ia valori de la 1 la n
(n fiind numărul total de probe unitare, sau dimensiunea statistică a probei;
numărul total de observaŃii). În funcŃie de forma norului de puncte, putem deja
discrimina teoretic între diferitele ecuaŃii care ar putea descrie această relaŃie.
Dacă distingem un nor care se dezvoltă predominant după o axă dreaptă, putem
sugera că relaŃia dintre cele două variabile îmbracă forma unui polinom de gradul
I, având ca expresie geometrică o dreaptă. Altfel spus am putea distinge un model
de tipul:

Y = a + b*X

unde a şi b sunt parametri care trebuie estimaŃi, adică acele mărimi care fac
obiectul principal al modelării statistice, legând datele experimentale de cele
teoretice (ale modelului). Şi iată un prim model statistic. Algoritmul de modelare
este următorul (a se revedea pentru detalii Sîrbu şi Benedek, 2004):

Construirea dreptei de regresie presupune parcurgerea următoarelor etape:


a. Fixarea variabilei dependente şi a celei independente; verificarea
suplimentară a naturii relaŃiei între cele două variabile.
b. Verificarea îndeplinirii celor trei condiŃii enunŃate anterior.
c. Trasarea “norului de puncte”, fiecare punct Ai având coordonatele (xi, yi).
Determinarea parametrilor ecuaŃiei dreptei care trece cel mai aproape de
toate punctele norului se face prin utilizarea metodei celor mai mici pătrate.
d. Se notează:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 88

SP = ∑( xi − X )( yi − Y )
SSX = ∑( xi − X )2
SSY = ∑( yi − Y )2

atunci parametrii ecuaŃiei de regresie se calculează după expresiile:

SP
b=
SSX
a = Y − bX

d. Se poate trasa dreapta de regresie prin norul de puncte, eventual peste


aceasta, sau separat, se poate scrie şi ecuaŃia corespunzătoare.
De reŃinut este faptul că întotdeauna pe dreapta de regresie se află valoarea medie
a lui Y pentru o valoare dată a variabilei X. Regresia are valoare numai între
limitele intervalului de calcul, adică între xmin şi xmax, ecuaŃia neavând valoare de
prognoză pentru valori ale lui X situate în exteriorul acestui interval.
e. Se calculează coeficientul de determinare (r2) care indică “tăria legăturii”,
altfel spus (şi mai corect), proporŃia din variaŃia variabilei dependente care este
explicată de variabila independentă. Acest coeficient variază între 0 şi 1 (uneori
se exprimă în procente, caz în care fracŃia se înmulŃeşte cu 100); legătura este cu
atât mai puternică (şi implicit modelul este mai bun), cu cât este mai aproape de
valoarea maximă.

SP 2
r2 =
SSX * SSY

f. Testarea semnificaŃiei regresiei.

Există posibilitatea ca relaŃia să fie numai aparentă, cauzele putând fi


efectul de probă, erori de colectare şi interpretare a datelor etc. Dacă dreapta de
regresie este în realitate paralelă cu abscisa atunci modelul nu este valabil pentru
populaŃia de date. Presupunem că b (coeficientul de regresie) este un estimator al
coeficientului populaŃional (β) şi că regresia nu este semnificativă (adică β=0).
Ipoteza alternativă presupune o diferenŃă semnificativă între β şi 0. Atunci se
poate aplica testul t pentru verificarea semnificaŃiei coeficientului de regresie,
după formulele:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 89

b
t=
sb
unde :
SSX * SSY − SP 2
sb =
SSX 2 * (n − 2)

Dacă valoarea calculată este mai mare decât valoarea critică din tabelul
testului t (a se vedea Anexa I) la nivelul 0.05 şi (n-2) grade de libertate,
respingem ipoteza nulă.
g. Determinarea limitelor de confidenŃă ale coeficientului de regresie se
realizează prin intermediul expresiei:
β = b ± t ∗ sb

h. Pentru un X dat limitele de confidenŃă ale valorii estimate ale variabilei


dependente Y pot fi calculate cu ajutorul expresiei:
y ± t ∗ sy

1 x − X
sy = s  + i 2 ( ) 2

n SSX 
 

ALTE MODELE STATISTICE ŞI ÎNSUŞIRILE LOR

Modele statistice pot fi parametrice (în exemplul de mai sus am inclus


condiŃia evaluării unor constante de tipul a şi b, care leagă modelul de datele
reale), sau pot fi neparametrice, adică se referă numai la datele experimentale.
Un model de regresie generală implică existenŃa unui set de date
experimentale-pereche pentru fiecare probă (experiment, evaluare, interval de
timp etc.), existând câte un set de informaŃii referitoare la variabila dependentă
(Yi) şi valorile corespunzătoare (la acelaşi timp, loc sau domeniu de referinŃă)
pentru variabilele independente (X1i, X2i, ...,Xki), unde i ia valori succesive de la 1
la n. Modelul de regresie generală este o ecuaŃie propusă de ecolog, iar - prin
utilizarea unor softuri adecvate şi algoritmi pe măsură - se generează valorile
parametrilor care stabilesc legătura optimă dintre ecuaŃie (model) şi datele reale.
Cu cât sunt mai multe observaŃii (seturi de date; adică cu cât este n mai
mare), cu atât acurateŃea estimării parametrilor va fi mai ridicată. Dacă obŃinem
un model bun, putem utiliza relaŃia matematică în sens invers: cel de prognoză a
uneia dintre variabile (indiferent dacă este dependentă sau independentă), ca
funcŃie de celelalte.
Dacă există o relaŃie perfectă dintre datele reale şi cele prognozate de
model (care se pot calcula din relaŃia matematică astfel obŃinută), atunci pentru
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 90

orice valori ale variabilelor independente se poate preciza cu siguranŃă valoarea


exactă a variabilei dependente. Geometric, acest fapt se poate constata atunci
când datele reale sunt plasate exact pe graficul funcŃiei de regresie. De obicei
acest lucru nu se constată (din cauza variabilităŃii generale a fenomenelor, a
incertitudinilor, a considerării unui număr mult mai redus de variabile decât cele
care determină un proces, cauze legate de erori de măsură etc.).
În majoritatea cazurilor va exista o diferenŃă între valorile observate, reale,
ale variabilei dependente şi cele deduse sau prognozate prin model. DiferenŃa
dintre valoarea reală (observată) şi cea prognozată (dedusă prin model, teoretică)
este eroarea estimării, fiind cunoscută şi ca "deviaŃie" sau - mai frecvent -
"reziduală". Putem astfel distinge un alt mod de a discrimina între modelele
valabile, şi anume un model este cu atât mai "bun" cu cât suma rezidualelor este
mai mică.
Un obiectiv esenŃial al analizei de regresie este determinarea valorilor
parametrilor care minimizează suma acestor reziduale pentru un set de obervaŃii
(experimente). Acest deziderat se poate realiza printr-o varietate de tehnici, poate
cea mai simplă şi des aplicată, fiind metoda pătratelor minime (utilizate şi în
exemplul anterior, la regresia liniară univariată).
După tipul de expresie matematică distingem modele liniare sau neliniare
(care îmbracă oricare altă formă decât cea a polinoamelor de gradul I, respectiv a
combinaŃiilor liniare ale acestora); respectiv distingem modele uni- sau
multivariate.
Astfel o ecuaŃie de regresie liniară, generală, multivariată, poate lua forma:
Y = a + b1x1 + b2x2 + ... + bnxn
unde: a este constanta sau intercepŃia ordonatei (valoarea lui Y atunci când toate
variabilele independente sunt 0), b1...bn sunt coeficienŃii de regresie, în număr
egal cu variabilele independente. Altfel spus coeficienŃii b explică cu cât se
modifică variabila Y atunci când cele independente variază cu o unitate.
Analiza de regresie presupune în primul rând evaluarea acestor parametri,
precum şi a gradului (a proporŃiei) în care variabilele independente explică
variaŃia variabilei dependente, fapt ilustrat - din nou - prin parametrul r2
(coeficientul de determinare). Repet faptul că un prim criteriu, extrem de
important, când alegem dintre diferitele modele, este cel de maximalizare a r2.
Astfel, un model va fi cu atât mai bun cu cât r2 este mai aproape de 1.
EcuaŃia de regresie într-un modul de tipul MGLH din SYSTAT (acronim
pentru modeling general linear hypothesis), poate conŃine şi combinaŃii ale
variabilelor independente. În expresia matematică descrisă anterior, pentru
ecuaŃia liniară multivariată, se observă că fiecare variabilă independentă
acŃionează aditiv, indiferent de celelalte, în explicarea variaŃiei variabilei
dependente. Acestea sunt modele fără interacŃiuni, în ceea ce priveşte
variabilele independente, cunoscute şi ca modele de efecte principale.
Unele modele (şi implicit ecuaŃii) includ şi combinaŃii ale variabilelor
independente, cum ar fi de exemplu:
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 91

Y = a + b1x1 + b2x2 + b3x1x2

sau:

Y = a + b1x12 + b2x22 + b3x1x2x32

ImplicaŃiile interacŃiunilor sunt denumite şi efecte moderatoare, deoarece


includ interacŃiuni rezultante ale variabilelor independente, care pot acŃiona în
sens ameliorativ asupra explicării variabilei dependente. Alegerea categoriei de
model şi - prin aceasta - a ecuaŃiei corespunzătoare, nu este un algoritm impus de
calculator, şi nici nu se cunosc reŃete sigure, certe. Este mai degrabă un aspect
care Ńine de joc, dar şi de experienŃa ecologului. În asemenea demersuri
modelatorul petrece un timp îndelungat la calculator, propunând diverse categorii
de ecuaŃii, selectând valoarea acestora (validitatea modelului) pe seama unui set
de criterii obiective. Prin urmare discriminarea între valoarea diverselor modele
propuse este obiectivă, dar propunerea acestora (alegerea, scrierea ecuaŃiilor,
includerea variabilelor independente, ca şi forma lor - cu sau fără interacŃiuni)
este la libea alegere a ecologului.
După valoarea coeficientului de determinare, un al doilea criteriu este
testul t pentru semnificaŃia coeficientului (coeficienŃilor - în cazul unui model
multivariat) de regresie. În toate cazurile de testare, ipoteza nulă afirmă că panta
dreptei (coficientul de regresie) este nesemnificativ, în speŃă că valoarea
coeficientului populaŃional pe care acesta îl aproximează, este de fapt 0. Aceste
informaŃii sunt redate sub forma probabilităŃii care rezultă din aplicarea testului
de către programul corespunzător. Cu cât aceste valori (redate prin nivelul de
semnificaŃie, care se poate nota - în funcŃie de softul utilizat - cu p sau cu α) sunt
mai mici (şi în speŃă mai mici de 0.05 sau - dacă modelatorul nu este prea
exigent, mai mici de 0.1) cu atât parametrii respectivi sunt mai semnificativi.
Un alt criteriu simplu de aplicat şi extrem de practic (însă nu neapărat şi
foarte corect) este să eliminăm din model toate variabilele sau combinaŃiile
pentru care aceste probabilităŃi sunt mai mici de 0.05.
În sfârşit în SYSTAT fereastra de rezultate ale modelului include şi o
analiză a de tipul testului F-Fischer, care analizează semnificaŃia modelului de
regresie ca întreg. Şi la acesta vom recunoaşte un model valabil, dacă
probabilitatea finală este mai mică de 0.05.
Cele mai frecvente modele statistice neliniare utilizate în ecologie sunt de
tipul:
- polinomiale: (exemplu) Y = a + bX12 + cX23
(inclusiv acest tip de model poate fi analizat în MGLH, pentru cele care urmează
recomand utilizarea modulului de statistică neliniară din STATISTICA)
- exponenŃiale: (exemplu) Y = a + b*ex1
- cu componente periodice: (exemplu) Y = a + b*sin(x1) + c*cos(x2)
- combinate (vă puteŃi imagina oricare combinaŃie între cele expuse mai sus).
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 92

EVITAREA ERORILOR DE MODELARE

Criteriile stabilite mai sus ne permit să distingem baze obiective pentru


selectarea unor modele din ce în ce mai valabile, dar nu spun nimic despre
tehnicile de evitare a erorilor, respectiv despre capcanele care pot apare în
modelarea statistică.
O primă regulă - generală - este aceea că mai multe variabile şi - implicit -
parametri, acumulează o cantitate mai mare de nedeterminare şi de variaŃii
accidentale ("zgomote"), prin urmare scad precizia modelului. Altfel spus,
acurateŃea şi precizia modelului va creşte până la un anumit număr de variabile şi
parametri independenŃi, după care va tinde să scadă accelerat cu numărul
acestora. Concluzia este aceea de selectare a unui număr optim, şi (preferabil)
redus, de parametri, precum şi evitarea celor care implică prea multă incertitudine
(Mangel şi col., 2001). Astfel se aplică cel de-al doilea paradox al lui Ludwig,
care mai poate fi enunŃat (şi) prin principiul imperativ: "modelele trebuie
păstrate în variante simple, până când apar motive serioase să le
complicăm".
O a doua idee este cea de a dispune întotdeauna de mai multe ipoteze de
lucru pentru analiza şi modelarea aceluiaşi set de date. Altfel spus, să nu ne
limităm niciodată la o singură abordare, respectiv un singur tip de model, ci să
încercăm să abordăm concepŃii diferite, şi expresii matematice variate, pentru a
avea o bază mai largă de selecŃie.
Din principiul precedent se deduce logic următorul, care sugerează ca
întotdeauna să avem în vedere modele alternative. Problema selectării unui
model valabil este numai parŃial legată de complexitate (de exemplu de numărul
de variabile independente incluse). La fel de importantă este selectarea a ce
anume se include (care sunt variabilele independente considerate, de exemplu).
Întotdeauna trebuie să avem în vedere că este posibil ca modelului să-i lipsească
una sau mai multe trăsături cheie ale sistemului, care explică mai bine
comportarea acestuia, decât variabilele considerate până în prezent. Astfel, este
benefică testarea presupunerilor şi a condiŃiilor de plecare, şi nu numai a
prognozelor oferite de model prin compararea acestora cu datele reale.
Un alt aspect, care nu trebuie uitat, este că modelele statistice au un
domeniu de aplicabilitate limitat, şi sunt greu de utilizat la alte sisteme sau
procese, respectiv în alte condiŃii. Este uşor să greşim atunci când preluăm un
model prefabricat din literatură şi să încercăm să-l folosim - de obicei pe date mai
puŃine şi variabile mai mult sau mai puŃin diferite - într-un alt habitat şi alte
condiŃii ale mediului.
Confuziile dintre modelele statistice şi cele teoretice constituie o sursă
inepuizabilă de erori. Adesea modelul statistic este excelent, explică şi
prognozează un anumit fenomen cu dezvoltare clară spaŃio-temporală, după care
autorii cad în greşeala considerării acestuia drept model teoretic (deci
transpozabil şi generalizabil). Însă nu trebuie subestimată posibilitatea dezvoltării
judicioase a legăturilor dintre cele două categorii de modele: adesea un model
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 93

statistic bun ne poate conduce la o serie de raŃionamente şi analize, care vor


releva explicativ relaŃiile intime, cauzale, sau mecanismele legăturilor de tip
statistic descoperite. Prin urmare, deşi nu sunt sinonime (şi nu pot fi niciodată),
nu înseamnă că cele două abordări nu sunt legate între ele, sau - mai practic - că
nu s-ar sprijini reciproc în calitate de unelte eficiente în cadrul aceluiaşi demers
(idem).
Pentru a construi un model eficient sunt necesare seturi de date valabile,
specificarea mecanismelor şi a proceselor, precum şi a parametrilor, dintre care
unele sau altele pot lipsi în anumite etape ale unui studiu. Nu trebuie să uităm că
modelele sunt (printre altele) metode care permit conducerea, organizarea şi
orientarea cercetărilor viitoare din laborator sau teren. Ele nu se confundă cu
adevărul, ci sunt "minciuna care ne ajută să vedem adevărul", după cum se
exprima metaforic Fagerstrøm (1987, ap. Mangel şi col., 2001).
Un factor important în dezvoltarea modelelor statistice este ideea
necesităŃii construirii unui set de ipoteze de lucru multiple. Diferite surse
argumentează că oamenii de ştiinŃă tind să posede ipoteze preferate pentru
explicarea proceselor naturale. Ei tind să fie subiectivi atunci când verifică aceste
ipoteze, eliminând sau ignorând datele care le infirmă şi supraestimând pe cele
care le confirmă. Aceasta este un alt fel de a spune că şi oamenii de ştiinŃă sunt
supuşi aceloraşi forŃe ca toată omenirea: dacă sunt puşi în faŃa unei explicaŃii care
pare satisfăcătoare, comode şi logice, sunt motivaŃi să creadă pur şi simplu în
aceasta. Pentru a se feri de această continuă sursă de erori şi părtinire, se
sugerează considerarea întotdeauna a multor altor ipoteze de lucru, alternative la
posibilele răspunsuri avansate într-un studiu.
După Platt (1964, ap. Franklin şi col., 2001) necesitatea alcătuirii acestor
ipoteze multiple, urmate de construirea unui set esenŃial de experimente care să le
verifice, apoi excluderea majorităŃii acestora, poartă denumirea de inferenŃă
puternică, fiind un motor al progresului ştiinŃei. S-a argumentat că testarea
ipotezelor poate fi benefic înlocuită prin procedura de testare a modelelor, aceasta
fiind abordarea cheie a procesului astfel definit.

MODELARE ÎN PROGRAMUL STATISTICA

În termenii cei mai generali, modelarea statistică neliniară va evalua relaŃii


între mai multe variabile independente şi o variabilă dependentă, în mod similar
cu cele expuse la analiza de regresie. În fapt, modelarea neliniară este o
generalizare a metodei regresiilor multiple. Deosebirea constă în faptul că prima
lasă libertatea utilizatorului de a defini natura şi forma relaŃiei între cele două
categorii de variabile; “neliniar” implică orice formă a funcŃiei care exprimă
aceste relaŃii. Un model general neliniar are forma:

y = F(x1, x2, ..., xn)


I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 94

unde: F este funcŃia care determină relaŃia dintre cele n variabile


independente şi variabila dependentă sau de răspuns y. Dacă relaŃia este de tip
liniar, obŃinem o particularizare şi anume modelul regresiei multiple, definit prin
formula generală:
y = a + b1*x1 + b2*x2 + ... + bn*xn
Estimarea neliniară ne permite să specificăm orice tip de regresie continuă
sau discontinuă; unele modele sunt predefinite în programul STATISTICA, dar
cercetătorul poate opta pentru orice descriere formală a acestei relaŃii.

♦ Modele polinomiale
Regresia polinomială este un model care apare în mod obişnuit în studiile
de biologie şi ecologie. Dacă studiem, de exemplu, o relaŃie între rata de
dăunători care mor (MORT - variabila dependentă) ca urmare a unui şir de
concentraŃii ale unor substanŃe insecticide (CON_I), putem obŃine într-un studiu
de caz următoarele valori:

Nr. MORT CON_I


1 .850 1000.000
2 .250 101.000
3 .940 1024.000
4 .120 45.000
5 .560 248.000
6 .480 205.000
7 .710 951.000
8 .250 118.000
9 .960 1011.000
10 .110 12.000
Reprezentând norul de puncte observăm că relaŃia este de natură neliniară.
Selectând o funcŃie de regresie polinomială de gradul 2, de tipul:
MORT = a + b1*CON_I + b2*(CON_I) 2
putem obŃine în programul STATISTICA, din meniurile necesare ale modulului
de modelare neliniară, o curbă şi o ecuaŃie de forma:
Model: mort=a+b1*con_i+b2*con_i^2
y=(0.0685345)+(0.0020472)*x+(-0.0000012)*x^2
1.2

1.0 C:9
C:3
C:1

0.8
C:7
MORT

0.6 C:5
C:6

0.4
C:2C:8

0.2
C:10 C:4

0.0
200 400 600 800 1000
CON_I
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 95

unde coeficientul de determinare r2 = 94.2%, iar coeficienŃii de regresie sunt


semnificativi la nivelul de asigurare ales.
În această ecuaŃie, asemănător cu cele expuse la analiza regresiei liniare, a
este intercepŃia ordonatei, b1 şi b2 sunt coeficienŃi de regresie, iar termenul care
determină modelul neliniar este exprimat prin variabila (CON_I)2. Această
categorie de modele este neliniară din cauza variabilelor selectate.
Modele neliniare din cauza parametrilor contrastează cu exemplul
anterior, prin faptul că funcŃia este explicit diferită de cea liniară, nu atât prin
natura variabilelor cât a parametrilor implicaŃi. De exemplu, considerând relaŃia
dintre rata de creştere (C - variabila dependentă) şi vârstă (V - variabila
independentă) la o populaŃie oarecare, definită prin şirurile:
C V
1 1.000 .500
2 .800 1.000
3 .600 2.500
4 .700 4.500
5 .600 6.000
6 .500 8.000
7 .400 12.000
8 .200 15.000
9 .100 18.000
10 .050 25.000
vom putea alege o expresie a relaŃiei de tipul:
C = a * e ( b1*V )
în care a şi b sunt coeficienŃii ecuaŃiei, iar numărul e este baza logaritmilor
naturali (numărul lui Euler). Pentru a defini acest model, vom tasta:

C = a * exp(b1*V)
iar calculatorul va estima automat toŃi termenii ecuaŃiei pe care nu îi recunoaşte
sub forma de etichete ale variabilelor sau alŃi coeficienŃi predefiniŃi. Rezultatul va
arăta astfel:
Model: C=A*EXP(B*V)
y=(0.9486946)*exp((-0.0913291)*x)
1.1

0.9

0.7

0.5
C

0.3

0.1

-0.1
5 10 15 20 25
V
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 96

în care r2 = 96.2%, iar valoarea finală a funcŃiei de pierdere este 0.064;


Natura acestui model nu mai este de tip liniar; această trăsătură rezidă din
însăşi definiŃia funcŃiei care reprezintă relaŃia dintre cele două categorii de
variabile. Evident, unele dintre aceste modele neliniare în parametri pot fi
transformate în relaŃii liniare, prin transformarea datelor, aşa cum a fost expus la
capitolul dedicat regresiilor liniare.

♦ Modele pentru variabile binare.

În numeroase cazuri variabila dependentă este binară, adică poate lua


numai unul din două răspunsuri (1 sau 0; de exemplu studenŃii promovează sau
nu examenul, iau sau nu bursă, sunt sau nu pe locuri bugetare etc.). Apar astfel
modele în care este necesară decelarea relaŃiei între una sau mai multe variabile
continue independente şi o variabilă dependentă binară.
Să analizăm două cazuri de unităŃi de învăŃământ superior care acordă
studenŃilor bursă (A = 1) sau nu acordă (A = 0), în funcŃie şi de un test care
verifică o serie de capacităŃi reunite sub denumirea de coeficient de inteligenŃă
(variabila independentă QI), test la care studenŃii iau note prin valori continue în
domeniul 0.0 (cel mai rău răspuns) şi 1.0. Desigur, bursele se acordă şi în funcŃie
de alte criterii, dar un cercetător ar putea fi interesat dacă instituŃiile acordă sau
nu o pondere importantă inteligenŃei studenŃilor. Extrasele din două şiruri sunt
redate mai jos (am selectat la întâmplare 20 de cazuri din fiecare unitate).

Unitate 1 Unitate2
NR. A QI NR. A QI
1 1.000 .890 1 1.000 .590
2 1.000 .910 2 1.000 .890
3 1.000 .780 3 1.000 .580
4 0.000 .230 4 0.000 .120
5 0.000 .150 5 0.000 .780
6 0.000 .840 6 0.000 .910
7 0.000 .730 7 0.000 .260
8 0.000 .610 8 0.000 .530
9 1.000 .840 9 1.000 .480
10 1.000 .790 10 1.000 .910
11 0.000 .360 11 0.000 .260
12 0.000 .210 12 0.000 .580
13 0.000 .150 13 0.000 .730
14 0.000 .150 14 0.000 .610
15 0.000 .200 15 0.000 .450
16 0.000 .160 16 0.000 .910
17 1.000 .790 17 1.000 .820
18 1.000 .990 18 1.000 .460
19 1.000 .890 19 1.000 .480
20 1.000 .730 20 1.000 .660
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 97

Pentru a rezolva această problemă, în programe de tipul STATISTICA


putem alege funcŃii de răspuns continuu, adică să considerăm o funcŃie de
regresie care prognozează un răspuns în domeniul cuprins între 0 şi 1, cum este
de exemplu modelul de regresie logistică. Astfel, se estimează parametrii
ecuaŃiei de regresie, între variabila dependentă (y) şi una sau mai multe variabile
independente (x1, x2, ... xn), ecuaŃie definită prin formula generală:

exp(b 0 + b1 x 1 + ... + b n x n )
y=
1 + exp(b 0 + b1 x 1 + ... + b n x n )

unde, analog cu exemplele precedente, exp(expresie) = eexpresie


Se poate observa cu uşurinŃă că oricum variază, şi în orice amplitudine,
variabilele independente xi, variabila prognozată y va lua valori cuprinse între 0
şi 1.
Selectând procedura de modelare neliniară din STATISTICA, introducem
cele două fişiere şi solicităm modelarea de tip logistic. Rezultatele finale sunt
redate mai jos:
Cazul 1.
Clasificarea cazurilor
Observate Prognozate Prognozate Procent
0 1 corect
0 9 2 81.8182
1 0 9 100.0000
2
χ = 17.89; α < 0.001
concluzie: model corect (coeficienŃi semnificativi)
Din acest tabel reiese o corectitudine a prognozelor de 82% în cazul
studenŃilor care nu iau bursă, prin criteriul QI, precum şi o prognoză de 100%
pentru cei care iau. Valori mici ale domeniului critic (α) de asemenea informează
asupra validităŃii modelului. EcuaŃia modelului şi expresia grafică a acestuia sunt
redate mai jos.

Model: Logistic regression (logit)


y=exp(-12.769327+(17.594565)*x)/(1+exp(-12.769327+(17.594565)*x))
1.2

1.0

0.8

0.6
A

0.4

0.2

0.0

-0.2
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
QI
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 98

Cazul 2. Clasificarea cazurilor (prognozate şi observate) indică:

Observate Prognozate Prognozate Procent


0 1 Corect
0 7 4 63.63636
1 6 3 33.33333
2
χ = 0.88; α = 0.347

Cu prognoze corecte ale studenŃilor care nu iau burse de 64%, respectiv de


33% a celor care reuşesc aceasta, precum şi pe baza valorii critice mult prea mari
(α = 0.347), rezultă că modelul este incorect (coeficienŃi nesemnificativi).
Graficul de mai jos de asemenea redă această lipsă de semnificaŃie a relaŃiei:

Model: Logistic regression (logit)


y=exp(-1.3748407+(1.936842)*x)/(1+exp(-1.3748407+(1.936842)*x))
1.2

1.0

0.8

0.6
A

0.4

0.2

0.0

-0.2
0.2 0.3 0.4 0.5 0.6 0.7 0.8 0.9
QI

Modelul logistic general de regresie poate fi exprimat ca:

b0
y=
1 + b1 exp(b 2 x )

Spre deosebire de modelul logistic prezentat anterior, cel general permite o


variaŃie a lui y într-un interval definit de utilizator, care poate fi altul decât [0, 1].
Acest tip de model este extrem de util pentru înŃelegerea şi simularea creşterii
logistice a populaŃiilor, aşa cum se va vedea într-un alt capitol din publicaŃia de
faŃă.

♦ Modele discontinue de regresie

În procedura de modelare neliniară avem posibilitatea evaluării relaŃiei de


dependenŃă, care se schimbă în funcŃie de domeniul de variaŃie al variabilei (sau
variabilelor) independente. De exemplu, rata de prădare sau consum evidenŃiată
prin studii de teren pentru un anumit prădător (c = variabila dependentă) creşte
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 99

după o anumită funcŃie până la o densitate P1 a prăzii, şi după o altă funcŃie


atunci când densitatea (d = variabila dependentă) este mai mare de această
valoare. Atunci putem specifica o ecuaŃie de regresie discontinuă, de tipul:

c = b0 + b1 * d * (d< P1) + b2 * d * (d ≥ P1)

În această formulă de regresie discontinuă, expresiile (d< P1) şi (d ≥ P1)


sunt condiŃii logice, care prin evaluare sunt echivalate cu 0 pentru fals şi 1 pentru
adevăr. Astfel, dacă densitatea prăzii este mai mică decât P1 (punctul de
inflexiune), termenul (d< P1) = 1 şi (d ≥ P1) = 0, motiv pentru care ecuaŃia se va
transforma în:
c = b0 + b1 * d
În mod corespunzător se modifică ecuaŃia când densitatea prăzii este mai
mare de P1. În exemplul anterior, pentru simplificare, am utilizat ecuaŃii de
gradul I (funcŃii liniare), dar cele expuse sunt valabile pentru oricare alte funcŃii.
Un model posibil pentru funcŃia discontinuă de regresie prezentată
anterior:
c

P1 d

În alte ocazii, la o anumită valoare a variabilei independente, se


înregistrează un salt în valoarea celei dependente (o rupere de continuitate a
funcŃiei de regresie), cum rezultă din exemplul de mai jos:

P0 d
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 100

Într-un asemenea caz se specifică un nou coeficient de “intercepŃie”, pentru


modelul care urmează din punctul ruperii continuităŃii funcŃiei. Un caz ca cel
prezentat mai sus va avea o ecuaŃie de tipul:

c = (b0 + b1 * d) * (d < P0) + (b3 + b2 * d) * (d ≥ P0)

unde b3 este noul coeficient de intercepŃie, care reprezintă valoarea funcŃiei


de regresie imediat de după salt.

♦ Procedurile de estimare neliniară

Într-un capitol anterior am analizat în detaliu procedura de evaluare a


parametrilor ecuaŃiei de regresie liniare, şi am definit-o pe aceasta ca “dreapta
care trece cel mai aproape de toate punctele”, respectiv cea pe care se află
“valorile medii ale variabilei dependente; pentru oricare valoare a variabilei
independente, valorile celei dependente sunt normal distribuite în jurul mediei”.
Tehnica prezentată anterior se mai numeşte procedura de estimare prin cele
mai mici pătrate, extrem de utilă, facilă, dar nicidecum singura. Această tehnică
se bazează pe minimizarea sumei diferenŃelor pătrate dintre valorile observate
(experimentale) ale variabilei dependente şi cele prognozate de către model.
FuncŃia de estimare prin cele mai mici pătrate este o particularizare a ceea
ce cunoaştem sub denumirea generală de funcŃie de pierdere (loss function, în
engleză). Denumirea are o logică: în orice regresie, simplă sau multiplă, liniară
sau neliniară, estimăm parametrii, astfel încât să minimizăm variaŃia reziduală din
jurul punctului prognozat, situat pe graficul funcŃiei de regresie. Putem spune că
scopul este de a minimiza pierderea de acurateŃe a prognozei noastre, respectiv
de a găsi cele mai mici valori pentru funcŃia care o descrie. Există mai multe căi
pentru a reduce pierderile la un minimum. Prin reziduale se înŃeleg diferenŃele
dintre valorile prognozate de o ecuaŃie de regresie şi cele observate.

• Metoda pătratelor minime ponderate

Metodele amintite anterior presupun că variaŃia erorii în jurul valorilor


estimate ale variabilei dependente este aceeaşi pentru toate valorile variabilei
independente (deci eroarea este egală pentru întregul model, în fiecare punct al
funcŃiei). În mod real această presupunere este adesea neconformă cu realitatea.
Un exemplu care apare permanent în studiile biometrice este norul de puncte de
formă triunghiulară. Norul prezintă o bază mai largă la valori mai mici ale
dimensiunii (sau masei) corpurilor, parte şi din cauza variabilităŃii individuale la
vârste juvenile, dar reflectă şi erori ale aparatului de măsură. Punctele tind să fie
mai apropiate, prin contrast, spre celălalt capăt al domeniului de variaŃie (desigur
această tendinŃă apare statistic, nu este o constantă a studiilor de acest gen). Prin
urmare, eroarea de estimare scade cu creşterea scării de măsură, din diferite
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 101

motive. Pentru a calcula această funcŃie de pierdere în mod diferenŃiat, putem


opta pentru metoda pătratelor minime ponderate, care are expresia:
 1 
Pierdere = (Observat − Pr ognozat) 2 *  2 
x 
Pierderea specifică mai întâi pătratul diferenŃei dintre valoarea observată şi
cea prognozată a variabilei dependente, după care ponderează această diferenŃă
prin raportarea la inversul pătratului valorii variabilei independente. Acest proces
se repetă pentru fiecare punct din nor, după care funcŃia se calculează prin
însumarea valorilor obŃinute.

♦ Algoritmi care minimizează funcŃiile de pierdere

Programul ne permite să decidem asupra modalităŃii de minimizare a


funcŃiei de pierdere, precum şi de estimare a erorii standard a parametrilor. Este
suficient să subliniem că algoritmul implementat în STATISTICA sub denumirea
de quasi - Newton, este extrem de eficient şi recomandat pentru a rezolva această
problemă, fără mare durere de cap. Acesta aproximează derivata de ordinul 2 a
funcŃiei de pierdere, pentru a identifica valoarea minimă a acesteia.
Dintre procedurile alternative care ne stau la dispoziŃie, amintim (fără a
mai intra în amănunte): tehnica minimului local, procedura simplex, modelul
Hooke-Jeeves, Rosenbrock, matricea Hessiană şi erorile standard etc.

♦ Evaluarea calităŃii modelului

Există mai multe metode pentru a afla dacă un model este semnificativ, în
sensul potrivirii valorilor prognozate cu cele observate, respectiv pentru
evaluarea erorilor şi a semnificaŃiei coeficienŃilor.
Selectând meniurile corespunzătoare, putem de exemplu evalua proporŃia
de varianŃă explicată de către model. Astfel, putem obŃine valori cu privire la
varianŃa totală a variabilei dependente (suma totală de pătrate, SST), proporŃia de
varianŃă datorată rezidualelor (suma de pătrate a erorilor, SSE) şi proporŃia de
varianŃă datorată modelului de regresie (suma de pătrate a regresiei: SSR = SST -
SSE). Raportul SSR / SST explică proporŃia de varianŃă înregistrată de model în
variabila dependentă, motiv pentru care această rată este echivalentă cu
coeficientul de determinare (r2 care ia valori între 0 şi 1).

- Verificarea semnificaŃiei diferenŃei dintre distribuŃia de frecvenŃe


observată şi cea prognozată, prin testul χ2. Se aplică pentru evaluarea potrivirii
dintre valorile prognozate şi cele observate în modelul de tip logistic al
variabilelor binare. Parametrul statistic χ2 se calculează şi raportează la gradele de
libertate, egale cu numărul de variabile independente ale modelului. Dacă nivelul
α asociat testului chi-pătrat este semnificativ, putem spune că parametri regresiei
sunt statistic semnificativi (a se revedea exemplul precedent, de la modelul
logistic).
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 102

- Reprezentarea valorilor observate în funcŃie de cele prognozate. Permite


vizualizarea acestei relaŃii sub forma unui nor de puncte; cu cât prognoza este mai
bună, cu atât punctele sunt dispuse pe o dreaptă (ilustrând o relaŃie liniară de
dependenŃă). Modelul este cu atât mai nesatisfăcător cu cât relaŃia se abate mai
mult de la forma unei drepte.
De exemplu, în modelul exponenŃial realizat între creştere şi vârstă (C şi V;
redat anterior), graficul valorilor prognozate în funcŃie de cele observate, este:

Valori Observate vs. Prognozate


1.1

0.9

0.7
Valori Obsevrate

0.5

0.3

0.1

-0.1
0.0 0.2 0.4 0.6 0.8 1.0
Valori Prognozate

- Graficele de probabilitate normală şi semi-normală ale rezidualelor


oferă posibilitatea de a observa, dacă erorile (rezidualele) sunt sau nu normal
distribuite. Modelul este cu atât mai bun cu cât distribuŃia este mai apropiată de
una de tip normal.

- Reprezentarea grafică a funcŃiei de regresie permite vizualizarea


punctelor norului, printre care trece graficul funcŃiei de regresie neliniară,
modelată după unul dintre algoritmii expuşi anteriori. Acest tip de grafic
constituie reprezentarea cea mai directă şi evidentă a rezultatelor, generându-se o
imagine de ansamblu asupra modelului obŃinut.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 103

9. ACTIVITATE INDEPENDENTĂ;
PROBLEME

Integrând cele expuse anterior şi din bibliografia indicată, studenŃii ar


trebui să fie capabili să rezolve pe calculator problemele de mai jos (care
simulează modul în care se va desfăşura partea practică a examenului). Succes!

Problema 1.
În tabelul de mai jos sunt redate valorile unor parametri fizico-chimici şi ai
biodiversităŃii comunităŃilor acvatice din 9 staŃii de prelevare a probelor,
amplasate de-a lungul râului Cibin (după A. Bănăduc, 2005).
Codurile utilizate au următoarele semnificaŃii:
RF = reziduu fix, DO = deficit de oxigen, CBO5 = consum chimic de oxigen
după 5 zile, CMN = consum chimic de oxigen prin metoda permanganatului de
potasiu, MA = indicele Margalef, ISIM = indicele Simpson inversat.
SemnificaŃiile codurilor staŃiilor: S1 - Râu Mare amonte de confluenŃa cu
Dăneasa; S2 - Cheile Cibinului, S3 - amonte lacul Gura Râului, S4 - aval baraj
Gura Râului, S5 - aval Orlat, S6 - amonte Sibiu, S7 - aval Sibiu, S8 - aval Mohu,
S9 - amonte vărsare în Olt.

RF DO CBO5 CMN MA ISIM

S1 124.440 16.320 1.990 3.780 11.170 0.919


S2 142.800 15.130 3.490 7.740 13.254 0.933
S3 111.220 13.130 1.840 3.370 10.695 0.930
S4 148.890 14.760 3.240 5.590 8.971 0.899
S5 222.440 23.100 4.180 7.310 6.216 0.836
S6 217.330 31.230 5.010 8.310 7.668 0.909
S7 209.110 31.270 5.130 9.260 4.281 0.859
S8 555.330 58.700 12.750 17.570 2.695 0.672
S9 294.440 25.210 7.400 14.330 5.290 0.779

CerinŃele problemei:
1. Să se discute posibilităŃile de reprezentare grafică a acestor valori.
2. Să se discute posibilităŃile de prelucrare a datelor.
3. Să se efectueze analiza de corelaŃie între valorile celor doi indici de
biodiversitate, şi o analiză similară între parametrii CBO5 şi CMN.
4. Să se efectueze analiza de regresie între CBO5 şi MA, şi o analiză similară
între CMN şi ISIM.
5. Să se calculeze matricea cu valorile standardizate ale variabilelor.
6. Pe baza matricii cu valori standardizate să se calculeze matricea de distanŃe
euclidiene între staŃiile de colectare a probelor (S1, S2 ... S9).
7. Să se reprezinte grafic matricea de distanŃe euclidiene printr-o dendrogramă,
utilizând metoda de grupare la distanŃă medie.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 104

Problema 2. În tabelul de mai jos sunt redate valorile indicelui de abundenŃă


relativă a principalelor grupe de macronevertebrate bentonice de-a lungul râului
Mureş (S1 - Izvorul Mureşului, S2 - Senetea, S3 - RăstoliŃa, S4 - Ungheni, S5 -
Gura Arieş, S6 - Sântimbru, S7 - VinŃu de Jos, S8 - Pecica). Aceste date relevă
starea ecologică a râului şi calitatea apei şi sedimentelor, având valoare în
caracterizarea impactului antropic asupra ecosistemelor riverane (după Sîrbu şi
col., 2002).

Taxon / StaŃie S1 S2 S3 S4 S5 S6 S7 S8
Hydroidea 0,00 0,00 0,00 0,00 0,45 0,00 0,45 0,10
Plathelminthes 3,46 0,00 0,00 0,00 0,00 0,00 0,00 0,10
Nemathelminthes 0,00 0,00 0,28 0,45 0,18 0,04 0,57 4,47
Oligochaeta 19,04 9,46 3,50 63,29 18,89 63,29 53,31 14,94
Hirudinea 0,00 0,00 0,00 0,34 0,00 0,00 0,00 0,00
Mollusca 0,58 0,17 1,83 0,68 0,36 0,00 0,00 0,10
Amphipoda 56,35 57,54 0,08 0,00 0,00 0,00 0,00 0,00
Hydracarina 0,19 0,62 2,87 0,00 0,09 0,00 0,00 0,00
Collembola 0,00 0,17 0,00 0,00 0,00 0,00 0,06 0,00
Ephemeroptera 4,61 8,77 3,82 7,87 6,83 5,24 2,93 0,81
Odonata 0,00 0,00 0,00 0,00 0,18 0,08 0,06 0,00
Plecoptera 1,54 1,99 0,12 0,34 0,00 0,00 0,00 0,00
Trichoptera 0,19 1,16 33,24 0,00 2,61 0,60 2,99 0,51
Coleoptera 9,81 13,43 0,72 0,00 0,00 0,04 0,00 0,00
Chironomidae 3,65 6,07 51,47 27,03 68,71 30,27 38,80 78,77
Diptera 0,58 0,62 2,07 0,00 1,71 0,44 0,82 0,20

Pe baza acestor date să se compare între ele staŃiile de prelevare a probelor,


utilizându-se distanŃa medie euclidiană, să se reprezinte grafic sub forma unei
dendrograme prin metoda de grupare la distanŃă medie. Să se comenteze
rezultatul.

Problema 3. Un studiu de variabilitate morfologică şi biometrică a fost realizat la


4 populaŃii de Holandriana holandri în vederea urmăririi modului în care
variabilitatea intraspecifică variază ecologic şi geografic, precum şi pentru
verificarea statutului taxonomic al subspeciilor citate în România (după Sîrbu,
1998). Fiecare individ are o fişă de diagnoză, iar tabelul de mai jos redă procentele
de indivizi din loturile studiate care prezintă caracterul codificat corespunzător.
Codurile caracterelor sunt următoarele (...) Pentru penultimul anfract: SMPA – şir
mamelonar, CPA – carenă, Pentru ultimul anfract: SMSUA – şir mamelonar
superior, CSUA – carenă superioară, LSUA – linie superioară, SMMUA – şir
mamelonar median, CMUA – carenă mediană, NORN – nu există ornamentaŃii, E3
– trei dungi brune în exterior, E2 – două, respectiv E1 – o singură dungă brună
spirală, I3 – trei dungi brune în transparenŃa peretelui palatal al aperturii, I2 – două,
I1 – o dungă vizibilă prin transparenŃă. EX3INT – trei dungi vizibile atât în
exterior cât şi prin transparenŃă, EX2INT – acelaşi lucru dar pentru două dungi,
NDB – nu există dungi brune, etc. etc.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 105

S1 S2 S3 S4
V$ C_GRAD C_VRANI N_SASCA L_TRIK
SMPA 23.070 24.560 8.600 1.660
CPA 3.840 24.560 3.220 3.320
LPA 17.290 3.510 0.000 1.660
SMSUA 44.200 29.820 54.840 1.660
CSUA 1.910 3.510 19.350 0.000
SMMUA 5.750 5.260 19.350 0.000
CMUA 3.830 10.520 58.060 0.000
LXMUA 17.290 5.260 3.220 3.320
LINUA 28.830 26.310 36.560 0.000
INFLUA 0.000 1.750 7.520 6.660
SFSUP 84.610 59.650 89.240 1.660
SFMED 80.750 43.860 87.100 3.320
SFINF 28.830 26.310 36.560 0.000
NEMORN 5.760 33.330 6.450 91.670
E3 9.610 5.260 11.830 100.000
I3 1.920 5.260 6.450 100.000
E2 40.380 10.520 51.610 0.000
I2 55.760 17.540 65.590 0.000
E1 3.850 0.000 0.000 0.000
I1 7.690 0.000 1.070 0.000
NDB 32.700 77.190 17.200 0.000

Problema cere să se compare loturile analizate prin construirea unei matrici


de distanŃe euclidiene şi să se reprezinte grafic sub forma unei dendrograme
(metoda de grupare la distanŃă medie). Să se calculeze pentru fiecare lot valoarea
indicelui de diversitate (morfologică) după formula Shannon-Wiener. Să se
comenteze rezultatele obŃinute.

Problema 4. Dinamica spaŃială a poluării cu doi compuşi chimici oarecare (în


mg/m3 sol), redată prin distanŃa faŃă de o sursă industrială (în km), este :
DistanŃa faŃă de sursă : 0, 0.2, 0.5, 1, 2, 4, 8, 12, 12.2, 16.5, 20
Compus 1 : 89.9, 80.5, 56.4, 61.3, 60.9, 34.6, 12.4, 12.5, 10.2, 2.0, 1.0
Compus 2 : 45.3, 21.1, 16.3, 16.9, 16.6, 10.4, 8.2, 4.1, 3.6, 2.9, 0.
- Să se modeleze dinamica prin interpolare cu funcŃii spline cubice.
- Să se evalueze în ambele cazuri unde se estimează reducerea la jumătate a
concentraŃiei, în funcŃie de distanŃa faŃă de sursă.

Problema 5. Să se construiască în MathCAD rutine pentru aplicarea şi calcularea


parametrilor prin Metoda distanŃelor (Ecologie practică, cap. VIII; Sîrbu şi
Benedek, 2004).
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 106

Problema 6. Se consideră dinamica numerică anuală a trei efective


populaŃionale, redate în tabelul de mai jos:

A B C
132.000 132.000 154.000
453.000 112.000 132.000
325.000 132.000 124.000
354.000 133.000 146.000
567.000 125.000 155.000
678.000 143.000 167.000
768.000 122.000 185.000
756.000 154.000 177.000
456.000 135.000 164.000
423.000 143.000 152.000
132.000 165.000 120.000
243.000 134.000 135.000
465.000 133.000 122.000
543.000 146.000 127.000
365.000 162.000 149.000
576.000 154.000 164.000
789.000 152.000 173.000
867.000 155.000 159.000
536.000 162.000 158.000
435.000 166.000 144.000
122.000 172.000 139.000
637.000 164.000 136.000
946.000 166.000 121.000
242.000 164.000 143.000
456.000 165.000 150.000
165.000 168.000 167.000
377.000 179.000 170.000
232.000 182.000 181.000
747.000 168.000 162.000
134.000 193.000 152.000
132.000 174.000 148.000
456.000 199.000 144.000
111.000 177.000 130.000

• Să se execute analiza seriilor de timp pentru cele trei populaŃii;


• Să se interpreteze aspectele legate de tendinŃe şi ciclicitate;
• Să se caute modele statistice pentru tendinŃele detectate (ecuaŃiile de
regresie pentru tendinŃa exprimată ca funcŃie de timp, probabilităŃi de
semnificaŃie, eroare standard de estimare şi coeficient de determinare).
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 107

Problema 7. În aplicaŃia de mai jos DIST semnifică distanŃa faŃă de o sursă de


poluare (în km), PB este concentraŃia de plumb (în mg/kg sol), CU concentraŃia
de cupru, Zn de zinc, iar DENS este densitatea unei populaŃii aparŃinând unei
specii edafice sensibile la poluare (în nr. indivizi / dm3 sol).
StaŃii PB CU ZN DENS DIST
s1 2.200 4.120 12.450 0.000 0.5
s2 2.200 3.190 11.450 0.140 1
s3 2.100 1.000 10.300 1.500 1.5
s4 2.600 2.000 10.040 0.400 2
s5 1.400 2.410 10.000 0.100 2.5
s6 1.300 3.000 8.540 1.500 3
s7 1.100 2.150 9.120 1.500 3.5
s8 0.600 2.100 8.430 1.800 4
s9 0.900 1.900 8.200 5.800 4.5
s10 1.100 1.400 8.000 5.300 5
s11 0.300 1.340 8.000 10.400 5.5
s12 0.100 1.120 2.160 12.200 6
s13 0.400 0.960 0.130 15.200 6.5
s14 0.200 0.350 0.120 13.700 7
s15 0.200 0.320 0.050 38.160 7.5

1- Să se reprezinte grafic variaŃia variabilelor cu distanŃa faŃă de sursa de poluare.


2- Să se afle principalii parametri statistici descriptivi pentru fiecare variabilă.
3- Să se alcătuiască matricea de corelaŃii între concentraŃiile de metale grele şi să
se verifice semnificaŃia coeficienŃilor.
4- Să se afle modele statistice de regresie între DENS şi metalele grele (atât
modele uni- cât şi multivariate).
5- Să se modeleze dinamica spaŃială a variabilelor în funcŃie de distanŃa faŃă de
sursă prin interpolare cu funcŃii spline cubice pe porŃiuni.
Problema 8. În metoda transectelor, estimatorul lui Hayne pentru densitate (DH)
este dat de expresia:
nR
Dˆ H =
2L
unde: n = numărul de indivizi aparŃinând unei anumite specii, identificaŃi la o
parcurgere a transectului; L = lungimea transectului; R = media inverselor
1 n 1
distanŃelor de vizualizare (media armonică) = ∑ ; ri = distanŃa de vizualizare
n i =1 ri
a fiecărui individ i (i ia valori succesive naturale în intervalul dintre 1 şi n).
Definim varianŃa estimatorului lui Hayne [var(DH)], respectiv eroarea
standard [ES(DH)] prin expresiile:

 n
1  
2



∑ 
 − R 
 
1 i =1  ri  
var(Dˆ H ) ≈ Dˆ H  +
2


n R 2
n ( n − 1) 
 
 
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 108

ES ( Dˆ H ) = var(Dˆ H )

iar limitele de confidenŃă (L1,2) ale densităŃii medii se calculează după expresiile:

L1, 2 = Dˆ H ± tα ES ( Dˆ H )

unde: tα = valoarea critică din tabelul t-Student la nivelul de asigurare ales (uzual
0.05) şi (n-1) grade de libertate = 1,64.

Şirul distanŃelor de vizualizare (în metri) a exemplarelor unei specii


oarecare, în timpul parcurgerii unui transect de L = 1000 m, este redat mai jos (n
= 38 indivizi):
ri = {12, 36, 10, 19, 51, 15, 68, 45, 36, 28, 87, 46, 52, 12, 16, 45, 69, 24, 15, 79,
31, 53, 26, 84, 15, 2, 65, 31, 19, 51, 63, 28, 16, 24, 23, 9, 17, 25} (metri).

Să se afle densitatea, varianŃa, eroarea standard şi limitele de confidenŃă.


Calculele se efectuează mai întâi în metri, iar valorile finale se raportează
la km , prin înmulŃirea valorilor estimatorilor cu 106.
2

EXERCIłII - MODELARE NELINIARĂ (CU RĂSPUNSURI)


Problema 9. RelaŃia între producŃia primară algală f (mg/t) şi concentraŃia
nutrienŃilor x (mg/l) este redată prin cifrele de mai jos. Să se afle care dintre
modele polinomiale de gradul I, II sau III descrie cel mai bine această relaŃie
neliniară.

x f(x)
1 14.8
4 160.0
9 1689.0
15 7775
42 170400
50 287500

răspuns: f=12.5 + 2.3*x3


I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 109

Problema 10. În tabelul de mai jos x este variabila independentă iar f este cea
dependentă. Care dintre următoarele modele este cel mai adecvat descrierii
fenomenului?
a. f=a+bx
b. f=a+bx3
c. f=a*bx
d. f=a*ex - asta este!
x f(x)
1 0.815
4 16.379
9 2431
15 980700

Problema 11. În tabelul de mai jos x şi y sunt variabile independente, iar f este
funcŃia bivariată f(x,y).

x y f(x, y)
1 1 0.665
5 5 1.923
9 9 -0.218
12 12 0.164
24 24 1.045
28 28 -7.777
32 32 -1.458
42 42 3.954
50 50 1.952
care dintre următoarele modele neliniare, aproximează cel mai bine această
relaŃie?

a.) f ( x, y ) = a + b * sin 2 ( x) + c * cos 2 ( x)


1
b.) f ( x, y ) = a + b * (sin( x)) 2 −
cos( x 3 )
1 1
c.) f ( x, y ) = a − b * 2
+ c*
sin( x) cos( x) 2

răspuns: b
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 110

10. BIBLIOGRAFIE SELECTIVĂ

1. Andrei, T., Stancu, S., Pele, D.T., 2002 - Statistică. Teorie şi aplicaŃii. Ed.
Economică, Bucureşti.
2. Begon, M., Harper, J.L., Townsend, C.R., 1986 - Ecology. Individuals,
Populations and Communities. Sinauer Associates Inc., Publ., Sunderland,
Massachusets.
3. Cox, G.W., 2002 - General Ecology; Laboratory Manual (Eight Edition),
McGraw - Hill Publ., 312 pp.
4. Curtean-Bănăduc, A., 2005 - Râul Cibin. Caracterizare ecologică. Ed. Univ.
"Lucian Blaga" Sibiu, 242 pp.
5. Digby, P.G.N., Kempton, R.A., 1987 - Multivariate Analysis of Ecological
Communities. Chapman and Hall, London, New York, 203 pp.
6. Diggle, P.J., 1995 - Time Series. A Biostatistical Introduction. Clarendon
Press; Oxford University Press, 257 pp.
7. Drăgulescu, C., Sîrbu, I., 1997 - Practicum de Fitocenologie. Univ. "Lucian
Blaga" Sibiu, 102 pp.
8. Edgar, G.A., 1990 - Measure, Topology and Fractal Geometry. Springer-Verlag,
New York, Berlin, Heidelberg, London, Paris, Tokyo, Hong-Kong, 230 pp.
9. Falniowski, A., 2003 - Metody numeryczne w taksonomii. Wydawnictwo
Uniwersytetu Jagiellońskiego, Kraków.
10.Gillman, M., Hails, R., 1997 - An Introduction to Ecological Modelling;
Puting Practice into Theory. Methods in Ecology (eds. J.H. Lawton, G. E.
Likens). Blackwell Sceince.
11. Gomoiu, M.T., Skolka, M., 2001 - Ecologie; Metodologii pentru studii
ecologice. Ovidius University Press, ConstanŃa.
12. Hair, J.F., Anderson, R.E., Tatham, R.L., Black, W.C., 1998 - Multivariate
Data Analysis Prentice Hall, New Jersey.
13. Hastings, H.M., Sugihara, G., 1993 - Fractals; A User’s Guide for the Natural
Sciences. Oxford University Press, Oxford, New York, Tokyo, 232 pp.
14. Jeffries, C., 1989 - Mathematical Modeling in Ecology; a Workbook for
Students. Mathematical Modeling, 3, Birkhäuser - Boston, Basel, Berlin, 191
pp.
15. Johnson, R.A., Wichern, D.W., 1998 - Applied Multivariate Statistical
Analysis (Fourth Edition). Prentice Hall, New Jersey
16. Jørgensen, S.E., 1988 - Fundamentals of Ecological Modelling. Developments
in Environmental Modelling, 9. Elsevier; Amsterdam, Oxford, New York,
Tokyo.
17. Jørgensen, S.E., Bendoricchio, G., 2001 - Fundamentals of Ecological
Modelling. (Third Edition) Developments in Environmental Modelling, 21.
Elsevier; Oxford, 1 - 523.
18. Kanji, G.K., 1993 - 100 Statistical Tests; Sage Publications, London, Newbury
Park, New Delhi.
I. Sîrbu - Bazele modelării proceselor şi sistemelor ecologice (I - 2008) 111

19. Krebs, C.J., 1989 - Ecological Methodology. Harper Collins Publishers, New
York.
20. Mangel, M., Fiksen, Øyvind, F., Giske, J., 2001 - Theoretical and Statistical
Models in Natural Resource Management and Research. In: Shenk, T.M.,
Franklin, A.B., (Editors) - Modeling in Natural Resource Management.
Development, Interpretation, and Application. Island Press, Washington,
Covelo, London, 57 - 73.
21. Saporta, G., Ştefănescu, V., 1996 - Analiza datelor şi informatică. Ed. Econ.,
Bucureşti.
22. Silvert, W., 2001 - Modelling as a Discipline. Int. J. General Systems, 30 (3),
261 - 282.
23. Sîrbu, I., 1996 - Programe pe calculator pentru asistarea studiilor de
speoclimatologie. Cercetări speologice, 4, ed. C.N.T.T., p. 70 - 82.
24. Sîrbu, I., 2003 – A new mathematical measure of ecological niches overlap
and similarity assessment. Acta oecologica, Univ. “Lucian Blaga” Sibiu, 10
(1-2), 167 - 172.
25. Sîrbu, I., 2003 - Sisteme ecologice: structură şi funcŃii; Partea a 2-a - ecologia
comunităŃilor; Note de curs. Univ "Lucian Blaga" Sibiu, 100 pp.
26. Sîrbu, I., Benedek, A.M., 2004 - Ecologie practică. Ed. Univ. Lucian Blaga,
Sibiu.
27. Sîrbu, I., 2007 - Introducere în modelarea proceselor şi sistemelor ecologice
(în format electronic - suport de curs şi aplicaŃii practice; în curs de publicare;
250 pp).
28.Scheiber, E., Lixăndroiu, D., 1994 - MathCAD. Prezentare şi probleme
rezolvate. Ed. Tehnică, Bucureşti.
29. Smith, R.L., 1986 - Elements of Ecology (second edition). Harper & Row,
Publishers, New-York.
30. Smith, R.L., 1990 - Ecology and Field Biology. Harper & Row, Publishers,
New York, Grand Rapids, Philadelphia, St. Louis, San Francisco, London,
Sydney, Tokyo.
31. Takayasu, H., 1990 - Fractals in the physical sciences. Manchaster University
Press; Manchaster and New York, 169 pp.
32. White, G.C., 2001 - Statistical Models: Keys to Understanding the Natural
World. In: Shenk, T.M., Franklin, A.B., (Editors) - Modeling in Natural
Resource Management. Development, Interpretation, and Application. Island
Press, Washington, Covelo, London, 35 - 56.
33. Yakowitz, S.J., 1977 - Computational probability and simulation. Applied
mathematics and simulation, 12. Addison- Wesley Publishing Company, Inc.
Massachussetts.
34. *** 2001 - Mathcad. User's Guide with Reference Manual; Mathcad 2001,
Professional; www.mathsoft.com.

S-ar putea să vă placă și