Sunteți pe pagina 1din 43

3. Modele cinetice ale proceselor biochimice enzimatice.

3.1. Ecuatii biocinetice de tip Michaelis-Menten (deducere, definire rol substrat,


enzima, inhibitor, produs).
3.2. Principalele tipuri de modele cinetice enzimatice.
3.3. Etapele identificarii statistice a unui model biocinetic.
3.3.1. Analiza datelor cinetice experimentale.
3.3.2. Formularea schemei de reactii si a expresiilor vitezelor de reactie.
3.3.3. Formularea problemei matematice de estimare a modelului cinetic.
3.3.4. Solutionarea problemei matematice de estimare a modelului cinetic.
3.3.5. Metode directe (shortcut) de estimare aproximativa a constantelor
cinetice.
3.3.6. Metode exacte de estimare cinetica utilizand metode de optimizare
numerica.
3.3.7. Analiza statistica a calitatii estimatului cinetic.
3.3.8. Reducerea si selectia modelelor cinetice.
3.3.9. Planificarea experimentelor in vederea unei estimari cinetice precise si a
selectiei modelelor cinetice.

Bibliografie:

- Dunn, I.J., Heinzle, E., Ingham, J., Prenosil, J.E., 1992, Biological Reaction Engineering:
Principles: Applications and Modelling with PC Simulation, VCH Weinheim.
- Hames, B.D., Hooper, N.M., Houghton, J.D., 1997, Instant Notes in Biochemistry, Springer
Verlag, New York (cap. C3, C4).
- Mihail, R., Muntean, O., Lavric, V., Ingineria Proceselor Biochimice, Litografia Institutului
Politehnic Bucuresti, 1988.

Modelarea proceselor celulare - cap. 3. Page 48


3.1. Ecuatii biocinetice de tip Michaelis-Menten (deducere, definire rol
substrat, enzima, inhibitor, produs).

v. Bibliografie

3.2. Principalele tipuri de modele cinetice enzimatice.

Expresiile cinetice enzimatice sunt de regula derivate in doua ipoteze:

Tip I: modele cinetice la care se aplica ipoteza de echilibre rapide stabilite de catre
intermediarii enzimatici, iar acestia ating rapid concentratia de echilibru.
Tip II: modele cinetice la care nu se aplica ipoteza de echilibru rapid intre intermediarii
enzimatici, iar expresiile cinetice se deduc prin aplicarea ipotezelor QSS unor
intermediari.

Notatii: S, B = substraturi; P, Q = produsi; I, X = inhibitori; A = activator; 'site' = centri activi

Modele cinetice de Tipul I:


a) Inhibitie simpla:
- inhibitie cu substrat si produs
- inhibitie cu substrat pentru mai multe enzime catalizand aceeasi reactie
- inhibitie competitiva cu P
- inhibitie non-competitiva
b) Inhibitie partiala si mixta (cu intermediari ce duc la produsi)
- partial competitiva
- partial non-competitiva
- liniara mixta cu 1 centru activ
- liniara mixta cu 2 centrii activi
- mixta hiperbolica
- partiala, cu 2 centrii non-competitivi
- partiala, cu 2 centrii competitivi
- cu legarea S de catre I
- cu legarea S de catre I si cu consum de enzima
c) Activare enzima
c1) Activare ne-esentiala (reactia decurge si fara A)
- pura, ne-esentiala
- ne-esentiala si inhibitie competitiva
- ne-esentiala, cu activator - dezinhibitor
c2) Activator substrat - complex
- S, A, (SA) legate de enzima
- (SA) leaga enzima
- (SA) si S leaga enzima
- (SA) si A leaga enzima
- (SA), S si A leaga enzima
- A este activator esential
- A este activator ne-esential si (SA) se leaga la centrul activ catalitic
- A si (SA) sunt substraturi
d) Sisteme reactante multiple (bi-, tri-, etc., cu echilibre rapide)
d1) Sisteme bi-reactante aleatoare (E si Intermediarul sunt activati aleator)
- bi-reactant pur
- I in competitie cu unul din substraturi
- I este non-exclusivist
- inhibitie prin produs (P)
- inhibitie prin substrat (B)
d2) Sisteme bi-reactante ordonate (activatorul activeaza doar E)
d3) Sisteme tri-reactante aleatoare
e) Sisteme multi-'sites' cu enzime alosterice (mai multi centri activi, iar enzimele pot fi
blocate succesiv si crescendo de catre S, in forma (ES), (ESS), (ESSS),...etc).
e1) 'Site' non-cooperative
e2) 'Site' cooperative
e3) 'Site' interactive secventiale Adair-Pauling
e4) Sisteme de 2 'site' active cu inhibitie competitiva
e5) Sisteme de 2 'site' active cu inhibitie competitiva partiala
e6) Sistem multi-'site' alosteric cu activare substrat
e7) Sistem cu activatori multi-'site' esentiali
e8) Sisteme multi-'site' cu activare esentiala cooperativa
e9) Sisteme multi-'site' cu interactii generale
e10) Sisteme multi-'site' cu interactii intre tetrameri
f) Sisteme cu inhibitie multipla a enzimei
f1) Sistem cu 1 inhibitor (I) si multi-'site'
f2) Inhibitie cu amestec de inhibitori (I,X)
- inhibitie competitiva pura
- inhibitie non-competitiva, mixta, reciproc exclusivista
- inhibitie cooperativa (sinergica), non-exclusivista
- inhibitie ordonata X la (EI)
- inhibitie cooperativa, non-competitiva, non-exclusivista
- inhibitie cooperativa, fara competitie
- inhibitie competitiva (I) si non-competitiva (X)
- inhibitie partiala in raport cu I,X
- inhibitie multi-valenta, concertata

Modele cinetice de Tipul II:


1) Sistem iso-uni-uni (Izomerizare enzima - sisteme 'single-site' EA, EP)
2) Sistem ordonat uni-bi si ordonat bi-uni
3) Sisteme bi-bi ordonate (incluzand 'two-sites' EAB, EPQ)
4) Sisteme bi-bi ordonate cu echilibre partial rapide (EAB, EAP)
5) Sisteme bi-bi Theorell-Chance
6) Sisteme bi-bi ping-pong
7) Sisteme bi-bi ping-pong cu echilibre partial rapide
8) Sisteme hibride ping-pong cu echilibru rapid si sistem bi-bi aleator (doua 'site')
9) Sisteme bi-bi iso
- iso-bi-bi ordonate
- iso-Theorell-Chance
- iso-ping-pong
10) Sisteme hibride Theorell-Chance ping-pong
11) Sisteme aleatoare bi-bi cu echilibre rapide
12) Sisteme aleatoare cu stare stationara
13) Sisteme aleatoare bi-bi cu echilibre partial rapide
14) Sisteme cu inhibitie produs si mecanisme bi-reactante
15) Sisteme ter-bi ordonate
16) Sisteme ter-bi ping-pong bi-uni-uni-uni
17) Sisteme ter-ter ordonate
18) Sisteme ordonate ter-reactant cu echilibre partial rapide
19) Sisteme ordonate ter-reactant cu secventa de echilibru rapid aleator
20) Sisteme ter-ter ping-pong bi-uni-uni-bi
21) Sisteme ter-ter ping-pong bi-bi-uni-uni
22) Sisteme ping-pong hexa-uni
23) Sisteme ter-reactant ne-aleatoare
24) Sisteme ter-reactant aleatoare
25) Sisteme cu inhibitie de tip complecsi 'dead-end'
26) Sisteme mixte cu inhibitie de produs si complecsi 'dead-end'
27) Sisteme cu inhibitie de alternativa de substraturi
28) Sisteme cu inhibitie cu produsi alternativi
29) Sisteme cu inhibitie multipla de substraturi

Legenda:
compettiv
non-competitiv (ne-competitiv)
un-competitiv (fara competitie, incompetitiv)
3.4. Etapele identificarii statistice a unui model biocinetic.

Modelarea cinetica pe baza unui mecanism de reactie a unui proces biologic, la nivel
macroscopic dar si la nivel celular, este o etapa esentiala in analiza datelor experimentale.
Aceasta are ca scop sintetizarea si generalizarea datelor experimentale si a informatiilor
calitative in vederea intelegerii fenomenului fizico-chimic-biologic, a variabilelor care il
influenteaza si a semnificatiei parametrilor procesului si modelelor matematice. Dezvoltarea
de modele complexe pentru caracterizarea dinamicii proceselor biocinetice este utila nu numai
pentru intelegerea mecanismului de desfasurare a procesului, dar constituie o baza de calcul
pentru proiecarea, operarea economica si in siguranta a unei instalatii biochimice/biologice
industriale. Modelele cinetice bazate pe mecanisme de reactie sunt din acest punct de vedere
instrumente de calcul si predictie mai sigure fata de cele empirice, oferind avantajul
semnificatiei parametrilor si posibilitatii de stocare a informatiei cuantificabile in vederea
unor analize viitoare ale proceselor similare. In acest context, pot fi elaborate scheme cinetice
ce includ sute si mii de reactii (bio)chimice elementare sau aparente stocate in banci cinetice
specifice (reviews Seressiotis & Bailey, 1988; Shimizu & Bray, 2002; Tomita, 2001; Hucka et
al., 2003). Simularea sistemelor (bio)chimice omogene spatial (zero-dimensionale) sau a celor
heterogene (uni-, bi-, si tri- dimensionale) a realizat succese importante in ultimii ani,
incluzand mecanisme detaliate de reactie si transport de substanta in configuratii geometrice
definite.
Dezvoltarea de modele cinetice complexe are insa si o justificare economica, prin
aportul de informatie si simularile de proces realizate, astfel: i) proiectarea si re-proiecarea
economica a instalatiilor in care se conduc procese biochimice; ii) optimizarea procesului in
raport cu criterii diverse economice, de siguranta si ecologice; iii) imbunatatirea calitatii
produselor; iv) monitorizarea mai eficienta si imbunatatirea indicatorilor de risc ai unei
instalatii; v) controlul mai eficient si robust al procesului; vi) minimizarea cantitatilor de
produsi secundari obtinuti, a reziduurilor, si reducerea impactului ecologic; vii) imbunatatirea
predictiilorprivind performanta bioprocesului in conditii variate de operare (temperatura, pH,
aditivi, nutrienti,etc); viii) planificarea mai buna a productiei in instalatii multi-scop
biochimice. Cercetarea mai in profunzime a fenomenelor biochimice, nu ar putea insa fi
posibila fara dezvoltarea impetuoasa a tehnicilor de analiza experimentala sofisticate si de
mare precizie a intermediarilor si conditiilor de reactie. Sunt apoi de subliniat posibilitatile
uriase de simulare in timp real si de stocare a informatiei oferite de calculatoare performante
cu procesare paralela. Aceasta poate oferi, spre exemplu, simulari ale proceselor biologice
celulare complexe, cum ar fi comunicarea sub-celulara, reactii de sinteza a proteinelor si
genelor in timpul exo-/endo-citozei, transmisia sinaptica, transportul si receptia semnalelor
celulare, etc. (simulatoarele E-Cell, M-Cell, V-Cell, A-Cell, s.a., vezi cap. 4).

Problema identificarii unui model cinetic biochimic consta in:

- identificarea schemei de reactii extinse / reduse, pe baza informatiilor experimentale,


incluzand reactii elementare si aparente, reactanti, intermediari, produsi, si grupari de
specii (ne)identificabile;
- identificarea expresiilor de viteza de reactie cele mai adecvate in raport cu informatia
experimentala;
- estimarea parametrilor modelului cinetic pe baza datelor cinetice experimentale;
- adaptarea structurii modelului si a parametrilor sai in functie de informatia disponibila.

Modelarea proceselor celulare - cap. 3. Page 55


Identificarea schemei de reactii si a modelului cinetic atasat cel mai potrivit, incluzand
bilanturi masice si expresii ale vitezelor de reactie, este mai dificila pentru procesele biologice
in comparatie cu cele pur chimice. Aceasta se datoreaza numarului relativ mic de variabile
observabile in raport cu complexitatea deosibit de mare a proceselor biologice,
reproductibilitatii mici a datelor experimentale, schimbarilor continue ale caracteristicilor
populatiei de microorganisme, posibilitatilor limitate de analiza rapida si detaliata a
multitudinii intermediarilor de reactie (in special pentru procesele la nivel celular; Holmberg,
1981).
Modelele cinetice conventionale contin variabile continue (vezi clasificarea din cap.
4), si o reprezentare mecanicista a procesului, mai mult sau mai putin detaliata in functie de
informatiile experimentale disponibile. Ele sunt foarte potrivite pentru descrierea proceselor
continue ce se desfasoara la nivel celular, a evolutiei populatiilor de celule si microorganisme,
si a simularii perturbatiilor continue din exteriorul sau interiorul sistemului biologic. Modelele
biocinetice deterministe cu variabile continue sunt foarte potrivite pentru reprezentarea
sistemelor ca o medie a comportarii individuale a membrilor populatiei de microorganisme,
sau atunci cand detaliile de modelare la nivel de individ (molecula, celula) sunt de mica
importanta pentru scopul analizei (Bower & Bolouri, 2001).
Pentru a obtine un model cinetic adecvat si de calitate pentru un sistem biochimic
studiat. procedura standard implica parcurgerea unor etape succesive experimentale si de
calcul (Maria, 2003b). Acestea pot fi sumarizate dupa cum urmeaza.

Etapa preliminara de analiza a datelor cinetice:


- achizitia datelor cinetice, respectiv a curbelor concentratie - timp pentru speciile analizate, in
intervalul de timp de reactie modelat; completarea setului de date cinetice in conditii de
reactii cat mai variate
- analiza bilantului atomic, reconcilierea (corectarea) datelor cinetice primare, si regularizarea
curbelor cinetice;
- verificarea experimentala a existentei intermediarilor si a reactiilor elementare, prin tehnici
specifice (izolarea, excesul, substitutia etc.);
- verificarea consistentei stoichiometriei de reactie in raport cu observatiile;
- verificarea limitarilor termodinamice ale reactiilor (evaluarea constantelor de echilibru);
- verificarea senzitivitatii variabilelor observate in raport cu conditiile de reactie;

Etapa propunerii modelului cinetic:


- formularea ecuatiilor diferential - algebrice de bilant masic
- propunerea expresiilor vitezelor de reactie pe baza informatiilor experimentale,
termodinamice si a celor stocate in banci cinetice;

Etapa de estimare a parametrilor modelului cinetic (constantele de viteza)


- transformarea ecuatiilor modelului cinetic in scopul regularizarii, inlaturarii slabei-
conditionari, si ameliorarii structurii in vederea unei simulari mai rapide si a unei
estimari mai eficace (aplicarea diverselor ipoteze, adoptarea starii stationare pentru unii
intermediari QSSA, determinarea inter-conectivitatii si 'distantei chimice' intre specii,
gruparea variabilelor si reactiilor, etc);
- formularea unui criteriu de estimare (conventional sau nu) potrivit in raport cu cantitatea de
informatie cinetica disponibila;
- estimarea constantelor cinetice pe baza tehnicilor numerice directe ('shortcut', solutia
initiala), a celor recursive (solutia aproximativa adaptabila), si a celor exacte de
optimizare (solutia rafinata);

Modelarea proceselor celulare - cap. 3. Page 56


Etapa de analiza a solutiei (modelului cinetic) si de imbunatatire a sa:
- verificare unicitate parametrii cinetici estimati si stabilitatea solutiei (existenta QSS);
- verificarea convergentei algoritmilor de estimare exacta, catre o solutie globala fezabila;
- verificarea adecvantei modelului in raport cu datele disponibile (teste de adecvanta);
- verificarea semnificatiei parametrilor cinetici ai modelului (teste de inferenta si calitate
estimat);
- verificarea semnificatiei fizico-chimice-biologice a estimatului cinetic;
- verificarea calitatii predictiilor modelului in conditii de reactie variate (perturbate,
oscilatorii, in prezenta limitarilor transferului de masa, in prezenta unui inert, etc);
- ameliorarea structurii modelului prin reducere sau extensie: i) gruparea variabilelor, a
parametrilor, a reactiilor; ii) simplificarea pe baza unor tehnici de analiza
numerica/experimentale specifice, cum ar fi QSSA, analiza de senzitivitate,
identificarea etapelor de pre-echilibru, analiza 'ridge selection', analiza 'principal
component', analiza ' principal component regression', etc.

3.4.1. Analiza datelor cinetice experimentale.

Aceasta etapa preliminara consta in determinarea erorii experimentale a curbelor


cinetice inregistrate cu o anumita frecventa [ , u=1,...,n], in conditii de operare care
fac neglijabile rezistentele la transportul masic in mediul de reactie. Prin efectuarea de
masuratori replicate se determina structura matricii de eroare, in experimentul
de indice u (i,j = indicii observatiilor; Bard, 1974; Bates & Watts, 1988). Eroarea
experimentala se considera a fi de regula normal repartizata, , cu media 'nula' si
matricea de varianta-covarianta a erorii (vezi Perry et al., 1977 pentru teste de verificare
a normalitatii). Estimate ale elementelor lui (notate cu ) pot fi obtinute din m-
experimente replicate ale fiecarei u-experiente, pe baza relatiilor (Perry et al., 1997):

; ; .

Evaluarea erorii experimentale (denumite si 'zgomot' experimental) permite evaluarea inter-


corelatiilor dintre variabilele masurate (observate). Astfel, patratul coeficientilor de corelatie,
, reprezinta procentul din dispersia variabilei j care poate fi
explicat prin asocierea sa cu variabila k (Middleton, 2000). In cazul unei erori normale a
variabilelor observate, ele pot fi direct comparate prin normalizare cu ajutorul transformarii
[unde noteaza valoarea medie sau 'speranta' matematica].
Verificarea normalitatii variabilelor aleatoare observate se face cu ajutorul unor teste statistice
ce compara frecventa de aparitie, observata si prezisa de modelul repartitiei, a valorii masurate
in m-replicate sau, mai simplu, analizeaza probabilitatea cumulativa (normala) de aparitie.
Momentele repartitiei erorii joaca un loc central in caracterizarea sa: momentul de ordinul 1
(media, ), de ordinul 2 (dispersia, ), de ordinul 3 ('skewness' sau asimetria, ),
de ordinul 4 ('kurtosis' sau excesul, ). Tehnici avansate numerice pot evalua gradul de

Modelarea proceselor celulare - cap. 3. Page 57


similaritate (sau redondanta) a seturilor de date experimentale, factorii principali care
afecteaza procesul (PCA, 'principal component analysis', Malinowski, 1991), sau existenta
dependentelor liniare intre observatii (Middleton, 2000). Acest test este important atunci cand
unele dintre variabilele observate nu sunt masurate direct ci deduse din alte observatii.
Utilizarea unor astfel de date si a unui estimator neadecvat duce la obtinerea unui estimat
'deplasat' (in raport cu valoarea asteptata 'corecta') si de o calitate inferioara a parametrilor
cinetici.
Dependentele liniare in date de concentratie pot fi dedectate pe baza vectorilor proprii ce
corespund unor valori proprii mici ai matricii de observatie ,
, ( noteaza media erorii standard σ, Box et al., 1973). Observatiile
dependente trebuiesc eliminate dintr-un criteriu de estimare de tip determinant (MLE, vezi
cap. 3.4.3.) daca valorile proprii corespunzatoare din matricea reziduurilor sunt mai
mici decat nivelul erorii experimentale ( noteaza valoarea prezisa de modelul cinetic pentru
vectorul concentratii; Bates & Watts, 1985).
Pentru obtinerea unui model cinetic adecvat, datele utilizate trebuie sa fie de calitate,
respectiv sa prezinte o eroare experimentala mica, si sa fie distribuite pe intreg domeniul de
timp de reactie studiat. Un set cuprinzator de date experimentale permite o modelare in detaliu
a procesului cinetic, pe cand un set incomplet de date si unele informatii calitative permit
elaborarea doar a unui model cinetic redus.
O etapa importanta a analizei datelor cinetice o reprezinta aceea de reconciliere,
respectiv de reducere a erorii experimentale utilizand baze teoretice si ecuatii de bilant masic
(si uneori si termic). Un test simplu de identificare a erorilor experimentale 'grosolane' consta
in determinarea deviatiei unui punct experimental fata de media replicatelor si compararea cu
nivelul 3σ (σ = nivelul 'zgomotului' mediu experimental). Tehnici avansate de reconciliere se
bazeaza pe 'corectarea' punctelor experimentale cu ajutorul unor ecuatii de bilant masic atomic
sau, daca este cunoscuta, cu ajutorul stoichiometriei de recatie. Aceste metode utilizeaza
tehnici PCA si de analiza chemometrica pentru a detecta masuratorile redondante, pentru a
corecta datele cinetice, pentru a extrage informatii despre stoichiometrie, si pentru a estima
starile si reactiile ne-observabile din sistemul analizat (Malinowski, 1001; Otto, 1999;
Stephanopoulos &San, 1984). Bilanturile masice formulate pe baza unei stoichiometrii de
reactie pot fi foarte utile in etapa de reconciliere a datelor experimentale, respectiv de
diminuare a erorilor de masurare (Maquin & Ragot, 1989; Narasimhan & Jordache, 2000).
Adesea, datorita complexitatii proceselor biochimice si a dificultatilor de masurare a
starilor, datele biocinetice nu sunt intotdeauna disponibile in forma standard (respectiv curbe
cinetice de concentratie). Acesta este, de exemplu, cazul proceselor metabolice celulare a
caror modelare cinetica ia in consideratie mai degraba informatii calitativ-cantitative disparate
din banci de date si conectate pentru a descrie functiunile celulare principale. In astfel de
cazuri, constantele cinetice de reactie sunt estimate utilizand criterii de estimare ne-
conventionale (vezi in continuare).

3.4.2. Formularea schemei de reactii si a expresiilor vitezelor de reactie.

Propunerea unui mecanism de reactie si elaborarea schemei cinetice pentru procesul


biochimic / biologic studiat este o etapa decisiva pentru modelarea satisfacatoare a
interactiunilor complexe dintre speciile considerate din sistem. Schema cinetica trebuie sa ia
in consideratie informatiile calitativ-cantitative despre proces, distributia de produsi si
intermediarii cheie implicati, etapele lente si rapide din dinamica procesului, precum si

Modelarea proceselor celulare - cap. 3. Page 58


elementele biologice si cele ne-biologice din proces. Procedura clasica de elaborare a unei
scheme de reactii ia in consideratie toate informatiile calitativ-cantitative disponibile, si
verificari in mai multi pasi (vezi cap. 2):
- determinarea si verificarea stoichiometriei de reactie
- determinarea numarului de reactii liniar independente din sistem
- determinarea numarului de reactii globale din schema
- determinarea numarului de specii dependente
- corectarea datelor pe baza dependentelor intre concentratiile speciilor
- determinarea inter-conectivitatii intre specii si a 'distantei chimice'

Schema cinetica propusa pentru procesul biochimic / biologic studiat trebuie sa ia in


consideratie atat informatiile calitative cat si cele cantitative despre proces, stabilitatea sau
instabilitatea speciilor implicate, etapele lente si rapide din dinamica procesului, starile
microscopice si cele macroscopice ale sistemului, precum si elementele biologice si cele ne-
biologice din reactii. Daca in schema cinetica sunt incluse doar reactiile elementare (care nu
mai pot fi 'descompuse' in sub-reactii constituente), modelul cinetic al unui proces
(bio)chimic, in ipoteza considerarii doar a variabilelor continue din proces si a separabilitatii
influentelor temperaturii si concentratiilor in expresiile vitezelor de reactie, este in fapt un
sistem de ecuatii diferentiale ordinare (ODE) de bilant masic al speciilor considerate (vezi
cap. 2).
Urmatoarea etapa a modelarii cinetice implica atasarea fiecarei reactii din schema
propusa a unei expresii cinetice adecvate in raport cu informatiile experimentale (intermediari
de reactie cu viata scurta / lunga, in cantitate mica/mare, succesiunea reactiilor, ordinele
partiale de reactie, stoichiometrie, etape lente si rapide, dependente ale constantei cinetice,
etc).
Integrarea modelului cinetic pe un anumit interval de timp de reactie ofera posibilitatea
prezicerii evolutiei dinamice a concentratiei speciilor considerate (asa-numitele 'curbe cinetice
prezise', ). Numarul de specii (bio)chimice observate experimental este de regula mai
mic sau cel mult egal cu numarul total de componenti (reactanti, intermediari, produsi)
participanti la reactie. Restrictiile explicite si implicite formulate in modelul anterior includ
limitarile fizico-chimice, termodinamice, sau ipoteze facute asupra schemei de reactii. Din
motivul complexitatii mari a procesului si cantitatii insuficiente de informatie cinetica, sau din
motive de dificultate de solutionare, modelele cinetice contin pe langa reactii elementare si
reactii globale. In acest ultim caz, constantele cinetice si ordinele de reactie ale expresiilor
cinetice sunt si ele aparente, neputand fi comparate cu valori deduse pe baze termodinamice
(Willems & Froment, 1988).
Expresiile cinetice reduse ale vitezelor de reactie (de tip Monod, Michaelis-Menten,
LHHW, etc) sunt frecvent utilizate in practica de modelare a proceselor enzimatice, datorita
simplitatii si numarului redus de parametrii, si din imposibilitatea masurarii evolutiei
concentratiilor tuturor intermediarilor de reactie si a estimarii expresiilor cinetice
corespunzatoare. Ele sunt folosite atunci cand informatiile cinetice sunt insuficiente, sau
datele sunt masurate in conditii limitative de transport masic. In acest ultim caz, parametrii
cinetici estimati sunt 'deplasati' (fata de valorile adevarate) datorita inter-corelatiilor cu
parametrii de transport.
Ipotezele simplificatoare aplicate sistemului cinetic diferential conduce de regula la
expresii reduse, cu functii de tip putere sau hiperbolice, avand atasate si relatii algebrice
(review Segel, 1993 pentru cinetica enzimatica si Froment, 1987, 1991, pentru cinetica de tip
LHHW).

Modelarea proceselor celulare - cap. 3. Page 59


Ele pot fi obtinute prin mai multe metode de analiza: adoptarea ipotezei de cvasi-
stationaritate a unor intermediari de reactie aflati in concentratie mica si cvasi-constanta
(QSSA); considerarea unei etape de reactie ca fiind limitativa pentru viteza procesului;
aplicarea de ipoteze de pre-echilibru in cazul unui lant de reactii consecutive, respectarea
principiului lui Wegscheider in schemele de reactii reversibile ciclice (Segel, 1993; Moser,
1988; Connors, 1990; Compton, 1991; Szabo, 1969; Schuster & Schuster, 1991). Utilizarea
modelelor reduse implica insa diminuarea corespunzatoare a capacitatii de predictie, a
informatiei continute, si reducerea semnificatiei parametrilor. Ca un exemplu, expresia clasica
a vitezei de reactie Michaelis-Menten a unui proces enzimatic, include un numar redus de
parametrii in functie de ipotezele simplificatoare utilizate (Tabel 3.1, Dunn et al., 1992).
In fapt, gradul de extindere sau de reducere a unui model cinetic elaborat depinde de
cantitatea de informatie experimentala si apriori, cat si de scopul in care este elaborat. Astfel,
modelele cinetice extinse sunt utilizate pentru o reprezentare si intelegere detaliata a
mecanismului procesului. Modelele cinetice reduse sunt utilizate in analiza rapida a
procesului, analiza de risc, precum si pentru un control in timp real. Variabilitatea mare a
caracteristicilor cinetice in sistemele biologice, precum si reproductibilitatea scazuta a
informatiilor experimentale face ca modelarea procesului sa se bazeze mai degraba pe o
structura evolutiva a modelului cinetic, atat din punct de vedere al expresiilor de viteza si/sau
al parametrilor (constantelor) cinetice. De regula, acestea se reactualizeaza ('up-gradeaza')
periodic pe baza informatiilor cinetice preluate on-/off-line din sistemul experimental studiat.
Modelele cinetice astfel elaborate sunt denumite 'modele de tendinta' ('tendency modelling',
Filippi-Bossy et al., 1989; Maria et al., 1996; Terwiesch, 1994; Fotopoulos, 1996), incluzand
doar reactiile esentiale ale variabilelor metabolice masurabile.

Tabel 3.1. Deducerea expresiilor de viteza de tip Michaelis-Menten pentru un proces


enzimatic, in diverse ipoteze simplificatoare (Notatii: S = concentratie substrat; P =
concentratie produs; I = concentratie intermediar; E = concentratie enzima).
Schema cinetica

Ipoteze Viteze de reactie


(I) E = E o ; ( k 3 ) este etapa de reactie limitativa.
,

dI
(II) E = E o ; intermediar cvasi-stationar ( = 0 ).
dt
(III) E o = I + E ; ( k 3 ) este etapa de reactie limitativa;
,
ipoteza de pre-echilibru chimic.
Deducere:
;
; ; ; ;
SEo v S
I= ; vR = max
substitutie in expresia ; . KS + S KS + S

dI
(IV) E o = I + E ; intermediar cvasi-stationar ( = 0 ); ;
dt
= constanta Michaelis-Menten.

Modelarea proceselor celulare - cap. 3. Page 60


SEo v S
I= ; vR = max
KS + S KS + S

Exista numeroase proceduri experimentale si numerice de reducere a dimensionalitatii


unui model cinetic, prin gruparea speciilor si/sau a reactiilor (vezi cap. de mai jos). In fapt,
prin aplicarea unei astfel de tehnici se realizeaza o reducere a numarului de parametrii
(constante) cinetice de estimat, rezultand un efort de calcul si de interpretare statistica redus,
dar si o diminuare corespunzatoare a capacitatii de predictie a modelului cinetic elaborat in ce
priveste unele specii si pasi de reactie. In plus, modelele cinetice reduse prezinta un estimat
deplasat si o semnificatie fizico-chimica-biologica diminuata a constantelor cinetice (review
Tomlin et al., 1997; Vajda et al., 1989; Maria, 1989).
Odata ce modelul cinetic este definit, inainte de a trece la etapa propriu-zisa de
estimare a constantelor de reactie (parametrii cinetici), este recomandat a se incerca reducerea
neliniaritatii functiilor modelului cinetic in scopul prevenirii unor posibile probleme de
convergenta a algoritmilor de estimare / optimizare. O astfel de regularizare a ecuatiilor
modelului poate fi realizata prin gruparea convenabila a mai multor termeni / constante de
reactie, prin substitutii si simplficari, sau prin transformari neliniare ale ecuatiilor. Spre
exemplu, reducerea corelatiilor foarte mari dintre parametrii Arrhenius (A,E) ai unei constante
cinetice (k) poate fi realizata printr-o transformare neliniara efectuata in vecinatatea unei
temperaturi de referinta, (Pritchard & Bacon, 1975):

Ratkowsky (1985; 1990) si Espie (1986) prezinta o trecere in revista a metodelor analitice
utilizate la transformarea neliniara a expresiilor cinetice (bio)chimice.

3.4.3. Formularea problemei matematice de estimare a modelului cinetic.

Dupa stabilirea schemei de reactii si a expresiilor vitezelor de reactie, urmatoarea


etapa de modelare cinetica implica determinarea parametrilor modelului, respectiv constantele
de reactie (vectorul k) si ordinele de reactie. Metodele standard de estimare pornesc de la
datele (curbele) cinetice filtrate, reconciliate, si 'netezite' (regularizate). Parametrii cinetici
sunt estimati pe baza unui criteriu de estimare statistica care minimizeaza diferenta reziduala
(vectorul de reziduuri, e) dintre datele masurate si predictiile modelului in termeni de variabile
observate ( , pentru speciile j=1,...,r si experimentele u=1,...,n). Pentru
modele biocinetice de tip Monod sau Michaelis-Menten, parametrii sunt identificabili in
anumite conditii experimentale (Holmberg, 1981; Schügerl, 1985; Moser, 1988; Nielsen &
Villadsen, 1994). In cazul experimentelor incomplete si cu erori de masurare importante este
foarte posibila obtinerea a mai multor solutii ale problemei de estimare, iar secventele de
calcul pot prezenta probleme de convergenta in a localiza solutia globala fezabila (optim
global si cu indeplinirea restrictiilor). Functia obiectiv de estimare este elaborata pe baze
statistice pentru ca datele observate sunt intotdeauna supuse erorilor de masurare, iar
parametrii cinetici se supun restrictiilor fizico-(bio)chimice (Bates & Watts, 1988). In plus,
estimarea cinetica ia in calcul toate restrictiile de bilant masic (atomic si al speciilor

Modelarea proceselor celulare - cap. 3. Page 61


moleculare) din sistem. Functia obiectiv de estimare depinde de structura matricii erorii
experimentale, de cunoasterea sau necunoasterea acestei matrici, de tipul de repartitie a
variabilelor si al erorii de masurare, de informatia apriori privind variabilele si estimatul, de
functiile de regularizare a modelului utilizate (Bates & Watts, 1988).
In fapt, problema de estimare este formulata ca o problema de programare neliniara
(NLP), sau ca o problema NLP cu variabile mixte intregi (discrete) si continue (MINLP).
Conform teoriei estimarii statistice, problema consta in maximizarea repartitiei aposteriori (P)
a parametrilor cinetici estimati ( ):

In relatia anterioara, noteaza functia de verosimilitate, respectiv probabilitatea


de a prezice corect valoarile experimentale ale concentratiilor C atunci cand sunt considerate
toate seturile de valori ale variabilelor independente x, conditionata de utilizarea in model a
parametrilor k. Variabilele independente reprezinta conditiile experimentale in care au fost
efectuate masuratorile cinetice, respectiv timpul de reactie, temperatura, pH-ul, etc. Notatia
reprezinta repartitia apriori a solutiei initiale a parametrilor cinetici, adoptata de regula
ca fiind una uniforma sau normala, cu matricea de covarianta . Dupa substitutia expresiilor
functiilor de densitate de probabilitate, problema NLP de estimare consta in minimizarea unei
functii de cost , dependenta de reziduurile , eroarea experimentala (de regula
repartizata normal, cu media nula si matricea de covarianta ), si de informatia apriori
privind parametrii :

; ∼
in prezenta restrictiilor:
; (numarul de parametrii).

Forme particulare ale expresiilor functiei obiectiv si cazurile de aplicare sunt prezentate in
Tabelul 3.2. Alte tipuri de estimatori, aplicabili cazului datelor incomplete, cazului matricii de
eroare incomplet precizate, al observatiilor puternic corelate, si al modelelor implicite cu
observatii neseparabile, sunt prezentati pe larg in literatura de specialitate (Hunter, 1967; Box
& Draper, 1972; Box et al., 1973; Mezaki et al., 1973; Bard, 1974; McLean et al., 1979; Klaus
& Rippin, 1979; Froment & Hosten, 1981; Stewart & Sorenson, 1981; Ricker, 1984; Bates &
Watts, 1985; Seber & Wild, 1989; Steiner et al., 1990; Iordache et al., 1991).
Cel mai utilizat estimator este cel al 'Celor Mai Mici Patrate Ponderate' (WLS) cu/fara
includerea informatiilor apriori privind parametrii, in sens Bayes sau in sensul regularizarii
Tikhonov (Tabel 3.2.). Regularizarea Tikhonov se aplica la identificarea modelelor
biocinetice ale caror parametrii prezinta coeficienti de sensitivitate foarte diferiti in raport cu
functiile modelului (Lei & Jorgensen, 2001). Acest criteriu 'deplasat' (in sens statistic)
penalizeaza solutiile foarte diferite de solutia initiala pentru parametrii cei mai 'insenzitivi' din
model, prevenind astfel o calitate slaba a estimatului.
Solutia redusa a unui model cinetic poate fi obtinuta si printr-o formulare speciala a
functiei obiectiv si solutionarea problemei in sens MINLP (cu parametrii intregi si continui).
Astfel, unii parametrii (sau grupe de parametrii si termeni cinetici) sunt multiplicati cu
parametrii de decizie discreti si binari (y). Estimarea parametrilor cinetici k se face simultan

Modelarea proceselor celulare - cap. 3. Page 62


cu cea a parametrilor binari, ducand automat la obtinerea unei solutii extinse sau reduse ale
modelului cinetic (Edwards et al., 1995, 2000):

;
in prezenta restrictiilor:
; ; ; , ,

(in care y noteaza vectorul parametrilor discreti, sunt limitele min/max ale
parametrilor ; sunt limitele min/max ale parametrilor , respectiv {0,1} in cazul
binar). In fapt, parametrii binari reprezinta veritabile variabile de decizie in determinarea
gradului de reducere a modelului cinetic. Ca un exemplu, viteza globala a unui proces
enzimatic cu multiple cuplari ale intermediarilor pe centrii de reactie ne-cooperanti (Segel,
1975) poate fi scrisa in sens MINLP astfel:

(S= concentratie substrat, E= concentratie enzima, indexul 't' noteaza valoarea totala). Astfel,
prin solutionarea problemei de estimare cinetica se determina atat valorile constantelor
cinetice si de echilibru ( , , , , , , , ), cat si parametrii
binari multiplicativi ( - ) care decid retinerea unei forme extinse sau reduse ale expresiei
vitezei de reactie care sa asigure o adecvanta satisfacatoare a modelului in raport cu datele
cinetice experimentale si o calitate satisfacatoare a estimatului.
In final, este de remarcat ca nu in toate cazurile de estimare a modelelor biocinetice se
dispune de date cinetice standard. In consecinta, functia obiectiv de estimare poate fi si una
neconventionala, neinterpretabila statistic. Acesti estimatori deplasati sunt utilizati in cazurile
in care informatiile cinetice sunt incomplete si disponibile intr-un format neinterpretabil
printr-o procedura standard. Un exemplu este cel al proceselor complexe metabolice si de
reglare celulara complexe in celulele vii, pentru care este foarte dificil a se masura evolutia
tuturor intermediarilor in conditii de sinteza, perturbatie, si oscilatii intretinute continue. In
situatiile neconventionale, drept criterii de estimare a parametrilor modelului cinetic pot fi
folosite: (i) proprietati de reglare ale sistemului, cum ar fi viteza sau timpul de revenire
('recover') dupa o perturbatie dinamica de tip 'impuls' (Yang et al., 2003), sau amplitudinea
traiectoriei de revenire la starea stationara; (ii) senzitivitatea sistemului in raport cu
perturbatiile (Maria, 2003a); (iii) stabilitatea starii stationare a sistemului (Maria, 2003a); (iv)
indeplinirea anumitor cerinte pentru procesele biologice oscilatorii (Tsuchiya & Ross, 2001);
(v) restrictii bio-fizice; (vi) 'rezistenta' sistemului biologic fata de schimbari in mediul extern;
(vii) respectarea unei anumite succesiuni de evenimente in procesele celulare metabolice
complexe, etc. Este probabil ca in cazul estimarii unui model complex, comportarea reala a
unui sistem biologic sa necesite indeplinirea simultana a mai multor criterii de estimare, cu o
functie de estimare multi-obiectiv in acord cu functiunile multiple ale sistemului.
O tendinta generala in utilizarea criteriilor de estimare a modelelor cinetice o
constituie includerea tuturor tipurilor de informatie cinetica disponibila, conventionala si

Modelarea proceselor celulare - cap. 3. Page 63


neconventionala, intr-un mod complex, prin utilizarea variabilelor de decizie, a unor functii
obiectiv mai elaborate, si exploatand proprietatile globale ale sistemului (eficacitatea de auto-
reglare, periodicitatea proceselor, flexibilitatea sistemului in conditii variabile de mediu,
succesiunea de evenimente, etc).

Modelarea proceselor celulare - cap. 3. Page 64


Tabel 3.2. Estimatori statistici [r = numar de observatii; p = numar de parametrii; n = numar de
experimente; γ j = heteroscedasticitatea (egala cu 0 pentru 'zgomot' constant, sau cu 2 pentru un 'zgomot'
relativ constant); det= determinant; k ~ N ( kˆ ,V ) ; e = C − Ĉ ].
o o o iu iu iu
Estimator Functie obiectiv ( Φ ) Obs.
Bayes (BE) MaxΦ = (constanta) P( C/k, x ) P( k o ) ; L = P( C/k, x ) ,
nr n 1 n cunoscut;
ln L = − ln( 2π ) − ln(det( Σ )) − ∑ e uT Σ −1 e u , ('zgomot' normal) P( k o ) , cunoscut.
2 2 2u
1 1 n Σ cunoscut,
MinΦ = ( k − k o )T V o−1 ( k − k o ) + ∑ e uT Σ −1 e u independent de
2 2u
experiment (u=1,...,n).
1 1 n 1 n r r eui euj Σ u cunoscut, dependent
MinΦ = ( k − k o )T V o−1 ( k − k o ) + ln[ ∏ det Σ u ] + ∑ ∑ ∑
2 2 2 u i j σ2 de experiment
u uij (u=1,...,n).
Verosimi- MaxΦ = L( k ) L = P( C/k, x ) , si Σ
litate maxima cunoscute.
(MLE)
2 Σ cunoscut, diagonal.
1 n r 2 1 r n  C − Ĉ ui 
MinΦ = ln ∏ ∏ σ uii + ∑ ∑  ui 
2 u i 2 i u  σ uii 
n n Σ necunoscut;
MinΦ = ln(det ∑ ( C ui − Ĉ ui )( C uj − Ĉ uj )) (observatiile depen-
2 u dente sunt eliminate).
  2 
1 r   1 n j ( C uj − Ĉ uj )  nj  Σ cunoscut;
MinΦ = ∑ n j (ln( 2π ) + 1 ) + n j ln  ∑  + γ j ∑ ln( Ĉ uj ) multiple seturi de date
2 j γj
n j u Ĉ uj  u 
   
'Cele mai L = P( C/k, x ) ,
mici patrate cunoscut;
ponderate' Σ cunoscut, diagonal.
(WLS)
Vo cunoscut, P( ko )
normal (Bayes).

cunoscut;
regularizare tip
Tikhonov.
'Cele mai L = P( C/k, x ) , si Σ
mici patrate'
(NLS) cunoscute; Σ = .
Vo cunoscut, P( ko )
normal (Bayes).

Estimator L = P( C/k, x ) ,
, (cazul unei observatii) cunoscut;
Σ cunoscut, diagonal.
MinMax Σ necunoscut.
Alti (o singura
estimatori ; ; ; ...etc. observatie).
(deplasati)

Modelarea proceselor celulare - cap. 3. Page 59


3.4.4. Solutionarea problemei matematice de estimare a modelului cinetic.

Rezolvarea problemei NLP de estimare formulata in paragraful anterior se face printr-


o metoda numerica directa, indirecta, sau recursiva.

- Metodele directe (sau 'shortcut') se bazeaza pe transformarea modelului cinetic ODE intr-un
sistem algebric de ecuatii de bilant (liniar sau neliniar, si supradeterminat) ce poate fi
solutionat printr-o metoda clasica, intr-un singur pas de calcul (Hosten, 1979; Maria &
Rippin, 1997).
- Metodele indirecte (sau exacte) determina minimul functiei obiectiv de estimare printr-o
procedura numerica iterativa de optimizare, implicand solutionarea in fiecare iteratie a
modelului cinetic (Bard, 1974).
- Metodele recursive se bazeaza pe un algoritm numeric de tip Kalman sau non-Kalman care
adapteaza (estimeaza) variabilele de stare ale sistemului si parametrii modelului pe baza
informatiilor cinetice culese on-line dintr-o instalatie experimentala (Goodwin & Sin,
1984).

Un estimat aproximativ al setului de constante cinetice din modelul ODE poate fi


obtinut prin utlizarea unei metode directe si a unui set limitat de date experimentale. Daca
acest estimat initial este de buna calitate, rafinarea sa ulterioara printr-o metoda de estimare
exacta este mai rapida, mai sigura, si fara probleme suplimentare de convergenta. Complicatii
in calcule pot apare in cazul problemelor de estimare foarte neliniare, multimodale, cu
restrictii complicate. Este de asemenea si cazul problemelor slab-conditionate, respectiv cazul
datelor cinetice de slaba calitate, insuficiente, distribuite inegal pe domeniul investigat,
degenerate, sau cazul modelelor supra-parametrizate, cu termeni degenerati din punctul de
vedere al estimabilitatii lor.
Metodele de estimare directe inlocuiesc in fapt solutionarea repetata a modelului
cinetic cu rezolvarea unui sistem algebric de ecuatii supradeterminat, obtinut din modelul
ODE originar printr-o metoda de discretizare (DP) sau de transformare integrala (IP). In ciuda
existentei unui numar mare de variante de algoritmi numerici DP si IP si a simplitatii in
aplicare, estimatul parametrilor cinetici astfel obtinut este deplasat (fata de valoarea reala),
fara proprietati statistice (in vederea evaluarii statistice riguroase a calitatii sale), si foarte
sensibil in raport cu calitatea datelor experimentale utilizate in estimare. In plus, algoritmii DP
sau IP nu pot sa utilizeze intreaga informatie cinetica disponibila, prezentand frecvent
probleme de multiplicitate, stabilitate, si fezabilitate a solutiei. O modificare a metodei IP este
realizata de Maria & Rippin (1997). Noul algortim, denumit MIP, este aplicabil modelelor
cinetice de complexitate redusa si medie, oferind posibilitati sporite in includerea unor
informatii cinetice suplimentare. Solutia MIP este de calitate superioara, fiind mai putin
influentata de situatiile slab-conditionate (corespunzand unei matrici Jacobi slab conditionate
a setului ODE), incluzand in estimare informatii cinetice privind procese similare (accesibila
prin utilizarea bancilor de date cinetice), fara a recurge la liniarizari ale modelului sau a
factorilor algoritmici de ajustare (Maria, 1998; Maria et al., 2000). Desi furnizeaza un estimat
deplasat si de multe ori de slaba calitate, metodele directe sunt foarte utile in localizarea unei
solutii initiale a problemei de estimare, conditie esentiala pentru majoritatea procedurilor
exacte de rafinare a estimatului.
Asa cum mentiona Holmberg (1981), estimarea parametrilor in modele biocinetice
este o problema dificila atat sub aspectul cmplexitatii modelului, dar si datorita
caracteristicilor variabile ale biomasei, ceea ce necesita o periodica reactualizare ('up-gradare')
a parametrilor si uneori chiar a structurii modelului cinetic. In cazul modelelor simple,

Modelarea proceselor celulare - cap. 3. Pag 60


utilizarea unui estimator recursiv de tip filtru Kalman extins (EKF) poate duce la estimarea
atat a starilor (concentratiilor) compusilor neobservati cat si a parametrilor din model, pe baza
masuratorilor experimentale din proces, efectuate in mod continuu (on-line), a unui estimat
anterior, cat si a liniarizarilor succesive ale modelului. Astfel de estimatori EKF sunt foarte
senzitivi la variatii/adaptari ale structurii modelului cinetic, marimea 'zgomotului'
experimental, liniarizari, observabilitatea variabila a speciilor / intermediarilor de reactie,
precum si calitatea estimatului apriori utilizat si a dispersiei sale (de Valliere & Bonvin, 1990;
Baratti et al., 1993). Datorita acestor dezavantaje, concomitent cu EKF sunt aplicate periodic
si etape de estimare exacta NLS in scopul reinitializarii informatiei apriori utilizate in pasii
ulteriori de estimare EKF (Jang et al., 1986). Tehnici combinate chemometrice si de estimare
statistica pot detecta on-line situatiile care necesita reactualizarea parametrilor cinetici si
ajustarea structurii modelului cinetic (Prinz & Bonvin, 1992; Harmon et al., 1992; Maria &
Rippin, 1993).
Dupa obtinerea unui estimat aproximatic al constantelor de reactie, o rafinare a lor
poate fi facuta in cazul in care se dispune de suficienta informatie cinetica consistenta si de o
metoda de optimizare performanta potrivita cazului investigat. O analiza statistica a calitatii
estimatului cinetic si a adecvantei modelului in raport cu datele utilizate ofera sugestii privind
reducerea sau extinderea modelului in scopul imbunatatirii capacitatii de predictie a sa. O
formulare MINLP a problemei poate considera concomitent un numar mai mare de modele
cinetice in timpul estimarii, conducand la obtinerea modelului redus cel mai potrivit in raport
cu datele disponibile, si incluzand un numar minim de parametrii (asa-numitul principiu al
'parsimoniei').

3.4.5. Metode directe (shortcut) de estimare aproximativa a constantelor cinetice.

Metodele directe de estimare a parametrilor in modele cinetice ODE reprezinta tehnici


numerice rapide care, prin simple manipulari algebrice, furnizeaza o solutie aproximativa a
problemei de estimare. Metodele directe pot fi aplicate datelor cinetice obtinute in conditii de
reactie izoterme, de pH constant, si cu un catalizator cu proprietati cvasi-constante in
domeniul de timp investigat. Metodele shortcut sunt de asemenea aplicabile doar speciilor
observabile, respectiv bilanturilor diferentiale masice atasate acestor specii. In scopul obtinerii
unor date cinetice cat mai consistente si semnificative pentru procesul investigat, reactorul
experimental trebuieste proiectat si operat in vederea indeplinirii cerintelor impuse de metoda
de estimare, eliminarii rezistentelor la transportul de masa din mediul de reactie, si realizarii
unui control cinetic al procesului (Froment & Bischoff, 1990; Levenspiel, 1999; Moser,
1988). In situatii speciale, pornind de la date obtinute intr-un reactor experimental operat
neizoterm, tehnici numerice moderne permit reconstituirea datelor cinetice izoterme
(Wojciechowski, 1992, 1993).
Metodele numerice de estimare cinetica directa sunt de mai multe tipuri (Maria &
Muntean, 1987; Maria & Rippin, 1997; Maria, 1999):
(i) metode analitice directe;
(ii) proceduri de discretizare (DP);
(iii) proceduri de transformare integrala (IP);
(iv) combinatii ale metodelor DP si IP cu tehnici numerice si statistice.

Inainte de aplicarea unei metode de estimare directe, este necesara o analiza suplimentara a
datelor cinetice. De exemplu, curbele cinetice C(t) pot fi aproximate prin functii algebrice
empirice in scopul obtinerii integralelor 'experimentale' de concentratie a speciilor observate,

Modelarea proceselor celulare - cap. 3. Pag 61


necesare metodei IP. In acest scop pot fi utilizate, cu rezultate satisfacatoare, functiile spline
cubice (Tang, 1971; Maria & Muntean, 1987; Otto, 1999). Cand aproximatiile spline sunt
obtinute prin utilizarea unui factor de 'netezire' ajustabil, curbele cinetice aproximate poseda si
proprietati de regularitate care faciliteaza evaluarea mai precisa a vitezelor de reactie
'experimentale', respectiv a pantelor curbei cinetice C j ( t ) in punctele experimentale yiter +1 iter
iter
=γ+INT
[U
M+D
]
necesare aplicarii metodei DP (Tang, 1971). Cu cat factorul de netezire este mai mare, cu atat
curba cinetica aproximata se apropie mai mult de o dreapta ce traverseaza punctele
experimentale. In practica, atunci cand se dispune de date cinetice masurate cu un 'zgomot'
experimental redus, aplicarea unei aproximatii spline cubice cu un factor redus de netezire,
previne obtinerea de viteze de reactie distorsionate, si duce la obtinerea unui estimat DP de
calitate acceptabila (Maria & Muntean, 1987).
Metodele directe analitice sunt aplicabile modelelor cinetice de complexitate redusa
pentru care este disponibila solutia analitica (integrata) a sistemului diferential de ecuatii de
bialnt masic al speciilor. Pentru setul algebric de functii analitice integrale se pot aplica
metode de regresie directe, de tipul 'celor mai mici patrate' neliniare, pentru a determina
constantele cinetice k utilizand valorile de concentratie masurate pentru speciile observate j in
punctele experimentale t u cu o anumita eroare de masurare ε ju , respectiv:
C j ( tu ) = Ĉ j ( tu ,k ) + ε ju . Colectii de forme integrale ale modelelor cinetice simple sunt
prezente in literatura de specialitate (Szabo, 1969; Fremaux & Lepoutre, 1989; Connors,
1990; Moser, 1988; Schügerl, 1985).
Metodele directe DP sunt aplicate, in forma grafica sau numerica, curbelor cinetice
experimentale C(t) inregistrate intr-un reactor diferential sau printr-o tehnica diferentiala
(Froment & Bischoff, 1990; Moser, 1988). Estimatorul aproximativ DP inlocuieste
solutionarea repetata a modelului cinetic ODE si estimarea iterativa a parametrilor sai, prin
rezolvarea unui sistem algebric de ecuatii, supradeterminat, intr-un singur pas de calcul.
Indiferent de varianta de aplicare, metodele DP inlocuiesc termenii diferentiali cinetici
(corespunzatori vitezelor de reactie) ai variabilelor observate cu termeni algebrici discretizati,
evaluabili numeric. Discretizarea se realizeaza prin diferite scheme, aplicabile in functie de
numarul de date disponibile, modul lor de imprastiere, si marimea 'zgomotului' experimental
(Tabelul 3.3). Schemele de discretizare evoluate sunt combinate cu tehnici spline de
aproximare si netezire a curbelor cinetice in scopul regularizarii lor, reducerii zgomotului, si
cresterii calitatii estimatului DP (Maria & Muntean, 1987; Glowinsky & Stocki, 1981). Chiar
daca datele experimentale sunt achizitionate uniform pe intreg domeniul de timp de reactie,
este demonstrat ca la aplicarea DP maximum de informatie cinetica este concentrata in
intervalele in care senzitivitatea parametrica (respectiv derivatele functiilor modelului in
raport cu constantele cinetice k) este mare, iar vitezele de reactie observate sunt apreciabile. In
aceste conditii, matricea de informatie J = E(∇ k L∇ kΤ L ) este ne-singulara si prezinta
elemente semnificative pe diagonala (Bates & Watts, 1988).
Sunt cunoscute mai multe tipuri de metode DP (review Moser, 1988):
- metoda variatiei vitezei initiale de reactie;
- metoda liniarizarii expresiilor vitezelor de reactie;
- diagrame de liniarizare si transformari convenabile ale ecuatiilor modelului;
- metoda obtinerii setului de ecuatii discretizate supradeterminat, rezolvat apoi in
raport cu toate punctele experimentale (diagrame Walker, liniarizari
Lineweaver-Burk, si Gates, etc.).
Prin aplicarea DP tuturor speciilor observabile j se obtine intotdeauna un set de ecuatii
algebrice, supradeterminat, si implicit de forma:

Modelarea proceselor celulare - cap. 3. Pag 62


G ju ( C o ,C , r , k ,t) = 0 ; j=1,...,r; u=1,...,n; nr>>p; g( k )) ≥ 0 .

[indicele 'o' noteaza punctul initial C( t o ) = C o ]. Sistemul (ne)liniar algebric poate fi


solutionat numeric cu ajutorul unui algoritm clasic, luand in considerare si restrictiile
implicite si explicite in parametrii: substitutia succesiva, metoda Newton, metoda Newton-
Raphson, metoda Broyden (Press et al., 1992; Constantinides & Mostoufi, 1999),
transformarea intr-o problema NLS, regresia 'ridge' (Iordache et al., 1991), sau regresia
partiala (in cazurile liniare, Lawson & Hanson, 1974).
Desi foarte simple si rapide, metodele directe de estimare DP prezinta importante
dezavantaje in aplicare. Astfel, estimatul DP este deplasat, neconsistent, fara proprietati
statistice deoarece DP considera vitezele de reactie drept variabile observate in locul
concentratiilor speciilor masurate. In plus, eroarea experimentala indusa vitezelor de reactie
evaluate din datele experimentale este amplificata cu cel putin un ordin de marime. Din aceste
motive, in mod frecvent estimatul cinetic furnizat de DP este inadecvat, ne-fezabil, sau
imprecis. In plus, metoda DP este foarte senzitiva in raport cu datele alterate de prezenta
efectelor variabilelor neconsiderate ('outliers'), prezinta o solutie nesatisfacatoare in cazurile
de probleme slab-conditionate (in date sau/si forma model), date incomplete, termeni ai
modelului supra-parametrizati sau degenerati (incluzand expresii aditive sau multiplicative ale
mai multor constante cinetice). DP in forma clasica nu poate include in secventa de estimare
informatii cinetice apriori privind parametrii de estimat, dispersia lor, sau alte informatiii
cinetice privind procese similare stocate in banci de date specifice.

Tabel 3.3. Scheme de discretizare utilizate la evaluarea vitezelor de reactie dC / dt , intr-un


punct experimental t o , pe baza curbelor cinetice f(t)=C(t). [Notatii: C j = C( t o + jh ) ;
h = t i − t i −1 ; t min < ξ < t max ; Zwillinger et al., 1996].
Schema Formula Eroarea de evaluare
Doua-puncte ( C1 − C( t o )) / h ; (schema Euler) hf ( 2 ) ( ξ ) / 2
Trei-puncte ( −3C( t o ) + 4C1 − C 2 ) /( 2 h ) ; h 2 f ( 3 )(ξ ) / 3
( C 1 − C −1 ) /( 2 h ) ; (schema Euler centrata)
h 2 f ( 3 )(ξ ) / 6
Patru-puncte ( C − 2 − 8C −1 + 8C1 − C 2 ) /( 12h ) h 4 f ( 5 ) ( ξ ) / 30
Cinci-puncte ( −25C o + 48C1 − 36 C 2 + 16 C 3 − 3C 4 ) /( 12h ) h4 f ( 5 )(ξ ) / 5

Detaliaza aici cateva dintre ele, cu exemplificare din Moser, p. 151. Pe scurt ce se reprezinta
grafic functie de ce.

Modelarea proceselor celulare - cap. 3. Pag 63


Metodele directe IP sunt aplicabile curbelor cinetice experimentale C(t) inregistrate
intr-un reactor integral sau printr-o tehnica integrala (Moser, 1988; Levenspiel, 1999).
Estimatorul aproximativ IP inlocuieste solutionarea repetata a modelului cinetic ODE si
estimarea iterativa a parametrilor sai, prin rezolvarea unui sistem algebric de ecuatii,
supradeterminat, intr-un singur pas de calcul. Indiferent de varianta de aplicare, metodele IP
inlocuiesc termenii diferentiali cinetici (corespunzatori vitezelor de reactie) ai variabilelor
observate cu termeni algebrici obtinuti prin aplicarea unui operator integral. Cea mai simpla
varianta de IP este cea propusa de Himmelblau et al. (1967). Transformarea aplicata
corespunde unui set algebric supradeterminat, formulat pentru toate speciile observate
j=1,...,r, in toate punctele experimentale u=1,...,n, si supus restrictiilor implicite/explicite in
parametrii:

tu
C j (t u ) = C j (t o ) + ∫ F j ( C ( k ,t), k ,t)dt ; j=1,...,r; u=1,...,n; nr>>p; g( k )) ≥ 0 .
to

Solutia sistemului (ne)liniar poate fi obtinuta printr-unul din algoritmii numerici clasici
mentionati anterior in cazul estimatorului DP. Pentru a obtine un estimat IP satisfacator,
integralele de concentratie trebuiesc evaluate cu suficienta precizie pe baza datelor
experimentale disponibile. Pentru aceasta, datele trebuie sa acopere intreg domeniul de timp
de reactie investigat, fiind inregistrate 'mai des' in vecinatatea 'pick-urilor' de concentratie,
unde eroarea de evaluare a integralelor este in mod inerent mai mare. Estimatul IP sufera de
aceleasi dezavantaje ca si cel DP. Totusi, el este influentat intr-un grad mai mic de eroarea de
masurare, in special atunci cand curbele cinetice sunt regularizate prin functii spline netezite
(Maria & Muntean, 1987). In plus, unele variante IP sunt consistente si interpretabile statistic
deoarece estimarea se raporteaza la variabilele originare observate.
Sunt cunoscute mai multe tipuri de metode IP (review Hosten, 1979; Connors, 1990;
Moser, 1988; Levenspiel, 1999; Maria, 1999):
- metoda IP ponderata;
- metoda IP cu liniarizari succesive ale expresiilor vitezelor de reactie (Moser, 1988);
- metoda IP analitica cu/fara eliminarea variabilei explicite timp;
- metoda IP cu considerarea unor ipoteze de pre-echilibru a reactiilor;
- metoda IP analitica cu utilizarea transformatei Laplace a modelului ODE;
- metoda IP analitica prin utilizarea ecuatiei seculare a sistemului cinetic diferential;
- variante grafice si/sau numerice ale IP incluzand punctul experimental intial si cel
inregistrat la injumatatirea concentratiei initiale de reactant.

Detaliaza aici cateva dintre ele, cu exemplificare din Moser, p. 151, Pe scurt ce se reprezinta
grafic functie de ce.

Modelarea proceselor celulare - cap. 3. Pag 64


Desi imprecise si deplasate, metodele de estimare cinetica directa DP si IP sunt simple, rapide,
fara sa ridice probleme de convergenta in obtinerea unui estimat initial al parametrilor
modelului cinetic. Prin simple manipulari algebrice, estimatul rezulta cu un efort de calcul
mai mic cu cel putin sase ordine de marime decat cel necesar unui estimator exact NLS.
Totusi, solutia DP sau IP este de slaba calitate in cazurile slab-conditionate, incluzand date
degenerate, incomplete, cu o eroare experimentala mare, sau modele supra-parametrizate.
O varianta de IP mai performanta a fost propusa de Maria & Rippin (1997), respectiv
metoda MIP. Aceasta varianta este capabila sa ia in consideratie atat datele cinetice masurate
cat si informatii cinetice incluse in banci de date privind procese similare. MIP este aplicabila
cazurilor de estimare a modelelor cinetice de complexitate mica si medie, fiind simpla, rapida,
si mai sigura in cazurile slab-conditionate. MIP nu are probleme de convergenta si nu necesita
liniarizari ale modelului ODE sau factori de ajustare. In fapt, MIP transforma sistemul cinetic
ODE intr-unul algebric supradeterminat prin aplicarea unui operator integral IP. Informatia
suplimentara privind un proces cinetic analog, guvernat de acelasi tip de model cinetic, si
prezentand curbe cinetice (C’,t’), parametrii si covarianta ( Kˆ ' ,Vˆ ' ) cunoscute (asa-numitul
‘proces istoric’), este utilizata impreuna cu datele 'procesului curent', pentru care sunt
cunoscute doar curbele cinetice (C,t), iar parametrii cinetici ( Kˆ ) sunt de estimat. Selectarea
procesului si a datelor cinetice similare se bazeaza pe o analiza de similitudine a proceselor
(curent si istoric), prin compararea perechilor de curbe cinetice similare ca forma si apartinand
unor specii similare. Un index numeric de similaritate (respectiv cvasi-constanta raportului
vitezelor de reactie in termeni redusi ai domeniului concentratie-timp) este utilizat pentru a
valida similitudinea dintre procesele comparate. Informatia apriori (C’,t’) si ( Kˆ ' ,Vˆ ' ) este
inclusa in estimare prin aplicarea IP ambelor procese si prin raportarea vitezelor integrale ale
speciilor observate similare pe un domeniu de timp de reactie redus comun ∆t * , in forma:

 
M t*  ∑ D z G z  ∑ D z M t* (G z )
∆C j ∆C' j ∆t' z = z Dd M t * ( G d )
/ . = ~ ~ ~ ~ ~ ;
∆t * ∆t * ∆t  ~ ~  ∑ D z M t* (G z ) Dd M t* ( Gd )
M t*  ∑ D z G z  z
z 
(Eq. X)
t2
[Mt(C)=( ∫ C dt )/∆t, noteaza media integrala a concentratiilor pe intervalul ∆t = ( t 2 − t 1 ) ;
t1
~ ~
j= indexul speciei observate; D , D ,G ,G = termeni cinetici complecsi ce includ variabilele C,
C', k, k' ]. Dupa descompunerea raportului de sume in rapoarte mai simple, termenul cinetic
dominant (index d) in domeniul investigat ∆t * este evidentiat si utilizat in estimarea
constantelor cinetice ale setului algebric MIP nou constituit. In acest fel sunt estimati cu
prioritate parametrii cinetici corespunzand vitezelor semnificative de reactie in domenii de
timp in care estimabilitatea si senzitivitatea lor este maxima. Gradul de 'dominanta' al unui
termen cinetic poate sa difere in diferite sub-intervale de timp, si de aceea estimatul final MIP
este o medie a estimatelor aceleiasi constante cinetice obtinute in diverse sub-intervale si
pentru diverse specii observate. Spre exemplificare, in Fig. XXX sunt prezentate curbele
cinetice ale speciei C pentru doua procese similare. Estimarea constantelor procesului analizat
se face pe baza constantelor cinetice ale procesului similar, utilizand formule de estimare (Eq.
X) scrise separat pentru fiecare termen cinetic in domeniul de timp de reactie in care acel
termen este dominant si cu estimabilitate crescuta. In Fig. XXX aceasta corespunde

Modelarea proceselor celulare - cap. 3. Pag 65


identificarii reactiei A+B→C in portiunea ascendenta a curbei C(t), a reactiei C⇐⇒D in zona
de cvasi-echilibru, si a reactiei D→P in zona descendenta a curbei cinetice).

Fig. XXX. Exemplificarea analizei de similaritate si estimare pe portiuni a unui model de


reactii (bio)chimice prin metoda directa MIP.

Urmand aceasta strategie de 'fortare' a suprapunerii curbelor cinetice ale proceselor


similare, si determinare a variatiei in constantele cinetice induse de variatii in integralele de
concentratie, rezulta o metoda mai robusta de estimare si a cazurilor slab-conditionate. Astfel,
constantele cinetice ce apar in termeni slab-conditionati, cu senzitivitate si estimabilitate
redusa, pot fi determinate luand in calcul raportul constantelor cinetice din procesul cinetic
cunoscut si similar. MIP poate fi aplicata off-line, dar si on-line, similar estimatorului recursiv
EKF, in vederea adaptarii parametrilor modelului atunci cand observabilitatea speciilor este
variabila (Maria et al., 1996).

3.4.6.Metodele de estimare cinetica recursiva.

Tehnicile numerice de estimare recursiva sunt folosite la estimarea simulatana a


starilor si parametrilor unui model cinetic pe baza datelor experimentale achizitionate on-line
din proces. Aceste tehnici se incadreaza in solutionarea problemei identificarii, controlului si
optimizarii proceselor (bio)chimice pe baza unui model matematic de dimensiuni suficient de
reduse pentru a permite monitorizarea procesului in timp real. Cu alte cuvinte, utilizarea unui
model redus este dictata de necesitatea unei simulari rapide, in regim dinamic, a evolutiilor
sistemului, dandu-se astfel posibilitatea unei corectii rapide intr-un timp mult mai scurt decat
constanta de timp a sistemului controlat. Modelul redus se obtine, de regula, prin reducerea
unei structuri extinse, dezvoltate intr-o faza anterioara pe baza unor experimente complete de
laborator sau pilot. Reducerea se face fie prin eliminarea etapelor de reactie neimportante si
prin gruparea unor specii secundare, fie chiar recurgand la liniarizarea modelului extins in
jurul punctului de operare curent. In ambele variante, modelul redus Modelul redus trebuie sa
prezerve suficienta informatie cinetica pentru a oferi predictii ale etapelor si variabilelor
esentiale ale procesului, parametrii sai fiind continuu readaptati pe baza datelor experimentale
achizitionate on-line si a relatiilor recursive. Atunci cand adecvanta modelului este

Modelarea proceselor celulare - cap. 3. Pag 66


nesatisfacatoare dupa corectia on-line a parametrilor, este necesara si o re-identificare a
structurii modelului redus, sau de discernere intre mai multe structuri reduse alternative
(Goodwin & Sin, 1984; Maria et al., 1996; Terwiesch et al., 1994; Terwiesch, 1994).
Aceasta operatie de estimare parametrilor este facuta impreuna cu estimarea
variabilelor sistemului (stari), ce nu pot fi observate direct, si poarta denumirea de estimare
recursiva a starilor si parametrilor sistemului. Starile sistemului (x) pot fi concentratii ale
compusilor, volumul de reactie, temperatura, etc., dintre care numai o parte sunt masurate ca
'variabile de iesire' (y), cu o anumita eroare ( ε ). Variabilele 'de intrare' ale procesului, ce
cuprind inclusiv pe cele 'de control' (u), sunt de regula debite de alimentare, temperaturi de
intrare sau ale agentului termic, etc. In categoria parametrilor modelului matematic (θ) intra
acele constante ce nu pot fi determinate decat indirect prin simularea legaturilor dintre
variabilele de intrare si cele de iesire ale sistemului si potrivirea lor cu datele obtinute
experimental. In aceasta categorie intra constantele cinetice de reactie si cele Arrhenius (k, A,
E), ordinele de reactie (β), constantele transferului de masa, de moment, si termic.
In literatura sunt publicate un numar mare de variante de estimatori recursivi simultani
ai starilor si parametrilor modelelor proceselor dinamice, care folosesc sau nu forma
liniarizata sau portiuni ale modelului cinetic/matematic al procesului (Maria et al., 1996). Cel
mai cunoscut este estimatorul recursiv Filtru Kalman Extins (EKF, review Goodwin & Sin,
1984). Acest estimator este cel mai utilizat in practica de control si optimizare on-line a
proceselor (bio)chimice continue si discontinue. El prezinta avantajul simplitatii, utilizand
forma liniarizata a modelului matematic. EKF prezinta insa si mai multe dezavantaje, sub
aspectul preciziei slabe de estimare si a calitatii reduse a predictiei in cazul proceselor
neliniare rapide. De asemenea, calitatea estimatului EKF este foarte mult influentata de
structura modelului, de valorile apriori ale parametrilor, de cunoasterea si marimea erorii
experimentale (de Valliere & Bonvin, 1990). Din acest motiv, s-au dezvoltat numeroase
variante ale algoritmului de baza EKF (Terwiesch et al., 1994; Terwiesch, 1994; Jang et al.,
1986).
In varianta de baza, se considera cunoscut modelul matematic al procesului si valorile
initiale apriori propuse pentru parametrii θ o , precum si matricile de covarianta a erorii
experimentale a observatiilor (R) si starilor (Q). Orice imperfectiune in precizarea structurii
modelului, matricilor de eroare, sau valorilor initiale ale parametrilor modelului, precum si
erori experimentale mari pot cauza probleme serioase de precizie ale algoritmului recursiv
EKF si chiar divergenta sa. Din acest motiv, informatiile necesare initierii unei secvente de
estimare EKF se obtin prin experimente si simulari anterioare ale procesului cu ajutorul unui
model extins al sistemului cinetic.
Considerandu-se cunoscute ecuatiile diferentiale de bilant masic (si termic) ale
sistemului, estimatorul EKF este construit prin atasarea unor ecuatii suplimentare, de
senzitivitate, ce descriu variatia parametrilor modelului in timp. Daca parametrii modelului
sunt doar cei cinetici, respectiv θ=k, atunci variatia acestora este nula in timpul evolutiei
procesului. In plus, se poate defini un vector extins al starilor, x*, care sa inglobeze atat starile
cat si constantele cinetice ale sistemului, obtinandu-se astfel filtrul Kalman extins:

 dx  dx *
 dt = f ( x ,θ , u ,t ) + ω; cov( ω ) = Q  dt = f ( x* ,θ , u ,t ) + ω
 
dθ   x
 =0 ⇒  x* =  
 dt  θ 
 y = h( x ) + ε ; cov( ε ) = R  y = h( x* ) + ε
 

Modelarea proceselor celulare - cap. 3. Pag 67


(x= starile sistemului; θ= parametrii modelului (constanti in timp); x*= vectorul extins al
starilor si parametrilor; u= vectorul variabilelor de intrare si de comanda din sistem, cov=
covarianta; t = timp; Q= matricea de covarianta a erorii experimentale ω a starilor; y=
variabilele de iesire din sistem (observabile); R= matricea de covarianta a erorii experimentale
ε a observatiilor).
Estimatorul recursiv EKF procedeaza in continuare la discretizarea modelului
matematic folosind incrementele de timp ( t k + 1 − t k ) utilizate la inregistrarea datelor
experimentale din sistem. In acest fel, modelul matematic ODE este transformat intr-unul
algebric, ce propaga in pasul de timp k+1 estimatiile starilor si parametrilor de la momentul
anterior k:
  xˆ    xˆ   ω 
 xˆ *k + 1 =  ˆ  = f   ˆ  , uk ,t k  +  
 θ  k + 1  θ   0 
 k  k
 *
 y k = ˆy k + ε k ; ˆy k = h( xˆ k , uk ,t k )

Observatii inregistrate in sistem la mometul t k , respectiv yk , sunt comparate cu predictiile


modelului pentru acelasi moment, anume y$ k , si folosite pentru corectia estimatului in pasul
k+1 printr-o relatie de proportionalitate in raport cu reziduurile observatiilor:

[ ]
xˆ *k + 1 = f ( xˆ *k + 1 ) + Lk y k − h( xˆ *k ) .

Matricea de proportionalitate Lk se numeste matrice ‘Kalman gain’ a filtrului, si este


reactualizata in fiecare pas de estimare, impreuna cu matricea de predictie a erorii starilor in
pasul următor Pk+1 (Goodwin şi Sin, 1984):

[ ][
Lk = Fk Pk H kT + GSJ T H k Pk H kT + JRJ T ]−1

[
Pk + 1 = Fk Pk FkT + GQG T − Lk H k Pk H kT + JRJ T LTk ]
In relatiile de mai sus s-au folosit urmatoarele matrici de senzitivitate, definite astfel:

 ∂f   ∂h   ∂x k + 1   ∂y 
Fk =  , H k =  , G =   , J = .
 ∂x k   ∂x k   ∂ω   ∂ε 

In absenta unor informatii experimentale complete, Maria et al. (1996) recomanda definirea
matricilor Q, R, S pentru cazul unei erorii experimentale normale si constante in timp, astfel:

R = σ 2 I ; Q = 0.01σ 2 I ; S = 0 .

(in care σ 2 este dispersia erorii experimentale). Matricea Q a fost adoptata intr-o varianta
apropiata de matricea nula in scopul considerarii unei incertitudini mici in evaluarea starilor
modelului cu modelul liniar folosit, dar mare in ce priveste parametrii sai. Pentru valoarea
initiala a matricii de predictie a erorii starilor Maria et al. (1996) recomanda utilizarea
informatiei apriori privind estimatul parametrilor si calitatea lor:

Modelarea proceselor celulare - cap. 3. Pag 68


 Q 
Po =  2 ~  ; m=1,…,p ,
 diag [ σ / λ m ] 
~
in care λ m reprezinta valoarea proprie a matricei de informatie (modificate pe diagonala) a
sistemului:

(∑ ir X iT X i +σ 2 I ); X iT =  ∂f∂iuθ(θˆ )  .
 m 

Integrarea modelului dinamic intre doua momente succesive de obtinere a observatiilor ( t k si


t k + 1 ) in scopul obtinerii predictiilor sale, este recomandabil a fi facuta cu un integrator
numeric de precizie (Runge-Kutta de ordin superior, sau algoritmul Gear; vezi Constantinides
& Mostoufi, 1999). Matricile derivatelor Fk , H k pot fi evaluate prin scheme simple de calcul
numeric a derivatelor (metoda Euler, sau de ordin superior, Tabel 3.3).

3.4.7. Metode exacte de estimare cinetica utilizand algoritmi de optimizare numerica.

Solutionarea problemei de estimare cinetica printr-o metoda exacta (indirecta) implica


gasirea extremului global si fezabil (minim / maxim) al functiei obiectiv de estimare,
problema echivalenta cu una NLP sau MINLP. Functia obiectiv in sisteme biochimice fiind de
regula multimodala, problema este solutionata numeric prin utilizarea unei proceduri de
optimizare globala. Sistemele biocinetice sunt dificil de estimat si datorita neliniaritatii mari a
modelului cinetic, a restrictiilor complicate, intercorelatiilor mari intre parametrii cinetici,
observabilitatii variabile a speciilor, si situatiilor frecvente a unor date incomplete cu
reproductibilitate redusa. Utilizarea unei metode clasice de optimizare, in special a metodelor
de gradient ce folosesc gradientul functiei obiectiv si a restrictiilor in determinarea iterativa a
extremului, ridica probleme de convergenta si duce adesea la rezultate nesatisfacatoare.
Aceste inconveniente sunt amplificate de forme particulare ale functiilor modelului si
restrictiilor ce induc un caracter neconvex problemei de optimizare (Salcedo, 1992). Pentru a
solutiona cu succes o astfel de problema de estimare este necesara utilizarea unei metode de
optimizare performante si potrivite cazului analizat, cuplata cu o analiza mai ampla a datelor
initiale si a formei modelului cinetic. Algoritmii de optimizare sunt de doua tipuri: metode de
gradient (ce utilizeaza derivatele functiilor modelului), si fara gradient (de regula algoritmi de
cautare aleatoare).
Metodele de gradient (GM) utilizate in rezolvarea problemei de estimare NLP
utilizeaza o succesiune de iteratii prin care estimatul constantelor cinetice k̂ iter obtinut in
iteratia 'iter' este modificat in iteratia urmatoare cu scopul apropierii de extremul functiei
obiectiv:

kˆ iter + 1 = kˆ iter + λiter s iter .

Modelarea proceselor celulare - cap. 3. Pag 69


In formula de recurenta anterioara, vectorul directiei de cautare ( s iter ) si pasul de cautare
( λiter ) sunt ajustate iterativ dupa proceduri specifice fiecarui algoritm de optimizare in parte.
Metodele GM pot fi clasificate in metode 'de ordinul unu' (care utilizeaza in procedura de
optimizare derivatele de ordin unu, respectiv matricea Jacobi a modelului si a restrictiilor),
metode 'de ordin doi' (care utilizeaza derivatele de ordin unu si doi, respectiv matricile Jacobi
si Hess), si metode 'de metrica variabila' (care utilizeaza aproximatii ale matricilor Jacobi si
Hess). Dintre metodele GM sunt de mentionat: metoda pantei maxime, metoda Gauss-
Newton, metoda Newton, metoda Marquardt, metoda gradientilor conjugati, metoda Broyden,
metoda Powell, metoda Davidon-Fletcher-Powell, metoda Broyden-Fletcher-Goldfarb-
Shanno, metoda programarii secventiale patratice, etc. (Fletcher, 1980; Press et al., 1992;
Constantinides & Mostoufi, 1999; Coleman et al., 1999). Restrictiile problemei de estimare
sunt considerate in formula iterativa de calcul prin includerea lor intr-o functie obiectiv
extinsa (denumita functie Lagrange), si prin utilizarea lor in ajustarea directiei si pasului de
cautare. Metodele GM de optimizare sunt de regula foarte rapide in a localiza solutia locala
(optimul local), dar nu pot localiza cu siguranta optimul global, depinzand foarte mult de
solutia de start aleasa. In plus, GM intampina serioare dificultati de convergenta in
solutionarea problemelor de estimare slab-conditionate si a problemelor cu restrictii neliniare
complicate, necesitand o evaluare cu precizie ridicata a derivatelor functiilor modelului si a
restrictiilor. O marire a sansei de a localiza optimul global poate fi realizata cu o metoda GM
doar daca cautarea extremului functiei obiectiv este reluata dintr-un numar mare de puncte de
start, generate aleator in intreg domeniul fezabil investigat (Press et al., 1992).
In cazul in care problema de estimare este formulata in sens MINLP, sunt aplicabile
metode speciale GM, problema originala fiind descompusa intr-o serie de sub-probleme.
Dintre algoritmi sunt de mentionat 'metoda descompunerii generalizate a lui Bender'
(Geoffrion, 1972), si 'metoda aproximatiei exterioare' (Duran & Grossmann, 1986a-b). Aceste
metode incearca sa identifice sursele de neconvexitate ale problemei MINLP, si apoi sa
descompuna problema originala intr-o problema 'primara' (o problema NLP rezolvabila pentru
un set fixat al variabilelor intregi), si o problema 'master' (o problema liniara cu variabile
mixte intregi si continue, rezolvabila in raport cu variabilele intregi). Partitionarea problemei
este facuta in asa fel incat variabilele intregi pot fi determinate independent de cele continue.
Deoarece restrictiile trebuiesc evaluate inainte de solutionare, problema 'master' este rezolvata
ca o serie de sub-probleme relaxate. Pentru a gasi optimul global, Kocis & Grossmann (1988)
localizeaza mai intai sursele de neconvexitate prin teste de optim local si global si apoi
solutiile invalide sunt relaxate succesiv. Floudas et al. (1989) sugereaza o partitionare a
problemei originare care sa asigure obtinerea solutiei globale, dupa un anumit numar de
iteratii, atat pentru problema 'primara' cat si pentru cea 'master'. Prin partitionarea variabilelor
responsabile si ne-responsabile de aparitia neconvexitatilor problemei MINLP, problemele
'master' si 'primare' sunt iterate pana se obtine solutia globala a problemei de optimizare.
Grossmann & Sargent (1979) propun o procedura de tip 'ramificare-si-limitare' ('branch-and-
bound') ce rezolva succesiv sub-problemele NLP utilizand un criteriu potrivit pentru
ramificarea cautarii. Indiferent de varianta, metodele de gradient necesita identificarea si
eliminarea surselor de neconvexitate ale problemei MINLP inainte de demararea secventei de
cautare a optimului local, prin analizarea formei functiei obiectiv si a restrictiilor, prin
efectuarea de transformari convenabile, sau prin rezolvarea unei probleme NLP perturbate in
jurul fiecarei solutii locale.
Tendinta actuala in dezvoltarea de algoritmi de optimizare globala se axeaza pe
ameliorarea eficientei de localizare a optimului global, chiar cu pretul unui efort de calcul
important, exprimat de regula prin numarul sporit de evaluari necesare ale functiei obiectiv si

Modelarea proceselor celulare - cap. 3. Pag 70


ale modelului cinetic. Caracteristici suplimentare ale algoritmului de optimizare, cum ar fi
simplitatea, usurinta in programare, amploarea calculelor auxiliare, independenta cautarii de
solutia initiala propusa parametrilor cautati, sunt foarte importante in alegerea variantei
potrivite unui caz dat.
O clasa aparte a metodelor de optimizare globale este cea a metodelor de cautare
aleatoare (RS, review Maria, 1998). Desi mai 'lent' convergente decat metodele GM,
algoritmii RS rezolva cu succes cele mai multe dintre dificultatile de optimizare mentionate
anterior. Metodele RS sunt simple, usor de programat, mult mai sigure in solutionarea
problemelor de optimizare globala complicate, neconvexe, multimodale, nefiind dependente
de alegerea solutiei initiale a problemei. Dezvoltari recente ale metodelor RS sunt foarte
eficiente in rezolvarea problemelor de estimare MINLP neconvexe, fiind potrivite si pentru
solutionarea problemelor de estimare (bio)cinetica, incluzand cazuri slab-conditionate sau
supra-parametrizate (Edwards et al., 1995, 2000; Salcedo, 1992; review Banga & Seider,
1995; Maria, 1998, 2003c).
Metodele de optimizare RS utilizeaza un algoritm iterativ de cautare a extremului
functiei obiectiv, cu o relatie de recurenta asemanatoare cu cea a metodelor GM. Diferenta
consta in aceea ca pasii si directiile de cautare sunt ajustate iterativ dupa proceduri proprii
folosind variabile aleatoare. Secventa aleatoare de cautare este generata in moduri diferite, in
functie de algoritm, esantionul putand fi de marime fixa sau variabila, generat uniform sau
dupa o anumita repartitie statistica, adaptabila sau neadaptabila in functie de succesul cautarii
din iteratiile anterioare, esantion dispersat intr-o sfera sau hiper-cub al domeniului fezabil.
Pasul de cautare poate fi fix, optimizat, sau adaptiv, luand in consideratie istoricul cautarii in
vederea generarii noului punct test. Metodele RS pot rezolva relativ usor probleme de
estimare MINLP prin complectarea secventei de cautare a variabilelor continue, cu una de
cautare a variabilelor discrete, in forma (Salcedo, 1992):

y iter + 1 = γ + INT [U iter M iter + D ] ; M iter + 1 = M iter ( 1 − ε ) ; M o = ξ − γ .

In relatia de recurenta anterioara, U este o matrice diagonala de numere aleatoare generate


uniform in intervalul [0,1] (de dimensiune (p- pc ); p = numarul total de parametrii de cautare;
pc = numarul de parametrii continui de cautare), D T = 1 ,..., 1
2 2
[
este un vector de]
dimensiune (p- pc ); M este vectorul intervalelor de cautare ( M o = domeniul initial); ε este un
factor de 'contractare' iterativa a domeniului de cautare; INT noteaza operatorul de conversie a
numerelor reale la numarul intreg cel mai apropiat si mai mic. O astfel de strategie ofera
posibilitatea cautarii parametrilor intregi pe intreg domeniul fezabil, in timp ce domeniul de
cautare al parametrilor continui este contractat sau dilatat in cursul iteratiilor in functie de
succesul cautarii. Metodele RS sunt de mai multe tipuri: metode RS pure, metode adaptive
aleatoare (ARS); metode aleatoare 'simulated annealing' (SA); algoritmi genetici aleatori
(GA); algoritmi aleatori de partitionare a domeniului de cautare ('clustere', CA); algoritmi
aleatori evolutivi (EA).
Metodele ARS adapteaza secventa aleatoare de cautare iterativa a optimului (respectiv
pasul de cautare, directia, domeniul investigat, generatorul de puncte aleatoare de testat), in
functie de istoricul cautarii, respectiv a pasilor de succes si insucces. Aceasta strategie este
completata de o 'dilatare' urmata de o 'contractare' a domeniului de cautare, in scopul rafinarii
solutiei si preintampinarii colapsului metodei intr-un punct de optim local. Cele mai
importante clase de metode ARS sunt urmatoarele (Maria, 1998): ARS cu generarea unui
centroid de cautare, clasa metodelor ARS-Luus-Jaakola, clasa metodelor ARS cu pas adaptiv,

Modelarea proceselor celulare - cap. 3. Pag 71


sau combinatii ale lor. Printre cele mei performante ARS sunt de mentionat metoda MWL
(Wang & Luus, 1978), metoda Luus (1998), metoda ARDS (Martin & Gaddy, 1982), metoda
ICRS (Casares & Banga, 1989), metoda M-SIMPSA (Cardoso et al., 1996, 1997), metoda
SGA (Salcedo et al., 1990). Banga & Seider (1995) au propus o metoda ARS pentru
rezolvarea problemelor dinamice complexe, situatie in care multe tehnici de gradient GM
esueaza. Salcedo (1992) si Cardoso et al. (1996) au prezentat o metoda ARS combinata cu SA
cu performante ridicate in rezolvarea problemelor MINLP. Mihail & Maria (1986) si Maria
(2003c) au propus o metoda ARS multimodala (denumita MMA si respectiv MMAMI)
performanta in rezolvarea problemelor de estimare multimodale neconvexe NLP si MINLP.
Metoda MMA imbunatateste considerabil viteza de convergenta si siguranta in obtinerea
solutiei globale prin utilizarea a doua strategii combinate: o cautare locala pseudo-
unidirectionala, si o cautare globala pseudo-multimodala. Metoda MMA prezinta doar patru
parametrii de procedura ajustabili care controleaza ponderea cautarii locale/globale, viteza de
contractie/expansie a domeniului de cautare functie de istoricul cautarii si gradul de rafinare a
solutiei. Varianta MMAMI a metodei este performanta in rezolvarea problemelor de estimare
de tip MINLP.
Metodele de optimizare aleatoare de tip 'simulated annealing' (SA) se bazeaza pe teoria
lanturilor Markov, luand in calcul doar informatia obtinuta in ultimul pas in scopul
directionarii cautarii aleatoare. In ciuda unei viteze de convergenta foarte scazute, metodele
SA prezinta o siguranta ridicata in localizarea optimului global pentru o problema complexa
NLP. Principala diferenta in raport cu alte metode RS consta in posibilitatea ca SA sa accepte,
intr-una dintre iteratii si in anumite conditii, un pas de cautare de insucces, cu o probabilitate
data de repartitia Boltzmann, ocolind astfel optimele locale (Schoen, 1991; Boender &
Romeijn, 1995; Kalivas, 1995). Cardoso et al. (1994, 1996, 1997) au propus o varianta de SA
cuplata cu o metoda ARS de tip centroid pentru rezolvarea cu succes a problemelor MINLP
neconvexe, chiar daca efortul de calcul necesar localizarii optimului global este cu 2-3 ordine
de marime mai mare decat cel al unei metode ARS performante.
Algoritmii genetici (GA) sunt metode aleatoare la care generarea iterativa a punctului de
testat prezinta similitudini cu procesul biogenetic de mutatie si cu selectia naturala (Goldberg,
1989). In fiecare iteratie, GA utilizeaza informatii provenite din solutii (puncte) candidate.
Prin aplicarea unor operatori de 'incrucisare' si de 'mutatie', se genereaza un 'descendent', testat
prin evaluarea functiei obiectiv atasate (denumita si 'fitness function'). O iteratie completa a
GA implica urmatorii pasi de calcul: i) pornind de la solutia curenta, se genereaza aleator
uniform un anumit numar (marimea populatiei, ‘population size’) de puncte fezabile (indivizi,
‘individuals’); ii) ‘indivizii’ sunt divizati, in mod aleator, in doua sau mai multe multimi
parentale (‘parents’); iii) din doua multimi 'parentale' se selecteaza doi 'indivizi', printr-o
procedura aleatoare, sau adaptiv aleatoare (proportionala, pe baza de clasificare etc.); iv)
vectorii ‘parentali’ sunt rescrisi intr-un alt cod numeric decat cel zecimal (de exemplu binar),
devenind astfel ‘cromozomi’ de o anumita lungime; v) prin metoda 'incrucisarii' a doi
'cromozomi parentali’ este creat un nou ‘individ’; vi) ‘descendentul’ astfel obtinut (respectiv
un nou vector al parametrilor de cautare) continua sa sufere transformari prin asa-numitul
procedeu al ‘mutatiei’ aleatoare al unei parti ale sale, cu o anumita frecventa; in acest fel, se
asigura explorarea intregului domeniu de cautare al parametrilor, ceea ce nu ar fi putut fi
garantat doar prin simpla aplicare a metodei 'selectiei' si 'incrucisarii'; vii) in final, ‘indivizii’
mutanti sunt decodati in baza zecimala si utilizati pentru evaluarea functiei obiectiv si a
progresului cautarii optimului global. Pasii iii)-vii) sunt repetati de un anumit numar de ori
(‘numar de generari’) fiind retinut cel mai 'bun' punct iterativ. Exista numeroase variante de
metode GA, de exemplu folosind 'incrucisarea' ortogonala, sau operatori de 'aglomerare
(‘crowding’). Aceste variante cauta sa previna convergenta prematura catre optime locale, si

Modelarea proceselor celulare - cap. 3. Pag 72


sa combata tendintele 'elitiste' in selectarea de noi 'indivizi' (Yu et al., 2000; Hanagandi &
Nikolaou, 1998).
Algoritmii evolutivi (EA) de optimizare sunt metode RS care mimeaza procesul de
evolutie a speciilor in mediul natural (Schwefel, 1985). Ca si GA, EA genereaza in mod
aleator o ‘populatie’ de puncte de testat, bazat pe un operator de ‘mutatie’, si utilizeaza functia
obiectiv si restrictiile in ierarhizarea si eliminarea ('selectia') punctelor generate. Procedura de
selectie se poate aplica in doua moduri. Algoritmul ( µ + λ ) EA genereaza, prin mutatie, din µ
'parinti' λ-descendenti si apoi, din µ + λ membrii rezultati sunt selectati cei mai bine
clasificati µ membrii care devin 'parinti' intr-o noua generatie (populatie de puncte).
Algoritmul ( µ , λ ) EA genereaza, prin mutatie, din µ 'parinti' λ>µ descendenti si apoi, din λ
membrii rezultati sunt selectati cei mai bine clasificati µ membrii care devin 'parinti' intr-o
noua generatie. Costa & Oliveira (2001) au propus un algoritm EA performant in rezolvarea
problemelor de tip MINLP. Pham (1995) a propus o metoda EA bazata pe un algoritm
competitiv intre mai multe populatii de puncte ('membrii', sau 'familii'), fiecare folosind o
strategie proprie de cautare. Populatiile cu rezultatele cele mai 'bune' si cele mai 'slabe', sufera
astfel o schimbare a strategiei de cautare, intr-un nou ciclu de calcul, urmand o anumita
schema evolutiva. Pham (1995) propune si o combinatie de algoritmi EA si GA, in timp ce
Wong & Wong (1995) studiaza o metoda de optimizare aleatoare hibrida GA si SA.
Exista multe analogii intre metodele ARS, GA si EA. De exemplu, marimea populatiei
in metoda GA poate fi asimilata cu populatia de puncte generata intr-o iteratie ARS; frecventa
mutatiilor in GA corespunde cu cea din EA si cu controlul convergentei locale/globale din
ARS; dilatarea si contractarea periodica a domeniului de cautare in ARS este analoga cu
cresterea diversitatii populatiei in GA prin utilizarea unei scheme de 'aglomerare' sau de
disipare in 'clustere' (Hanagandi & Nikolaou, 1998); schema de competitie - cooperare intre
'familii' in EA este echivalenta cu cea anti-elitista aplicata in GA, cu alternanta intre cautarea
globala si locala in ARS, sau cu cautarea locala in 'clustere' in algoritmii CA (De Jong, 1975).
Combinatii intre tehnicile de optimizare RS, sau intre cele RS si GM, sunt cunsocute ca
prezentand o eficienta ridicata atat sub aspectul vitezei de convergenta catre solutie cat si al
sigurantei localizarii optimului global. De exemplu, Maria (2003c) a propus o combinatie
intre o varianta ARS si un algoritm EA pentru rezolvarea problemelor de estimare MINLP
neconvexe (asa-numitul algoritm MMAMI-EA). In aceasta varianta, cautarea optimului global
se face in paralel in mai multe populatii de puncte ('familii'), fiecare 'familie' urmand o
procedura de cautare completa ARS (in fapt MMAMI). Dupa un ciclu de calcul, 'familiile'
sunt ierarhizate in functie de rezultatele cautarii: cele mai 'bune' familii, prezentand o functie
obiectiv cu o valoare mai favorabila, ocupa pozitiile de frunte, pe cand cele cu rezultate
modeste sunt mentinute in pozitii inferioare. Scopul acestei ierarhizari este acela al
modificarii caracteristicilor de cautare in urmatorul ciclu de calcul: cu cat pozitia in ierarhie
este mai buna, cu atat cautarea optimului va avea un caracter mai local, optimul obtinut
anterior suferind doar o rafinare; cu cat pozitia 'familiei' in ierarhie este mai nefavorabila, cu
atat cautarea optimului va fi mai axata pe una globala pe intreg domeniul fezabil. In fapt, intr-
un ciclu de cautare metoda MMAMI-EA aplica doua nivele de competitie: o competitie
eliminatorie intre membrii aceleiasi 'familii' (respectiv intre punctele de cautare), si o
competitie intre 'familii' pentru o cat mai buna pozitie ierarhica. Aceasta competitie-
cooperativa intre 'familii' asigura celor mai slab plasati in ierarhie o sansa de a depasi optimele
locale si de a se lansa catre o pozitie fruntasa. In acelasi timp, 'familiile' plasate in topul
ierarhiei, prin pastrarea aceleiasi politici de cautare intr-un nou ciclu de calcul, prezinta un risc
mai mare in a pierde pozitia fruntasa cu scopul depasirii optimului local.

Modelarea proceselor celulare - cap. 3. Pag 73


3.4.8. Analiza statistica a calitatii estimatului cinetic.

In cazul unui sistem cinetic identificabil (vezi conditiile de identificabilitate prezentate


de Vajda et al., 1989), modelul cinetic obtinut printr-o procedura de estimare statistica trebuie
verificat din punctul de vedere al unicitatii solutiei, calitatii statistice, si semnificatiei fizico-
chimice-biologice a solutiei in raport cu informatiile cinetice disponibile, precum si al
adecvantei si capacitatii de predictie in conditii variate de reactie (conditii dinamice,
oscilatorii, ne-izoterme, cvasi-stationare, cu/fara limitari ale transportului masic, in conditii de
curgere ideala/neideala a fluidelor in sistem, in prezenta altor componenti). Testele statistice
se impart in trei categorii (BAtes & Watts, 1988; Iordache et al., 1991):
- teste de convergeta si calitate a estimatorului statistic;
- teste de verificare a calitatii estimatului printr-o analiza de senzitivitate parametrica;
- teste de adecvanta a modelului cinetic bazate pe comparatia reziduurilor de estimare (in
termeni de dispersie medie) cu eroarea (dispersia) experimentala, in conditiile
considerarii calitatii datelor, si incertitudinii structurii modelului (McLean et al., 1979;
Ziegel & Gorman, 1980; Otto, 1999).

Estimatul cinetic este mai degraba influentat de structura modelului si de calitatea


datelor folosite decat de procedura de estimare folosita in localizarea sa (Stewart et al., 1996).
Deoarece in majoritatea proceselor biologice exista un exces de grade de libertate (sub forma
parametrilor cinetici ajustabili) fata de numarul de variabile observate, modelarea cinetica
poate duce la obtinerea unor solutii multiple. Desi o analiza teoretica de multiplicitate si
unicitate a solutiei este posibila in cazul sistemelor ODE (Compton, 1991), selectia modelelor
cinetice se face mai degraba prin proceduri de optimizare si experimente suplimentare cuplate
cu metode de ameliorare a structurii cinetice (Froment & Hosten, 1981).
Testele statistice de evaluare a calitatii estimatorului statistic, a calitatii estimatului
cinetic ('teste de inferenta a parametrilor') si de apreciere a adecvantei modelului sunt
prezentate sumar in Tabelul 3.4. pentru problema de estimare formulata in sens NLP (cap.
3.4.3.). In literatura sun detaliate multe din aceste teste si specificate conditiile lor de
aplicabilitate (Bard, 1974; Bates & Watts, 1988; Maria & Rippin, 1993; Fogiel, 1998; Steiner
et al., 1990; Otto, 1999; Constantinides, & Mostoufi, 1999; Iordache et al., 1991; Maria,
1997). Aceste teste pot orienta viitoare decizii avand ca scop ameliorarea structurii modelului,
extinderi sau reduceri ale sale, planificarea de noi experiente pentru imbunatatirea calitatii
estimatului, schimbarea strategiei de estimare, sau schimbarea procedurii de optimizare
utilizate. Daca analiza statistica indica corelatii mari intre parametrii cinetici (peste 0.95-0.99
in valoare absoluta), acestia nu pot fi estimati simultan cu precizie ridicata. Acest efect
nedorit, datorat formei particulare a modelului sau a datelor cinetice utilizate, poate fi
diminuat prin modificarea structurii modelului, sau prin efectuarea de noi experimente,
abaterea standard a estimatului fiind proportionala cu n −0.5 (n = numarul de experimente;
Bard, 1974). De pilda, prin efectuarea de experimente izoterme, este eliminata estimarea
simultana a factorilor Arrhenius din corelatia cu temperatura a constantelor cinetice (Pritchard
& Bacon, 1978). Experimente planificate dupa criterii speciale duc la o reducere a
intercorelatiilor dintre constantele cinetice estimate (Bard, 1974; Dodge et al., 1988). Alte
tehnici recurg la eliminarea unor parametrii, putin semnificativi, din modelul cinetic (Maria &
Rippin, 1993), la gruparea parametrilor (Vajda et al., 1989), la reducerea dimensiunii
vectorului de estimat, la fixarea ('inghetarea') anumitor parametrii insenzitivi in cursul

Modelarea proceselor celulare - cap. 3. Pag 74


estimarii (Bard, 1974; Le Roux et al., 1993; Lei & Jorgensen, 2001), sau la transformari
neliniare in ecuatiile modelului (Espie, 1986).
Exista situatii in care testele de semnificatie ale estimatului indica, pentru mai multi
parametrii, aproximativ acelasi efect asupra predictiilor modelului, sau un efect scazut. In
aceste cazuri, solutia de estimare este ambigua chiar daca datele experimentale sunt
satisfacatoare sub aspectul 'zgomotului' de masurare, a distributiei si numarului lor. Un efect
imediat este slaba-conditionare a problemei de estimare (respectiv a matricii Jacobi a
derivatelor modelului), obtinerea de valori mari ale dispersiei estimatului, parametrii puternic
intercorelatii, si cu o semnificatie scazuta in model. Sunt posibile mai multe cauze ce pot fi
investigate (Bard, 1974).
i) Daca parametrii estimati sunt incerti si reziduurile de estimare mari in raport cu
eroarea experimentala, calitatea lor poate fi ameliorata prin efectuarea de noi experimente in
conditii de reactie cat mai variate.
ii) Daca parametrii estimati sunt incerti si reziduurile de estimare mici, slaba-
conditionare a problemei de estimare provine din forma degenerata a functiilor modelului sau
a datelor experimentale (respectiv termeni aditivi si/sau multiplicativi ne-estimabili, 'zgomot'
experimental mare, date ce tind catre coliniaritate, inegal distribuite pe domeniul de timp
investigat). In acest caz, informatia cinetica este insuficienta pentru determinarea cu precizie a
tuturor parametrilor, si sunt necesare experimente suplimentare pentru reducerea
intercorelatiilor si imbunatatirea calitatii datelor. Totodata, este posibila o ameliorare a
calitatii estimatului si prin reducerea structurii modelului cinetic.
iii) Daca estimatul este incert si reziduurile de estimare mari, inacceptabile in raport cu
'zgomotul' experimental, atunci modelul cinetic trebuieste respins si reformulat.

Din multitudinea de teste statistice de evaluare a calitatii estimatului si adecvantei


modelului sunt de mentionat cele clasice, din Tabelul 3.4. Pentru un model cinetic ce include r
2
observatii, masurate cu un 'zgomot' experimental de nivel σ uii , dependent de experimentul
u=1,...,n, si de observatiile i=1,...,r, aplicarea unui criteriu de estimare de 'cele mai mici
patrate ponderate' (WLS, Tabel 3.2.) furnizeaza parametrii estimati k̂ , prin minimizarea
functiei obiectiv (Bates & Watts, 1988):

2
n r Ĉ ( t , k ) − C i ( t u )
Min k f ( k ) = ∑ ∑  i u  ,

u =1 i =1 σ uii 

cu restrictiile:
kˆ > 0 ; g j ( k ) ≥ 0 ; j = 1,2 ,..., m ; α i ≤ k i ≤ β i ; i = 1,2 ,..., p .

Functia obiectiv este minimizata in prezenta restrictiilor in variabile si parametrii, impuse din
considerente de semnificatie fizico-chimica-biologica si pentru satisfacerea unor conditii de
bilant masic (de exemplu restrictii de echilibru termodinamic, conditii de existenta a
sistemelor de reactii reversibile ciclice, etc.). Estimatul cinetic k̂ poate fi utilizat pentru
analiza capacitatii de predictie a modelului identificat, si analiza semnificatiei statistice a
parametrilor.
Astfel, reziduurile model-experiment, in termeni de concentratii ale speciilor
observate, eiu = Ĉi ( tu ,k ) − Ci ( tu ) , sumate pentru toate speciile si experimentele formeaza

Modelarea proceselor celulare - cap. 3. Pag 75


n r
asa-numita 'suma a patratelor reziduurilor', respectiv SSR= ∑ ∑ ( Ĉ i ( t u , k ) − C i ( t u )) 2 . SSR
u =1 i =1
este un indicator global al adecvantei modelului cinetic in raport cu datele considerate, putand
fi comparat cu nivelul 'zgomotului' experimental prin intermediul testului χ 2 . Astfel, daca
dispersia medie a modelului este semnificativ mai mica decat cea experimentala, fiind
indeplinita inegalitatea:

s2 SSR /( nr − p )
= < χ 2 ( nr − p ;0.95 ) , σ~ 2 = Min( σ uii
2
),
~
σ 2 ~
σ 2

atunci modelul este adecvat cu o probabilitate de 95%. Testele de adecvanta sunt completate
cu graficele reziduurilor ('residual plots', Tabel 3.4.), ce pun in evidenta diverse aspecte ale
analizei statistice: abateri de la ipoteza de 'zgomot' experimental constant, prezenta
influentelor variabilelor neinvestigate ('outliers') in repartitia erorii experimentale, adecvanta
satisfacatoare a modelului, prezenta reziduurilor sistematice pozitive si negative, marimea
reziduurilor comparativ cu cea a observatiilor, etc.
Semnificatia parametrilor estimati este determinata pe baza urmatoarelor matrici,
evaluate numeric (Bates & Watts, 1988; Maria & Rippin, 1993):

n r 1  ∂C  T
 ∂C iu 
V ( kˆ )[−1p , p ] = ∑ ∑ 
iu
   , (matricea de covarianta a estimatului);
u =1 i =1σ uii  ∂ k  [ p ,1 ]  ∂ k  [ 1, p ]
2

n r  ∂C  T
 ∂C iu 
U ( kˆ )[ p , p ] = ∑ ∑  iu    + σ~ 2 I ;
u =1 i =1 ∂ k  [ p ,1 ]  ∂ k  [ 1, p ]
[ ij ][ p , p ]
R( kˆ ) = R ; (matricea de intercorelatii intre parametrii);

[V ( kˆ )]ij
Rij = ∈ [− 1,1] .
[V ( kˆ )]ii [V ( kˆ )] jj

Un estimat al parametrilor k̂ j este considerat semnificativ, cu o probabilitate de 95%, in


modelul cinetic daca este indeplinit testul Student, respectiv:

k̂ j
tj = > t( nr − p ;97.5%) .
[V ( kˆ )] jj

Un test asemenator este si cel de selectie 'ridge' modificat de Maria & Rippin (1993),
respectiv:

λ j / σ~ 2 > 1 − 3 ,

(in care λ j sunt valorile proprii ale matricii U).

Modelarea proceselor celulare - cap. 3. Pag 76


O pereche de parametrii [ k̂ i , k̂ j ] nu pot fi estimati simultan cu aceeasi precizie daca
modulul coeficientului de intercorelatie corespunzator este mare si apropiat de valoarea 1,
respectiv Rij ∈ [ 0.95 ,1 ] . Aceasta situatie poate avea cauze multiple: date experimentale
insuficiente, inegal distribuite pe domeniul de timp de reactie, sau degenerate (aprope
coliniare), model supra-parametrizat, termeni ne-estimabili ai modelului, etc. Parametrii ce
prezinta o semnificatie redusa in model, prezinta si intervale de incredere mari, respectiv:

k j = k̂ j ± { [V ( kˆ )] jj } t( nr − p ;97.5%) ; j = 1,...,p.

Modelarea proceselor celulare - cap. 3. Pag 77


Tabel 3.4. Teste de analiza a calitatii estimatului pentru problema NLP de estimare cinetica. [Notatii: r= numar de observatii; p= numar de parametrii; n= numar
r n 2
de experimente; SSR= ∑ ∑ eiu = suma patratelor reziduurilor; eiu = C iu − Ĉ iu , sau eiu = C iu − Ĉ iu ; E(*) = valoarea medie, asteptata; k ~ N ( kˆ ,Vˆ ) ].
i u
Tip test Relatii si remarci
Teste ale estimatorului:
teste de solutie locala sau globala - vezi Floudas (1995)
teste de convergenta a estimarii - viteza de convergenta, teste de progres a cautarii (Iordache et al., 1991)
test de estimator eficient n
[ ]
- E( Vˆ ) = G −1 ; G = ∑ J uT Σ −1J u ; J u = ∂Ciu / ∂k j = matricea Jacobi
u
test de estimator nedeplasat - E( kˆ ( C, x ) ) = k
test de estimator asimptotic consistent - lim n →∞ ( kˆ ( C, x ) ) = k
test de estimator invariant - nu depinde de dimensiunea vectorului k
test de estimator suficient - P( ko ) , P( k ) , L( k ) , P( C ) , P( ε ) ofera maximum de informatie
test de estimator robust - nu depinde de ko , P( ko )
Teste de adecvanta modelului:
F-test - s 2 / s e2 < F ( nr − p , n e − 1; α ) ; s 2 = SSR /( nr − p ) ;
s e2 = aproximatie a dispersiei erorii experimentale determinata din n e replicate
χ 2 -test - (vezi text)
Q -test - P( Φ > Φˆ ) = 1 − Q(( nr − p ) / 2 ,Φˆ / 2 ) > 0.1 ; (Perry et al., 1997; statistica-Q in Abramowitz & Stegun, 1964)
r = coeficient de corelatie al (x,C) - r < 1 (Fogiel, 1998)
reprezentari grafice reziduuri ('lack-of-fit' test) - test al calitatii predictiei: Cui vs. x; Ĉui vs. x; [banda de densitate de 95% probabilitate pentru Ĉ ui ( x ) ];
- test al caracterului aleator al reziduurilor ('runs'-test): eui vs. x;
- test al normalitatii sau uniformitatii erorii experimentale; detectarea influentelor ‘outliers’:

eui
[
Ĉui vs. Cui ; Cui vs. eui ; Ĉui vs. eui / s 2 ; eui / σ uii
2 ]
vs. eui / se2  ;
 ui 

(in care: se2 = σ uii


2
1 − hui ; H = J ( J T J )−1 J T = [h]ij = matricea 'hat');
ui
- test al neliniaritatii modelului si al intercorelatiilor erorilor experimentale: eui / s e2 vs. x;
ui

Modelarea proceselor celulare - cap. 3. Pag 73


 n  

- test de determinare a corelatiilor intre observatii prin reprezentarea valorilor proprii ale: ∑ eui euj   ;
 u  ij 
- reprezentari 2D si 3D ale suprafetei de raspuns [ respectiv Φ ( k1 , k 2 ,...) ], etc.
Teste de semnificatie (inferenta) a estimatului.
t j -test - testul Student al parametrului k j (vezi text)
Rij -test - coeficientul de intercorelatie ( k i , k j ) ; Rij < 1 (vezi text)

( λ j / σ~ 2 ) -test - (vezi text; Maria & Rippin, 1993)

k j = k̂ j ± st .dev.( k j ) - intervalul de incredere al parametrului k j (vezi text)


regiune comuna de incredere a parametrilor cu - ( kˆ − k )T V −1 ( kˆ − k ) ≤ ps 2 F ( p , nr − p ;1 − α ) , pentru Σ cunoscut;
probabilitatea ( 1 − α )
[ ]
Φ ( k ) ≤ Φ ( kˆ ) exp( χ 2 ( r − 1;1 − α )) / n , pentru Σ necunoscut; (Froment & Hosten, 1981)
Diverse alte teste de analiza a modelului:
test de discriminare (selectie) a modelelor - Bard (1974); Froment & Hosten (1981)
test de adecvanta modele de tip 'error-in-variable' - Kemeny et al. (1982); Ricker (1984); Valko & Vajda (1987); Kim et al. (1990,1991)
pentru variabilele independente si dependente
simultan (x,C)
teste de reducere a modelului - teste QSSA pentru eliminarea intermediarilor de reactie (Tomlin et al., 1997); teste de grupare a speciilor (Turanyi, 1990b;
Wei & Kuo, 1969; Iordache, Maria & Pop, 1988; Li & Rabitz, 1990, 1991a,b; Tomlin et al., 1997); teste de eliminare
a parametrilor (Maria, 1989; Maria & Rippin, 1993); teste de grupare a parametrilor (Vajda et al., 1989); teste de
senzitivitate parametrica (Bard, 1974; Le Roux et al., 1993; Lei & Jorgensen, 2001); teste de senzitivitate globala
(Vajda et al., 1985; Turanyi, 1990a)

Modelarea proceselor celulare - cap. 3. Pag 74


3.4.10. Planificarea experimentelor in vederea unei estimari cinetice precise si a selectiei
modelelor cinetice.

Exista mai multe proceduri de planificare a experimentelor in scopul identificarii cat


mai bune a unui model cinetic al procesului studiat. De exemplu, diverse metode incearca o
reducere a dimensionalitatii problemei de identificare, si evidentierea anumitor aspecte ale
mecanismului de recatie, dupa cum urmeaza (Connors, 1990):

(i) tehnici de izolare (sau tehnici de reducere a ordinelor de reactie) prin mentinerea
constanta a concentratiei unui reactant;
(ii) studierea unei reactii reversibile in conditii foarte apropiate de echilibru, ceea ce are ca
efect reducerea ordinelor de reactie aparente;
(iii) neglijarea stadiilor terminale ale unui proces atunci cand reactiile ce duc la produsi
secundari devin semnificative;
(iv) neglijarea stadiilor initiale ale unui proces atunci cand sunt de interes doar pasii de
reactie consecutivi finali;
(v) utilizarea unui intermediar drept reactant in vederea 'izolarii' unei portiuni din schema
de reactii; aceasta cale este foarte eficienta atunci cand este aplicta schemelor cinetice
mari la care observabilitatea speciilor variaza mult in timpul reactiei;
(vi) mimarea unui reactant cu ajutorul altui compus care poate reduce complexitatea
procesului de analizat;
(vii) schimbarea conditiilor de reactie in scopul minimizarii complicatiilor cinetice
(experimente la conversii foarte mici sau foarte mari, temperaturi diferite, pH diferit,
prezenta unui solvent sau inert, etc.);
(viii) alegerea unor conditii initiale de reactie care sa simplifice interpretarea cinetica a
datelor;
(ix) folosirea unor metode analitice selective in scopul simplificarii interpretarii datelor
cinetice.

In general, un program experimental este elaborat in scopul achizitionarii maximului de


informatie despre un proces intr-un domeniu experimental definit (Box et al., 1978).
Experimente orientate incearca o imbunatatire a calitatii estimatului, sau face discriminarea
intre modele cinetice rivale mai usoara. Alte experimente incearca reducerea inter-corelatiilor
dintre parametrii si deci o crestere a preciziei de estimare bazat pe analiza matricii de
covarianta a estimatului V ( kˆ ) (cap. 3.4.7). De exemplu, programul experimental D-optimal
proiecteaza noi puncte experimentale x̂ in asa fel incat sa fie realizata o minimizare a
determinantului matricii V (respectiv volumu minim pentru regiunea de incredere a
parametrilor). Programul experimental A-optimal proiecteaza noi puncte in vederea
minimizarii urmei matricii V, respectiv suma dispersiilor individuale ale parametrilor.
Programul experimental E-optimal proiecteaza noi experimente ce realizeaza minimizarea
celei mai mari velori proprii a matricii V, facand astfel ca regiunea comuna de incredere a
parametrilor sa fie cat mai sferica. Alte programe experimentale cauta sa mareasca discrepanta
in predictii intre modelele cinetice rivale, ducand astfel la o selectie mai usoara a modelului
cel mai potrivit (review Bard, 1974; Buzzi-Ferraris et al., 1984, 1990).

Modelarea proceselor celulare - cap. 3. Pag 75


Exemplul XXX. Identificarea cineticii Monod pentru procesul de oxidare enzimatica a D-Glucozei la keto-D-
glocozon (Treitz, Maria et al. 2001).

Oxidarea enzimatica a D-glucozei (DG) la 2-keto-D-glucoza (kDG) sub influenta unei enzime (Pyranose oxidase)
a fost studiata in conditii normale de Treitz et al. (2000) intr-un reactor discontinuu. Mediul lichid, continand
substratul, este amestecat eficient cu ajutorul unui agitator magnetic. Oxigenul necesar reactiei este transferat din
faza gazoasa (mentinuta in permanenta sub forma de 'perna' de oxigen pur), prin interfata gaz-lichid, catre mediul
de reactie.
S-au efectuat experimente continue, izoterme, pe un interval de timp t ∈ [ 0 ,11350 ] s, cu doua injectii de enzima
(E), de volum neglijabil, respectiv la t = 800 s , C E = 0.5 mM , si la t = 9450 s , C E = 0.275mM . Concentratia
initiala de D-glucoza este de C DG ,o = 200 mM . Din totalul de 5 specii chimice potential a fi considerate intr-un
model cinetic ( DG ,kDG ,O2 , H 2 O2 , E ), s-a masurat continuu concentratia de oxigen in faza lichida, COx , pe
tota durata experimentului.

Intr-o prima faza, de tatonare a procesului, s-au retinut n=14 puncte experimentale:
tu(s)(u=1,...,n)= 0 400 799 800 950 5000 6000 7000 8000 9400
COx,u(mM)= 0.000 1.210 1.197 1.197 0.145 0.639 0.850 1.028 1.144 1.176
tu(s)(u=1,...,n)= 9450 9500 11050 11350
COx,u(mM)= 0.466 0.575 1.013 1.067

Intr-un experiment mai avansat, s-au determinat continuu, in aceleasi conditii, n=228 puncte experimentale:
tu(s) 0 50 100 150 200 250 300 350 400 450 500
COx,u(mM) 0.000 0.285 0.700 1.062 1.176 1.198 1.206 1.209 1.210 1.209 1.209
tu(s) 550 600 650 700 750 800 850 900 950 1000 1050
COx,u(mM) 1.208 1.208 1.207 1.190 1.195 1.197 0.940 0.191 0.145 0.152 0.162
tu(s) 1100 1150 1200 1250 1300 1350 1400 1450 1500 1550 1600
COx,u(mM) 0.173 0.182 0.193 0.202 0.214 0.225 0.233 0.244 0.253 0.264 0.271
tu(s) 1650 1700 1750 1800 1850 1900 1950 2000 2050 2100 2150
COx,u(mM) 0.284 0.291 0.300 0.308 0.317 0.325 0.336 0.346 0.359 0.368 0.377
tu(s) 2200 2250 2300 2350 2400 2450 2500 2550 2600 2650 2700
COx,u(mM) 0.388 0.395 0.410 0.417 0.432 0.451 0.468 0.479 0.480 0.498 0.507
tu(s) 2750 2800 2850 2900 2950 3000 3050 3100 3150 3200 3250
COx,u(mM) 0.518 0.533 0.546 0.553 0.559 0.566 0.578 0.581 0.588 0.597 0.600
tu(s) 3300 3350 3400 3450 3500 3550 3600 3650 3700 3750 3800
COx,u(mM) 0.602 0.611 0.614 0.618 0.620 0.623 0.624 0.632 0.639 0.643 0.643
tu(s) 3850 3900 3950 4000 4050 4100 4150 4200 4250 4300 4350
COx,u(mM) 0.635 0.635 0.643 0.657 0.664 0.679 0.685 0.695 0.702 0.715 0.723
tu(s) 4400 4450 4500 4550 4600 4650 4700 4750 4800 4850 4900
COx,u(mM) 0.729 0.739 0.747 0.759 0.777 0.786 0.800 0.808 0.826 0.833 0.845
tu(s) 4950 5000 5050 5100 5150 5200 5250 5300 5350 5400 5450
COx,u(mM) 0.850 0.863 0.867 0.877 0.887 0.892 0.911 0.896 0.890 0.889 0.892
tu(s) 5500 5550 5600 5650 5700 5750 5800 5850 5900 5950 6000
COx,u(mM) 0.912 0.926 0.935 0.943 0.950 0.959 0.966 0.975 0.984 0.991 0.998
tu(s) 6050 6100 6150 6200 6250 6300 6350 6400 6450 6500 6550
COx,u(mM) 1.006 1.012 1.019 1.028 1.032 1.040 1.045 1.053 1.058 1.065 1.068
tu(s) 6600 6650 6700 6750 6800 6850 6900 6950 7000 7050 7100
COx,u(mM) 1.075 1.083 1.087 1.091 1.096 1.104 1.110 1.112 1.114 1.121 1.124
tu(s) 7150 7200 7250 7300 7350 7400 7450 7500 7550 7600 7650
COx,u(mM) 1.130 1.131 1.134 1.137 1.140 1.141 1.144 1.146 1.150 1.150 1.151
tu(s) 7700 7750 7800 7850 7900 7950 8000 8050 8100 8150 8200
COx,u(mM) 1.154 1.154 1.155 1.157 1.159 1.158 1.161 1.164 1.166 1.168 1.167

Modelarea proceselor celulare - cap. 3. Pag 60


tu(s) 8250 8300 8350 8400 8450 8500 8550 8600 8650 8700 8750
COx,u(mM) 1.169 1.172 1.173 1.174 1.173 1.177 1.177 1.163 1.157 1.157 1.158
tu(s) 8800 8850 8900 8950 9000 9050 9100 9150 9200 9250 9300
COx,u(mM) 1.161 1.164 1.163 1.165 1.165 1.168 1.168 1.169 1.172 1.173 1.174
tu(s) 9350 9400 9450 9500 9550 9600 9650 9700 9750 9800 9850
COx,u(mM) 1.175 1.175 1.176 0.466 0.575 0.604 0.622 0.645 0.666 0.686 0.708
tu(s) 9900 9950 10000 10050 10100 10150 10200 10250 10300 10350 10400
COx,u(mM) 0.735 0.756 0.769 0.787 0.800 0.809 0.830 0.843 0.858 0.867 0.879
tu(s) 10450 10500 10550 10600 10650 10700 10750 10800 10850 10900 10950
COx,u(mM) 0.889 0.903 0.910 0.922 0.933 0.944 0.953 0.965 0.977 0.984 0.996
tu(s) 11000 11050 11100 11150 11200 11250 11300 11350
COx,u(mM) 1.007 1.013 1.023 1.032 1.050 1.047 1.057 1.067

Se cere sa se imagineze un model cinetic al procesului care sa ia in considerare inhibitia enzimei cu produsii de
reactie. Structura modelului va fi adaptata in functie de informatia cinetica disponibila.

Solutie.

Instalatia experimentala pentru culegerea datelor cinetice o reprezinta un bioreactor discontinuu (de
volum 1mL), cu un mediu lichid considerat perfect amestecat cu ajutorul unui agitator magnetic. Experimentele
se desfasoara izoterm, intr-un nediu mentinut cu o solutie buffer la pH=7.
Pentru determinarea coeficientului de transfer masic a oxigenului in mediul lichid, se efectueaza
experimente si masuratori de oxigen in absenta reactiei biochimice. Considerand un echilibru la interfata intre
concentratia de oxigen din faza gazoasa si cea de la interfata ( C *Ox ), ecuatia de bilant a concentratiei oxigenului
in lichid COx in absenta reactiei este:

dC Ox *
= k Oxl a( C Ox − C Ox ) .
dt

Prin integrare in raport cu timpul t (s), si inlocuire cu valorile experimentale se determina k Oxl a =0.02 1/s,
respectiv este produsul dintre coeficientul partial de transfer de masa si aria interfaciala de transfer. Pentru
calculul concentratiei la echilibru a oxigenului a fost folosita relatia lui Henry, C *Ox = p Ox / H , rezultand
* =1.21 mM la 25oC si 1 atm (H= 2.61×106 Pa.L/g, Blanch & Clark, 1996). Experimentele au fost facute in
C Ox
absenta azotului, prin mentinerea solutiei sub barbotare si saturare cu oxigen pur.
In prezenta reactiei chimice, bilantul masic al speciilor considerate (de concentratie C j ) este cel tipic
dintr-un reactor discontinuu ideal (Moser, 1988):

dCOx
= kOxl a( C*Ox − COx ) + rOx ,
dt
dC j
= rj ,
dt

in care rOx = viteza de consum a oxigenului in reactie (mM/s), r j = viteza de reactie a speciei j.

Modelarea proceselor celulare - cap. 3. Pag 61


enzima
oxygen addition gaz
evacuat

membrana agitator

proba
oxigen

Fig. XXX. Celula de reactie cu prelevarea automata a probei de oxigen (electrod Rank Brothers Ltd.) si
oxigenare continua (volum lichid 1 mL).

OH OH
O O
HO POx HO
HO OH HO OH
OH O

2-ceto-D-
D-glucoza O2
glucoza
H2O2

( POx din Peniophora gigantea )

Fig. XXX. Reactia globala de sinteza enzimatica (POx) a 2-ceto-D-glucoza ('zahar rar').

Modelarea proceselor celulare - cap. 3. Pag 60


Din punctul de vedere al schemei de reactie, oxidarea enzimatica a D-glucozei este insotita de formarea
de produsi secundari, respectiv forme partial oxidate ale glucozei, intermediari enzimatici cu activitate partiala,
apa oxigenata, s.a. Este constat experimental faptul ca produsii de reactie inactiveaza enzima (POx). Prin urmare,
modelul cinetic propus trebuie sa considere, pe langa reactia principala de sinteza si reactii secundare de
inactivare cu produsi a POx (notata cu E). Pentru reactia principala se propune o exprese cinetica de tip
Michaelis-Menten cu limitare de substrat si oxigen:

E
DG + O2 + H 2 O i → kDG + H O
2 2

In ce priveste inhibarea enzimei, lipsa de date cinetice complete privind intermediarii de reactie a facut ca sa fie
propuse mai multe mecanisme posibile:

Mecanismul M1 - inhibarea progresiva a POx prin reactii succesive cu produsul kDG si formarea de baze Schiff:
E C DG C ox
DG + O2 + H 2 O  i → kDG + H O ;
2 2 ri = k cat, i CE ,
K M + C DG K ox + C ox i
k
kDG + E  VIII
→ ED1 ; r = - kVIII C E C kDG
k
kDG + ED1 IX → ED2; r = - k IX C ED1C kDG
k
kDG + ED2 X→ ED3; r = - k X C ED2 C kDG
Ei = ED1, ED 2 , ED 3 .

Mecanismul M2 - inhibarea POx printr-o reactie globala de degradare a aminoacizilor cu apa oxigenata,
catalizata de impuritatile de fier din mediul de reactie:
E C DG C ox
DG + O2 + H 2 O → kDG + H 2 O2 ; r = k cat CE ,
K M + C DG K ox + C ox
k
H 2 O2 + E III → E d ; r = rE = − k III C E C H 2O2
b ) ; (C ≈ 3 × 10 -5 mM) .
k III = k o (1 + aC Fe Fe

Mecanismul M3 - inhibarea POx print reactie cu radicalii HO* rezultati din descompunerea apei oxigenate:
E C DG C ox
DG + O2 + H 2 O → kDG + H 2 O 2 ; rDG = rOx = − rkDG = − k cat CE ,
K M + C DG K ox + C ox
k k k
2H 2 O 2 IV → 2H 2 O + O 2 ; H 2 O 2  V→ 2HO * ; HO * + E  VII

→ E d
rE = − kC E C H 2O2 ; rH 2 O2 = rkDG + rE .

Functia obiectiv aleasa pentru estimarea parametrilor cinetici in fiecare mecanism de reactie in parte este unul
ECMMP, ce corespunde cazului erorii eperimentale σ constante:

2
Mink f ( k ) = ĈOx − COx ; k >0,
2

Rutina de minimizare neliniara cu restrictii utilizata este MMA (© Maria, 1986-1998), bazata pe algoritmul de
optimizare al lui Mihail & Maria (1986), modificat de Maria (1998). Algoritmul utilizeaza o cautare aleatoare
adaptiva multi-nivel, cu periodice expansii si contractii ale regiunii de cautare. Metoda este performanta pentru
cautarea extremului global al functiilor multimodale in prezenta multiplelor restrictii implicite si explicite de
complexitate ridicata.

Modelarea proceselor celulare - cap. 3. Pag 60


Modelul cinetic identificat ce indica cea mai buna adecvanta si calitatea cea mai buna a parametrilor este cel cu
numar minim de parametrii, respectiv modelul M2. Parametrii cinetici identificati k= [ K O , K m , kcat , k ]
utilizand setul redus de date experimentale (n=14) sunt prezentati in Tabelul XXX.

Tabel XXX. Teste statistice ale solutiei modelului cinetic M2 (n=14; σ = 0.1 mM; se2 = 0.083mM 2 ; f= 0.83;
K Ox , K m in mM; kcat in mM −! s −! kU −1 ; k= k III in mM −! s −! ).
Parameru Estimat Incredere t-test Matrice de intercorelatie λ j / σ~ 2
K Ox 0.2613 ± 0.007 74 1 1.3e+4
Km 63.523 ± 1.71 72 -0.79 1 2.2e+9
kcat 0.0891 ± 0.0007 264 0.19 0.16 1 1.3e+11
k 9.2827e-6 ± 6e-8 303 0.06 -0.13 0.73 1 2.4e+20

Figura XXX. Observatii experimentale, predictii si grafice reziduuri pentru procesul de oxidare enzimatica a D-
glucozei (setul redus de date).

Adecvanta modelului matematic, apreciata global prin raportarea dispersiei predictiilor in raport cu dispersia
experimentala, este comparata cu repartitia χ 2 teoretica, fiind de dorit un raport cat mai mic:
r n 2
2 ∑ ∑ ( ŷui − yui )
( ˆy − y ) 0.83 s 2 0.083
se2 = 2 = i =1 u =1 = = 0.083 ; e = = 8.3 < χ 2 ( nr − p;95%) = 18.3 .
( nr − p ) ( nr − p ) 14 x1 − 4 σ 2 0.01

(in care y = C Ox , r=1, p=4). Testul de adecvanta al modelului este completat de analiza reziduurilor (‘residuals
plots’), redata in Figura XXX (stanga), pentru concentratia de oxigen masurata. In grafice sunt reprezentate si
predictiile modelului cinetic privind evolutia concentratiei celorlalte specii incluse in model. Desi testul χ 2 este
satisfacator, curba prezisa pentru concentratia de oxigen dizolvat este destul de aproximativa in raport cu putinele
date experimentale. In plus, graficul reziduurilor ( yui − y$ui ); u = 1,..,n; i = 1,...,r, arata o repartitie ne-uniforma,
infirmand ipoteza de eroare experimentala constanta.
Semnificatia parametrilor modelului (vectorul k) se analizeaza pe baza matricii de varianta - covarianta
a estimatului V, evaluata numeric in exemplul de fata. Testele de semnificatie Student, respectiv testarea egalitatii
intre valoarea medie a parametrului estimat si cea adevarata, sunt pozitive (Tabelul XXX), prezentand valori mai
mari decat cuantila teoretica t(14-4;97.5%) = 2.2. Intervalelor individuale de incredere a parametrilor sunt de
asemenea mici, cativa parametrii fiind ceva mai intercorelati in model (coeficienti de intercorelatie mai mari
decat 0.7). Parametrii sunt foarte semnificativi, testul λ / σ~ 2 prezentand valori superioare limitei recomandate
j
3 (Maria & Rippin, 1993).

Modelarea proceselor celulare - cap. 3. Pag 61


Desi parametrii apar ca semnificativi in model, totusi discrepanta mare a predictiilor pentru multe din
punctele experimentale, ca si repartitia neuniforma a reziduurilor necesita date experimentale suplimentare pentru
o clarificare deplina a problemei de adecvanta. In acest scop este considerat un al doilea set de date (n=228),
respectiv o mai fina masurare continua a concentratiei de oxigen dizolvat in mediul de reactie (vezi Fig. XXX).
Repetand estimarea parametrilor cinetici si analiza estimatului cu aceste date, se obtin valorile din Tabelul XXX.

Tabel XXX. Teste statistice ale solutiei exemplului XXX (n=228; σ = 0.1 mM; se2 = 0.0046 mM 2 ; f= 1.038;
K Ox , K m , units in mM; kcat in mM −! s −! kU −1 ; k in mM −! s −! ).
Parameru Estimat Incredere t-test Matrice de intercorelatie λ j / σ~ 2
K Ox 0.2613 ± 0.001 448 1 5.6e+5
Km 63.523 ± 0.3 475 -0.45 1 3.6e+10
kcat 0.0891 ± 0.0002 1168 0.71 0.11 1 6.5e+12
k 9.2827e-6 ± 1e-8 1639 0.44 -0.45 0.59 1 3.4e+21

Figura XXX. Observatii experimentale, predictii si grafice reziduuri pentru procesul de oxidare enzimatica a D-
glucozei (setul de date extins).

Adecvanta modelului matematic apreciata prin testul global χ2 este considerabil imbunatatita:
χ c2 = 0.46 < χ 2 ( nr − p ;95%) = 124 . Testul de adecvanta a modelului, completat de graficul reziduurilor redat
in Figura XXX (stanga) pentru concentratia de oxigen, arata o repartitie satisfacatoare, confirmand ipoteza de
eroare experimentala constanta si deci validitatea estimatorului ECMMP utilizat. Semnificatia parametrilor
modelului este de asemenea mult imbunatatita, rezultand valori ale testului Student mai mari, intervalelor de
incredere ale parametrilor mai mici, si valori corespunzatoare λ / σ~ 2 mai mari. Cu toate acestea suspiciunea
j
asupra generalitatii acestui model cinetic redus persista, deoarece dintr-o singura observatie masurata este putin
probabil a se dovedi validitatea unei scheme de reactie in care sunt implicate 5 specii chimice. In plus, masuratori
suplimentare calitative indica mult mai plausibil un mecanism de tipul M3. Prin urmare, planificarea unor
masuratori suplimentare pentru determinarea curbelor cinetice a altor intermediari din sistem devine absolut
necesara in acest scop.
In concluzie, testele de adecvanta si calitate a estimatului trebuiesc aplicate cat mai complet, analizate
comparativ si in detaliu, in scopul unei evaluari a calitatii modelului din toate punctele de vedere. Chiar in
situatia unor testele de adecvanata si de semnificatie ale parametrilor aparent bune, aprecierea calitatii unui
model nu este suficienta daca nu sunt testate predictiile modelului si in alte conditii experimentale decat cele
considerate. In plus, o inconsistenta intrinseca a datelor experimentale (de pilda observatii insuficiente, corelate,
degenerate), precum si determinari incomplete si neglijarea unor intermediari cheie de reactie, pot diminua
considerabil gradul de generalitate al modelului identificat.
¦

Modelarea proceselor celulare - cap. 3. Pag 62

S-ar putea să vă placă și