Sunteți pe pagina 1din 26

Modelare matematică în Bioinformatică

Curs 2. Noţiune de calcul molecular. Calculatoare


pe bază de ADN. Experimentul lui Adleman.

Aurelia Prepeliţă, conf. univ.,


Departament Informatica, USM

Chisinau 2021 1
Reacţii de sinteză matricială

Molecula de ADN are o structură


dublu-spiralată şi conţine 2 catene.
Catenele sunt compuse dintr-o
succesiune de baze azotate
(nucleotide). De-a lungul unei
catene nucleotidele sunt legate (în
aproape orice succesiune posibilă)
prin legături covalente. Legăturile
dintre catene (legături de hidrogen)
se pot stabili doar între bazele
azotate complementare, şi anume
adenină - timină, respectiv
guanină – citozină.

2
Reacţii de sinteză matricială

Legăturile dintre bazele azotate ce


compun o catenă sunt puternice,
pentru desfacerea lor fiind necesară
utilizarea unor enzime restrictive, iar
pentru refacerea lor utilizarea unei
ligaze. Fiecare enzimă restrictivă
recunoaşte o anumită succesiune
într-un grup de baze azotate din cele
două catene, şi desface o anumită
legătură în fiecare din cele două
catene. Legăturile dintre catene sunt
mai slabe, pentru desfacerea lor fiind
suficientă creşterea temperaturii
peste o anumită limită, iar pentru
refacerea lor scăderea temperaturii
sub limita respectivă. 3
Reacţii de sinteză matricială

În general, se întâlnesc 4 baze azotate:


adenina (A), timina (T), guanina (G) şi citozina (C).
4
Reacţii de sinteză matricială

În anul 1987, profesorul Tom Head de la


departamentul de matematică al Universităţii
Binghamton (New York State University) propune un
model matematic al operaţiei de splicing, operaţie ce se
desfăşoară asupra moleculelor de ADN, în prezenţa
unor enzime restrictive şi a unei ligaze, cu scopul de a
dinamiza teoria limbajelor formale prin introducerea unui
nou tip de operaţie. Operaţia de splicing presupune
desfacerea moleculei de ADN în două molecule cu
margini libere şi de refacere a unei molecule prin
legarea a două molecule cu margini libere
complementare, în prezenţa unei ligaze.

5
Reacţii de sinteză matricială

Cele 4 nucleotide pot fi considerate ca alcătuind un


alfabet, catenele construite prin diferitele combinaţii de
baze azotate pot fi văzute ca şiruri liniare generate peste
acest alfabet, iar enzimele restrictive care desfac
moleculele ADN ca un fel de reguli de splicing. Sistemul
alcătuit dintr-un astfel de alfabet, un număr iniţial finit de
şiruri obţinute prin posibile combinaţii ale simbolurilor ce
compun acest alfabet, precum şi din operaţia de splicing,
împreună cu un set finit de reguli pentru aplicarea acesteia
asupra mulţimii de şiruri, se numeşte sistem splicing
(conform modelului propus de matematicianul Tom Head în
1987). Închiderea operaţiei de splicing asupra setului iniţial
finit de şiruri considerat generează un limbaj splicing.
6
Reacţii de sinteză matricială

Modelul propus de către matematicianul Tom Head a fost extins şi


studiat în diferite contexte. Formal, un sistem splicing simplu
(rebotezat sistem H) este reprezentat prin tuplul <A, L, R>, unde
A este alfabetul, L este setul iniţial de şiruri (limbajul de pornire),
iar R este mulţimea regulilor de splicing. De exemplu, o regulă de
splicing poate fi reprezentată astfel:
(x1a|bx2)/(y1c|dy2) --> (x1ady2)/(y1cbx2),
unde x1abx2 şi y1cdy2 sunt şirurile iniţiale, a, b, c, d, aparţin A
(a şi c, respectiv b şi d sunt complementare), x1, x2, y1, y2
aparţin L sunt şiruri construite peste alfabetul A, iar rezultatul
operaţiei de splicing activate de prezenţa în cele două şiruri a
simbolilor a, b, c, d este obţinerea a două noi şiruri, respectiv
x1ady2 şi y1cbx2.

7
Reacţii de sinteză matricială

S-a constatat că un sistem H simplu este echivalent


unui automat finit. Diferite tipuri de extensii au fost
propuse în scopul creşterii puterii sistemelor H (set iniţial
infinit de şiruri şi/sau de reguli, şiruri circulare,
restricţionarea şi creşterea controlului asupra operaţiei
de splicing, etc.), obţinându-se, în final, sisteme H
extinse care pot genera limbaje recursiv enumerabile.
Pe cealaltă parte, au fost construite sisteme H extinse,
echivalente cu maşinile Turing, propunându-se chiar
algoritmi de construire a unui automat Turing, pornind
de la un sistem H extins şi invers.

8
Reacţii de sinteză matricială

O alta direcţie de cercetare o constituie


automatele Watson-Crick, denumite astfel după
doi dintre laureaţii Nobel (1953) pentru
descoperiri legate de structura ADN, automate
similare maşinii Turing, care dispun de două
benzi de citire/scriere între care există o relaţie de
complementaritate.
P sisteme – sisteme de cacul membranar,
Gheorghe Paun, Romania.
I sisteme – sisteme de procesare AND cu
insertie/deletie
Reacţii de sinteză matricială

În 1994 profesorul Leonard Adleman a utilizat molecule ADN


pentru efectuarea de calcule matematice. El a reuşit să rezolve
practic un caz particular al problemei căii hamiltoniene într-un graf
orientat. Un graf orientat constă dintr-o mulţime finită de noduri,
legate între ele prin arce orientate de la un nod la altul.
O succesiune de arce din graf formează o cale în acel graf.
O cale ce trece prin toate nodurile grafului, atingând fiecare nod
10
o singură dată, se numeşte cale hamiltoniană.
Reacţii de sinteză matricială

Problema căii hamiltoniene, pentru un


anumit graf, constă în deciderea dacă
în acel graf există o cale hamiltoniană.
Această problemă este NP-completă.
Acesta a fost primul experiment reuşit
de utilizare a calculului molecular
pentru rezolvarea unor probleme.
Datorită faptului că moleculele sunt de
fapt fragmente ADN, calculul se mai
numeşte şi calcul ADN.

11
Reacţii de sinteză matricială
În graful prezentat, calea 1 --> 2 --> 3 --> 4 -->
5 --> 6 --> 7 este o soluţie (o cale
hamiltoniană).
Algoritmul nedeterminist, utilizat pentru
rezolvarea problemei, este următorul:
1. Se generează căi aleatorii prin graf.
2. Sunt păstrate acele căi care pornesc
din nodul iniţial, şi se termină în nodul
final.
3. Sunt păstrate doar acele căi care au
dimensiunea egală cu numărul de noduri
din graf.
4. Sunt păstrate doar acele căi în care
fiecare nod apare maxim odată.
5. Dacă a rămas cel puţin o cale, problema
12
are soluţie, altfel nu.
Reacţii de sinteză matricială
Nodurile şi arcele au fost codificate folosind şiruri liniare de baze
azotate orientate 5 -> 3. Pentru codificarea fiecărui nod, s-a
generat un şir aleator compus din 20 de baze azotate. Au fost
sintetizate Arcele care au fost obţinute prin concatenarea celei
de-a doua jumătăţi a şirului, ce codifică nodul de pornire la prima
jumătate a şirului, ce codifică nodul de sosire al arcului:
Nodul 2: 5 – TATCGGATCG |GTATATCCGA – 3
Nodul 3: 5 – GCTATTCGAG |CTTAAAGCTA – 3
Nodul 4: 5 – GGCTAGGTAC |CAGCATGCTT – 3
Arcul 2 --> 3: 5 – GTATATCCGA|GCTATTCGAG – 3
Arcul 3 --> 4: 5 – CTTAAAGCTA|GGCTAGGTAC – 3
Arcele care pornesc/se termină din/în nodul 1/7 preiau toată
codificarea nodului (şi nu doar a doua jumătate).

13
Reacţii de sinteză matricială

Codificările pentru noduri trebuie astfel alese, încât


fiecare arc să fie codificat diferit, iar arcul i --> j (dacă
există) să fie codificat diferit de arcul j --> i (dacă
există). De asemenea, pentru fiecare şir ce codifică
un nod a fost sintetizat şirul complementar:

5 - GCTATTCGAGCTTAAAGCTA - 3 --> (Nodul 3)


3 - CGATAAGCTCGAATTTCGAT - 5 -->
(Complementarul nodului 3)

Complementarul unui nod este orientat 3 --> 5.

14
Reacţii de sinteză matricială

Astfel, în prezenţa unei ligaze, complementarul


unui nod poate lega şirul unui arc, ce intră în
nodul respectiv, cu şirul unui arc ce iese din
nodul respectiv, formându-se astfel o moleculă bi-
catenată, care reprezintă o cale orientată de la un
nod până la altul, trecând printr-un nod
intermediar.

15
Experimentul Adleman
Experimentul s-a desfăşurat astfel:
Pasul 1. Într-un buffer lichid (tub pentru testare) cu o compoziţie
specială, s-au introdus într-o cantitate suficient de mare (de
ordinul a 10*13 ) moleculele mono-catenate (одноцепочечные
молекулы) ce codifică complementarele nodurilor grafului şi
arcele grafului respectiv. În prezenţa unei ligaze moleculele
respective au produs căi arbitrare prin graful respectiv.

16
Experimentul Adleman
Pasul 2:
Pentru a păstra doar acele
căi care încep din nodul 1 şi
se termină în nodul 7, au
fost utilizate enzime
speciale în cadrul unei
reacţii cunoscute sub
numele PCR (polymerase
chain reaction). Rezultatul a
fost amplificarea (creşterea
prin copiere a) numărului de
molecule bi-catenate care
corespund acestui criteriu,
astfel încât celelalte practic
nu mai contează în etapele
următoare ale
experimentului.
17
Experimentul Adleman

- cuva pentru
electoforeza

- sursa de
-

alimentare

- AND are
-

sarcina negativa

18
Experimentul Adleman
Pasul 3: (utilizarea gel
electroforezei) a constat în
separarea moleculelor ADN,
care au lungimea egala cu 7
(140 de baze azotate). Această
operaţie s-a desfăşurat într-un
mediu special (gel) care, inserat
într-un circuit electric, a condus
la separarea moleculelor pe
lungimi, reuşindu-se apoi
extragerea celor cu o anumită
dimensiune. Moleculele astfel
obţinute au fost amplificate şi
purificate de mai multe ori, prin
succesiunea operaţiilor de
amplificare şi separare, pentru a
elimina cât mai mult posibil
moleculele necorespunzătoare. 19
Experimentul Adleman
Pasul 4: a constat în izolarea moleculelor care conţin o singură dată
fiecare codificare a unui nod al grafului. Pentru aceasta, mediul a
fost încălzit astfel încât moleculele bi-catenate au fost desfăcute în
molecule mono-catenate, păstrându-se apoi doar partea care
reprezenta calea prin graf (în exemplele prezentate anterior, partea
superioară). Aceste molecule reprezintă căi ce încep în nodul 1, trec
prin alte 5 noduri şi se termină în nodul 7.

20
Experimentul Adleman
Pasul 4: Pe rând, moleculele complementare,
reprezentând cele 5 noduri interne grafului, au fost
fixate pe un suport cu ajutorul unei substanţe speciale
(biotină), s-a adăugat ligază, iar moleculele reprezentând
căile prin graf, care conţineau codificarea nodului
respectiv se legau, celelalte rămânând libere. Acestea din
urmă erau îndepărtate din sistem, şi se trecea la
următorul nod. La sfârşit, în tubul de test au rămas acele
molecule care începeau cu reprezentarea nodului 1, se
terminau cu reprezentarea nodului 7, şi conţineau
reprezentarea fiecărui nod intern.

21
Experimentul Adleman

Pasul 5. Dacă se puteau evidenţia molecule de lungime


7, problema avea soluţie, altfel nu. Solutia a fost - Da.

22
Experimentul Adleman
Procesul de rezolvare a acestei probleme s-a
desfăşurat pe parcursul a 7 zile de muncă în laborator.
Cel mai mare consumator de timp a fost ultimul pas, în
care s-au utilizat succesiv complementarele nodurilor
interne, pentru eliminarea căilor ce trec de mai multe
ori prin acelaşi nod.
Numărul de molecule utilizate creşte liniar cu numărul
de noduri din graf, ca şi numărul de paşi ai algoritmului
(ceea ce constituie marele avantaj al metodei).
Numărul mare de cópii ale fiecărei molecule asigură,
într-un fel, posibilitatea obţinerii unei soluţii prin
minimizarea efectului erorilor care pot apare (legări
eronate ale moleculelor sau nelegarea lor atunci când
sunt îndeplinite condiţiile, deteriorarea moleculelor,
separarea incorectă, etc.). 23
Experimentul Adleman
Concluziile imediate la care a ajuns Adleman şi echipa
sa sunt că utilizarea calculului molecular, pentru
dimensiuni medii ale acestui tip de probleme, poate fi
mai eficientă decât utilizarea calculatoarelor
convenţionale, datorită paralelismului masiv, energiei
mici consumate şi a volumului mic în care poate fi
codificată o cantitate mare de informaţii. Pentru
probleme de dimensiuni mici, calculul molecular este
ineficient, iar în cazul problemelor de dimensiuni mari s-
ar putea atinge repede limitele cunoştinţelor umane în
domeniul biochimiei (dimensiunile moleculelor care pot
fi utilizate, desfăşurarea unor procese nedorite,
degradarea în timp a soluţiilor, ceea ce limitează timpul
în care un astfel de experiment se poate desfăşura,
etc). 24
Experimentul Adleman
Referinţe bibliografice:
1. Adleman, Leonard - Molecular computation of solutions to combinatorial
problems, Science, 268 (1994), 1021-1024.
2. Adleman, Leonard - On constructing a molecular computer, unpublished
(1995).
3. Boneh, D., Dunworth, C., Lipton, R..J.,Sgall, J., - On the computational
power of DNA.
4. Boneh, D., Dunworth, C., Lipton, R.J., - Making DNA computers error
resistant.
5. Boneh, D., Dunworth, C., Lipton, R.J., - Breaking DES using a molecular
computer.
6. Head, Tom - Formal language theory and DNA: an analysis of the
generative capacity of recombinant behaviors, Bulletin of Mathematical
Biology, 49 (1987), 737-759.
7. Head, Tom - Splicing schemes and DNA, Nanobiology, 1 (1992), 335-342.
8. Mateescu, A., Păun, Gh., Rozenberg, G., Salomaa, A. - Simple splicing
systems, Discrete Applied Mathematics, (to appear).Majoritatea acestor
articole, precum şi multe altele sunt accesibile în Internet.

25
Intrebari

Calculatoare bazate pe ADN/calculatoare moleculare/sisteme membranare si
solutionarea problemelor NP complete.

P systeme/H sisteme/I sisteme.

Descrieti etapa de pregatire a experimentului Adleman.

Descrieti etapa 1 din experimentul Adelman.

In experimentul lui Adleman in cati pasi este gasita calea Hamilton? Descrieti
pe scurt aceste etape.

Cate legaturi de hidrogen leaga nucleotidele A,T, C si G?

26

S-ar putea să vă placă și