Sunteți pe pagina 1din 19

3.

Structura secundar, teriar i


cuaternar a proteinelor. Programele
PDB, Cn3D i Rasmol
3.1.
-

Obiectivele lucrrii de laborator sunt:

recunoaterea structurii secundare, teriare i cuaternare a poteinelor


exploatarea structurilor proteice cu PDB
vizualizarea structurilor cu programul Cn3D
vizualizarea structurilor cu programul Rasmol

3.2.

Noiuni introductive

Proteinele sunt substane organice macromoleculare formate din lanuri simple sau
complexe de aminoacizi; ele sunt prezente n celulele tuturor organismelor vii n
proporie de peste 50% din greutatea uscat. Toate proteinele sunt polimeri ai
aminoacizilor, n care secvena acestora este codificat de ctre o gen. Fiecare protein
are secvena ei unic de aminoacizi, determinat de secvena nucleotidic a genei.

3.2.1. Proprieti fizico-chimice


a) Masa molecular
Datorit formrii aproape n exclusivitate din aminoacizi, putem considera
proteinele ca fiind de fapt nite polipeptide, cu mas molecular foarte mare intre
10.000 i 60.000.000. Masa molecular se determin prin diferite metode, mai ales n
cazul proteinelor cu masa molecular foarte mare ca de exemplu proteina C reactiva. n
urmtorul tabel sunt enumerate diferite proteine mpreun cu masa molecular
corespunztoare:
Denumirea proteinei

Sursa proteinei/Izolat din

Masa
molecular

Lactalbumin

lapte

17000

Gliadina

gru

27.500

Insulina

pancreas

12.000

Hordeina

orz

27.500

Hemoglobina

globule roii

68.000

Hemocianina

molute(snge),
artropode(snge)

2.800.00

Miozina

muchi

850.000

Pepsin

stomac

36.000

Peroxidaza

rinichi

44.000

Virusul mozaicului tutunului


(capsida)

tutun

17.000.000

Deoarece la multe proteine masa molecular apare ca un multiplu de 17,500, mult


vreme s-a mers pe ipoteza c particulele proteice sunt formate prin unirea mai multor
molecule de baz ce au masa molecular n jurul valorii de 17,500. Aceste molecule de
baz s-ar putea uni ntre ele prin aa numitele valene reziduale, ducnd la formarea de
agregate moleculare. Atunci cnd are loc ruperea acestor valene reziduale ar avea loc
doar modificarea proprietilor fizice ale proteinelor, n timp ce dac are loc ruperea
legturilor principale (legturile peptidice), proteina i modific proprietile fizicochimice.
b) Solubilitatea proteinelor
Proteinele sunt substane solide, macromoleculare, solubile n general n ap i
insolubile n solveni organici nepolari.Unele proteine sunt solubile n ap dar insolubile
n alcool, altele sunt solubile n soluii apoase de electrolii, acizi organici. Datorit
gradului diferit de solubilitate n diferii solveni, proteinele se pot izola, identifica i
separa. Solubilitatea lor depinde foarte mult de legturile care se stabilesc ntre
gruprile libere de la suprafaa macromoleculelor i moleculele solventului. La
suprafaa macromoleculelor proteice se gsesc grupri libere de tip polar:-COOH, -NH2,
-OH, -SH, -NH, grupri cu caracter hidrofil care favorizeaz dizolvarea proteinelor n
ap. De asemenea exist grupri de tip apolar, hidrofobe, de regul radicali de
hidrocarburi: -CH3, -C6H5, -C2H5, care favorizeaz dizolvarea proteinelor n alcool. ns
n marea lor majoritate predomin gruprile polare, determinante pentru caracterul
hidrofil. n contact cu apa proteinele greu solubile manifest fenomenul de gonflare,
datorit tendinei de hidratare datorat gruprilor polare. Gelatina de exemplu se mbib
foarte puternic cu apa dnd natere prin rcire la geluri. La dizolvarea proteinelor n
ap, are loc fenomenul de formare a coloizilor hidrofili. S-a constatat c n soluii
diluate se gsesc macromolecule proteice izolate, iar n cazul soluiilor concentrate se
formeaz agregate de macromolecule proteice. Soluiile coloidale ale proteinelor
coaguleaz prin nclzire i prezint efectul Tyndall (dispersia fasciculului de lumin).
c)

Structura secundar

Imaginea alfa helixurilor mioglobinei, a crei structur a fost determinat de


ctre Max Perutz i Sir John Cowdery Kendrew n 1958 folosind cristalografia cu raze
X, este prezentat n figura 3.2.1.a.

Figura 3.2.1.a. Structura secundar a mioglobinei

Structura secundar se refer la forma i la lungimea lanurilor polipeptidice,


proprieti induse de legturile de hidrogen. Cele mai ntlnite tipuri de structura
secundar sunt alpha helixul i lanurile beta (figura 3.2.1.b). Elicea alpha se formeaz
prin rotaia unui lan polipeptidic n jurul propriei axe.

Figura 3.2.1.b. Structura secundar sub form de lanuri beta

Alte helix-uri cum ar fi helixul 310 i helixul sunt din punct de vedere energetic
favorabile formrii legturilor de hidrogen, dar sunt rareori observate n proteinele
naturale exceptnd prile terminale ale helixului n timpul formrii scheletului proteic
(de obicei centrul helixului). Aminoacizii au un comportament diferit vis-a-vis de
posibilitatea formrii structurii secundare. Prolina i glicina sunt cunoscui ca aa
numiii " helix breakers"(sprgtori de helix), deoarece afecteaz configuraia
scheletului proteic; ambii aminoacizi au abiliti conformaionale neobinuite i de
regul se gsesc n colurile scheletului proteic. Aminoacizii care prefer s adopte
conformaia helixului proteic fac parte din aa numita serie MALEK (codurile formate
din 1 liter a aminoacizilor: metionin, alanin, leucin, acid glutamic i lizina); prin
contrast aminoacizii aromatici (triptofanul, tirosina i fenilalanina) dar i aminoacizii cu
legare prin carbonul beta (izoleucina, valina i treonina) adopt configuraia .
Structura secundar cunoate cteva ipoteze privind formarea ei:

Teoria polipeptidic formulat de ctre E. Hoffmeister n 1902 i dezvoltat ulterior


de ctre E.Fischer, are la baz conceptul conform cruia moleculele proteice sunt
formate din lanuri polipeptidice foarte lungi. Teoria are cteva dezavantaje:
o nu explica diferenierea biologic a anumitopr proteine
o unele proteine sunt rezistente la aciunea enzimelor proteolitice (dei
datorit lungimii lanului nu ar trebui)
Teoria plierii i rsucirii lanului polipeptidice a fost elaborat de ctre Corey i
Pauling n 1943 i a fost confirmat prin spectrele de difracie cu raze X,
microscopului electronic, prin msurarea unghiurilor de valen, a distanelor
interatomice, au confirmat faptul c lanul polipeptidic se gsete sub form pliat.
Plierea catenei are loc prin formarea legturilor de hidrogen ntre gruparea
carboxilic a unui aminoacid i gruparea aminic a aminoacidului vecin.
Lanul polipetidic pliat se prezintz ca o panglic ndoit alternativ la
dreapta i la stnga, plierea avnd loc n dreptul carbonilor metinici. Mai
multe lanuri pliate polipeptidice dau natere unei reele, ntre aceste lanuri
pliate putndu-se de asemenea forma legturi de hidrogen, acestea fiind n
numr mai mare cnd gruprile terminale a 2 lanuri sunt aranjate diferit (NH2 i COOH, sau HOOC-i -NH2). Catenele polipeptidice pliate
predomin n proteinele fibrilare i mai puin n cele globulare. Dup
valoarea perioadei de identitate se cunosc mai multe tipuri de proteine cu
structur pliat. Prin perioada de identitate se nelege distana cea mai mic
la care se repet aminoacizii identici din molecul
Structura elicoidal, ipotez lansat de Corey i Pauling e o ipotez
conform creia lanul polipeptidic se poate prezenta i nfura sub form de
spiral. n acest model, fiecare spir conine de obicei 27 aminoacizi, iar
distana ntre spire este de 5,44 A0. Fiecare aminoacid mrete spira cu 1,47
A0. n faa fiecrei grupri -CO- va apare la o distan de 2,8A0 o grupare
NH de la al treilea aminoacid. ntre aceste grupri se stabilesc punile de
hidrogen care asigur stabilitatea helix-ului. n acest model lanul
polipeptidic se prezint sub forma unui surub cu pasul fie spre dreapta, fie
spre stnga. n cazul proteinelor naturale, acestea datorit coninutului n Laminoacizi, pasul helixului va fi spre dreapta, catenele laterale ies n afara
corpului propriu-zis putnd reaciona fie cu moleculele solventului fie cu
alte catene polipeptidice. Canalul format n interiorul helixului este foarte
ngust, n el nu poate ptrunde molecula solventului. Legturile peptidice
sunt plane, iar 2 planuri consecutive -CO-NH- formeaz un unghi de 1800,
rotirea lanului facndu-se la carbonul (metinic).
d) Structura teriar

Prin intermediul cristalografiei cu raze X s-a dovedit faptul c macromoleculele


proteice au o conformaie tridrimensional, realizat de obicei prin intermediul cuplrii
mai multor lanuri polipeptidice scurte ntre ele, cuplare care duce la formarea fibrelor
proteice; legturile intercatenare pot fi principale sau secundare:
o Legturi de hidrogen, sunt legturi coordinativ heteropolare care se stabilesc
cu uurin ntre gruparea carbonil C=O (electronegativ) i gruparea NH(electropozitiv), din 2 lanuri polipeptidice alturate, sau n cazul formelor
lactam-lactim ntre gruparea -OH i azotul iminic =NH (figura 3.2.1.c).

Figura 3.2.1.c. Exemplu de structur teriar

Legturile de hidrogen au lungimea cuprins ntre 2,7-3,1A i energia de 37Kcal/mol la peptide, iar la ap 2-3Kcal/mol. Legturile de hidrogen se pot stabili i
ntre catenele laterale care au grupri carboxil, hidroxil, amino sau tiolice. Din punct de
vedere energetic legtura de hidrogen nu este puternic dar datorit rspndirii relativ
uniforme de-a lungul scheletului proteic ofer proteinei stabilitatea necesar.
o

Legturi disulfidice

Figura 3.2.1.d. Exemplu de legtur disulfidic

Legtura disulfidic (figura 3.2.1.d) este foarte puternic, 50-100kcal/mol i are un


rol foarte important n stabilizarea arhitecturii spaiale a moleculei proteice. Legtura
este rezistent la hidroliz, ns se poate desface iar prin reducere formeaz tioli(SH),
iar prin oxidare formeaz acizi. n general legtura sulfidic se ntlnete la proteinele
transformate care au o rezisten mecanic mare. n afar de aceste legturi se mai pot
stabili alte tipuri de legturi: legturi ionice (stabilite de obicei ntre gruprile aminice i
cele carboxilice ionizate), legturi de tip van der Waals (legturi electrostatice slabe
care se stabilesc ntre radicalii hidrofobi), legturi fosfodiesterice (ntre 2 resturi de
serin i acid fosforic) i legturi eterice (stabilite la nivelul aminoacizilor cu grupri
hidroxilice).

e)

Structura cuaternar

Structura cuaternar se refer la modul cum se unesc subunitile proteice.


Enzimele care catalizeaz asamblarea acestor subuniti poart denumirea de
holoenzime, n care o parte poart denumirea de subuniti reglatoare i subuniti
catalitice.

Figura 3.2.1.e. Vizualizarea 3D a hemoglobinei

Vederea 3 D a hemoglobinei (figura 3.2.1.e) prezint 4 subuniti rou i galben, iar


unitatea hemic e verde. Numele de hemoglobin este format din hem i globin,
denumire ce denot faptul c hemoglobina are la baz proteine globulare cuplate cu o
grupare hem. Proteinele care au structura cuaternar sunt hemoglobina, ADN
polimeraza i canalele ionice, dar i nucleozomi i nanotubuli, care sunt complexe
multiproteice. Fragmentele proteice pot suferi transformri n structura cuaternar,
transformri care se reflect fie n structurile individuale fie n reorientrile fiecrei
subuniti proteice. Numerele subunitilor din oligomerice sunt denumite prin
adugarea sufix-ului -mer (grecescul pentru subunitate), precedat de numele subunitii,
astfel:
1 = monomer
2 = dimer
3 = trimer
4 = tetramer
5 = pentamer
6 = hexamer

7 = heptamer
8 = octamer
9 = nonamer
10 = decamer
11 = undecamer
12 = dodecamer

13 = tridecamer
14 = tetradecamer
15 = pentadecamer*
16 = hexadecamer
17 = heptadecamer*
18 = octadecamer

19 = nonadecamer
20 = eicosamer
21-mer
22-mer
23-mer
etc.

3.3. Determinarea structurii proteinelor prin tehnici


experimentale i metode de modelare comparativ
Modelarea molecular este ansamblu de activiti ntreprinse pentru calcularea unor
proprieti moleculare, statice i/sau dinamice, din care se pot estima proprieti
microscopice. Modelarea molecular caut s simuleze interaciuni intra- i intermoleculare pentru a nelege procesele fizico-chimice cu importan in biologie i
medicin, pentru a testa ipoteze i pentru a prezice evenimente noi.
Un rol central n modelare l joac interacia cu calculatorul, fie prin mijloace
grafice fie prin tastatur-folosind un grup de comenzi care permit monitorizarea i
influenarea stimulrilor.
Modelarea macromoleculelor biologice a fost iniiat n anii 1940,cu mult
naintea apariiei uneltelor computaionale avansate. Modelarea structurilor
macromoleculelor biologice ne permit studierea n profunzime a caracteristicilor
funcionale moleculare.
Primele macromolecule modelate au fost dublu-helixul de ADN i mioglobina.
Absena uneltelor computationale avansate a ngreunat mult aceste eforturi de modelare.
Linus Pauling a fost printele modelrii moleculare, structura alpha-helixului
modelat de el permind identificarea unor modele(pattern) structurale numite
structuri secundare (alpha-helix, beta, strand) care exist la nivelul molecular al
proteinelor n toate organismele.
Sir Francisc Crick i James Watson a primit Premiul Nobel pentru
descoperirea structurii dublu catenare a moleculei de ADN, rezolvnd astfel multe
ambiguiti legate de ereditate.
n zilele de astzi, cristalografia, rezonana magnetic nuclear (NMR) i
microscopia crio-electronic ce permite defracie electronic sunt tehnicile folosite
pentru obinerea structurilor de nalt rezoluie ale macromoleculelor biologice.
n cristalografie proteina cristalizat este bombardat cu electroni, modelul de
difracie al electronilor fiind folosit pentru determinarea structurii atomice a moleculei.
Modelul de difracie este folosit pentru calcularea coordonatelor atomice bazat
pe msurarea densitii electronice asociat cu fiecare dintre atomii detectai. ntruct
aceast metod nu este limitat de mrimea moleculelor, poate fi folosit n principiu
pentru determinarea structurii oricrei macromolecule i n cristalografia cu
dezavantaje: dificultatea de a obine cristale regulate a milioane de uniti identice,
multe din proteinele noastre eseniale (de exemplu proteinele membranare) sunt
incapabile s cristalizeze cnd sunt ndeprtate din mediul lor; calcule extensive
asociate cu analiza datelor. O alt limitare a metodei este lipsa informaiei legat de
dinamica i flexibilitatea macromoleculelor hologice n mediul lor, cristalografia
oferind doar o imagine rapid a unei molecule deformate expunerii de lung durat
necesar colectrii modelelor de defracie.
O alt metod folosit pentru determinarea structurii macromoleculare, este
rezonana magnetic nuclear. Chiar dac metoda pare s fie avantajoas i rezonabil,
datorat folosirii semnturilor protonice care, se suprapun n cazul moleculelor mai
mari, impun folosirea NMR-ului n cazul macromoleculelor mai mici de 30 KD, de

aceea sunt necesare tehnici alternative (custalograph, difracia electronic) pentru


determinare structurii moleculelor mai mari.
Calcule extensive din analizele cristalografice i RMN sunt efectuate cu
acuratee de programe automate i semi automate ce reduc mai mult timpul necesar
obinerii structurilor macromoleculare.
Cu ajutorul computerelor performante din ziua de azi, analiza unei molecule
proteice tipic poate fi realizat n cteva zile n timp ce n absena acestor tehnologii ar
fi necesari mult mai multi ani pentru cercetarea respectiv. Cunoaterea aspectelor
structurale ale proteinei de interes va genera o imens cantitate de informaie despre
funcia sa potenial i despre relaiile cu alte macromolecule eseniale.
Predicia structurii de nalt rezoluie a proteinelor i al mecanismelor corecte de
pliere al lor constituie ns o problem major n biologie, deoarece proteinele sunt
compuse din 20 de aminoacizi diferii care introduc variabilitatea esenial a secvenelor
observate la aceste molecule.
Fiecare din aceti aminoacizi adopta variate conformaii n raport cu celelalte
reziduuri din protein. Teoretic, numrul posibilitilor structurale la care proteina se
poate conforma n funcie de secvena sa de aminoacizi este fenomenal ns n realitate
doar una sa cateva structuri active sunt formate n soluie.
Numeroase tehnici i metodologii au fost utilizate pentru descoperirea acestor
structuri active ale proteinelor din numrul imens de posibiliti conformaionale, cele
mai folosite fiind cele care folosesc relaia proteine cu omologi cunoscui i cele de
minimizare energetic axate pe termodinamic.
Aa cum am amintit anterior, rata de obinere a structurilor macromoleculelor
prin cristalografie sau rezonan magnetic nuclear este mult mai mic dect numrul
foarte mare de secvene noi ADN i proteice introdus zilnic, fiind astfel necesar o
abordare automatizata a designului structural. Grupurile de informaticieni i cercettori
i direcioneaz eforturile spre identificarea macromoleculelor biologice-cheie (de ex.
proteina) responsabile de procesele patologice i propunerea inhibitorilor poteniali ai
acestor molecule. Cel mai mare obstacol ntmpinat este lipsa datelor structurale ele
moleculei de interes. n majoritatea cazurilor macromoleculele studiate sunt proteine
structurale sau reglatorii. n cazul moleculelor pentru care nu exist date structurale
obinute cristalografic sau prin NMR, pot fi folosite date ale proteinelor omologe care
au o structura cunoscut. Modelarea comparativ este bazat pe simularitile
structurale dintre proteina necunoscut i omolog sau cu structura tridimensional
cunoscut i unul din programele performante care realizeaz aceast modelare este
programul Homology din pachetul software Insight II al companiei MSI.
n continuare vor fi prezentate detalii legate de modelarea comparativ cu
avantajele i limbajele acesteia.
Multe dintre proteinele eseniale prezente n organismul uman se gsesc i n
alte organisme vii. Aceste proteine au un rol cheie n meninerea vieii. De exemplu
proteinele implicate n catalizarea unor procese eseniale, cum ar fi replicarea ADNului, trebuie sa-i conserve funcionalitate de-a lungul evoluiei i sunt comune tuturor
organismelor n timp ce alte proteine mai puin eseniale sunt mai caracteristice pentru
anumite organisme.
Proteinele omologe sunt de obicei proteine care au o compoziie similar de
aminoacizi i o origine evoluionar comun. Schimbri n secvena aminoacizilor din

protein poate conduce la schimbarea structurii sale tridimensionale. Aceast relaie


ntre secvena aminoacizilor din protein i structura tridimensional a proteinei ne
permite compararea proteinelor care nu au date structurale oferite de cristalografie sau
NMR cu secvenele omologe avnd structuri tridimensionale cunoscute.
n modelarea proteic bazat pe omologie, structurile determinate experimental
reprezint modelele template pentru secvenele omologe int care nu au
coordonate structurale.
1.
2.
3.
4.
5.

Protocolul standard al modelrii comparative cuprinde 5 etape (figura 3.3.a):


izolarea secvenei ADN
gsirea omologilor cu structura cunoscut pentru proteina int, aceast cutare
putnd fi realizat cu programul BLAST;
alinierea secvenelor int cu aceste secvene model pentru identificarea
structurii model cea mai apropiat;
construirea modelului tridimensional al secvenei int pornind de la modelele
cele mai corespunztoare gsite n etapa a 2-a;
evaluarea calitativ a modelului secvenei int, folosind criterii diverse (de ex.
energetice, stereochimice).

n mod ideal compoziia n aminoacizi a unei proteine necunoscute i cea cunoscut


a omologilor si structurali sunt oarecum similare i n baza de date proteic (PDB) sunt
prezente mai multe structuri omologe provenind din specii diferite.

Figura 3.3.a. Protocolul standard al modelrii comparative

Programul de cutare BLAST folosete ca i date de intrare pentru cutare


secvenei de aminoacizi a proteinei int, pentru cutarea secvenelor aminoacizilor
omologe n baza de date specializat (de ex. PDB, SWISS-Prot). La sfritul cutrii
sunt afiate structurile omologe cele mai apropiate de structura int cu att mai nrudite
cu ct scorul BLAST este mai mare.

Coordonatele structurale ale proteinelor celor mai similare cu proteina int sunt
salvate i folosite ca date de intrare pentru programul de modelare comparativ (de ex:
software-ul Homology din Insight II).
Coordonatele atomice ale structurilor matrita (template) sunt aliniate structural
pentru a reprezenta regiunile structurale conservate (RSC S) ale proteinei int.
Folosirea SCRS urilor ofer posibilitatea construirii caracteristicilor structurale
conservate evoluionist pentru proteina int.
Multe regiuni de bucl ale proteinelor omologe au o mare similaritate a secvenelor
de aminoacizi dar au caracteristici structurale tridimensionale variabile. Cu alte cuvinte,
relaia ntre regiunile structurale conservate i secvenele de aminoacizi aliniate nu este
asa de evident cum ar fi de ateptat. De aceea n procesul modelrii comparative este
foarte important stabilirea acestor RSCS, majoritatea acestei regiuni conservate fiind
reprezentate de structurile secundare ( - helix, structur , etc). Structurile regiunilor
din afara SCR-urilor sunt de obicei buclele structurale (loops) i capetele terminale ale
moleculelor.
Dup stabilirea coordonatelor aminoacizilor din secvenele suprapuse la nivelul
SCR-urilor trebuie gsite cele mai corespunztoare coordonate pentru regiunile de bucl
ale proteinei int, precum i ale capetelor terminale. Aceste deziderate pot fi realizate
cu ajutorul programului Homology din pachetul de programe comerciale Insight II
al companiei MSI.
Uneltele software de predicie a structurilor proteice sunt n general clasificate n 2
domenii: domeniul public accesibil i cel comercial, privat.

Figura 3.3.b. Modelarea structurilor proteice bazat pe omologie

10

Unul din programele comerciale foarte des folosit este mediul Insight II al
companiei biotehnologiei i bioinformaticii MSI (Molecular Simulation Inc.) care a
revoluionat studiile de design medicamentos prin adugarea elementelor de predicie a
structurii proteice la abordarea empiric nvechit.
La ora actual programele Insight II ruleaz numai pe computere Silicon
Graphics i IBM RISC system/6000 workstation. Majoritatea modulelor software ale
companiei MSI necesit programul grafic Insight II 3-D graphics, un mediu prietenos i
uor de folosit de ctre utilizatori.

3.4.

Grafica molecular

Reprezentarea computerizat a modelelor biologice a fost realizat pentru prima


oar de ctre Cyrus Levinthal i colegii si care au creat un sistem ce a afiat pe un
osciloscop reprezentri ale structurilor macromoleculare.
Primul sistem pentru afiajul interactiv al structurilor moleculare a fost creat la MIT
n 1966 (Eric Francoeur, Early Interactive Molecules Graphics at MIT, 1998,
http://www.umas.edu/molvis/francoeur/levinthal/lev-index.html).
Folosind unul din primele calculatoare, Project MAC, C. Levinthal i colegii si au
conceput un program model Building care s lucreze cu structurile proteice.
Programul a permis studiul interaciunilor de scurt durat ntre atomi precum i
manipularea structurilor moleculare. Terminalul de afiare a structurii moleculare a
fost un osciloscop monocromic artnd structura n form atomic cu reprezentare
grafic de srm. Efectul tridimensional a fost obinut prin rotaia constant a
structurii pe ecran.
La nceputul anilor 1970, pentru prima dat, structura unei proteine a fost obinut
cristalografic i vizualizat n ntregime cu ajutorul calculatoarelor de ctre Jane i
David Richardson i colegii. La sfritul anilor 1970, Thomas Porter a dezvoltat
algoritmi pentru reprezentrile spaiale care au revoluionat vizualizarea
macromoleculelor dar au avut acces limitat, numai pentru specialiti.
n anii 1980 David i Jane Richardson au realizat reprezentri grafice ale
structurilor moleculare folosind programul CHAOS iar n 1992 au descris Kinemage
(imaginea cinetic) i programele create de ei, MAGE i PREKIN.
MAGE este accesibil la adresa http://kinemage.biochem.duke.edu,
The Richardsons 3D Protein Structure Laboratory and Kinemage Home Page.
Software-ul cuprinde urmtoarele:
MAGE pentru afisajul Kinemage-lor;
PREKIN prepar imaginile cinetice (Kinemages) moleculare necesare ca
input pentru programul MAGE, pornind de la coordonatele n format PDB
REDUCE pentru adugarea i optimizarea hidrogenilor
PROBE calculul contactelor interatomice
MAGE poate arta diferite conformaii ale unei molecule.
Aceast capacitate de animaie molecular a programului MAGE nu este valabil
i pentru programul Rasmol.
n ultimii ani au fost create programe de vizualizare grafice relativ
necostisitoare, accesibile populaiei interesat de cercetarea molecular cum ar fi

11

RASMOL, Kinemage i Chemscape


http://www.mdli.com./chemscape/chime.

Chime

Viewer

accesibil

la

adresa

Grafica molecular este pasul spre dimenisunea a treia: analiza 3D,


manipularea n 3D, precum i compararea diferitelor conformaii.
Animaia joac un rol esenial n vizualizarea simulrilor de dinamic
molecular.
Echipamentul hardware, parte component a tehnologiei de grafic molecular,
este completat de software-ul adecvat, necesar unor tehnici curente de vizualizare:
zooming (alterarea scalei de vizualizare), clipping (simularea micrii n planul Z al
monitorului, care permite vizualizarea n adncime), precum i algoritmi de rotaietranslaie, acurateea geometric de reprezentare a atomilor i lungimilor de legtur,
manipularea precis a obiectelor n procesul de superpoziie atomic, vizualizarea
spaiului torsional (diagrama Ramachandran).
Alte suprafee i volume vizualizate curent sunt orbitalele moleculare,
potenialul electrofilic sau lipofilic proiectate pe suprafaa van der Waals sau pe
suprafaa accesibil solventului (de tip Connolly). Suprafaa poate fi la rndul ei
opac, translucent sau reprezentat sub form de puncte. Suprafeele Connolly sunt
adesea vizualizate n combinaie cu potenialul electrostatic.
Pentru proteine exist convenii de vizualizare a structurii secundare folosind
obiecte grafice de tip panglic sau cilindru.
Programele de modelare molecular sunt capabile s execute asemenea operaii
fie pe baza structurii predefinite (n format PDB), fie pe baza unor reguli care se refer
la unghiurile de torsiune phi-psi, putnd fi astfel vizualizat cu claritate structura
secundar, teriar sau cuaternar a unei proteine.

3.5. Exemplu de explorare a structurilor proteice cu


PDB (Protein Data Bank)

Accesai adresa de internet http://www.rcsb.org/pdb/home/home.do

cutai Protein Kinase C Interacting Protein with PDB-ID 1AV5


(figura 3.5.a).

12

Figura 3.5.a. Interogare cu PDB

Salvai structura n format.pdb

Structura teriar vizualizat cu jmol o alegei ca n figura 3.5.a, iar


rezultatul e prezentat n figura 3.5.b.

Figura 3.5.b. Exemplu de structur teriar vizualizat cu jmol

3.6.

Utilizarea Cn3D

Acest
modul
de
program
l
putei
accesa
http://www.ncbi.nlm.nih.gov/sites/gquery (figura 3.6.a).

de

pe

adresa

13

Figura 3.6.a. Opiunea de vizualizare a structurii 3D moleculare

n csua search vom scrie fibrinogen si vom obine rezultatul cutrii n figura
3.6.b:

Figura 3.6.b. Rezultatele interogrii

Prin accesarea butonului indicat de sgeat (figura 3.6.b) se va deschide programul


Cn3D (figura 3.6.c).

Figura 3.6.c. Vizualizarea celor 3 structuri ale fibrinogenului

14

n Cn3D vom avea afiat structura secundar i teriar n ecranul principal,


precum i structura primar (lanul de aminoacizi) n ecranul Sequence alignment
viewer (figura 3.6.c). n acest ecran aminoacizii sunt organizai pe domenii care
corespund vederii 3D a proteinei din background. Tot n Cn3D avem la dispoziie
meniul View, din care putem alege zoom in (pentru a vedea anumite domenii
ascunse), precum i opiunea animantion prin care putem crea o animaie n care
structura 3D a proteinei se va roti. De asemenea avem la dispoziie meniul Styles
unde putem selecta opiunea Rendering shortcuts. Aceasta va afecta modul de
vizualizare al proteinei, fiind disponibile urmtoarele variante (figura 3.6.d): worms
vizualizarea cu spirale si panglici (cea mai sugestiva); tubes; wire; ball and stick vizualizeaz atomii i legturile dintre molecule.

Figura 3.6.d. Moduri diferite de vizualizare ale structurilor teriare i cuaternare

Tot din meniul Styles avem optiunea Coloring Shortcuts pentru a selecta
culoarea de reprezentare a structurii 3D:
Secondary structure - va colora structura secundar
Domain - va colora un domeniu (partea funcional a proteinei)
Molecule - va colora o anumit molecul
Temperature - va colora n funcie de temperatur
Charge - va colora n funcie de ncrctura electric
Hidrophobycity - va colora n funcie de hidrofobicitate.

3.7.

Exemplu de utilizare a programului Rasmol

Denumirea rasMol provine de la raster display of molecules. Raster este un tip de


afiaj computerizat folosit n special pentru a afia suprafee solide. RasMol deschide
fiiere de tipul.pdb (protein database bank).

15

Figura 3.7.a. Vizualizarea proteinei cu programul RasMol

La adresa http://rasmol.org/ veti


(RasMol_Latest_Windows_Installer).

putea

instala

programul

Rasmol

Fereastra Linia de Comanda apare n faa ecranului principal (figura 3.6.a).


n continuare ne propunem s introducem cteva comenzi n liniile de comanda:
RasMol > help
Citii introducerea din fereastra de help.
RasMol > help commands
Windows: Main Window
Ecranul principal este ecranul pe care va fi afiat structura proteinei. Se recomand ca
ecranul cu linia de comand s fie aezat n josul ecranului principal.Cu acest
aranjament fcut se pot vedea i ultimele linii de comand i mesajele trimise de
RasMol. n ecranul principal se prezint o structur sub form de cadru de srm a unui
model de protein (figura 3.7.a).
Display: Backbone
Aa se pot vedea doar atomii de carbon din poziia alpha. Liniile care conecteaz atomii
de Carbon alpha sunt virtuale de obicei. Se pot vizualiza elemente de structur
secundar ca elice aplha sau ca foie beta pliate.
ncercai i alte comenzi din meniul Display. Fiecare comand din acest meniu
modific felul n care RasMol reprezint sau afieaz modelul. La final afiai modelul
backbone. Astfel structura secundar va fi i mai evident.
Colours: Structure
Aceast comand coloreaz elicea alpha n roz, foiele beta n galben i alte pri de
molecul n gri deschis.
RasMol > select hetero and not hoh
Aceast comand va selecta numai gruprile hetero (non-proteice) din acest fiier,
excluznd moleculele de ap care sunt frecvent incluse n modelele cristal. Nimic nu se
ntmpl pn nu este introdus o alt comand. Atenie! Comanda afecteaz numai
atomii selectai n mod curent. De asemenea nu este nevoie de a aduce fereastra cu
linia de comand n primul plan pentru a introduce comenzi.

16

Display: Ball & Stick


RasMol afieaz un model de bee i mingi ale atomilor selectai. Observai c
aceast comand nu afecteaz lanul proteic pentru c nu e selectat.
Colours: CPK
RasMol coloreaz atomii selectai conform unor convenii chimice larg rspndite:
Carbonul (C) este gri deschis, Azotul (N) se coloreaz n albastru deschis, iar oxigenul
se coloreaz n rou.
Dai click pe Carbonul din poziia alpha a proteinei i urmrii linia de comand.
Aceast manevr se numete extragerea unui atom. Cnd vei alege un atom din
fereastra principal RasMol l va identifica (figura 3.5.b). O s observai o expresie de
genul: Atom: CA 652 Group: PRO 81 care ne spune c am selectat carbonul din poziia
alpha (CA) din restul 81 n citocromul b5, care este o prolin. RasMol definete restul
ca un grup (de aminoacizi), iar poriunea non-proteic dintr-o molecul ca hetero.
Dac vedei un atom colorat n galben dup modelul ball and stick dai click pe el. Va
fi afiat ceva de genul: Atom: FE 754 Hetero: HEM 201. Atomul galben numit FE este
Fierul (Fe3+, de fapt) in centrul grupului hem al citocromului b5. Folosind comanda
select hetero and not hoh i afind totul ntr-un stil contrast (similar cu displaylul
Display:Ball&Stick) putem gsi foarte rapid gruprile nonproteice din fiierul nostru
PDB. Selectnd un atom dintr-un grup putem afla numele n PDB al acelui grup, fapt
care ne va folosi mai trziu.

Figura 3.7.b. Tipuri de vizualizri ale atomilor i fereastra de comand

Atenie! Selectarea unui atom funcioneaz cel mai bine cu modul de vizualizare
Wireframe i Sticks i nu fucioneaz deloc cu modul Ribbons, Strands i Cartoons
(fiind
inexact
prin
vizualizarea
cu
Spacefill
i
Ball&Stick).
Dedesubt este afiat lista de comenzi utilizat pn acum (figura 3.5.b). Putei folosi
aceast list de comenzi pentru a va creea ct mai repede o idee asupra oricrei
macromolecule pentru care avei fiierul PDB ct i pentru a afia eventualele grupri
hetero (cofactori, inhibitori, apa):
Display: Backbone
Colours: Structure

17

Rasmol > select hetero and not hoh


Display: Ball & Stick
Colours: CPK

3.8.
1.

Exerciii propuse

Descrcai rasmol de la adresa http://www.umass.edu/microbio/rasmol/

2. Din ce clas face parte proteina Protein Kinase C Interacting Protein with
PDB-ID 1AV5 ?
R: Face parte din familia inhibitorilor de protein kinaza.
3. Cutai i vizualizai hexokinaza uman I (Swissprot cod HXK1_HUMAN,
numr P19367, PDB-id 1HKB).
4. Vizualizai domeniul de legare cu beta-D glucoza cu ajutorul programului
Ligand explorer.
R:Dupa ce ai cutat proteina 1HKB la seciunea Ligand Chemical Component=>
beta-D- glucose accesai Ligand explorer.
5. Folosii
GOR
IV
(http://npsa-pbil.ibcp.fr/cgiin/npsa_automat.pl?page=npsa_gor4.html) pentru a prezice structura secundar a
proteinei cu structura primar urmtoare (lanul alpha al hemoglobinei):
vlspadktnv kaawgkvgah ageygaeale rmflsfpttk tyfphfdlsh gsaqvkghgk kvadaltnav
ahvddmpnal salsdlhahk lrvdpvnfkl lshcllvtla ahlpaeftpa vhasldkfla svstvltsky r
6. Comparai rezultatele cu structura vizualizat n Cn3D a proteinei de mai sus
(ID 2HCO).
Exerciii cu Rasmol
Mergei la link-ul PDB i descrcai:
1ZNI (insulina porcina)
1LPH (insulina umana creata artificial)
Dai dublu click pe icoana Raswin de pe desktop. Va aprea fereastra RasMol i
fereastra cu linia de comand Rasmol minimalizat. Accesai fereastra cu linia de
comand Rasmol pentru a afia linia de comand. Scrieti background white, apasai
enter. Se va schimba fundalul ecranului principal.
Ducei fisierul PDB 1ZNI n fereastra principal rasmol. Acum putei vedea
structura insulinei afiat cu displayul wireframe n ecranul principal.
Ci aminoacizi are poteina (insulina)?
Cte lanuri polipeptidice are?
Care este aminoacidul din captul N-terminal i cel din captul C-terminal al
lanurilor A i B?
Care este structura secundar?
Care este cel mai lung Helix?

18

R: Cte lanuri polipetidice are insulina?


Introducei urmtoarele comenzi n linia de comand:
reset
restrict backbone
ribbons on
wireframe off
color chain
Putei salva un script pe hard-disk introducnd comanda: write script C:\zni.sp
R: Ci aminoacizi are lanul A?
select *.ca and *a (selecteaz toi atomii CA din lantul A)
(Rspuns: "21 atoms selected!", deci exist 21 de aminoacizi n lanul A)
R. Care este captul N-ternimal i C-terminal?
select 1,21 and *.ca and *a label
R: Care este structura secundar? Care este cel mai lung Helix ?
Exist pantru lanuri polipeptidice n structura insulinei, fiecare afiat cu o culoare
diferit. Un fiier PDB folosete o liter unic pentru fiecare lan polipeptidic, ncepnd
cu litera A.
De exemplu introducei comanda: restrict *a
Se va afia numai lanul A n ecranul principal Rasmol.
R: Cum putei folosi Rasmol pentru a afla captul N-terminal i C-terminal al
lanului A?
Accesai ambele capete ale lanului i vei vedea afiat n linia de comad rasmol,
aminoacizii corespunztori.

19

S-ar putea să vă placă și