Sunteți pe pagina 1din 14

Studiu bioinformatic asupra tintelor

moleculare ale acidului aspartic

Referinta bibliografica : ”The webtool is described in detail here:  SwissTargetPrediction:


updated data and new features for efficient prediction of protein targets of small
molecules, Nucl. Acids Res. (2019). For technical information about the prediction
algorithm, you can refer to: Shaping the interaction landscape of bioactive
molecules, Bioinformatics (2013) 29:3073-3079. ”

1. Folosind programul Swiss Target Prediction principalele tinte sunt redate in figura :

Dintre aceste tinte moleculare am ales-o pe cea cu probabilitatea cea mai mare : un omolog al
proteinei EGLN1 . EGLN1 este cea mai importantă izozimă sub normoxie și, prin reglarea
stabilității HIF1, implicată în diverse procese influențate de hipoxie, cum ar fi angiogeneza în
funcționalitatea retinei. Codul din Potein Data bank (PDB) este :2Y33
2 Identificarea proteinelor care au secvente similare cu un omolog al proteinei EGLN1

Am identificat proteine care au grad de similaritate a secventei cu un omolog al proteinei


EGLN1.

Codurile din UNIPROT :

Q91YE3 78.9 %

W5NZ83 88.9 %

Q28E59 61.8 %

A0A484H0X4 96.3 %

A0A4X2MA31 50.4 %
3 Alinierea multipla a secventelor proteinelor identificate

: aminoacizi similari

** aminoacizi asemanatori
Matricea create prin programul Clustal.

Caracterizarea proprietatilor fizico-chimice ale proteinei EGLN1

4. Despre Protparam

ProtParam calculează diverse proprietăți fizico-chimice care pot fi deduse dintr-o secvență de
proteine. Nu sunt necesare informații suplimentare despre proteina luată în considerare.
Proteina poate fi specificată fie ca număr de identificare sau cod de aderare Swiss-Prot /
TrEMBL, fie sub formă de secvență brută. Spațiul alb și numerele sunt ignorate. Alegerea
include o selecție de lanțuri mature sau peptide și domenii din tabelul de funcții Swiss-Prot
(care poate fi ales făcând clic pe poziții), precum și posibilitatea de a introduce poziția de
început și de final în două casete. În mod implicit (adică dacă lăsați cele două cutii goale), se
va analiza secvența completă.

Greutate moleculara : 46020.97


Proteina este de talie mare pentru ca este peste 400.

Punctul izoelectriv: 8.83


Punctul izoelectric este bazic pentru ca este mai mare ca 7.

Indice de instabilitate: 40.11

Proteina este stabila pentru ca indicele este in jur de 40.


Lant alifatic : 61.69

Aminoacizi cu lant alifatic sunt in numar mic , ceea ce poate conduce la o asamblare
compacta a proteinei.

Caracter global (GRAVY): - 0.657


Exista un caracter global hidrofil pentru ca este negativ.

Scala Hphob. / Kyte & Doolittle

Cea mai hidrofoba regiune (+) : 205 - 214

Cea mai hidrofila regiune (-) : 100 - 120


Scala  Hphob. / Hopp & Woods

Cea mai hidrofoba regiune (-) : 200-212

Cea mai hidrofila regiune (+) : 100-125


Predictia regiunilor de structura secundara a proteinei

JPred este un server de predicție a structurilor secundare proteice și funcționează din aproximativ
1998. JPred încorporează algoritmul Jnet pentru a face predicții mai precise. În plus față de structura
secundară a proteinei, JPred face și predicții cu privire la accesibilitatea solventului și regiunile Coil-
coil (metoda Lupas).

Referinta bibliografica : „The JPred 4 server is described in NAR (primary JPred citation):
Drozdetskiy A, Cole C, Procter J & Barton GJ. (first published online April 16, 2015) JPred4: a
protein secondary structure prediction server, Nucleic Acids Res. Web Server issue”.

Regiuni foaie beta (sageata verde)

Regiuni elice ( sageata rosie )

PONDR – Predicted of Natural Disordered Regions

PONDR® prevede secvențe unice. PONDR-urile sunt de obicei rețele neuronale care utilizează
atribute de secvență prelevate pe ferestre de 9 până la 21 de aminoacizi. Aceste atribute, cum ar fi
compoziția fracțională a anumitor aminoacizi, hidropatia sau complexitatea secvenței, sunt mediate
peste aceste ferestre și valorile sunt utilizate pentru a antrena rețeaua neuronală în timpul construcției
de predictori. Aceleași valori sunt utilizate ca intrări pentru a face predicții.

Referinta bibliografica : “Garner E, Romero P, Dunker AK, Brown C, and Obradovic Z. (1999)
Predicting binding regions within disordered proteins, Genome Informatics, 10, 41-50.”
================================VLXT NNP STATISTICS================================
Predicted residues: 426 Number Disordered Regions: 6
Number residues disordered: 193 Longest Disordered Region: 121
Overall percent disordered: 45.31 Average Prediction Score: 0.4801
Predicted disorder segment [1]-[23] Average Strength= 0.8553
Predicted disorder segment [67]-[187] Average Strength= 0.9173
Predicted disorder segment [221]-[226]Average Strength= 0.5533
Predicted disorder segment [243]-[259]Average Strength= 0.7493
Predicted disorder segment [269]-[271]Average Strength= 0.5067
Predicted disorder segment [401]-[423]Average Strength= 0.7047
================================PREDICTOR OUTPUT================================
"D" = Disordered " " = Ordered
================================================================================

In cea mai mare parte regiunile ordonate si neordonate corespund cu programul PONDR.
Predictia structurii spatiale a proteinei cu programul Geno3D
Referinta bibliografica: ”Combet, C., Jambon, M., Deléage, G. & Geourjon, C., Geno3D an
automated protein modelling Web server, Bioinformatics, 2002, 18, 213-214”

Despre Geno3d

Geno3D (http://geno3d-pbil.ibcp.fr) este un server web automat pentru modelarea moleculară


a proteinelor. Începând cu o secvență de proteine de interogare, serverul realizează modelarea
omologiei în șase etape succesive:

(i) identifică proteine omologe cu structure


(ii) 3D cunoscute prin utilizarea PSI-BLAST;
(iii) furnizează utilizatorului toate șabloanele potențiale printr-o interfață de utilizator
foarte convenabilă pentru selectarea țintei;
(iv) efectuează alinierea atât a secvențelor de interogare, cât și a subiectelor;
(v) extrage restricții geometrice (unghiuri și distanțe diedre) pentru atomi
corespunzători între interogare și șablon;
(vi) execută construcția 3D a proteinei utilizând o abordare de geometrie a distanței
(vii) trimite în sfârșit rezultatele prin e-mail către utilizator.

Codul pdb : pdb4kbz-A

Programul Geno3d a identificat multiple rezultate si identifica care sunt secvetele similare cu
cea pe care am introdus-o.

Extragerea fisierului structural al proteinei EGLN1 din baza de date Protein Data Bank

Coduri din PDB : 5L9R , 4BQW ,5L9B ,5OX5 ,2Y33


Fisierul structural al proteinei EGLN1 contine 5L9R cu urmatoarele specificatii :
 Lungimea secventei este de 252 aminoacizi
 Are specificatii umane
 Are lantul A
 Are 2 mutatii

Cuprinde 5 liganzi :
1. MANGANESE (II) ION
2. SULFATE ION
3. GLYCEROL
4. TETRAETHYLENE GLYCOL
5. N-OXALYLGLYCINE

Uscf Chimera
UCSF Chimera este un program extrem de extensibil pentru vizualizarea și analiza interactivă
a structurilor moleculare și a datelor conexe, inclusiv hărți de densitate, ansambluri
supramoleculare, alinieri de secvență, rezultate de andocare, traiectorii și ansambluri
conformaționale. Imagini și animații de înaltă calitate pot fi generate. Chimera include
documentație completă și mai multe tutoriale și poate fi descărcată gratuit pentru utilizare
academică, guvernamentală, nonprofit și pentru uz personal.

Vizualizarea si analiza proteinei 5L9R cu programul Chimera

Molecula propriu zisa

Imagine care reprezinta hidrofobicitatea


Zona albastra este hidrofila iar zona portocalie hidrofoba

Imagine care reprezinta lantul lateral (A)

Imagine care prezinta liganzii


Imagine care reprezinta suprapunerea a 2 molecule

RMSD : 195 de atomi din 217 perechi se suprapun

Imagine care prezinta sarcinile electrice


Cu rosu regiunile incarcate negativ , rosu pozitiv , alb regiuni neutre.

Vizualizarea cavitatilor

14 cavitati detectate
Tabel cu primele 3 cavitati

Nr cavitatii Scorul de Scor de Volumul Sarcina Densitatea


hidrofobicitate polaritate electrica locala
globala
0 26.4000 15 3.8667 -3 33.1936

1 49.1250 5 5.0000 0 22.3200

2 20.2500 4 4.0000 1 7.0000

Concluzie :

Proteina este de talie medie , preponderent hidrofila. Are 14 cavitati dintre care am identificat
3. Cea mai puternica fiind cavitatea “ 1” cu caracter hidrofil.

S-ar putea să vă placă și