Sunteți pe pagina 1din 9

Alinierea secventelor ADN

1. Accesati site-ul NCBI si salvati secventele CDS (in format fasta: cu extensia .fas) ale
genelor pentru adenilat ciclaza, ale speciilor de bacterie: Bordetella pertussis (GI:
580667), B. parapertussis (GI: 7160623), B. bronhiseptica (GI: 11602642) si hemolizina
din Escherichia coli (GI: 157688243).
2. Porniti programul BioEdit si deschideti, pe rand, toate secventele salvate.
3. Incarcatile manual in acelasi document (de exemplu in documentul cu secventa din B.
pertussis, GI: 580667) astfel: selectati una din secvente (titlul ei), Edit/Copy Sequence(s),
activati fereastra documentului principal si apoi Edit/Paste Sequence(s). Procedati la fel
cu toate celelalte secvente.
4. Selectati secventele ADN din B. pertussis (GI: 580667) si B. parapertussis (GI: 7160623) si
aliniatile cu comanda Sequence/Pairwise alignment/Align two sequence (optimal
GLOBAL alignment).
Modulul de aliniere Align two sequence (optimal GLOBAL alignment) aliniaza perechile de
secvente pe toata lungimea lor. Modulul de aliniere Align two sequence (allow end to slide)
este un aliniament local si se foloseste pentru perechile de secvente mai putin asemanatoare
si/sau diferite ca dimensiune.
Rezultatul aliniamentului se regaseste in doua ferestre: una cu aliniamentul propriuzis si
cealalta cu sumarul in care sunt afisate titlurile secventelor, tipul de aliniament folosit (Optimal
GLOBAL alignment) sau Sequence ends allowed to slide over each other), scorul si gradul de
asemanare dintre secvente (Identity). Scorul depinde de fiecare secventa in parte. In cazul in
care cele doua secvente aliniate sunt identice, gradul de asemanare are valoarea 1 (100%).
Repetati aliniamentul si cu secventele de ADN din B. pertussis (GI: 580667) si B.
bronhiseptica (GI: 11602642).
5. Pentru a realiza un aliniament multiplu selectati toate secventele ADN si accesati
Accesori Application/ClustalW Multiple alignment. Asigurati-va ca in fereastra aparuta
sunt bifate casutele pentru Full multiple alignment(afisarea aliniamentului) si Output
Clustal format with Clustal consensus sequence generation (notarea nucleotidelor
conservate).
Functia Gap penalties poate fi folosita pentru restrictionarea introducerii si/sau
prelungirii unei intreruperi in cadrul secventelor.

Celelalte functii (Calculate NJ Tree, FAST algoritm for guide tree, Bootstrap for NJ
tree si Number of bootstraps) se folosesc pentru realizarea unor calcule preliminarii in
vederea formarii arborilor filogenetici. Crearea arborilor filogenetici se realizeaza cu ajutorul
aplicatiei TreeView care trebuie instalata (folosind fisierul executabil treev32.exe aflat sub
forma arhivata, in directorul BioEdit) si configurata in BioEdit. Aceasta aplicatie nu functioneaza
bine in sistemul de operare Windows 64bit.
Faceti click stanga pe butonul OK aflat in fereastra care se deschide pentru a anunta
fisierele temporale create in cursul alinierii.
Repetati aliniamentul si cu secventele de ADN din B. pertussis (GI: 580667), B. parapertussis
(GI: 7160623) si B. bronhiseptica (GI: 11602642).
6. Pentru printarea aliniamentelor se acceseaza File/Grafic View. In fereastra de editare
aparuta puteti modifica parametri de afisare a aliniamentului.
Fixati la 60 numarul de nucleotide per rand (Residues per row) si bifati casutele pentru:
afisarea titlurilor in stanga aliniamentului (Titles on left), ingrosate (Titles Bold), afisarea atat in
stanga (numbers left of seqs), cat si in dreapta aliniamentului (numbers right of seqs) a
numerotarii nucleotidelor, afisarea ingrosata (Sequence Bold) si eventual color (Sequence in
color) a secventelor si afisarea riglei (Show Ruler). Faceti click stanga pe butonul Redraw.
Printarea se realizeaza ca la majoritatea documentelor prin accesarea File/Print (sau
Ctrl+P), urmata de alegerea imprimantei sau a programului de creare a documentelor cu
extensia .pdf.

Analiza informatica a secventelor

Bioinformatica asigura baza teoretica, dar si uneltele practice pentru explorarea proteinelor si ADNului. Ea consta dintr-o abordare computationala pentru gestionarea si analiza informatiilor biomedicale.
Este folosita tot mai mult in cercetare atat in cadru academic cat si industrial.
Obtinerea secventelor
1. Intrati pe pagina de web a NCBI (National Center for Biotechnology Information):
www.ncbi.nlm.nih.gov. NCBI este o retea exinsa de baze de date cu informatii genetice, medicale si
biochimice. Pentru informatii detaliate cu privire la acest site puteti accesa Manualul NCBI
(http://www.ncbi.nlm.nih.gov/books/NBK21101/).
2. Pentru a ajunge in portalul GQuery (http://www.ncbi.nlm.nih.gov/gquery/) selectati All
Databases din bara de navigatie din partea de sus a paginii, si dati click pe butonul Search.
Acesta ne asigura accesul la o mare varietate de informatii: de la literatura biomedicala (PubMed)
pana la baze de date ce cuprind secvente de nucleotide, secvente si structuri proteine etc.
3. Tastati in bara de cautare cuvintele cheie ale fragmentului de ADN cautat. In continuare vom lucra
cu adenilat ciclaza din Bordetella pertussis (cuvinte cheie: adenylate cyclase AND Bordetella
pertussis).
I1: Cate secvente nucleotidice s-au obtinut? Dar gene?
I2: Ce se obtine la folosirea cuvantului cheie: bacteria? De ce?
4. Accesati linkul Nucleotide: DNA and RNA sequences. In pagina afisata se poate gasi linkul adenilat
ciclazei din B. pertussis, urmat de cateva informatii legate de secventa respectiva: nr. de pb pe care
le contine (6441 pb), precum si Accession: A14850.1 si GI: 580667.
Accession cuprinde Accession number (nr de identificare unic atribuit fiecarei secvente
inregistrate, alcatuit dintr-o litera urmata de 5 cifre sau 2 litere urmate de 6 cifre), urmat de Version
number (indice al istoricului revizuirii care incepe cu 1 si creste cu fiecare revizuire a secventei).
GI (GenInfo Identifier) alcatuit dintr-o serie de cifre care sunt atribuite consecutiv pentru fiecare
secventa inregistrata si prelucrata de NCBI.
Cele doua sisteme functioneaza in paralel. Daca o secventa de ADN sau proteine sufera modificari de
orice natura, acesta va primi un nou numr de GI.
5. Accesati linkul adenilat ciclazei din B. pertussis pentru a acceseaza secventa in formatul GenBank.
Acesta cuprinde 3 parti: antet, caracteristici, si secventa in sine.

Structura antetului este prezentata in figura 1

Figura 1. Formatul GeneBank (Antet).


In cadrul modulului Features se regasesc informatii despre secventa in cauza (organismal de
provenienta, tipul de molecula, etc.), precum i regiunile biologice importante.
CDS (Coding DNA Sequence) = Secventa codificatoare, cuprinsa intre codonul strart (ATG) si codonul stop.
Ea corespunde cu secventa de aminoacizi rezultata in urma traducerii.
Secventa se gaseste in ultima parte a paginii.
Mai multe detalii se pot vedea pe site: http://www.ncbi.nlm.nih.gov/Sitemap/samplerecord.html.
I3: Ce se intampla la accesarea linkului CDS situat la stanga paginii?
6. Salvati secventa codificatoare (CDS) prin accesarea meniului pop-up, aflat in dreptul linkului
Send: aflat in dreapta-sus a ferestrei (click stanga pe acesta, bifati Coding Sequences, selectati
FASTA Nucleotide si apasati butonul Create File).

Prelucrarea secventelor
1. Deschideti programul de prelucrare a secventelor (ADN/proteine) BioEdit (kitul de instalare se
poate downloada de pe http://www.mbio.ncsu.edu/bioedit/bioedit.html).
2. Deschideti secventa de ADN (CDS-ul adenilat ciclazei din B. pertussis) salvata de pe NCBI (File/Open,
selectati All Files in dreptul Files of Types: si deschideti documentul cu extensia .txt).
3. Pentru a obtine harta de restrictie a secventei ADN, selectati secventa si accesati modulul de
restrictie pe urmatoarea cale: Sequence/Nucleic Acid/Restriction Map.
2

Setati conditiile de afisare a hartii de restrictie (Display), asa cum este prezentat in figura 2. Aici sunt
bifate casutele pentru afisarea hartii si a listelor enzimelor de restrictie aranjate dupa nume si pozitia in
cadrul secventei, lista enzimelor care au doar un singur situs de restrictie, a celor care au cel mult 5 situsuri
de restrictie, precum si a enzimelor care nu prezinta nici un situs de restrictie. Sunt luate in considerare
doar enzimele care recunosc situsuri de restrictie compuse din cel putin 6 nucleotide.

Figura 2. Modulul de restrictie a programului BioEdit.


Casuta pentru ADN circular ramane nebifata.
I4: Cand este necesara bifarea casutei Circular DNA?
4. Apasati butonul Generate Map.
Se obtine un document text cu harta de restrictie si lista enzimelor respective.

De asemenea cu ajutorul programului BioEdit se pot face diverse alte prelucrari de secvente (atat
ADN cat si proteine). O prelucrare ar fi traducerea secventelor ADN in proteine (Sequence/Nucleic
Acid/Translate). Se poate alege cadrul de citire (frame) care in cazul nostru este 1 deoarece codonul start
ATG incepe chiar din pozitia 1 a secventei nucleotidice. Se mai pot face aliniamente a doua secvente de
ADN sau poteine (Sequence/Pairwise Alignment/).

Electroforeza ADN

Introducere
Electroforeza in gel de agaroza este o metoda utilizata in

biochimie, biologie moleculara si chimie clinica pentru a


separa o populatie mixta de ADN sau proteine intr-o matrice
de agaroza.
Tehnica se foloseste pentru determinarea calitatii ADN-ului,
verificarea existentei produsilor rezultati in urma PCR sau a
purificarilor, precum si pentru analiza fragmentelor rezultate
dupa clivarea enzimatica.

Electroforeza se realizeaza

intr-un tampon salin, in


prezenta unui curent electric.
In reteaua gelului de agaroza
separarea moleculelor de
ADN are loc in functie de
marime (moleculele mici
migreaza mai repede dacat
cele mari).
Acizii nucleici sunt incarcati
negativ datorita prezentei
gruparilor fosfat si migreaza
spre electrodul incarcat
pozitiv.
http://blog.sciencemusings.com/2008_08_01_archive.html

Mobilitatea electroforetica a ADN-ului


Este influentata de urmatorii factori:
Concentratia de agaroza - rezolutia fragmentelor mici este mai la

concentratie mare, in timp ce fragmentele mari sunt separate mai bine la


concentratii mici de agaroza (concentratia de 1% este cea mai intes utilizata);
Marimea moleculei de ADN;
Conformatia moleculei de ADN (monocatenar, bicatenar sau superspiralizat)
- molecula de ADN superspiralizata migreaza mai repede decat cea relaxata;
Prezenta compusului fluorescent in gel intercalarea bromurii de etidiu
intre bazele moleculelor de ADN poate afecta mobilitatea acestora in camp
electric;
Tamponul utilizat tamponul TBE (Tris-borat cu EDTA) confera o rezolutie
mai buna pentru fragmente mai mici de 1kb, in timp ce tamponul TAE confera o
rezolutie buna pentru cele mari;
Tipul de agaroza agaroza low melting point confera o rezolutie buna doar
pentru molecule relativ mici (pana la 1kb);
Voltajul aplicat rezolutia fragmentelor mari scade la voltaj crescut (de obicei
se utilizeaza 4-10V/cm).