Sunteți pe pagina 1din 2

Hierarchical Shotgun Sequencing

1. Introducere
Secvențierea ierarhică prin metoda shotgun reprezintă singura posibilitate pentru secvențierea
genomurilor de lungimi mari, care nu pot și inserate într-un vector fagic sau a genomurilor care
aparțin organismelor eucariote, în cazul cărora există multe secvențe repetitive ce pot îngreuna
ansamblarea corectă.
2. Principiu
Această metodă presupune fragmentarea genomului în bucăți cu dimensiuni mari, de
aproximativ 150 kb, care prezintă suprapunere.
Fragmentele obținute sunt clonate folosind vectori precum cromozomii bacterieni artificiali
(BAC). Denumirea de cromozom este generică, deoarece BAC-urile nu prezintă centromer sau
telomere, acești vectori sunt plasmide (derivate din plasmidul F) care permit clonarea unui
insert de dimensiuni mai mari, păstrând stabilitatea și fidelitatea ADN-ului inserat pe tot
parcursul transmiterii.
În urma inventarierii clonelor BAC se obține o librărie sau bancă de clone. După obținerea
librăriei se începe ordonarea acestora prin încercări de suprapunere pentru a obține seturi de
clone cu suprapunere parțială care, ideal, să acopere întreg genomul.
Clonele BAC astfel ierarhizate sunt secvențiate prin metoda shotgun care presupune
fragmentarea fiecărei clone în fragmente mai mici care vor fi introduse în vectori. Apoi vor fi
suprapuse și secvențiate în continuare pentru a putea întregi contigurile și pentru a determina
secvența clonei BAC de origine. Acest proces este repetat pentru fiecare clonă BAC din
ierarhizarea preliminară. Astfel, se merge din aporoape în aproape pentru elucidarea unui
genom și este ușurată ansambarea bucăților secvențiate de către ierarhizarea făcută pentru
clone.
3. Aplicarea metodei HSS și istoricul secvențierii genomului uman
În realizarea proiectului de secvențiere a genomului uman s-a folosit cu succes metoda HSS.
La demararea proiectului s-a folosit ADN de la un voluntar anonim de sex masculin, a fost ales
un bărbat datorită prezenței celor 24 de tipuri de ADN nuclear (22 autozomi, 1 cromozom X și
1 cromozom Y). S-a dorit folosirea a 10 librării BAC, însă doar librăria RPCI-11 a fost utilizată
pentru majoritatea procesului de secvențiere. Această librărie conținea peste 500.000 de clone,
iar dimensiunea medie a fragmentului era de 178 kb.
Folosind identificarea cu enzime de restricție a fost realizată o hartă cu localizarea probabilă a
clonelor BAC obținute.
Ierarhizarea probabilă a clonelor BAC a fost făcută prin identificarea cu ajutorul enzimelor de
restricție. Anterior publicării schiței, în septembrie 2000, o serie de clone BAC cu fost analizate
în urma restricției cu enzima HindIII. Fragmentele cu suprapuneri au fost identificate pe baza
faptului că aveau în structură fragmente de restricție comune și s-au obținut contiguri de clone
suprapuse. Din clonele analizate au fost construite 1447 contiguri și au mai rămas 76.436 clone
la care nu s-a găsit suprapunere cu o altă clonă.
În urma unui experiment ideal ar fi trebuit să se obțină 24 de contiguri perfecte, unul pentru
fiecare cromozom, însă există lacune între contiguri care continuă să fie completate pentru a
putea întregi harta.
Motivele pentru care obținerea contigului perfect este îngreunată constau în primul rând în
faptul că suprapunerea dintre BAC-uri este prea mică pentru a fi detectată de identificarea prin
restricție. Un alt motiv pentru care un cromozom nu poate fi acoperit de un singur contig este
datorat repetițiilor, mai ales duplicațiilor care prezintă aceleași modele de restricție deci, vor fi
ansamblate în același contig în loc de contiguri separate.
Următorul pas a fost deterimarea poziției clonelor în cromozom, prin diferite metode. O primă
determinare a fost făcută prin caracterizare clonelor BAC înainte de construirea contigurilor.
Altă metodă a presupus căutarea de sequence-tagged sites (STS-uri) în fiecare clonă. STS-urile
reprezintă secvențe din genom a căror locație este cunoscută. Dacă o sondă STS se leagă la o
clonă BAC se poate determina poziția clonei în cromozom, iar o sondă care se leagă la două
clone BAC indică suprapunerea clonelor. Determinarea a mai fost făcută prin tehnica de
hibridiare fluorescentă in situ (FISH), care permite vizualizarea clonei marcate după legarea
acesteia de cromozomi întregi.
Schița genomului uman a fost făcută publică în luna februarie a anului 2001. Aceasta elucida
aproximativ 87% din genom, cu o acoperire de 90% a eucromatinei. Pentru înregistrarea
statistică a contigurilor care aveau lungimi diferite s-a introdus „lungimea N50”. Contigurile de
secvență aveau o lungime N50 de 826 kb, adică 50% din bazele întregii ansamblări erau
prezente într-un contig de minin 826 kb.
Restul de 10% din eucromatină a fost mai costisitor și a necesitat mai mult timp. În 2004, o
variantă mai completă a fost publicată. Aceasta acoperea 99% din eucromatină și 93% din
ADN-ul total, secvența conținea doar 341 lacune, lungimea N50 era 38,5 Mb, iar acuratețea era
99,999% (1 eroare la 100.000 baze). Părțile din genom care nu au fost secvențiate, fie nu pot fi
clonate, fie reprezintă zone înalt repetate care nu pot fi ansamblate după secvențierea shotgun
sau nu pot fi generați primeri pentru a folosi metoda primer walking.
4. Scevențierea întregului genom uman prin metoda WGS (whole genome shotgun
sequencing)
În paralel cu proiectul de scevențiere prin metoda HSS, o companie privată a încercat
secvențierea genomului prin metoda WGS. După ce au investit în mai multe secvențiatoare și
computere cu putere mare de calcul pentru ansamblare au construit librării cu fragmente de 2,
10 și 50 kb de la 5 indivizi. Deși au obținut datele de secvențitere în doar 1 an, nu au fost
suficiente pentru ansambarea genomului. Au folosit datele obținute prin metoda HSS înpărțite
în fragmente de 550 kb și le-au adăugat secvențelor obținute de ei. Deoarece aveau ambele
capete, mai ales cele ale fragmentelor de 10 și 50 kb, au putut aranja contigurile în scaffold-uri
și au folosit markerii STS și informațiile analizelor BAC pentru a le poziționa în cromozom.
Rezultatele lor au fost publicate în același timp cu cele ale proiectului care a folosit metoda
HSS, tot cu o acoperire de 90% a eucromatinei, dar cu o ansamblare puțin mai bună.
Metoda HSS a fost aleasă pentru proiectul public de secvențiere a genomului uman deoarece
permitea o acoperie mai bună a lacunelor decât metoda WGS, în urma căreia se obținea o
cantitate mare de date foarte rapid, dar nu a reușit să completeze genomul.