Documente Academic
Documente Profesional
Documente Cultură
Bioinformatica Curs5
Bioinformatica Curs5
unde s(xi, yj) este scorul alinierii lui xi cu yj (obţinut, de exemplu, dintr-o matrice de
substituţie), iar d este penalizarea pentru gap.
Scorul celei mai bune alinieri se găseşte în celula din colţul dreapta-jos al matricei.
Identificarea alinierii propriu-zise se face printr-un procedeu de traceback (se urmăreşte,
pornind din colţul dreapta-jos, înapoi, drumul parcurs pentru a obţine acest scor, până la
atingerea colţului din stânga-sus.
În afară de potrivire, ştergere şi inserţie, o altă opţiune este începerea unei noi alinieri
locale, cu scor iniţial 0;
Alinierea locală se poate termina oriunde în matrice, scorul ei fiind cel mai mare scor
dintr-o celulă a matricei; pentru identificarea alinierii, se face traceback din acea celulă
până când se întâlneşte o celulă cu scor 0.
Aplicație:
1. Fie secvențele v= SEND și w= AND. Considerăm că scorul pentru potrivire este +1, pentru
nepotrivire -1, iar pentru inserție și ștergere -1, gap open penalty d=-5, folosind matricea
BLOSUM62.
a. Realizați tabela de programare dinamică pentru alinierea globală. Care este scorul
optim? Care este alinierea corespunzătoare?
2. Fie secvențele v=TACGGGTAT și w=GGACGTACG. Considerăm că scorul pentru
potrivire este +1, pentru nepotrivire -1, iar pentru inserție și ștergere -1, gap d=8, folosind
matricea BLOSUM62.
b. Realizați tabela de programare dinamică pentru alinierea globală. Care este scorul
optim? Care este alinierea corespunzătoare?
c. Similar pentru aliniera locală.
a. Realizați tabela de programare dinamică pentru alinierea locală. Care este scorul
optim? Care este alinierea corespunzătoare?
a. Realizați tabela de programare dinamică pentru alinierea globală. Care este scorul
optim? Care este alinierea corespunzătoare?
b. Similar pentru aliniera locală.
Solutii Matlab
v = 'VSPAGMASGYD';
w = 'IPGKASYD';
% scoringmatrix poate fi 'BLOSUM62', 'BLOSUM30' increasing by 5 up to
'BLOSUM90'
% 'BLOSUM100', 'PAM10' increasing by 10 up to 'PAM500', 'DAYHOFF', 'GONNET'
% AlphabetValue - Character vector or string specifying the type of
sequence.
% Choices are 'AA' (default, 'BLOSUM50') or 'NT' ('NUC44').
d = 5;
[Score, Alignment] = nwalign(v, w, 'scoringmatrix','BLOSUM62', 'gapopen',5,
'showscore', 'true')