Query |
121 |
AVHASLDKFLASVSTVLTSKYR |
142 |
Sbjct |
126 |
V A+ +KF+A + L+ Y |
147 |
KVQAAWEKFIAVLVDGLSQGYN |
Выравнивание 22 с глобином эпсилон Gallus gallus (Банкивский петух).
epsilon globin [Gallus gallus] Length=147
GENE ID: 428114 HBE1 | hemoglobin, epsilon 1 [Gallus gallus] (10 or fewer PubMed links)
Score = 99.0 bits (245), Expect = 1e-19, Method: Compositional matrix adjust. Identities = 54/141 (39%), Positives = 81/141 (58%), Gaps = 8/141 (5%)
Query |
7 |
DKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF-DLSH-----GSAQVKGHG |
60 |
||||||
Sbjct |
8 |
+K |
+ |
WGKV + |
E GAEAL R+ + +P T+ +F F +LS |
G+ |
V+ HG |
65 |
|
EKQLITGLWGKV--NVAECGAEALARLLIVYPWTQRFFASFGNLSSATAIIGNPMVRAHG |
|||||||||
Query |
61 |
KKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTP |
120 |
||||||
Sbjct |
66 |
KKV |
+ |
AV ++D++ |
+ + LS LH KL VDP NF+LL |
L++ LA+H |
+FTP |
125 |
|
KKVLSSFGEAVKNLDNIKKSFAQLSKLHCDKLHVDPENFRLLGDILIIVLASHFSKDFTP |
|||||||||
Query |
121 |
AVHASLDKFLASVSTVLTSKY |
141 |
|
|
|
|||
Sbjct |
126 |
A A+ K + V+ L +Y |
146 |
|
|
|
|||
ASQAAWQKMVRVVAHALAHEY |
|
|
|
||||||
Выравнивание 23 с субъединицей эпсилон-2 гемоглобина Bos taurus (Дикий бык).
hemoglobin subunit epsilon-2 [Bos taurus] Length=147
GENE ID: 513240 HBE2 | globin, beta, epsilon 2 [Bos taurus] (10 or fewer PubMed links)
Score = 98.6 bits (244), Expect = 1e-19, Method: Compositional matrix adjust. Identities = 51/145 (36%), Positives = 79/145 (55%), Gaps = 8/145 (5%)
Query |
3 |
LSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSH------GSAQV |
56 |
|||||
Sbjct |
4 |
+ + V + W KV |
G E+L R+ + |
P T+ +F F + |
G+ +V |
61 |
||
FTTEENVAVASLWAKVNVEV--VGGESLARLLIVCPWTQRFFDSFGNLYSESAIMGNPKV |
||||||||
Query |
57 |
KGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPA |
116 |
|||||
Sbjct |
62 |
K +G+KV ++ |
NA+ H+DD+ |
+ LS+LH |
KL VDP NF+LL + +L+ LA H |
121 |
||
KVYGRKVLNSFGNAIKHMDDLKGTFADLSELHCDKLHVDPENFRLLGNMILIVLATHFSK |
||||||||
Query |
117 |
EFTPAVHASLDKFLASVSTVLTSKY |
141 |
|
|
|
||
Sbjct |
122 |
EFTP + A+ K |
+V+ |
LT KY |
146 |
|
|
|
EFTPQMQAAWQKLTNAVANALTHKY |
|
|
|
|||||
50
Выравнивание 24 с гемоглобином альфа Rattus norvegicus (Серая крыса).
hemoglobin, gamma A [Rattus norvegicus] Length=147
GENE ID: 94164 Hbg1 | hemoglobin, gamma A [Rattus norvegicus] (10 or fewer PubMed links)
Score = 97.8 bits (242), Expect = 3e-19, Method: Compositional matrix adjust. Identities = 52/145 (36%), Positives = 83/145 (58%), Gaps = 8/145 (5%)
Query |
3 |
LSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF-DLSH-----GSAQV |
56 |
||||
Sbjct |
4 |
+ +K |
+ + W KV |
+ G E L R+ + +P T+ +F F +LS |
G+ ++ |
61 |
|
FTAEEKAAIISIWEKVDLE--KIGGETLGRLLIVYPWTQRFFDKFGNLSSALAIMGNPRI |
|||||||
Query |
57 |
KGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPA |
116 |
||||
Sbjct |
62 |
+ HGKKV |
+L +AV ++D++ |
+ LS+LH KL VDP NFKLL + L++ L+ H |
121 |
||
RAHGKKVLTSLGSAVENMDNLKETFAHLSELHCDKLHVDPQNFKLLGNMLVIVLSTHFAK |
|||||||
Query |
117 |
EFTPAVHASLDKFLASVSTVLTSKY |
141 |
|
|
||
Sbjct |
122 |
EFTP V A+ K + |
V+ L+ KY |
146 |
|
|
|
EFTPEVQAAWQKLVMGVANALSHKY |
|
|
|||||
Выравнивание 25 с бэта-глобином Salmo salar (Сёмга).
beta-globin [Salmo salar] Length=147
GENE ID: 100136584 LOC100136584 | beta-globin [Salmo salar] (10 or fewer PubMed links)
Score = 96.3 bits (238), Expect = 7e-19, Method: Compositional matrix adjust. Identities = 54/142 (39%), Positives = 82/142 (58%), Gaps = 8/142 (5%)
Query |
6 |
ADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF-DLS-----HGSAQVKGH |
59 |
||||
Sbjct |
7 |
A+K+ + A WGKV |
+ E G |
AL R+ + +P T+ YF F D+S |
G+ +V H |
64 |
|
AEKSTISAVWGKVDIN--EVGPLALARVLIVYPWTQRYFGSFGDVSTPAAIMGNPKVAAH |
|||||||
Query |
60 |
GKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFT |
119 |
||||
Sbjct |
65 |
GK V |
AL AV ++ ++ |
+LS+ HA+KL VDP NF++L+ |
L + +AA A FT |
124 |
|
GKVVCGALDKAVKNMGNILATYKSLSETHANKLFVDPDNFRVLADVLTIVIAAKFGASFT |
|||||||
Query |
120 |
PAVHASLDKFLASVSTVLTSKY |
141 |
|
|
||
Sbjct |
125 |
P + A+ |
KF+ V |
+ S+Y |
146 |
|
|
PEIQATWQKFMKVVVAAMGSRY |
|
|
|||||
Выравнивание 26 с субъединицей бэта-Н1 гемоглобина Mus musculus (Мышь домовая).
hemoglobin subunit beta-H1 [Mus musculus] Length=147
51
GENE ID: 15132 Hbb-bh1 | hemoglobin Z, beta-like embryonic chain [Mus musculus]
(Over 10 PubMed links)
Score = 95.5 bits (236), Expect = 1e-18, Method: Compositional matrix adjust. Identities = 51/145 (36%), Positives = 81/145 (56%), Gaps = 8/145 (5%)
Query |
3 |
LSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF-DLSH-----GSAQV |
56 |
|||||
Sbjct |
4 |
+ +K |
+ + W KV |
+ G E L R+ + +P T+ +F F +LS |
G+ ++ |
61 |
||
FTAEEKAAITSIWDKVDLE--KVGGETLGRLLIVYPWTQRFFDKFGNLSSALAIMGNPRI |
||||||||
Query |
57 |
KGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPA |
116 |
|||||
Sbjct |
62 |
+ HGKKV |
+L |
V ++D++ |
+ LS+LH KL VDP NFKLL + L++ L+ H |
121 |
||
RAHGKKVLTSLGLGVKNMDNLKETFAHLSELHCDKLHVDPENFKLLGNMLVIVLSTHFAK |
||||||||
Query |
117 |
EFTPAVHASLDKFLASVSTVLTSKY |
141 |
|
|
|||
Sbjct |
122 |
EFTP V A+ |
K + |
V+ L+ KY |
146 |
|
|
|
EFTPEVQAAWQKLVIGVANALSHKY |
|
|
||||||
Выравнивание 27 с субъединицей бэта гемоглобина Equus caballus (Лошадь домашняя).
hemoglobin subunit beta [Equus caballus] Length=147
GENE ID: 100054109 HBB | hemoglobin, beta [Equus caballus] (10 or fewer PubMed links)
Score = 95.1 bits (235), Expect = 2e-18, Method: Compositional matrix adjust. Identities = 62/145 (43%), Positives = 84/145 (58%), Gaps = 8/145 (5%)
Query |
3 |
LSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF-DLSH-----GSAQV |
56 |
|||||
Sbjct |
4 |
LS +K |
V A W KV |
E G EAL R+ + +P T+ +F F DLS+ |
G+ +V |
61 |
||
LSGEEKAAVLALWDKVNEE--EVGGEALGRLLVVYPWTQRFFDSFGDLSNPGAVMGNPKV |
||||||||
Query |
57 |
KGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPA |
116 |
|||||
Sbjct |
62 |
K HGKKV |
+ |
V H+D++ |
|
+ALS+LH KL VDP NF+LL + L+V LA H |
121 |
|
KAHGKKVLHSFGEGVHHLDNLKGTFAALSELHCDKLHVDPENFRLLGNVLVVVLARHFGK |
||||||||
Query |
117 |
EFTPAVHASLDKFLASVSTVLTSKY |
141 |
|
|
|||
Sbjct |
122 |
+FTP + AS |
K +A V+ L |
KY |
146 |
|
|
|
DFTPELQASYQKVVAGVANALAHKY |
|
|
||||||
Выравнивание 28 с бэта-типом глобина эмбриона Oncorhynchus mykiss (Радужная форель).
embryonic beta-type globin [Oncorhynchus mykiss] Length=147
GENE ID: 100135791 LOC100135791 | embryonic beta-type globin [Oncorhynchus mykiss] (10 or fewer PubMed links)
Score = 94.0 bits (232), Expect = 4e-18, Method: Compositional matrix adjust.
52
Identities = 49/124 (40%), Positives = 72/124 (59%), Gaps = 6/124 (4%)
Query |
24 |
EYGAEALERMFLSFPTTKTYFPHFDLSHGSAQVKG------HGKKVADALTNAVAHVDDM |
77 |
|||
Sbjct |
23 |
+ G |
AL R + +P T+ YF +F + +A ++G |
HGK V |
L AV ++DD+ |
82 |
DVGPAALSRCLVVYPWTQRYFGNFGNLYNAAAIQGNPMVAAHGKTVLRGLDRAVKNMDDI |
||||||
Query |
78 |
PNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVL |
137 |
|||
Sbjct |
83 |
|
+ LS LH+ KLRVDP NF+LL+ CL + +AA + A+FT V + |
KFLA V + L |
142 |
|
KATYAELSVLHSEKLRVDPDNFRLLADCLTIVVAARMGADFTADVQGAFQKFLAVVVSSL |
||||||
Query |
138 |
TSKY |
141 |
|
|
|
Sbjct |
143 |
+Y |
146 |
|
|
|
GRQY |
|
|
|
|||
Выравнивание 29 с субъединицей бэта-4 гемоглобина Oncorhynchus mykiss (Радужная форель).
hemoglobin subunit beta-4 [Oncorhynchus mykiss] Length=148
GENE ID: 100136291 LOC100136291 | beta-globin [Oncorhynchus mykiss] (10 or fewer PubMed links)
Score = 90.1 bits (222), Expect = 6e-17, Method: Compositional matrix adjust. Identities = 54/142 (39%), Positives = 80/142 (57%), Gaps = 9/142 (6%)
Query |
7 |
DKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF-DLS-----HGSAQVKGHG |
60 |
|||||
Sbjct |
8 |
+++ + |
WGK+ |
E G +AL R+ + P T+ +F F +LS |
G+ V HG |
65 |
||
ERSAIVGLWGKISVD--EIGPQALARLLIVSPWTQRHFSTFGNLSTPAAIMGNPAVAKHG |
||||||||
Query |
61 |
KKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHL-PAEFT |
119 |
|||||
Sbjct |
66 |
K V |
L AV ++DD+ N |
+ALS +H+ KL VDP NF+LL+ C+ V +AA L PA F+ |
125 |
|||
KTVMHGLDRAVQNLDDIKNTYTALSVMHSEKLHVDPDNFRLLADCITVCVAAKLGPAVFS |
||||||||
Query |
120 |
PAVHASLDKFLASVSTVLTSKY |
141 |
|
|
|||
Sbjct |
126 |
+ |
KFLA V + L |
+Y |
147 |
|
|
|
ADTQEAFQKFLAVVVSALGRQY |
|
|
||||||
Выравнивание 30 с субъединицей бэта-1 гемоглобина Xenopus (Silurana) tropicalis (Водная лягушка силураны).
hemoglobin subunit beta-1 [Xenopus (Silurana) tropicalis] Length=147
GENE ID: 394453 hbg1 | hemoglobin, gamma A [Xenopus (Silurana) tropicalis] (10 or fewer PubMed links)
Score = 86.7 bits (213), Expect = 6e-16, Method: Compositional matrix adjust. Identities = 47/146 (33%), Positives = 77/146 (53%), Gaps = 10/146 (6%)
Query |
3 |
LSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF-DLS------HGSAQ 55 |
||
Sbjct |
4 |
L+ ++ + W K+ A |
G +AL M ++P T+ YF F +LS |
H +A |
LTAKERQLITGTWSKICAKT--LGKQALGSMLYTYPWTQRYFSSFGNLSSIEAIFHNAA- 60 |
||||
|
|
|
53 |
|
Query |
56 |
VKGHGKKVADALTNAVAHVDDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLP |
115 |
|||
Sbjct |
61 |
V HG+KV ++ |
A+ H+DD+ |
+ LS H+ L VDP NFK |
C ++++A L |
120 |
VATHGEKVLTSIGEAIKHMDDIKGYYAQLSKYHSETLHVDPYNFKRFCSCTIISMAQTLQ |
||||||
Query |
116 |
AEFTPAVHASLDKFLASVSTVLTSKY |
141 |
|
|
|
Sbjct |
121 |
+FTP + A+ +K |
A+++ L Y |
146 |
|
|
EDFTPELQAAFEKLFAAIADALGKGY |
|
|
||||
Выравнивание 31 с гемоглобином бэта эмбриональным-2 Danio rerio (Данио рерио, аквариумная рыбка).
hemoglobin beta embryonic-2 [Danio rerio] Length=147
GENE ID: 405772 hbbe2 | hemoglobin beta embryonic-2 [Danio rerio] (10 or fewer PubMed links)
Score = 86.3 bits (212), Expect = 8e-16, Method: Compositional matrix adjust. Identities = 48/124 (39%), Positives = 72/124 (59%), Gaps = 6/124 (4%)
Query |
24 |
EYGAEALERMFLSFPTTKTYFPHF-DLSHGSA-----QVKGHGKKVADALTNAVAHVDDM |
77 |
||||
Sbjct |
23 |
E G +AL+R + +P T+ YF F +L + A |
+V HG |
V |
L A+ ++DD+ |
82 |
|
EAGPKALQRALIVYPWTQRYFGSFGNLYNAEAIINNPKVAAHGTVVLHGLDRAMKNMDDI |
|||||||
Query |
78 |
PNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAHLPAEFTPAVHASLDKFLASVSTVL |
137 |
||||
Sbjct |
83 |
N |
+ LS LH+ KL VDP NF+LL+ CL + +A+ + A FT |
+ A+ |
KFLA V + L |
142 |
|
KNTYAELSVLHSEKLHVDPDNFRLLADCLTIVIASTMGAAFTADMQAAWQKFLAVVVSAL |
|||||||
Query |
138 |
TSKY |
141 |
|
|
|
|
Sbjct |
143 |
+Y |
146 |
|
|
|
|
QRQY |
|
|
|
|
|||
Выравнивание 32 с белком LOC417972 Gallus gallus (Банкивский петух).
hypothetical protein LOC417972 [Gallus gallus] Length=151
GENE ID: 417972 GBE | eye-globin [Gallus gallus] (10 or fewer PubMed links)
Score = 83.2 bits (204), Expect = 6e-15, Method: Compositional matrix adjust. Identities = 50/151 (34%), Positives = 77/151 (51%), Gaps = 13/151 (8%)
Query |
1 |
MVLSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF------DLSHGSA |
54 |
|||||||
Sbjct |
1 |
M |
S A+ |
+ + AW K+ |
A + G |
L RMF P TK+YF HF |
+ |
S |
60 |
|
MSFSEAEVQSARGAWEKMYVDAEDNGTAVLVRMFTEHPDTKSYFTHFKGMDSAEEMKQSD |
||||||||||
Query |
55 |
QVKGHGKKVADALTNAVAHVDDMPNALSALSDL---HAHKLRVDPVNFKLLSHCLLVTLA |
111 |
|||||||
Sbjct |
61 |
QV+GHGK+V |
A+ + V H+D+ |
L L+ L |
HA +L++DP NF+++ |
|
+L |
118 |
||
QVRGHGKRVFTAINDMVQHLDNTEAFLGILNPLGQKHATQLKIDPKNFRIICDIILQL-- |
||||||||||
Query |
112 |
AHLPAEFTPAVHASLDKFLASVSTVLTSKYR |
142 |
|
|
|
||||
Sbjct |
119 |
+ |
+F |
AS +K |
+ T LT+ Y+ |
147 |
|
|
|
|
--MEEKFGGDCKASFEKVTNEICTHLTNIYK |
|
|
|
|||||||
54
Выравнивание 33 с цитоглобином-2 Danio rerio (Данио рерио, аквариумная рыбка).
cytoglobin-2 [Danio rerio] Length=179
GENE ID: 554176 cygb2 | cytoglobin 2 [Danio rerio] (10 or fewer PubMed links)
Score = 80.9 bits (198), Expect = 4e-14, Method: Compositional matrix adjust. Identities = 48/149 (33%), Positives = 78/149 (53%), Gaps = 11/149 (7%)
Query |
3 |
LSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF-DLS-----HGSAQV |
56 |
||||
Sbjct |
19 |
L+ ++ +K |
W +V A + G |
L R F++FP+ K YF F D+ |
S+Q+ |
78 |
|
LTDVERGIIKDTWARVYASCEDVGVTILIRFFVNFPSAKQYFSQFQDMEDPEEMEKSSQL |
|||||||
Query |
57 |
KGHGKKVADALTNAVAHVDDMPNALSALSDL----HAHKLRVDPVNFKLLSHCLLVTLAA |
112 |
||||
|
|
+ H ++V +A+ |
V ++ D P |
+S++ L |
HA K +V+PV FK+LS +L |
LA |
|
Sbjct 79 RKHARRVMNAINTVVENLHD-PEKVSSVLVLVGKAHAFKYKVEPVYFKILSGVILEILAE 137
Query 113 HLPAEFTPAVHASLDKFLASVSTVLTSKY 141
FTP V S K +A++ +T Y
Sbjct 138 EFGECFTPEVQTSWSKLMAALYWHITGAY 166
Выравнивание 34 с цитоглобином Xenopus laevis (Обыкновенная шпорцевая лягушка).
cytoglobin [Xenopus laevis] Length=179
GENE ID: 447575 cygb | cytoglobin [Xenopus laevis] (10 or fewer PubMed links)
Score = 77.0 bits (188), Expect = 5e-13, Method: Compositional matrix adjust. Identities = 42/149 (29%), Positives = 77/149 (52%), Gaps = 9/149 (6%)
Query |
3 |
LSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFD------LSHGSAQV |
56 |
|||||
Sbjct |
19 |
++ +++ +K W +V A+ |
+ G |
L R F++FP+ K +F F |
GS Q+ |
78 |
||
ITESERGVIKETWARVYANCEDVGVSILIRFFVNFPSAKQHFSQFKHMEDPLEMEGSVQL |
||||||||
Query |
57 |
KGHGKKVADALTNAVAHVDD---MPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAH |
113 |
|||||
Sbjct |
79 |
+ HG++V |
A+ + V ++ D |
+ |
LS + |
HA K +V+PV FK+L+ |
+L A |
138 |
RKHGRRVMGAVNSVVENLGDPEKVTTVLSIVGKSHALKHKVEPVYFKILTGVMLEVFAEE |
||||||||
Query |
114 |
LPAEFTPAVHASLDKFLASVSTVLTSKYR |
142 |
|
|
|||
Sbjct |
139 |
+FTP V |
+K + + + + S Y+ |
167 |
|
|
||
YAKDFTPDVQLVWNKLRSLIYSHVQSAYK |
|
|
||||||
Выравнивание 35 с цитоглобином Gallus gallus (Банкивский петух).
cytoglobin [Gallus gallus] Length=179
GENE ID: 427802 CYGB | cytoglobin [Gallus gallus] (10 or fewer PubMed links)
55
Score = 76.6 bits (187), Expect = 6e-13, Method: Compositional matrix adjust. Identities = 44/149 (30%), Positives = 76/149 (52%), Gaps = 9/149 (6%)
Query |
3 |
LSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFD------LSHGSAQV |
56 |
|||||
Sbjct |
19 |
+S A+K |
++ |
W +V A+ |
+ G L R F++FP+ K YF F |
S Q+ |
78 |
|
ISDAEKKVIQETWSRVYANCEDVGVSILIRFFVNFPSAKQYFSQFKHMDDTLEMERSLQL |
||||||||
Query |
57 |
KGHGKKVADALTNAVAHVDD---MPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAH |
113 |
|||||
Sbjct |
79 |
+ H ++V |
A+ |
V ++DD + + L+ + |
HA K +V+PV FK L+ +L |
+A |
138 |
|
RKHAQRVMGAINTVVENLDDPEKVSSVLALVGKAHALKHKVEPVYFKKLTGVMLEVIAEA |
||||||||
Query |
114 |
LPAEFTPAVHASLDKFLASVSTVLTSKYR |
142 |
|
|
|||
Sbjct |
139 |
+FTP |
H + |
K |
+ T +T+ Y+ |
167 |
|
|
YGNDFTPEAHGAWTKMRTLIYTHVTAAYK |
|
|
||||||
Выравнивание 36 с цитоглобином Xenopus (Silurana) tropicalis (Водная лягушка силураны).
cytoglobin [Xenopus (Silurana) tropicalis] Length=179
GENE ID: 448640 cygb | cytoglobin [Xenopus (Silurana) tropicalis] (10 or fewer PubMed links)
Score = 76.3 bits (186), Expect = 7e-13, Method: Compositional matrix adjust. Identities = 42/149 (29%), Positives = 78/149 (53%), Gaps = 9/149 (6%)
Query |
3 |
LSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFD------LSHGSAQV |
56 |
||||||
Sbjct |
19 |
++ +++ |
+K |
W +V A+ |
+ G |
L R F++FP+ K +F F |
GS Q+ |
78 |
|
ITESERGVIKETWARVYANCEDVGVSILIRFFVNFPSAKQHFSQFKHMEDPLEMEGSVQL |
|||||||||
Query |
57 |
KGHGKKVADALTNAVAHVDD---MPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAH |
113 |
||||||
Sbjct |
79 |
+ H ++V |
A+ + V ++ D |
+ |
LS + |
HA K +VDPV FK+L+ |
+L +A |
138 |
|
RKHARRVMGAVNSVVENLGDPEKITTVLSIVGKSHALKHKVDPVYFKILTGVMLEVIAEE |
|||||||||
Query |
114 |
LPAEFTPAVHASLDKFLASVSTVLTSKYR |
142 |
|
|
||||
Sbjct |
139 |
+FTP V |
+ +K + + + + S Y+ |
167 |
|
|
|||
YAKDFTPDVQLAWNKLRSHLYSHVLSAYK |
|
|
|||||||
Выравнивание 37 с цитоглобином Oncorhynchus mykiss (Радужная форель).
cytoglobin [Oncorhynchus mykiss] Length=177
GENE ID: 100136084 cygb | cytoglobin [Oncorhynchus mykiss]
Score = 75.9 bits (185), Expect = 1e-12, Method: Compositional matrix adjust. Identities = 42/140 (30%), Positives = 70/140 (50%), Gaps = 9/140 (6%)
Query |
3 |
LSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHFDLSHG------SAQV |
56 |
|
Sbjct |
19 |
L +++ +K W KV + + G L R+F++FP++K YF F |
SAQ+ |
78 |
LCDSEREMIKDTWAKVYQNCDDVGVAILIRLFVNFPSSKQYFSQFQQVEDPGELERSAQL |
||||
56
Query |
57 |
KGHGKKVADALTNAVAHV---DDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAH |
113 |
||
Sbjct |
79 |
+ H ++V +A+ |
V ++ |
D M + L + HA + V+PV FK+L +L L A |
138 |
RKHSRRVMNAINTLVENLHDGDKMVSVLKLVGKAHALRHNVEPVYFKILCGVILEVLVAD |
|||||
Query |
114 |
LPAEFTPAVHASLDKFLASV |
133 |
|
|
Sbjct |
139 |
P TP V + |
K L ++ |
158 |
|
FPDYITPEVAVAWTKLLDAI |
|
||||
Выравнивание 38 с цитоглобином-2 Oryzias latipes (Медака, рыбка семейства оризиевых).
cytoglobin-2 [Oryzias latipes] Length=194
GENE ID: 100049377 cygb-2 | cytoglobin-2 [Oryzias latipes] (10 or fewer PubMed links)
Score = 74.3 bits (181), Expect = 3e-12, Method: Compositional matrix adjust. Identities = 44/148 (30%), Positives = 75/148 (51%), Gaps = 9/148 (6%)
Query |
3 |
LSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF-DLS-----HGSAQV |
56 |
|||
Sbjct |
34 |
LS A+ ++ |
WG V + |
+ G L R F++FP+ K YF F D+ |
S+Q+ |
93 |
LSDAEMEIIQHTWGHVYKNCEDVGVSVLIRFFVNFPSAKQYFSQFQDMQDPEEMEKSSQL |
||||||
Query |
57 |
KGHGKKVADALTNAVAHVDD---MPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAH |
113 |
|||
|
|
+ H ++V +A+ |
V ++ D |
+ + L+ + HA K +V+P+ FK+ S +L |
L+ |
|
Sbjct |
94 |
RQHARRVMNAINTVVENLQDPEKVSSVLALVGKAHAVKHKVEPIYFKIXSGVMLSVLSED 153 |
||
Query |
114 |
LPAEFTPAVHASLDKFLASVSTVLTSKY |
141 |
|
Sbjct |
154 |
P FT V |
K +A+V +T Y |
181 |
FPEFFTAEVQLVWTKLMAAVYWHVTGAY |
||||
Выравнивание 39 с цитоглобином-1 Danio rerio (Данио рерио, аквариумная рыбка).
cytoglobin-1 [Danio rerio] Length=174
GENE ID: 246090 cygb1 | cytoglobin 1 [Danio rerio] (10 or fewer PubMed links)
Score = 72.4 bits (176), Expect = 1e-11, Method: Compositional matrix adjust. Identities = 46/149 (31%), Positives = 72/149 (49%), Gaps = 10/149 (6%)
Query |
3 |
LSPADKTNVKAAWGKVGAHAGEYGAEALERMFLSFPTTKTYFPHF-DLS-----HGSAQV |
56 |
||||
Sbjct |
16 |
L+ D ++ W |
V A |
G L R F +FP+ K YF HF +L |
+AQ+ |
75 |
|
LTEEDVCVIQDTWKPVYAERDNAGVAVLVRFFTNFPSAKQYFEHFRELQDPAEMQQNAQL |
|||||||
Query |
57 |
KGHGKKVADALTNAVAHV---DDMPNALSALSDLHAHKLRVDPVNFKLLSHCLLVTLAAH |
113 |
||||
Sbjct |
76 |
K HG++V +AL |
V ++ |
D + |
+ + HA + +VDPV FK+L+ +L |
L |
135 |
KKHGQRVLNALNTLVENLRDADKLNTIFNQMGKSHALRHKVDPVYFKILAGVILEVLVEA |
|||||||
57
Query |
114 |
LPAEFTPA-VHASLDKFLASVSTVLTSKY |
141 |
Sbjct |
136 |
P F+PA V +S K + + + Y |
164 |
FPQCFSPAEVQSSWSKLMGILYWQMNRVY |
КОНТРОЛЬНЫЕ ВОПРОСЫ
1.Какие существуют два метода количественного измерения расстояния между двумя данными строками последовательностей?
2.Какие бывают виды штрафов за делеции?
3.Что такое матрица РАМ?
4.Чему соответствует расстояние между последовательностями в 1 РАМ?
5.Показать, чему равна вероятность мутации замены V↔M,если в матрице РАМ250 соответствующая цена мутации равна +2?
6.В чём отличие принципа построения матриц BLOSUM от РАМ?
7.Для выравнивания №39 альфа-субъединицы гемоглобина человека HBA_HUMAN с цитоглобином-1 Danio rerio вычислить с помощью матрицы BLOSUM80 и аффинного штрафа за
пропуски γ(g) = −d −(g −1)e (при d =8 и e = 4) счёт следующего фрагмента выравнивания
GAEALERMFLSFPTTKTYFPHF-DLS-----HGSAQV
GVAVLVRFFTNFPSAKQYFEHFRELQDPAEMQQNAQL
3.АЛГОРИТМЫ ВЫРАВНИВАНИЯ
3.1.АЛГОРИТМ ДИНАМИЧЕСКОГО ПРОГРАММИРОВАНИЯ
Алгоритм глобального оптимального выравнивания двух последо-
вательностей, дающий максимальное количество баллов (максимальный вес (счёт, score)) основан на математическом методе, называемом динами-
ческим программированием.
58
Основное достоинство этого метода состоит в том, что он гарантирует глобальный оптимум: наилучший результат выравнивания при заданном наборе параметров – матрице замещений и штрафных значениях для пропусков – без каких-либо приближений.
Основной недостаток метода состоит в том, что многие выравнивания двух данных последовательностей могут привести к оптимальному числу баллов, при этом совершенно не обязательно, что хотя бы одно из них имеет отношение к биологически корректному выравниванию (имеет биологический смысл). Например, при сравнении последовательностей α- и β-цепей гемоглобина цыпленка В. Фитч и Т. Смит (W. Fitch и T. Smith) нашли 17 выравниваний, каждое давало одинаковое оптимальное число баллов, из которых корректным, (используя дополнительную информацию о пространственной структуре белков) оказалось только одно. И вообще, оказалось, что для этой задачи существует 1317 выравниваний, которые дают число баллов в пределах 5% от оптимума.
Есть еще один недостаток – время, требуемое для выравнивания двух последовательностей длиной п и т пропорционально размеру редактируемой матрицы, то есть, пропорционально произведению m ×n . Вычислительную сложность алгоритма обозначают O( f ) . Поскольку обычно п и т одного порядка, про алгоритм говорят, что он требует
O(n2 ) времени (или памяти). В области анализа биологических после-
довательностей обычными компьютерами (а не суперкомпьютерами)
алгоритмы O(n2 ) дают удовлетворительные результаты, а вот алгоритмы
O(n3 ) возможно применять только для очень коротких последователь-
ностей.
Таким образом, метод динамического программирования будет слишком медленным при поиске соответствия для пробной последовательности в полной базе данных последовательностей, и ещё меньше он подходит для выравниваний "все-против-всех". Проблема поиска в базе данных – это на самом деле проблема поиска соответствия
59