序列组装是生物资讯学中的一种分析方法。此方法通过序列比对和序列合并等演算,将短片段的DNA建构成为较长的连续序列。此技术的创立,是因为被测序的核酸分子通常长度都远大于目前存在的DNA测序技术。而此分析能试图从有限长度的DNA测序结果,重建出原本被测序分子的样貌。
多重序列比对是对三个以上的生物学序列,如蛋白质序列、DNA序列或RNA序列所作的序列比对。一般来说,是输入一组假定拥有演化关系的序列。从MSA的结果可推导出序列的同源性,而种系发生关系也可引导出这些序列共同的演化始祖。如右图般的视觉化叙述可描绘出各种突变事件,例如点突变的单格变化,或是如删除突变与插入突变,可使各个序列之间产生鸿沟。MSA常用来研究序列的保守序列,或是蛋白质结构域的三级结构与二级结构,甚至是个别的氨基酸或核苷酸。
BLOSUM打分矩阵是一种在生物信息学中用于序列比对的氨基酸替换打分矩阵。BLOSUM 是“blocks substitution matrix”的缩写。它是目前常用的一种氨基酸替换打分矩阵。BLOSUM打分矩阵最早由 Steven Henikoff. 和 J.G Henikoff在他们的论文中被提出。其中,他们从BLOCKS数据库中对那些在高度保守序列中的蛋白质家族进行观察测量进而整理出了氨基酸替换的概率。他们继续使用对数胜算来计算矩阵中的分值。与PAM打分矩阵相比,BLOSUM打分矩阵的内容皆由观察得出。在实际运用中,BLOSUM矩阵通常能获得更好的结果。
多重序列比对是对三个以上的生物学序列,如蛋白质序列、DNA序列或RNA序列所作的序列比对。一般来说,是输入一组假定拥有演化关系的序列。从MSA的结果可推导出序列的同源性,而种系发生关系也可引导出这些序列共同的演化始祖。如右图般的视觉化叙述可描绘出各种突变事件,例如点突变的单格变化,或是如删除突变与插入突变,可使各个序列之间产生鸿沟。MSA常用来研究序列的保守序列,或是蛋白质结构域的三级结构与二级结构,甚至是个别的氨基酸或核苷酸。
序列组装是生物资讯学中的一种分析方法。此方法通过序列比对和序列合并等演算,将短片段的DNA建构成为较长的连续序列。此技术的创立,是因为被测序的核酸分子通常长度都远大于目前存在的DNA测序技术。而此分析能试图从有限长度的DNA测序结果,重建出原本被测序分子的样貌。
Velvet是处理从头测序基因组计划及短读长序列比对的一个算法包。这是使用德布鲁因图通过消除错误和化简重复区域而来进行基因组序列组装。 Geneious、MacVector、BioNumerics等商业软件包的内部也实现了Velvet。