生物信息学利用应用数学、信息学、统计学和计算机科学的方法研究生物学的问题。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索、处理及利用。目前主要的研究方向有:序列比对、序列组装、基因识别、基因重组、蛋白质结构预测、基因表达、蛋白质反应的预测,以及建立进化模型。
Rosetta@home 是一个基于伯克利开放式网络计算平台的分布式计算项目,由西雅图华盛顿大学贝克实验室开发和维护,用于蛋白质结构预测、蛋白质-蛋白质对接和新的蛋白质设计的研究。截至2015年2月12日,全球共有5万多台计算机是这一项目的活跃志愿者,平均每秒浮点运算次数达87万亿。Rosetta@Home还开发了一款电子游戏Foldit,目的是通过众包途径来实现上述研究目标。尽管这个项目很大程度上侧重于进行提高蛋白质组学方法的精确性和稳固性的基础研究,它也进行一些关于艾滋病、疟疾、癌症、阿兹海默病以及其他疾病的病理学的应用研究。
蛋白质结构预测技术的关键测试是自1994年以来每两年进行一次的全球范围内的蛋白质结构预测竞赛,目的是更好预测和破解蛋白质三维结构。CASP为参赛者提供了一个测试其研发的蛋白质结构预测方法的机会。
生物信息学利用应用数学、信息学、统计学和计算机科学的方法研究生物学的问题。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索、处理及利用。目前主要的研究方向有:序列比对、序列组装、基因识别、基因重组、蛋白质结构预测、基因表达、蛋白质反应的预测,以及建立进化模型。
AlphaFold是Alphabet/Google旗下DeepMind开发的一款人工智能,做蛋白质结构预测。该程序被设计为一个深度学习系统。
生物信息学利用应用数学、信息学、统计学和计算机科学的方法研究生物学的问题。生物信息学的研究材料和结果就是各种各样的生物学数据,其研究工具是计算机,研究方法包括对生物学数据的搜索、处理及利用。目前主要的研究方向有:序列比对、序列组装、基因识别、基因重组、蛋白质结构预测、基因表达、蛋白质反应的预测,以及建立进化模型。
利文索尔佯谬是一个思想实验,也是蛋白质折叠理论中的一个自指。在1969年, 美国分子生物学家Cyrus Levinthal指出,由于在未折叠的多肽链中的非常大量的自由度,该分子具有天文数量的可能构象。在一篇论文中,他估计了3或10 。例如,一个由100个氨基酸残基组成的多肽,将具有99个肽键,并且因此具有198个不同的二面角键角。如果这些键角中的每一个可以是三个稳定构象之一,则蛋白质可错误折叠成最多达到3种不同构象。因此,如果蛋白质通过连续采样所有可能的构象而获得其正确折叠的构型,则需要比宇宙的年龄更长的时间以达到其正确的天然构象。即使以快速速率采样构象,这也是真的。 “悖论”是大多数小蛋白质在毫秒或甚至微秒时间尺度上同时折叠。这种悖论的解决方案已经通过蛋白质结构预测的计算方法建立。
蛋白质结构预测技术的关键测试是自1994年以来每两年进行一次的全球范围内的蛋白质结构预测竞赛,目的是更好预测和破解蛋白质三维结构。CASP为参赛者提供了一个测试其研发的蛋白质结构预测方法的机会。