小:蛋白质对接的流形优化算法

赞助单位:美国国家科学基金会(NSF)

奖励编号:1527292

PI:德米特罗·科扎科夫

合伙人/合伙人:Ioannis (Yannis) Ch. Paschalidis, Pirooz Vakili, Sandor Vajda

文摘:

蛋白质是细胞的主要组成部分。许多蛋白质通过与其他蛋白质相互作用来发挥功能。在一个典型的细胞中,会发生成千上万种不同的蛋白质相互作用。描述这些相互作用有助于阐明生物体在分子水平上的功能,有助于开发针对癌症等疾病的治疗方法,并促进新型生物灵感材料的设计。详细了解蛋白质相互作用机制需要确定蛋白质-蛋白质复合物的三维结构。这些结构很难用实验技术得到,因此,计算方法是非常有用的。Kozakov, Paschalidis, Vajda和Vakili团队开发的算法和软件,根据全球评估实验CAPRI(预测相互作用的关键评估),是预测蛋白质-蛋白质复合物结构的最佳算法和软件之一。这些方法已经在完全自动化的对接服务器ClusPro中实现,该服务器免费供学术使用,拥有超过10,000名固定用户。然而,目前的工具在计算上要求太高,无法服务于如此大的用户群或在基因组规模上模拟蛋白质相互作用。该项目的目标是使用严格的几何和生物物理原理,在保持生成模型准确性的同时,大幅提高对接算法的效率。更快地建立蛋白质复合物的模型将有助于更好地理解细胞和系统水平上的基本生物学问题,并将促进生化、生物医学和生物技术的澳门威尼斯人注册网站研究。此外,该方法还将用于澳门威尼斯人注册网站研究生的培养和本科生、高中生的教学中。

蛋白质对接问题是通过寻找基于能量的评分函数的全局最小值,计算确定由两个未结合的蛋白质组成的复合物的三维(3D)结构,给定它们各自的三维结构。如果其中一种蛋白质(被认为是受体)处于固定的位置和方向,则搜索空间包括另一种蛋白质(被认为是配体)的6D旋转/平移空间,以及代表两种蛋白质灵活性的额外自由度。由于能量函数具有大量被高势垒分隔的局部极小值,因此最小化问题极具挑战性。拟议的项目旨在利用该小组为对接协议的各个组件开发的创新的流形和基于优化的方法,以便(i)将算法建立在坚实的理论基础上,(ii)更严格地澳门威尼斯人注册网站研究它们的性能和行为,以及(iii)开发可应用于其他应用领域的算法的可推广特性。这项工作将集中在四个关键算法上。首先,将澳门威尼斯人注册网站研究流形上的快速傅立叶变换(MFFT),该方法能够在一个蛋白质相对于另一个蛋白质的刚体运动空间中进行全局系统搜索。本文将分析MFFT的计算复杂度,并进行不同带宽设置下的数值性能测试。其次,将探索基于低估的采样技术,作用于相同的流形,并针对中等范围搜索来完善MFFT解决方案。将开发和测试各种低估器。第三,开发基于流形的柔性蛋白优化局部优化方法。在每种情况下,将比较不同的流形参数化和不同的最小化方法。最后,利用马尔可夫随机场理论的原理,提出了一种新的侧链填充公式和蛋白质对接中出现的其他问题。在此背景下,将开发涉及最大权重独立集(MWIS)问题和广义信念传播的不同解决方法。所开发的算法将作为开源软件库发布,用于蛋白质对接和其他应用领域。

欲了解更多信息,请点击这里。