元素百科介绍科学家预测蛋白质相互作用的计算方法。蛋白质相互作用研究可以从分子水平上揭示蛋白质的功能,有助于揭示细胞活动的规律,如生长发育、新陈代谢、分化和凋亡。在全基因组范围内识别蛋白质的相互作用是解释细胞调节机制的重要一步。随着蛋白质相互作用实验技术的发展,人们可以获得大量的蛋白质相互作用数据,甚至分析整个基因组中的蛋白质相互作用。然而,由于实验技术的限制,许多高通量实验方法测得的蛋白质相互作用数据的错误率相对较高。此外,传统的实验方法不适用于检测大规模数据。

针对这一科学问题,中国科学院新疆物理化学技术研究所多语种信息技术研究室硕士生王延斌在系统研究的指导下,提出了一种利用蛋白质序列信息预测蛋白质相互作用的计算方法。为了获得重要的蛋白质信息,研究人员首先使用位置对矩阵进行评分(PSSM)表示每一个蛋白质序列。研究发现,打分矩阵的表示方法不仅保留了序列的位置信息,还保留了蛋白质的化学信息。同时,为了开发PCVMZM预测模型,研究人员首先从不同规模的PSSM评分矩阵中提取准确、有代表性的蛋白质信息,并将每个信息表示为特征向量,并使用强分类器来预测蛋白质的交互。
研究结果表明,该方法提供了准确、稳定、高覆盖率的预测信息,为基因组学研究提供了有用的决策工具。研究结果发表在《国际分子科学杂志》上(International Journal of Molecular Sciences)发表至今约两个月,被引用23次。
基于上述研究成果,研究人员通过构建深度学习系统实现了更准确、更稳定的预测系统。实验结果表明,使用深度学习方法后,预测精度可提高2.2%,跨物种检测可实现。研究结果发表在《生物分子》中(Molecular Biosystems)上。

