您的位置:首页 >百科快讯 >

简化药物靶标的搜索

时间我们体内的数以千计的蛋白质可能会导致疾病,但最具挑战性的问题之一是找出哪些药物可以针对它们。在实验室环境中测试蛋白质和药物对既耗时又昂贵,并且计算模拟需要大量计算机和复杂的计算。麻省理工学院的计算生物学家罗希特·辛格(RohitSingh)表示:“这还无法扩展到可以扫描整个基因组或大型[药物]化合物库的水平。”

这些挑战促使Singh和麻省理工学院计算生物学家SamuelSledzieski开发一种更简单的计算方法来预测药物和蛋白质是否结合。他们的方法称为ConPlex,最近发表在《美国国家科学院院刊》上。1与使用3D蛋白质结构模型的更复杂方法不同,ConPlex仅需要蛋白质序列和候选药物的简单描述。

研究人员首先将蛋白质序列输入蛋白质语言模型,该模型的灵感来自于日益常见的文本生成算法,例如自动填充或ChatGPT。2“[文本算法]基本上只是根据之前发生的事情来预测下一件事应该是什么,”Sledzieski说。“这些算法的这些特性非常适合蛋白质,因为它们也是线性链。”文本算法使用大量文本数据来预测句子的其余部分或回答问题,而蛋白质语言模型则使用有关数百万个蛋白质序列的信息来识别可以预测蛋白质特性的关键特征。3

然后,研究人员构建了ConPlex,这是一种机器学习算法,其他科学家可以使用该算法根据蛋白质语言模型提取的关键特征和一组已知的蛋白质-药物相互作用来预测药物是否会与蛋白质结合。ConPlex还整合了已知不与蛋白质结合的药物的信息,尽管它们看起来与确实结合的药物相似,因此该模型可以识别可能促进结合的微妙特征。研究人员发现,即使在预测模型以前未遇到过的新药物或蛋白质的结合时,ConPlex也快速而准确。

在未来的迭代中,Singh和Sledzieski希望将更多元素纳入模型中,例如多种药物如何相互作用以及突变对药物靶标结合的影响。中佛罗里达大学计算机科学家OzlemGaribay并未参与这项研究,他也同意有关蛋白质的更多细节可以进一步提高性能。“简单可以成为一种力量,”她说。“但它可能在这里受到限制,因为[蛋白质]是三维结构。”

研究人员已在网上免费提供ConPlex,供科学家用来寻找针对蛋白质的新药物,或识别可重新用于针对其他疾病的蛋白质的现有药物。Sledzieski表示,虽然ConPlex不会就某种药物是否有效给出最终决定,但它可以优先考虑有希望的候选药物进行进一步研究。

ConPlex甚至可能在临床试验中发挥作用,因为它可以预测潜在的脱靶结合,从而导致不良副作用。“药物[在临床试验中]的失败率非常高,”辛格说。“你越早将脱靶效应建模到你的计算管道中,你就越早可以说‘这种药物看起来很有趣,但它不是一个好主意。’”

免责声明:本文由用户上传,如有侵权请联系删除!