斯克里普斯研究中心的科学家们采用了一种通常用于确定油井最佳位置的计算方法,以帮助设计针对囊性纤维化(CF)等罕见遗传疾病的潜在新疗法。通过使用该方法分析蛋白质不同变体之间的空间关系(而不是整个景观中的测试井之间的关系),研究人员发现他们可以获得有关疾病如何影响蛋白质的基本形状以及药物如何恢复的有价值的信息。那个形状正常。
新方法只需要从患有这种疾病的人身上收集的少量基因序列。然后,它确定每个相应蛋白质变体的结构如何与其功能相关,以及该功能结构如何影响病理学并通过治疗进行修复。为了展示其实用性,斯克里普斯研究小组使用该方法来说明为什么现有的CF药物无法治愈该疾病。
“这是治疗罕见疾病的重要一步,”资深作者、斯克里普斯研究中心分子医学教授威廉·巴尔奇博士说。“我们可以从几个基因序列中获得如此多的信息,这确实是前所未有的。”
Balch与同事ChaoWang博士和FrédéricAnglès博士在《Structure》杂志上发表了一篇题为“对人群中的变异进行三角测量以定义遗传疾病精确管理机制”的论文,报告了他们的研究。
作者写道,变异是推动生物学进化和多样性的基础。“……了解人群中的遗传变异对于揭示野生型(WT)蛋白质折叠的功能机制至关重要,当野生型蛋白质折叠受到变异破坏时,会强烈影响个体的疾病易感性和临床表现。
对遗传性疾病的研究通常依赖于确定受疾病影响的蛋白质的精确三维形状的技术。但遗传病可能是由同一基因的数十个甚至数百个或数千个不同变体引起的。其中一些变体会破坏蛋白质的稳定性或改变蛋白质的形状,从而使分离蛋白质以进行进一步研究比平常更加困难。
巴尔奇与斯克里普斯研究中心的高级科学家王和科学家安格莱斯希望利用自然变异来发挥自己的优势。对于人类基因组中的大多数基因来说,人类群体中存在着许多变异体;其中一些变异会导致疾病,而另一些变异对生物学影响很小并且不会被注意到。该团队此前曾表明,有助于蛋白质序列多样性的遗传多样性可以通过“变异空间分析”(VSP)来构建,这使得人们能够更好地理解驱动蛋白质功能的“序列与结构”关系折叠。他们解释说,VSP应用一种称为高斯过程回归(GPR)的概率机器学习工具来构建基于生物系统中空间协方差(SCV)的“表型景观”。
在此基础上,该团队新开发的变异捕获(VarC)图谱分析了基因序列的自然排列,并确定了每种改变蛋白质结构导致疾病的机制。Balch的团队将GPR机器学习和统计工具集成到VarC中,该工具仅需要几个基因序列,让研究人员能够确定每个导致疾病的变异的最有可能的驱动功能的结构机制,并模拟药物如何影响这些结构功能。
他们指出:“为了从机制上理解治疗方法如何塑造蛋白质折叠,从而为疾病的精确管理提供信息,我们开发了VarC图谱。”“VarC使用基于GPR的机器学习对人群中发现的稀疏序列变异信息进行三角测量,以定义有助于个体响应治疗的动态蛋白质功能的组合成对残基相互作用。”
为了证明该系统的实用性,研究人员将VarC映射应用于CF,这是一种由囊性纤维化跨膜电导调节器(CFTR)基因的遗传变异引起的疾病,会导致肺部粘液积聚。患者数据库中已鉴定并描述了超过2,000个CFTR基因变体。研究人员知道,其中许多变异对CFTR蛋白具有截然不同的影响,但很难比较和对比这些变异,以指导如何在临床上对具有不同变异的患者进行不同的治疗。
“当你想要治疗患者时,你真的必须意识到不同的治疗方法可能以完全不同的方式针对不同的变异,这就是为什么我们同时研究许多不同变异的方法如此强大,”王说。“我们的方法不仅揭示了这些变异如何对每个患者的生物学做出贡献,而且还以一种方式将它们连接起来,使每个变异都可以指导如何管理其他变异。”
研究人员将CF群体中发现的约60个遗传变异的信息输入到他们的VarC程序中。计算分析捕获了每个氨基酸残基如何与其他残基对话以产生功能,并揭示了对于大多数CF患者来说,蛋白质存在相同的净效应:不稳定的内核。
当斯克里普斯研究小组随后使用该程序来模拟现有的CF药物如何影响结构时,他们发现,尽管这些药物以不同的方式影响CFTR蛋白,但它们都没有有效地稳定隐藏在视野之外的蛋白质内核,就像测试井揭示的复杂地貌中的油藏。
“使用SCV原则方法,其中来自世界各地人口的稀疏变异输入集合可以通过GPR进行解释,以产生跨越整个蛋白质折叠的序列到功能到结构关系的定量视图作为输出,我们有发现了CFTR折叠的一个关键能量核心,它对CFTR功能至关重要,但目前的治疗方法对其影响微弱,”该团队指出。
Balch及其同事表示,随着对CF患者CFTR的结构缺陷有了更好的了解,开发有效药物的工作将会容易得多。可以在实验室实验之前对潜在化合物对CFTR蛋白内核的影响进行建模。
“在大多数药物发现中,你会在蛋白质上投入数千种化合物,然后看看哪些化合物会改变它,但通常并没有完全理解其机制,”巴尔奇说。“要解决一件事,你必须首先了解问题所在。”
Balch表示,CF并不是他们的VarC方法可能解决的唯一疾病。任何遗传疾病都可以用同样的方式进行分析,利用人群中发现的患者变异的知识以及每种变异引发的症状信息。“我们真的认为我们可以对任何蛋白质做到这一点,”巴尔奇说。“这是一条针对罕见疾病药物发现的快车道,而过去这些疾病的研究非常困难且缓慢。”
他们认为,VarC有效地将基因组变异与群体中的蛋白质组功能联系起来,提供了一种通用工具,可以对群体中遗传变异的信息进行三角测量,从而机械地发现指导个体精准管理的治疗策略。研究小组得出结论:“这些结果表明,VarC通过基于GPR的动态协方差矩阵,提供了一种新工具来描述在人类遗传疾病中受损的序列、功能和结构关系。VarC提供了一种与仅预测结构的算法不同的新方法,因为VarC作为一种基于基因组的工具,可以捕获由发现的物理、化学和/或细胞生物学特性构成的折叠本机功能背景下的结构关系在不断发展的人类群体中。”
该团队已经将该方法应用于其他罕见遗传病,并寻求治疗CF的新药。