生物多样性观测和研究越来越依赖于生物分子数据。这些数据的标准化,包括主要信息和上下文信息(元数据),对于实现数据(重新)使用、集成和知识生成至关重要。虽然生物多样性和组学研究界都认识到对(元)数据标准的迫切需要,但他们各自历史上都制定并采用了自己的标准,这使得协作和数据集成具有挑战性。
满足生物多样性和组学(元)数据之间互操作性的迫切需求,成立了可持续DwC-MIxS互操作性任务组(TG)。其主要任务是弥合两个不同组织的(元)数据标准之间的差距,即生物多样性信息标准(TDWG)的达尔文核心(DwC)标准和基因组标准联盟(GSC)的有关任何(x)序列(MIxS)清单,为数据集成提供可持续的框架。
任务组组建了一个专家团队,在TDWG的DwC标准和GSC的MIxS检查表之间建立语义精确且持续的互操作性。
这种协作努力最终形成了一份方法论文,其中报告了如何在DwC和MIxS之间建立可持续的互操作性。论文发表在《生物多样性数据杂志》上上,旨在展示获取和(重新)使用链接的生物多样性数据的优势和新颖方法。
“与来自已建立的生物多样性数据基础设施、领域专家、数据生成器和出版商的代表一起,我们从头开始将概念与应用领域联系起来,”任务组成员在论文中写道。
为了确保该计划的可持续性和持久影响,TDWG和GSC签署了一份关于创建连续模型以同步其标准的谅解备忘录。
他们总结道:“我们相信,该技术组的活动将激发该领域其他元数据标准之间的类似活动,打破孤岛,开辟通向更具协作性和互操作性的未来的道路。”