我们在宇宙中是孤独的吗?在人工智能的帮助下,科学家们可能离找到答案又近了一步。在多伦多大学研究人员的带领下,一个国际科学家团队通过使用一种新算法将望远镜中的数据分类以区分真实信号和干扰,从而简化了对地外生命的搜索。通过称为机器学习的AI过程,新方法使研究人员能够对信息进行分类并快速找到模式。
自1960年代以来,致力于“SETI”(寻找地外智慧)的天文学家使用强大的射电望远镜搜索了数千颗恒星和数百个星系,以寻找所谓的“技术签名”或技术产生的信号,其假设是先进的地外文明将足够复杂以发出此类信号。然而,即使用于这些搜索的望远镜位于手机和电视台等技术干扰最小的区域,人为干扰仍然构成重大挑战。
“在我们的许多观测中,存在很多干扰,”多伦多大学艺术与科学学院数学和物理本科生PeterMa说,他是《自然天文学》上发表的一篇新研究论文的第一作者解释了这项技术。
“我们需要将太空中令人兴奋的无线电信号与来自地球的无趣无线电信号区分开来。”
通过模拟这两种类型的信号,该团队训练了他们的机器学习工具来区分类外星信号和人类产生的干扰。他们比较了一系列不同的机器学习算法,研究了它们的精度和误报率,然后利用这些信息确定了一个强大的算法。
这种由Ma创建的新算法已经发现了八种新的无线电信号,这些信号可能是来自外星智能的传输。这些信号来自距离地球30到90光年的五颗不同的恒星。在之前对相同数据的分析中,这些信号被忽略了,该分析没有使用机器学习。
对SETI团队来说,这些信号被认为是值得注意的,原因有二。“首先,它们在我们注视恒星时存在,而在我们移开视线时不存在——这与通常总是存在的局部干扰相反,”格林班克望远镜突破聆听项目科学家史蒂夫克罗夫特说。“其次,信号的频率随着时间的推移而变化,使它们看起来远离望远镜。”
然而,Croft指出,当您拥有包含数百万个信号的数据集时,信号有时会偶然具有相同的两个特征。“这有点像走过一条碎石路,发现一块石头卡在你的鞋底,看起来非常合脚。”
出于这个原因,即使这八个信号看起来像团队期望的外星信号看起来的样子,研究人员仍不相信它们来自外星智能——至少在他们再次看到相同的信号之前是这样。当使用格林班克射电望远镜进行简短的后续观察时,没有发现可以指示地外信号的模式。更多的观察和分析正在进行中。
作为维多利亚学院的一员,Ma将他创建的算法称为机器学习的两种子类型的组合——监督学习和无监督学习。他的方法被称为“半无监督学习”,涉及使用监督技术来指导和训练算法以帮助其泛化,以及无监督学习技术,以便更容易地在数据中发现新的隐藏模式。
在12年级的计算机科学课上,马首先提出了将这种特定算法应用于寻找外星智能的想法。不幸的是,他说,这个项目让他的老师感到困惑,他们不确定如何使用它。
“我只是在论文发表后才告诉我的团队,这一切都是从一个高中项目开始的,我的老师并没有真正欣赏它,”马云说。
CherryNg是多伦多大学邓拉普天文学和天体物理学研究所的助理研究员,也是该论文的第二作者,她说新想法在SETI这样的领域非常重要。“通过使用各种技术挖掘数据,我们或许能够发现令人兴奋的信号,”她说。
Ng自2020年夏天以来一直与Ma一起从事这个项目,他说机器学习是大数据天文学时代的必由之路。“我对这种方法在寻找外星智能方面的表现印象深刻,”Ng说。
“在人工智能的帮助下,我乐观地认为我们将能够更好地量化来自其他文明的地外信号存在的可能性。”
展望未来,Ma、Ng和SETI团队的其他成员希望扩展他们的新算法并将其应用于其他数据集和天文台。
使用功能强大的多天线射电望远镜,如MeerKAT、平方公里阵列和下一代VL,Ma表示该团队计划以主要方式扩展他们的机器学习方法。
“凭借我们的新技术,结合下一代望远镜,我们希望机器学习可以让我们从搜索数百颗恒星到搜索数百万颗恒星。”
本研究中使用的数据来自西弗吉尼亚州的格林班克望远镜,该望远镜是参与BreakthroughListen技术签名搜索项目的主要设施之一。该倡议由突破奖基金会赞助,是迄今为止为寻找地外智慧生命迹象而进行的最强大、最全面和最深入的科学探索。