用机器学习解开宇宙最初诞生最初之谜

来源:新华网  06-13 15:41

  美国能源部劳伦斯伯克利国家实验室(伯克利实验室)的物理学家收集了几千幅模拟高能离子碰撞的图像来训练神经网络,将经过训练的网络用以分析解释真实碰撞后遗留下来的模拟粒子碎片图像,并识别其中的重要特征。测试中,研究人员发现在18000个图像样本中,该神经网络的重要特征识别率能达到95%。

  这项研究发表在《自然通讯》杂志上。下一步会将相同的机器学习过程应用到实际的实验数据中。

  强大的机器学习算法能让这些网络在处理更多图像时提升分析效果。这种底层技术常用于人脸识别和其他类型的基于图像的对象识别应用程序中。

  本研究中使用的图像与布鲁克海文国家的粒子对撞机核物理实验有关。

  该实验室的相对论重离子对撞机和欧洲核子研究中心的大型强子对撞机——重建了亚原子粒子“汤”的状态,这是一种超热流体状态,被称为夸克-胶子等离子体,只存在宇宙诞生后的百万分之一秒。伯克利实验室的物理学家参与了这两个网站的实验。

  “我们正在努力了解夸克胶子等离子体的最重要的特性,”伯克利实验室核科学部门的核物理学家、该团队成员之一的Xin-Nian Wang说。很多特性都只存在于宇宙爆炸的一瞬间,而且尺度特别微小,所以宇宙爆炸的瞬间才显得如此神秘。

  在实验中,核物理学家利用粒子对撞机将金或铅等原子的重核粉碎,剥夺它们的电子。这些碰撞被认为是将原子内部的粒子释放出来,形成了一个短暂的亚原子尺度的火球,它将质子和中子分解成一个自由漂浮的形式,通常是由夸克和胶子组成的。

  研究人员希望通过了解这种夸克-胶子等离子体形成时所需的精确条件,如吸收多少能量,以及其在转换成液体状态时的温度和压力,来获得对其物质的组成粒子和性质以及宇宙形成阶段的新见解。

  但是想要严格测量这些属性—即“状态方程,物质在碰撞中物一个阶段到另一个阶段”,非常具有挑战性。因为实验的初始条件会影响结果,所以要提取与这些条件无关的“状态方程”是很有挑战性的。

  “在核物理学界,大家所追求的是看到这些高能相互作用中的相变,然后从实验数据中确定状态方程,”Wong说。“这是夸克胶子等离子体最重要的特性,我们还没有从实验中学习。”

  研究人员还寻求洞察夸克和胶子之间相互作用的基本力,物理学家称之为量子色动力学。该研究的第一作者是加州大学伯克利分校伯克利Lab-affiliated博士后研究员Long-Gang Pang。2016年,当他在法兰克福高等研究所博士站工作时,对人工智能产生了兴趣。

  他发现深度卷积神经网络的架构来自于动物大脑中的图像处理过程,似乎很适合分析与科学相关的图像。

  “这些网络可以识别模式,评估棋盘中的落子位置”,Pang说。“我们认为,‘如果我们有一些可视化的科学数据,也许我们可以从中得到一个抽象的概念或有价值的物理信息。’”

  Wang补充说:“我们正在尝试用这种机器学习确定一个特定的模式或模式的相关性,这是一个独特的状态方程的特征。因此,在训练之后,网络可以精确定位图像中的部分和相关性,如果存在的话,这与科学家试图解决的问题最为相关。

  分析所需要数据量非常大,在某些情况下,一天的计算量只能创建一张图片。当研究人员使用一组并行计算的GPU时,(GPU是最初被用来增强视频游戏效果的图形处理单元,后被用于各种各样的用途)——他们将时间缩短到每幅图像20分钟左右。

  他们在研究中使用了伯克利实验室国家能源研究科学计算中心(NERSC)的计算资源,大部分计算工作集中在德国GSI的GPU集群和中国的华中师范大学。

  研究人员指出,使用复杂的神经网络的好处是能够识别出最初实验中没有找到的特征,就好比在一堆干草中找一根针。他们甚至可以从模糊图像中提取有用的细节。

  “即使你的分辨率很低,你仍然可以得到一些重要的信息,”Pang说。现在已经开始讨论将机器学习工具应用于处理实际重离子碰撞实验的数据,模拟结果应该有助于训练神经网络来解释真实数据。Wang说,“除了粒子对撞机实验,在高能粒子物理学中会有很多应用。”

  本文编译自Berkeley Lab,原标题为Applying machine learning to the universe's mysteries,作者Glenn Robert,编译邢天航 杜雪,转载请注明来源。