机器学习和物理学

Roger Luo

多体问题

经典的多体问题,例如广为人知的三体问题实际上在计算复杂度上并不困难。我们可以使用不多的参数就完成经典多体问题的模拟。然而到来量子的体系中,我们就遇到了另外的问题。

在量子力学中表示多个物体的状态所需的参数会随着个数指数增长

对于量子力学中的多体问题,也变得更难,为了表示一个多体问题的状态,我们需要Dn个数字,D是各个物体所在的状态个数。例如对两个硬币,我们可以用两个数字表示他们的经典概率分布,但是在量子概率的情形下,我们需要22 = 4个参数。

而量子多体问题往往就是说求解多体的薛定谔方程。这对于凝聚态物理,量子化学,原子物理,量子信息,甚至宇宙学都至关重要。

Ref: wiki:Many-body problem

这被称为维度诅咒

具体来说,这是计算复杂度过高

计算复杂度是说计算机计算一个问题的所需操作的次数。

一些简单的分类有:

  • P问题:可以被经典计算机在多项式时间里计算出的问题
  • NP问题:可以被经典计算机在多项式时间里验证的问题
  • BQP问题:可以被量子计算机在多项式时间里计算的问题
  • QMA问题:可以被量子计算机在多项式时间里以一定概率验证的问题(量子版本的NP问题)

接下来物理学家想到了两种方案:

  • 制造更合适的计算机:量子计算机
  • 设计更聪明的算法:新的经典算法

量子计算机由于本身满足薛定谔方程,它可以很好的模拟量子体系(计算量子概率)。但是能够商用的还没有被造出来...

甚至,有一些体系被证明是QMA的!

但是没关系,值得庆幸的是我们这个世界是简单的,是稀疏的。大部分的真实存在的量子态是稀疏的,我们可能实际上只需要很少的参数就可以表示。

表示这些量子态的稀疏结构被称为Ansatz,在德语中是构型的意思。

计算机视觉

在计算机视觉中,一个比较重要的问题是如何分类图像。

而分类图像,可以看成是获得不同类型的联合概率分布P(X, label)

那么问题就变成了如何表示这样的概率分布

但是问题来了

一张图片X,例如最简单的二制图片(黑白图片)。状态空间有2m × n这么大,这里m × n是图片的大小。

直接去表示是及其困难的,这个状态空间随着分辨率会指数增长。这也是一种维度诅咒

第二节完

神经网络

实际上各位已经看到了神经网络作为一种有效的表示被应用在了计算机视觉中,它有效的降低了数据维度。而实际上这还只是2006年。

  • Reducing the dimensionality of data with neural networks, Hinton G E, Salakhutdinov R R.

后续也有非常多的工作...

  1. Deep Residual Learning
  2. PReLu/Weight Initialization
  3. Batch Normalization
  4. ...

来自于Awesome Deep Vision

并且它的效果非常好

张量网络

张量网络是一种很类似于神经网络但又很不同的结构。它往往有着非常好的数学性质,在物理学中应用广泛。

其中最成功的方法莫过于密度矩阵重整化,或者说是这样一种称为矩阵乘积态的网络,它可以很好的表示量子体系中的对称性,还有纠缠结构。以至于有人认为这是描述多体物理新语言。

其中一个很重要的原因是:这些张量网络满足面积定律,也就是他们的纠缠熵和面积成正比

在此之前,利用这样的结构表示量子态,也就是量子版本的概率分布有非常好的效果。

Ref: arxiv:1306.2164

但是,这个方法在一些不满足面积定律的体系中,还有体系随时间演化的表示中,由于纠缠结构不再具有这种简单的特点,这些表示变得不那么有效。我们也许需要寻找一种新的结构。

以上是背景介绍