A short and not accurate introduction to lattice gauge theory.
本文仅仅是一点点科普,不是很严谨。如果有错误请及时指出~原文发表于知乎.
我们首先来看一个最简单的格点系统,其哈密顿量包含一个动能项(隧穿)和一个质量项(化学势)
\[H = -t \sum_{\langle jk \rangle} (a_j^\dagger a_k + h.c. ) + m\sum_{j} a_j^\dagger a_j.\]这个动能项对应着连续体系的\(\psi^\dagger \partial \psi\)。也就是说,动能项涉及到不同时空位置处产生湮灭算符的比较(物质场的比较)。但我们必须认识到,所有的数学描述都依赖于一个参考,或叫基准。例如我们要描述一个物体的平动,我们要建立一个参考系。在不同参考系中,对物体运动的描述自然不同。物质场的描述也需要一个参考。所谓的参考,就是英文所讲的gauge,即“规范”或标准。所谓的规范变换,其实就是指我们换了一个参考系而已。既然只是参考系的变化,那描述的物理就不应该有任何不同,这也就要求哈密顿量在规范变换下不变,或拉格朗日量在规范变换下仅相差边界项。
不同物质场需要不同类型的参考。例如最简单的标量场,这个标准就是参考相位,因为绝对的相位值并无意义。对于自旋,这个标准则是Bloch球的取向;或者用量子信息的语言来说,计算基(computational basis)\(\vert 0 \rangle\) 和 \(\vert 1 \rangle\)的定义。
在现代理论中,我们倾向于用局域(local)的理论来描述世界。即我们不预设任何超距作用或时空上统一的参数。
在上面的哈密顿量或拉格朗日量中,我们实际上默认了在时空各处要采取相同的规范。但这并非必要(即这并不是被什么对称性所要求的),而只是一个特例。那么我们现在试图考虑一个通用(general)的理论,在这个理论中我们允许在时空各处采用不一样的规范。这不会给质量项带来问题,但动能项则不然。由于动能项涉及到物质场在不同时空位置处的比较,在没有统一规范的情况下,这一项甚至没有良好定义。规范场(gauge field)就是为解决这一问题引入的。所谓的规范场,就是描述规范作为时空位置函数的分布。我们首先定义一个平行移动子(parallel transporter),用来描述物质场如何从一点 \(x\) 移动(transport)到另一点 \(y\) 。换句话说,它告诉我们这两点的规范是如何联系在一起的。举个经典的例子,这移动子其实就对应着两套参考系之间的变换矩阵。
下面我们分别用前面提到的相位变换的问题和自旋变换的问题作具体的例子,来具体地讨论规范场的引入。
相位变换其实就是乘一个因子 \(e^{i\phi}\),即 \(1\times 1\)的酉(unitary)矩阵,这些变换构成一个群,起名叫 \(U(1)\)。在时空某处 \(x\) 做一个规范变换,物质场的变化写作
\[\psi(x) \to e^{i\phi(x)} \psi(x)\]在 \(y\) 处的则写作
\[\psi(y) \to e^{i\phi(y)} \psi(y)\]那么为了表述两处的规范之间的联系,在这个规范变换下平移子 \(U(y, x)\) 应当定义为按如下规律变换
\[U(y, x) \to e^{i\phi(y)} U(y, x) e^{-i\phi(x)}\]这样一来,我们就又可以定义良好地时空导数了,即协变(covariant)导数
\[D_{\mu} \psi = \lim_{\epsilon \to 0} \frac{U(x, x+\epsilon e_{\mu})\psi(x+\epsilon e_{\mu}) - \psi(x)}{\epsilon}\]与普通的导数相比,它把规范在不同点处的差异也考虑了进去。显然,在规范变换下它这样变化
\[D_{\mu} \psi \to e^{i\phi(x)} D_{\mu} \psi\]这样一来,我们的动能项就与规范无关了。任务完成!
到现在为止,我们仅仅是把 \(U(y, x)\) 当作是一个辅助函数,用来帮助我们在各处规范不同的情况下,比较不同位置的物质场。现代理论指出,如果把 \(U(y, x)\) 看作是一个动力学自由度,赋予它动力学演化,会得到新的丰富物理,可以解释电磁相互作用等现象,并最终导致粒子标准模型的提出。为了赋予 \(U(y, x)\) 动力学意义,我们需要解决两个问题。一是 \(U(y, x)\) 依赖于时空的两点,并不local。二是要确定其正则动量和正则坐标,正则坐标在解决完第一个问题后自然得到解决,而正则动量则按标准定义求即可。第二个问题主要是写成哈密顿量形式的正则量子化时需要考虑它们的量子化和对易关系。如果用拉格朗日量形式做路径积分量子化,一切都很自然。
来看第一个问题。物理学中,我们一般通过做微小变化来寻找局域物理量。
\(A_\mu\)即对应着 \(U(x, x+\delta x)\)对第二个变量的导数。这样一来,我们就得到了一个局域的物理量 \(A_\mu\)。那么我们来看看它在规范变换下应当如何变换(精确到 \(\delta x\) 的一阶)
\[1 - ie\delta x^\mu A_\mu(x) \\ \to e^{i(\alpha(x)-\alpha(x+\delta x))} (1 - ie\delta x^\mu A_\mu(x)) 1 + i(\alpha(x)-\alpha(x+\delta x)) - ie\delta x^\mu A_\mu(x)\]于是
\[A_\mu(x) \to A_\mu(x) + \frac{1}{e}\partial_\mu \alpha(x)\]看到这里大家应该会觉得熟悉了,这正是电磁学里磁矢势的变换关系(其实对应的是相对论电磁学的电磁四矢)。在这变换下,电磁场不发生任何改变。定义了 \(A_\mu\),我们就可以把 \(U(y, x)\) 写成
\[U_P(x, y) = \exp\left( ie\int_0^1 \frac{dz^\mu(\lambda)}{d\lambda} A_\mu(z(\lambda)) d\lambda\right)\]这里 \(P = z^\mu (\lambda)\) 代表从 \(y\) 到 \(x\) 的路径。
OK,现在我们已经找到了一个描述规范随时空变化的局域物理量 \(A_\mu\)。把它作为正则动量,就获得了一个通用理论,其中规范也具有动力学意义。我们给 \(A_\mu\) 起名叫做规范场(gauge field)。但现在它的动力学还是平庸(trivial)的。它没有动能,也不会相互作用。为了赋予它一些非平庸的动力学,我们想给理论里加入一些涉及规范场的项,这些项必须在规范变换下不变。注意到 \(U(y, x)\) 的规范变换只依赖于 \(y\), \(x\) 两点,那么只要我们构造一个环路,把这环路上的平移子连在一起,就可以得到一个规范不变的项,这就是威尔逊环(Wilson loop)。这项和规范场本身显然不对易,因而可以带来非平庸的动力学。
前面说过,我们希望我们的理论尽量局域,所以先考虑一个无穷小环
\[U_{\square} = U(x, x+\varepsilon e_\mu)U(x+\varepsilon e_\mu, x+\varepsilon e_\mu+\varepsilon e_\nu)U(x+\varepsilon e_\mu+\varepsilon e_\nu, x+\varepsilon e_\nu)U(x+\varepsilon e_\nu, x) \approx \left( 1 - ie\varepsilon A_\mu(x) \right) \left( 1 - ie\varepsilon A_\nu(x+\varepsilon e_\mu) \right) \times \left( 1 + ie\varepsilon A_\mu(x+\varepsilon e_\nu) \left( 1 + ie\varepsilon A_\nu(x) \right) \right) \approx 1 - ie\varepsilon^2 (\partial_\mu A_\nu - \partial_\nu A_\mu).\]这里我们发现 \(F_{\mu\nu}\equiv\partial_\mu A_\nu - \partial_\nu A_\mu\) 是一个局域项,且满足张量的规范变换关系。但插入到拉格朗日量中的项应是标量,所以就按最简单的方式收缩为标量
\[F_{\mu\nu}F^{\mu\nu}\]这里的 \(F_{\mu\nu}\) 正是电动力学里的电磁场强张量。上面的这一项,经对称性分析和拉格朗日方程,正可以给出电磁学基本方程即麦克斯韦方程。注意到从头到尾我们都只要求了规范不变这一条,就可以构造出描述整个经典电动力学的基本方程,这正是规范理论的精妙之处。
下面用另一种方式来定义 \(F_{\mu\nu}\),以揭示规范场的拓扑学含义。正如广义相对论中,弯曲时空由变化的度规场来描述,其涨落和激发给出引力波的预测(已经实验证实);规范场也是在描述某种东西的弯曲程度,上面讨论的 \(U(1)\) 规范场的涨落和激发则给出电磁波,或者说光子。学过广义相对论就会熟知,要描述弯曲,可以利用物质场从时空某点沿两条路径到另一点传递导致结果的不同。举个几何的例子:在平面上有一个三角形,我们把一个箭头从一个角平移到另一个角,只要我们永远保证箭头和直边的夹角不变,我们平移后的结果总是一样的。但在球面上,沿不同边平移的结果会成一个角度。这个差异正好可以描述球面的弯曲程度。回到规范场的讨论中,我们可以比较沿两条路径移动一个物质场的区别,这正好对应着Wilson loop的概念。这个差异可以用两个方向协变导数的对易子来描述,即
\[[D_\mu, D_\nu] = [\partial_\mu,\partial_\nu] - ie[\partial_\mu,A_\nu] + ie[\partial_\nu,A_\mu] -e^2 [A_\mu,A_\nu] = -ie (\partial_\mu A_\nu - \partial_\nu A_\mu)\]也就是说,两个协变导数算子的对易子并不是算符,而是一个张量,而且这个张量正好和 \(F_{\mu\nu}\) 成正比。在拓扑学语言中,\(A_\mu\) 叫做联络(connection),\(F_{\mu\nu}\) 叫做曲率(curvature)。换句话说,规范场所描述的,是某种物质形态的拓扑特性。
上面已经引入了规范场论的各种基本元素,但是讨论的规范只是参考相位,比较简单。之所以说它比较简单,是因为 \(U(1)\) 群是一个阿贝尔群(Abelian group),在时空两点 \(x\) 和 \(y\) 各做一个规范变换,则连接两点的规范场的变化并不依赖于是先做 \(x\) 处的,还是先做 \(y\) 处的。但如果我们要讨论的规范变换是用 \(SU(2)\) 群描述的,事情就没那么简单了,因为这是一个非阿贝尔群(non-Abelian group),做 \(x\) 和 \(y\) 两处规范变换的先后顺序不同,产生的结果也不同,因而没办法只用一个正则动量来描述规范场的动力学。\(U(1)\) 的规范场还比较好想象,因为它描述的电磁场体会得到、测得着,从历史来看也是先发展出电磁场的理论,后来才引入了规范场这一概念。这主要得益于电磁场动力学的能标和我们日常生活的能标基本一致。
能标的概念非常重要,我们生活所处的能标决定了我们认识世界的道路。我们的世界中大部分事物表现为粒子性,少部分如电磁场表现为波动性。由于这一点,我们首先发展了牛顿力学和麦克斯韦电磁学。后来随着我们接触的能标拓宽,我们认识到这二者其实是物质的两种表现形式。于是我们发展出了量子力学和量子场论。
而宇宙中的另外两种相互作用,弱相互作用和强相互作用,则并不发生在我们熟悉的能标,所以对它们的研究则格外需要想象力。杨先生的伟大洞察力告诉我们,这些相互作用都和电磁理论一样,是由规范场论所描述的,只是它们涉及到了非阿贝尔规范群 \(SU(2)\) 和 \(SU(3)\)。因此,非阿贝尔群描述的规范场论称为杨-米尔斯场论。
以 \(SU(2)\) 规范场论为例,它涉及到的规范不是我们熟知的概念,而是同位旋(isospin),最初由海森堡(Heisenberg)提出。虽然不熟知,但它可以和我们熟知的自旋类比,因为它们的变换都由 \(SU(2)\) 群描述。质子和电子大致相等,而且在一定条件下可以互相转化,因此海森堡提出质子和电子其实可以由旋子(spinor)来描述。就像电子(自旋1/2)有自旋向上和向下两种状态,质子和电子则是同位旋(同位旋1/2)向上和向下的两种状态。其质量的微小差异则是质子参与的电磁相互作用导致的。质子和中子互相转化时要放出\(\pi\)介子(pion):质子转化成中子时放出\(\pi^+\)介子,中子转化成质子时放出\(\pi^-\)介子。由这两个过程可以分析出\(\pi\)介子的同位旋必为1(在此不赘述)。那么必然存在一个同位旋第三分量为零的\(\pi\)介子,即\(\pi^0\)介子。它在1950被确认观察到,证实了这一猜想。这样一来,质子和中子就可以像自旋那样形成叠加态,因而可以用布洛赫球(Bloch sphere)来描述。正如前文提到,我们需要定义布洛赫球 \(z\) 轴(第三分量)的指向,这就是 \(SU(2)\) 规范场论中的所说的规范(再次提醒读者,规范就是参考,就是基准)。
也许大家已经耳熟能详,粒子标准模型是由 \(U(1)\times SU(2) \times SU(3)\) 规范场论描述的。杨-米尔斯场论无疑是粒子标准模型最重要的基础。下面介绍杨-米尔斯场论与阿贝尔规范场论的一个重要不同。这个不同导致了 \(SU(3)\) 非阿贝尔规范场论的一个有趣结果,即渐进自由(asymptotic freedom)。
对于非阿贝尔群,其描述的规范变换比相位因子要复杂些,而是类似于旋转参考系的矩阵那样
\[\psi_j \to V_{jk}\psi_k \equiv (e^{i\alpha^a T^a})_{jk}\psi_k\]这里 \(\psi_j\) 是物质场的分量(对于 \(SU(2)\),就是同位旋spinor),\(T^a\)是规范群的生成元(generator, 对于 \(SU(2)\),就是泡利算符,Pauli operator)。可见,由此导出的规范场也并非只有一个,而是对每个生成元都有一个。由于规范变换不对易,显然规范场也不对易,这导致的直接结果就是,在场强张量的定义式中,最后一项消不掉
\[F_{\mu\nu} \equiv \frac{i}{g} [D_\mu,D_\nu]= \partial_\mu A_\nu - \partial_\nu A_\mu - ig[A_\mu,A_\nu]\]注意这里的\(F\)和\(A\)全都是李代数(Lie algebra),或者简单地说,都是矩阵。这样一来,场强张量不再是规范场的线性函数,而是二次函数。由此导出的拉格朗日量则含有规范场的四次项。这意味着对应的拉格朗日方程不再是线性方程,而是含有规范场之间的相互作用(因为拉格朗日方程是要对正则动量求导)。正如电磁学中带电荷的粒子参与作用,在其他相互作用中也存在对应的荷。杨-米尔斯场论的传递相互作用的粒子本身也参与相互作用因而带荷,而电磁相互作用中光子是不带电荷的。这是杨-米尔斯场论研究的另一个困难。
渐进自由说的是,在高能极限下,强相互作用趋于微弱而非更强。即,与电磁相互作用在大空间尺度下逐渐减弱不同,强相互作用正好反过来,在小空间尺度下渐弱,在大空间尺度变强。这导致了夸克禁闭(quark confinement),因为拉开两个夸克需要的能量可能比新创造一对夸克还要高。
为了解释渐进自由,先解释电磁相互作用在大空间尺度下逐渐减弱的原因,即真空极化(vacuum polarization)。在量子理论中,真空并不空,存在涨落。在相互作用中,真空可以激发出虚的正反电子对。这对正反电子在实物电子的作用下,虚电子原理实物电子,虚正电子靠近实物电子。这导致的结果是实物电子感受到的电场被虚正反电子对抵消了一部分,正如电介质和金属中发生的部分或全部屏蔽一样。这个效应就是屏蔽效应(screening effect)。尺度越大,这个效应就越强,因此在低能极限下电磁相互作用逐渐减弱。
在强相互作用中,由于传递相互作用的粒子,即胶子(gluon)本身可以参与相互作用,真空的涨落既可能产生虚正反夸克对,也可能产生虚胶子对。后者产生的效应可能是屏蔽,也可能是反屏蔽。反屏蔽带来的效果就是,尺度越大,相互作用越强。在现实世界中,存在二者的竞争。重整化理论计算表明,孰强孰弱与夸克的味数有关。我们的世界中的强相互作用,反屏蔽更胜一筹,因此在高能极限下,相互作用反而变得很弱,我们的理论变成了近自由理论,可以使用微扰论处理,这就是渐进自由。当然,在低能下,微扰论将变成不可控的展开,这就是研究格点规范理论(或许是目前最靠谱的非微扰方法)的必要性。
关于规范理论的基本概念
一些讲座和讲义
关于等价类、联络等拓扑相关知识