技术文章

12.什么是量子力学？-2

2022-05-18 18:32:51

21波函数

****

有了这些认识，我们就能在具体表象下讨论问题了。

还是那个电子，当我们在位置表象下考虑问题时，我们其实是以电子的位置算符的本征矢量为基矢构建了一个坐标系，再把描述电子状态的态矢量投影到这个坐标系里了。

现在只考虑一维情况，也就是假设电子只在x方向运动。如果电子处于x=1的位置本征态，测量时就会在x=1这个位置发现它。因为这是一个本征态，我们要用一个本征矢量来描述它，而本征矢量又是坐标系的基矢，会对应一根坐标轴。所以，x=1这个位置本征态就会对应坐标系里的一根坐标轴。

当然，除了x=1，电子的位置还可以在x=2，x=2.5等无穷多个地方，同样，每个位置本征态都会对应坐标系里的一根坐标轴。这样一来，这个坐标系里就会有无穷多个坐标轴。

现在，我们把态矢量投影到这个拥有无穷多个坐标轴的坐标系里去，它在每一个坐标轴上就会有一个投影系数，也就是态矢量在这个坐标轴上的坐标。

比如，x=1是一根坐标轴，代表了x=1的位置本征态。态矢量在这个坐标轴上有一个投影系数，也就是它在这个轴上的坐标，我们记作Ψ(1)。同理，态矢量在x=2、x=2.5上也会有一个投影系数（坐标），我们分别记作Ψ(2)、*Ψ(2.5)*，以此类推。

而玻恩规则又告诉我们：态矢量在x=1这个坐标轴上的投影系数的模的平方|Ψ(1)|²，就代表了测量时在x=1处发现电子的概率。同理，|Ψ(2)|²就代表了测量时在x=2处发现电子的概率。电子的位置x还可以取3、3.5、4.1等无穷多个地方，每个地方都有一个对应的投影系数Ψ(x)，它的模的平方|Ψ(x)|²就代表了在这里发现电子的概率。

也就是说，给定一个电子可以取的位置x，我们都能找到一个与之对应的投影系数Ψ(x)，使得|Ψ(x)|²就代表了在x处发现电子的概率。

给定一个位置x，就有一个数Ψ(x)与之对应，这种从数到数的映射是什么？

是函数啊！是我们初中就学了的函数。

所以，进入位置表象以后，态矢量在各个坐标轴的投影系数（坐标）就是一个关于位置x的函数，我们把它记作Ψ(x)。而这个函数的名字，就是大名鼎鼎的波函数。

很多朋友对态矢量和波函数感到很迷糊，因为有的地方说“用态矢量描述系统状态”，有的地方又说“用波函数描述系统状态”，这样他就晕了。明明一个是矢量，一个是函数，看起来八竿子打不着，为什么系统状态好像既可以用态矢量来描述，又可以用波函数来描述呢？

原因就在这了，因为波函数是跟具体表象绑定在一起的。我们只有选定了具体的表象，建立了具体的坐标系，把态矢量投影到具体坐标系的系数才是波函数。

所以，我们说“用态矢量描述系统状态”没错，说“用波函数描述系统状态”也没错。就好像我们既可以说矢量a，也可以把它分解到一个坐标系，说这是矢量（1,2）一样。

建立了位置表象，态矢量在这个具体坐标系里的投影系数就是波函数Ψ(x)，波函数的模的平方|Ψ(x)|²就代表了在位置x发现这个电子的概率。比如，Ψ(1)=0.1就代表在x=1这个地方发现电子的概率是0.1²=0.01，Ψ(2)=0.2就代表在x=2这个地方发现电子的概率是0.2²=0.04等等，这样问题就具体化了。

当然，你能建立位置表象，自然也能建立动量表象。我们一样可以以动量算符的本征矢量为基矢构建一个坐标系，然后把态矢量分解到这个坐标系里。这样，态矢量的投影系数就是动量表象下的波函数，它的模的平方就代表了测量时发现电子具有这个动量的概率。

很显然，不同表象之间是等价的。你既可以在位置表象下讨论问题，也可以在动量表象下讨论问题，就像你既可以选择笛卡尔坐标系，也可以选择球坐标系一样。同一个态矢量，它既可以对应位置表象下的波函数，也可以对应动量表象下的波函数，它们就差了一个傅里叶变换。

因为大家平常对位置表象接触得比较多，所以有些人就误以为量子力学就是位置表象下的量子力学。他不太清楚位置表象和动量表象的关系，也不太清楚波函数和态矢量的区别，这样就始终云里雾里的。

好，现在我们进入位置表象。

22位置表象

进入位置表象以后，我们就可以用波函数代替原来的态矢量了。而我们又知道，系统状态随时间的变化是遵守薛定谔方程的（假设四），而原来的薛定谔方程是用态矢量|Ψ(t)>来描述系统状态的：

所以，现在我们可以用波函数代替原方程里的态矢量。

因为薛定谔方程描述的是系统状态随时间的变化，我们用波函数Ψ(x)描述系统状态，那波函数随时间t的变化自然就是Ψ(x,t)。因此，在位置表象下，我们就可以用波函数Ψ(x,t)代替原来的态矢量|Ψ(t)>。

但这样还不够，为了让薛定谔方程更加具体，我们把哈密顿算符H(t)也一并展开。

关于哈密顿算符，我们前面讲过一点。在这里，大家只要知道：一般情况下，如果我们知道了系统的哈密顿算符，就知道了系统本身的情况（比如粒子的数量、质量以及它们之间的相互作用）以及系统所处的外部情况（比如粒子所在的外部电磁场）。基本上，知道了系统的哈密顿算符，我们就知道了系统的一切。

在经典力学里，如果系统与外界不存在能量交换，系统的哈密顿量H一般可以写成动能（P²/2m）加上势能V，在数值上就等于系统的总能量：

到了量子力学，力学量要用算符来描述。那么，跟能量紧密相连的哈密顿量自然也要算符化，算符化的结果就是薛定谔方程里的哈密顿算符H。

很显然，如果系统的哈密顿量H可以写成动能（P²/2m）加势能V，我们想把它算符化，就要把里面的力学量，也就是动量P算符化。在位置表象下，动量P算符化的结果是-iℏ∂/∂x。为什么长这样我们先不管，但大家要记住，这只是动量算符在位置表象下的形式，它在其它表象下就不长这样了。

于是，我们就集齐了在位置表象下写出薛定谔方程的全部条件：用波函数Ψ(x,t)代替态矢量|Ψ(t)>，把哈密顿算符H展开成最常见的一种形式（P²/2m+V），并找到了位置表象下的动量算符（-iℏ∂/∂x）。

然后，我们就可以在位置表象下重新写出薛定谔方程了（只考虑一维情况）：

这个方程比原来的长一些，看起来也复杂了一些。但是，它只是用Ψ(x,t)代替了|Ψ(t)>，并把哈密顿算符H(t)展开了而已。它们的核心区别是：原来的方程是一般的薛定谔方程，没有指定表象，现在这个是位置表象下的薛定谔方程。

大家看看这个方程，i、ℏ是常数，m是质量，如果势能函数（一般简称为势函数）V(x,t)确定了，那未知量不就只剩下波函数Ψ(x,t)了么？一个方程一个未知量，求解方程就能得到波函数Ψ(x,t)了。

也就是说，对位置表象下的薛定谔方程来说，只要给定了势函数V(x,t)，我们就能解出一个与之对应的波函数Ψ(x,t)（能否求出精确解就是另外一回事了）。

知道了粒子的波函数Ψ(x,t)，我们就能知道在任何时间t，任何位置x发现粒子的概率|Ψ(x,t)|²（玻恩规则）。概率分布确定了，力学量平均值也就确定了，我们正是在这个意义上说波函数完全描述了系统状态。

在牛顿力学里，给物体一个外力，物体就会有一个加速度，它的状态也会随之变化。到了量子力学，我们不再用“力”来描述外界的影响，而用势（能）函数。比如，牛顿力学谈重力，我们这里就谈重力势能；牛顿力学谈弹力，我们就谈弹性势能。

分析力学是一套以能量为核心的体系，它跟以力为核心的牛顿力学不一样。量子力学沿用了分析力学的逻辑，所以，在薛定谔方程里出现的是势（能）函数，而不再是力。

因此，只要我们确定了势函数，就能通过求解薛定谔方程得到描述粒子状态的波函数，进而知道粒子的各种情况。事实上，大家一开始学习量子力学时，很大一部分工作就是求解各种势函数下的薛定谔方程。

比如，对于自由落体的粒子，它的势能就是重力势能-mgx，所以势函数V(x,t)就是-mgx（不含时间t）。我们把-mgx代入薛定谔方程，求解方程就能得到描述粒子状态的波函数Ψ(x,t)。然后，我们就能知道1秒、2秒、n秒在某个地方发现这个粒子的概率以及各种力学量的平均值。

类似的，对于一个简谐振子，它的势函数是V(x)=mω²x²/2(也不含时间t)。我们把它代入薛定谔方程，解出波函数Ψ(x,t)以后，一样可以得到它的各种信息。

也就是说，如果我们想了解一个量子系统，通常要先做两件事情：第一，找出系统的势函数V(x,t)；第二，把势函数代入薛定谔方程，解方程求出描述系统状态的波函数Ψ(x,t)。

一般来说，找势函数是比较容易的，但是，薛定谔方程是一个偏微分方程，求解起来就没那么容易了。事实上，我们只在极少数情况下能精确求解薛定谔方程，在更多时候，我们只能采取一些近似方法。

这样，相信大家对量子力学的基本框架，以及量子力学处理问题的一般方法就有了个大致了解。然后，我们就可以这样去分析具体问题了，得到的结论是什么样就是什么样，大家平常熟悉的那些反常识、不可思议的量子力学特性都是这么来的。不信的话，我们来看一看。

23不连续的问题

****

首先，我们来看一个大家都喜闻乐见的话题：不连续性。

很多量子力学科普都是从黑体辐射开始的，并告诉你正是普朗克创造性地把能量的传播看成一份一份，而不是连续的，这才解决了黑体辐射难题，从而开创了量子力学。

当然，普朗克当时只是把这当作一个数学技巧，并不真的认为能量的传播就是不连续的，后面到了爱因斯坦才把这当作物理现实。再往后，玻尔通过假设电子的轨道是分立的，无法连续吸收、释放能量，初步解决了氢原子问题。

总之，如果单独看量子力学的初期发展史，会让很多人会误以为量子力学就是让一切都分立化，让一切都不连续。似乎只要我们让一些东西离散化，那些经典力学无法解释的问题就会迎刃而解，似乎不连续性就是量子力学的核心。

有的同学还会觉得，想要建立量子力学，是不是只要让经典力学的东西都离散化，让经典力学全都变成不连续的就行了？

但是，你看看我们这里讲的量子力学，通篇都在讲什么用矢量描述系统状态，用算符描述力学量，用薛定谔方程描述态矢量随时间的变化等等，压根都没提什么连续不连续。

有的同学走得更远，他觉得量子力学里到处都是不连续，那么，量子力学里的时间和空间肯定也是不连续的。刚好，他又知道普朗克时间和普朗克长度的概念，于是，他就在脑海里把时间和空间切成了一块一块，并认为这就是量子力学，然后说自己轻而易举地解决了芝诺悖论。

不得不说，如果只是看了一点量子力学科普书，然后基于它们做了一些自以为合理的延伸，再加上点脑洞，得出这样的结论是非常正常的。但是，如果稍微系统地学了一点量子力学知识，就会知道这样的推论是错得离谱的。

最简单的证据，你看看薛定谔方程，里面出现的是对时间t和空间x的求偏导∂/∂t、∂/∂x。求导意味着什么？求导意味着一定连续啊，相信大家多多少少还记得“可导一定连续，连续不一定可导”。

薛定谔方程里有对时间和空间的求偏导操作，这明摆着就是在告诉我们：在**量子力学里，我们假设时间和空间是连续的，否则，薛定谔方程就没有意义了**。

确实，在有些量子引力理论，比如圈量子引力里就认为时间和空间是不连续的，但这并不是我们常说的量子力学。它属于量子引力的前沿探索领域，理论本身都还存在许多问题，也还没得到人们的共识。

而大家常说的量子力学，它在理论上是非常成熟了的，也经历了无数实验的考验，它假定时间和空间是连续的。

也就是说，虽然量子力学里可以有不连续的东西（比如能量），但时间、空间这个背景舞台却依然是连续的。而且，我们说能量可以不连续，而不是一定不连续，它在有的情况下依然可以连续。所以，像“量子力学里一切都是不连续的”这种简单粗暴的念头，趁早打消了吧~

那么，既然量子力学里的时间和空间都是连续的，而能量却可以不连续，那这种不连续是怎么产生的呢？

24直觉和反直觉

****

到了这里，我要跟大家强调一件非常重要的事：学习量子力学时，我们要以量子的眼光看待世界，而不是以经典的眼光看世界。我们不要老觉得量子世界很奇怪，于是非要用自己更加熟悉的经典图像去类比。量子力学是更加底层的东西，需要被解释的不是量子力学，而是经典力学。

****

我们真正应该问的，不是量子力学为什么奇怪，而是经典力学的种种现象是如何从量子力学涌现出来的？我们真正该奇怪的，不是量子世界为什么是这样，而是经典世界为什么可以这样？

量子力学已经诞生百年了，面对这个极其成功并且已经深刻改变了我们的思想和生活的理论，按理说，我们应该觉得它已经很自然了。但事实却与此截然相反：很多人一提到量子力学，第一反应依然是反直觉、反常识，觉得这个理论稀奇古怪，难以琢磨，不可理喻！

但是，你想过没有，当你在说量子力学反直觉的时候，你到底在说什么？你能够反直觉，说明你之前已经有了一个直觉。你有了一套看待世界的直觉以后，又发现了某些不符合这些直觉的现象，然后才会反直觉。

对大部分人来说，这个直觉就是中学阶段学习牛顿力学所形成的直觉。

所以，当他们试图把量子世界的种种现象纳入原先的版图，试图用牛顿力学的思维和习惯理解量子现象时，发现理解不了，于是就觉得反直觉了。

这种事说来也正常，如果一个人已经积累了很多经验，在遇到新事物以后，他自然会希望原来的经验还能派上用场。所以，在量子力学初期，那些物理大师一样希望能在经典框架内解决问题，他们有意无意地保留了许多经典物理的思维和概念，经历了大约四分之一个世纪艰苦卓绝的探索后，才形成了比较系统的量子力学。

大概是量子力学前25年的历史太过精彩，各种人物轮番登场，各种思想对经典物理发起了一轮又一轮的冲击。量子力学内部又有矩阵力学和波动力学两股力量，后面还有玻尔和爱因斯坦的论战，拿来说书再合适不过了。

这就引发了一个比较严重的问题：现在市面上关于量子力学的科普书，绝大部分都是在讲量子力学这前25年的历史。

他们从普朗克与黑体辐射开始，讲爱因斯坦和光电效应，讲玻尔和氢原子，讲海森堡和神秘的矩阵，讲德布罗意和物质波，讲薛定谔的神秘女郎和薛定谔方程，再配合矩阵力学和波动力学的小论战，以及玻尔和爱因斯坦的大论战，一本精彩纷呈的量子力学科普书就完成了。

这样写的书，当成量子力学史来看是不错的。但是，如果你把它当成量子力学科普书，希望从这里学习量子力学的思维，了解量子力学的基本框架和处理问题的一般方法，那就非常容易出问题了。

原因也说了，量子力学前25年的历史本身就充斥着各种混乱，那些大师们在思考问题时也掺杂了各种经典的东西。从经典视角看待量子力学，自然会各种反直觉，奇怪，乃至诡异。如果你想学习量子力学，没有学到如何从量子视角看待世界，反而学来了一堆反直觉和诡异，这可不是什么好事。

比如这里的不连续性，很多人看完量子力学前25年的历史后，对这个不连续性的印象极其深刻。于是，他很容易认为量子力学就是在说一切都不连续，时间不连续，空间也不连续，认为把经典力学全部离散化之后就能得到量子力学，然后开始各种胡思乱想。

25波粒二象性

****

类似的还有波粒二象性，这也是一个很典型的试图用经典思维来解释量子现象的东西。我们在经典力学里谈到波，就会想到类似水波这样的东西；谈到粒子，就会想到类似豌豆那样的东西。

但是，在量子力学里，如果你还说粒子性，那也只是说它具有一定的质量、电荷这种属性，一个电子的行为一点也不像一粒豌豆，它根本没有确定的轨道；你在量子力学里说波动性，那也只是说它具有相干叠加性，并不是说空间中真的有一个类似水波这样的东西。

这样导致的结果就是，你看啊，我们先是千方百计地让读者接受任何粒子都具有波粒二象性：一个电子既是波又是粒子，它有时候像波，有时候像粒子。当我们用波动的方式去测量时，它表现得像波；当我们用粒子的方式去测量时，它表现得像粒子。

等大家被这个搅得一团乱，却只记住了“电子既是波又是粒子”之后，你又跑来告诉读者：不好意思，我们量子力学里说的这个波啊，它不是经典的波；量子力学里说的粒子，它也不是经典的粒子。

读者：……

你完全可以想象，经过这样一轮科普之后，读者能不迷糊么？他能不觉得量子力学玄之又玄，既反直觉又诡异么？如果脑洞再大一点，借着波粒二象性继续发挥一下：电子既是波也是粒子，既有阴也有阳，阴阳五行相生相克……这就很容易形成拳打薛定谔，脚踩海森堡，一记左勾拳撂倒玻尔和爱因斯坦的局面。

归根结底，波粒二象性是在量子力学发展初期，在那个混沌阶段，人们试图用尽量多经典概念描述量子力学的产物。在量子力学还没建立起来之前，人们的确需要这样一根拐杖，但是，在量子力学已经建立起来的一百多年后，我们还有必要拄着一百年前的拐杖一步一拐吗？

我们在文章里讲用态矢量描述系统状态，用算符描述力学量，用薛定谔方程描述系统状态随时间的变化，通篇都没提什么波粒二象性，也没必要。

在经典力学里，波和粒子是两种不能并存的实体，区分它们是很自然的。但到了量子力学，我们只要从量子力学的基本框架出发，就会发现粒子具有确定的质量、电荷，描述粒子状态的波函数具有相干叠加性都是非常自然的事情，没有必要刻意提让人容易混淆的波粒二象性。以后学了量子场论，大家会觉得这更加自然。

当然，如果你执意要用波粒二象性，也不是不可以。但是，你一定要清楚当你在说波粒二象性时，你到底在说什么，你要清楚量子力学里的波动性、粒子性跟经典力学里的有什么区别。

我们都知道量子力学是比经典力学更加深刻的理论，经典力学能描述的东西量子力学能描述，经典力学不能描述的东西量子力学也能描述。既然这样，为什么我们学习量子力学的时候还要管经典力学怎么看？为什么我们还要做着“从经典力学的视角去理解量子力学”这种既荒诞又无用还容易制造各种混乱的事情呢？

我们就不能堂堂正正地学习量子力学，用量子的方式思考量子问题么？我们要做的不是“如何从经典视角理解量子力学”，而是应该反过来：如果我们更加底层的世界是量子的，那经典世界的种种现象是如何涌现出来的？

如果量子力学的基本假设里没有不连续性，那我们常说的能量不连续是怎么冒出来的？如果不用波粒二象性这种半经典半量子的东西，我们要如何解释单电子双缝干涉实验？量子世界充满了各种概率和不确定性，为什么宏观世界好像没有？如何从量子力学出发，给物理世界一个完整而又自洽的描述？等等。

这是一系列非常宏大的话题，我们留到后面慢慢谈。在这篇文章里，我们就先把量子力学的基本框架搭起来，学习量子力学处理问题的一般方法，把这些都搞清楚了，我们的头脑就完成了一次从经典到量子的格式化。然后，你就会觉得量子力学很自然，而不再反什么直觉，因为现在的**量子力学才是你的直觉**。

所以，我们要逐步尝试用量子的方式思考量子力学问题。我们不是已经找到了量子力学的基本假设么？从这里出发就好了。

那么，我们就从这里出发，看看能量为什么可以是不连续的？再次提醒，这里说的是“可以”，而不是“一定”。

26能量是否连续？

****

假设这里有个粒子，我们想看它的能量是否连续。首先，我们要意识到：当我们在说这句话的时候，我们到底在说什么？

在经典力学里，一个粒子的动能跟它的速度有关，而粒子的速度可以连续取值，它可以是1，可以是1.6，也可以是其它任何一个实数，于是，粒子的动能也可以连续取值。同样的，粒子的势能也可以连续取值，因为势能依赖位置，而位置可以连续取值。

所以，在经典力学里，粒子的动能和势能都可以连续取值，那粒子的总能量当然可以连续取值，这没什么好说的。

到了量子力学，如果你还想通过粒子的速度去寻找动能，就会发现此路不通。原因也很简单，经典力学的速度是指单位时间内的位移变化量。粒子此刻在A点，一秒后到了B点，我们用AB两点间的距离除以时间，就能得到速度的大小，进而得到动能。

但是，我们在量子力学里还能说粒子此刻在A点么？

不能啊！只有当粒子处于位置A的本征态时，我们才能说粒子一定在A点。如果粒子处于位置叠加态，那测量时就有一定的概率在A点，有一定的概率在B点、C点等等。因此，粒子在一般情况下并没有确定的位置，那你就不能说它此刻在A点。同理，你也没理由说它下一秒就一定在B点。

位置都不确定，那如何确定粒子的速度呢？

所以，我们不能像经典力学那样谈论粒子的动能，也没法像经典力学那样谈论能量的连续性。我们必须丢掉经典力学的经验，直接从量子力学的框架出发考虑问题。

我们知道，量子力学里是用算符描述力学量的（假设二）。能量也是力学量，那自然也要用算符来描述，用什么算符呢？前面说了，用哈密顿算符。在经典力学里，粒子的能量一般就等于哈密顿量，我们把它算符化以后，就得到了薛定谔方程里的哈密顿算符Ｈ。而我们又知道，测量一个力学量的结果是对应算符的本征值之一（假设三）。

因此，如果我们想判断粒子的能量是否连续，就不是像经典力学那样看它的速度是否连续，而是要看哈密顿算符的本征值是否连续。

前面讲过了，经典力学里的哈密顿量H一般写成动能（P²/2m）加势能V：

在位置表象下，动量P对应的算符长这样-iℏ∂/∂x（为啥长这样先不管了），把它代进去，就得到了位置表象下的哈密顿算符H：

也就是说，想看能量是否连续，我们就要看这个哈密顿算符H的本征值是否连续。

想看一个算符的本征值是否连续，前面也讲过了，解这个算符的本征方程（A|Ψ>=a|Ψ>，这里的a就是算符A的本征值，|Ψ>是对应的本征态）就行了。

所以，我们现在的问题变成了：上**哪找哈密顿算符H的本征方程**？

27定态薛定谔方程

****

想找哈密顿算符的本征方程，你得先找一个含有哈密顿算符的方程吧？大家看看位置表象下的薛定谔方程：

哈密顿算符Ｈ跟薛定谔方程的右边是不是有点像（废话，没进入表象的薛定谔方程的右边就是哈密顿算符，能不像么~）？

如果我们可以像代数乘法那样把Ψ提出来，那这个方程的右边是不是就只剩下哈密顿算符Ｈ了？也就是说，如果可以把Ψ提出来，那位置表象的薛定谔方程的右边就可以写成HΨ，我们就能看到哈密顿算符H了。

但是很可惜，这个方程的右边并不是代数乘法，位置表象下的波函数Ψ(x,t)和势函数V(x,t)也都是既跟时间t有关，又跟空间x有关的多元函数，不是随随便便就能提出来的。

因此，如果想把Ψ提出来，你就得先想办法把波函数Ψ(x,t)和势函数V(x,t)的时间和空间部分分开，怎么做呢？

先看势函数，现在的势函数V(x,t)是既跟时间t有关，也跟空间x有关，那怎么才能把它们分开呢？简单，我们就直接假设势函数不依赖时间t好了。也就是说，我们就只考虑不依赖时间t，只考虑跟空间x有关的势函数V(x)。

大家想想我们平常遇到的情况：一个物体的重力势能只跟高度有关（跟时间无关），一个弹簧的弹性势能只跟位置有关（跟时间无关），我们做电磁学题目，一般也是先给定一个电磁场（不随时间变化）。可见，不依赖时间t的势函数V(x)是非常常见的，我们先考虑这种简单情况，以后再考虑更加复杂的也不迟。

势函数解决了，那波函数呢？

为了把波函数的时间和空间部分也分开，我们把波函数Ψ(x,t)写成只包含位置的ψ(x)和只包含时间的φ(t)的乘积：

当然，你可能会说凭什么把波函数写成这种形式？的确，可以写成这种形式的波函数只是很少的一部分。但后面大家会看到，更一般的解都可以通过这少部分的解构造出来。所以，我们先寻找这一小部分解集还是非常有意义的。

于是，我们就通过假定势函数V不依赖时间，并把波函数Ψ(x,t)写成ψ(x)φ(t)这样的形式，把薛定谔方程的时间和空间部分分开了。

然后，我们就把波函数的新形式ψ(x)φ(t)代入位置表象下的薛定谔方程，经过一个简单地懂的都懂，不懂也没关系的求导、替换工作，原来的薛定谔方程就变成了这样：

为了方便区分，我们把既包含时间，又包含空间的波函数用大写的Ψ(x,t)表示，把只包含空间的部分用小写的ψ(x)表示，把只包含时间的部分用φ(t)表示。

可以看到，由于Ψ(x,t)被拆成了ψ(x)和φ(t)相乘的形式，原来方程里的求偏导∂/∂x，∂/∂t都变成了普通的求导d/dx，d/dt，这样形式就简单了。这么一来，方程的左边就真的只跟时间t有关，方程的右边就只跟空间x有关了（因为右边的势函数V不依赖时间，ψ(x)也不含时间）。

一个跟时间相关的东西（方程左边）等于一个跟空间相关的东西（方程右边），看起来好像不太可能，两个互不相关的函数怎么会相等呢？

但是，它们还是有相等的可能性的，那就是：它们都恒等于一个常数！

你想啊，左边的东西是随时间变化的，可能8点一个值，9点一个值；右边的东西是随位置变化的，可能北京一个值，武汉一个值。左右两边没有任何关系，你现在让它们强行相等，那它们就只能都等于一个常数了，我们姑且把这个常数记为E。

于是，上面的方程就可以拆成这样两个：

第一个方程非常简单，求解也很容易，这里先不管，我们重点看第二个方程。如果把方程二的左右两边都乘以ψ，它就可以写成这样：

这个方程有个很响亮的名字，叫定态薛定谔方程。

为什么叫定态呢？从表面上来看，“定”应该是不动，不随时间变化的意思。但是，我们这里只是假设势函数V不依赖时间，波函数Ψ(x,t)虽然写成了ψ(x)φ(t)的形式，但依然是跟时间φ(t)相关的，似乎谈不上“定”。

但是，我们想一下玻恩规则：|Ψ(x,t)|²表示在时间t，在位置x发现粒子的概率。也就是说，虽然波函数Ψ(x,t)跟时间t相关，但波函数本身却不对应什么物理现实，真正有物理意义的是波函数的模的平方|Ψ(x,t)|²，它代表我们在某时某地发现粒子的概率。

但是，当我们计算|Ψ(x,t)|²的时候，却发现时间因子在计算过程中竟然相互抵消了，最后的结果反而跟时间无关。更具体的说，|Ψ(x,t)|²就等于|ψ(x)|²，它只跟空间部分有关。

于是，当势函数V不依赖时间时，虽然波函数Ψ(x,t)本身跟时间相关，但概率分布*|Ψ(x,t)|²=*|ψ(x)|²却跟时间无关。这样，任何力学量的平均值就也跟时间无关，所以我们才说这是“定态”，是概率分布和力学量平均值都不随时间变化的状态。

28能量本征态

****

明白了定态的意义，我们再来追问那个常数E的意义，那个让时间和空间部分相等的常数E是什么？

大家都知道，在物理学里，我们一般用E表示表示能量（Energy），那这个常数E跟能量有没有什么关系呢？

有关系！这个E，正是系统的能量。

为什么？我们再来看看定态薛定谔方程：

这里的ψ只跟空间x有关，是个一元函数ψ(x)。这样的话，我们就可以把方程左边的ψ提出来，那剩下的部分就是哈密顿算符H了。

于是，我们就可以把定态薛定谔方程写成Hψ=Eψ这种非常精简的形式了。温馨提示，这里的H是哈密顿算符，是一个算符，而E是一个数。大家可不要大笔一挥把ψ约掉了，闹出一个H=E的笑话来~

很多人应该还记得，我们在讲“用算符描述力学量（假设二）”时讲过算符的本征方程：如果力学量用算符A描述，那当系统处于力学量的本征态ψ时，力学量的取值就是确定的。无论你测量多少次，测量结果都会是本征值**a，对应的本征方程就是Aψ=aψ**。

我们再看看定态薛定谔方程**Hψ=Eψ，跟算符的本征方程（Aψ=aψ）是不是很像？一般情况下，能量对应的算符就是哈密顿算符H，如果ψ又是能量本征态，那Hψ=Eψ不就是能量**的本征方程了么？

但问题是：这个ψ是能量的本征态么？

如果ψ不是能量本征态，那定态薛定谔方程Hψ=Eψ就不能看作能量本征方程。因此，如何判断这个ψ是不是能量本征态呢？

首先，我们回想一下这个ψ是怎么来的：我们假设势函数V不依赖时间，然后把波函数Ψ(x,t)拆成了时间和空间部分的乘积ψ(x)φ(t)，而这个ψ就是空间部分。

咋一看，这个ψ似乎跟能量本征态没啥关系，但光看不行，我们还得计算。

如果ψ真的是能量本征态，那E就是对应的能量本征值。这时候，你去测量系统的能量，测量结果就一定是本征值E，平均值也一定是E。

因此，如果你想证明ψ是能量本征态，就得先证明哈密顿算符Ｈ在状态ψ的平均值等于Ｅ。如果平均值都不等于Ｅ，那这肯定就不是本征态了。通过计算，我们发现哈密顿算符H在状态ψ的平均值确实等于E。

当然，光平均值等于E还不够，因为能量本征态的意思是：无论你测量多少次，结果都是E。现在你只说哈密顿算符H在状态ψ的平均值是E，万一这个E是由0.5E和1.5E平均出来的呢？也就是说，如果我们测量粒子的能量，它有50%的概率是0.5E，有50%的概率是1.5E，这样平均值依然是E。但是很显然，这并不是能量的本征态。

所以，除了平均值等于E，我们还要保证它没有弥散，没有波动，用统计语言说就是方差和标准差都必须为0。通过计算，哈密顿算符H在状态ψ的标准差也确实为0（计算过程都略了，我这只讲思路，大家最好自己去算一算）。

平均值等于E，标准差为0，这样我们才能保证每次测量的结果都是Ｅ，才能确定ψ是本征态。于是，我们才能光明正大的说：当势函数V不依赖时间时，定态薛定谔方程Hψ=Eψ描述的状态，正是能量的本征态，定态薛定谔方程就是能量的本征方程。而这个常数E，不是别的，它正是本征态ψ下系统的能量，大功告成！

也就是说，如果势函数V不依赖时间，系统就处于定态，也就是能量本征态。在这种状态下，测量系统的总能量，总会得到确定值E。

为什么势函数不依赖时间，总能量就是确定的呢？我举个简单的例子大家就明白了。

一个苹果往下落，苹果下落时重力势能转化成了动能。但大家都知道，这个过程中苹果的总能量（动能+重力势能）并没有改变，它是守恒的，有一个确定值E。为什么苹果下落时能量守恒呢？因为苹果的重力势能mgh不依赖时间，它只跟苹果的高度h有关。也就是说，让苹果的势能函数mgh不依赖时间，结果就导致了能量守恒，导致了苹果的总能量一直是定值E。

如果苹果的势函数V依赖时间，那它的动能和势能之和就不再是一个定值（最简单的，苹果静止不动时，动能不变，但势能随时间变化，所以总能量必然也随时间变化，就不再守恒），总能量也就不再是定值E了。

这里的言外之意是：苹果这个系统还**跟外界系统存在能量交换**。比如，我们拿根绳子上下拉苹果，那苹果的动能和重力势能的和就肯定不是定值。因为我们的手会对苹果做功，苹果跟我们之间存在能量交换。

这样，大家明白定态薛定谔方程Hψ=Eψ的意义了吧？

29势函数

****

我们前面不是在讲能量的连续性么，为什么这里要花这么大篇幅讲定态薛定谔方程呢？

因为能量也是力学量，而力学量要用算符来描述，力学量的取值就是算符对应的本征值之一。所以，你想知道能量可以取哪些值，就得知道对应的哈密顿算符有哪些本征值；想知道哈密顿算符有哪些本征值，就得知道它的本征方程是什么。

现在，我们找到了哈密顿算符H的本征方程，发现它竟然就是定态薛定谔方程Hψ=Eψ。于是，我们才能继续讨论能量的连续性问题。

大家再来看看定态薛定谔方程，也就是能量本征方程：

从方程上看，系统的一个状态ψ（能量本征态）就对应了一个能量E（能量本征值）。你想知道能量E的情况，就得先知道系统状态ψ的情况。

那么，如何知道描述系统状态的波函数ψ呢？

这个前面讲过了：解薛定谔方程就行了！顺便提一句，虽然一开始说的波函数是指跟时间t相关的Ψ(x,t)，但习惯上，我们把定态薛定谔方程里这个只跟空间x相关的ψ(x)也称为波函数，大家知道就行。

也就是说，如果我们想知道粒子的能量是如何取值的，是连续的还是离散的，就得知道描述粒子状态的波函数ψ可以如何取值。想知道波函数ψ如何取值，就得解定态薛定谔方程。

在定态薛定谔方程里，除了能量E和波函数ψ，还有一个未定的势函数V。也就是说，不同的势函数（比如不同的电磁场）会有不同的解，进而得到不同的波函数ψ，以及不同的能量取值。

所以，我们不能笼统地说量子力学里的能量是连续的还是离散的，而是要根据不同的势函数区别对待。

30自由粒子

****

一如既往，我们还是由易入难，从最简单的入手。那什么样的势函数最简单呢？当然是势函数V=0，也就是没有任何外界约束的时候。

在牛顿力学里，如果合外力为0，粒子就会做最简单的静止或者匀速直线运动。到了量子力学，如果势函数为0，粒子会如何运动呢？

很显然，当势函数V恒等于0时，它依然是不依赖时间的。那么，我们就可以继续使用定态薛定谔方程来处理问题。

在定态薛定谔方程里，如果V=0，方程就变成了这样：

这是个非常简单的微分方程，我们可以轻而易举地写出它的一般解，此时的波函数ψ长这样（不会解的自己去翻书，我就不在这里科普如何解微分方程了~）：

这个解是什么意思呢？大家中学都学过三角函数，像Asinkx这样的是一个正弦波。A越大，正弦波震荡得越高，波峰跟波谷的距离越大；k越大，正弦波就越密，两个波峰之间的距离就越小。

很显然，如果A和k不受任何限制，可以随意取值的话，那这个正弦波的图像就也可以随意变化。它可以随意的高，也可以随意的密，余弦波Bcoskx类似。

因此，我们解势函数V=0的定态薛定谔方程，得到的波函数ψ(x)是一个正弦波Asinkx和余弦波Bcoskx的叠加，即ψ(x)=Asinkx+Bcoskx。由于势函数V处处为0，对粒子没有其它约束，所以，我们就没有其它条件来约束A、B、k的取值。换句话说，A、B、k可以随意取值。

A、B我们可以先不管，但这个k是跟能量E紧密相连的：

k越大，波越密，对应的能量E就越大。

现在，我们说这个k可以随意取值，那这个E自然也可以随意取值。也就是说，当势函数V=0时，这个自由粒子的能量E可以取任意的正实数，它显然是连续的。

于是，我们就得到了第一个结论：自由粒子（势函数V=0）的能量取值是连续的，它可以取任何正的能量值。

是不是有点吃惊？可能在你的印象里，量子力学里的能量肯定都是不连续的。却没想到我们的第一个结论，最简单的自由粒子的能量竟然就是连续的。

大家要记住，“能量是否连续”并不是量子力学的基本假设，基本假设就是前面说的态矢量、算符、测量、薛定谔方程那些。我们从这些假设出发，算出能量是连续的就是连续的，算出能量是离散的就是离散的，仅此而已。

那问题来了，大家熟悉的那种不连续的能量，那种一份一份的能量是怎么来的呢？

31一维无限深方势阱

****

你想想，自由粒子的能量E之所以连续，是因为它对波函数ψ(x)=Asinkx+Bcoskx没有任何约束，于是Ａ、B、k可以随意取值。如果我们再加上一些限制条件呢？如果我不让k随意取值，那对应的能量E是不是也就不能随意取值了？它是否会因此变成不连续的呢？

空想是没有用的，我们还得用计算来说话。我们给自由粒子加上一个非常简单的限制：把粒子关在一个“地牢”里，不让它出去。

什么意思？自由粒子不是任何地方的势函数都为0，在任何地方都没人管么？现在我在左右两边加两块铜墙铁壁，把它关起来。

如上图，在0到a这个范围内，势函数V依然等于0，粒子在这个范围内依然是自由的。但是，在这个范围以外，也就是小于0以及大于a的地方，势函数V都是无限大，粒子别想过去。

这个东西很像一个陷阱，因为是一维的，又是方形的，而陷阱外的势函数又是无限大，所以就叫它一维无限深方势阱。

那么，这样一个势阱会对波函数做出什么样的限制呢？在势阱内，也就是0到a的范围内，势函数还是0，跟自由粒子的情况没啥区别。但是，到了势阱外，势函数就是无限大，粒子无法“出去”，这就不一样了。

在经典力学里，我们说一个粒子无法出去，是说它的位置坐标不可能离开那个范围。但到了量子力学，粒子在一般情况下压根就没有确定位置，只有在某个位置发现粒子的概率|ψ(x)|²。现在势阱外的势函数无限大，我们说粒子无法出去，意思是在势阱外发现粒子的概率为0，也就是|ψ(x)|²=0，即ψ(x)=0。

由于x=0和x=a是势阱的左右边界，所以这两个地方的波函数也必须为0：ψ(0)=0，ψ(a)=0。于是，我们就得到了两个约束条件。

那么，这两个约束条件会给系统带来什么变化呢？它又会使粒子的能量E发生什么变化呢？我们来一个个的看。

先看第一个ψ(0)=0，因为ψ(x)=Asinkx+Bcoskx，所以ψ(0)=Asin0+Bcos0=B（因为sin0=0，cos0=1）。如果ψ(0)=0，那我们就得到了B=0。这样，波函数ψ(x)就只剩下了第一项ψ(x)=Asinkx。

如果波函数ψ(x)=Asinkx，而第二个条件又告诉我们ψ(a)=0，代进去就得到了Asinka=0，这又是什么意思呢？

前面讲过了，正弦波sinx的图像是这样的：

所以，Asinka=0就有两种可能：A=0或者sinka=0。

A=0是一种非常无趣的情况，因为B已经等于0了，如果你再A=0，那就直接是整个波函数ψ(x)=0了。翻译一下就是：在任何地方发现粒子的概率都为0，这就是说没有粒子嘛。所以，这是一个平庸的解，也不符合现在的情况。

真正有意思的是后面那个解，也就是sinka=0的情况。我们看一下正弦函数sinx的图像，它的取值是可以为0的，你看它跟x轴不是有很多交点么？这些交点就是sinka等于0的地方。

也就是说，如果我们想让sinka=0，我们只需让ka取正弦函数跟x轴相交的那些地方就行了。学过中学三角函数的朋友都知道，正弦函数跟x轴相交的地方，只考虑正半轴，正好就是π，2π，3π，…

这么一来，ka就不能随意取值了，而是只能取π，2π，3π等等，写成更加紧凑的形式就是：

而我们又知道，这个k是跟粒子的能量E直接相关的。解势函数V=0的定态薛定谔方程时，为了让形式更加简单，我们给能量E做了一个简单的替换：

现在k的取值知道了，能量E的取值简单替换一下就行了：

于是，这个能量E就真的是离散的了，因为这里的n只能取1、2、3等自然数。现在，大家看明白这个离散的能量是怎么来了的么？

32不连续性

****

自由粒子时，势函数V处处为0，它对波函数ψ(x)没有任何限制，所以k能随意取值，对应的能量E也能连续取值。但是，当粒子不再自由，而是被束缚在一个有限宽的势阱时，它就不能乱跑了，k也不能随意取值了。于是，对应的能量E也不能随意取值了，也就是不连续了。

在一维无限深方势阱里，我们要求波函数ψ在势阱两边的取值都为0，即ψ(0)=ψ(a)=0，这相当于固定住了一根绳子的两端。于是，在0到a之间，这根绳子可以弯成一个波形，也可以弯成两个波形、三个波形，就像下图这样：

因为ψ(x)代表了系统状态（能量本征态），所以，这每一种可能的波形，就代表了系统可能的一种状态，对应了一个确定的能量E。

在经典力学里，我们用一个粒子的位置和动量描述它的状态。就算我们把粒子关在一个牢房里，限制它的活动范围，它在牢房里的位置和动量依然可以连续变化，能量也可以连续变化，它在牢房里依然可以连续走动，没人管它。

但到了量子力学，这个牢房不仅限制了它的活动范围，还限制了它的状态，限制了它的能量，让它不能再随意取值。

在一维无限深方势阱里，求解定态薛定谔方程得到的波函数是一个正弦波。作为一个波，它有自己的傲气和傲骨，即便身陷囹圄，活动范围受到了限制，它还是要保持波的样子。所以，粒子的状态和能量就出现了离散化。

这样，大家对量子力学里的不连续性是否有了更深刻的认识？

33氢原子

****

在量子力学的基本假设里，我们没有对能量是否连续做出任何假设，我们只说用态矢量描述系统状态，用薛定谔方程描述系统状态随时间的变化。

当势函数V不依赖时间时，系统就处于定态（能量本征态），这时候测量能量就有确定值。能量有确定值，我们才能谈论能量的取值是连续的还是离散的。如果系统处于能量叠加态，都没有确定的能量值，那这问题就没啥意义了。

势函数确定后，我们求解定态薛定谔方程就能得到描述系统状态的波函数，进而得到能量的情况，然后就知道了能量的取值是连续的还是离散的。

当势函数V=0时，粒子完全自由，它的能量是连续的；当势函数不为0，而是一维无限深方势阱时，粒子的能量就变成离散**的**了。如果我们再换一种环境，再换一个势函数，这个操作流程还是一样的，都是把对应的势函数代入薛定谔方程求解，再根据波函数分析能量的取值情况。

比如，我们知道氢原子是由一个质子和一个核外电子组成。那么，这个电子的能量可以取哪些值呢？是连续的还是离散的？

同样的，要分析电子的行为，我们就要知道它的势函数。而我们很清楚，电子和质子会互相吸引，根据库仑定律，这个势函数V可以写成：

然后，我们把这个势函数代入定态薛定谔方程，经过一系列我们觉得非常复杂，但在量子力学里还算简单的计算，就能得到氢原子里电子可以取的能量：

这就是著名的玻尔公式，玻尔从他的模型里得到了这个公式，进而名扬天下。现在，我们可以从薛定谔方程里把它非常自然地推出来。

这个求解过程我就不说了，任何一本量子力学教材都会写。但结果很明显，跟一维无限深方势阱一样，库伦势下的电子可以取的能量值一样是离散的，它只能取一些特定的值。n=1是能量的最低状态，也叫基态，其它情况被称为激发态。

34原子模型

****

在量子力学历史上，氢原子问题一直都很重要。现在我们知道了量子力学里处理氢原子的方式，那不妨再回过头，看看经典力学是如何处理氢原子的，看看它遇到了什么困难，这对我们深入理解量子力学也很有好处。

在量子革命前夜，困扰经典力学的有四大难题：包括大家很熟悉的黑体辐射和光电效应，以及大家不太熟悉的原子光谱和原子稳定性问题。后两个问题都跟原子模型有关，而氢原子又是最简单的原子，所以它非常重要。

说到原子模型，首先出场的是汤姆生。他认为原子是个球体，带正电的物质均匀分布在球内，带负电的电子一颗一颗镶嵌在球内，这个模型被称为“枣糕模型”。

但是很快，汤姆生的模型就被他的学生卢瑟福打脸了。卢瑟福用α粒子轰击金箔时，发现绝大部分α粒子都会通过金箔，但有极少数α粒子竟然会反弹回来。

这是什么意思呢？如果原子里带正电的物质都均匀分布，那用α粒子轰击原子，就会像用子弹轰击蛋糕一样，是绝不可能被反弹回来的。现在有极少量α粒子被反弹回来了，那就说明原子内部有极少量非常坚硬的东西。

卢瑟福经过反复的实验和思考，认为带正电的物质只能集中在一个非常小的范围内，原子的质量也主要集中在这里，这就是我们说的原子核。这样，带正电的原子核就像太阳，带负电的电子就像围绕太阳转的行星，卢瑟福的原子模型就被称为“行星模型”。

行星模型虽然跟实验符合得很好，但却存在一个巨大的理论问题：如果电子真的在绕核转动，那根据经典电磁理论，电子转动时就会不断释放能量。这样的话，当电子的能量消耗殆尽以后，它就应该坠入原子核，原子也就随之毁灭了。

但我们都知道，世界很稳定，原子并没有毁灭，电子也没有坠入原子核。那问题就来了：原子为什么能保持稳定？电子为什么没有因为不断释放能量而坠入原子核？

这就是原子的稳定性问题，它是经典物理无法回答的。

卢瑟福无法解决这个问题，就把它丢给他的学生玻尔。玻尔捣鼓了一段时间，在充分吸收了普朗克、爱因斯坦的量子化思想后，提出了一套全新的原子模型。

玻尔认为，电子的轨道并不能随意选，它只能处在一些特定的轨道上。当电子处在这些特定轨道上时，电子并不发射、吸收能量（所以不会坠毁），只有当电子从一个轨道跃迁到另一个轨道时，才会发射和吸收能量。

玻尔的模型是一个经典和量子的混合体，里面既有量子化轨道这样的概念，也有电子绕核转动这种经典模型。从理论上来说，这样一个“缝合怪”必然槽点满满（当时也确实没人相信它），这个模型也确实无法解释更复杂的原子。

但是，相比理论，物理学家更看中你的模型能否解释实验现象。当越来越多的实验站在玻尔这边时，大家就慢慢接受了玻尔模型的主要思想，承认这里面确实有部分正确的东西。同时，大家也在期待一个更完美的理论，希望能从那里导出玻尔模型，并解释玻尔模型无法解释的东西。

大概十年后，随着量子力学的全面建立，一切都清晰了。那么，现在的量子力学是如何看待玻尔模型的呢？

首先，我们要明确：在量子力学里，电子是没有轨道概念的。什么是轨道？电子这一秒在这，下一秒在那，它每个时刻的位置都能精准算出来，这是轨道。但是，量子力学里电子在一般状态下并没有确定的位置，我们只能计算在各个地方发现电子的概率，所以根本谈不上轨道。

但我们也知道，玻尔模型是符合实验的，它肯定也包含了一些正确的东西。那么，如果量子力学里并没有确定的轨道，那玻尔说的轨道又是什么？

在前面，我们已经解了库伦势下的薛定谔方程，并得到了玻尔公式：

这里每一个可能的E，都代表了电子可能的一种状态。没错，这其实就是玻尔说的“轨道”。

每一个“轨道”，其实就是一种定态，是一种能量本征态。因为库伦势下电子可以取的状态和能量都是离散的，所以玻尔才会觉得电子只能待在一些特定而离散“轨道”上。

为什么电子没有坠入原子核呢？因为在这些允许的能量E里，有一个最小值，即n=1时的基态能量（这里能量取负值，负号代表电子受到了原子核的束缚，E1=-13.6eV，E2=-3.4eV…），电子的能量无法比它再小，所以无法坠入原子核。

这样，大家对原子问题有更深刻的认识了么？

35双**缝实验**

****

我写这篇文章，主要是想帮大家把量子力学的基本框架搭起来，让大家知道如何从量子力学的视角看问题。

很多人觉得量子力学奇怪、诡异，甚至恐怖，根本原因就是：他们并不是从量子的角度看待量子问题的。他们有意无意地保留了许多经典的概念和思维，用半经典半量子的眼光看待量子世界，这样不觉得奇怪才怪了。

在量子革命初期，在量子大厦还没建起来之前，那些大师们用更加熟悉的经典思维思考问题无可厚非。他们四处碰壁，经过各种艰苦卓绝的探索才建立起了成熟的量子力学框架。一百多年后的今天，难道我们还要用半经典半量子的视角看问题，还要在量子初期的那些泥潭里一直摸爬打滚么？

很多人觉得量子力学很奇怪，觉得没人能懂量子力学，并引以为傲地说许多物理大师也是这么说的。但请相信我，绝大部分人觉得量子力学奇怪，仅仅是因为他们对量子力学的基本概念、基本框架缺乏最基本的认识，他们陷在半经典半量子的泥潭里出不来，跟物理大师眼中的奇怪根本不是一回事。

就像同样是数学，有人说解一元二次方程太难了，有人说黎曼猜想太难了，都说数学难，但这能是一码事么？如果大家把量子力学的框架搭起来了，学会了从量子视角看问题，那原先很多看起来非常反直觉，非常不可思议的东西都会变得非常自然。

比如，被无数科普文扣上恐怖、细思恐极、颠覆三观帽子的单电子双缝干涉实验，如果从量子力学的角度看，它就是一个平平无奇的实验。

为什么那么多人觉得双缝实验恐怖呢？因为他们是从经典视角看这个实验的。

从经典视角看，单电子双缝干涉实验比较“诡异”的地方有两个：第一，大家熟悉的干涉实验都是有大量粒子参与的，不同粒子之间产生干涉容易理解。但是，现在我们每次只发射一个电子，时间一长，屏幕上居然还能出现干涉图案，这就难以理解了。

每次只发射一个电子，你跟谁干涉？没有干涉对象怎么会有干涉图案呢？这就好像每个电子都有意识，知道自己前后的电子要往哪走似的，这种氛围再配上点恐怖音乐，就显得很诡异了。

更加“诡异”的是第二个：我们一个个放出电子时，屏幕上会慢慢出现干涉图案。但是，一旦我们在缝隙后加了一个探测器，想看看电子到底通过了哪条缝隙，干涉条纹就消失了。

从经典视角来看，这里原本有个干涉图案，我“看”一眼电子要从哪经过，干涉图案就消失了。仿佛意识可以影响实验，或者电子能读懂我的心灵似的，这里再渲染一下气氛，那就不是诡异，而是恐怖了。

我去网上搜了一下“双缝实验”，大家看看这些热搜词：

都是些什么恐怖、骗局、真相，更夸张的连“双缝实验看见鬼”都冒出来了。一个科学实验搜出一堆这样的东西，也是没谁了。

当然，从经典视角看，双缝实验的确非常诡异，非常恐怖。但是，从量子视角看，你会发现这是一个非常自然的实验，它所体现的，无非就是量子力学最基本的一些特性。

首先，为什么每次发射一个电子也会出现干涉图案呢？

在量子力学里，我们用波函数（态矢量）描述电子的状态，而这个状态是可以叠加的。也就是说，如果ψ1是电子的一个可能状态，ψ2也是电子的一个可能状态，那么，它们的线性叠加ψ=ψ1+ψ2就也是电子的一个可能状态（ψ1、ψ2前面可以有不同的系数），这叫态叠加原理。

这个大家应该觉得很自然。在斯特恩-盖拉赫实验里，银原子可以处于自旋向上的本征态ψ1，也可以处于自旋向下的本征态ψ2，那么，它就也可以处于自旋向上和自旋向下的叠加态ψ=ψ1+ψ2，这再正常不过了。

而且，我们还知道测量力学量的概率是跟波函数的模的平方|ψ|²挂钩的。

然后，我们就会发现：叠加态对应的概率|ψ|²=|ψ1+ψ2|²并不等于原来各个状态的概率之和|ψ1|²+|ψ2|²，它们之间还差了一个**交叉项，小学数学老师也会经常强调“和的平方不等于平方的和”。而这个交叉项**，就是干涉出现的原因。

其实，经典力学里波的干涉也是因为交叉项。因为波的强度也是平方相关的，所以，两个光波叠加的强度就不等于每个光波的强度之和（强度跟平方相关，会多出交叉项），而我们看到的明暗程度又跟光的强度有关，于是就出现了干涉条纹。

在量子力学里，两个波函数叠加的概率并不等于每个波函数的概率之和（|*ψ1+ψ2*|²≠*|ψ1|²+|ψ2|²*），所以叠加态的概率分布图像就不是原来两个概率图像的简单叠加，这样就出现了一种概率上的干涉。时间一长，概率大的地方就会积聚更多的粒子，于是，概率上的干涉图像就变成了真正的干涉图像。

也就是说，量子力学里的单电子双缝干涉跟经典干涉没啥区别，都是因为叠加性。经典力学里两个波可以叠加，量子力学里描述系统状态的两个波函数（态矢量）也可以叠加，而它们的可观测量（强度和概率）又都是平方相关的，所以叠加后就会多出一个交叉项，然后就出现了干涉图案。

至于“看一眼干涉图案就消失了”那就更简单了。不管你用什么看，人眼、仪器或者一只狗，只要我们知道了电子是从哪个缝隙通过的，本质上就是通过跟系统的相互作用完成了一次测量。而量子力学里的测量是会改变系统状态的，它会让系统从原来的状态变成被测力学量的某个本征态，这我们太熟悉了。

所以，当你测量电子会通过哪个缝隙时，这个操作就改变了电子的状态，让电子从原来的状态变成了某个本征态。状态变了，概率分布也就变了，于是干涉图案自然就消失了。有的书上说单电子的双缝干涉是电子自己跟自己干涉，其实是说这是电子的两个状态（通过缝隙1的状态和通过缝隙2的状态）之间的干涉。而测量过程会改变电子的状态，于是就破坏了干涉图案。

可见，如果我们建立起了量子力学框架，从量子视角看，双缝实验就是非常简单而且自然的。它无非就是在说“系统状态可以叠加，测量会改变系统状态”，这些基本结论有什么好奇怪的？又哪里有半分恐怖？你非要用经典视角看问题，然后自己吓自己，说哎呀妈呀好恐怖，三观震裂，那我还能说什么呢？

当然，这里只是对双缝实验做了一个非常简单的介绍（后面再单独写文章详细谈），目的就是让大家知道：如果我们学会了从量子视角看问题，很多你之前觉得奇怪、诡异、恐怖的问题都会变得非常自然。你觉得双缝实验恐怖，跟古人觉得闪电恐怖没啥区别，一旦掌握了看待这些问题的正确视角，它们都是非常自然的现象。

36不确定性原理

****

此外，很多人觉得不确定性原理也很神秘，其实它也很自然。大家看一张格里菲斯的《量子力学概论》里的插图很快就明白了：

上面那个图，你很难说这个波在哪，但却很容易说两个波峰之间距离（也就是波长）是多少；下面那个图，你很容易说这个波在哪，却说不出它的波长是多少。

也就是说，如果波长越精确（上图），波的位置就越不精确；如果波的位置越精确，波长就越不精确（下图）。

在量子力学里，我们用波函数描述系统的状态，而波长λ跟动量p之间有一个简单的关系：p=h/λ。用动量代替上图的波长，于是就有：动量越精确，位置就越不精确；位置越精确，动量就越不精确。

此外，我们也能看到，一个波的位置越确定，它的波长就越不确定，这是系统的内在属性，跟你测量不测量无关。海森堡一开始以为是测量干扰了其它物理量，进而导致测不准，后来才知道并不是这样。

关于不确定性原理，这里就先简单地聊这些，因为这篇文章让我意外地发现：原来公众号的文章最多只能写5万字，再多就发不了了！我这已经是在极限边缘疯狂试探了，更详细的以后再聊吧~

37量子力学诠释

****

量子世界还有许多激动人心的话题，比如薛定谔的猫、玻尔和爱因斯坦的论战、贝尔不等式、多世界理论、狄拉克方程、量子场论、量子纠缠、量子通信和量子计算等等，这里就先不说了。但大家要清楚，我们能愉快讨论这些话题的前提，是你已经掌握了量子力学的基本框架，知道如何从量子视角思考问题，否则就只是看个热闹。

例如，很多人都知道玻尔和爱因斯坦的论战，但很少有人知道他们到底在争什么。有些人只是给爱因斯坦贴了一个“反量子力学”的标签，认为爱因斯坦先是参与了量子力学的建立，成为权威后变保守了，又开始反对量子力学，那也太肤浅了。

为了搞清楚玻尔和爱因斯坦到底在争什么，我们要先搞清楚一件事，一件很重要，但又很容易被忽略的事：量子力学的形式理论（或者说对量子力学的数学描述，也叫裸量子力学）和对量子力学的诠释是不一样的，我们一定要区分两者。

什么意思？我们观察自然界的各种现象，发现物理规律，然后用数学语言描述它。一开始，我们只要理论能给出正确的预言，计算结果能跟实验符合就行了，并**不追问这些数学语言背后代表了什么样的物理现实**。

比如，德布罗意提出了物质波假说以后，薛定谔就找到了对应的波动方程，也就是大名鼎鼎的薛定谔方程。通过薛定谔方程，我们能很好描述各种量子现象。但是，对于薛定谔方程的解，也就是波函数到底是什么？大家却莫衷一是。

也就是说，虽然我们用波函数描述系统的状态，而且这样工作得非常好。但是，这个波函数到底是个什么东西？它是描述了粒子的真实状态（实在的），还是说只是我们认识粒子的工具，描述的仅仅是我们对粒子的认识状态（非实在的）？这其实是一个哲学上的本体论问题，我在文章里对此类问题只字未提。

我在这里介绍的量子力学框架，实际上只是一套量子力学的数学描述，我们可以说它是量子力学的形式理论或裸量子力学。如果我们想追问这套数学语言背后的物理图像，就涉及量子力学诠释了。

所谓诠释，就是对一套数学语言背后的物理图像进行解读。我们用态矢量描述系统状态，用算符描述力学量，用薛定谔方程描述系统状态随时间的变化，这些都是对量子现象的数学描述，是量子力学的形式理论。对于这些，是所有人都承认的，不管爱因斯坦还是玻尔。

但是，如果我们想知道这套数学语言的背后对应了一个什么样的物理世界，想知道波函数到底是什么，诠释就出现了。面对同样一套形式理论，诠释可以是多种多样的，于是，玻尔和爱因斯坦的分歧就出现了。

以玻尔为首的哥本哈根诠释认为：波函数并不描述粒子的真实状态，它只是我们认识量子世界的工具，波函数只有认识论上的意义。当我们测量时，波函数会瞬间坍缩。而且，虽然系统状态的演化遵守薛定谔方程，但测量导致波函数坍缩的过程却不遵守薛定谔方程……

哥本哈根诠释还有很多观点，这里就不一一列举了。玻尔他们通过这样一种诠释，构建了一幅相对完整的量子图像。这样，大家在处理量子力学问题时脑袋里就会有一个具体的画面。

当然，虽然哥本哈根的量子图像跟实验对得上，但它理论上的问题也很多：波函数在测量过程中瞬间坍缩，而且这个过程不满足薛定谔方程，那坍缩过程是如何发生的？测量在这里如此重要，那什么样的行为可以算是测量？为什么会有两类演化过程，一类遵守薛定谔方程，另一类不遵守？量子世界和经典世界如此不一样，你给它们划了一条界线，那这条界线到底在哪？

更加重要的是，哥本哈根诠释说波函数并不描述电子的真实状态，它只是一个认识工具。他们认为根本就不存在什么真实的电子状态，只有当我们测量时发现了电子，才能说电子存在。因此，站在哥本哈根的角度，是我们的测量过程创造了电子，你不测量时电子就不存在。

这种说法彻底激怒了爱因斯坦，他说：“难道我们不看月亮时，月亮就不存在了么？”。大家更熟悉爱因斯坦的另一句“上帝不投骰子”，但其实，相比投不投骰子，爱因斯坦更在意月亮存不存在。大家经常在科普书里看到玻尔和爱因斯坦的论战，爱因斯坦反对的不是量子力学（没人反对量子力学的形式理论），他反对的是量子力学的哥本哈根诠释。

爱因斯坦非常讨厌哥本哈根诠释（薛定谔、德布罗意也是），于是，他就一边挑哥本哈根诠释的漏洞，一边找一些新诠释。但是，虽然哥本哈根诠释的问题很多，但它跟实验也都对得上，而它的竞争对手们当时又太弱，爱因斯坦的超一流挑刺功力也在不断帮哥本哈根诠释打补丁。再加上玻尔、海森堡、玻恩这帮人在量子领域的权威，爱因斯坦到死也只能一边看它不爽，一边拿它也没什么好办法。

爱因斯坦去世两年后，一个叫埃弗雷特的人提出了一种了全新的量子力学诠释：多世界诠释。

这是一个在理论上极其简洁，但在推论上似乎极其“荒诞”的诠释。多世界甚至可以说是不要诠释的诠释，因为它的基本假设就两条：第一，系统状态由态矢量描述；第二，态矢量随时间的演化遵守薛定谔方程（可见，它跟我们这里讲的形式理论并不太一样，所以，多世界也不只是一个诠释，它还是一个独立的理论）。

哥本哈根诠释的那些额外假设（测量导致的坍缩，量子和经典的边界问题等等）它通通不要，玻恩规则也不要，这些东西在多世界这里不是假设，而是结论。它一样能跟所有实验符合，也不存在什么“不看月亮，月亮就不存在”的问题。

在多世界诠释（理论）里，波函数描述的是粒子的真实状态（实在的），测量只不过是仪器跟系统的相互作用，测量过程也遵守薛定谔方程，并没有什么波函数坍缩。它还有很多其它观点，这些观点一起也构成了一幅完整的量子力学图像，但是很明显，这是一幅完全不同于哥本哈根诠释的图像。

细节这里先不讲，以后再说。不过，从这里我们起码能看到：哥本哈根诠释里有波函数坍缩，多世界诠释里没有波函数坍缩；哥本哈根诠释里波函数不描述粒子的真实状态，多世界诠释里波函数描述粒子的真实状态；哥本哈根诠释里有量子-经典边界问题，多世界诠释里没有……

这两个诠释有很多不一样的地方，但它们都跟实验符合，你说我听谁的？

哥本哈根诠释有时也被称为正统诠释，很多教材也都是以哥本哈根形式写的。时至今日，多世界诠释也有了非常多的支持者。然而，不管是哥本哈根、多世界，还是其它什么诠释，支持者的比例都很低，更多物理学家的选择是：不要诠释！不要诠释！不要诠释！

他们就拿量子力学的形式理论来做计算，能算、有用就行！至于它背后的物理图像，去你的玻尔和爱因斯坦，我谁都不信，他们是闭嘴计算派。当然，闭嘴计算并不代表他们不关心诠释，没有哪个物理学家会真的不关心量子理论背后的图像。只不过，现有诠释的说服力实在都不太够，没有哪个诠释能让人特别信服，所以他们就干脆不管了。

因此，很多量子力学教材也会有意识地避免诠释问题，它们就只介绍量子力学的形式理论，只介绍我们是如何运用数学语言描述量子现象的，只介绍这套所有人都承认的东西。

形式理论压根就不谈波函数有没有坍缩，它只说测量结果是对应算符的本征值之一。至于测量过程中到底发生了什么，是波函数坍缩了，还是世界分裂了，它不管。

有些朋友可能会感到很困惑：我学物理这么久了，为什么好像只在量子力学这里有诠释问题，学习其他理论时好像压根就没这事？比如，我们学习牛顿力学时，哪有什么诠释啊。

牛顿力学当然也有诠释，只不过，我们在牛顿力学里是采用三维空间中的实数和函数来描述质点和场的，这种描述具有很直接的空间意义。所以，大家对牛顿力学里什么概念代表什么物理意义，都能取得广泛的共识。一个石头往下落，描述这个过程的数学公式是这样的，大家脑中的物理图像也都是这样的，没人有异议。

但是，在量子力学里，我们是用希尔伯特空间中的矢量和算符来描述系统状态和力学量的，这是很抽象的数学结构。希尔伯特空间并不是我们日常接触的三维空间，这样一来，如何把数学概念和物理现实对应起来就比较麻烦了。于是，有人认为波函数描述了现实，有人认为并没有；有人认为测量时波函数坍缩了，有人认为没有坍缩等等。

不存在共识，也说明我们对量子世界的认识还不够深刻。随着理论和实验的进步，我们以后或许能区分不同的诠释，能搞清楚许多现在还不懂的事情，形成一幅所有人都同意的量子力学图像。到那时，自然就没人再提什么量子力学诠释了。

量子力学诠释是一个非常宏大而且深刻的话题，它不仅跟物理学有关，也跟哲学有关，可以说爱因斯坦的后半辈子一直都在思考它。

在这篇文章里，我们只要知道有量子力学诠释这么回事，知道形式理论和诠释的关系，知道我们这里介绍的只是量子力学的形式理论就行了。关于量子力学的诠释更多问题，我们以后再慢慢聊。

这样，文章就接近尾声了。

38结语

****

在经典力学里，系统状态、可观测量和观测结果都是一样的，我们没必要刻意区分它们。到了量子力学，为了描述斯特恩-盖拉赫实验以及其它量子现象，我们必须区分三者。

我们用态矢量描述系统状态，用算符描述力学量，测量结果是对应算符的本征值之一，系统状态随时间的变化遵守薛定谔方程。

为了把抽象的态矢量具体化，我们要建立坐标系。然后，我们发现以力学量算符的本征矢量为基矢建立的坐标系是极好的，选取这样一组基矢就叫选取了一个表象。以位置算符的本征矢量为基矢建立的就叫位置表象，以动量算符的本征矢量为基矢建立的就叫动量表象，它们之间可以通过傅里叶变换相互转换。

选定了表象，我们就可以把态矢量投影到具体的坐标系里了，投影系数（坐标）就是波函数。于是，除了态矢量，波函数也可以用来描述系统的状态。

然后，我们也写出了位置表象下的薛定谔方程，求解方程就能得到波函数。要解薛定谔方程，就得先确定势函数。

如果势函数不依赖时间，概率分布就不随时间变化，力学量的平均值也就不随时间变化，这样的状态我们称之为定态。因为定态下的能量具有确定值，所以定态也就是能量本征态。能量有确定值，求解定态薛定谔方程就能得到系统可以取的能量，这样能量是连续的还是离散的一看便知。

于是，我们就知道了量子力学里能量不连续的原因，也知道了量子力学处理问题的一般方法。掌握了量子力学的思考方式，你会发现很多大家熟悉的量子力学性质（比如能量可以不连续）都能推出来，很多大家觉得奇怪、诡异，甚至恐怖的问题（比如双缝干涉实验）都会变得非常自然。

建立了量子力学的基本框架以及处理量子力学问题的一般方法，这篇文章的目的就达到了。限于篇幅，很多大家非常感兴趣的话题这里只能一笔带过，我们以后再讲，怕错过的盯着我的公众号“长尾科技”就行。

最后，我们还区分了量子力学的形式理论和诠释，这些东西后面会引申出非常多超级精彩的话题。但是，理解它们的前提，是已经把量子力学的形式理论搞清楚了。

量子大戏已经开幕，各位看官坐稳了~

技术文章

12.什么是量子力学？-2

为您推荐