(如果你的专业是物理,或者非常喜欢物理,我想你会喜欢的)
量子力学是个魔鬼。
其实曾经有一段时间,量子力学和广义相对论一起坐在至高天上,接受着大家的膜拜。可是随后量子力学就露出了它黑色的尾巴,开始在高校间大肆活动,用 “学术成果”“技术创新”“Paper”“Funding”诱惑各个院系管理人的灵魂。很不幸的是,越来越多的系主任们轻易的就将自己的灵魂出卖给了这个魔鬼;更有甚者,他们还顺便把自己管辖的学生的灵魂一并出卖以换取魔鬼面前更高的地位了……于是广大可怜无助的学生们只好默默忍受量子力学的折磨,用自己一点可怜的光亮照耀上头老板的前程……
好吧,我承认上面这一段其实完全是在扯淡(真的么?)。不过量子力学总是让接触他的人很头疼这确实是事实。作为20世纪物理学最重要的两大发现之一,量子力学极大的改变了人类的生活,在我们身边制造了一个又一个奇迹;可是,另一方面,量子力学的理论和原则似乎总是暧昧不明而且看上去又极大的违反了我们日常的观念,以至于第一次接触它的人很难在错综复杂的概念丛林之中找出一条通向理解的小径来。虽然相对论也和我们日常生活的“经验”有着很大的差别,但是相对论里人们的日常毕竟太遥远了,尤其是广义相对论,研究它的理论的物理学家基本可以算是物理学家中的物理学家了(或者其实叫物理学家中的数学家比较好?)。可是量子力学不同,只要跟原子分子有关,就不可避免的要和量子力学打交道,化学及其相关的专业就很自然而且很快的的被拖下了水;随后随着电子技术的发展,器件越做越小,电类专业也无可奈何的投降了;甚至到了最后,居然还出现了“量子计算”“量子信息”这种东西,一旁偷笑的计算机系也被当头来了一闷棍。量子力学不再是小圈子里自娱自乐的东西,而是确确实实的进入了更多人的学习生活。
一直以来,量子力学似乎就是理论物理最不清楚的分支,Bohr就曾经说过:“如果谁不为量子论而感到困惑,那他就是没有理解量子论。” 造成这种现象的原因很多,一方面是因为量子力学里有太多和经典物理里不同的概念,另一方面大概也和量子力学的建立过程有关。和相对论那种top-down 的建立方式不同,量子力学的形成是标准的bottom-up。最一开始Planck的黑体辐射公式只是内插得到的经验公式,他引入“量子(quanta)”的概念只是为了能够推导出正确的黑体辐射谱。Einstein的“光量子”、德布罗意的“物质波”以及Bohr模型都只能算是唯像模型,每一个模型基本只能解决某个特定的实验现象(例如Bohr模型只能解释氢原子的光谱,用到氦原子就傻了)。不过这些模型毕竟带来了概念上的巨大进步,基于这些概念诞生的“波动力学”(薛定谔)和“矩阵力学”(海森伯)可以算是真正意义上有普适意义的理论了。虽然两种表述看上去完全不同,海森伯还是成功的证明了两种形式的等价性。最后在30、40年代的时候由Dirac给出了一套标准的top-down的量子力学的体系,量子力学算是真正的建立完成(最后一点的时间我并不是很确定,我是按照Dirac的《量子力学原理》第三版和第四版的出版时间大致计算的,这本书基本上确定了现在我们使用的量子力学的基本形式)。不过在量子力学家们还没来得及庆祝的时候,Einstein又跳出来开始质疑量子力学的基本假设本身,引发了旷日持久的Einstein- Bohr之争。随后量子力学和狭义相对论的统一带来了更多概念上的争执与革新(不过这个基本上算是量子场论了)。旧有的想法不断的被放弃,新的想法不断的被提出,而后在不远的将来又变成旧的被放弃,量子力学就这样在磕磕绊绊之中前进。如果一个人试图按照历史的顺序追述量子力学的发展,那他一定会陷入巨大的概念的泥沼之中不可自拔,当他好不容易搞清楚20年代大家在说什么的时候,他会发现在30年代这些说法已经过时了(量子力学中有很多名词在现在已经完全丧失了最初的含义了,比如说“量子化”这个概念,现在通用的定义基本上和quantize这个词在英语里面的意思关系不大了,我后面会提到)。所幸的是,虽然Einstein在晚年的时候EP了一把(原谅我用这种说法),量子力学的基本假设和一些概念的定义在《量子力学原理》第四版里基本固定下来了,我们现在有了一个标准版本可以作为参照。
(题外话:量子力学的建立历史和广义相对论如此的不同甚至到了相反的地步。相对论、尤其是广义相对论在诞生的一开始,它们的基本公设就是非常明确的,随后的工作就像是几何学一般的自然和清晰。这一方面自然是因为Einstein超人的洞察力,看到了引力背后的几何结构;另一方面我认为也说明相对论仍然是一个经典理论,它对于概念上的突破无法和量子力学相比)
翻翻国内的量子力学课本,可以发现编排顺序基本都是这样的:Why quantum mechanics-波函数-薛定谔方程-氢原子(中心势)-角动量以及力学量用算符表示-微绕论。。。无论是曾谨言的两本“砖头”以及后来的“简明版”,还是周世勋小本基本上都是这个顺序(顺便一说,我猜周世勋就是折磨yumemi的直接黑手)。这一套讲法基本继承于朗道的《非相对论量子力学》。由于苏联一直一来有着很好的的分析传统,从薛定谔方程入手貌似是个很好的选择(而且这也是20世纪初期人们所熟悉的方式,这也是“波动力学”在一开始比“矩阵力学”受欢迎的原因)。可是另一方面,薛定谔方程也不可避免的将量子力学背后简明清晰的数学结构(线性代数)复杂化了,人们需要比较深的分析功底才会知道波函数、薛定谔方程和向量空间、矩阵是一回事。而且薛定谔方程也会给人带来了一种错觉,认为方程就是基础,波函数就是一切。这种认识是比较粗糙的,其实薛定谔方程和波函数只是量子力学无数表示中的一种罢了,量子力学的“本质”并不是这么繁复的东西。
每一个物理理论大致都可以氛围两个部分:运动学部分和动力学部分。运动学部分用来描述在某一固定时刻的被观测对象和物理量;动力学部分用来从已知的某个时刻预测对象和物理量在下一时刻的行为。举个例子,经典力学里面的质点模型和质点在某一时刻的坐标和动量属于运动学部分,而牛顿定律则属于动力学部分。量子世界观和经典世界观最大的分歧主要来自于运动学部分,而非动力学部分。事实上,薛定谔方程和海森伯的算符方程在经典力学中都有很明显的对应(自然,这个对应不是牛顿方程),这一点其实不算太奇怪,因为毕竟应用到宏观系统,量子力学本应该给出经典力学一样的描述,有趣的事实是经典力学本身的理论结构已经发展到了非常“完备”的程度以至于量子力学在这方面突破的可能变得很小。
量子力学的运动学部分确实颠覆了很多人们长久一来形成的常识:一个电子的“波函数”可以和另一个电子的“波函数”在空间上重叠,*河蟹*了一直以来物质的“不可入性”的假设。而且这种重叠还会带来“干涉”和“衍射”的效果。我们对于一个系统的测量也会不可避免对系统本身带来干扰,而且和经典物理不同,这种干扰在很多情况下无法避免,而且不会因为测量手段的进步而消除……这些现象是如此的违反“常识”但是又确确实实的存在,因此Dirac只能感叹:
Dirac这段话看上去有些不负责任,但其实这才是真正严肃的做法。当时所谓的“直观”和“图像”其实都来源于经典物理。当经典物理已经明显不适用的时候,还试图相信这些“图像”确实是很可笑的行为。Dirac后来写到:
其实Dirac所描述的过程在300年前已经发生过了。在当时,牛顿第一定律(惯性定律)本身就是违反“常识”的:在对摩擦力缺乏概念的情况下,人们很容易相信静止是物体的最终状态,运动的物体最终趋向于静止。只有从伽利略开始,人们才渐渐意识到运动和静止的相对性以及惯性定律。物理学的诞生其实本身就是为了抛弃简单的直观,寻求自然的更本质的描述方式。量子力学的发展似乎是历史的一个有趣的轮回(或者说:事物都是螺旋形发展,哈哈),不过挺多著名的物理学家在这个过程中扮演并不是很正面的角色。在量子力学诞生的时候,也许我们确实需要一些图像性的描述和讨论来让更多的人接受它。但是现在,量子力学的基本形式已经固定,量子力学本身也成为一个“经典(的)”理论的时候,从基本公理出发也许是更好的理解量子力学的方式。
说了这么多,也许我们是时候来看一下量子力学的运动学部分到底是怎么样的。或者说,量子力学是怎么描述这个世界的。以下基本上是参照Dirac的《量子力学原理(第四版)》总结出来的,算是量子力学里面的公理,我们用实验验证这些公理的推论,这些公理本身也可能是某尚不存在的理论的推论。
首先来看看量子力学里面怎么描述一个物体(或者说,系统)。在经典力学里面,所有的物体都可以看成质点或者一陀质点的集合。而对于质点,只要我们知道了它们的质量,在某一时刻的位置和动量,我们就知道了描述这个系统所需要的所有信息,原则上,这个系统的所有量都可以从这些信息得到。但是在量子力学里,我们放弃了质点的概念,一个有100个电子的系统并不是由100个质点来描述的。相对的,我们用“态(State)”来描述所有物理系统,一个态,就是复线性空间(态空间)中的的一个矢量(向量),两个态的线性组合是一个新的态,如果两个态之间只相差一个复数系数,它们描述同样的物理系统。需要注意的是:无论系统多复杂,原则上它在一个固定时刻都是用一个态来描述的,一个态就包含了系统的所有信息。也就是说,只有1个电子的系统对应的是态空间的向量,有100个电子的系统对应的其实是同一空间中的另一个向量。不过,一般来说,我们只用完整态空间的一个子空间就足够了。线性空间对于物理学家来说并不陌生,一般我们用的笛卡尔坐标系就是很典型的线性空间。但是不同之处在于,量子力学里面将复数引入了物理学,这就预示了相位在物理学中的普遍存在。|A>(|A>代表一个态)和i|A>描述的是同样的物理系统,但是|B>+|A>和|B>+i|A>一般却代表了不同的系统,它们之间有着相位差。在波和光学之中相位是非常常见的,但是在量子力学之前,没有人意识到相位存在与所有系统之中,而且随着规范对称性的发现,相位拥有了越来越重要的物理意义。还要提到的是,在实际计算中,我们通常会为一个线性空间选取一组“基”(basis)或者说是坐标,坐标的选择往往可以让计算变得非常方便。
上面的公理只是告诉我们物理系统(或者对象)的所有信息都包含在态空间的某个矢量之中,但是我们还不知道该怎么的到这些信息。为了能够计算给定系统具有的物理量(比如位置,动量,能量……),我们首先要知道量子力学里面什么是“物理量”。为此我们需要下面的公理:每一个物理量都对应于态空间中的一个厄米算符(矩阵),物理量的可能取值对应这个矩阵的本征值(eigenvalue),而这个矩阵的本征态(eigenstate,eigenvector)所对应的系统以相应的本征值作为物理量的取值。这个公理可以说和经典物理是天差地远。在经典物理之中,物理量只不过是一堆数值的集合罢了,而且对于系统的描述也是有一串表示坐标和动量的数字来实现的。但是量子力学中不同,描述系统本身和描述物理量的方法被分开了,而且物理量也不在是一个简单的数字的集合而变成了一个算符(矩阵), 物理量和物理量的取值有了明显的区分。我们可以把这个矩阵乘到任何一个态(向量)上面得到一个新的态。两个物理量的乘积也变成了矩阵的乘积,但由于是矩阵的乘积,乘法交换律不再成立,我们也不能随便的改变乘积的顺序。物理量并不仅仅是一堆数值的集合,它还代表了将旧的态(矢量)变成新的态(矢量)的一种变换方式,而正是这种将每一个物理量都和某一个变换对应的描述方式,使得群论和对称性分析在物理学之中有了更广泛的应用。顺便一说,为什么要求物理量都用厄米矩阵来表示?因为厄米矩阵的本征值必然是实数,可以用来表示物理量的数值;而且厄米矩阵的本征向量可以构成线性空间中的一组“基”。
当可以描述系统(态)和物理量(矩阵)之后,我们可以开始试着从系统之中提取它包含的物理量的信息了,这个过程我们称之为“测量”。先来回忆线性空间的一个性质:我们是可以在线性空间上定义“内积”的。同样,我们也可以在态空间里面定义“内积”的。如果有两个态:|A>,|B>,他们的内积通常是一个复数。但是一个态和自己的内积总是个正实数,这样的话,我们总可以在一个任意的态上乘一个系数使它和自己的内积为1。这样的态矢量在实际计算中会很方便,如果没有说明,我们以后考虑的都是这种态(向量)。
现在我们可以看看这个“内积”所代表的物理意义。如果我们有一个物理量Q和一个态|A>,Q|A>通常代表了态空间中的另一个态(向量),我们并不清楚内积代表了什么。但是如果态|1>是Q的本征向量,那么由定义我们会知道Q|1>=q1|1& gt;,这里q1就只是一个实数了(本征值)。在这个时候<1|Q|1>=<1|q1|1>=q1<1|1& gt;=q1。我们发现在这时候内积<1|Q|1>代表了我们测量得到的物理量的数值。因此我们猜测,也许内积也代表了对系统A测量物理量Q所得到的数值。
有了这些“铺垫”之后,我们给出量子力学里最令人迷惑、争议最大的“测量公理”:如果对于系统A测量物理量Q,我们得到的结果必然是Q的本征值中的一个;在测量之后,如果描述系统A的态|A>是Q的本征态,|A>将保持不变;如果|A>不是Q的本征态,|A>将“塌缩”为Q的某一个本征态|i>,塌缩到|i>的概率为||^2;对于一般的系统A,多次测量物理量Q的平均值(期望值)将是。
恩,好吧,我相信你看到上面的红字之后一定已经晕了,也许真的感到活生生的噩梦出现在你的面前。我们来试着解释解释,让这条公理变得更清楚一些。首先,是关于测量的结果:在经典力学里,物理量的测量结果可以是任意连续的实数;但是在量子力学里面,测量结果被限定在了矩阵的本征值之中,这是比经典情形更强的限制。如果某个矩阵的本征值只有1,那么我们测量的结果只能得到1;如果某个矩阵的本征值为-1和1,那么不管我们对什么他进行测量,每一次测量的到的值不是1就是-1。其次是测量的影响。在经典物理中,我们知道测量的行为会对系统本身产生影响(比如用电压表测电压会受到电压表内阻的影响),但是我们总假设这个影响可以趋于0(例如电压表内阻越大,对电路的影响就越小)。量子力学则不然,测量在大部分时候都是会对系统本身造成影响,唯一的例外是本征态的情形。如果系统处在本征态,我们的测量将不会对系统产生任何改变;但如果系统原本不处在本征态,测量过程本身将对系统产生不可逆转的改变:系统将变成Q的某个本征态中的一个,而且这个改变只能用概率来描述。无论我们如何“温柔”的去测量系统,测量的影响都会在某个“最小值”之上(假如我们可以用数值来量化);只不过,对于微观的系统,这个可以观察到这个“最小值”;但是对于宏观系统,这个“最小值”通常在我们的测量精度之下,以致与无法表现出来(这是为了容易理解的说法,事实上,Dirac认为,微观和宏观应该用我们能否观察到这个“最小值”来定义)。那么,对于一般的系统,如果没办法预测测量的结果,理论还有什么意义呢?其实量子力学并不是完全不能预测测量的结果。如果我们有很多很多同样的系统|A>,然后对它们测量物理量Q,我们会发现,虽然每一次测量的结果不一定相同也不可预测,但是多次测量的平均值将是,测量结果的方差(的平方)将是-^2,而且塌缩到任一本征态的概率也将和我们的计算结果相符合。
测量公理有一个直接的推论,如果我们有两个物理量A和B,对应两个矩阵,如果这两个矩阵不满足交换律:AB!=BA,他们不会拥有共同的本征态。如果我们从A的某个本征态出发,我们对于A的测量有确定的值,但是如果此时测量B,我们无法确定会得到怎样的数值,也无法预测测量后会得到B的哪个本征态。在测量B之后,系统塌缩到了B的本征态,此时不管测量多少次B,我们还会得到同样的数值,但是如果返回去测量A,我们又无法决定会得到怎样的A的值了。总之对于这种情况,我们没有办法同时精确的知道A和B的值。
测量公理表示,我们从系统抽取信息的过程不可避免的干扰了系统本身。那么我们是否无法完全得到系统的全部信息呢?这个问题的答案是否。如果我们制备很多很多相同的态进行大量的测量,我们还是可以把系统确定到只差一个整体的常数因子的。也就是说,我们还是可以通过测量反推到系统的全部信息。测量公理只是说对于一次测量,我们通常无法得到系统的全部信息。
量子力学在测量中引入了无法消除的概率因素,那么是否说明量子力学的预测能力要弱于经典力学呢?其实也不然。首先量子力学的动力学部分是完全精确的,我们可以精确的描述态的演化,概率只出现在从态里面抽取所需要的信息这部分(测量)。而对于测量,很多时候我们关心的其实也只是多次测量之后的平均值和方差,而量子力学对于这两者的预测能力并不逊于经典力学。举个例子,如果我手头有一块放射性材料,大部分时候我只会关心这块材料在某时刻有百分之几的原子会发生衰变(这决定了放射线的强度),但是我不会关心这块材料中的某一个原子到底会精确的在哪一个时刻衰变。量子力学可以确定的给出前者,量子力学虽然不能确定的给出后者,但是我们确实也不需要这个信息。如果我们在日常生活中使用量子力学,我们会发现,由于测量所导致的方差要远远小于我们日常生活中的精度(h的量级~10^-34),量子力学中的概率因素自然是可以忽略的。其实这从另一方面说明,经典力学的决定论实际上是个没有被证实的先验假设,我们确实没有理由认定这个假设会一直成立。
我们花费了大量的篇幅来解释测量公理,但是这个公理确实值得这些篇幅。这是量子力学体系在完成还仍然不停的在有争议的一条公理(主要是Einstein的疯狂反对),而且初学量子力学的人也通常会对测量和塌缩感到困惑。不过我在这里只想再提一个容易被忽略的地方:测量公理本身其实也可以看成是对于测量的“定义”。在量子力学中,测量这个过程本身是无法用量子力学描述的,我们只能用结果来定义一个测量过程。当然,你可以因为看概率和塌缩很不爽而试图用一个其它的方法来解释这些东西(例如:平行宇宙、隐变量、blablabla)。但是要明确这些解释本身已经超出了量子力学的范畴,而且至今没有一个解释是成功的或可验证的。这其中的原因大概和我们至今无法很好的描述测量这个过程本身有关。(与本段相似的内容在 Dirac的书中也提到过一些,不过很遗憾我现在无法找到原文了)
以上的三条公理是量子力学最基础的部分,也是量子力学和经典物理相差最大的部分。但是你会发现,这三条公理只是告诉大家描述世界的大原则,但是我们根本还是不知道具体怎么计算。比如说,我们还不知道坐标和动量所对应矩阵的具体形式是什么。不知道这个,上面的三条公理也只是空谈,量子力学也不会有任何预测能力。因此我们至少需要一个假设告诉我们怎么给物理量指定矩阵。经典力学里面所有的量可以表示成坐标和动量的函数,所以我们一般只要指定坐标x和动量p的矩阵就可以了,例如能量的矩阵H就可以写成1/(2m)p^2+V(x),相应的运算全换成矩阵的运算。原则上当然可以强行指定矩阵,但是在量子力学里,我们是通过给定一个基本对易关系做到的:
[x,p]=xp-px=ih
这里的h其实应该是hbar,但是我将暂时不区分这两个符号(其实作为High EP物理工作者,我一般连h,hbar都不写的)。这个关系规定了x和p这两个矩阵的乘积在交换之后差,从它出发就可以推出x和p的矩阵了(选取这个关系的原因是因为经典力学中有一个叫做泊松括号的量和这个对易关系有相同的形式)。但是基本对易关系还有另一个作用,它可以推出海森伯不确定关系:dxdp>=h(这里x前面的d其实应该是三角)。对于不确定关系也需要稍微说明一下的,不确定关系在日常的生活中也是成立的,只不过日常生活中测量的不确定度随随便便就可以满足它了。而且要注意公式中出现的是x和p的不确定度而不是x和p本身。比如说:即使我站在那里不动,我的动量是0,但是我的动量的不确定度仍然不是0。我可能会有不规则的微微晃动,虽然这个晃动的平均效果是0,但是dp^2=
-
^2并不会为0。顺便一说,我们现在所说的量子化,就是指指定基本对易关系这个过程。
以上是量子力学的全部运动学部分。同上面四条复杂的公理比起来,量子力学的动力学部分可以算是简单至极——只有一条而且可以看成是经典力学的推广。这个公理决定了在这一时刻的态会在下一时刻变成什么样子,也就是理论的运动方程。我们可以选薛定谔方程,也可以选海森伯的算符方程,他们是等价的,而且相互之间的只是“岸认为船在动,船认为岸再动”这种相对的关系。更有趣的是,这两种方程分别都在经典力学之中有“对应”的方程——算符方程和Hamilton方程是一样的,薛定谔方程也和Hamilton-Jacobi方程有着相近的形式。其实这种相似某种意义上来说也是必然,因为当系统从微观变为宏观的时候,我们的当然希望量子力学的方程可以退化为经典力学的方程。(你可能会抱怨我对于运动方程讲得太少了,这和通常的量子力学课本里不太一样。这并不是我偷懒,而是因为运动学部分所包含的物理内容的革命要比动力学部分多太多。Dirac本人在书里就花了4章来描述运动学部分,而运动方程的引入只花了1章。)
Dirac的工作给予了量子力学一个简明的数学基础,整个量子力学的数学体系仅仅是线性代数而已。所谓的“波函数”本质上只是矢量在线性空间某一组坐标上的坐标值。我们可以用不同的坐标来描述同一个矢量。就像在直角坐标中 r=x*i+y*j+z*k而在极坐标中r=r*e_r,虽然它们有不同的样子,但是都代表同一个矢量。波函数也是这样,不过这里的坐标基矢量用连续的数字x来枚举,某一点x的波函数就对应了“坐标值”。也就是说,这里的x起到了前面式子里i,j,k的作用,而psi(x)起到的是前面x,y,z的作用。
从量子力学开始,代数在物理学中的地位蒸蒸日上,随着群论的发展以及物理学中对于对称性的日益重视(群论是对称性分析所不可缺少的),代数渐渐取代了分析而成为物理学中最重要的数学支柱之一(另一个支柱毫无疑问是几何,而且一直以来的物理几何化的愿望和行动使得几何在物理中的地位无可动摇)。很多时候,利用群论的方法,我们可以在得到薛定谔方程的解之前就可以知道很多过程是不是可以发生,如果发生的话,它们的相对概率是多少,在我们无法得到运动方程严格解的时候,这些方法无疑可以提供宝贵的信息。即使对于可以进行微绕计算的问题,代数方法也可以提供非常多的非微绕信息。甚至在随后的发展之中,光是代数结构本身就可以给理论非常强的限制甚至完全决定理论的形式。可以说,量子力学体系的建立,也是物理学家接触新的数学形式的过程,而每一次新的数学形式引入物理学都会带来革命性的进展。在代数的基础上诞生了量子力学,在几何的基础上诞生了广义相对论,那么在代数和几何结合的数学之中又会诞生什么呢?