Category Archives: 纸上乱弹

纸上乱弹物理学(11,11特别版)——孤子与单极

恩,很久以前就答应别人要写这个了,不过一直感觉没有把握。这会在节日的鞭策下花了两天终于写出来了,好像也没有想象的那么难写。 PS: shiki从标题里硬是看出了孤单两个字,恩,所以我写的其实不是物理,而是寂寞——么? 纸上乱弹物理学——孤子与单极 物理学经历过多次革命,每一次革命都会摒弃原有的一些观念,建立新的概念和模型。不过,也有一些事物如小强一般,在一次次革命中存活下来,有些甚至在革命之后被发掘出更深刻的物理内容——孤立子(Soliton)和单极子(Monopole)这两个“钻石王老五”就是如此。 有记载的孤立子最早由苏格兰工程师Russell于1834年观察到。他看到运河之中的一个“大水包”保持了大致的形状和速度向前跑了1-2英里才消失——而一般的水波由于色散的缘故很快就会被抹平消失。Russell称其为“Wave of tranlation”,并在水槽实验中重复了类似现象。Russell的“大水包”的稳定性乍一看之下会很令人费解。因为在与“大水包”相同速度的参考例看来,这个“大水包”可是突兀的静止在水面上的——而无论是常识还是“能量最低原理”都告诉我们,水面总是会趋向于平如镜的稳定状态。Russell的“大水包”似乎成了长在经典力学身上的一个肿块。 物理学家仔细的对一些非线性系统考察之后发现,Russell的“大水包”在理论上是完全可能的,而且同能量最低原理没有任何矛盾之处。原因就在于系统前面“非线性”这个定语。我们先考虑简单的单粒子情况:线性系统有简单的弹簧势能:V(s)=ks^2只有一个极小值在s=0(它是线性的,因为力作为势的一阶导数正比于s),运动粒子的稳定状态就在s=0这一点。但是,如果我们加入一点非线性的因素,比如说把势能写成:V(s)=s^4-s^2系统将会在s=-1/2和s=1/2处拥有两个稳定的平衡点。就好像过山车的轨道,虽然最低的地方是在出口,但是整段轨道上却可以有好几个局部的“最低点”,过山车能量不够的话乘客可是会被卡在某个“最低点”到不了终点的。 同样的现象也可以出现在波动系统中,区别只是维数更高了。任何的波都可以用波函数A(x,t)来描述,此处A和上面单粒子中的s地位相同,系统的势能也将是A(x,t)的函数(或者说泛函,因为A(x,t)本身是x,t的任意函数)。同样由于非线性项的作用,系统势能打到极小的时候,A(x)可能并不为0,而且由于此时A仍然可以是坐标的函数,A(x)就可以具有某种形状——就像Russell看到的“水包”一样。严格来说,对于波动系统,平衡点也并不是一个真正的点,A(x)也可以跟一些参数有关。此时系统的势能处于极小值,同其它极小值之间有势垒的存在,当系统的能量不足以超过这个势垒的时候,A(x)就会是稳定的,直到由于耗散效应(摩擦力等等)将势垒逐渐抹平。这种孤零零的波也被称作孤波(Solitary wave),由由于波量子化之后是粒子,所以量子化的孤波也被称为孤(立)子(Soliton)(这个名字在很长一段时间被Physical Review的编辑所抵制,因为他们固执的认为只有实验上发现的粒子才可以被称作XX-on,所以那时候的作者只能将Soliton换成quasi-particle或者pseudo-particle。讽刺的是在supersymmetry出现以后,更多的粒子反倒不叫XX-on了) 经典的孤波解总有下面的性质:1、不随时间变化,以示稳定。不过孤波仍然可以作为一个整体运动,因为这不过是做了一个参考系变换。2、孤波总是会“凝聚”在空间的某个区域,换句话说,孤波的总能量是有限的。孤波大多像高斯函数一样有个明显的空间位置,所以即使经典的孤波远远看上去都像是个粒子。3、要产生孤波必须有非线性效应。即使是很弱的非线性效应都可能产生孤波(但是一定要有),而且还这个孤波本身可能很强!经典的孤立子有很多的应用,比如说光学,比如说木星大红斑,不过我这里想说的是在量子革命之后大放异彩的一种孤立子(理由很简单,我只懂这一种)。此乃后话,我们先把视角转向单极子。 说到单极子(Monopole)一般都是指磁单极子。电场和磁场实在是过于对称,所以总让人觉得电荷也应该和什么东西对称。的确,如果我们先写下真空中无源的Maxwell方程组(高斯单位):div E=0,curl E=-1/c dB/dtdiv B=0,curl B=1/c dE/dt在如下的对偶变换(duality transformation)1下(恩,或者叫Ctrl+R变换):E‘=B,B‘=-E方程组:div B‘=0,curl B‘=-1/c d(-E‘)/dtdiv E‘=0,curl E‘=1/c d(-B‘)/dt如何,还是原来的方程,只不过上下行换了个个,我们也可以去考察电磁波的各种物理观测量(比如,能量动量),结论是这些量都不随对偶变换而变化。我们也可以把变换稍稍扩展成一个转动2:E‘=EcosA+BsinA,B‘=-EsinA+BcosAMaxwell方程组在这个转动之下仍然是不变的(这里的方程组都写在Gauss单位制下,因为在该单位制下电场和磁场量纲相同,这也是很多教授抵制SI单位的原因之一)。 那么,如果加上电荷之后这个对偶性如何呢?其实也不难。在变换1下,一个只带电荷的粒子会变成一个只带磁荷的粒子,也就是磁单极。在变换2下,一个带电荷的粒子会变成一个既带电荷也带磁荷的粒子(关于经典电磁对偶的具体讨论,见Jackson)。总之,如果我们画出一个2维的直角坐标,横轴是电荷量,纵轴是磁荷量,那么横轴上的点将代表带电粒子,纵轴上的点代表磁单极,平面上任意一点代表既带电荷又带磁荷的粒子,这种粒子叫dyon(很不幸dyon缺乏标准的中文译名,似乎有人翻译成“双子”,也许双荷子更准确一些——顺便鄙视一下现在国内名词和国外名词严重脱节的状况,怀念仍然有物理学名词委员会的时代)。在这个平面上,变换2代表一个转了角度A的转动,变换1当然就是一个90度的转动了。加入磁单极和dyon之后,我们可以看到,电和磁之间的“对称”越来越完美了。 你可以注意到我一直使用的是对偶(duality)而并非对称(Symmetry)。因为毕竟这个变换把粒子的电荷和磁荷变掉了,虽然变换后的理论和原有的理论结构上一样,但毕竟是另一个相互作用常数不一样的理论了,所以这并不是像规范对称一样的对称性变换。不过当我们知道电荷解的形式之后,我们可以通过对偶变换轻易得到磁单极解和dyon解,因为理论的形式并没有变。对偶性在物理中出现的也很早,而且是大家很熟悉的东西,比如经典力学中心势问题中1/r势(万有引力)和r^2势(胡克力)就是对偶的。听起来很扯,不过这是事实,一个证据就是只有万有引力和胡克力可以有闭合的轨道(想一想牛顿和胡克之间的关系,就会觉得万有引力和胡克力的对偶很有喜感,也许他们两个人也是对偶的而且他们两个意识到了这一点,所以关系才那么不好,哈哈哈。。。这是胡说八道)。对偶性在弦论中甚至扩展到了强-弱耦合常数的对偶,给很多困难的计算带来福音,不过具体细节属于超超超展开,我们还是不要跑题了(以后我也许会写,你也许会看?)。 磁单极子在经典电动力学里没什么用。任何粒子都可以用电-磁荷平面上的一个点来代表,如果所有粒子的电荷和磁荷之比都一样,也就是说如果所有的粒子都分布在一条直线上,我们可以把电荷坐标轴转到这条直线上,把电场磁场重新定义一下,世界上就又没什么磁荷了。至少现在对于质子、中子、电子的测量表明他们确实在一条直线上,误差小于10^-20!找磁单极就是寻找一个在这条直线之外的粒子,不过找到了又能如何呢?磁铁又不会一下子不磁了。所以1894年Pierre Curie提出磁单极假设的时候不受重视也挺正常(觉得这个人眼熟?恩,他夫人很有名,叫Maria Sklodowska,跟他结婚后被称作Mrs Curie。啥?你还不知道他和她是谁?哦,你的素质低于二战时候德国陆军平均水平)。 量子力学和Dirac在1931年给磁单极子提供了更重要的意义。从Millikan的油滴实验我们知道电荷是量子化的,但是电荷的量子化和量子力学似乎毫无关系!Dirac最早可能是想研究量子力学里面的磁单极,但是量子力学里面描述电磁场最好是用标量势phi和矢量势A,可是矢量势的存在是建立在磁场散度为0div B=0之上的,磁单极的存在直接破坏了这个条件,也就无法定义矢量势A。为了解决这个问题,Dirac看着他手头的通电螺线管。。。恩,如果我们站在螺线管外面很靠近某一个头A的地方,我们会觉得磁场都是从螺线管A端跑出来的(或者跑进去,结论类似),就好像螺线管的这一端点A像电荷发射电场一样往外发射磁场。当然,如果我们跑到螺线管里面去看,我们会发现磁场线是绕圈的。可是如果这个螺线管越来越细,那么越来越多的人会处在螺线管的外面,也就会觉得螺线管的A端是磁场线的源头——如果把螺线管缩成一条线(并不是把螺线管拉成直线,而是想象螺线管以无穷小的半径缠绕)并且把另一头B拉到无限远,那么只要不是正好站在线上,你就会觉得螺线管的A端就像是磁荷一样产生磁场。螺线管外部的矢量势有定义,那么磁单极的矢量势也有定义——当然,你要从空间去掉那根无限长无限细的螺线管——这个螺线管后来被称作叫Dirac string。换个角度想一想,如果从三维空间里去掉一条从磁单极出发的射线,那么剩余的空间里任何封闭的2维曲面都不可能把磁单极包在里面,所以可以定义矢量势(静磁学里面有类似的技巧,在空间里划出特定的区域可以给磁场定义磁标量势),这从另一个角度说明了引入Dirac string 的合理性。不过我们虽然从磁单极引出了Dirac string,这条string并不属于磁单极的一部分,它对于其它粒子必须是不可见的——否则就真成了螺线管啦。Dirac string不可见的条件再加上量子力学里面的AB效应,Dirac得到结论,只要有磁单极存在,量子力学原理将要求电荷是量子化的!所以,为了电荷的量子化,实验家们,上吧!(注意,此处Dirac的思考过程是我通过Dirac的文章自己YY的,并不代表Dirac本人同意我的说法,当然他也不能反对就是)顺便一说,Dirac … Continue reading

Posted in 纸上乱弹|8 Comments

纸上乱弹物理学——Classical Life

唔,好久没有写这个系列了。似乎上次发狠“量子噩梦”写的太长了,很长时间缓不过来。趁着今天考完试,写着么一篇换换心情。以前的文章主要是讲很多概念尽可能地讲清楚。不过这一次,呵呵,把一个大家很熟悉的东西讲得面目全非似乎也挺有意思的。玩笑^_^,其实这一篇是想尽量介绍一些数学物理学家(mathematical physicist)的工作,他们的工作不一定是直接描述世界的模型,但是却帮助这些模型更好的描述了世界。 从《自然哲学之数学原理》出版(1686年)开始,经典力学已经走过了风风雨雨的三百多个年头。在这三百多年中,经典力学不停的改变着我们的生活,最终成为了日常的一部分。于此同时,经典力学本身的结构也在不停的进化,不停的获得更加普适的形式,不停的显露出更新的对称性。虽然在进入20世纪之后,由于相对论和量子力学的诞生,经典力学不再被当成描述精确世界的模型(这里稍微要澄清一点,有些时候人们会把相对论也归于经典物理的部分从而和量子物理区分,虽然大部分时候我喜欢这种划分,这里我还是将经典力学限制为非相对论的牛顿力学),令人惊讶的是经典力学在发展过程中得到的各种结构、框架仍然活跃于理论物理(原谅我用这个词)的最前沿,没有一点过时的迹象。 以上算是一个相当平凡的开场白,几乎和我们所知道的经典力学一样平凡了,毕竟我们从初中就开始知道惯性定律,高中就开始和各种质点系统打交道,到了大学物理一上来还是牛顿方程,只是要用到微积分。从使用的角度来说,这确实是经典力学的全部,因为三百多年来经典力学的发展都和牛顿定律等价。不过,从理论结构的角度来看,牛顿力学只是冰山一角。全清华的学生大概都知道牛顿方程,不过估计只有少数几个系的人知道拉格朗日量和拉格朗日方程,要是再说哈密顿方程的话估计只有数学系和物理系的人明白了。泊松括号,Hamilton-Jacobi equation基本上是物理系的人自娱自乐的东西。Dirac bracket?哦,大部分物理系的学生只会告诉你Bra和Ket。看到这里,你是否感到经典力学变得完全陌生了呢? 我们还是从熟悉的F=ma开始,这是从高一就开始折磨我们的Newton方程。不过在写下这个方程的时候,我们应该明确两个概念:参考系和坐标系。首先运动都是相对的,所有的量都必须相对于某一个基准来定义,参考系是用来描述运动的基础。更重要的是,牛顿定律只在惯性参考系中成立(我们这里暂且不考虑如果定义惯性系的问题)。其次,牛顿方程本身是一个矢量方程,F和a都是矢量,因此我们最好建立一个坐标系在每一点提供一组线性无关的基矢量将牛顿方程投影在这个坐标系之下,也就是牛顿方程的分量形式。一般我们会选择固定在惯性系上的直角坐标系,牛顿方程变成熟悉的F_x=ma_x的形式。不过,这并不是唯一的选择。事实上,参考系和坐标系是独立的。我们一样可以选择将F和a投影到一个相对某参考系运动甚至转动的坐标系S_ep之下。此时,因为参考系没有变,牛顿方程本身仍然不变,但是,因为我们EP的选了一个复杂的坐标系,牛顿方程在该坐标系下的分量形式可能非常复杂。我们当然也可以选则一个现对于S_ep静止的参考系,这样F和a的分量形式又会变得比较好写,可是此时我们并不是在惯性系之下,牛顿方程本身不成立。很多时候我们容易将参考系和坐标系等同起来,但是在研究转动问题的时候,要将两者区分开来比较好理解。一个类比是曲线论里面的活动标架法,在这里曲线所浸入的空间可以看成是参考系,而曲线的活动标架可以看成是运动的坐标系,所有的向量可以在活动标价上分解(呃,似乎这个类比反倒让问题复杂了也说不定) 在大部分时候,固定于参考系的直角坐标系并不是最适合描述问题的坐标系,因此我们需要考虑牛顿方程在不同坐标系之间的变换。而坐标系变换正式牛顿力学最大的弱点。牛顿力学有时候也被称为矢量力学,因为它的基础全是建立在矢量方程F=ma之上的。但是在坐标变化下,矢量的变换非常复杂甚至可能和位置相关(大家可以试试把直角坐标中(0,0,0)点处的矢量(1,0,0)和(1,1,1)点处的矢量(1,0,0)写在极坐标系下)。有没有能够绕过这一弱点的方法呢? 在18世纪中叶,物理学家们得到了和牛顿定律等价的“最小作用量原理”——任何物体在运动的时候都会选择使作用量S最小的轨迹。作用量S是拉格朗日量(Lagrangian)L对时间的积分,而拉格朗日量是系统动能和势能的差:L=T-V。也就是说,最小作用量原理认为,物体的[B]真实运动轨迹[/B]总是无数可能轨迹之中平均动能和平均势能最为接近的那一条。这个原理的类比是光学中的费马原理——光线在介质中的轨迹总是光程最短的那一条(其实它们本质是一样的)。牛顿时代的数学家们就已经发明了解决这类问题的工具——变分法(由某个伯努利在另一个伯努利向全世界数学家挑战的问题中发明)。变分法告诉我们,使作用量S最小的轨迹满足下面的拉格朗日方程(Lagrangian Equation):这里q是用来描述系统的广义坐标。 最小作用量原理和牛顿定律是等价的,但是它的形式带给了我们更多的内容。无论是作用量S还是拉氏量L都是标量,也就是说,它们在坐标变换下是不变的。更重要的是拉格朗日方程的形式在坐标变换下也是不变的。也就是说,即使我们换到了坐标系q’,S和L的值仍然和坐标系q中一样,拉格朗日方程也仍然是上面的样子。如果我们想写出系统的运动方程,只要在一组合适的坐标下写出系统的动能和势能,然后写出L,套入方程就可以得到我们需要的运动方程。虽然和直接用牛顿定律得到的方程是一样的,但是我们跳过了复杂的受力分析和运动分解的过程(还记得高中时候痛苦的寻找加速度之间的关系么)。事实上,在最小作用量原理的体系下,我们不需要“力”的概念,也根本不用画受力分析图。拉格朗日抛弃了矢量力学中的几何部分,将力学转化成了纯分析问题。他本人也在《分析力学》中自豪的宣称:“从此,力学成为了分析的一个分支”而且在书中没画一张图(我所知的第二少的例子是只花了四张图)。不过,拉格朗日那个时代力学和几何本身的发展还是太过浅显。50年后哈密顿重新建立了力学和几何的联系,只不过那时的几何也不需要画图了。。。(另,其实拉格朗日表述本身就是流形上的切从——感谢clover的补充) 最小作用量原理第一次在物理学中明确引入了“广义协变性”的概念——运动方程应该与坐标系的选择无关。不过这一原则一直到1916年才被广义相对论发扬光大。另一方面,最小作用量原理似乎赋予了物体一种“灵性”,好像没有意识的物体似乎都回自动的寻找作用量最小的道路。有些人认为这样的理解相当自然,但是也有很多人讨厌这种“目的论”似的解释。这个问题一直到20世纪中叶费曼建立路径积分才有了很好的解释。 虽然在使用上拉格朗日体系和牛顿定律是等价的,但是因为拉格朗日体系中的基本概念比牛顿体系中少(没有力),拉格朗日体系有着更强的可推广性。最小作用量原理只需要定义好作用量S,就可以通过变分原理给出运动方程。实际上对于广义坐标的选择,系统所处的时空结构等等完全没有任何限制。牛顿力学中的坐标是一组数,我们可以把广义坐标选成场。牛顿力学建立在伽利略时空中,我们可以把背景时空换成闵式的,任意维数的,甚至是弯曲的。只要选择合适的作用量,我们都可以自动得到运动方程。而写下满足某些对称性的作用量比直接写满足某些对称性的运动方程容易得多!目前几乎所有的基本理论都可以从某个合适的作用量得到,无论是Maxwell电磁理论,还是广义相对论,我们都可以找到合适的作用量,唯一的例外是Type IIB超引力(需要在作用量之外补充一个条件)。作用量原理甚至将拓扑引入了物理之中,不过谈这个就扯的太远了,我们还是回来谈经典力学。 无论牛顿方程还是拉格朗日方程,都是坐标空间(或者拽一点,位形空间(configuration space))中的二阶微分方程组(我们需要给定坐标和速度才能完全描述系统接下来的行为)。而数学里面对于一阶微分方程组研究的更为透彻。虽然给定任意一个二阶方程组,我们总可以将它转化为一阶方程组。但是,有没有办法像得到拉氏方程一样能直接得到一阶的运动方程呢?哈密顿在1833年提出的新体系解决了这个问题。哈密顿放弃了在坐标(位形)空间中用坐标和速度(q和dq/dt)描述系统的做法,转而将坐标和动量(q和p)看成是独立的变量来描述系统的运动。这样,原来N维位形空间中的N个拉格朗日方程变成了2N维空间中的2N个一阶哈密顿方程:这里H被称作哈密顿量(Hamiltonian),可以从拉氏量L得到,从L到H的变换叫做Legendre变换(以此人名字命名的某函数可能给大家印象更深些)。一般情况下,哈密顿量就是系统的能量。在哈密顿体系下,我们可以直接应用很多一阶微分方程的数学结论。 不过,更有意思的是,哈密顿体系比以前的体系显示出了更多的几何结构,只不过这种几何结构并不是拉格朗日所想的欧式几何。相空间本身是个辛流形(Symplectic Manifold),拥有辛几何结构。哈密顿方程本身定义了相空间中的一个变换g,相空间中的每一点(q,p)在一定时刻dt之后都会映射到相空间中的另一点(q’,p’),整个相空间会映射到它自身。我们知道三维空间中的转动变换保持任意两点之间的距离不变。在相空间中,变换g不会保持距离不变(相空间里面也没有“距离”的概念),而是保持相空间的辛结构不变。系统的运动变成了相空间中一系列辛变换的叠加! 在相空间中还可以定义一个叫做Poisson括号的运算:{F,G}。利用Poisson括号哈密顿方程可以写成:Poisson括号的具体形式并不重要,重要的是Poisson括号满足反交换律,Jacobi恒等式等运算性质——实际上就是李代数的运算性质以及{q,p}=1的结果。因此我们同样可以抛弃经典力学里面Poisson括号的定义,将它换成我们需要的定义,只要我们能保证和经典力学里面有同样的运算性质和{q,p}=1,我们就能用Poisson括号得到运动方程(就像我们将作用量换成别的形式之后就能得到广义相对论的方程一样)。这一推广的直接结果就是量子力学,或者严格地说海森伯的矩阵力学。当初海森伯在建立矩阵力学的时候,就是将坐标和动量看成矩阵,将Poisson括号替换成矩阵的对易子,哈密顿方程就变成了矩阵的方程。这个过程和做小作用量原理的推广类似,抽象的代数和几何结构并没有变,仅仅是换了这些结构的具体表示,我们就从经典力学走到了新物理。 哈密顿体系中还有另一个重要的概念——相空间之间的正则变换(canonical transformation)。正则变换将一个相空间变成另一个相空间,保持辛结构不变,但是哈密顿量可能变化。实际上,系统的运动也可以看成一种特殊的正则变换。正则变换可以给系统的运动提供类似曲线论中的活动标架法的描述。想法其实很简单:如果我本人一动不动的坐在一辆运动的汽车中,那么知道了汽车的运动,就可以知道我的运动。将这个想法推广一下:如果我们能描述一个坐标系的运动,而且在这个坐标系看来,我们要描述的系统始终是静止的,我们也就等于找到了系统运动的描述。因此解运动方程变成了寻找一个适当的活动的坐标系(当然是空间中的)。这个看上去更加费事的方法将2N个一阶常微分方程(哈密顿方程)变成了一个有2N+1个变量(N个p,N个q再加一个时间)的一阶偏微分方程——Hamilton-Jacobi方程。事实上解H-J方程要比解Hamilton方程复杂的多,但是H-J方程的重要性在于:只要稍作变换就可以变成量子力学中的Schrodinger方程(在前面一篇“量子噩梦”中我提到过量子力学的推广更多是运动学的而非动力学的)。在哈密顿表述中,几何概念和物理概念总是交缠出现,互相推广,这一点是当初拉格朗日本人所没有想到的。 进入20世纪后,由于相对论和量子力学的冲击,人们的注意力逐渐从经典力学移开。但有趣的是,经典力学的工作有时候仍然可以指导我们如何量子化。Dirac在50年前后给出了Poisson括号在约束系统下的推广——Dirac括号(Dirac Brackets)。这是一个纯经典力学的结果,但是更多的用在了规范场的正则量子化上而不是用于解经典力学的方程。Dirac在做出这个工作之后实在是太高兴了,感觉自己的地位足以与拉格朗日、哈密顿等人并列,因此他将Dirac bracket看成是他一生最重要的贡献(而不是通常误解的bra和ket)。正则变换则在1983年重出江湖,在Batalin和Vilkovisky给出的antifield formalism中,field和antifield有着同样的辛结构,而这时,正则变换将把经典的作用量变成量子化的作用量(BV formalism对于大部分物理学家没有任何用,只是在string theory和string field theory中大显身手。另,圈子里对Batalin和Vilkovisky的评价是:无论多简单的东西,他们都能整的无限复杂)。 实际上,上面所说的所有经典力学的体系并不能帮我们更快更准确的解出运动方程(实际上,拉格朗日表述还是哈密顿表述得到的方程最终都是一样的,H-J方程比它们还难解)。这些工作的目的其实是为了逐渐抛弃掉力学之中各种具体的概念,将方程之后的代数和几何结构显示出来,后很多方法在很多年之后可能才被人意识到它的强大。不过话又说回来了,数学物理学家追求更普遍的结构,至于有没有用,他们恐怕也不care吧。

Posted in 纸上乱弹|7 Comments

纸上乱弹物理学——量子噩梦

量子力学是个魔鬼。 其实曾经有一段时间,量子力学和广义相对论一起坐在至高天上,接受着大家的膜拜。可是随后量子力学就露出了它黑色的尾巴,开始在高校间大肆活动,用“学术成果”“技术创新”“Paper”“Funding”诱惑各个院系管理人的灵魂。很不幸的是,越来越多的系主任们轻易的就将自己的灵魂出卖给了这个魔鬼;更有甚者,他们还顺便把自己管辖的学生的灵魂一并出卖以换取魔鬼面前更高的地位了……于是广大可怜无助的学生们只好默默忍受量子力学的折磨,用自己一点可怜的光亮照耀上头老板的前程…… 好吧,我承认上面这一段其实完全是在扯淡(真的么?)。不过量子力学总是让接触他的人很头疼这确实是事实。作为20世纪物理学最重要的两大发现之一,量子力学极大的改变了人类的生活,在我们身边制造了一个又一个奇迹;可是,另一方面,量子力学的理论和原则似乎总是暧昧不明而且看上去又极大的违反了我们日常的观念,以至于第一次接触它的人很难在错综复杂的概念丛林之中找出一条通向理解的小径来。虽然相对论也和我们日常生活的“经验”有着很大的差别,但是相对论里人们的日常毕竟太遥远了,尤其是广义相对论,研究它的理论的物理学家基本可以算是物理学家中的物理学家了(或者其实叫物理学家中的数学家比较好?)。可是量子力学不同,只要跟原子分子有关,就不可避免的要和量子力学打交道,化学及其相关的专业就很自然而且很快的的被拖下了水;随后随着电子技术的发展,器件越做越小,电类专业也无可奈何的投降了;甚至到了最后,居然还出现了“量子计算”“量子信息”这种东西,一旁偷笑的计算机系也被当头来了一闷棍。量子力学不再是小圈子里自娱自乐的东西,而是确确实实的进入了更多人的学习生活。 一直以来,量子力学似乎就是理论物理最不清楚的分支,Bohr就曾经说过:“如果谁不为量子论而感到困惑,那他就是没有理解量子论。”造成这种现象的原因很多,一方面是因为量子力学里有太多和经典物理里不同的概念,另一方面大概也和量子力学的建立过程有关。和相对论那种top-down的建立方式不同,量子力学的形成是标准的bottom-up。最一开始Planck的黑体辐射公式只是内插得到的经验公式,他引入“量子(quanta)”的概念只是为了能够推导出正确的黑体辐射谱。Einstein的“光量子”、德布罗意的“物质波”以及Bohr模型都只能算是唯像模型,每一个模型基本只能解决某个特定的实验现象(例如Bohr模型只能解释氢原子的光谱,用到氦原子就傻了)。不过这些模型毕竟带来了概念上的巨大进步,基于这些概念诞生的“波动力学”(薛定谔)和“矩阵力学”(海森伯)可以算是真正意义上有普适意义的理论了。虽然两种表述看上去完全不同,海森伯还是成功的证明了两种形式的等价性。最后在30、40年代的时候由Dirac给出了一套标准的top-down的量子力学的体系,量子力学算是真正的建立完成(最后一点的时间我并不是很确定,我是按照Dirac的《量子力学原理》第三版和第四版的出版时间大致计算的,这本书基本上确定了现在我们使用的量子力学的基本形式)。不过在量子力学家们还没来得及庆祝的时候,Einstein又跳出来开始质疑量子力学的基本假设本身,引发了旷日持久的Einstein-Bohr之争。随后量子力学和狭义相对论的统一带来了更多概念上的争执与革新(不过这个基本上算是量子场论了)。旧有的想法不断的被放弃,新的想法不断的被提出,而后在不远的将来又变成旧的被放弃,量子力学就这样在磕磕绊绊之中前进。如果一个人试图按照历史的顺序追述量子力学的发展,那他一定会陷入巨大的概念的泥沼之中不可自拔,当他好不容易搞清楚20年代大家在说什么的时候,他会发现在30年代这些说法已经过时了(量子力学中有很多名词在现在已经完全丧失了最初的含义了,比如说“量子化”这个概念,现在通用的定义基本上和quantize这个词在英语里面的意思关系不大了,我后面会提到)。所幸的是,虽然Einstein在晚年的时候EP了一把(原谅我用这种说法),量子力学的基本假设和一些概念的定义在《量子力学原理》第四版里基本固定下来了,我们现在有了一个标准版本可以作为参照。 (题外话:量子力学的建立历史和广义相对论如此的不同甚至到了相反的地步。相对论、尤其是广义相对论在诞生的一开始,它们的基本公设就是非常明确的,随后的工作就像是几何学一般的自然和清晰。这一方面自然是因为Einstein超人的洞察力,看到了引力背后的几何结构;另一方面我认为也说明相对论仍然是一个经典理论,它对于概念上的突破无法和量子力学相比) 翻翻国内的量子力学课本,可以发现编排顺序基本都是这样的:Why quantum mechanics-波函数-薛定谔方程-氢原子(中心势)-角动量以及力学量用算符表示-微绕论。。。无论是曾谨言的两本“砖头”以及后来的“简明版”,还是周世勋小本基本上都是这个顺序(顺便一说,我猜周世勋就是折磨yumemi的直接黑手)。这一套讲法基本继承于朗道的《非相对论量子力学》。由于苏联一直一来有着很好的的分析传统,从薛定谔方程入手貌似是个很好的选择(而且这也是20世纪初期人们所熟悉的方式,这也是“波动力学”在一开始比“矩阵力学”受欢迎的原因)。可是另一方面,薛定谔方程也不可避免的将量子力学背后简明清晰的数学结构(线性代数)复杂化了,人们需要比较深的分析功底才会知道波函数、薛定谔方程和向量空间、矩阵是一回事。而且薛定谔方程也会给人带来了一种错觉,认为方程就是基础,波函数就是一切。这种认识是比较粗糙的,其实薛定谔方程和波函数只是量子力学无数表示中的一种罢了,量子力学的“本质”并不是这么繁复的东西。 每一个物理理论大致都可以氛围两个部分:运动学部分和动力学部分。运动学部分用来描述在某一固定时刻的被观测对象和物理量;动力学部分用来从已知的某个时刻预测对象和物理量在下一时刻的行为。举个例子,经典力学里面的质点模型和质点在某一时刻的坐标和动量属于运动学部分,而牛顿定律则属于动力学部分。量子世界观和经典世界观最大的分歧主要来自于运动学部分,而非动力学部分。事实上,薛定谔方程和海森伯的算符方程在经典力学中都有很明显的对应(自然,这个对应不是牛顿方程),这一点其实不算太奇怪,因为毕竟应用到宏观系统,量子力学本应该给出经典力学一样的描述,有趣的事实是经典力学本身的理论结构已经发展到了非常“完备”的程度以至于量子力学在这方面突破的可能变得很小。 量子力学的运动学部分确实颠覆了很多人们长久一来形成的常识:一个电子的“波函数”可以和另一个电子的“波函数”在空间上重叠,推翻了一直以来物质的“不可入性”的假设。而且这种重叠还会带来“干涉”和“衍射”的效果。我们对于一个系统的测量也会不可避免对系统本身带来干扰,而且和经典物理不同,这种干扰在很多情况下无法避免,而且不会因为测量手段的进步而消除……这些现象是如此的违反“常识”但是又确确实实的存在,因此Dirac只能感叹: …the main object of physical sience is not the provision of pictures, but is the formulation of laws governing phenomena and the application of these laws to the discovery of … Continue reading

Posted in 纸上乱弹|Leave a comment

纸上乱弹物理学——我的老师Peter van Nieuwenhuizen

Peter van Nieuwenhuizen是石溪对我影响最大的老师,这一年对我也多有照顾。因为明天就是他70岁的生日,所以突发奇想写点文字为他庆祝一下,虽然他本人是不大可能看到这个东西了,呵呵。 如果在网上搜索这个Peter,大致会得到这样的结果: “Peter van Nieuwenhuizen is a Dutch physicist. He is now a distinguished Professor at Stony Brook University in the United States. Van Nieuwenhuizen is best-known for his discovery of supergravity with Sergio Ferrara and Daniel Z. … Continue reading

Posted in 纸上乱弹|6 Comments

纸上乱弹物理学——喧闹的真空

真空这个概念离我们既接近又遥远,我们每个人似乎都生活在“真空”之中(虽然有了我们,那地方也就不叫真空了),可是每个人都会感觉真空是如此的陌生,甚至大部分地球人都会有“真空恐惧症”,他们和真空唯一的接触就是在拿起吸尘器的时候(vacuum cleaner)。 当人们观察这个世界的时候,先会看到各种有形的东西,然后就会想:“如果没有这些,还有什么吗?”哦,还会有各种看不到的东西。那,如果这些也没有,还有 什么吗?或者换句话说,如果把所有的物质都移除出这个世界,还会剩下什么呢?噢,似乎所有物质存在所需要占据的“空间”本身是除不掉的,或者说,我们除来 除去总会到达一个终点的。 人们就把这种状态称为“真空”,也就是说,不可能有比这个更空的状态了。 在牛顿的时代,真空基本上和空间是等同的,空空荡荡什么也没有,本身也是平直的,严格的符合欧几里德几何(当然,那时候也就只有这么一种几何)。所有的物 质都是真空这个大舞台上活跃的演员,伟大的牛顿说:“你们之间都要互相吸引。”——恩,这就是万有引力。在牛顿的《自然哲学之数学原理》中,万有引力被描 述成超距的瞬时的作用,不过其实据说牛顿本人是很讨厌这个观点的,因为他觉得一个物体凭空就能影响离它十万八千里的另一个物体是一件很不真实的事情。可是 如果是有某种媒介,牛顿又想象不出这种媒介是什么,而且势必会涉及到一个物体 “从真空中产生某种媒介”然 后作用于另一个物体。牛顿是个虔诚的教徒,他当然不能接受这种观点,在他眼里,能够从“无”中创造物质的只有上帝他老人家,所以他只能忍一忍,退而接受超 距作用这个“不太真实”的观点。其实就算牛顿不那么虔诚,出于自己生命安全的考虑,他也还是会选择“不太真实”的观点的。毕竟他的前任被关了好多年(还是 因为和教皇的关系比较好),前前任直接被逮住烧死了。 好多年就这么过去了,真空安安稳稳待在那里给物理学家当背景。Lagrange创造了力学更为优美的形式,Laplace甚至把上帝从他的宇宙里踢出去了,可是真空似乎还是没什么变化。它太低调了,以至于物理学家都快把它忘掉了。 历史的发展总是出人意料的,似乎牛顿当年的直觉是正确的,真空没有那么简单。突破来源于这个世界和我们关系最大的相互作用——电磁。当库伦发现他的定律的 时候,大家还觉得这只是万有引力的简单类比。随后,多事的奥斯特发现通电的导线表现的和磁铁一样,而更加多事的法拉第发现运动的磁铁尽然和电池一样,事情 复杂了,大大的复杂了——最严重的后果就是直接导致我们高中时候最折磨人的Lenz定律的诞生,当然,这和主题真空没什么关系。这些发现至少告诉我们电和 磁并不是万有引力的类比。为了解释这些现象,法拉第提出了“场”的概念, 一个三元(或者四元,如果加上时间)的函数第一次成为一种独立的物理实在(以前也有场的概念,比如温度场,但是显然是基于某种介质,比如大气)。电场和磁场居住在真空中,散布在真空中,都是一种物质,有电荷产生。 一种物质会被另一种物质从“无”中产生,幸亏那时候教会的力量已经衰退了,人们对主无穷的神威也不是那么恭敬。于是Maxwell作出了更暴弹的宣言:“ 不仅带电物体可以产生电场磁场,变化的电场和磁场本身也可以产生场。电场和磁场是一回事,就是电磁场”——这就是著名的(或者说“臭名昭著”的)Maxwell方程。清华也许有三分之一的专业和它有关,它让人头疼到不经觉得Maxwell当年被烧死有多好——当然,这也是题外话。 Maxwell方程和它所预言的电磁波让大家真真正正的疑惑了。电磁波的传播似乎没有也不需要介质,变化的电磁场甚至真的在“真空”中产生了新的电磁场。 可是“真空”是被定义成没有任何物质的空间啊,从无中到底该怎么产生物质。物理学家提出了“以太”来救驾,可是不中用的迈克尔逊没有发现它,而后来伟大的 爱因斯坦干脆就说“以太这个概念是不需要的”(他1905年的论文里只提了这么一次以太)。可是即使是伟大的爱因斯坦也没有解决真空中产生电磁场的问题, 虽然他在随后的广义相对论中提到空间可以被物质所弯曲(这一点在后来引起了更大的麻烦)。 为解决这个问题提供线索的还是量子力学。在量子力学里,所有的束缚态(简单说就是有边界)问题都会有一个能量最低的状态——基态的。基态的能量被称作“零 点能”。虽然基态是能量最低的态,但是处在基态的粒子因为不确定关系并不会静止,而是仍然会有一定的动能。这给我们提示了一种解决“从真空中产生电磁场” 的方法,也许我们需要改变“真空”就是什么也没有的观念, 而是保持“真空”是整个世界的“基态”的概念,我们所说的粒子,物质,都是相对于这个“基态”比较出来的。可是这样的结果,就像“零点能”并非能量为零一样,物理的“真空”也未必真的是一无所有。 但是量子力学是不能完全解决这个问题的,因为量子力学无法描述粒子的产生和衰变。真正的解决是由量子场论来完成的。在量子场论的框架下,每 一种由一个场来代表,有几个这种粒子的状态仅仅是这个场的某一种激发模式,同样的,没有这种粒子,也代表了场的一种状态。如果所有的场都处于没有粒子的状态,我们就说这是真空态;这样,量子场论里的真空,并不是指“一无所有”,而是由所有出于特定状态的场一起构成的。 很多科普读物中会将真空描述成一锅乱哄哄的粒子炖成的粥。无数的虚粒子对在真空中不停的产生和湮灭,但是由于不确定关系我们看不到这些虚粒子对。这个说法 没什么错误,尤其是你做量子化之后确实如此。但是我试着来提出一个更平易近人的说法。想象你在一望无垠的完全平坦的平地上跑,或者说坐着车滑行,你很容易 就会忽略掉地面的存在,因为走到哪里高度都不会有变化。可是如果地面上突出一个包,正在自由奔跑的你不小心被绊倒了,你也许会说:“靠,怎么这里有一个 包。”注意,从这句话开始,你的注意力就被转移了,你注意到的是那个包,也就是高于其它地面的存在,由于这个比较(当然也由于你被它绊倒了,很疼或者感觉 很浪费感情),你把它和地面的其它部分分隔开了,似乎“包”代表了一种新的东西,可是其实它也仍然是地面的一部分。 量子场论里的真空其实和这个差不多,真空就是那平坦的地面,它存在,只不过没有比较我们看不出来。一个粒子就相当于地面的一个包,这个包的高度就代表了粒 子的能量动量等等。如果地面上又多了一个包,好,我们有了两个粒子。这样的话电磁场的问题就好解决了,当我们把一个包往下压的时候,总有一些部分被挤进平 地里,然后就可以把另一些部分挤出来,于是在另一个地方产生了新的粒子。这就好像动画片里面的旅行者在塞他满满的背包,这里塞下去,那里跳出来,也许你会 … Continue reading

Posted in 纸上乱弹|4 Comments

纸上乱弹物理学——A Frantic Dream

一个英文的东西,呵呵,不知道有多少人会看。不过如果试着读一读的话应该感觉还是不错的。 内容上就像标题所说,大致是一个狂乱的梦,视角先是不停的变大,拉远,时间倒退,然后在某一点停滞,镜头变得非常小,然后又开始放大。 Imaging, our planet is floating silently in space. Around it, the sun light gently touches the face of the earth, bringing brightness, warmth, and more importantly, life. The sun, like a generous god, shares its energy to the … Continue reading

Posted in 纸上乱弹|2 Comments

纸上乱弹物理学——高能与粒子物理

即使在物理学里,粒子物理也算是比较奇怪的分支了。别的分支,只要不是起了个太后现代的名字,多少能让大家知道它是做什么的。比如地球物理一看就是研究地球本身的,固体物理显然和固体有关,宇宙学……恩,不用说了,我们抬头看到的东西都和它有关。可是粒子物理?谁知道“粒子”是什么玩意儿,有多大,平时都呆在哪儿。恩,这确实是个很不直观的东西,尤其是再考虑到“粒子”这个概念在20世纪至少变了三次,看来粒子物理让人感到困惑也确实没什么奇怪的,甚至可能会有人大吼:“变来变去,难道你们自己也不知道该研究什么吗?” 其实从另一个角度来看,粒子物理研究的内容算是非常清晰。粒子物理只是想回答两个问题:“我们生活的世界到底是由什么东西构成的”“这些东西又是怎么构成我们这个世界的”。这两个问题起源很古老,至少古中国人和古希腊人就试图回答了。无论是“金木水火土”还是“风土水火”都可以看做是“粒子物理”最早的尝试——当然没有任何科学性可言。在现代物理学和分子模型诞生之后,“粒子物理”算是开始走上了正轨。当然了,其实那时候是没有“粒子物理”这个名称的,那时候的人们更倾向于把研究物质基本组成的学科叫做“化学”,呵呵。随着人们发现分子是有原子构成的,而且原子又有那么美妙的周期律,看起来第一个问题回答的真是很清楚了。 可是很快问题又来了,我们一个又一个的发现新的原子(元素)。50,60,70,80一直不停的增加。更为重要的是,连同居里夫人在内的几位物理(化学)家又发现一些原子是可以自然变成另一些原子的……这些可怕的事实似乎提示我们:原子看来也不是什么基本的东西了。在差不多(或稍早)的时候,汤姆孙测量了阴极射线,发现它由一些质量远远小于氢原子的东西(电子)构成。阴极射线是金属加热后产生的,恩,我们似乎得到结论,看来电子像是原子的一个组成部分。这样,从电子发现开始,“粒子物理”算是诞生了,那时候的人们,把质量小于原子,可能是原子组成部分的东西都叫做“粒子”。 20世纪初,卢瑟福用他精妙的实验证明了原子由一个很小的核和外围电子构成。随后物理学家们由确定了原子核是有质子和中子两种粒子构成的。我们的世界看起来真的变得非常简单。电子、质子、中子这三种粒子的不同的组合就形成了我们千变万化的世界。粒子物理现在可以放下第一个问题,专心解决第二个问题就可以了,因为核力确实很奇怪也很复杂。 可惜,世界从来不让人们舒坦着过。在宇宙射线中发现了一种mu轻子。这个奇怪的粒子除了比电子重200倍,剩下所有的性质都和电子一样,但是它又绝对不存在于稳定的物质之中。以至于无数物理学家绝望的仰天呐喊:“Why do we have this guy?”随后他们更加绝望了,在实验室里,粒子物理学家发现了越来越多的类似mu轻子的粒子,有些粒子找到了存在的意义,另一些仍然显得很神秘。当时,这些粒子们都被统称为“基本粒子”。 为了更好的研究这些粒子,物理学家们试图把带电的粒子加速到更高的速度,让它们带有更高的能量,然后相撞。这样,我们就能看到更小的尺度,看到世界更基本的结构。粒子物理学家们需要的能量越来越高,很快一次反应所需的能量就超过了核反应释放的能量。由于这种赤裸裸的对于能量的滥用,粒子物理从此又多了一个称呼“高能物理”。 随后,更高的能量却更快的将粒子物理学家推向了绝望的深渊。新的“基本”粒子赶集一样的出生,很快,小写希腊字母已经不够用了,大写希腊字母也不够用了,甚至在字母上加各种+号-号++号都显得不够用了。粒子物理学家们发现他们面对的是比元素数量还多的“基本”粒子,就好像是开了个乱哄哄的动物园,而且各种新的动物还在不停的往进冲。 终于,盖尔曼不能忍受粒子物理学家变成动物学家这个事实了,他提出了夸克模型,将这几百号动物用几种夸克的不同组合表示出来,成功的将几百压缩到了个位数字。这节省了太多物理学家的寿命,也将物理学家从名字的海洋里解救出来,于是,还没等实验上观测到夸克,瑞典人就把诺贝尔奖发给他了。 现在,粒子物理的标准模型告诉我们,物质是由6种轻子(电子是其中的一种)和6种夸克组成的,这些粒子之间的相互作用由4种规范波色子来传递,再加上一个给大家质量的Higgs波色子(实验上尚未找到),世界一下子又变得清爽多了。到目前为止,标准模型已经诞生了30年,仍然是我们描述世界的最基本也是最精确的理论。 以上的文字简单的叙述了人类对于物质基本结构的探求,简单概括起来,就是:原子->原子核->质子、中子、电子->夸克、轻子。随着我们输入的能量越来越高,上一层次的物质就被打散,出现下一层次的物质。而正因为粒子物理总是要研究最底层的物质,所以我们可以看到,粒子物理研究对象的改变其实是很自然的,每当出现了新的基本结构,粒子物理学家就转去研究这种新的结构,以及它们怎么构成上一层次的物质了。从这种意义上讲,粒子物理算是真正的与时俱进的学科。 到目前为止,我们只看到了回答第一个问题的努力,其实更多的时候,粒子物理学家是在努力回答第二个问题:“粒子之间的相互作用是怎样的”。为了回答这个问题,量子力学被用进来了(因为是微观世界)。随后能量越来越高,粒子运动速度接近光速,狭义相对论也不得不进来了。相对论和量子力学的结合诞生了量子场论。随后群论尤其是李群被拿来分类粒子。再后来随着老杨发明了规范场,微分几何和拓扑学开始大举进入粒子物理。数学家的介入将问题更加复杂化,以至于出现了两个版本的粒子物理,给物理学家的和给数学家的。使用版本一的基本上看不懂版本二,使用版本二的基本上不明白版本一,偶尔有个别天才既明白版本一又明白版本二,好吧,没人能明白他们。物理学家叫field strength,数学家偏要叫curvature。物理学家觉得path integral清晰无比,数学家总觉得这个东西没有定义。现在粒子物理学家开口就是Chern class,Calabi-Yau流形;数学家闭口就是Yang-Mills gauge field。因为局势过于复杂,使用的语言过于奇特,使得任何对于理论粒子物理的科普读物都不可避免的以失败告终。 粒子物理是很美妙的,尤其是你感觉到将世界都简化成几种粒子、几种相互作用和几种对称性的时候。但是粒子物理也有着无可避免的永恒的悲哀。粒子物理学家的目标是“根源”——物质基本结构的“根源”和物质相互作用的“根源”。就像魔术师一样,粒子物理学家追求世间一切的终极原因,希望能有一个解释一切的模型。粒子物理学家相信,随着一代一代的努力,我们可以一步步的接近终极的真理,一点点从上帝紧握的手中推理出宇宙最本源的设计图。可是,粒子物理的结构本身又注定粒子物理学家必须有个出发点,几个作为逻辑起点的假设。我们用Higgs粒子来解释质量的起源,却又发现我们假设了Higgs和物质的相互作用;我们用规范对称性来限制相互作用,却又发现我们没办法解释规范对称性的起源;我们用超代数来统一时空和规范对称性,却又发现物质基本成分的数量又多了一倍……一次次的进步,只是回到了一个新的起点;每一次的循环,却又好像透出了一丝差别。粒子物理学家追求真正的智慧,就在这矛盾螺旋的尽头,就在这无尽循环的终点。 我不知道为什么会被粒子物理所吸引。也许是因为它所拥有的无尽的狂想,也许是因为狂想之后严肃认真的求证,也许是因为注定没有终结的旅程中所拥有的疯狂而又悲哀的色彩。Anyway,我们还是要走下去,带着一点天真和不变的好奇心走下去,重复着问题-解释-新问题的循环。我们用更高的能量来解析宇宙,用更大的对称性包容世界;我们用弦去生成粒子,用额外维来提供新理论的生存空间;我们……。我们不会停下探索根源的步伐,可是,也许根源根本不在我们道路的尽头。 即使这样,我们还是会走下去,啊啊,因为我们很早以前就已经被无尽的螺旋迷住了,即使未来是无回报的毁灭也无法阻止我们追求瞬间的辉煌。

Posted in 纸上乱弹|5 Comments