射影变化都是与向量的分解(如)相关的;复数理论是向量理论的前奏.如果把向量改成复数,则用另一个复数去乘它,就得到一个变换(映射)

读书笔记之看看人家是怎么做的──向量和向量空间以及其中的变换(二)
二、线性变换



新课标里面对于变换给予了很大的重视,因为变换是整个数学的最基本的概念之一.函数无非就是由一个集合到另一个集合(在中学教材里通常是实数集合,偶尔也有复数集合)的变换;映射就是变换,几乎是同义语.在几何教学中也讲到变换.不过我以为还应该讲得更仔细一些.在现在的情况下,则需要向量空间之间的变换.如果我们记此向量空间为,记此变换为:(从一个向量空间到另一个向量空间的变换虽然也很重要,但是在目前中学几何教学里却用不着),也就是对于中任意元素(即任意向量)必有中一个(可能是另一个,也可能就是原来的那个向量)与之相应.这和函数作为映射的定义是一样的,不过现在变换的定义域是整个,而在中学教学里会是其一部分.我们在向量空间里讨论的变换一定都是线性变换,就是一定要适合以下的要求:

1.

2. 这里是任意的实数.由此得到一个非常重要的结论,即:原点一定仍被变为(或者说映射为)原点:



这句话的重要性何在?平行移动不是向量空间里的线性变换.因为原点在平行移动下被移到另一个点处去了,但是向量空间里除原点以外根本没有别的点,怎么叫作移到另一个点处去了呢?向量空间里面没有平行移动,这是向量空间不可能成为展开我们熟知的几何学的最重要原因之一.那么向量空间里有哪些我们熟知的几何变换呢?为此先要讲一下我们要从什么样的视角来看待变换.这里会有两种视角.一是几何的视角,就是看一个变换有什么几何特性;二是代数的视角,就是看如何用代数语言来表示这些几何特性.具体说来,就是如何用矩阵来表示线性变换的问题(不过要提醒一下,一般的变换不一定能用矩阵来表示,但是这篇文章里讲到的线性变换都是可以的).一个向量通常的坐标表示是把坐标写成一个横行如(平面即二维向量)或者(空间即三维向量),但是现在我们总把它们写成竖列或者,这是为了适合矩阵乘法的需要,但是为书写方便,时常应用“转置”记号,即在向量右上角(有的书上则在左上角)加上字母t,表示行变列,列变行:



三维情况类此.一个线性变换在平面情况就可以写成一个2阶矩阵,空间情况则写成3阶矩阵如下

.

线性变换作用于一个向量,就表示为这个矩阵与(竖)列向量的乘积,例如



如果我们仍把右方的向量的各个分量写出来,成为或,就有



可见矩阵记号是一个方便得多的记号.利用矩阵记号,上面关于线性变换必须具有的性质就可以写为



从这里也就立刻可以从代数上看到,平移为什么不是线性变换.因为平移如果用坐标来表示就是

(是两个实数).

它不是齐次式,而如上面的写法,线性变换必须是齐次式.图16则是平移的几何形像:图16中的Tx和Ty就分别是上式的



图16 平行移动,即平移



图17 变换的乘积依赖于实行变换次序的例子.图中3根短线

表示脚趾. 第1排的两个图中,铅直轴固定;第2排图

中由纸面向外伸 出的轴固定.

变换既然可以用矩阵来表示,就可以如同矩阵一样来计算.这里最重要的是变换的“乘积”.正式的称呼应该说“复合”.两个线性变换的乘积作用于向量的定义就是先用作用于再以作用于所得的结果这里作用的次序非常重要:先实行最靠近向量的变换,再对其结果实行紧靠在其左方的变换.有时,按不同次序进行同样的两个变换,结果可以不相同.“乘法”的不可交换性对于中学生是否太难懂?很难说,在21世纪的信息时代,乘法可以不服从交换律这种事情不会成为家喻户晓的事情:使用电脑,先点击这个键,再点击另一个,或者反其道而行之,结果不同难道是“奇迹”吗?难道变换的复合的不可交换性真那么难懂吗?我是在高中二年级从一本小书知道这件事情的,那本书是郑太朴先生翻译的《类论(即群论)梗概》,1939年出版,是为中学师生编的《数学小丛书》的一种.当时许多同班同学都读过,也没有谁说怎么难死人了.当然也没有谁靠这本书来学习群论,只是觉得群论也没啥了不起.总不能说,现在的中学师生比一个世纪前的中学生更笨吧!我的这一点看法得到了武大一些代数老师的支持.说变换的复合从几何视角来看并不难,而从代数视角来看,就相应于矩阵的乘法,这一点课标里也是明确的,我们就不再多说了.



回到正题.有两种种线性变换很重要.其一就是把一切向量都变为自身:这个线性变换称为恒等变换(但是要注意,对于并非恒等的变换,也可能存在某个向量,使得这个成为该变换的不动点).恒等变换时常记作甚至就记作1,因为数1在乘法中就起了恒等变换的作用.它的矩阵表示就是单位矩阵这里凡是没有写出的元素都是0.另一个线性变换就是就是把一切向量都变为零向量的线性变换,记作,称为零变换:它和数0在加法中的作用相似(线性变换也是可以相加的:).它的矩阵表示就是零矩阵.另一个重要概念是线性变换的逆变换:设有线性变换则把变回成的线性变换(如果它存在的话)就称为的逆变换,记作即是说(也是线性变换待证明,这里略去).注意,并非每个线性变换都有逆变换存在,因为给定了一个不一定有适合上式的存在,即便有,也不一定只有一个,那么取哪一个作为中的当且仅当线性变换是一个一一对应时,逆变换才存在.顺便提一下,在中,称为的象,称为的原象.因为逆变换的概念十分重要,下面对于每一个讲到的线性变换,都要指出是否有逆变换存在,如果存在又是什么.例如恒等变换的逆变换就是它自己,而零变换择没有逆变换.逆变换的矩阵就是逆矩阵.这些,在新教材里也一定会讲,所以这里也不多讨论了.



上面我们已经讲到了几种重要的变换.第一个是平移(尽管它并非线性变换),它倒是有逆变换的:



  可见平移的逆变换仍是平移(这里记号的用法和反函数中自变量仍记为相同).很明显,平移不能用矩阵来表示.但是最重要的线性变换当然是旋转.因为它重要,必须用很大的篇幅,所以我们放到最后.先介绍三个也很重要的线性变换.因为它们在几何上都很清楚,所以我们不把几何和代数两个视角分那么清楚.第一个是相似,其实就是以原点为相似中心的相似.有两点和综合几何不太相同:首先,综合几何里将的相似是没有相似中心的;其次现在的相似变换的相似比在不同的方向上可以不同,所以最好换一个名称:伸缩变换或尺度变换.图上没有画出相似中心,但是读者容易自己想象出来中心在哪里,估计出来相似比有多大.



图18 尺度变换

           

图19 各方向的相似比不同的尺度变换

  图19则是一个方向和方向相似比不同的尺度变换.图8的每一步都是横向收缩,竖向拉长的尺度变换.现在写出尺度变换的矩阵表示.很明显,我们有



这里的是不一定相同的正数.所以,尺度变换及其逆变换的矩阵分别是



由此,可以看出为什么要规定不能为0,若为0就没有逆矩阵了.但是为什么要求它们为正?因为不是正的话,就会得到一种新的同样很重要的变换:反射.



我们在几何学里会见到许多各种各样的反射,但是在中学几何教学里,我们通常只讨论对于原点,对于某个坐标轴或某个坐标平面(只在立体几何里有这个情况)的反射.通常我们都说是某种对称.其实所谓对称就是在某种反射下的不变性.我们还是先从图形上看什么是反射.





图 20 对原点和一根坐标轴的反射(平面情况)


图20上给出的是平面上的两种反射,如果右图上的竖立的直线是轴,则它们的矩阵表示就分别是



它们都是尺度变换中有一个或多个的情况.三维的反射,可以从下面美丽的印度泰姬陵对于水面的反射看到.如果把水面看成三维坐标的平面,即则这个反射可以写成



但是我们还看到,这座美丽的建筑还有一个对称平面:水里的石柱是中轴线,我们以它为轴,泰姬陵对于平面,即,也是对称的(但图上没有把这个对称性完全表示出来,如果这个对称性也完全表示出来了,这些石柱就会重合为一个而看不清楚了),所以,它在

反射变换



下也不变.这当然只不过是说这个建筑有两个不同的对称性,而绝不是说这两个反射变换是相同的.



图21 美丽的泰姬陵在两个反射变换下都不变

再一种重要的线性变换是切变.图22给出了最简单的切变:



图 22 最简单的切变


这里有一条线段,在切变中其上的点不动,但是其外的点(如左图矩竖边上的点都将沿方向移动一个距离,这个距离的大小与此点的高度成正比.例如以矩形左下角为原点,横边为轴,竖边为轴.则在高度为处,平移量应为为一实数(或者说,右图斜线的方程为从而为这条斜线的倾角.图22上的切变称为水平方向的切变,它有一个特点,即左方矩形的底长度没有变化,而虽然矩形变成了平行四边形,高度也没有变化,所以这两个图形面积相同.现在我们来写出它的矩阵表示.首先可以看到任意点的纵坐标未变,所以有至于横坐标则因如上所说的平移而变成所以它的矩阵表示是



与此类似,可以考虑铅直方向的切变,如图23所示,它的坐标表示是是一个实数;而矩阵表示则是



在这个图上

              

                  图23 铅直方向的切变

切变是一种非常有用的变换,我们不妨来看一下怎样用它来证明勾股定理.这个证明是著名的数学科普作家加德纳(M.Gardner)在1964年的一本文集里给出的.只要记住切变不会改变面积,读者完全可以“看图识字”读懂这个证明.用切变来证明勾股定理还有其他方法,不过这一个似乎最简单.我们再来看一下,切变会把图形扭曲成什么样子.下面就是对名画蒙娜丽莎作铅直切变的结果:





图24 用切变证明勾股定理



图25 切变以后的蒙娜丽莎

请注意,铅直方向的向量(红色的)完全没有变化,其他方向的向量(蓝色的)都按顺时针方向扭转了一点.但是,这么一点小变动却使得美丽的蒙娜丽莎怎么看怎么不顺眼.切变是一种重要的物理现象.大气的风场(就是风速的向量场)中剧烈的突然切变(称为切变风)是飞行的大敌!



以上我们只讲到两个特殊方向的切变.一般的切变自然复杂得多.怎样来刻画一般的切变,自然远远超出本文的范围.



  另一个重要的变换是射影.需要注意的是,射影一词在本文涉及的范围内有两种意义.一种理解是用于例如摄影,照相,绘画等方面的射影,这是一种把三维物体映射为平面图像的方法,例如各种透视,画法几何里绘制三视图等.它们与射影几何学有密切关系.而在中学几何教学中也会时而涉及这方面的问题,我们在下文中也会稍稍涉及.另一种理解是一个向量空间里的一种特殊的线性变换它是这样来定义的(以二维平面为限):设有两个线性无关的向量,由教材里面讲的平面向量的基本定理,任意向量都可以用唯一方式写为是实数),我们就说是沿着的方向在方向上的射影,这个线性变换的最明显的性质是:如果对图26中轴上的各个向量例如再作一次射影,其结果就等于是再作了一次恒等变换:



图26 斜射影

  这个式子是作为向量空间里的线性变换的射影的基本性质,时常我们就以它为定义.而在实际应用时,最常见的情况是是互相正交的单位向量,即轴和轴方向的单位向量和,如图27那样.读者可能会奇怪,图27难道不是向量的分量的图示吗?是的,向量在轴和轴方向的分量,就是它在上的射影.重要的是它必须适合上面的关系式.



图27 正射影

正射影的矩阵表示是:




  射影变换有一点和前面讲过的变换都不一样.以前讲过的变换都有逆变换,但是射影变换却没有.因为你从图26上就可以看到,例如所有终点在连接与的那条虚线上的向量,沿的射影都是,也就是说的原象远不止一个,而有无穷多个.如果用正射影的矩阵表示,则看得更清楚:所有的向量都适合都是的原象.



上面我们只讲了教材上一定会有的最简单的情况.实际情况当然会更复杂,而且有时也会见到,例如对于一个平面的射影等.但是主要之点在于必须明白,射影变化都是与向量的分解(如)相关的,而且最根本的性质是

三、旋转与三角函数



现在我们来讲最为重要的线性变换──旋转.具体来说是讲平面上的以原点为中心的旋转.因为它特别重要,我们还是从几何视角与代数视角分开来介绍它.



旋转涉及到许多几何问题.这类几何问题在通常的教材中的处理有一个缺陷,它最典型地表现在三角学和角公式的证明里:通常证明的公式时,画的图都是这两个角及其和均是锐角的情况.如果不是呢?比较负责的教材会说“仿此类推”之类的话,更多的则给人这样一个印象:除此以外别无他法,否则就是“高等数学”“严重超纲”“学生不能接受”等.实际情况是:大家都在追随一种约定俗成的习惯,这种习惯至少算不得“数形结合”,也不符合数学对于逻辑思维的要求.但是,新课标把向量、矩阵和变换都纳入高中教材以后,这个问题就很容易解决了,而且用不着大动干戈.下面我们就想这样来讲三角学.还是请大家不要忘记这句话:“没有代数的几何是哑巴!没有几何的代数是瞎子!”



这种变换之以特别重要,是因为它是数学(现在我们只讲中学数学课程水平的数学)的一个交通枢纽:可以从许多不同方向到达它,又可以由它到达许多地方.三角学的主要部分,其实讲的就是一类把旋转变换的性质表现得淋漓尽致的函数.非常遗憾的是不容易找到一本书帮助中学老师们从旋转变换的角度来重新审视三角学,所以这里打算多费一些笔墨.



我们这里首先要指出,平面上的旋转与三维空间中的旋转是非常不相同的;后者虽然极为重要,却远远超出了中学数学的范畴.所以下文中若无特别申明,凡是讲到旋转,都是指的平面上的旋转.



  什么是平面旋转?它是这样一种变换,保持旋转中心(即向量的起点)不动,也保持向量的长度不变,但是让倾角变化.讲到平面上的旋转,就要讲到旋转角.中学教学里讲到角,在高中与初中不同,总是讲的一般角.初中数学里的角是两条边“夹”出来的,它总是非负的,但是有锐角与钝角之分;一般角则是由一条边“转”出来的,这条边称为“始边”,转到头的那条边称为“终边”.一般角不仅大小不受限制,特别是,它是有符号的.正因为如此,许多最基本的定理本应重新证明,但是因为这些证明时常看起来太简单,人们也就视为当然,不加注意了,而许多要害问题就常被掩盖起来了.为了研究的需要,我们总把角的顶点放在原点,而两条边都画到单位圆的圆周为止.这样研究起来,就可以用单位圆周上的点,也就是用从原点开始的单位向量来代表,例如图29的角就用圆弧来表示.这样一来就可以重新定义一个角的正弦和余弦,刚才已经说到一个角可以把始边(例如图29的单位向量)放在正向的轴上,令它的旋转角,得到其终边(图29上的单位向量),并且表示为坐标形式:

就是基底)   (1)



图29 用单位向量来表示旋转

于是我们定义:这个定义是很容易接受的,但是它和初中利用直角三角形斜边与对边或邻边之比来定义正余弦不同,因为这里没有直角三角形,所以不受为锐角的限制,而且正余弦的符号利用在哪个象限一望即知.



旋转变换确实是一个线性变换.因为两个向量之和可以用平行四边形法则画出来,把这个平行四边形旋转一个角,则它的各边和对角线都会旋转,而相互关系不变;同样,若把一个向量伸缩倍,则旋转后的向量也旋转倍.就是说,若记大小为角的旋转为则这些事实都是自明的.所以,在我们的处理中,不是不要几何直观,也不是把几何直观压缩到最低限度,只是力求避免上面说到的模糊的托词(如仿此类推之类).本来对于其他变换,也应该类似地说明它们也是线性变换,只不过那时没有那些烦心的事,我们就不去说了.



这里要讨论一个重要的特例,就是旋转一个直角会发生什么事.为什么先要讨论这特例呢?不讨论行不行?我百思不得其解,看来还是别无他法,似乎要到讲复数与三角函数的关系时,才能恍然大悟.不过还是希望能找到更便捷的方法.对于任意向量我们要去求按照传统的讲法,就要区别位于各个象限的情况,一一加以处理.这当然很麻烦.但是利用上式,我们只需要处理而决定所在的象限的在上式中根本没有触及.留下来的问题就只有经过旋转后变成什么.从几何上看,很明显:

旋转后变成旋转后变成 (2)

这是一个非常重要的公式(特别不要忘了后一句讲的是而不是),有了它,我们就能很容易地对于任意角和任意向量求出,求出如下:

(3)

就是把旋转一个角度后所得的向量,即是倾角为的向量,而按正余弦的定义,于是留下来的仅有一个问题:是什么?这里有一点很简单的代数运算(可能许多读者未曾想到的就是这一点):-是由j旋转所得的向量:由(2)有所以





以上都是从几何视角来讲旋转.现在要转到代数视角,就是要找出旋转变换的矩阵表示.为此,我们先把这两个结果用竖向量的形式写出来.

(4)

最后

(5)

由此立即有旋转变换的矩阵表示:

(6)

  

  现在的中学教材里,一般都未讨论旋转的代数表示.但是,旧的解析几何书讲到坐标变换时,是会遇到类似情况的(但是与这里不同:现在的点在变,转了一个角而坐标轴则没有变,旧书讲到二次曲线的标准形式时,需要把坐标轴转一个角,这就相当于点作了一个“相对运动”,转了一个角,所以(6)中的需要反号).但是那时也未见到应用如上的推理方法,而一般是应用初等几何相似三角形之类,而且多数的书只就为锐角,点也在第一象限的情况证明一下,其余情况就“依此类推”了事.如果真要“类推”一番,首先是图不好画,其次是一些线段是加是减,极易混淆.实行新课标,似乎需要讲旋转变换的矩阵表示,不知该怎样讲?旧的讲法总是含糊不清,就叫没有代数的几何是哑巴!这里的讲法依据三个几乎是自明的几何事实:

1.重新定义正弦余弦;

2.旋转后变成旋转后变成;

3.把旋转一个角度,相当于把旋转于是先转一个角,再转

  

  除此而外就是一些简单的代数运算,特别是体现在里的交换律.但是,读者必须明白,这里所做的事就是说明上面的三条几何事实,否则的话,短短几行式子也会让人头昏眼花.这就叫做: 没有几何的代数是瞎子!总之你没有必要区分这种那种情况,代数演算自动为你分忧.



你可能觉得,何必为古人担忧?没有哪个学生会问这种事情;何况这里的结果都是正确的.但是不要忘了,我们生活在21世纪,我们所指挥的千军万马将是计算机,它们能够自动区分各种情况吗?我至今没有在国外那些计算机图形学的讲义等里面看见以初等几何为依据的那些证明,难道这只是因为外国学生就是怕几何证明吗?



下面讲到加法定理时,还会见到这个情况.



现在我们把关于旋转的这些结果概括如下.用来记这些几何里的旋转(它们的矩阵表示)的集合,则这个集合具有以下三个性质:

1.若,则,.

2.是恒等变换(是单位矩阵).

3.是逆向旋转,即旋转一个角度(是的逆矩阵).



由于这些性质的原则的重要性,我们需要逐条加以进一步的解释.



我们要特别注意第1条.现在设有一个向量,即有

于是



这就是说,变换的复合对应于矩阵的乘法.但是,从几何上看是自明的,而上式右边的矩阵表示是于是立即得到

(7)

把右边的矩阵乘开,就会得到重要的加法定理:

(8)

把改成(见下面关于第3条的说明),就可以得出的公式.



这个证明远远优于现在的一切中学教材的证法.不仅在于它同时给出了两个公式;也不仅在于它不受限于这两个角位于哪一个象限;而是它真正揭示了这个问题的实质在于相继进行两次旋转时,深刻表示旋转的本质的正余弦函数的变化规则.



读者们可能以为应用了矩阵这个生疏的工具会使得上面的论证很难懂.但是,我曾经在《数学通报》上写过一篇文章,没有使用矩阵也得到同样(至少是类似)的论证.现在重复一下这个论证,为了表明它完全不同于教材上以相似三角形为基础的证明.基本的思想是旋转一个角度分成两步走.第一步是:设从单位长向量开始旋转一个角度(在哪个象限都没有关系),于是得到另一个单位长向量,其坐标是把它当作新的横轴上的向量,则新的铅直轴上的单位向量是由旋转而得,所以按照上面的说法,其坐标表示为.我们把这两个结果放在一起备用:

(9)

现在走第二步:从开始在旋转一个角度,而且得到最终的向量.利用(8)式,就有

(10)

但是也可以由一下子旋转一个角度得出,于是应该有

(11)

比较(9),(10)两式,我们又一次得到加法定理(7)!



这两种推导方法几乎如出一辙:它们都摆脱了对于诸如三角形的相似性的依赖,不必去区分各种不同情况,不必费劲去规定两个线段何时相加,何时相减──没有代数的准则,这些事情很难说清楚:没有代数的几何确实是哑巴──而只需要几个确无疑义的几何事实──正余弦函数的新定义;旋转以后成为旋转以后成为──以及最简单的代数运算和平面向量的基本定理;不过不了解这些基本的几何事实也会乱成一团(没有几何的代数是瞎子),而在把这些几何事实了然于胸以后,代数的运算法则就会为你自动地处理种种复杂情况.新推导方法的优点主要在此.



那么,何必要用矩阵记号呢?是否多此一举?请特别注意(7)式,再注意到数的加法的可交换性以后,我们把它写成

(12)

只要讲到矩阵的乘法,一定会提到其不可交换性,可是在这里,因为矩阵具有特殊形状──主对角线上的两个元素相同,另一条对角线上的元素反号──它的乘法反而和数(实数与复数)的加法一样具有了可交换性!平面旋转具有可交换性则是自明的.这绝非无足轻重的小事,我们下面还要讲到.现在我们要问:

您在数学里面见过类似于(12)的公式吗?

见过:对于指数函数(如果我们记为的话),就有

(13)

在数学的如此基础的部分里,不太可能有什么巧合,那么平面旋转与指数函数有什么关系呢?这正是下面要讲的事.

第2条没有什么可说.

第3条倒是需要证明.本来可以应用代数方法来求的逆矩阵,并证明它就是但是我们宁愿走一条几何的道路,因为这会给我们带来新的洞察.从几何视角来看,的逆变换应该是,而它的矩阵表示应该是.那么,怎样把角变为?除了反向旋转以外,对轴作反射也可以.但是,在这样的反射下,一个点(或向量)的横坐标不变,而纵坐标反号.所以一个倾角为的单位向量,将变为仍然具有单位长度但倾角为的向量,但是由上述坐标在此反射下的变化规则,即有另一个重要公式:

(14)

我们对这个公式用几何方法证明,是因为它与上面讲的加法定理反映全然不同的事实.总之,我们有

(15)

至此我们得到了关于三角函数的几乎所有重要定理.[1]



现在我们要换一个角度来讨论这些问题了.



前面说过,复数理论是向量理论的前奏.如果把向量改成复数,则用另一个复数去乘它,就得到一个变换(映射)当即为“单位”复数(这里生造一个新名词,常用的说法是“模为1的复数”)时,它就是一个旋转角为的旋转,记为,而一般情况下就是一个这样的旋转与一个相似比为的尺度变换的复合.对于旋转角为的两个旋转,我们有

页: [1]

请您先登陆,再发跟帖!