科学网

 找回密码
  注册

tag 标签: 行列式

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

线性代数(3)_讲初等行变换_化行最简形的算法
cambaluc 2020-4-12 12:21
把矩阵化为 ” 行最简形 ” 是线性代数课中很重要的算法,求线性方程组的解、解矩阵方程、求逆、求特征向量,以及求行列式都可利用。 以下是我写的化矩阵 B 为行最简形 C 的程序,算法好理解,但写成程序还是颇费脑筋的,如果你是理工科的学生,学过 C 语言,学线性代数时最好是写写下列程序。其实学线性代数,我认为主要是锻炼“自然语言、数学语言和空间图象”的理解和转换,以及代数方程语言、矩阵语言、几何 ( 向量 ) 语言、算法程序语言的互译。 有了这个算法,对把增广矩阵化为行最简形,就可写出线性方程组的解或求逆。 如:对矩阵: 1.00 1.00 1.00 -0.20 1.00 -1.00 -1.00 -0.60 3.00 1.00 1.00 -1.00 化行最简为 1.00 0.00 0.00 -0.40 0.00 1.00 1.00 0.20 0.00 0.00 0.00 0.00 确定自由未知数为 x3 ,可写出向量形式的解。 用初等行变换化行最简形,等同于同解变换即解方程的消元法,也等同于用初等变换阵乘增广矩阵,举例: 对化行最简的算法稍加改进,利用初等行变换和方阵行列式的性质,就可写出计算行列式的程序,如下,这个算法在计算高阶行列式方面,要比上上篇博文中介绍的递归算法有效多了,但我还是喜欢递归法。
个人分类: 算法|9430 次阅读|0 个评论
线性代数(1)_这样开始讲“行列式”
cambaluc 2020-3-12 10:16
这学期在网上讲线性代数,对一些在教室黑板上很容易说清楚的问题,都得搬到计算机上进行,关键是看不见学生的反映,有人说出些小作业随时让学生做,可是,数学课不同于其它课,信息量知识量大做题耗时不必说,很多抽象思维的东西是需要现场交流的,虽然也是直播,有的只可 ” 意会 ” 的内容很不好远程 ” 言传身教 ” 。 这样,师生都守着电脑上课,也是可利用的,正好这届学生已学过 C 语言课,所以上线性代数,我也试着引入用 C 语言计算一些问题。同时用自然语言、数学语言、计算机语言,从不同的角度描述和理解同一数学问题也许更好。教材上来就讲行列式,并且用什么“对换”“逆序”来讲,想想学生看着 PDF 电子文件也够头痛的。 线性代数,对学了 C 语言的同学该这样开始学: 递归方法计算行列式 我先简单引入向量,就是一列有序的数,这是学生熟悉且好掌握的,简单介绍矩阵,让学生和 C 语言二维数组联系起来,再正式开讲方阵的行列式。引入矩阵的余子阵概念,即方阵 A 中划去某元素所在行及所在列的元素后剩余元素所组成的 n-1 阶方阵 , 记为 Aij ,就可自然引出用如下递归定义计算行列式 det(A) 或 |A| 。 如果 A 是 1 阶方阵, A 只有一个元素, det(A) 为 A 的值,即 det(A)=A 。否则 n1 时,行列式值为: 根据这个定义,先讲一些示例,按着以上算法,再介绍 C 程序。虽然有的同学 C 语言学的不怎么好,但大概思路还是可接受的。 主程序调用: det(A,N) 我写的 det 函数为: ( 倒数第四行 delete [] A1k; ,还是学生告我他的编译器对“ delete A1k ”有警告而改正的。 ) 这个定义,开始可能难点,但再熟悉一下二阶行列式的计算,就可很自然地理解行列式的性质,如对换、数乘、倍加变换对行列式值的影响。也很容易理解行列式的按行、列展开。 有了以上行列式计算的程序,也容易理解克拉默法则解线性方程组、求伴随矩阵等程序。 教材上也没涉及行列式的几何意义,只是一味的算算算,行列式其实是代表向量组所组成的平行四边形有向面积(三维是体积),画了如下图简单介绍,了解几何意义也对以后学习矩阵或向量组的秩时为什么用到行列式,有个直观的映像。对线性变换导致的空间变换也好理解,对 |AB|=|A||B|=|B||A|=|BA| 等性质看起来也很直观了。 通过举例分析一些复杂的行列式计算,学生基本能掌握行列式这一章。 另外,递归程序计算行列式时,随着 n 的增大,计算量是很大的,如以下四阶矩阵, 算 4 阶矩阵的行列式共调用 det(A) 的次数为 1+4+4*3+4*3*2=41 次。 对于 5 阶,是 1, 5, 5*4, 5*4*3, 5*4*3*2 =206 次, 对于 6 阶 1237 次, 7 阶 8860 , 8 阶 69281 次。
个人分类: 数学|3693 次阅读|0 个评论
重修线性代数6——行列式
热度 13 xying 2017-2-24 08:29
行列式是线性代数中,联系线性方程组解,特征多项式和线性算子标准形式的一个枢纽。在西方科学史上,矩阵起先只是作为行列式所用的表示形式,线性代数的内容早就在这学科形成之前,在行列式的研究中已被了解了。行列式计算的解析表达式,是纯粹用代数方法来讲述这门学问的有力工具,但也因莫名其妙而饱受诟病。 6.1 行列式的几何含义 许多教科书都用莱布尼茨公式作为行列式的定义: 这里 p=(p 1 ,p 2 , …, p n ) 是数组 (1, 2, …, n) 全排列中的一个置换,共有 n !个,σ (p) 是这置换的奇偶性,奇置换为 -1 ,偶置换是 1 。这是个纯粹用算法程序来定义的函数,很难看出与经验关联足以想象的含义。这公式定义了行列式作为 n 阶方阵中 n 2 个参数作为变量的多元函数,充满了对称的美、抽象方法的奇妙和构造性计算的确定性。也许教科书的作者想让学生,以此领略抽象代数中一些基本构件的联系,以及代数方法的简洁。但猛然来怎么一下,想看懂它和应用的联系,谁都觉得晕。 在科学理论中列为范本的是欧几里德的几何原理,从简单的几条公理出发,纯粹用逻辑演绎出一套定理,无所不包地解释平面几何中一切关系。现代数学走向公理化的形式逻辑推理,抽象的代数方法无疑是最简洁和严谨的。却没去深思,几何研究面对的是图形,物理概念基于经验,抽象的美好来自于对已知具象的涵盖,驱动推理的灵感是心中的直观想象。除此之外,抽象的概念只是个符合定义条件的约束、什么都可代入的容器,逻辑推理只是句法的机械操作搬弄符号,无关语意,没有灵魂。所以符号主义的人工智能,缺乏人类联想的创作性和驱动推理的方向。高度抽象的数学,是到了高级阶段时对前面知识的总结,只在拥有了丰富的经验内容之后,才能显示出价值。对于初学线性代数的学生,用复杂的算法来定义一个重要的数学概念,会让人迷失在算法的程序中,与现实事物无从接轨。 这里给行列式一个可以想象的几何含义的定义,让你能从图像中“看出”行列式的各种性质。 行列式是用矩阵描写平行多面体广义体积的函数,以正负值来表示行列顺序在空间的定向。 在n维空间中,n个线性无关的向量 x 1 ,x 2 ,…,x n 构成了一个平行多面体,它的广义体积是以这些向量为变量的多元线性函数V( x 1 ,x 2 ,…,x n ),这函数有下列性质: 单位正交基向量的函数值等于1,V( e 1 ,e 2 ,…,e n )= 1. (n维单位立方体的体积为1) 如果变量中有两个向量相等,则函数值为0.(退化平行多面体的体积为0) 体积函数对其变量具有线性关系,V(…, a x +b y , …) = aV(…, x , …) + b V(…, y , …) 。 当 n=2 时,矩阵描写了平行四边形, n=3 时,它是平行六面体,图形如下,你可以想象高维的情况。 V 作为广义体积定义的性质,在线性空间的数域是实数时,符合经验的想象。 应用性质 2 和 3 ,不难推导证明,若变量中两个向量对调位置,则 V 函数乘上 -1 ,这对应着在高一维的空间中,广义的体积作为与这平行多面体垂直向量的长度时它的朝向。 向量 x 1 ,x 2 ,…,x n 在标准正交基 { e 1 ,e 2 ,…,e n } 上,表示为 n 个列向量 A 1 , A 2 , …,A n ,用它们组成一个 n 阶方阵 A = ( A 1 , A 2 , …,A n ) ,代入不难证明上面的莱布尼茨公式。 列向量也可以直接看成是向量,把它们 n 个打包成方阵 A , A 的行列式表示为 A 到数域的函数, |A| = V( A 1 , A 2 ,…,A n ) ,函数值是这些列向量构成的平行多面体的广义体积。 直接从行列式的几何定义出发,很容易想象,任何方阵如果其中的行向量或列向量是线性相关的,它们形成的平行多面体退化成一个低维空间上的几何体,体积为 0 。所以非零值行列式的矩阵的充要条件是满秩的。 满秩的方阵可以分解为初等矩阵的乘积。任何方阵都可以分解成几个初等矩阵与对角线上只有 1 和 0 的对角阵。对角线上有 0 的对角阵对应着奇异的(不满秩的)方阵,即列向量线性相关,其行列式为零。单位矩阵行列式值为 1 。在这些初等变换中,数乘变换 D i (k) 把其中一个向量变长了 k 倍,面积也成 k 倍,列交换 P ij 改变了向量扫过平行四边形的方向,相反的方向乘上 -1 ,而切变矩阵 T ij (k) 进行剪切变形,将 j 轴向 i 轴方向推斜了 k:1 斜度,保持体积不变,这些初等变换的行列式值分别等于 k , -1 , 1 ,所以,方阵的行列式等于分解成的那些初等矩阵与对角阵行列式的乘积。因此,相乘的两个方阵行列式等于它们行列式的乘积。 满秩方阵 A 的转置等于分解它初等矩阵和对角阵转置后的反向乘积 A’ = (P 1 P 2 …P k )’ = P k ’…P 2 ’P 1 ’ ,而对角阵的转置保持不变,初等矩阵转置后行列式不变,所以转置的矩阵行列式保持不变 |A| = |A’| 。这意味着上面几何定义的行列式也可以用在行向量,所有对列操作运算的性质对行也适用。 6.2 代数余子式与向量的外积 中学数学里介绍过,三维向量 a 与 b 的外积是 ,它的结果是一个向量,这向量的长度是由 a 和 b 形成的平行四边形的面积,方向 n 是与这平行四边形平面垂直,按右手定则确定的朝向。将这些向量表示成在 i, j, k 轴的分量形式,可以用行列式的式子来表示: 这里的 i , j , k 分别是这些列向量作为坐标表示的单位正交基向量 e 1 , e 2 , e 3 ,这个外积向量在这些基向量的分量是这行列式的代数余子式,也可以看成把这两个向量分别投影到与这些基向量垂直的平面上平行四边形的面积。从三维空间中 3 个向量形成的行列式,可以推出 这里 a x b 表示平行四边形面积的法向向量,向量 c 对这法向向量的投影与平行四面体面积的乘积( a x b )· c 自然是这平行六面体的体积。这个几何的解释完全与行列式的计算一致。 我们感兴趣的是怎么把这个几何直观推到 n 维空间。把这 3 个向量放在 4 维空间,依行列式的计算有 这说明行列式计算的广义体积,对应着在高一维空间中与这平行多面体垂直向量的长度。这向量可以用行列式表示为 n 个向量在 n+1 维空间上的广义外积。下面进一步解释细节。 教科书都是用公式推导证明, n 阶行列式可以按列(行)展开来计算, |A| = Σ i a ij D ij ,这里的 D ij 叫做 a ij 的代数余子式,它是矩阵 A 中划去第 i 行第 j 列后 n-1 阶行列式的值乘上 (-1) i+j 。这低一阶的行列式如法炮制,又可以用再低一阶的行列式来计算,这种递归算法叫做拉普拉斯定理。然而,从几何解释中直接看出这一点,将给我们更清晰的图像理解。 对应着 A 的第 j 列向量 A j 的代数余子式 (D 1j ,D 2j , …, D nj ) T 组成代数余子式向量 D j ,行列式 |A|= A j · D j 。从行列式是广义体积的几何图像来看, D j 就是 n 维 A 矩阵中,除去 A j 余下的 n-1 个向量,张成 n-1 维空间里平行多面体的广义体积。这 n-1 维的广义体积的向量与它所在的子空间垂直,它与 A j 的内积作为“面积”与“高”的相乘,构成 n 阶行列式的广义体积。 代数余子式向量可以看做三维空间中两个向量外积概念的推广,从三维空间中两个向量平行四边形面积为长度的法向向量,推广到 n 维空间 n-1 个向量平行多面体广义体积为长度的法向向量。代数余子式 A ij 是对应于 j 的法向向量对第 i 坐标轴的投影,这法向量与多面体所在的子空间垂直,相当于这多面体向与第 i 坐标轴垂直的子空间的投影,所以在计算广义体积时,不计这 n-1 个向量在第 i 坐标轴上的分量,在构造余子式的 n-1 阶子行列式中,需要移动矩阵 A 的第 j 列移和第 i 行到子行列式外,其中交换列和行 2n-i-j 次,所以代数余子式要乘上 (-1) i+j 因子。 一般形式的拉普拉斯定理,把这种三维空间中“高”与“面积”的相乘得到“体积”的思路,进一步推广到 n 维空间广义体计算积中,用 k 阶行列式的子式表示的投影到“高”那 k 维部分的向量,与 n-k 阶代数余子式表示的“面积”部分向量的内积。 如果你还没有形成足够的空间想象能力,能通过上面的描述看到几何图像,建议用上面二维和三维空间行列式和向量外积计算,在纸面上画出图形来理解。线性代数课是继平面几何,解析几何之后,对抽象的空间想象能力的训练。抽象概念的想象也是在课程学习中,逐步建立起来能够看到的画面,在学习中忽视了这一点,你就无法看到进一步学习内容中的图像。 6.3 逆矩阵和克莱姆公式 矩阵 A = ( A 1 , A 2 , …,A n ) 的代数余子式向量构成的矩阵 D = ( D 1 , D 2 ,…,D n ) 的转置,叫做 A 的伴随矩阵。代数余子式向量与张成它的 n-1 阶多面体垂直, D i · A j = 0 , i ≠ j ;由拉普拉斯定理有 D j · A j = |A| ,所以 D T A = |A|I ,这得出非奇异方阵的逆的解析表达式 A -1 = D T /|A| 。 对于线性方程组 A x = c ,将 A 的伴随矩阵左乘方程两边,则得到 |A| x = ( D 1 , D 2 , …,D n ) T c ,所以 x 的第 i 个分量有 |A| x i = D i · c ,由 6.2 节中拉普拉斯定理的解释得知这个内积等于行列式 | D 1 , D 2 ,…D i-1 ,c,D i+1 ,D n | ,当 A 是非奇异时则有克莱姆公式 x i =| D 1 , D 2 , …D i-1 ,c,D i+1 ,D n |/|A| 。 行列式是个有确定结果的算法表达式。无论是求矩阵的逆还是线性方程的解,以及以后的各种应用,都能用它得出解析的式子,这在理论上有很大意义。但是由于它的计算量与其阶数成指数函数关系,所以除了 2 阶等极端情况外,在实践中都是先将矩阵变换成三角阵或准三角阵后再行计算。 6.4 张量和半张量积 行列式的值对于它的列向量(或行向量)都有线性关系,它可以看成是一种斜对称的多线性函数,向量的内积是两个变量的对称双线性函数。研究多线性代数的数学称为张量分析。张量是用来表示在标量、向量和其他张量之间线性关系的多线性函数。它是一种比向量更广泛意义上的“数量”,它的概念可以包括标量、向量、线性算子等等作为特殊情况。在线性空间上线性作用的重数称为张量的“阶( rank )”,标量可以看作是 0 阶的张量,向量是 1 阶的,线性算子是 2 阶的。在给定的坐标下,向量表示为 1 维的数组(即列向量),线性算子为 2 维的数组(即矩阵), r 阶张量为 r 维数组。在坐标变换中依变换的方式不同,其指标可以分成协变和逆变两种,具有丰富的表达能力,在物理和工程上有着广泛的应用。 高维数组在数学和工程问题上经常使用,尤其应用在对多线性和非线性问题的处理,但在显示和分析上十分不便。如果把它们按一定的顺序排成一列或矩阵,规定它们间合适的运算规则,则既可以方便地在书面上显示、作理论分析,又能与原来的数组运算等价。这种新的矩阵运算叫做“半张量积”,是对普通矩阵乘法进行推广。传统上矩阵的乘法 AB ,要求 A 的列数与 B 的行数相等,相乘时 A 与 B 中的相应的元素是 1 对 1 的运算;矩阵的张量积没有这限制,它是 A 中的每个元素与整个 B 矩阵来相乘,但它与传统矩阵乘法不能兼容;而半张量积与张量积一样,对 A 、 B 矩阵的列行数并无要求,其运算规则介乎传统乘法与张量积之间,当列行数相等时即为传统的矩阵乘法,但有倍数关系时就变成其中一个矩阵元素与另一矩阵按倍因子分块配对的乘法,进而推广到任意的两个矩阵。半张量积的这种矩阵运算规则,不仅适用于多维数组排成矩阵后的等价运算,而且它与矩阵的加法有分配律,与矩阵通常乘法有结合律,这是一种漂亮地解决多维数组书面表达、分析、计算和扩展矩阵乘法的设计。这是程代展教授对矩阵理论的原创性贡献,经过十多年普及,现已成为表达有限集合上映射及性质,研究有限集合上的动态系统的演化规律及控制的有力工具,在动力系统、网络、线路设计与检测等方面有许多应用。 (待续) 【补充】贴在评论 之后 一些读者对半张量积好奇,希望给个简单的例子。这里简介一下。 定义:设 A 是 mxn 矩阵, B 是 pxq 矩阵,记 n 与 p 的最小公倍数为 t . 定义 A 与 B 的半张量积为 (A ⊗I t/n )( B ⊗I t/p ) ,这里 ⊗ 是矩阵的张量积( Kroneckerproduct )。 注:上述定义中,如果 n=p 称 A 与 B 是等维数,如果 n 与 p 其中一个能整除另一个,则称是倍维数的 , 其他为一般情况。定义是对一般情况给出的。 对于等维数的情况 , 它退化为普通矩阵乘法,倍维数可简化为分块积。因此 , 半张量积是普通乘法的推广。倍维数情况定义左半张量积是最常用的。在这定义下结合律与分配律对半张量积仍成立。 仍然觉得晕?好吧,举例说明。张量积 A ⊗B 意思是 A 中每一个元素与每一个 B 中元素相乘的矩阵,或者说 A 中每一个元素与整个 B 相乘,然后按 A 的布置排出的矩阵,比如说: 假如 A 是 3x4 的矩阵, B 如上是 2x2 的矩阵,它们的最小公倍数是 4 , I 1 是 1 , A 与 B 的半张量积 如下 (注: 不是半张量积的标准符号,只是无法找到这标准符号,暂时用它聊以示意) . 因为这是倍维数的半张量积,也可以把 它化简为 A 中的列分成 2 块与 B 向乘。 为什么定义这样的乘法?想一想 A 原来 是个 3x2x2 的三维数组 展成的矩阵 , A 1 , A 2 是三维数组的第三个下标的两个断面,为了显示方便把它们并排放一起变成一个矩阵,这第三个下标方向按传统方式与 B 来相乘 ( 想象一下 线性算子的复合),然后再把它们排放成一个矩阵 。想进一步了解它的 理论和 应用,详见: 程代展 , 赵寅 . 矩阵的半张量积 : 一个便捷的新工具 . 科学通报 , 2011, 56: 2664 – 2674 程代展 , 齐洪胜,矩阵的半张量积理论与应用,科学出版社, 2007
个人分类: 科普|19879 次阅读|25 个评论
受够了本科生教学,皇帝新装的骗局
热度 141 dawndream 2016-5-21 19:10
改完期中测验卷,我感到心灰意冷。 两门课。一门选修课“控制工程数学基础”。开设此课的出发点,是为了强化线性代数知识。因为我知道,学生大一学的“线性代数”是公共课,没教好,也没学会,所以再教一遍。 这次期中测验,结果令人又气又悲。一共56个人,课堂学了足足两遍,仍然 无一人 对线性代数的基本概念有起码的了解!卷面实际成绩无人能到40分。 我出的题目专门检测对基本概念的掌握。比如,给定一个矩阵,第一问秩是多少?第二问是否奇异?第三问行列式多少?第四问最小模特征值是多少?其实我给的3阶以上矩阵,统统都不满秩。只需算出(有些可以直接目测)秩是多少,其他全都是送分的,顺着写就行。可是这些人偏要每一步都去死算,结果我15分钟能做完的题量,给他们45分钟,又延长了10分钟,依然算不完! 他们拿到题只会死算,跟我的理念形成了尖锐的冲突。线性代数,你会算行列式,会求逆,会求矩阵乘积,会用高斯消元法算秩,会算特征值... 这些有什么用? 你的机械计算能力永远抵不上一个小小的手机APP软件。真正重要的是思想,是对概念的思考理解。可是这些学生无论多么简单的证明题,就束手无策,因为脑子里面总是一团浆糊。最不可思议的是“线性空间”这个概念,无论你怎么给他讲,就是全然不会。连续几届都如此。“一个对任意加法和数乘运算封闭的非空集合,就是线性空间”,就这么个概念,无论怎么教,依旧全体不懂。这次测验,一道证明题“求证:同时满足方程 Ax=0 且 Bx=0 的解形成一个线性空间。”全都缴枪,绝大部分人都留空白。 另外一门课,“现代控制理论”,情况略微好一点点。二十多人的班,大概能有 10% 到 15% 的学生大体掌握了基本概念,其余的人还是完全不会,拿到题目以后一通胡写。这门课小班授课,我使出浑身解数,务求精益求精地教学,内容精简之至。依然是这样的结果... 最近跟一个毕业生聊天。大概人之将别,其言也真,这位同学道出了真相。学生说,老师你不知道,大家从来都 不学习 。时间都花在睡觉,打游戏,玩手机,看小说,谈恋爱,上党课,培养人际社交能力... 种种活动上面,反正就是 不学习,集体抗拒 。考试的时候等老师划范围,透题,然后硬背一些题往卷子上胡填。就这样。 花费大量的时间和精力,去做“本科教学”这样毫无实效的工作。我是受够了。 如此恶劣不堪的学风,如此无底线的学习效果,我校绝非个例,应属于普遍的有代表性的情况,估计排名在150到400名的学校,大抵如此。欢迎同仁朋友们讨论,贵校本科教学的真实情况。 附线性代数期中测验题: 控制理论期中测验
34329 次阅读|311 个评论
周四讨论班:行列式(刘禹男)
GrandFT 2014-12-24 23:49
题目: 行列式 主讲:刘禹男 时间:2014年12月25日 星期四下午4:30 地点:16教学楼308室 行列式 1、行列式的构造和基本性质。 1.1几何背景 1.2组合解析方法 1.3行列式的基本性质 2、行列式的进一步性质 2.1按行(列)展开 2.2特殊矩阵的行列式 3、行列式的应用 3.1伴随矩阵、逆矩阵关系 3.2 克拉默公式 4、行列式的公理化构造(略讲) 4.1第一公理化构造 4.2第二公理化构造 4.3完全归纳构造法 4.4通过乘法性质的刻画 PS:完全归纳构造法定义行列式。 行列式的极限和导数简介。
个人分类: 周四讨论班|2230 次阅读|0 个评论
线性映射对单位正方形的作用
Yaleking 2014-8-6 23:40
我们来研究从线性空间 $ \mathbf{R}^n$ 到 $ \mathbf{R}^n$ 的线性变 换 $ L$ 对$ n$ 维单位正方形的作用.令 $ L:\mathbf{R}^n\rightarrow \mathbf{R}^n$ 是一个 线性变换,而 $ E$ 是 $ \mathbf{R}^n$ 中的一个 $ n$ 维单位正方形,也就是 说,$ E= \times \times\cdots\times $,其中 $ \forall 1\leq i\leq n$,$ b_i=1$. $ E$ 在 $ \mathbf{R}^n$ 中的测度为$ 1$.现在我们来看看,$ E$ 在 $ L$ 的作用下,在 $ \mathbf{R}^n$ 中的测度将会发生如何变化. 设线性变换 $ L:\mathbf{R}^n\rightarrow \mathbf{R}^n$ 对应的矩阵为 $ {\displaystyle L=\begin{pmatrix} a_{1,1} a_{1,2} a_{1,3} \ldots a_{1,n} \\ a_{2,1} a_{2,2} a_{2,3} \ldots a_{2,n} \\ \vdots \vdots \vdots \vdots \vdots \\ a_{n-1,1} a_{n-1,2} a_{n-1,3} \ldots a_{n-1,n}\\ a_{n,1} a_{n,2} a_{n,3}\ldots a_{n,n} \end{pmatrix} \ \ \ \ \ (1)}$ 通过从头到脚的初等行变换(这里的初等行变换包括行之间的交换, 以及将某一行乘以一个非零常数后加到另一行上,但是不包括将某一行乘以 一个非零数这种操作,下文所涉及的所有初等行变换都是这样的.),我们能将矩阵 (1) 化为上三角形式 $ {\displaystyle L'=\begin{pmatrix} u_{1,1} u_{1,2} u_{1,3} \ldots u_{1,n} \\ u_{2,2} u_{2,3} \ldots u_{2,n} \\ \vdots \ddots \ddots \vdots \\ (0) \ddots u_{n-1,n}\\ 0 \cdots u_{n,n} \end{pmatrix} \ \ \ \ \ (2)}$ 对上三角矩阵 (2) 继续进行初等行变换,不过这时候的初等行变 换顺序是从脚到头,那么可以将上三角矩阵 (2) 化为对角矩阵 $ {\displaystyle L''=\begin{pmatrix} v_{1,1} \cdots 0 \\ v_{2,2} (0) \\ \vdots \ddots \ddots \vdots \\ (0) \ddots \\ 0 \cdots v_{n,n} \end{pmatrix} \ \ \ \ \ (3)}$ 下面看对角矩阵 (3) 所对应的线性变换 $ L''$ 对 $ E$ 的作用.易 得 3 $ {\displaystyle L''(E)= \times \times\cdots\times . \ \ \ \ \ (4)}$ ($ \forall 1\leq i\leq n$,当然如果$ v_{i,i}0$,那么区间 $ $其实应该写成$ $.)于 是,$ L''(E)$ 的体积变为 $ {\displaystyle m(L''(E))=|v_{1,1}v_{2,2}\cdots v_{n,n}|b_1b_2\cdots b_n=|\det L''|. }$ 由于初等行变换不改变行列式的值,因此 $ \det L''=\det L$.于是 $ {\displaystyle m(L''(E))=|\det L|m(E). }$ 下面我们来证明, $ {\displaystyle m(L''(E)))=m(L(E)). }$ 根据矩阵 $ L''$ 的形成过程,可得 $ {\displaystyle L''=P_1P_2\cdots P_kL, }$ 其中 $ P_1,P_2,\cdots,P_k$ 是初等阵,代表的是矩阵的初等行变换(不包括将某 一行乘以一个非零数这种操作),因此我们只用证明 $ {\displaystyle m(P_1P_2\cdots P_kL(E))=m(L(E)). \ \ \ \ \ (5)}$ 为了证明 (5) ,我们只需要证明如下引理(为什么只需要证明这 个引理就可以得到 (5) ?提示:若 $ L(E)$ 是个 $ n$ 维的规则几何体,则它可以被可数个 $ n$ 维正方形填充.) 引理 1 $ \mathbf{R}^n$ 中的 $ n$ 维正方形 $ K$ 在初等阵 $ P_i$ 的作用下不改变其在 $ \mathbf{R}^n$ 中的测度. 而该引理的证明是容易的.如果初等阵 $ P_i$ 代表的是行 之间的交换,那么 $ \mathbf{R}^n$ 中的 $ n$ 维正方形 $ K$ 在 $ P_i$ 的作用下 只是挪了一个位置.如果初等阵 $ P_i$ 代表的是某一行乘以一个非零数后加到 另一行上,那么 $ n$ 维正方形 $ K$ 在 $ P_i$ 的作用下只会向某一个维度发生偏 移,整个正方形体发生了倾斜,但是体积仍然不会受到影响. 3. ↩
个人分类: 线性代数|2208 次阅读|0 个评论
[转载]大话矩阵
热度 5 Moviez 2013-1-17 09:48
[转载]大话矩阵
博主注:原标题为《理解矩阵( 一 、 二 、 三 )》@CSDN·孟岩博客,因写作风格有点像丁奇的《大话无线通信》,故转载时修改为现标题;本文再次诠释了“知识的运用是一回事,知识的理解是另一回事”,其最佳状态是真正理解后的知识再运用。 理解矩阵(一) 前不久chensh出于不可告人的目的,要充当老师,教别人线性代数。于是我被揪住就线性代数中一些务虚性的问题与他讨论了几次。很明显,chensh觉得,要让自己在讲线性代数的时候不被那位强势的学生认为是神经病,还是比较难的事情。 可怜的chensh,谁让你趟这个地雷阵?!色令智昏啊! 线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说,在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍逆序数这个“前无古人,后无来者”的古怪概念,然后用逆序数给出行列式的一个极不直观的定义,接着是一些简直犯傻的行列式性质和习题——把这行乘一个系数加到另一行上,再把那一列减过来,折腾得那叫一个热闹,可就是压根看不出这个东西有嘛用。大多数像我一样资质平庸的学生到这里就有点犯晕:连这是个什么东西都模模糊糊的,就开始钻火圈表演了,这未免太“无厘头”了吧!于是开始有人逃课,更多的人开始抄作业。这下就中招了,因为其后的发展可以用一句峰回路转来形容,紧跟着这个无厘头的行列式的,是一个同样无厘头但是伟大的无以复加的家伙的出场——矩阵来了!多年之后,我才明白,当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说:“这个东西叫做矩阵”的时候,我的数学生涯掀开了何等悲壮辛酸、惨绝人寰的一幕!自那以后,在几乎所有跟“学问”二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对于我这个没能一次搞定线性代数的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血流。长期以来,我在阅读中一见矩阵,就如同阿Q见到了假洋鬼子,揉揉额角就绕道走。 事实上,我并不是特例。一般工科学生初学线性代数,通常都会感到困难。这种情形在国内外皆然。瑞典数学家Lars Garding在其名著Encounter with Mathematics中说:“ 如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。 ”,然而 “按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型,...,这就带来了教学上的困难。” 事实上,当我们开始学习线性代数的时候,不知不觉就进入了“第二代数学模型”的范畴当中,这意味着数学的表述方式和抽象性有了一次全面的进化,对于从小一直在“第一代数学模型”,即以实用为导向的、具体的数学模型中学习的我们来说,在没有并明确告知的情况下进行如此剧烈的paradigm shift,不感到困难才是奇怪的。 大部分工科学生,往往是在学习了一些后继课程,如数值分析、数学规划、矩阵论之后,才逐渐能够理解和熟练运用线性代数。即便如此,不少人即使能够很熟练地以线性代数为工具进行科研和应用工作,但对于很多这门课程的初学者提出的、看上去是很基础的问题却并不清楚。比如说: * 矩阵究竟是什么东西?向量可以被认为是具有n个相互独立的性质(维度)的对象的表示,矩阵又是什么呢?我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什么这种展开式具有如此广泛的应用?特别是,为什么偏偏二维的展开式如此有用?如果矩阵中每一个元素又是一个向量,那么我们再展开一次,变成三维的立方阵,是不是更有用? * 矩阵的乘法规则究竟为什么这样规定?为什么这样一种怪异的乘法规则却能够在实践中发挥如此巨大的功效?很多看上去似乎是完全不相关的问题,最后竟然都归结到矩阵的乘法,这难道不是很奇妙的事情?难道在矩阵乘法那看上去莫名其妙的规则下面,包含着世界的某些本质规律?如果是的话,这些本质规律是什么? * 行列式究竟是一个什么东西?为什么会有如此怪异的计算规则?行列式与其对应方阵本质上是什么关系?为什么只有方阵才有对应的行列式,而一般矩阵就没有(不要觉得这个问题很蠢,如果必要,针对m x n矩阵定义行列式不是做不到的,之所以不做,是因为没有这个必要,但是为什么没有这个必要)?而且,行列式的计算规则,看上去跟矩阵的任何计算规则都没有直观的联系,为什么又在很多方面决定了矩阵的性质?难道这一切仅是巧合? * 矩阵为什么可以分块计算?分块计算这件事情看上去是那么随意,为什么竟是可行的? * 对于矩阵转置运算A T ,有(AB) T = B T A T ,对于矩阵求逆运算A -1 ,有(AB) -1 = B -1 A -1 。两个看上去完全没有什么关系的运算,为什么有着类似的性质?这仅仅是巧合吗? * 为什么说P -1 AP得到的矩阵与A矩阵“相似”?这里的“相似”是什么意思? * 特征值和特征向量的本质是什么?它们定义就让人很惊讶,因为Ax =λx,一个诺大的矩阵的效应,竟然不过相当于一个小小的数λ,确实有点奇妙。但何至于用“特征”甚至“本征”来界定?它们刻划的究竟是什么? 这样的一类问题,经常让使用线性代数已经很多年的人都感到为难。就好像大人面对小孩子的刨根问底,最后总会迫不得已地说“就这样吧,到此为止”一样,面对这样的问题,很多老手们最后也只能用:“就是这么规定的,你接受并且记住就好”来搪塞。然而,这样的问题如果不能获得回答,线性代数对于我们来说就是一个粗暴的、不讲道理的、莫名其妙的规则集合,我们会感到,自己并不是在学习一门学问,而是被不由分说地“抛到”一个强制的世界中,只是在考试的皮鞭挥舞之下被迫赶路,全然无法领略其中的美妙、和谐与统一。直到多年以后,我们已经发觉这门学问如此的有用,却仍然会非常迷惑:怎么这么凑巧? 我认为,这是我们的线性代数教学中直觉性丧失的后果。上述这些涉及到“如何能”、“怎么会”的问题,仅仅通过纯粹的数学证明来回答,是不能令提问者满意的。比如,如果你通过一般的证明方法论证了矩阵分块运算确实可行,那么这并不能够让提问者的疑惑得到解决。他们真正的困惑是:矩阵分块运算为什么竟然是可行的?究竟只是凑巧,还是说这是由矩阵这种对象的某种本质所必然决定的?如果是后者,那么矩阵的这些本质是什么?只要对上述那些问题稍加考虑,我们就会发现,所有这些问题都不是单纯依靠数学证明所能够解决的。像我们的教科书那样,凡事用数学证明,最后培养出来的学生,只能熟练地使用工具,却欠缺真正意义上的理解。 自从1930年代法国布尔巴基学派兴起以来,数学的公理化、系统性描述已经获得巨大的成功,这使得我们接受的数学教育在严谨性上大大提高。然而数学公理化的一个备受争议的副作用,就是一般数学教育中直觉性的丧失。数学家们似乎认为直觉性与抽象性是矛盾的,因此毫不犹豫地牺牲掉前者。然而包括我本人在内的很多人都对此表示怀疑,我们不认为直觉性与抽象性一定相互矛盾,特别是在数学教育中和数学教材中,帮助学生建立直觉,有助于它们理解那些抽象的概念,进而理解数学的本质。反之,如果一味注重形式上的严格性,学生就好像被迫进行钻火圈表演的小白鼠一样,变成枯燥的规则的奴隶。 对于线性代数的类似上述所提到的一些直觉性的问题,两年多来我断断续续地反复思考了四、五次,为此阅读了好几本国内外线性代数、数值分析、代数和数学通论性书籍,其中像前苏联的名著《数学:它的内容、方法和意义》、龚昇教授的《线性代数五讲》、前面提到的Encounter with Mathematics(《数学概观》)以及Thomas A. Garrity的《数学拾遗》都给我很大的启发。不过即使如此,我对这个主题的认识也经历了好几次自我否定。比如以前思考的一些结论曾经写在自己的blog里,但是现在看来,这些结论基本上都是错误的。因此打算把自己现在的有关理解比较完整地记录下来,一方面是因为我觉得现在的理解比较成熟了,可以拿出来与别人探讨,向别人请教。另一方面,如果以后再有进一步的认识,把现在的理解给推翻了,那现在写的这个snapshot也是很有意义的。 因为打算写得比较多,所以会分几次慢慢写。也不知道是不是有时间慢慢写完整,会不会中断,写着看吧。 -------------------------------------------------------------------------- 今天先谈谈对线形空间和矩阵的几个核心概念的理解。这些东西大部分是凭着自己的理解写出来的,基本上不抄书,可能有错误的地方,希望能够被指出。但我希望做到直觉,也就是说能把数学背后说的实质问题说出来。 首先说说空间(space),这个概念是现代数学的命根子之一,从拓扑空间开始,一步步往上加定义,可以形成很多空间。线形空间其实还是比较初级的,如果在里面定义了范数,就成了赋范线性空间。赋范线性空间满足完备性,就成了巴那赫空间;赋范线性空间中定义角度,就有了内积空间,内积空间再满足完备性,就得到希尔伯特空间。 总之,空间有很多种。你要是去看某种空间的数学定义,大致都是“存在一个集合,在这个集合上定义某某概念,然后满足某些性质”,就可以被称为空间。这未免有点奇怪,为什么要用“空间”来称呼一些这样的集合呢?大家将会看到,其实这是很有道理的。 我们一般人最熟悉的空间,毫无疑问就是我们生活在其中的(按照牛顿的绝对时空观)的三维空间,从数学上说,这是一个三维的欧几里德空间,我们先不管那么多,先看看我们熟悉的这样一个空间有些什么最基本的特点。仔细想想我们就会知道,这个三维的空间:1. 由很多(实际上是无穷多个)位置点组成;2. 这些点之间存在相对的关系;3. 可以在空间中定义长度、角度;4. 这个空间可以容纳运动,这里我们所说的运动是从一个点到另一个点的移动(变换),而不是微积分意义上的“连续”性的运动, 上面的这些性质中,最最关键的是第4条。第1、2条只能说是空间的基础,不算是空间特有的性质,凡是讨论数学问题,都得有一个集合,大多数还得在这个集合上定义一些结构(关系),并不是说有了这些就算是空间。而第3条太特殊,其他的空间不需要具备,更不是关键的性质。只有第4条是空间的本质,也就是说, 容纳运动是空间的本质特征。 认识到了这些,我们就可以把我们关于三维空间的认识扩展到其他的空间。 事实上,不管是什么空间,都必须容纳和支持在其中发生的符合规则的运动(变换)。你会发现,在某种空间中往往会存在一种相对应的变换,比如拓扑空间中有拓扑变换,线性空间中有线性变换,仿射空间中有仿射变换,其实这些变换都只不过是对应空间中允许的运动形式而已。 因此只要知道 ,“空间”是容纳运动的一个对象集合,而变换则规定了对应空间的运动。 下面我们来看看线性空间。线性空间的定义任何一本书上都有,但是既然我们承认线性空间是个空间,那么有两个最基本的问题必须首先得到解决,那就是: 1. 空间是一个对象集合,线性空间也是空间,所以也是一个对象集合。那么线性空间是什么样的对象的集合?或者说,线性空间中的对象有什么共同点吗? 2. 线性空间中的运动如何表述的?也就是,线性变换是如何表示的? 我们先来回答第一个问题,回答这个问题的时候其实是不用拐弯抹角的,可以直截了当的给出答案。 线性空间中的任何一个对象,通过选取基和坐标的办法,都可以表达为向量的形式。 通常的向量空间我就不说了,举两个不那么平凡的例子: L1. 最高次项不大于n次的多项式的全体构成一个线性空间,也就是说,这个线性空间中的每一个对象是一个多项式。如果我们以x 0 , x 1 , ..., x n 为基,那么任何一个这样的多项式都可以表达为一组n+1维向量,其中的每一个分量a i 其实就是多项式中x (i-1) 项的系数。值得说明的是,基的选取有多种办法,只要所选取的那一组基线性无关就可以。这要用到后面提到的概念了,所以这里先不说,提一下而已。 L2. 闭区间 上的n阶连续可微函数的全体,构成一个线性空间。也就是说,这个线性空间的每一个对象是一个连续函数。对于其中任何一个连续函数,根据魏尔斯特拉斯定理,一定可以找到最高次项不大于n的多项式函数,使之与该连续函数的差为0,也就是说,完全相等。这样就把问题归结为L1了。后面就不用再重复了。 所以说,向量是很厉害的,只要你找到合适的基,用向量可以表示线性空间里任何一个对象。这里头大有文章,因为向量表面上只是一列数,但是其实由于它的有序性,所以除了这些数本身携带的信息之外,还可以在每个数的对应位置上携带信息。为什么在程序设计中数组最简单,却又威力无穷呢?根本原因就在于此。这是另一个问题了,这里就不说了。 下面来回答第二个问题,这个问题的回答会涉及到线性代数的一个最根本的问题。 线性空间中的运动,被称为线性变换。也就是说,你从线性空间中的一个点运动到任意的另外一个点,都可以通过一个线性变化来完成。那么,线性变换如何表示呢? 很有意思,在线性空间中,当你选定一组基之后,不仅可以用一个向量来描述空间中的任何一个对象,而且可以用矩阵来描述该空间中的任何一个运动(变换)。而使某个对象发生对应运动的方法,就是用代表那个运动的矩阵,乘以代表那个对象的向量。 简而言之, 在线性空间中选定基之后,向量刻画对象,矩阵刻画对象的运动,用矩阵与向量的乘法施加运动。 是的,矩阵的本质是运动的描述。如果以后有人问你矩阵是什么,那么你就可以响亮地告诉他, 矩阵的本质是运动的描述 。(chensh,说你呢!) 可是多么有意思啊,向量本身不是也可以看成是n x 1矩阵吗?这实在是很奇妙, 一个空间中的对象和运动竟然可以用相类同的方式表示。 能说这是巧合吗?如果是巧合的话,那可真是幸运的巧合!可以说,线性代数中大多数奇妙的性质,均与这个巧合有直接的关系。 理解矩阵(二) 上一篇里说“矩阵是运动的描述”,到现在为止,好像大家都还没什么意见。但是我相信早晚会有数学系出身的网友来拍板转。因为运动这个概念,在数学和物理里是跟微积分联系在一起的。我们学习微积分的时候,总会有人照本宣科地告诉你,初等数学是研究常量的数学,是研究静态的数学,高等数学是变量的数学,是研究运动的数学。大家口口相传,差不多人人都知道这句话。但是真知道这句话说的是什么意思的人,好像也不多。简而言之,在我们人类的经验里,运动是一个连续过程,从A点到B点,就算走得最快的光,也是需要一个时间来 逐点 地经过AB之间的路径,这就带来了连续性的概念。而连续这个事情,如果不定义极限的概念,根本就解释不了。古希腊人的数学非常强,但就是缺乏极限观念,所以解释不了运动,被芝诺的那些著名悖论(飞箭不动、飞毛腿阿喀琉斯跑不过乌龟等四个悖论)搞得死去活来。因为这篇文章不是讲微积分的,所以我就不多说了。有兴趣的读者可以去看看齐民友教授写的《重温微积分》。我就是读了这本书开头的部分,才明白“高等数学是研究运动的数学”这句话的道理。 不过在我这个《理解矩阵》的文章里,“运动”的概念不是微积分中的连续性的运动,而是瞬间发生的变化。比如这个时刻在A点,经过一个“运动”,一下子就“ 跃迁 ”到了B点,其中不需要经过A点与B点之间的任何一个点。这样的“运动”,或者说“跃迁”,是违反我们日常的经验的。不过了解一点量子物理常识的人,就会立刻指出,量子(例如电子)在不同的能量级轨道上跳跃,就是瞬间发生的,具有这样一种跃迁行为。所以说,自然界中并不是没有这种运动现象,只不过宏观上我们观察不到。但是不管怎么说,“运动”这个词用在这里,还是容易产生歧义的,说得更确切些,应该是“跃迁”。因此这句话可以改成: “矩阵是线性空间里跃迁的描述”。 可是这样说又太物理,也就是说太具体,而不够数学,也就是说不够抽象。因此我们最后换用一个正牌的数学术语—— 变换 ,来描述这个事情。这样一说,大家就应该明白了, 所谓变换,其实就是空间里从一个点(元素/对象)到另一个点(元素/对象)的跃迁 。比如说,拓扑变换,就是在拓扑空间里从一个点到另一个点的跃迁。再比如说,仿射变换,就是在仿射空间里从一个点到另一个点的跃迁。附带说一下,这个仿射空间跟向量空间是亲兄弟。做计算机图形学的朋友都知道,尽管描述一个三维对象只需要三维向量,但所有的计算机图形学变换矩阵都是4 x 4的。说其原因,很多书上都写着“为了使用中方便”,这在我看来简直就是企图蒙混过关。真正的原因,是因为在计算机图形学里应用的图形变换,实际上是在仿射空间而不是向量空间中进行的。想想看,在向量空间里相一个向量平行移动以后仍是相同的那个向量,而现实世界等长的两个平行线段当然不能被认为同一个东西,所以计算机图形学的生存空间实际上是仿射空间。而仿射变换的矩阵表示根本就是4 x 4的。又扯远了,有兴趣的读者可以去看《计算机图形学——几何工具算法详解》。 一旦我们理解了“变换”这个概念,矩阵的定义就变成: “矩阵是线性空间里的变换的描述。” 到这里为止,我们终于得到了一个看上去比较数学的定义。不过还要多说几句。教材上一般是这么说的,在一个线性空间V里的一个线性变换T,当选定一组基之后,就可以表示为矩阵。因此我们还要说清楚到底什么是线性变换,什么是基,什么叫选定一组基。线性变换的定义是很简单的,设有一种变换T,使得对于线性空间V中间任何两个不相同的对象x和y,以及任意实数a和b,有: T(ax + by) = aT(x) + bT(y), 那么就称T为线性变换。 定义都是这么写的,但是光看定义还得不到直觉的理解。线性变换究竟是一种什么样的变换?我们刚才说了,变换是从空间的一个点跃迁到另一个点,而线性变换,就是从一个线性空间V的某一个点跃迁到另一个线性空间W的另一个点的运动。这句话里蕴含着一层意思,就是说一个点不仅可以变换到同一个线性空间中的另一个点,而且可以变换到另一个线性空间中的另一个点去。不管你怎么变,只要变换前后都是线性空间中的对象,这个变换就一定是线性变换,也就一定可以用一个非奇异矩阵来描述。而你用一个非奇异矩阵去描述的一个变换,一定是一个线性变换。有的人可能要问,这里为什么要强调非奇异矩阵?所谓非奇异,只对方阵有意义,那么非方阵的情况怎么样?这个说起来就会比较冗长了,最后要把线性变换作为一种映射,并且讨论其映射性质,以及线性变换的核与像等概念才能彻底讲清楚。我觉得这个不算是重点,如果确实有时间的话,以后写一点。 以下我们只探讨最常用、最有用的一种变换,就是在同一个线性空间之内的线性变换。也就是说,下面所说的矩阵,不作说明的话,就是方阵,而且是非奇异方阵。学习一门学问,最重要的是把握主干内容,迅速建立对于这门学问的整体概念,不必一开始就考虑所有的细枝末节和特殊情况,自乱阵脚。 接着往下说,什么是基呢?这个问题在后面还要大讲一番,这里只要 把基看成是线性空间里的坐标系就可以了。 注意是坐标系,不是坐标值,这两者可是一个“对立矛盾统一体”。这样一来,“选定一组基”就是说在线性空间里选定一个坐标系。就这意思。 好,最后我们把矩阵的定义完善如下: “矩阵是线性空间中的线性变换的一个描述。在一个线性空间中,只要我们选定一组基,那么对于任何一个线性变换,都能够用一个确定的矩阵来加以描述。” 理解这句话的关键,在于把“线性变换”与“线性变换的一个描述”区别开。 一个是那个对象,一个是对那个对象的表述。就好像我们熟悉的面向对象编程中,一个对象可以有多个引用,每个引用可以叫不同的名字,但都是指的同一个对象。如果还不形象,那就干脆来个很俗的类比。 比如有一头猪,你打算给它拍照片,只要你给照相机选定了一个镜头位置,那么就可以给这头猪拍一张照片。这个照片可以看成是这头猪的一个描述,但只是一个片面的的描述,因为换一个镜头位置给这头猪拍照,能得到一张不同的照片,也是这头猪的另一个片面的描述。所有这样照出来的照片都是这同一头猪的描述,但是又都不是这头猪本身。 同样的,对于一个线性变换,只要你选定一组基,那么就可以找到一个矩阵来描述这个线性变换。换一组基,就得到一个不同的矩阵。所有这些矩阵都是这同一个线性变换的描述,但又都不是线性变换本身。 但是这样的话,问题就来了如果你给我两张猪的照片,我怎么知道这两张照片上的是同一头猪呢?同样的,你给我两个矩阵,我怎么知道这两个矩阵是描述的同一个线性变换呢?如果是同一个线性变换的不同的矩阵描述,那就是本家兄弟了,见面不认识,岂不成了笑话。 好在,我们可以找到同一个线性变换的矩阵兄弟们的一个性质,那就是: 若矩阵A与B是同一个线性变换的两个不同的描述(之所以会不同,是因为选定了不同的基,也就是选定了不同的坐标系),则一定能找到一个非奇异矩阵P,使得A、B之间满足这样的关系: A = P -1 BP 线性代数稍微熟一点的读者一下就看出来,这就是相似矩阵的定义。没错, 所谓相似矩阵,就是同一个线性变换的不同的描述矩阵。 按照这个定义,同一头猪的不同角度的照片也可以成为相似照片。俗了一点,不过能让人明白。 而在上面式子里那个矩阵P,其实就是A矩阵所基于的基与B矩阵所基于的基这两组基之间的一个变换关系。关于这个结论,可以用一种非常直觉的方法来证明(而不是一般教科书上那种形式上的证明),如果有时间的话,我以后在blog里补充这个证明。 这个发现太重要了。 原来一族相似矩阵都是同一个线性变换的描述啊! 难怪这么重要!工科研究生课程中有矩阵论、矩阵分析等课程,其中讲了各种各样的相似变换,比如什么相似标准型,对角化之类的内容,都要求变换以后得到的那个矩阵与先前的那个矩阵式相似的,为什么这么要求?因为只有这样要求,才能保证变换前后的两个矩阵是描述同一个线性变换的。当然,同一个线性变换的不同矩阵描述,从实际运算性质来看并不是不分好环的。有些描述矩阵就比其他的矩阵性质好得多。这很容易理解,同一头猪的照片也有美丑之分嘛。所以矩阵的相似变换可以把一个比较丑的矩阵变成一个比较美的矩阵,而保证这两个矩阵都是描述了同一个线性变换。 这样一来,矩阵作为线性变换描述的一面,基本上说清楚了。但是,事情没有那么简单,或者说,线性代数还有比这更奇妙的性质,那就是, 矩阵不仅可以作为线性变换的描述,而且可以作为一组基的描述。 而作为变换的矩阵,不但可以把线性空间中的一个点给变换到另一个点去,而且也能够把线性空间中的一个坐标系(基)表换到另一个坐标系(基)去。而且,变换点与变换坐标系,具有异曲同工的效果。线性代数里最有趣的奥妙,就蕴含在其中。理解了这些内容,线性代数里很多定理和规则会变得更加清晰、直觉。 理解矩阵(三) 在第二部分结束的时候,我说: “ 矩阵不仅可以作为线性变换的描述,而且可以作为一组基的描述。而 作为变换的矩阵,不但可以把线性空间中的一个点给变换到另一个点去,而且也能够把线性空间中的一个坐标系(基)表换到另一个坐标系(基)去。而且,变换点 与变换坐标系,具有异曲同工的效果。线性代数里最有趣的奥妙,就蕴含在其中。理解了这些内容,线性代数里很多定理和规则会变得更加清晰、直觉。 这个留在下一篇再写吧。 因为有别的事情要做,下一篇可能要过几天再写了。 ” 然而这一拖就是一年半。一年半以来,这两篇粗糙放肆的文章被到处转载,以至于在Google的搜索提示中,我的名字跟“矩阵”是一对关联词汇。这对于学生时代数学一直很差的我来说,实在是令人惶恐的事情。数学是何等辉煌精致的学问!代表着人类智慧的最高成就,是人与上帝对话的语言。而我实在连数学的门都还没进去,不要说谈什么理解,就是稍微难一些的题目我也很少能解开。我有什么资格去谈矩阵这样重要的一个数学概念呢?更何况,我的想法直观是直观,未见的是正确的啊,会不会误人子弟呢?因此,算了吧,到此为止吧,我这么想。 是时不时收到的来信逐渐改变了我的想法。 一年半以来,我收到过不下一百封直接的来信,要求我把后面的部分写出来。这些来信大部分是国内的网友和学生,也有少数来自正在国外深造的朋友,大部分是鼓励,有的是诚挚的请求,也有少数严厉斥责我不守承诺。不管是何种态度,这都表明他们对我这一点点小小的思考成果的鼓励,特别是对于我这种思维的视角和尝试的鼓励。他们在信中让我知道,尽管我的数学水平不高,但是我这种从普通人(而不是数学家)视角出发,强调对数学概念和规则的直觉理解的思路,对于很多人是有益的。也许这条路子在数学中绝非正道,也不会走得很远,但是无论如何,在一定的阶段,对一部分人来说,较之目前数学教材普遍采用的思路,这种方式可能更容易理解一些。既然是可能对一部分人有帮助的事情,那么我就不应该心存太多杂念,应该不断思考和总结下去。 所以,下面就是你们来信要求我写出来的东西。 首先来总结一下前面两部分的一些主要结论: 1. 首先有空间,空间可以容纳对象运动的。一种空间对应一类对象。 2. 有一种空间叫线性空间,线性空间是容纳向量对象运动的。 3. 运动是瞬时的,因此也被称为变换。 4. 矩阵是线性空间中运动(变换)的描述。 5. 矩阵与向量相乘,就是实施运动(变换)的过程。 6. 同一个变换,在不同的坐标系下表现为不同的矩阵,但是它们的本质是一样的,所以本征值相同。 下面让我们把视力集中到一点以改变我们以往看待矩阵的方式。我们知道,线性空间里的基本对象是向量,而向量是这么表示的: 矩阵呢?矩阵是这么表示的: a 11 , a 12 , a 13 , ..., a 1n a 21 , a 22 , a 23 , ..., a 2n ... a n1 , a n2 , a n3 , ..., a nn 不用太聪明,我们就能看出来,矩阵是一组向量组成的。特别的,n维线性空间里的方阵是由n个n维向量组成的。我们在这里只讨论这个n阶的、非奇异的方阵,因为理解它就是理解矩阵的关键,它才是一般情况,而其他矩阵都是意外,都是不得不对付的讨厌状况,大可以放在一边。这里多一句嘴,学习东西要抓住主流,不要纠缠于旁支末节。很可惜我们的教材课本大多数都是把主线埋没在细节中的,搞得大家还没明白怎么回事就先被灌晕了。比如数学分析,明明最要紧的观念是说,一个对象可以表达为无穷多个合理选择的对象的线性和,这个概念是贯穿始终的,也是数学分析的精华。但是课本里自始至终不讲这句话,反正就是让你做吉米多维奇,掌握一大堆解偏题的技巧,记住各种特殊情况,两类间断点,怪异的可微和可积条件(谁还记得柯西条件、迪里赫莱条件...?),最后考试一过,一切忘光光。要我说,还不如反复强调这一个事情,把它深深刻在脑子里,别的东西忘了就忘了,真碰到问题了,再查数学手册嘛,何必因小失大呢? 言归正传。如果一组向量是彼此线性无关的话,那么它们就可以成为度量这个线性空间的一组基,从而事实上成为一个坐标系体系,其中每一个向量都躺在一根坐标轴上,并且成为那根坐标轴上的基本度量单位(长度1)。 现在到了关键的一步。看上去矩阵就是由一组向量组成的,而且如果矩阵非奇异的话(我说了,只考虑这种情况),那么组成这个矩阵的那一组向量也就是线性无关的了,也就可以成为度量线性空间的一个坐标系。结论: 矩阵描述了一个坐标系。 “慢着!”,你嚷嚷起来了,“你这个骗子!你不是说过,矩阵就是运动吗?怎么这会矩阵又是坐标系了?” 嗯,所以我说到了关键的一步。我并没有骗人,之所以矩阵又是运动,又是坐标系,那是因为—— “运动等价于坐标系变换”。 对不起,这话其实不准确,我只是想让你印象深刻。准确的说法是: “对象的变换等价于坐标系的变换”。 或者: “固定坐标系下一个对象的变换等价于固定对象所处的坐标系变换。” 说白了就是: “运动是相对的。” 让我们想想,达成同一个变换的结果,比如把点(1, 1)变到点(2, 3)去,你可以有两种做法。第一,坐标系不动,点动,把(1, 1)点挪到(2, 3)去。第二,点不动,变坐标系,让x轴的度量(单位向量)变成原来的1/2,让y轴的度量(单位向量)变成原先的1/3,这样点还是那个点,可是点的坐标就变成(2, 3)了。方式不同,结果一样。 从第一个方式来看,那就是我在《理解矩阵》1/2中说的,把矩阵看成是运动描述,矩阵与向量相乘就是使向量(点)运动的过程。在这个方式下, Ma = b 的意思是: “向量a经过矩阵M所描述的变换,变成了向量b。” 而从第二个方式来看,矩阵M描述了一个坐标系,姑且也称之为M。那么: Ma = b 的意思是: “有一个向量,它在坐标系M的度量下得到的度量结果向量为a,那么它在坐标系I的度量下,这个向量的度量结果是b。” 这里的I是指单位矩阵,就是主对角线是1,其他为零的矩阵。 而这两个方式本质上是等价的。 我希望你务必理解这一点,因为这是本篇的关键。 正因为是关键,所以我得再解释一下。 在M为坐标系的意义下,如果把M放在一个向量a的前面,形成Ma的样式,我们可以认为这是 对向量a的一个环境声明 。它相当于是说: “注意了!这里有一个向量,它在坐标系M中度量,得到的度量结果可以表达为a。可是它在别的坐标系里度量的话,就会得到不同的结果。为了明确,我把M放在前面,让你明白,这是该向量在坐标系M中度量的结果。” 那么我们再看孤零零的向量b: b 多看几遍,你没看出来吗?它其实不是b,它是: Ib 也就是说:“在单位坐标系,也就是我们通常说的直角坐标系I中,有一个向量,度量的结果是b。” 而 Ma = Ib的意思就是说: “在M坐标系里量出来的向量a,跟在I坐标系里量出来的向量b,其实根本就是一个向量啊!” 这哪里是什么乘法计算,根本就是身份识别嘛。 从这个意义上我们重新理解一下向量。向量这个东西客观存在,但是要把它表示出来,就要把它放在一个坐标系中去度量它,然后把度量的结果(向量在各个坐标轴上的投影值)按一定顺序列在一起,就成了我们平时所见的向量表示形式。你选择的坐标系(基)不同,得出来的向量的表示就不同。向量还是那个向量,选择的坐标系不同,其表示方式就不同。因此,按道理来说,每写出一个向量的表示,都应该声明一下这个表示是在哪个坐标系中度量出来的。表示的方式,就是 Ma,也就是说,有一个向量,在M矩阵表示的坐标系中度量出来的结果为a。我们平时说一个向量是 T ,隐含着是说,这个向量在 I 坐标系中的度量结果是 T ,因此,这个形式反而是一种简化了的特殊情况。 注意到,M矩阵表示出来的那个坐标系,由一组基组成,而那组基也是由向量组成的,同样存在这组向量是在哪个坐标系下度量而成的问题。也就是说,表述一个矩阵的一般方法,也应该要指明其所处的基准坐标系。所谓M,其实是 IM,也就是说,M中那组基的度量是在 I 坐标系中得出的。从这个视角来看,M×N也不是什么矩阵乘法了,而是声明了一个在M坐标系中量出的另一个坐标系N,其中M本身是在I坐标系中度量出来的。 回过头来说变换的问题。我刚才说,“固定坐标系下一个对象的变换等价于固定对象所处的坐标系变换”,那个“固定对象”我们找到了,就是那个向量。但是坐标系的变换呢?我怎么没看见? 请看: Ma = Ib 我现在要变M为I,怎么变?对了,再前面乘以个M -1 ,也就是M的逆矩阵。换句话说,你不是有一个坐标系M吗,现在我让它乘以个M -1 ,变成I,这样一来的话,原来M坐标系中的a在I中一量,就得到b了。 我建议你此时此刻拿起纸笔,画画图,求得对这件事情的理解。比如,你画一个坐标系,x轴上的衡量单位是2,y轴上的衡量单位是3,在这样一个坐标系里,坐标为(1,1)的那一点,实际上就是笛卡尔坐标系里的点(2, 3)。而让它原形毕露的办法,就是把原来那个坐标系: 2 0 0 3 的x方向度量缩小为原来的1/2,而y方向度量缩小为原来的1/3,这样一来坐标系就变成单位坐标系I了。保持点不变,那个向量现在就变成了(2, 3)了。 怎么能够让“x方向度量缩小为原来的1/2,而y方向度量缩小为原来的1/3”呢?就是让原坐标系: 2 0 0 3 被矩阵: 1/2 0 0 1/3 左乘。而这个矩阵就是原矩阵的逆矩阵。 下面我们得出一个重要的结论: “对坐标系施加变换的方法,就是让表示那个坐标系的矩阵与表示那个变化的矩阵相乘。” 再一次的,矩阵的乘法变成了运动的施加。只不过,被施加运动的不再是向量,而是另一个坐标系。 如果你觉得你还搞得清楚,请再想一下刚才已经提到的结论,矩阵MxN,一方面表明坐标系N在运动M下的变换结果,另一方面,把M当成N的前缀,当成N的环境描述,那么就是说,在M坐标系度量下,有另一个坐标系N。这个坐标系N如果放在I坐标系中度量,其结果为坐标系MxN。 在这里,我实际上已经回答了一般人在学习线性代数是最困惑的一个问题,那就是为什么矩阵的乘法要规定成这样。简单地说,是因为: 1. 从变换的观点看,对坐标系N施加M变换,就是把组成坐标系N的每一个向量施加M变换。 2. 从坐标系的观点看,在M坐标系中表现为N的另一个坐标系,这也归结为,对N坐标系基的每一个向量,把它在I坐标系中的坐标找出来,然后汇成一个新的矩阵。 3. 至于矩阵乘以向量为什么要那样规定,那是因为一个在M中度量为a的向量,如果想要恢复在I中的真像,就必须分别与M中的每一个向量进行內积运算。我把这个结论的推导留给感兴趣的朋友吧。应该说,其实到了这一步,已经很容易了。 综合以上1/2/3,矩阵的乘法就得那么规定,一切有根有据,绝不是哪个神经病胡思乱想出来的。 我已经无法说得更多了。矩阵又是坐标系,又是变换。到底是坐标系,还是变换,已经说不清楚了,运动与实体在这里统一了,物质与意识的界限已经消失了,一切归于无法言说,无法定义了。道可道,非常道,名可名,非常名。矩阵是在是不可道之道,不可名之名的东西。到了这个时候,我们不得不承认,我们伟大的线性代数课本上说的矩阵定义,是无比正确的: “矩阵就是由m行n列数放在一起组成的数学对象。” 好了,这基本上就是我想说的全部了。还留下一个行列式的问题。矩阵M的行列式实际上是组成M的各个向量按照平行四边形法则搭成一个n维立方体的体积。对于这一点,我只能感叹于其精妙,却无法揭开其中奥秘了。也许我掌握的数学工具不够,我希望有人能够给我们大家讲解其中的道理了。 我不知道是否讲得足够清楚了,反正这一部分需要您花些功夫去推敲。 此外,请大家不必等待这个系列的后续部分。以我的工作情况而言,近期内很难保证继续投入脑力到这个领域中,尽管我仍然对此兴致浓厚。不过如果还有(四)的话,可能是一些站在应用层面的考虑,比如对计算机图形学相关算法的理解。但是我不承诺这些讨论近期内会出现了。
个人分类: 他山之石|5941 次阅读|12 个评论
[转载]线性代数的主要内容有哪些?
chnfirst 2012-12-17 21:56
http://wenwen.soso.com/z/q181093777.htm 线性代数的主要内容有哪些? 一、 行列式 考试内容 ??行列式的概念和基本性质 行列式按行(列)展开定理 考试要求 1.了解行列式的概念,掌握行列式的性质. 2.会应用行列式的性质和行列式按行(列)展开定理计算行列式. 二、矩阵 考试内容 ??矩阵的概念 矩阵的线性运算 矩阵的乘法 方阵的幂 方阵乘积的行列式 矩阵的转置  逆矩阵 的概念和性质  矩阵可逆 的 充分必要条件   伴随矩阵  矩阵的初等变换  初等矩阵    矩阵的秩  矩阵的等价  分块矩阵 及其运算 考试要求 ??1.理解矩阵的概念,了解 单位矩阵 、 数量矩阵 、 对角矩阵 、 三角矩阵 、 对称矩阵 和 反对称矩阵 ,以及它们的性质. 2.掌握矩阵的线性运算、乘法、转置以及它们的运算规律,了解方阵的幂与方阵乘积的行列式的性质. 3.理解逆矩阵的概念,掌握逆矩阵的性质,以及矩阵可逆的充分必要条件,理解伴随矩阵的概念,会用伴随矩阵求逆矩阵.   4.理解矩阵初等变换的概念,了解初等矩阵的性质和矩阵等价的概念,理解矩阵的秩的概念,掌握用初等变换求矩阵的秩和逆矩阵的方法. 5.了解分块矩阵及其运算. 三、向量 考试内容   向量的概念向量的 线性组合 与线性表示 向量组的 线性相关 与线性无关 向量组的 极大线性无关组 等价向量组 向量组的秩 向量组的秩与矩阵的秩之间的关系 向量空间 及其相关概念 维向量空间的基变换和 坐标变换 过渡矩阵 向量的内积 线性无关向量组的正交规范化方法 规范正交基 正交矩阵 及其性质 考试要求   1.理解 维向量、向量的线性组合与线性表示的概念.   2.理解向量组线性相关、线性无关的概念,掌握向量组线性相关、线性无关的有关性质及判别法.   3.理解向量组的极大线性无关组和向量组的秩的概念,会求向量组的极大线性无关组及秩 4.理解向量组等价的概念,理解矩阵的秩与其行(列)向量组的秩之间的关系.   5.了解 维向量空间、 子空间 、基底、维数、坐标等概念.   6.了解基变换和坐标变换公式,会求过渡矩阵.   7.了解内积的概念,掌握线性无关向量组正交规范化的施密特(Schmidt)方法. 8.了解规范正交基、正交矩阵的概念以及它们的性质. 四、 线性方程组 考试内容: 线性方程组的 克莱姆 (Cramer)法则 齐次线性方程组 有非零解的充分必要条件 非齐次线性方程组 有解的充分必要条件 线性方程组解的性质和解的结构齐次线性方程组的 基础解系 和通解 解空间 非齐次线性方程组的通解 考试要求 l.会用 克莱姆法则 . 2.理解齐次线性方程组有非零解的充分必要条件及非齐次线性方程组有解的充分必要条件. 3.理解齐次线性方程组的基础解系、通解及解空间的概念,掌握齐次线性方程组的基础解系和通解的求法. 4.理解非齐次线性方程组解的结构及通解的概念. 5.掌握用初等行变换求解线性方程组的方法. 五、矩阵的特征值和 特征向量 考试内容:   矩阵的特征值和特征向量的概念、性质 相似变换 、 相似矩阵 的概念及性质 矩阵可相似对角化的充分必要条件及相似对角矩阵实对称矩阵的特征值、特征向量及其相似对角矩阵 考试要求: 1.理解矩阵的特征值和特征向量的概念及性质,会求矩阵的特征值和特征向量. 2.理解相似矩阵的概念、性质及矩阵可相似对角化的充分必要条件,掌握将矩阵化为相似对角矩阵的方法. 3.掌握实对称矩阵的特征值和特征向量的性质. 六、 二次型 考试内容 ??二次型及其矩阵表示 合同变换与 合同矩阵 二次型的秩 惯性定理 二次型的标准形和规范形 用 正交变换 和 配方法 化二次型为标准形 二次型及其矩阵的正定性 考试要求 1.掌握二次型及其矩阵表示,了解二次型秩的概念,了解合同变换与合同矩阵的概念,了解二次型的标准形、规范形的概念以及惯性定理. 2.掌握用正交变换化二次型为标准形的方法,会用配方法化二次型为标准形. 3.理解 正定二次型 、 正定矩阵 的概念,并掌握其判别法.
个人分类: 数学|0 个评论
[转载]行列式
chnfirst 2012-11-28 09:26
http://baike.soso.com/v179882.htm 行列式 行列式出现于 线性方程组 的求解,它最早是一种速记的表达式,现在已经是数学中一种非常有用的工具。行列式是由 莱布尼茨 和日本数学家关孝和发明的。 1693 年4 月,莱布尼茨在写给洛比达的一封信中使用并给出了行列式,并给出方程组的系数行列式为零的条件。同时代的日本数学家关孝和在其著作《解伏题元法》中也提出了行列式的概念与算法。   1750 年,瑞士数学家 克莱姆 (G.Cramer,1704-1752) 在其著作《 线性代数 分析导引》中,对行列式的定义和展开法则给出了比较完整、明确的阐述,并给出了现在我们所称的解线性方程组的克莱姆法则。稍后,数学家贝祖 (E.Bezout,1730-1783) 将确定行列式每一项符号的方法进行了系统化,利用系数行列式概念指出了如何判断一个齐次线性方程组有非零解。   总之,在很长一段时间内,行列式只是作为解线性方程组的一种工具使用,并没有人意识到它可以独立于线性方程组之外,单独形成一门理论加以研究。   在行列式的发展史上,第一个对行列式理论做出连贯的逻辑的阐述,即把行列式理论与线性方程组求解相分离的人,是法国数学家范德蒙 (A-T.Vandermonde,1735-1796) 。范德蒙自幼在父亲的知道下学习音乐,但对数学有浓厚的兴趣,后来终于成为法兰西科学院院士。特别地,他给出了用二阶子式和它们的 余子式 来展开行列式的法则。就对行列式本身这一点来说,他是这门理论的奠基人。 1772 年,拉普拉斯在一篇论文中证明了范德蒙提出的一些规则,推广了他的展开行列式的方法。   继范德蒙之后,在行列式的理论方面,又一位做出突出贡献的就是另一位法国 大数学家 柯西 。 1815 年,柯西在一篇论文中给出了行列式的第一个系统的、几乎是近代的处理。其中主要结果之一是行列式的乘法定理。另外,他第一个把行列式的元素排成方阵,采用双足标记法;引进了行列式特征方程的术语;给出了相似行列式概念;改进了拉普拉斯的行列式展开定理并给出了一个证明等。   19 世纪的半个多世纪中,对行列式理论研究 始终不渝 的作者之一是詹姆士· 西尔维斯特 (J.Sylvester,1814-1894) 。他是一个活泼、敏感、兴奋、热情,甚至容易激动的人,然而由于是犹太人的缘故,他受到剑桥大学的不平等对待。西尔维斯特用火一般的热情介绍他的学术思想,他的重要成就之一是改进了从一个 次和一个 次的多项式中消去 x 的方法,他称之为配析法,并给出形成的行列式为零时这两个多项式方程有公共根充分必要条件这一结果,但没有给出证明。   继柯西之后,在行列式理论方面最多产的人就是德国数学家 雅可比 (J.Jacobi,1804-1851) ,他引进了函数行列式,即“雅可比行列式”,指出函数行列式在多重积分的变量替换中的作用,给出了函数行列式的导数公式。雅可比的著名论文《论行列式的形成和性质》标志着行列式系统理论的建成。由于行列式在 数学分析 、几何学、线性方程组理论、二次型理论等多方面的应用,促使行列式理论自身在19世纪也得到了很大发展。整个19 世纪都有行列式的新结果。除了一般行列式的大量定理之外,还有许多有关特殊行列式的其他定理都相继得到。 行列式的计算方法 1. 递推法 2.拆元法 3.加边法 4.数学归结法 5.消去法求三对角线型行列式的值 6 乘以已知行列式 7 利用线性代数方程组的解 8 递推方程组方法
个人分类: 数学|0 个评论
[转载]《理解矩阵》 (一)
tumigsse 2012-7-24 15:30
个人觉得作者分析的很透彻,很值得正在学习线性代数的同学们参考。原作者为孟岩, http://blog.csdn.net/myan/article/details/647511 ,感谢孟老师分享他的心得,让大家都受益无穷。 线性代数课程,无论你从行列式入手还是直接从矩阵入手,从一开始就充斥着莫名其妙。比如说,在全国一般工科院系教学中应用最广泛的同济线性代数教材(现在到了第四版),一上来就介绍逆序数这个 “ 前无古人,后无来者 ” 的古怪概念,然后用逆序数给出行列式的一个极不直观的定义,接着是一些简直犯傻的行列式性质和习题 —— 把这行乘一个系数加到另一行上,再把那一列减过来,折腾得那叫一个热闹,可就是压根看不出这个东西有嘛用。大多数像我一样资质平庸的学生到这里就有点犯晕:连这是个什么东西都模模糊糊的,就开始钻火圈表演了,这未免太 “ 无厘头 ” 了吧!于是开始有人逃课,更多的人开始抄作业。这下就中招了,因为其后的发展可以用一句峰回路转来形容,紧跟着这个无厘头的行列式的,是一个同样无厘头但是伟大的无以复加的家伙的出场 —— 矩阵来了!多年之后,我才明白,当老师犯傻似地用中括号把一堆傻了吧叽的数括起来,并且不紧不慢地说: “ 这个东西叫做矩阵 ” 的时候,我的数学生涯掀开了何等悲壮辛酸、惨绝人寰的一幕!自那以后,在几乎所有跟 “ 学问 ” 二字稍微沾点边的东西里,矩阵这个家伙从不缺席。对于我这个没能一次搞定线性代数的笨蛋来说,矩阵老大的不请自来每每搞得我灰头土脸,头破血流。长期以来,我在阅读中一见矩阵,就如同阿 Q 见到了假洋鬼子,揉揉额角就绕道走。 事实上,我并不是特例。一般工科学生初学线性代数,通常都会感到困难。这种情形在国内外皆然。瑞典数学家 Lars Garding 在其名著 Encounterwith Mathematics 中说: “ 如果不熟悉线性代数的概念,要去学习自然科学,现在看来就和文盲差不多。 ” ,然而 “ 按照现行的国际标准,线性代数是通过公理化来表述的,它是第二代数学模型, ... ,这就带来了教学上的困难。 ” 事实上,当我们开始学习线性代数的时候,不知不觉就进入了 “ 第二代数学模型 ” 的范畴当中,这意味着数学的表述方式和抽象性有了一次全面的进化,对于从小一直在 “ 第一代数学模型 ” ,即以实用为导向的、具体的数学模型中学习的我们来说,在没有并明确告知的情况下进行如此剧烈的 paradigm shift ,不感到困难才是奇怪的。 大部分工科学生,往往是在学习了一些后继课程,如数值分析、数学规划、矩阵论之后,才逐渐能够理解和熟练运用线性代数。即便如此,不少人即使能够很熟练地以线性代数为工具进行科研和应用工作,但对于很多这门课程的初学者提出的、看上去是很基础的问题却并不清楚。比如说: * 矩阵究竟是什么东西?向量可以被认为是具有 n 个相互独立的性质(维度)的对象的表示,矩阵又是什么呢?我们如果认为矩阵是一组列(行)向量组成的新的复合向量的展开式,那么为什么这种展开式具有如此广泛的应用?特别是,为什么偏偏二维的展开式如此有用?如果矩阵中每一个元素又是一个向量,那么我们再展开一次,变成三维的立方阵,是不是更有用? * 矩阵的乘法规则究竟为什么这样规定?为什么这样一种怪异的乘法规则却能够在实践中发挥如此巨大的功效?很多看上去似乎是完全不相关的问题,最后竟然都归结到矩阵的乘法,这难道不是很奇妙的事情?难道在矩阵乘法那看上去莫名其妙的规则下面,包含着世界的某些本质规律?如果是的话,这些本质规律是什么? * 行列式究竟是一个什么东西?为什么会有如此怪异的计算规则?行列式与其对应方阵本质上是什么关系?为什么只有方阵才有对应的行列式,而一般矩阵就没有(不要觉得这个问题很蠢,如果必要,针对 m x n 矩阵定义行列式不是做不到的,之所以不做,是因为没有这个必要,但是为什么没有这个必要)?而且,行列式的计算规则,看上去跟矩阵的任何计算规则都没有直观的联系,为什么又在很多方面决定了矩阵的性质?难道这一切仅是巧合? * 矩阵为什么可以分块计算?分块计算这件事情看上去是那么随意,为什么竟是可行的? * 对于矩阵转置运算 A T ,有 (AB) T = B T A T ,对于矩阵求逆运算 A -1 ,有 (AB) -1 = B -1 A -1 。两个看上去完全没有什么关系的运算,为什么有着类似的性质?这仅仅是巧合吗? * 为什么说 P -1 AP 得到的矩阵与 A 矩阵 “ 相似 ” ?这里的 “ 相似 ” 是什么意思? * 特征值和特征向量的本质是什么?它们定义就让人很惊讶,因为 Ax =λx ,一个诺大的矩阵的效应,竟然不过相当于一个小小的数 λ ,确实有点奇妙。但何至于用 “ 特征 ” 甚至 “ 本征 ” 来界定?它们刻划的究竟是什么? 这样的一类问题,经常让使用线性代数已经很多年的人都感到为难。就好像大人面对小孩子的刨根问底,最后总会迫不得已地说 “ 就这样吧,到此为止 ” 一样,面对这样的问题,很多老手们最后也只能用: “ 就是这么规定的,你接受并且记住就好 ” 来搪塞。然而,这样的问题如果不能获得回答,线性代数对于我们来说就是一个粗暴的、不讲道理的、莫名其妙的规则集合,我们会感到,自己并不是在学习一门学问,而是被不由分说地 “ 抛到 ” 一个强制的世界中,只是在考试的皮鞭挥舞之下被迫赶路,全然无法领略其中的美妙、和谐与统一。直到多年以后,我们已经发觉这门学问如此的有用,却仍然会非常迷惑:怎么这么凑巧? 我认为,这是我们的线性代数教学中直觉性丧失的后果。上述这些涉及到 “ 如何能 ” 、 “ 怎么会 ” 的问题,仅仅通过纯粹的数学证明来回答,是不能令提问者满意的。比如,如果你通过一般的证明方法论证了矩阵分块运算确实可行,那么这并不能够让提问者的疑惑得到解决。他们真正的困惑是:矩阵分块运算为什么竟然是可行的?究竟只是凑巧,还是说这是由矩阵这种对象的某种本质所必然决定的?如果是后者,那么矩阵的这些本质是什么?只要对上述那些问题稍加考虑,我们就会发现,所有这些问题都不是单纯依靠数学证明所能够解决的。像我们的教科书那样,凡事用数学证明,最后培养出来的学生,只能熟练地使用工具,却欠缺真正意义上的理解。 自从 1930 年代法国布尔巴基学派兴起以来,数学的公理化、系统性描述已经获得巨大的成功,这使得我们接受的数学教育在严谨性上大大提高。然而数学公理化的一个备受争议的副作用,就是一般数学教育中直觉性的丧失。数学家们似乎认为直觉性与抽象性是矛盾的,因此毫不犹豫地牺牲掉前者。然而包括我本人在内的很多人都对此表示怀疑,我们不认为直觉性与抽象性一定相互矛盾,特别是在数学教育中和数学教材中,帮助学生建立直觉,有助于它们理解那些抽象的概念,进而理解数学的本质。反之,如果一味注重形式上的严格性,学生就好像被迫进行钻火圈表演的小白鼠一样,变成枯燥的规则的奴隶。 对于线性代数的类似上述所提到的一些直觉性的问题,两年多来我断断续续地反复思考了四、五次,为此阅读了好几本国内外线性代数、数值分析、代数和数学通论性书籍,其中像前苏联的名著《数学:它的内容、方法和意义》、龚昇教授的《线性代数五讲》、前面提到的 Encounter with Mathematics (《数学概观》)以及 ThomasA. Garrity 的《数学拾遗》都给我很大的启发。不过即使如此,我对这个主题的认识也经历了好几次自我否定。比如以前思考的一些结论曾经写在自己的 blog 里,但是现在看来,这些结论基本上都是错误的。
2870 次阅读|0 个评论
行列式表示平行多面体体积
Mathsun 2011-5-13 22:57
一维,二维,三维情形下,平行二面体(直线)平行四面体(矩形)平行六面体的体积都是对应列向量的行列式。猜测;n维空间的平行2n面体的体积为列向量对应的n阶行列式。 证明:1)古典法:直观方法。首先,n阶对角行列式从直观上来讲非常显然,就是长方体的体积,即对角元素的乘积。 现在对其做第三类初等变换,可以变为一般情形的行列式,其值不变。而且,体积等于底乘以高,逐级进行。第三类初等变换不改变底面积,使得新矢量组成的平面仍在旧平面内且面积相当,说明此变形不改变体积,故证毕。 2)有向体积法。上面的方法已经涉及到有向体积了,即体积是有正负之分的。所有取实数值的几何量都应该有正负号之分。所以,发现体积满足其列向量构成的行列式的八条性质(略),由一维的为归纳基础,必须是行列式才满足八条。所以体积是个行列式。 几何是直观,感觉上面没说明白,希望有人能讲明白,浅显易懂的。
个人分类: 数学问题|512 次阅读|0 个评论
[转载]行列式、矩阵的写法
taoffei 2010-8-29 16:24
个人分类: 未分类|3617 次阅读|0 个评论
一个数学公式征求证明:ln Det A = Tr ln A(答案有了)
热度 1 wliming 2010-3-27 11:38
请教高人给个证明:ln Det A = Tr ln A. Det 是矩阵A 的行列式,Tr 是迹, ln 是对数。 这是HUBBARD MODEL 路径积分中用到的一个公式。 谢谢。 感谢3楼网友提供的答案:Proof: Consider the factorization S = O E Otr. Its logarithm is ln(S) = O ln(E) Otr. Its trace is trace(ln(S)) = trace(ln(E)) = ln(det(E)) = ln(det(S)). QED . 注: 这里的S是正定的对称矩阵(或厄米矩阵),O是正交归一矩阵(或酉矩阵)。
个人分类: 物理学|4263 次阅读|4 个评论
行列式定义--助记辞
metanb 2010-3-26 22:57
异行异列初等积, 偶正奇负数逆序。 代数求和乃一数, 莫当矩阵行列式。
个人分类: 课程专栏|2910 次阅读|0 个评论
行列式的历史
metanb 2010-3-12 17:33
http://www.jstor.org/pss/2299112 http://en.wikipedia.org/wiki/Determinant#History http://en.wikipedia.org/wiki/Circulant http://blog.sina.com.cn/s/blog_541655580100f493.html
个人分类: 科学研究|5 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-3 21:57

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部