科学网

 找回密码
  注册

tag 标签: 线性变换

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

标幺值和有名值、缩放和中心化;非线性与随机性;额外误差
热度 1 zlyang 2020-1-15 15:42
汉语是联合国官方正式使用的 6 种同等有效语言之一。请不要歧视汉语! Chinese is one of the six equally effective official languages of the United Nations. Not to discriminate against Chinese, please! 标幺值和有名值、缩放和中心化; 非线性与随机性;额外误差 从数学角度看,经过“减法”、“数乘”之后性质仍然不变的系统,一般为“线性系统 linear system”,即同时满足 ①“叠加性 additivity or superposition principle” f(x+y) = f(x) + f(y), 和 ②“齐次性 homogeneity” f(kx) = kf(x),k≠0是一个实数。 的系统f(·)。 现实世界里的大多数事物都不具有线性性质。即“非线性”,不满足上面的一条或一条以上的性质。 对于非线性,特别是带有噪声(随机性)的事物,经过线性变换(如标幺化 per-unit normalization,min-max 标准化 normalization,z-score 标准化 Stardardization,中心化/零均值化 Zero-centered,等)后,信息处理的结果可能会带有一定的额外的系统误差。 简言之,非线性系统的全局分析时,如果变量使用了线性变换,可能会引起一定量额外的系统误差。好像现在大多数人还没有注意到这点。 温馨提醒: 数据处理中常用的线性变换有:(1)标幺化 per-unit normalization,(2)min-max 标准化 normalization,(3)z-score 标准化 Stardardization,(4)中心化/零均值化 Zero-centered。 建议: 对于具有较大波动性(或噪声)的非线性数据,用原始数据进行信息处理,从理论上看具有比“线性变换”后再处理具有更高的准确性。 可惜目前许多方法不具有直接处理原始数据(如有名值)的良好能力。例如在多变量回归时,不采用标准化等的结果会更坏。原因似乎还不是很清楚,可能与统计量的“置信区间 confidence interval”、多元函数微分 multivariate Function Differential、有效数字位数 number of significant digits 等有关。再次呼吁大力发展“小样本统计学”! 推荐阅读: 邹德虎,2020-01-06,标幺值的必要性 精选 http://blog.sciencenet.cn/blog-3316223-1213112.html 2019-04-03,归一化(normalization)、标准化(standardization)以及正则化(regularization)比较 https://blog.csdn.net/Castlehe/article/details/88988267 2018-06-25,归一化 (Normalization)、标准化 (Standardization)和中心化/零均值化 (Zero-centered) https://www.jianshu.com/p/95a8f035c86c Feb 2, 2018-02-02, Differences between normalization, standardization and regularization https://maristie.com/blog/differences-between-normalization-standardization-and-regularization/ 2019-10-29,normalization, standardization and regularization https://www.codetd.com/article/7677587 刘锐,2017-10-10,机器学习里的黑色艺术:normalization, standardization, regularization https://zhuanlan.zhihu.com/p/29974820 相关链接: 2018-06-21,慎用“机器学习中的数据预处理:缩放和中心化” http://idea.cas.cn/viewdoc.action?docid=63578 http://blog.sciencenet.cn/blog-107667-1132083.html 对数变换下非平稳时间序列预测误差的解析分析. 计算机应用与软件, 2015, 32(12): 38-41. http://www.cnki.com.cn/Article/CJFDTotal-JYRJ201512011.htm Removing forecasting errors with white Gaussian noise after square root transformation. Journal of Forecasting, 2016, 35(8): 741-750. https://onlinelibrary.wiley.com/doi/10.1002/for.2407 采用反正切变换降低小波去噪对野值的敏感性. 计算机工程与应用, 2017, 53(10): 241-245. http://www.cnki.com.cn/Article/CJFDTotal-JSGG201710042.htm 2019-06-25,俺在《中科院科学智慧火花》贴出的帖子 http://blog.sciencenet.cn/blog-107667-1186809.html 2018-08-18,“大数据”时期,更渴望“小样本数理统计学” http://blog.sciencenet.cn/blog-107667-1129894.html 2016-03-07,关于时间序列的“组合预测之谜 forecast combination puzzle” http://blog.sciencenet.cn/blog-107667-961080.html 感谢您的指教! 感谢您指正以上任何错误! 感谢您提供更多的相关资料!
6358 次阅读|6 个评论
重修线性代数7——相似
热度 12 xying 2017-2-28 08:45
把向量看作是状态,线性变换驱动着线性空间中所有向量的变化,从一个状态变为另一个状态,如在空间中运动。对于一个具体的线性算子,从对空间不同方向的影响来剖析算子的特性,便可以从抽象的高度俯视算子在不同坐标表示矩阵的共同性质,从中选择合适的视角便能看到算子的结构。 线性变换的矩阵表示是一个方阵。这线性变换在旧的基下的矩阵表示 A ,在新的基下表示为 T -1 AT. 对于线性变换,秩仍然是在不同基的坐标表示中不变量,但把映射限制在原来的空间。仅仅是相同秩的方阵,不足以通过坐标变换而相等。同一个线性变换在不同坐标下表示为不同的矩阵,称为是 相似 的,相同秩的方阵并非都是相似的。这里介绍怎么通过线性变换的不变子空间,理解相似矩阵标准形式的直观意义。 7.1 不变子空间 对于线性空间正交基,每个基向量张成一个一维子空间,线性空间是这些一维子空间的直和。向量的坐标值分别对应着它在每个一维子空间的分量。线性空间只要选取合适的基,就可以做出所需的子空间直和的分解。对于线性空间中的线性变换,并非任意的子空间能对线性变换保持封闭,最有意义的是对线性变换是封闭的子空间分解。 如果一个线性子空间对一个线性变换保持封闭,即子空间中任何向量经过这变换仍在这子空间中,则它称为这个线性变换的 不变子空间 。线性变换对它不变子空间上向量的作用,等于它局限在这个较低维数线性算子的作用。所有线性变换所得的向量形成一个子空间,称为线性变换的像。所有在线性变换下映成零向量的向量集合也是一个子空间,称为线性变换的核。线性变换的像和核都是它的不变子空间。 设 K 是线性变换 的一个不变子空间,线性空间 N 的维数是 n , K 的维数是 k ,取 K 的基为 N 的基中前 k 个基向量,线性变换 在这基上的矩阵 A ,它的前 k 个列向量对应着 K 中的基向量在线性变换下的线性表示,而 K 是 $\alpha$ 的不变子空间,这意味着,这 k 个列向量,除了前 k 个分量外,其余的都为 0. 方矩 A 具有下面的形式。 , 这里 B 是 k 阶方阵,它是线性变换 在 K 子空间(这个基)上的矩阵表示。 如果与 K 正交的子空间 J 也是 $\alpha$ 的不变子空间,那么在它们的基下,矩阵 A 可以表示为对角方块形式 , 这样计算和分析都更为简单。可惜这并不总是能够做到的。消化了这方面内容的读者,自己应该能够举出例子。 7.2 若当( Jordan )标准形式 线性变换在给定的基上表示为一个矩阵, n 维线性空间上的线性变换为 n 阶方阵。相似的矩阵 A 和 B ,是同一个线性变换在不同基上的表示,两个基坐标之间的变换是 T 时, B= T -1 AT 。我们研究怎么选取一个合适的基将线性变换表示为一种简单的矩阵形式,也就是对于给定的方阵,怎么通过合适的坐标变换变成统一且方便的形式。 显然,矩阵中含有越少的非零元素就越容易计算和分析,对角阵或具有较小方块的准对角阵是个很好的选择。从上面看到,用不变子空间的向量作为基,线性变换在这基上的矩阵可以表示为上三角形分块矩阵,如果空间可以分解为不变子空间的直和,则矩阵可以相应表示为准对角线矩阵。我们看看如何将已有的矩阵变成尽可能小方块的准对角阵。 先从特征向量入手。 线性变换 ,如果它有一维的不变子空间。则这子空间里的向量 r ,称为是线性算子 的特征向量,这时有 r = λ r ,这个线性空间的数域中标量λ,称为是 的特征值。对于线性变换 ,如果 n 维线性空间有 n 个一维的不变子空间,用这些不变子空间的向量为基, 就可以表示为一个对角阵,对角线上元素是相应的特征值。这是最美好的情况。 这样的矩阵称为可对角化。能够被酉变换下对角化具有特别意义。 正规性是检验矩阵能否在酉变换下对角化的简单方法,矩阵 A 如果与自己的共轭转置 A * 的乘法是可交换的,即 A * A = AA* ,则称为它是正规矩阵。正规矩阵可以经酉变换对角化,反之,能通过酉变换与对角阵相似的必然是正规矩阵。矩阵是正规的当且仅当其特征向量能张成整个空间,且相互正交。厄米矩阵是正规矩阵,所以它能够对角化,而且特征值都是实数,特征向量相互正交。 可惜这并非都有可能,线性变换可能有多个一维不变子空间,即多个特征向量和特征值,也可能只有一个。但这是一个很好的思路。 给定一个线性变换的矩阵表示 A ,怎么求它的特征值和特征向量?这是解线性方程组 Ax= λ x 的问题,这里向量 x 和标量λ都是未知的。把这方程改写成 (A – λ I)x = 0 的形式,这里 I 是单位矩阵,如果行列式 |A – λ I| = 0 ,这个齐次方程组有解。我们知道, n 阶矩阵行列式 |A – λ I| = 0 是个λ为未知数 n 次代数方程,叫做特征方程,对于复数域,这多项式的特征方程有 n 个根,这些根都是矩阵 A 的特征值,而对应λ值的齐次方程解则是特征向量。 如果矩阵 A 有 n 个不同的特征值,这些特征值为对角线的对角矩阵 D 是 A 的相似矩阵,不难证明相应的特征列向量是线性无关的,它们排成坐标转换的矩阵 T ,我们有 T -1 AT = D. 但是这 n 个特征值并非都是不同的,对于 k 重根的特征值,对应的齐次线性方程不一定有 k 个线性无关的解,即所有的特征向量不足以张成全空间。所以在有重根的情况, A 也许不能与对角阵相似。在这种情况下,它总可以表示为准对角阵。大致说来,代入 k 重根特征值的矩阵 (A – λ I) k 表示的是一个线性变换,它的核是 A 的一个 k 维不变子空间。 我们可以选取这子空间合适的基,将 A 代表的线性变换表示为对角线上元素是λ i 的一些若当块 J i 矩阵。线性空间可以分解为不同特征值λ i 所对应的不变子空间的直和,所以 A 可以通过坐标变换表示为对角线上元素为特征方程解λ i 的若当标准形式矩阵 J. 7.3 有理标准形式 如果线性空间的数域不是复数, n 阶特征方程不一定都能得到 n 个根,这种情况下线性变换不能表示为若当标准形式。我们寻找另一种方法,也能把线性变换表示成非零元素非常少的矩阵。 对于 n 阶矩阵 A 所表示的线性变换,假设可以找到一个向量 r ,线性变换 A 逐次施加其上,得到 n 个不相关的向量,即循环向量集 {r , Ar, A 2 r, …, A n-1 r} ,构成了线性空间的基,那么 A n r 一定与它们线性相关, A n r +a n-1 A n-1 r + … + a 1 Ar+ a 0 r = 0 ,这个线性变换在这基上可以表示为矩阵 R : 这个矩阵 R 称为多项式 p(x) =x n +a n-1 x n-1 + … + a 1 x + a 0 的伴侣矩阵,它是一个有理标准形式,可以在线性空间所在的任何数域上实现。循环列向量集 {r , Ar, A 2 r, …, A n-1 r} 是新的基在旧的基上的表示,它排列构成的矩阵 T 是新旧坐标的变换,我们有 R = T -1 AT ,即 R 是 A 的相似矩阵。 现在的问题是:是否存在着这样的向量 r ?如果存在,不同的 r 生成的基上,与矩阵 A 相似的有理标准形式是否一样? 记 m(x) = x k +a k-1 x k-1 + … + a 1 x + a 0 ,称 m(x) 为 A 的最小多项式,如果 m(A)=0 是能够让多项式矩阵变成零的最小阶次。第一个问题答案是:如果 n 阶矩阵 A 的最小多项式是 n 次,那么存在着一个向量, A 对它的循环向量集形成线性空间的基。 这个并不难证明: A 的 n 次矩阵多项式为零,意味着任何向量在 A 的 n 次重复作用下线性相关,而最小多项式说,不可能让所有的向量在比它少次数的重复作用下线性相关,所以在这种情况下总有一个向量 r ,它 A 对它的循环向量集构成空间的基。 伴侣矩阵是由 A 的最小多项式确定的,它与生成基的向量无关。所以由不同的 r 用 A 重覆作用生成的基上,矩阵的有理标准形式都是一样的。 怎么能得到最小多项式呢?对于 n 阶矩阵 A ,行列式 p(x) =|A – xI| 是 x 的 n 次多项式, Cayley-Hamilton 定理告诉我们,这特征多项式矩阵 p(A) = 0 ,所以 A 的最小多项式必须是它的因子。另一方面,特征多项式的根是 A 的特征值λ,它也必须是最小多项式 m( λ ) 的根。这是因为,特征值所对应的特征向量 y ,在 A 的最小多项式作用下 m(A)y = m( λ )y ,除非 m( λ )=0 ,不然它不等于零向量,这与最小多项式的定义矛盾。这两个性质告诉我们,如果特征多项式没有重根,它就是最小多项式,否则我们可以用 A 代入计算,确认它是否最小多项式。 如果特征多项式不是最小多项式,我们不能将线性变换表示为一个特征多项式的伴侣矩阵的形式。但可以把它表示为有理标准形式的矩阵,即对角线上是几个多项式伴侣矩阵的准对角阵。大致说来,这时最小多项式 m(A) 的次数是 k , k n ,意味着有一个向量, A 对它的循环向量集有 k 个,以此为基构成了 A 的 k 维不变子空间。在这不变子空间里,算子在这基上表示为它的伴侣矩阵。假设线性空间被线性变换 A 为分解成几个不变子空间直和, m 1 (A), m 2 (A), …, m(A) 分别是 A 局限在这些子空间上的最小多项式,局限在这子空间里线性变换 A 的最小多项式必须是全空间最小多项式的因子,所以有 m 1 (x) | m 2 (x) | … | m(x). 特征多项式在不同的基上保持不变,则有 p(x)= m 1 (x) m 2 (x) …m(x) ,在简单情况下可以得出这个有理标准形式。 7.4 λ矩阵 上面两小节告诉我们,如果矩阵 A 的特征多项式没有重根,对于复数域, A 可以与对矩阵相似,对于任何数域都可以与特征多项式的伴侣矩阵相似,它们分别对应着 A 所代表线性变换的若当标准形式和有理标准形式。 A 与相似的标准形式间的坐标变换矩阵,可以直接由相应的特征向量,以及循环向量集组成。 对于多项式有重根的情况,虽然我们大致了解怎么形成这两种准对角阵的标准形式,但是严格的证明必须引入λ矩阵,初等因子,不变因子等概念才能说清。 到了要说清线性变换矩阵的标准形式,线性代数或矩阵论到了学习抽象方法的一个关口。课文在这之前,多数已经介绍群、环、域、多项式和行列式等等概念和性质,在这里把它们综合起来解决这个问题。很多人在这之前多已迷糊了,为什么东一榔头,西一锤子零散着介绍许多概念,又不深入介绍它们的应用,布了这么一大的局,最后绕圈子的证明实在让人晕乎。能有更简单直接的证明吗?应该会有,但课文的目的是趁机介绍这些抽象代数基步的概念,并用这个标准形式的证明作为抽象方法的例子。这部分内容的理解大约是课文中最艰深理论的部分,过去对于物理和微分方程的理论分析十分重要,但现在对绝大部分工科学生却不是最有用。我只在这里大致介绍一下它们间的联系。 前面介绍的矩阵的元素都是在数域上,称为数字矩阵。如果矩阵上的元素是个λ的多项式,即线性空间定义在数域的多项式环上,例如用行列式求矩阵特征方程的特征矩阵 A - λ I ,这样的矩阵称为λ矩阵。对矩阵对换行(列),数乘一行(列)以及数((相应地用多项式)乘一行(列)加在另一行(列)中称为矩阵的初等变换,通过初等变换把一个矩阵变为另一个矩阵,称这两个矩阵是等价的。定理证明,λ矩阵都可以通过初等变换,变成只有对角线上是非零的矩阵,对角线上的元素(λ多项式)从上到下依次有 d 1 ( λ ) , d 2 ( λ ) , … , d s ( λ ) ,余下是 0 ,这些非零多项式称为λ矩阵的不变因子,前面不变因子能够整除是后面的不变因子,即 d 1 ( λ )|d 2 ( λ )|…|d s ( λ ) ,能够同过初等变换成这样形式的矩阵是唯一的,称为等价矩阵的标准形式。所以具有相同的不变因子是矩阵等价的充要条件。 定理证明,矩阵 A 和 B 相似的充要条件是特征矩阵( A- λ I )与( B - λ I )是等价的,即它们的特征矩阵的不变因子都是相同的。 每个不变因子是个λ的多项式,它对应着一个伴侣矩阵,即多项式的伴侣矩阵的特征矩阵是个对角线上最后一个元素是这个多项式,其他都是 1 的对角阵。所以与矩阵相似的有理标准形式是个准对角阵,对角线上依次对应着其特征矩阵每个不变因子的伴侣矩阵。 对于复数域,每个特征矩阵上不变因子可以分解为互不相同特征值的幂次因子,例如 d k ( λ ) = ( λ - a 1 ) k1 ( λ - a 2 ) k2 …( λ - a m ) km 这样相乘的每个幂次因子称为初等因子,所以复数域上矩阵相似的充要条件是特征矩阵的初等因子是相同的。 不难验证每个初等因子唯一对应着一个若当块,所以复数域上矩阵都能与若当标准形式的矩阵相似。当特征矩阵的初等因子都是一次时,矩阵能够与对角阵相似。 (待续)
个人分类: 科普|20474 次阅读|33 个评论
[转载] 3D数学 ---- 矩阵和线性变换
LiangliangNan 2014-10-22 15:53
一般来说,方阵能描述任意线性变换。线性变换保留了直线和平行线,但原点没有移动。线性变换保留直线的同时,其他的几何性质如长度、角度、面积和体 积可能被变换改变了。从非技术意义上说,线性变换可能“拉伸”坐标系,但不会“弯曲”或“卷折”坐标系。 矩阵是怎样变换向量的 向量在几何上能被解释成一系列与轴平行的位移,一般来说,任意向量 v 都能写成“扩展”形式: 另一种略有差别的形式为: 注意右边的单位向量就是x,y,z轴,这里只是将概念数学化,向量的每个坐标都表明了平行于相应坐标轴的有向位移。 让我们将上面的向量和重写一遍,这次分别将 p 、 q 、 r 定 义为指向+x,+y和+z方向的单位向量,如下所示: v = x p + y q + z r 现在,向量 v 就被表示成向量 p , q , r 的 线性变换了,向量 p , q , r 称作基向量。这里 基向量是笛卡尔坐标轴,但事实上,一个坐标系能用任意3个基向量定义,当然这三个基向量要线性无关(也就是不在同一平面上)。以 p 、 q 、 r 为 行构建一个3 x 3矩阵M,可得到如下矩阵: 用一个向量乘以该矩阵,得到: 如果把矩阵的行解释为坐标系的基向量,那么乘以该矩阵就相当于执行了一次坐标转换,如果 aM = b , 我们就可以说, M 将 a 转换到 b 。 从这点看,术语“转换”和“乘法”是等价的。 坦率地说,矩阵并不神秘,它只是用一种紧凑的方式来表达坐标转换所需的数学运算。进一步,用线性代数操作矩阵,是一种进行简单转换或导出更复杂转换 的简便方法。 矩阵的形式: 基向量 , , 乘以任意矩阵 M : 用基向量 乘以 M 时,结果是 M 的第1行。其他两行也有同样 的结果,这是一个关键的发现:矩阵的每一行都能解释为转换后的基向量。 这个强有力的概念有两条重要性质: 1、有了一种简单的方法来形象化解释矩阵所代表的变换。 2、有了反向建立矩阵的可能 ---- 给出一个期望的变换(如旋转、缩放等),能够构造一个矩阵代表此变换。我们所要做的一切就是计算基向量的变换,然后将变换后的基向量填入矩阵。 首先来看看2D例子,一个2 x 2矩阵: 这个矩阵代表的变换是什么?首先,从矩阵中抽出基向量 p 和 q : p = q = 图7.1以“原”基向量(x轴,y轴)为参考,在笛卡尔平面中展示了这些向量。 、 如图7.1所示,x基向量变换至上面的 p 向量,y基向量变换至 q 向量。所以 2D中想象矩阵的方法就是想象由行向量构成的“L”形状。这个例子中,能够很清楚的看到, M 代表的部分变换是逆时针旋 转26度。 当然,所有向量都被线性变换所影响,不只是基向量,从“L”形状能够得到变换最直观的印象,把基向量构成的整个2D平行四边形画完整有助于进一步看 到变换对其他向量的影响,如图7.2所示: 平行四边形称作“偏转盒”,在盒子中画一个物体有助于理解,如图 7.3 所示: 很明显,矩阵 M 不仅旋转坐标系,还会拉伸它。 这种技术也能应用到3D转换中。2D中有两个基向量,构成L型;3D中有三个基向量,它们形成一个”三脚架“。首先,让我们展示出一个转换前的 物品。图7.4展示了一个茶壶,一个立方体。基向量在”单位“向量处。 (为了不使图形混乱,没有标出z轴基向量 ,它被茶壶和立方体挡住了。) 现在,考虑以下3D变换矩阵: 从矩阵的行中抽出基向量,能想象出该矩阵所代表的变换。变换后的基向量、立方体、茶壶如图7.5所示: 这个变换包含z轴顺时针旋转45度和不规则缩放,使得茶壶比以前”高“。注意,变换并没有影响到z轴,因为矩阵的第三行是 。 我们可以通过让比例因子k按比例放大或缩小来缩放物体。如果在各方向应用同比例的缩放,并且沿原点“膨胀”物体,那么就是均匀缩放。均匀缩放可以保 持物体的角度和比例不变。如果长度增加或减小因子k,则面积增加或减小k^2。在3D中,体积将增加或减小 k^3。 如果需要“挤压”或拉伸物体,在不同的方向应用不同的因子即可,这称作非均匀缩放。非均匀缩放时,物体角度将发生变化。视各方向缩放因子的不 同,长度、面积、体积的变化因子也各不相同。 如果|k|1,物体将“变短”;如果|k|1,物体将“变长”,如果k = 0,就是正交投影,如果k 0就是镜像。 应用非均匀缩放的效果类似于切变,事实上,非均匀缩放和切变和很难区分的。 沿坐标轴的缩放 最简单的缩放方法是沿着每个坐标轴应用单独的缩放因子,缩放是沿着垂直的轴(2D中)或平面(3D中)进行的。如果每个轴的缩放因子相同,就是均匀 缩放,否则是非均匀缩放。 2D中有两个不同的缩放因子,Kx和Ky,图8.13展示了应用不同缩放因子后的情况。 凭直觉就可知道,基向量 p , q 由相应的缩放因子单独影响: p ' = Kx p = Kx = q ' = Ky q = Ky = 用基向量构造矩阵,结果如公式8.6所示: 对于3D,需要增加第三个缩放因子Kz,3D缩放矩阵如公式8.7所示: 沿任意方向缩放 我们可以不依赖于坐标系而沿任意方向进行缩放,设 n 为平行于缩放方向的单位向量,k为缩放因子,缩放沿穿过原点 并平行于 n 的直线(2D中)或平面(3D中)进行。 我们需要推导出一个表达式,给定向量 v ,可以通过 v , n 和 k来计算 v' 。为了做到这一点,将 v 分解为两个分量, v || 和 v⊥ ,分别平行于 n 和垂直于 n ,并满足 v = v || + v ⊥。 v ||是 v 在 n 上 的投影,由 ( v . n ) n 可以得到 v ||。 因为 v ⊥垂直于 n ,它不会被缩放操作影响。因此, v' = v ||' + v ⊥,剩下的问题就是怎样得到 v ||'。 由于 v ||平行于缩放方向, v ||'可以由公式k v || 得出,如图8.14所示: 总结已知向量并进行代换,得到: 既然我们知道了怎样对任意向量进行缩放,当然也就可以计算缩放后的基向量。这里只详细列出2D中的一个基向量的求法,其余的基向量依次类推。我们只 给出其结果(注意下面采用列向量形式只是为了使等式的形式好看一些。) 通过基向量构造矩阵,得到以单位向量 n 为缩放方向,k为因子的缩放矩阵,如公式8.8所示: 3D中,基向量为: 以单位向量 n 为缩放方向,k为因子的3D缩放矩阵如公式8.9所示: 一般来说,投影意味着降维操作,有一种投影方法是在某个方向上用0作为缩放因子。这种情况下,所有点都被拉平至垂直的轴(2D)或平面(3D)上。 这种类型的投影称作正交投影(或者平行投影),因为从原来的点到投影点的直线相互平行。 向坐标轴或平面投影 最简单的投影方式是向坐标轴(2D)或平面(3D)投影,如图8.15所示: 向坐标轴或平面投影在实际变换中不常发生,大多数情况是向低维的变换赋值,且要抛弃维数时。例如,将3D点赋值给2D点,抛弃z分量,只复制x和 y。 通过使垂直方向上的缩放因子为零,就能向坐标轴或平面投影。考虑到完整性,下面列出这些变换矩阵,见公式8.10 - 8.14。 向任意直线或平面投影 也能向任意直线或平面投影,像往常一样,由于不考虑平移,这些直线或平面必须通过原点。投影由垂直于直线或平面的单位向量 n 定 义。 通过使该方向的缩放因子为0能够导出向任意方向投影的矩阵,2D中的情况如公式8.15所示: 记住这里 n 垂直于投影直线,而不是平行。3D中,向垂直于 n 的平面投影的矩 阵如公式8.16所示: 镜像 镜像(也叫做反射)是一种变换,其作用是将物体沿直线(2D中)或平面(3D中)“翻折”,图8.16展示了镜像的效果。 使缩放因子为-1能够很容易地实现镜像变换,设 n 为2D单位向量,公式8.17所示的矩阵将沿通过原点且垂直于 n 的 反射轴来进行镜像变换。 3D中,用反射平面代替直线。公式8.18中的矩阵将沿通过原点且垂直于 n 的平面来进行镜像变换: 注意一个物体只能“镜像”一次,如果再次镜像(当沿不同的轴或平面的时候),物体将翻回“正面”(用一张纸来想象),这和在原位置旋转物体的效果一 样。 切变 切变是一种坐标系“扭曲”变换,非均匀地拉伸它。切变的时候角度会发生变化,但令人惊奇的是面积和体积却保持不变。基本思想是将某一坐标的乘积加到 另一个上。例如,2D中将y乘以某个因子然后加到x上,得到 x' = x + sy,如图8.17所示: 实现这个切变变换的矩阵为: 变换的组合 设想世界中有一个任意方向、任意位置的物体,我们要把它渲染到任意方向、任意位置的摄像机中。为了做到这一点,必须将物体的所有顶点从物体坐标系变 换到世界坐标系,接着再从世界坐标系变换到摄像机坐标系。其中的数学变换总结如下: 矩阵乘法满足结合律,所以我们能用一个矩阵直接从物体坐标系变换到摄像机坐标系: 这样就能在渲染的循环外先将所有矩阵组合起来,使循环内作矩阵乘法的时候只需要和一个矩阵相乘即可(物体有很多顶点,省一次矩阵乘法就会提高不少效 率),如下: 所以矩阵组合从代数角度看是利用了矩阵乘法的结合律。矩阵的行向量就是变换后的基向量,这在多个变换的情况下也是成立的。考虑矩阵乘法 AB , 结果中的每一行都是 A 中相应的行与矩阵 B 相乘的结果。换言之,设a1, a2, a3为 A 的行,矩阵乘法能够写为: 这使得结论更加清晰, AB 结果中的行向量确实是对 A 的基向量进行 B 变 换的结果。 变换分类 变换的类别并不是互斥的,也不存在一定的“次序”或“层次”使得某一类比另一类多或少一些限制。 当讨论一般意义上的变换时,我们将使用类似的术语:映射或函数。在最一般的意义上,映射就是一种简单的规则,接受输入,产生输出。我们把从 a 到 b 的 F 映 射记作 F ( a ) = b 。 线性变换 在数学上,如果满足下式,那么映射 F ( a )就是线性的: F ( a + b ) = F ( a ) + F ( b ) 以及 F (k a ) = k F ( a ) 如果映射F保持了基本运算:加法和数量乘,那么就可以称该映射为线性的。在这种情况下,将两个向量相加然后再进行变换得到的结果和先分别进行变换再 将变换后的向量相加得到的结果相同。同样,将一个向量数量乘再进行变换和先进行变换再数量乘的结果也是一样的。 这个线性变换的定义有两条重要的引理: (1) 映射 F ( a ) = aM ,当 M 为 任意方阵时,说映是一个线性变换,这是因为: F ( a + b ) = ( a + b ) M = aM + bM = F ( a ) + F ( b ) 和 F (k a ) = (k a ) M = k( aM ) = k F ( a ) (2) 零向量的任意线性变换的结果仍然是零向量。(如果 F ( 0 ) = a , a ≠ 0 。那么 F 不可能是线性变换。因为 F (k 0 ) = a ,但 F (k 0 ) ≠ k F ( 0 )), 因此线性变换不会导致平移(原点位置上不会变化)。 在某些文献中,线性变换的定义是平行线变换后仍然是平行线。大多数情况下它是对的,但有一个小小的例外:投影(当一条直线投影后变成一个点,能认为 这个点 平行于什么?)除了这点理论上的例外,这种定义是正确的。线性变换可能造成“拉伸”,但直线不会”弯折“,所以平行线仍然保持平行。 仿射变换 仿射变换是指线性变换后接着平移。因此仿射变换的集合是线性变换的超集,任何线性变换都是仿射变换,但不是所有仿射变换都是线性变换。 任何具有形式 v' = vM + b 的 变换都是仿射变换。 可逆变换 如果存在一个逆变换可以”撤销“原变换,那么该变换是可逆的。换句话说,如果存在逆变换 G ,使得 G ( F ( a )) = a ,对于任意 a ,映射 F ( a ) 是可逆的。 存在非仿射变换的可逆变换,但暂不考虑它们。现在,我们集中精力于检测一个仿射变换是否可逆。一个仿射变换就是一个线性变换加上平移,显然,可以用 相反的量”撤销“平移部分,所以问题变为一个线性变换是否可逆。 显然,除了投影以外,其他变换都能”撤销“。当物体被投影时,某一维有用的信息被抛弃了,而这些信息时不可能恢复的。因此,所有基本变换除了投影都 是可逆的。 因为任意线性变换都能表达为矩阵,所以求逆变换等价于求矩阵的逆。如果矩阵是奇异的,则变换不可逆;可逆矩阵的行列式不为0。 等角变换 如果变换前后两向量夹角的大小和方向都不改变,该变换是等角的。只有平移,旋转和均匀缩放是等角变换。等角变换将会保持比例不变,镜像并不是等角变 换,因为尽管两向量夹角的大小不变,但夹角的方向改变了。所有等角变换都是仿射和可逆的。 正交变换 术语“正交”用来描述具有某种性质的矩阵。正交变换的基本思想是轴保持互相垂直,而且不进行缩放变换。 平移、旋转和镜像是仅有的正交变换。长度、角度、面积和体积都保持不变。(尽管如此,但因为镜像变换被认为是正交变换,所以一定要密切注意角度、面 积和体积的准确定义)。 正交矩阵的行列式为1或者负1,所有正交矩阵都是仿射和可逆的。 刚体变换 刚体变换只改变物体的位置和方向,不包括形状。所有长度、角度、面积和体积都不变。平移和旋转是仅有的刚体变换,镜像并不被认为是刚体变换。刚体变 换也被称作正规变换,所有刚体变换都是正交、等角、可逆和仿射的,某些刚体变换旋转矩阵的行列式为1。
3319 次阅读|0 个评论
【新书快讯】《矩阵理论与应用》
sciencepressnj 2011-12-31 13:59
【新书快讯】《矩阵理论与应用》
【内容简介】本书共分六章,第一章线性代数概要与提高,总结并拓展了后续章节需要的线性方程组和矩阵的基本知识,给出了矩阵与线性方程组的几个应用实例;第二章矩阵与线性变换,讨论了子空间与直和分解及内积空间,详细探讨了线性变换与矩阵的关系,简要介绍了构造新线性空间的几种方法,举例了子空间、正交性、线性变换、张量积等的应用;第三章特征值与矩阵的 Jordan 标准形,证明了 Schur 三角化定理与 Cayley-Hamilton 定理,给出了矩阵在相似变换下的最简形式即 Jordan 标准形,讨论了特征值估计的盖尔圆盘定理;第四章正规矩阵与矩阵分解,介绍了正规矩阵及其几何意义,讨论了分解矩阵的几种方法以及应用;第五章矩阵函数及其微积分,介绍了向量范数与矩阵范数、矩阵幂级数、矩阵函数的微积分和应用;第六章广义逆矩阵,介绍了最常用的几种广义逆及其在解线性方程组等方面的应用。 【读者对象】本书是为上海交通大学非数学类研究生写的通用教材,也可作为高等学校理工科高年级本科生以及从事教学、科研等人员的参考用书。 【作者简介】张跃辉 1965 年 4 月生,上海交通大学数学系副教授。 1996 年在北京师范大学获得博士学位,研究方向为代数表示论及有序代数系统。目前为止,已在 Journal of Algebra 、 Czechoslovak Mathematical Journal 、中国科学、科学通报、数学学报、数学年刊等杂志上发表论文 50 余篇, 被 SCI 、 EI 检索 12 篇。 1999 年获海南省自然科学优秀论文二等奖一项、海南省数学学会优秀论文一等奖与二等奖各一项。近年来共承担或参加 10 余 项省部级以上科研课题,获资助总额 40 万余元。 出版著作《矩阵理论》一种,第三作者。
个人分类: 新书快讯——数理化生类|2938 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-13 01:03

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部