nqed的个人博客分享 http://blog.sciencenet.cn/u/nqed

博文

什么是协变和逆变矢量?数学家和物理学家的定义很不同

已有 22983 次阅读 2018-9-18 11:29 |个人分类:物理数学笔记|系统分类:科研笔记|关键词:学者

什么是协变和逆变矢量?数学家和物理学家的定义很不同


过去,现在和将来,我都是一个真正的数学爱好者。大学毕业之后,由于科研的需要,还曾经自学了许多数学知识。数学是物理学家最重要的工具之一,这是毫无疑问的。

但是,近二十年来,我在工作中发现,数学家和物理学家在很多重要问题上的观点是很不相同的,甚至是对立的。

研究量子力学和相对论的时候,向量空间的理论是最基本的数学工具。物理学家和数学家对向量空间的理解就非常不同,可以说是不可调和的。

刚好今天偶然在网上发现一篇帖子,对协变和逆变向量的数学观点说得很准确,我就全文贴出来,请大家仔细看看,会很有收获的。

---------------------------------------

【简介】协变和逆(反)变矢量

百度 相对论吧 

wolfking97 (博主)

协变(covariant)和逆(反)变(contravariant)矢量还有张量是物理跟数学中常见的概念,但是要比较清晰地掌握这两个概念并不那么容易。这个帖子里我希望尽量把它们讲清楚。

1. 先来看看最直截了当的抛开一切背景的代数定义。假设我有个抽象的线性空间 V ,我选取一组基底 $e_1, ... , e_n$,那么任取 V 中的矢量v,我都可以用一组(带上标的)坐标 $(v^1, ... , v^n)$ 来表示v,$v = v^1 e_1 + ... + v^n e_n$ 。但是基底的选取有任意性,我也可以用另外一组线性无关的矢量 $f_1, ... , f_n $来做基底,为简单起见就选 $f_1 = 2 e_1, ... ,f_n = 2 e_n $好了。那么原来的矢量 v 在新基底下也有一组坐标表示,很显然新的坐标表示是 $(1/2 v^1, ... , 1/2 v^n)$。我们看到新的基底是原来的两倍,但是v的新坐标反而变成了原来坐标的二分之一。这种坐标跟基底变化相反的矢量就叫逆变矢量或者反变矢量。


可是这样一眼看去好像大家都是逆变矢量啊?那么我们来看看 V 上的所有线性泛函组成的空间,容易看出这也是一个线性空间,我们通常叫它V的对偶空间,用 V* 表示。而且针对 V 的基底$e_i$,我们有V* 的唯一一组对偶基底$e^j$,使得作用在 $e_i$ 上正好是单位矩阵:$ e^j ( e_i ) = δ_i^j $。而任何其他线性泛函 v* 都可以用 $e^j$ 表示,$v* = v_1 e^1 + ... + v_n e^n$,这里带下标的$v_1, ... , v_n$ 是 v* 的坐标分量。大家可以通过计算来验证这么一件事,就是当原来的矢量空间V的基底变成两倍时,v* 在新的对偶基底下的坐标也变成两倍 $(2v_1, ... , 2v_n)$。这种坐标跟原来空间V的基底变化相同的矢量就叫做协变矢量。简而言之,原空间中的矢量是逆变矢量,对偶空间中的矢量是协变矢量。


一切似乎很清楚很简单?这里我就要讲点把事情复杂化的东西。其实仔细点的吧友也许已经意识到一点,就是仅仅从上面纯代数的定义来看,一个矢量是逆变还是协变似乎有一定的任意性。学过线性代数或泛函分析的吧友一定记得线性空间V跟它的对偶的对偶V** 是天然同构的。所以如果我就是愿意把 V* 选做“原空间”(比如在微分几何中我们完全可以先定义余切空间,然后把切空间定义为其对偶空间。印象里陈省身的《微分几何讲义》就是这么干的。),那么 V = V** 反而成了相应的对偶空间。这时候我不就可以把 V* 里面的元素叫做逆变矢量,而把 V 里面的元素叫做协变矢量了吗?更有甚者,如果线性空间V上定义有度规或者说非退化的内积,那么V跟其对偶空间V* 还可以通过度规定义一个典则(canonical)的同构。有了这个同构某种意义上我们可以说V就是V*,那么里面的矢量到底是协变还是逆变的呢?


要解决这些问题,具体在物理和数学(主要是几何)中我们有一些约定俗成的做法,或者说我们约好了把哪个空间作为“原空间”。我在下面几节会一一介绍。

2. 我们来看看物理背景下的情况。物理中我们最常见的就是在某个坐标空间干活,并且我们经常需要做坐标变换。以二维欧氏空间为例,在选取原点跟正交的xy坐标轴后空间中任何一点 p 就可以用在x和y方向上测量的距离作为坐标来表示,而p也可以看成是以这对坐标为分量的位置矢量。现在考虑一种最简单的坐标变换:长度单位的变化。比如原来以厘米做单位,现在变成用米做单位。如果把所有位置矢量看成一个矢量空间,那么这种长度单位的变化相当于原来把x和y方向上1厘米长的矢量作为基底,而现在把1米长的矢量作为基底。容易看出新基底是原来基底的100倍。可是原来(100,100)表示的点在新单位下(或者说新基底下)却变成了(1,1)。因为这个原因,物理中我们往往约定位置矢量是个逆变矢量!同样的,速度矢量也是个逆变矢量。但是在上面的约定下一个函数的梯度就是个协变矢量。为什么呢?比如说我们的二维空间模拟的是一块铁板,而铁板上每点的温度构成了二维空间上的一个函数。这个函数的梯度大小就是每单位距离的温度变化。如果在厘米单位下梯度为1就意味着每差1厘米温度变化1度。那么换了米做单位后每隔1米温度变化就应该是100度!所以梯度跟坐标单位的变化是一致的,是个协变矢量。这些就是物理中约定俗成的做法。而对其他矢量来说,跟位置矢量或者速度矢量变化方向相同的就是逆变矢量,跟梯度变化方向相同的就是协变矢量。

 

3. 几何中我们研究流形时,一个最重要的研究对象就是流形的切丛,也就是由每点的切空间放在一起做成的流形。如果我们不想追究背后的原因,那么可以这么认为:微分几何中我们约定切矢量是逆变矢量,而余切矢量是协变矢量。如果一定要问这样选择的原因,一个答案是出于实用上的考虑。因为流形上某点的切矢量可以看成是经过该点的某条曲线的切矢量。而如果把曲线看成运动轨迹,切矢量就跟物理中的速度矢量挂钩。既然在物理中速度矢量是逆变矢量,几何中的切矢量也应该是逆变矢量。而跟它对偶的余切矢量就应该是协变的。


4.也许最让人困惑的情况是有些比较早的相对论教材或者一些工程学教材里面的做法。在这些书中他们往往会提到一个矢量(以及张量)的“协变分量”跟“逆变分量”。比如你会看到这样的公式:

$v = v^1e_1 + … + v^n e_n = v_1 e^1 + … + v_ne^n$,

其中$(v^1, … , v^n)$是v的“逆变分量”,$e_1, … , e_n $是矢量空间的一组基,而$(v_1, … , v_n)$是v的“协变分量”,$e^1, … , e^n $是跟$e_1, … , e_n$相应的对偶基。v的带上标跟带下标的分量之间的关系是通过“升”指标跟“降”指标来实现的,就是假设 $g_{ij }$是空间(流形)上在$e_1, … , e_n$ 这组基下的度规矩阵(就是说 $g_{ij} = (e_i, e_j)$ ),而 $g^{ij}$ 是其逆矩阵,那么

$v^i =g^{ij} v_j$ ;这里用了重复指标求和(爱因斯坦求和,哑指标求和)的约定。类似的

$v_i =g_{ij} v^j$ 。

为什么物理学家和工程师喜欢这么做呢?因为这样方便。反正计算起来结果是正确的就行了。

【评论:作者可能是位数学家,或者数学研究生,开始批评物理学家和工程师了,哈哈】

但是从几何学或者说数学角度来说,这样的写法很不好。从概念上来说差不多就是错的。这是完全混淆了V跟其对偶空间V* 里面的矢量。V* 中的矢量是V上的线性函数,也就是 V→R 的线性映射。它跟V中的矢量是属于不同空间的元素。那么为什么我不说这是“彻头彻尾”错了呢?因为这种做法的出现当然不是偶然的,它其实隐含了一个事实,就是当V上有一个度规的时候,V 跟对偶空间V* 有一个典则的同构(数学中“典则”或者“自然”一词经常出现,在不同的情形下有不同含义。这里的典则可以理解为“跟基底的选取无关”)。具体说来,度规 g定义了V上的一个内积g(v, w) 。而这个典则的同构就是$ v → g( v, ∙)$。就是说任取一个矢量v,如果我们把内积的第一个空档放上v,把第二个空档看成自变量,那么这就定义了一个V上的线性映射v* ,或者说一个对偶空间V*上 的元素 v* 。如果 $v^i$ 是v的分量,那么通过简单计算就能看出这个v*在对偶基底下写出来就是 $v* = g_{ij }v^j e^i$。也就是说如果我们把 v 跟它的典则同构下的像看成是一回事,那么

$v = v^ie_i “=” v* = g_{ij} v^j e^i$ 。

就是说把v看成逆变矢量时,它的分量是$ v^i $;把v看成协变矢量v* 的时候,它的分量就是$g_{ij }v^j $。这就是为什么物理书中会把$v^i$ 叫做v的逆变分量,而把$g_{ij} v^j$ 叫做 v 的协变分量。

 

5.最后我们讲一下上下指标的问题。在数学和物理的实践中我们发现把逆变矢量的分量用上指标来表示,而把协变矢量的分量用下指标来表示是一种非常方便实用的做法。另外一个与此相配合的方便实用的事情是当上下指标出现重复的时候就自动认为是求和。为什么呢?因为一旦确定了逆变与协变分量的上下指标使用规则,我们就会发现求和只应该出现于上下指标之间。为什么?因为求和得到的是一个标量,而这说明该求和定义了一个线性函数。所以求和的两个矢量必定属于不同空间,一个是原空间,另外一个是其对偶空间。那么两边指标就应该是一上一下。也许你会说欧氏空间中矢量求内积不就是把分量平方再求和吗?是的这看上去像是上指标跟上指标求和,但其实有内积就必然意味着有度规,所以严格写出的内积公式应该是$ v^i g_{ij }v^j $,只不过对欧氏空间度规是单位矩阵:$ g_{ij} = δ_{ij} ,所以最终结果是 v^i v^i$ 。


Rprocess6 (游客)

理解得非常深刻。我再补充两点:

第一:协变与逆变张量是相对的,把线性空间V(或等价的V**)中的张量称为协变,那么V*上的张量就是逆变;反之,把V*上的张量称为协变,则V(V**)上的张量就是逆变。

第二:区分协变与逆变张量,是为了做“除法”运算。张量有加,减,乘(张量积,内积,外积)等运算,但“除法”运算就得靠协变、逆变张量运算了。

wolfking97: “区分协变与逆变张量,是为了做“除法”运算”:请教一下这个“除法”运算指什么?谢谢!

zhukekezhu66: 回复 wolfking97 :当然指乘法的逆运算。举个例子,一个群,只有乘法运算,如果我们有a.b=e(单位元素),则b为a的逆元素。相当于b=1/a。这不是“除法”吗?同理,两个对偶张量基A,B,其内积A.B=delta,就类似于B=1/A。“除法”。

 wolfking97: 回复 zhukekezhu66 :这个说法值得商榷吧?首先内积一般没有逆运算,也就说不上“除法”;其次这个跟是否区分协变逆变没啥关系啊?除法的关键在于乘法可逆,而协变逆变关键在于坐标变换的形式,两者不相干啊?“逆变”的逆跟“可逆”的逆虽然是同一个字但是没有联系啊。

zhukekezhu66: 回复 wolfking97 :考虑张量方程:AX=B,这里的”乘“可以是内积,外积等张量乘法。如何求未知张量X?不是需要一种”逆运算“么?简单来说,为了使张量的运算具有封闭性(只有封闭性才能使任何方程有解),必须使用其对偶空间上的张量(即逆变张量),这就自然引出了协变,逆变的概念了。

【评论 zhukekezhu66对张量的理解有错误,以后再详细说


newqed (我)

这个问题很有趣,因为物理学家和数学家的观点完全不同。

最简单的例子。在物理学家看来,时空中的向量,无论是协变的还是逆变的,都具有长度的量纲。内积具有长度平方的量纲。度规张量则是无量纲的。不管单位向量是厘米,米或者公里,物理学家永远选择$g_{00}=-1$!

数学家的办法,在物理里行不通。

基本分歧来自于:数学家只考虑数,而物理量总是有量纲和单位的。

请同意我把楼主的帖子和我的评论转载到科学网上去。

---------------------------------------

(待续)



https://m.sciencenet.cn/blog-583426-1135202.html

上一篇:简单说说高等学校的教学和科研的关系
下一篇:秋风辞及其它

12 尤明庆 钱大鹏 刘全慧 王安良 李学宽 郑永军 朱晓刚 杨正瓴 姬扬 曲杨 陈敏伯 黄忠凯

该博文允许注册用户评论 请点击登录 评论 (5 个评论)

数据加载中...
扫一扫,分享此博文

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-14 20:41

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部