科学网

 找回密码
  注册

tag 标签: 泛函

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

狄拉克δ函数的数学迷思
热度 29 xying 2015-6-5 07:03
早期的科学家既是物理学家,也是数学家,还是哲学家。由哲学启迪认知,以直观指引逻辑,理论 概括 实践验证,用数学量化计算。那时的科学家,宇宙在乎手,万化生乎身,为智者,为大师,为哲人。 自从牛顿用微积分将大家带入无穷的世界后,凭借逻辑冥想的大步跨越,让物理的直观和数学的严谨拉开了距离。经二三百年的混乱和各自发展的累积,已难有跨足两边的大师了。物理学者 研究真实的世界, 视数学为工具,不敷使用时,便凭直观想象,强用公式硬推,大胆用到原来不允许或没定义的场合,有时精彩无比,有些荒谬离奇。数学家则跟随修正补遗,获取灵感。近百年前,狄拉克继毕达哥斯派的古风,以形式的美,扩展了许多直观想象的应用。牛顿以来用微积分将世界看成连续不可分的时空和场,狄拉克改造了分析工具,在连续的景象里凸现出分立的个体。他大约是给数学带来最多创意的近代物理学者。狄拉克的δ函数,便是一个典型。 最为简单直观的δ函数,表述为零点为无穷大,其他都是零的实数变量函数,它在实数轴上积分为1。 和 这个定义在数学上有着明显的缺陷。一般来说,函数的值不能是无穷大。定义者辩称,这是广义上的函数,把值域扩充到包含有无穷大的情况。这样说的函数可以接受,但这个在 0 点是无穷大,其它处处为 0 的函数,对黎曼积分没定义,勒贝格的积分是 0 ,才是问题所在。麻烦还不仅于此。在数学上,函数是从定义域到值域的一个映射,以此确定了函数的所有性质。上述的定义并非如此,定义的前半部分建立了自变量与函数值的对应关系,已经完全确定了函数。这函数乘上常数 c ,仍然保持相同的映射,即保持这函数不变,它的积分也应该保持不变;在而后半部分,这函数乘上一个常数 c ,从积分的线性关系,积分值将变成 c 。应用定义的不同部分,推导出不同的结果,说明定义中有矛盾,这在数学上是不允许的。 于是大家便改成逼近的方式来定义,例如用一个积分值为 1 矩形脉冲函数序列$H_n(t)$,把它看成其宽度趋向 0 时的极限函数,或者看成是均方差趋于 0 的正态分布序列的极限。这样行不? $\delta(t)=\lim_{n\rightarrow \infty}H_n(t)) \;\;\;$ $\delta(t)=\lim_{a \rightarrow 0+} \frac{1}{a \sqrt{\pi}}e^{-t^2/a^2}$ 从函数序列来看,在定义域除了 0 点外都是收敛的,但在 0 点不收敛,也就是说在逐点的意义上,这两个函数序列都不收敛。即使把函数定义扩展到包括无穷大的值域,认为它可以作为函数序列的极限,也没有微积分的定理能让这一个无界函数的积分等于序列函数积分的极限。实际上,这极限函数的勒贝格积分是 0 ,不是所希望的为 1 的数值。企图把δ函数定义为单位阶跃函数的导函数,或者用光滑函数序列导函数逼近阶跃函数的导函数,也将是如此,无论对黎曼积分还是勒贝格积分,它都不满足那个联系着不定积分和定积分的牛顿 - 莱布尼茨公式的条件。 此路不通!因为δ函数根本不是个函数,即使允许定义那样的映射,也无法合理定义出积分为 1 的性质。那么狄拉克是怎么想的?这δ函数如何能用在物理,统计和工程上? 狄拉克有着极好的物理直观和形式推理的训练,他的美感蕴含着自然和谐的内涵,来支持他做法内在的合理性。这要从他面对的挑战谈起。 在向量空间,人们经常用线性算子对空间进行分解,将空间中的向量表示成特征向量的线性组合。特别是规范地表达成特征向量正交归一化的基 e i ,在数学计算上和物理直观上都有着重大的意义。这在空间能够分解成有限的或可数无穷的基时都不难做到。 对正交归一化的基向量有 $\left \langle e_i,e_j \right \rangle = \delta_{ij} $ ,空间中的向量x表现成它们的线性组合时,$x = \sum _{k}a_k e_k$,由 $\langle x, e_n \rangle = \langle (\sum _{k}a_k e_k ), e_n \rangle= \sum _{k}a_k \langle e_k, e_n\rangle = \sum _{k}a_k \delta_{kn} = a_n$,得到向量在基向量上分解的系数就是对它的投影 $a_n = \langle x, e_n \rangle$,这是大家熟知的线性代数上数学形式推理和几何直观。例如分立频谱时傅立叶级数分解,即是这里基为可数的形式。 将这个几何直观推广到基向量是不可数的情况,例如量子力学中算符的连续谱本征波函数 e s ,归一化就处在遵从数学严格定义与应用上两难的局面。这时狄拉克引入δ函数来取代δ ij 函数,把内积和线性组合的叠加表现成积分的形式,建立起在分立和连续不同情况下类比的解读,以保持几何直观和数学推导形式的一致。 定义δ函数具有这样的性质:$\int_{-\infty}^\infty f(r)\delta(r-s)dr = f(s) \;\;\;\forall f\in L^1(R)$,规范化连续谱的基向量满足 $\left \langle e_r e_s \right\rangle = \int_{-\infty} ^\infty e_r(t)\overline{e_s(t)}dt =\delta(r-s)$ ,则空间中的向量x对这组基的分解$ x = \int _{-\infty}^\infty a(s)e_s ds $,在几何投影直观上直接可以得出其中$a(s)=\langle x, e_s \rangle $. 在数学的形式推导上不难验证,$\langle x, e_s \rangle = \langle \int _{-\infty} ^\infty a(r)e_rdr, e_s \rangle = \int _{-\infty}^\infty a(r)\langle e_r, e_s\rangle dr = \int_{-\infty}^\infty a(r) \delta(r-s)dr = a(s) $,这就保持了逻辑和直观统一的形式美。 狄拉克函数的动机是类比于δ ij 函数,并不是将实数对应到 0 和无穷大的映射,只是如果把它当作函数来看时必须具有的性质,不是它的定义。其真正的要求,是在积分里,将空间里的函数 a(.) 对应到 s 点的函数值 a(s) 的功能,从而得到状态 x 对(本征值 s 的)连续谱本征波函数 e_s 分解的系数 a(s) 。数学上,将函数看成变量,对应到数域上的一个数值,称之为泛函。不难看到δ函数是个泛函,它确定的映射是线性的,而且是连续的,所以它是一个连续线性泛函。 另一方面,如果用函数 g 作为积分 $\int_\Omega f \overline{g}$ 中的一个因子,也将可积函数 f 对应到数域上的一个数值,所以也可以把 g 在这个积分下的作用看成是一个连续线性泛函。在积分作用下,泛函包括传统的函数以及不能表示为传统函数的部分。连续线性泛函 L 对线性赋范空间 F 中函数 f 的作用,通常可以写成内积的形式 $L(f) = \langle f, L\rangle$. F 空间上全部连续线性泛函构成了它的对偶空间,记为 F* 。 狄拉克δ函数是广义函数,这广义不是指它的值域包含了无穷大和已确定的积分值,而是本质上它是函数空间到函数空间上的映射,当固定参数 s 或缺省为 0 时,δ s 是函数空间到数域上的映射,这不是传统函数定义为数域到数域的映射所能涵盖的。能够反映这个功能的定义应该是: $\int_{-\infty}^\infty f(t)\delta(t-s)dt = f(s) \;\;\;\forall f\in C^0(R)$ 篇首的那种简单直观的“定义”, 是它在F*空间以参数为变量的范数值函数, 以及对常数值1函数的泛函值,不足以确定广义函数。 广义函数是一类连续线性泛函。连续线性泛函在积分作用下可以包含传统的函数,功能如同概率统计中的分布函数,所以有时也类比地称之为分布函数。线性赋范空间 F 上的两个连续线性泛函,如果对 F 中所有函数的内积都是相等的,可以认为它们是等同的。 我们知道微分算子的特征向量集合$\{e_k=\frac{1}{\sqrt{2\pi}}e^{-ikt} \; | \; k \in \mathbb{Z} \}$是L 2 空间上的一组正交归一基。这空间中的函数对这组基展开的是傅立叶级数。对于$L^2(-\infty, \infty)$空间,微分算子不可数的特征向量 $e_s(t)= \frac{1}{\sqrt{2\pi}}e^{-ist},\;\;s\in \mathbb{R} $,依上面的对特征向量的分解系数和线性叠加的解读实现的是傅立叶变换和它的反演。这表示这组连续谱的基是规范的,验证这个泛函内积的表现则有:$\delta(r-s)=\langle e_r,e_s \rangle= \frac{1}{2\pi}\int_{-\infty}^\infty e^{-irt}\overline{e^{-ist}} dt =\frac{1}{2\pi}\int_{-\infty}^\infty e^{-i(r-s)t} dt $ 即狄拉克函数的另一性质:$ \delta(w) =\frac{1}{2\pi}\int_{-\infty}^\infty e^{-iwt} dt $. 线性赋范空间 F 上的泛函序列( L n ), $\lim_{n\rightarrow\infty} L_n = L_0$ ,说是弱 * 收敛于 L 0 如果满足下面条件: $\lim_{n\rightarrow\infty} \langle f, L_n\rangle = \langle f, L_0\rangle, \;\;\;\forall f\in F,L_0, L_n \in F^*$ 所以对于广义函数,我们说 $\lim_{n\rightarrow \infty} \frac{1}{\pi}\frac{\sin (nx)}{x} =\delta(x)$,实际上是指弱*收敛, $\lim_{n\rightarrow\infty} \frac{1}{\pi}\int_{-\infty}^\infty f(x)\frac{\sin (nx)}{x}dx = f(0)=\int_{-\infty}^\infty f(x)\delta(x)dx = \langle f, \delta\rangle, \;\;\;\forall f\in \mathbb{D}(\Omega)$ , 上面常见的几个极限等式,也是在这个意义下的收敛等价关系。明白了这个意义,不难构造出无数种这样的极限等式。 $\Omega\subset \mathbb{R} $ 是个开区间, $\mathbb{D}(\Omega)$ 是定义在 $\Omega$ 上无穷阶可微函数的空间,空间中的函数对应于非 0 函数值的点各是在一个有界闭区间里(为“紧支集”)。 $\mathbb{D}(\Omega)’$ 表示对应的连续线性泛函空间,它的元素叫做 $\Omega$ 上的广义函数。广义函数 L 可以用下面的公式定义它的任意阶导数 D n L , $ \langle f, D^n L\rangle = (-1)^n\langle D^n f, L\rangle , \;\;\; \forall f \in \mathbb{D}(\Omega)$ 例如,把单位阶跃函数看成广义函数,我们有$H'(x) = \delta(x)$ ,这是因为 $\langle f, H'\rangle = - \int_{-\infty}^\infty f'(x)H(x)dx = - \int_0^\infty f'(x)dx =f(0)=\int_{-\infty}^\infty f(x)\delta(x)dx,\;\;\;\forall f\in \mathbb{D}(\mathbb{R})$ ,注意这里用了具有紧支集的函数在无穷处的函数值是0的性质。 完全类似地可以定义 n 维空间的广义函数和它的任意阶偏导数。 Sobolev 空间理论及广义函数,在现代偏微分方程中已是不可或缺的工具。狄拉克以非常简单直观的δ函数,给物理学者和工程师铸造了一把饱含数学能量的利器,也为数学家打开了一座富有宝藏的矿山。 到这里已经大致用广义函数的理论,给δ函数一个数学上严谨的解读。所谓的δ函数,不是个值域扩展到无穷大的传统函数,而是定义在函数空间上的泛函。通常介绍的极限或导数形式的等式,不能作为它的定义,只能看作在函数空间作用上的等价关系。 物理学者和工程师,经常凭证直观想象的类比,不严谨地套用公式,经常得到丰硕的成果,但有时也错得离谱。即便是历史上数学大师,如费尔马,欧拉等,以其丰富地类比想象,而硕果累累,但也有些不靠谱的错误论断。数学上严谨的证明,如同物理实验一样,在逻辑上验证一种类比猜想的正确性。只有过了这关才是可靠的。狄拉克的δ函数,作为数学实体的存在性,作为函数序列弱 * 收敛极限的泛函,以及各种初等计算的性质都得到了严格数学上的证明。有了这个数学加持为后盾,说明这一个直观类比是可行的,我们仍然可用那些通俗解读,作为数学模型的性质来想象它的应用,而不必涉及深入的数学理论。 能够通读到此,对δ函数的认知应是过了“看山不是山,看水不是水”的阶段;即使你不能全部消化上面的数学内容,只要你知道δ函数不是函数,而是连续线性泛函,常见的各种应用和初等性质,在数学上都有依据,这时虽然“看山仍然山,看水仍然水”,相信已不再是原来的那个境界了。
个人分类: 科普|38792 次阅读|45 个评论
《数理同源》-4-数学家的绝招
热度 20 tianrong1945 2014-3-19 08:52
3. 数学家的绝招 伯努利家族的几位数学家当时曾经叱咤风云,但无论如何也掩盖不了大师级的瑞士数学家和物理学家欧拉的夺目光辉。 莱昂哈德·欧拉( LeonhardEuler , 1707 - 1783 )是约翰•伯努利的学生。尽管约翰小气到连自己的儿子都会妒忌,却早早地就认识到了欧拉的数学才能。他说服了欧拉的父亲,让 16 岁的欧拉从神学转到数学,成为自己的博士生。天才的欧拉在 19 岁时就完成了他的博士论文, 20 岁时被丹尼尔·伯努利邀请到俄国圣彼得堡的俄国皇家科学院工作,直到 1741 年转到柏林,他一生大部分时间都在俄国和普鲁士度过。不像老师约翰•伯努利的喜争好斗,欧拉一生仁慈且宽容。欧拉很早就有严重的视力障碍,最后 17 年双眼完全失明,但他乐观而自信,仍然用对儿子口述的方式坚持发展他平生钟爱的数学。 欧拉成就斐然、著作甚丰,在数学的每个角落都能找到他的踪影。本节将叙述的他在泛函变分以及微分方程理论中的先驱作用,不过是大师巨大成就中的泰山一角、沧海一粟而已。 上一节中介绍的变分法,始于 17 世纪末期雅各布对最速落径问题的解答,雅各布用了一点变分的思想,但却并未系统化,并且,“变分法”这个名称,是欧拉在 1766 年才根据拉格朗日的一封信中的命名而给出的。 约瑟夫·拉格朗日( Joseph-LouisLagrange , 1736-1813 )是法国数学家,要比欧拉晚生 30 年,但和欧拉年轻时一样,是个天才少年。 图 1 :( a )不均匀介质中的光线( b )等时下降曲线( c )等周期的摆钟 上节中叙述过摆线,看起来这个被伽利略命名的摆线在当时还挺受宠的,因为好几个问题的答案都是它。摆线最原始的定义是指圆滚动时边沿一点的轨迹,后来发现最速落径是摆线,约翰·伯努利还发现光在折射率与深度成正比的介质中的轨迹也是摆线,见图 1a 。后来数学家对等时曲线( tautochrone )问题加以研究,答案也是摆线。 惠更斯( ChristiaanHuygens , 1629 — 1695 )对这几个与摆线有关的问题都进行过深入钻研。在他的《摆钟》一书中 【 1 】 ,他描述了一种周期相等的“摆”(图 1c ),这不同于一般情形中摆线伸直而长度固定的钟摆。在上述的一般情形下,当摆长固定时,摆锤作的是圆周运动。中学物理中大家就学过,当摆动的振幅很小时,可以近似地将摆锤的运动当作是周期不随初始位置而变的简谐运动,但如果振幅太大就不行了。惠更斯发现,如果用某种方法,使得摆锤运动的轨迹是倒过来的“摆线”的话,如此而设计的摆钟将是等时的。也就是说,在这种曲线上,摆锤运动的周期不依赖于摆锤的初始位置。这个问题后来被等效地表述为如下的等时曲线问题。 设想一个在重力作用下无摩擦地向下滑动的小球,如图 1b 所示。等时曲线是这样一种曲线:所有初始速度为 0 、同时出发的小球,(比如图中的 A 、 B 、 C 、 D 位置上面,分别放了小球 1 、 2 、 3 、 4 ),无论它们起始于哪一个高度,所有的小球将同时到达曲线的最低点 E 。等时曲线乍一听有点奇怪,不同位置的小球怎么会同时到达地面呢?仔细想想就容易明白了:小球的初始位置不同,正好使得它们具有不同的势能,使得滑下来的速度有快有慢,距离地面远的小球滑动速度快,离地近的速度慢,而最后便可能同时到达。惠更斯证明了,这个等时曲线是存在的,和最速落径问题的解答相同,也是倒放着的摆线。 几十年之后,年轻的( 19 岁时)拉格朗日又对等时曲线、及等周曲线(见之后的第 5 节)等变分问题发生了兴趣,并与当时已经成名的数学大师欧拉多次通信讨论有关变分及泛函分析。在欧拉的宽容和鼓励下,以此研究为基础写出了他的第一篇有价值的论文“极大极小的方法研究”。之后,欧拉肯定了拉格朗日 1760 年发表的一篇用分析方法建立变分法的代表作,并正式将此方法命名为“变分法”。 拉格朗日的功劳是完全用分析的方法解决了一般的变分问题。当牛顿初建微积分的时候,主要考虑时间为自变量。推广到更一般的情形,自变量数目可以增多,但仍然是一个分离而有限的数目。变分法要处理的自变量却是一个变幻无穷的函数,从原始微积分的角度来看,那意味着自变量的数目是无限多!该如何处理这种无限多个连续自变量的问题呢?数学家们总是有他们的绝招。我们在下面简单描述一下变分分析的精神所在,并由此而导出变分法中基本的欧拉 - 拉格朗日方程。 经典的变分问题除了曾经叙述过的最速落径问题、光线轨迹、等时曲线之外,还有测地线问题、等周问题、牛顿最早提出的阻力最小的旋转曲面问题,等等。这些问题都可以表示成下面的积分形式: ( 1 ) 这儿的 x 是自变量, y 是 x 的函数,可以写成 y(x) , y’ 是 y(x) 对 x 的微商。因为 y 是一个函数,所以, J 便是函数的函数,即泛函。变分法提出的问题就是:对什么样的函数 y , J 将取极小(或极大)值?为叙述方便起见,在以后的文中只谈及“极小值”。 假设这个极值函数已经找到,用图 2b 中的红色曲线 y(x) 表示。也就是说, y(x) 是我们要求的泛函问题的解,它使得公式( 1 )的泛函 J 有极小值。那么,泛函在极值附近将有些什么特点呢?为此,我们可以先看看一般函数在极值附近的特点。曲线在极值附近时,函数所对应的一阶导数为 0 ,也就是说,极值附近曲线的切线是水平方向的,切线水平意味着自变量变化时,函数值不怎么变化,既不上升也不下降,变化(即函数的微分)为 0 。对泛函的情况也是这样,如果泛函 J 在 y(x) 有极值的话,当解函数 y(x) 变化时,泛函 J 几乎不变化,即变分为 0 。 图 2 :变分法分析 函数中自变量 x 的变化好说,我们用 dx 来表示其变化。比如,如果 x 是实数, dx 便是一个很小的实数而已。而泛函是函数的函数,泛函的自变量是一个函数,函数可以千奇百怪地变化,在最速落径问题中唯一需要满足的条件是:在 A 和 B 两个端点的函数值是固定的。那么,我们如何用数学语言来表示 y(x) 附近变化的各种函数呢?在拉普拉斯之前,比如雅各布,是将自变量 x 在某些位置的数值来一点点变化,如图 2a 所示,再运用几何直观的方法,加上具体问题的物理规律,从而得到函数 y(x) 的变化,然后令此变化为 0 而导出具体问题的方程。欧拉后来推广了雅各布求解最速落径问题的方法到一般的情况,将 y(x) 分成若干段一节一节更小的曲线,用求和代替公式( 1 )中的积分,得到了泛函分析中最重要的欧拉方程。但欧拉所使用的,万变未离其宗,仍然属于变动 x 的几何类方法。 拉普拉斯很巧妙地改进了欧拉的办法 【 2 】 。如图 2b 所示,所有的千奇百怪的试验函数 Y(x) ,可以写成解函数 y(x) 加上一个扰动函数之和。这个扰动函数则写成一个小实数变量 e 与另一个任意连续函数 h( x ) 的乘积: Y(x) = y(x) + e h( x ) (2) 这样做的结果就像是将扰动的幅度变化和形状变化分开来了。幅度变化取决于实数变量 e ,而函数形状的变化则由函数 h( x ) 表征。对函数 h( x ) 的要求不多:它们是至少有连续的一阶导数,两个端点值为 0 的任何函数,如图 2b 左上角的曲线所示。然后,将表达式( 2 )代入到积分公式( 1 )的被积函数 f (x,Y,Y') 中。因为公式的右边是关于 x 的积分,积分之后,表面上看起来,函数 h( x ) 消失了,积分结果 J ( e) 只是 e 的函数。但实际上,正确的说法应该是:函数 h( x ) 被吸收到了 J ( e) 之中。因为不同的 h( x ) ,将会得到不同形状的 J ( e) 。图 2b 中右边的两个函数曲线,便是对应于不同的 h( x ) 而得到的不同 J ( e) 。 虽然不同的 h( x ) 得到不同的 J ( e) ,但这所有的 J ( e) 函数有一个共同的特点:当 e 等于 0 的时候,函数 J ( e) 的一阶导数为 0 ,这是函数取极值的必要条件。如图 2b 右图所示,也就是说,函数 J ( e) 在 0 点有极小值。这个性质可以很容易地从公式( 2 )看出来,因为当 e 等于 0 的时候,试验函数就是该泛函问题要寻求的解: y(x) ,这个解函数将使得 J 的变分为 0 ,亦即 J ( e) 对 e 的微分为 0 。 以上描述的方法很巧妙地将泛函变分的问题,等效地转化成了一个函数 J ( e) 对一个实数变量 e 取微分求极值的问题,将 对函数的求导变成了对单变量的求导。当然,两者仍然是有所区别的,这区别是在于这儿包括了一个任意函数 h( x ) 。解决这个后续问题时玩的花招也是在这“任意”二字上。 首先,类似于解决函数极值的方法,我们需要求 J ( e) 对 e 的微分。根据微积分的基本法则,因为积分限与 e 无关,微分符号便可以直接穿过公式( 1 )右边的积分符号而变成全微分应用到 f (x,Y,Y') 上。然后再利用 J ( e) 对 e 的微分等于 0 这一点,得到一个积分为 0 的表达式。如下面的公式( 3 )所示,这个积分的被积函数是两部分的乘积: 公式( 3 )中,被积函数的第一部分是 f 的偏微分表达式,第二部分则是任意函数 h( x ) 。现在,这两部分相乘之后再积分的结果为 0 。而我们知道, h( x ) 是一个任意函数,怎么样的函数乘上一个任意函数再积分后将会使得结果总是为 0 呢?显然只有当这个函数为 0 的时候才能做到这点。如此一来,我们便得到了如公式( 4 )所示的微分方程。这就是变分法中最基本的欧拉 - 拉格朗日方程。 附件:从公式(1)、(2)到(3)的简单推导: 参考资料: 【 1 】 C.Huygens, The Pendulum Clock or Geometrical Demonstrations Concerning theMotion of Pendula (sic) as Applied to Clocks, Translated by R. J.Blackwell, Iowa State University Press (Ames, Iowa, USA, 1986). 【 2 】 CourantR, Hilbert D (1953). Methods of Mathematical Physics. Vol. I (First Englished.). New York, New York: Interscience Publishers, Inc. pp. 184–5 上一篇:哪条路径最快? 系列科普目录 下一篇 : 数学的诗篇
个人分类: 系列科普|15903 次阅读|35 个评论
《数理同源》-3-哪条路径最快?
热度 20 tianrong1945 2014-3-11 09:42
2. 哪条滑梯最快? 谁都见过儿童乐园的滑梯。滑梯有各种各样的形状,孩子们从上面飞速滑下,不亦乐乎!但你是否想过:什么形状的滑梯,才能使得滑动者到达地面的时间最短呢?这实际上是一个著名的数学问题,微积分方法的出现促成了它的解决,并由此而开拓了一门与物理学紧密联系的新的数学分支:变分法和泛函分析。 别着急,且听我们慢慢道来,先从微积分建立之后,欧洲两位数学家:伯努利兄弟之争说起。 瑞士的伯努利家族是世界颇负盛名的科学世家,出了好几个有名的科学家,驰骋影响学界上百年。学物理的人都知道流体力学中有一个著名的伯努利定律,说的是有关不可压缩流体沿着流线的移动行为,由丹尼尔•伯努利( DanielBernoulli , 1700 - 1782 )提出。丹尼尔的父亲和伯父则都是他们那个时代著名的数学家。 有意思的是,伯努利家族这几个科学家之间,相处得并不和谐。互相在科学成就上争名夺利、纠纷不断。尤为后人留下笑柄的是丹尼尔的父亲约翰•伯努利 【 1 】 。 约翰•伯努利( JohannBernoulli , 1667-1748 )和他的哥哥雅各布•伯努利( JakobI. Bernoulli , 1654-1705 )都为微积分的发展作了杰出贡献。约翰进入巴塞尔大学时,比他大 13 岁的雅各布已经是数学系教授,因此,约翰向大哥学习数学。两人既是兄弟手足,又是导师和学生的关系。 约翰天资聪明,拜大哥为师的两年之后,数学能力就达到了与哥哥能一比高低的水平。没想到智力水平的高低并不等价于人品和修养的高低,约翰不服雅各布,雅各布却仍然将弟弟看成一个学生,两兄弟之间逐渐形成了一种不十分友好的竞争状态。约翰十分妒忌雅各布在巴塞尔大学的崇高地位,于是,无论在私底下,还是在大庭广众中,两人经常互相较劲。不过,世人可以不齿于他们互相嫉妒诋毁的人格,却不能否认他们这种竞争较劲的状态,还算有利于学术。从下面的几个例子,便是对以上说法的佐证。 那个时代的欧洲数学家,有一股互相出难题来挑战学术界的风气。 1691 年,哥哥雅各布建议数学家们研究悬链线( Catenary )问题,也就是两端固定的绳子(或链条)由于重力而自由下垂形成的曲线到底是个什么形状的问题。这个问题现在看起来简单,但在微积分和牛顿力学尚未建立以及刚刚建立的年代,却是不容易解决的。伽利略在 1638 年就曾经错误地猜测悬链线是抛物线,后来( 1646 年), 17 岁的少年惠更斯证明了悬链线不是抛物线。但不是抛物线,又是什么线呢?它的方程是怎么样的?当时谁也不知道答案。悬而未决的悬链线问题在等待着微积分的到来 【 2 】 ! 图 1 :悬链线和方程 雅各布收到了好几个答案,其中包括萊布尼茨、惠更斯以及他的弟弟约翰•伯努利。他们成功地用微积分解决了这个问题,证明了悬链线是如图 1 中所示的公式所描述的双曲余弦函数。因为这个问题的成功,骄傲自负的约翰得意非凡,认为这是他在兄弟之争中的辉煌胜利,并更加瞧不起这个他认为“愚笨”的哥哥。约翰在多年后写给朋友的一封信中,还津津有味地描述了当时掩饰不住的“赢了哥哥”的狂喜心态 【 3 】 : “我哥哥对此问题的努力一直都没有成功,最后却被我解决了。我不是想自夸,但我为什么要隐瞒真相呢?在我找到答案后第二天早上,狂奔到我的兄弟那儿,看到他还在为此而苦苦挣扎。他总是像伽利略那样傻想,认为悬链线可能是抛物线。我兴奋激动地告诉他,错了,错了!抛物线是代数曲线,悬链线却是一种超越曲线 transcendentalcurve ……” 其实,雅各布的数学成就并不逊色于弟弟,他活得没有弟弟长, 50 岁就去世了。约翰活到了 80 岁。雅各布短短的学术生涯中,对微积分及概率论作出很多贡献,其中最为众人所知的是“大数定律”。此外,数学中有许多以伯努利命名的术语,其中十几个都是雅各布的功劳。 1696 年,約翰也对欧洲数学家提出了一个挑战难题,那就是著名的最速降落轨道( Brachistochrone curve )问题,也就是我们在本节开头所问的“哪条滑梯最快?”的问题。 假设 A 和 B 是地面上高低不同( A 不低于 B )左右有别的两个点,如图 2 左图所示。一个没有初始速度的小球,在无摩擦力只有重力的作用下从 A 点滑到 B 点。从 A 到 B 的轨道可以有很多很多,各自有不同的形状和长短,见图 2 中间一图。问题是:这其中的哪一条轨道,将使得小球从 A 到 B 的时间最短? 如果问的是距离最短,大家在直观上都知道答案是直线,但现在是要你求出所花时间最短的曲线,直观就不太顶用了。有人估计约翰自己当时已经得出了这个问题的答案,而提出这个问题的目的之一是挑战牛顿,其二则是奚落自己的哥哥。奚落雅各布是约翰的嫉妒心所致,为啥又要挑战牛顿呢?原因是在牛顿与萊布尼茨对微积分发明权的争夺战上,约翰是始终坚定地站在自己的老师萊布尼茨一边的。 约翰原来规定答案必须在 1697 年 1 月 1 日之前寄出,后来在萊布尼茨的建议下,将期限延长至复活节。期限延长后,为了确保牛顿得知此事,约翰亲自将问题单独寄了一份给他。牛顿毕竟是大师,当时已经年过半百,正在繁忙于他的改铸新币的工作,自己也承认脑瓜子已经大不如年轻时机敏。但无论如何,据说牛顿在下午 4 点钟收到邮件后,仅仅用了一个晚上便解决了这个问题 【 4 】 ,并且立即匿名寄给了约翰。这使约翰大为失望,因为他自己解决这个问题花费了两个星期的时间。虽然牛顿未署真名,约翰仍然猜出了是他,并且也不得不佩服地说:“我从利爪认出了雄狮!”( Irecognize the lion by his paw )。复活节时,约翰共收到五份答案:除了约翰自己和牛顿的之外,还有莱布尼兹、法国的洛必达侯爵、以及他的哥哥雅各布。 图 2 :最速落径问题 最速落径问题被视为数学史上第一个被仔细研究的变分问题,它导致了变分法的诞生,之后更开辟出泛函分析这一崭新广阔的数学领域。 变分法是什么?它和原始的微积分思想有何异同点? 有了微积分之后,人们学会了处理函数的极大值极小值问题。比如,当我们研究上抛物体所形成的抛物线轨道时,物体能到达的最高点便对应于抛物线的极大值。用微积分的语言来描述,极大极小值,和鞍点,都是曲线上函数 y (抛出物体的高度)对自变量 x (抛出物体的水平位移)的一阶导数为 0 的点。变分法处理的也是极值问题,不同的是,变分法的自变量不是一个变数 x ,而是一个变动的函数 y ( x )。比如说在上述的最速落径问题中问的是,从 A 到 B 的各种轨道(即图 2 中间图中的各种曲线),即各种函数 y ( x )中,哪一条轨道能使得下滑的时间最短?在这儿,需要求极值的函数是“下滑的时间”,自变量呢,则是在端点 A 和 B 固定了的所有“函数”。也就是说,变分法要解决的是“函数的函数”的极值问题。数学家们将这种“函数的函数”称为“泛函”,而变分之于泛函,便相当于微分之于函数。 回到当初约翰提出最速落径问题后收到的五份答案。尽管牛顿的才能使约翰沮丧,他仍然得意地认为自己的方法是所有答案中最简洁漂亮的,而认为他哥哥雅各布的方法最笨最差。牛顿等其余三人用的是微积分方法,在此不表。伯努利弟兄方法的差别何在呢? 约翰的答案简洁漂亮,是因为他借用了光学中费马的光程(或时间)最短原理。法国数学家费马( Fermat , Pierrede , 1601-1665 )是个很奇怪的学者,他是法院的法律顾问,算是个业余数学家。他的特点是不怎么发表著作,经常是只在书的边缘处写下一些草率的注记,或者是偶然地将他的发现写信告诉他的朋友。现在看来,即使是这种草率注记中的三言两语,已经使世人震撼忙碌不已,要是费马正儿八经地专门研究数学,那还了得?例如, 1637 年,费马在阅读《算术》一书时,曾写下注记:“将一个立方数分成两个立方数之和,或一个四次幂分成两个四次幂之和,或者一般地将一个高于二次的幂分成两个同次幂之和,这是不可能的。关于此,我确信已发现了一种美妙的证法 ,可惜这里空白的地方太小,写不下……” 。就是这一段短短的注记,后来被称之为“费马大定理”的猜想,就困惑了数学家们整整 358 年! 言归正传,费马研究光学时发现,光线总是按照时间最小的路线传播。这个原理,是几何光学的基础,可以从后来的惠更斯原理推导出来。事实上,费马原理现代版的更准确表述应该是:光线总是按照时间最小、或最大、或平稳点的路线传播。换言之,光线传播的经典路径是变分为 0 的路径。所以事实上,有关光线传播的费马原理应该算是变分法的最早例子,但在当时,人们尚未认识到这点,也没有进行详细的理论研究。 约翰·伯努利毕竟脑瓜子灵活,将费马原理信手拈来,把小球在重力场中的运动类比于光线在介质中的传播,导出了最速落径问题中那条费时最短的路径所满足的微分方程。这个微分方程的解,实际上就是同时代的惠更斯曾经研究过的“摆线”(沿直线滚动的圆的边界上一点的轨迹)。或者说,最速落径就是倒过来看的摆线,见图 2 中的右图。 约翰很得意地将最速落径问题中的物体类比于光线,貌似轻而易举地解决了问题,也得到了正确的答案(图 3a )。用现代物理学对光的理解来审查约翰的解法,光和物体的确可以类比。但在当时,约翰的方法恐怕只能算是一种投机取巧,因为他完全没有证据来说明这种做法的正确性。 雅各布·伯努利的方法虽然被约翰看不上,认为太繁复,但却在繁复的推导中闪烁出新的变分思想的光辉。雅各布没有使用像现成的费马原理这类的东西,而是从重力运动下小球遵循的物理和几何规律来仔细推敲这个问题。他首先假设小球是沿着一条时间最短的路线下滑的,然后考虑:如果在某个时刻,小球的路线稍微偏离了这条时间最短的路线,走了别的什么路径的话,会发生什么情况呢(图 3b )?大家可以注意到,上述雅各布的做法已经是一种变分的思想,因为他是在考虑所有微小偏离路径中使得时间最小的那个偏离。然后,雅各布用二阶导数的方法证明了,在这种情形下,为了使小球继续走时间最短的路,它的路线的微分偏离量, dx 和 dy ,应该满足的方程,就正好是摆线所满足的微分方程。 图 3 :( a )约翰使用折射定律( b )雅各布用二阶导数的分析方法 从图 3 中可粗略看出,约翰简单地使用费马折射定律,雅各布用考虑二阶导数的“繁琐” 方法,最后都导致了同样的公式,即图 3a 和图 3b 中间的方程,解决了最速落径问题。 简单之美的确诱人,但从上面的故事也悟出一个道理:外表简洁漂亮的未必见得正确,繁复冗长的功夫也可能并没有白费。 伯努利兄弟的你争我斗推动了变分法和泛函分析的发展。没过几年,哥哥雅各布就去世了。看来,约翰是过不了没有竞争对手的日子,他继而又把对雅各布的嫉妒心转移到了自己的天才儿子丹尼尔•伯努利的身上,据说他为了与儿子争夺一个奖项把丹尼尔赶出了家门,后来还窃取丹尼尔的成果据为己有。约翰与另一位数学家洛必达之间也有一段纷争,因为众所周知的“洛必达法则”,实际上是约翰·伯努利发现的。约翰曾经被洛必达以一纸合约聘请为私人数学老师,洛必达并非有意剽窃伯努利的成果,但伯努利为此久久不能释怀。更多的故事不在这儿讲,只付诸一笑。 图3的公式推导见附件: formula3.pdf 参考资料: 【 1 】 TheBernoulli Family, by H. Bernhard, Doubleday, Page Company, (1938) 【 2 】 Catenary- Wikipedia : http://en.wikipedia.org/wiki/Catenary 【 3 】 AChronicle of Mathematical People by Robert A. Nowlan , http://www.robertnowlan.com 【 4 】 D.T.Whiteside,Newton the mathematician, in Bechler, Contemporary Newtonian Research, p. 122. 上一篇:谁发明了微积分? 系列科普目录 下一篇 : 数学家的绝招
个人分类: 系列科普|19342 次阅读|40 个评论
肖建华:百家争鸣:热力学的尴尬
xcfcn 2012-12-2 21:52
百家争鸣:热力学的尴尬 已有 219 次阅读 2012-11-25 16:10 | 个人分类: 生活点滴 | 系统分类: 科研笔记 | 关键词:的 热力学 http://blog.sciencenet.cn/blog-39419-636078.html 热力学是最为依靠逻辑推理的学科之一。这是因为,它无法对运动进行精确的描述。从而,它是使用泛函的变分来表达各种热力学量间的关系。 一旦采用这种形式化,它也就很难于区分引起热力学现象的具体原因。这种因果性解释上的非唯一性与牛顿力学的精确性形成鲜明的反差。 吉布斯把这种热力学上的运动概念(温度)的非唯一性通过布朗运动做出解释,从表面上看就与牛顿力学无矛盾了,这是通过“能量”这个概念来达成的。 从而,内能概念就成为了热力学的基础概念。从一开始,这就是一个泛函。 在布朗运动中,加上短程相干,长程不相干的概念,可以用统计学的方法得到运动的宏观精确描述。其后来的扩展就是统计力学。 为了把这个方法纳入到微积分的精确定量体系中,出现了两个核心概念,一个是熵,一个是“分布”。系统的“分布”是一个几何测度(度规)的等价物,从而,“分布”的变化就是“几何运动”的等价物。而熵的概念则是“广义力”概念的等价物。 使用作用量为泛函,一个热力学系统就成为了一个“普遍”的哈密尔顿系统。与动量坐标相联系的正则变换也就使得热力学披上了精确化的外衣。 我们学到的经典热力学大概也就是如此了。 但是,由于分布概念和熵的概念都是使用温度参量来定义的,在逻辑上不独立,从而,无数的不同观点就避不可免的出现了。 搞理论研究的把目标定位在熵的概念。如果它是“广义力”的等价概念,则可以为负,但是,这与温度(运动)的随机性假设矛盾,从而,熵绝对的不能为负。这个矛盾被普利高津抓住了,他巧妙的使用涨落概念用正则化方程的解来论证自身理解的合理性,从表面上看是回避了“分布”(几何运动)的概念。 在普利高津把矛盾的焦点转移到:开放系统与封闭系统以后,其变种:平衡系统与非平衡系统也就连带的成为另一个焦点。 一个大家都高兴的办法是:熵绝对的不能为负。但是,其增量变化可正可负。 搞实验研究的和搞工程应用的把目标定位在分布的概念上。从而,任何一个热力学现象总是能对应于某种“分布”。一种满足感油然而生。他们拒绝任何的批判,无论是来自理论界的,还是来自同行的。 热力学就这样成了“神圣不可侵犯”的学科。它的神圣性表现在:( 1 )第零定律,温度的定义(纯逻辑性的);( 2 )第二定律,熵增定律(断言式的);( 3 )“分布”的无所不能性(数学表达上的)。 所以,对热力学的理论出现各持己见的争论就是很正常的事情。 但是,一百多年来,对熵的概念的理论研究工作从来没有中断过。这是热力学中最为“神秘”的概念。 有一段时间,在容忍负熵概念后,熵被等价为“时间”的运动方向概念。从而,一个推论就是;时间的起点就是零熵。这也就从一个侧面支持了宇宙大爆炸理论。 由于熵和温度是孪生兄弟,任何一方的独到见解都会受到另一方的强大制裁。从而,我们学者对热力学的批判性讨论在某种程度上表明:我国的科学研究开始对准目标。 张学文 2012-11-27 17:38 热力学熵是信息熵的特例。 从热力学熵到它与可能状态的数量的关系,再到信息论的出现,熵其实对应的该系统可能状态的丰富程度或者说复杂程度。 复杂程度最大就是熵最大,而复杂程度最大是因为它出现的概率最高... 所以依我看热力学第2定律仅不过是高概率的事情容易出现的推论。
个人分类: 热统|1 次阅读|0 个评论
英语的表达是一个泛函
热度 8 phd9992000 2011-1-17 16:56
其实任何其他语言也一样,人们总是喜欢用最简短的语句,表达清楚自己的意思。 在直率的情况下,人们表达一个意思,可以有很多不同说法。人们所采用的,一定是那个最省劲的。这类似于固体受力后的变形:实际的变形一定是变形后能量状态最低的那一种。大多英国人说话采用如此方式,坦率、直截了当。消耗资源少,效率较高。 中国人的说话就更复杂一些。实际意思往往经过层层包装,表达方式不一定是泛函之中能量最低的。由此导致整个社会的交易成本高,很多资源都在交易过程中消耗掉了。所以GDP增长很多,但人们的幸福感不强。 来英国之前,我想像了一些生活情形,臆想英国人会怎么表达。来到后发现完全不是那么回事。英国人的表达,简洁、省力多了。仔细体味的话,发现英语也是一种极其精炼、优美而简洁的语言。下面是几个例子: Calling at:这是乘火车时,招呼乘客上车的语言。后面是所到车站名称。例如,Rugby,Euston.简洁,明快。节省能量。 Sorry,not in service:这是公交车运行中,停止上车的话。礼貌的拒绝。还真找不到更省力的话。 To let:这是出让房屋的广告。开始,我还以为是厕所(Toilet)这个字的中间掉了一个字母(i),后来发现不是那么回事。简单到家了。 还有2个口语经常用的:wanna= want to .类似地,gonna = going to . 例子今天暂时想到这么多,就写到这里。 真是耗能最低的泛函。
个人分类: 科教感悟|2087 次阅读|8 个评论
费马原理的例子
qianlivan 2010-2-13 14:00
费马原理是一个很深刻的物理原理。最早接触这个原理是在光学中。光在均匀介质中沿测地线传播(在平直时空是直线)以及光的折射定律都可以从这个原理得出。 除此之外还有什么地方可以找到这个原理的用武之地呢?和路径选择有关的问题很多都和费马原理有关,也和上面提到的光学里的例子类似。比如,从陆地上某地甲到海上某地乙,若两地的连线和海岸线不垂直,那么从甲地到乙地最省时间的路径一般不是两地的连线,而是和在陆地上的运动速度以及在海上的运动速度有关的路径。 此外,在有避雷针的情况下,闪电在空气中的路径也和费马原理有关。但是这种情况有一点不同。光的传播路径在同一种介质中是径直向前的,而闪电却是充满拐折。区别就在于光的传播是稳态过程,在每一点,光的下一步的走向都是确定的。而闪电是瞬态过程,其传播会改变介质的状态,因而细节的路径是不确定的,但大致方向可以用费马原理估计。
个人分类: 思考|7346 次阅读|0 个评论
关于电磁场泛函法的简单总结和归纳
williammilo 2010-1-28 09:22
我的博客已经搬家到 xiongbox.com 欢迎访问熊伟博士的网站! 本文永久链接 http://xiongbox.com/电磁场泛函法/ 1.泛函的 数学意义 是函数空间对数值空间的某种确定的 映射关系 ,泛函定义域中的每一种可取函数对应一个确定的泛函值。 2.电磁场的泛函法以泛函方程为电磁场问题 数学模型 的各种 近似解法 ,区别于以函数方程为数学模型的各种经典的 严格解法或近似解法 。 3.电磁场问题中的两类泛函── 参量值 的泛函和 误差 泛函,分别对应于两类求解方法,即 变分法 和 加权余量法 ,统称为泛函法。 4.利用 有限差分法 的概念,将加权余量法的子域未知函数表示成离散结点上未知函数取样值的 多项式插值函数 ,就发展成有限元法 。单矩法在实质上是数学边界上的 边界元法 与界内的 有限元法 (或有限差分法),以及界外的 分离变量法 三者的联合。
个人分类: 电子信息工程与计算机科学|3323 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-19 18:52

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部