科学网—标签 - 转移矩阵

相关帖子	版块	作者	回复/查看	最后发表

zhangxw 2014-9-22 11:30

气象随机场分析遗补之一--（气象随机场-28）张学文，2014.9.22 下面是我在2009年关于把转移矩阵思路用于概率分布函数上的一个系列认识的博客名称与地址。它算作对气象随机场探索的分布函数及其转移矩阵分析的前期思想说明。它们是气象随机场的重要思想来源。 ************ 对概率分布簇成因的另一认识途径（ 1 ） -- 开场白张学文，学习探索笔记， 2009-6-10 1. 统计学广泛应用于各个领域。统计学的基础是概率论。而 10 多个概率分布函数（如正态分布、幂率分布、负指数分布、均匀分布等）是概率论和统计学的重要内容。关于这些分布函数（我们称为分布函数簇）的数学特征、以及在它们分别在各个领域的具体应用已经有很多研究。 2. 很多学科研究对概率分布函数的应用，多体现在“ 这些数据符合某某分布函数 ”的水平等方面。而对于为什么它恰好符合这个分布而不是另外的分布的问题，探索的比较少（为大量数据穿上一套合适的数学外衣，这文章确实已经比较漂亮了）。显然，寻找概率分布簇中这些不同的分布的统一的原因和具体区别，是具有基础意义的问题。 3. 《组成论》（张学文著， 2003 ，中国科学技术大学出版社）一书研究了各个领域的分布问题。它还给出了的一种思路，就是把这些常用的一些概率分布函数的形成机理都从最大熵原理（最复杂原理）去认识。它理出来的思路是最大熵原理在不同场合配合不同的约束条件必然出现不同的概率分布函数。这为认识不同的概率分布提供了统一的理论思路，又根据不同问题中的不同约束获得不同的概率分布函数。从而形成一个系统化的认识。 4. 今年笔者发现了另外一个统一认识不同的概率分布形成机理的思路。目前我已经沿着这个思路获得了均匀分布、幂率分布、正态分布的初步线索。我觉得这个思路值得进一步发展与落实，而我个人力量不足。所以我把有关的初步成果分段公布。欢迎有关学者指点以致参与。 (2014.9.22 注:现在的工作已经初步说明沿着这个思路可以获得概率论谈及的各种著名概率分布了)。 5. 我获得这个初步认识所运用的数学步骤十分简单。它比熵思路包括的运算也少。但是构成这个一般模型，我是经历了一番周折的。后面不谈思想经历，而以容易理解的语言介绍初步收获。本段作为一个系列介绍的开场白吧。后续见（ 2 ）。本文引用地址： http://blog.sciencenet.cn/blog-2024-237480.html 对概率分布簇成因的另一认识途径（ 2 ） -- 格子间里的昆虫数量的转移问题为了突出物理图像，不陷入数学符号迷宫。我们用格子间里的昆虫数量的演化问题来说明我们的一般模型。… 本文引用地址： http://blog.sciencenet.cn/blog-2024-237481.html 对概率分布簇成因的另一认识途径（ 3 ） -- 关于转移规则的一般说明已有 2028 次阅读 2009-6-12 16:09 | 个人分类 : 统计、概率、熵、信息、复杂性 .1. | 系统分类 : 科研笔记 | 关键词 : 概率推荐到群组对概率分布簇成因的另一认识途径（ 3 ） -- 关于转移规则的一般说明本文引用地址： http://blog.sciencenet.cn/blog-2024-237818.html 对概率分布簇成因的另一认识途径（ 4 ） -- 从转移规则获得幂分布本文引用地址： http://blog.sciencenet.cn/blog-2024-237819.html 用 excel 演算出幂率（5）--对概率分布簇成因的另一认识途径张学文（ 2009-6-15 ）本文引用地址： http://blog.sciencenet.cn/blog-2024-238350.html 对概率分布簇成因的另一认识途径（ 6 ） -- 对演算出的幂率的补充说明张学文（ 2009-6-15 ）本文引用地址： http://blog.sciencenet.cn/blog-2024-238522.html 上一篇：对概率分布簇成因的另一认识途径（ 5 ） -- 用 excel 演算出幂率下一篇：对概率分布簇成因的另一认识途径（ 7 ） -- 从转移规则获得正态和均匀分布推荐到博客首页发表评论评论 (2 个评论 ) IP: 202.114.70.* 删除回复 ziyi 2010-1-14 21:32 张老师，我有一个问题想请教一下，您这里说模型幂的值都是 “-1” ，是不是可以这样理解， p(x=k)=a/k ，（ a 是一个常系数），表示随机变量 x 取值为 k 的概率为 a/k 。另一方面，我们知道概率论中有这样一个关系式，即随机变量的所有取值的概率和要为 1 ，但是如果 p(x=k)=a/k 的话，关于 k 的无穷级数和是发散的，不满足这个关系式，产生矛盾。删除回复曹广福 2009-6-16 17:52 gfcao 将您的文章推送到山巅一寺 e 壶酒 , 博主回复：感谢关注和推荐。张学文对概率分布簇成因的另一认识途径（ 7 ） -- 从转移规则获得正态和均匀分布对概率分布簇成因的另一认识途径（ 7 ） -- 从转移规则获得正态和均匀分布张学文（ 2009-6-17 ）本文引用地址： http://blog.sciencenet.cn/blog-2024-238718.html 曹广福 2009-6-17 20:40 gfcao 将您的文章推送到山巅一寺 e 壶酒 , 博主回复：感谢关注和推荐。张学文删除回复袁贤讯 2009-6-17 19:29 用一个概率守恒定律写差分方程，规定边界条件，三两下可以写出解释解的。你这个数值实验想说明什么问题？不是抬杠，没有反对，只是觉得你没有把问题解释清楚。博主回复：感谢关注和提示。这是我学习的一个笔记，它记录了我的感悟。您提的思路能够与我悟到的内容一致，我也就放心了一层。一个正确的认识可以通过多个途径达到。欢迎您进一步展开说明您的思路，我在学习着。张学文对概率分布簇成因的另一认识途径（ 8 ） -- 对正态和均匀分布等的补充说明张学文（ 2009-6-21 ） … 好了，作为今年上半年的一个思路扩展，就说这些。前面 6-10 所提的事，欢迎大家延伸（注：今年我在科学网博客上关于人口的演化的计算， http://www.sciencenet.cn/m/user_content.aspx?id=221822 ，也是一个思路的不同模型的应用）。显然把重要的概率分布中一些分布都用这个思路給出理论说明，会使我们对概率分布成因的认识系统化。本文引用地址： http://blog.sciencenet.cn/blog-2024-239453.html

个人分类: （熵+统计）气象学|2504 次阅读|0 个评论

动平衡的负指数分布要求的转移矩阵--《气象随机场-25》

zhangxw 2014-9-16 10:54

动平衡的负指数分布要求的转移矩阵 -- 《气象随机场 -25 》张学文， 2014/9/14-16 我们已经对均匀分布和正态分布型的分布函数所要求的转移矩阵作了粗糙的分析。现在讨论在气象随机场中也经常遇到的负指数分布型的分布函数（概率密度分布函数）。即此分布函数实际处于动态平衡时，对应的转移矩阵的特征。我们也是打算从极限分布函数反求转移矩阵。在数学上人们好像在已经知道矩阵反求其特征函数。而我们这里的要求恰好相反。与均匀分布或者正态分布类似，这里的第一步的工作是使你规定的连续函数的自变量和函数值都适当地离散化为n个相格（区间）中的离散值，这n个区间基本覆盖自变量的全域又不至于太细致而导致最后求得的n阶矩阵太大。同时还要求这n个相格可以体现分布函数的基本特征。对于均匀分布，其自变量是有界的，但是对于正态分布，其自变量的存在域，理论上是从负无穷大到正无穷大。我们前面的处理是把负无穷大到-3.5合并在一个相格内，而在正的方向放弃了自变量大于3.4的区间（忽略，近似）。这种处理显然是粗糙的。但是它也基本体现了我们的成功。现在讨论的负指数分布函数的特点是自变量出现于零到正无穷大这个范围。我们既希望自变量的分割尽量是线性的（每个区间的宽度相同），又希望从0到正无穷大，这显然是存在矛盾的。在例子中我们取了一个标准的，有关常数都=1的负指数函数，f(x)=exp(-x) , 最简单的负指数函数。这个函数的基本特点在自变量＞3以后函数值已经很小了。我们把自变量划分为16个区间（相格）。其具体的各个相格的边界和有关函数值列于表中：自变量下界自变量上界区间（相格）宽度负指数函数积分值累计值 1 0 0.2 0.2 0.181269 0.181269 2 0.2 0.4 0.2 0.148411 0.32968 3 0.4 0.6 0.2 0.121508 0.451188 4 0.6 0.8 0.2 0.099483 0.550671 5 0.8 1 0.2 0.08145 0.632121 6 1 1.2 0.2 0.066685 0.698806 7 1.2 1.4 0.2 0.054597 0.753403 8 1.4 1.6 0.2 0.0447 0.798103 9 1.6 1.8 0.2 0.036598 0.834701 10 1.8 2 0.2 0.029964 0.864665 11 2 2.2 0.2 0.024532 0.889197 12 2.2 2.4 0.2 0.020085 0.909282 13 2.4 2.6 0.2 0.016444 0.925726 14 2.6 2.8 0.2 0.013464 0.93919 15 2.8 3 0.2 0.011023 0.950213 16 3 3 以上无穷大 0.049787 1 以上是负指数函数exp(- x ) 在上面指定的区间内的出现概率。它是严格按负指数的定积分而计算的（比前面正态分布的差分计算要准确）。表的第5列是负指数函数离散化为16个区间时的概率值，它也是我们求转移矩阵的各个转移系数时，利用细致平衡原则所需要的参数。最后一列是概率值的合计值。如果我们规定转移矩阵的第2行，2列的元素值是0.98，并且根据转移速度相等的原则和第2行的合计值=1，那么我们就可以直接求得第2行的三个元素值（0.01，0.98，0.01）。随后利用细致平衡要求和每行合计值=1，我们就获得了转移矩阵的各个元素的值。鉴于这种矩阵中0很多，而且16乘16的矩阵太大（不便于在一个表格中体现），下面我们改以仅列出主对角线各个元素及其两则的元素值的方法来表达这个矩阵。（见下表）。负指数分布要求的16*16转移矩阵的对角线元素及其左右的元素值表转移矩阵的其他元素的值都是0。合计值=1 体现了转移矩阵的要求。　对角线左侧对角线元素值对角线右侧合计值 1 　 0.991813 0.008187 1 2 0.01 0.98 0.01 1 3 0.012214 0.975572 0.012214 1 4 0.014918 0.970164 0.014918 1 5 0.018221 0.963558 0.018221 1 6 0.022255 0.955489 0.022255 1 7 0.027183 0.945634 0.027183 1 8 0.033201 0.933598 0.033201 1 9 0.040552 0.918896 0.040552 1 10 0.04953 0.900939 0.04953 1 11 0.060496 0.879007 0.060496 1 12 0.073891 0.852219 0.073891 1 13 0.09025 0.8195 0.09025 1 14 0.110232 0.779536 0.110232 1 15 0.134637 0.730725 0.134637 1 16 0.036409 0.963591 　 1 我们利用这个转移矩阵在初始分布函数的函数值仅在第3个相格=1，其他相格都=0的很不合理的初态作为开始状态进行分布函数与转移矩阵的乘法，而不断地做乘法。结果是在做了1万多次的乘法以后所获得的分布函数已经与负指数分布函数没有什么区别了。这说明，此转移矩阵是以负指数函数为极限分布的转移矩阵。或者说我们已经从离散的负指数分布求得了对应的转移矩阵，并且此转移矩阵确实可以从任何起点逐步转移到负指数分布函数。在实验中应当补充说明一句：第2,2元素值之所以取为0.98，是因为其他比较小的值可能导致计算的某些转移矩阵中的元素值成为负值。这显然是不合理的，所以也是不可取的。这样我们就已经逐步获得了均匀、正态和负指数这三种概率论中经常遇到的分布函数在动态平衡时所需要的转移矩阵的基本特征了。

个人分类: （熵+统计）气象学|4907 次阅读|0 个评论

动平衡的正态分布要求的转移矩阵--《气象随机场-24》

zhangxw 2014-9-12 12:51

动平衡的正态分布要求的转移矩阵--《气象随机场-24》张学文，2014/9/12 上一讲讨论了一个气象场的某气象变量（如大气压力）如果其分布函数是稳定的均匀分布，即处于动态平衡情况下的均匀分布，它要求的转移矩阵的特征。这个讨论是在对分布函数的转移矩阵做了很多的一般分析基础上而展开的。均匀分布的转移矩阵的高度对称特征也使我们看到转移矩阵无论阶数是多少，其矩阵都是类似的。所以我们没有就不同阶数的矩阵多讨论。现在我们的核心任务是分析正态分布所对应的转移矩阵。即我们试图获得在动态平衡情况下的正态概率分布所要求的转移矩阵的特征。鉴于正态分布在概率论和统计学中经常遇到。所以这个讨论对非气象领域的正态分布的认识也有价值。在23讲中我们看到对称性很强的均匀分布，除了满足状态在一个时间步长中最多只可以移动到相邻的相格（离散的状态区间）外，还具有向左右相格的转移速度（转移率）相等的特征。而左右相格的转移率如果相等，也就意味着待求的转移矩阵中的未知数又减少了n-1个。而在第22讲的最后部分我们指出过从分布函数获得转移矩阵尚缺n-1个未知数。而左右转移速度相等的假设竟然使这些未知数消失了。这就算是说你给我任何一个离散化的分布函数，我都可以在 1. 转移矩阵适用于时间步长很短，从而状态仅可以转移到相邻相格或者不转移； 2. 满足马尔科夫过程的细致平衡原则（对分布函数是转移矩阵的极限分布）； 3. 左右转移速度相等； 4. 任意给一个合理的假设的转移速度； 5. 转移矩阵的每一行的诸元素的合计值=1。依据分布函数的n个离散值（相格）而推算出它要求的n阶转移矩阵。下面就针对正态分布落实对应的各个环节： 1. 正态分布公式：这里用的是平均值=0，标准差=1的正态分布公式其公式是 f(x)=(1/(2*Π)^0.5）*exp（-x*x/2） 2. 对此概率密度我们把它适当地离散化为15个相格（区间,分的不是很好）。而每个区间中的出现概率大致是如下的表。离散的相格变量上限变量下限区间概率值 1 - 无穷大 -3.5 0.000279 2 -3.5 -3 0.001304 3 -3 -2.5 0.00554 4 -2.5 -2 0.018417 5 -2 -1.5 0.047905 6 -1.5 -1 0.097511 7 -1 -0.5 0.155332 8 -0.5 0 0.19366 9 0 0.5 0.188972 10 0.5 1 0.144323 11 1 1.5 0.086265 12 1.5 2 0.040353 13 2 2.5 0.014771 14 2.5 3 0.00423 15 3 3.4 0.000861 合计 0.997 3. 根据前面整理的5项要求而得到的15乘15的转移矩阵（其中由我们主观设定的一个值是矩阵的第2行第2列为0.7）。而空白处的转移速度是0. 转移矩阵　概率 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 0.000279 1 0.299 0.701434 　　　　　　　　　　　　　 0.001304 2 0.15 0.7 0.15 　　　　　　　　　　　　 0.00554 3 　 0.0353 0.929399823 0.0353 　　　　　　　　　　　 0.018417 4 　　 0.01061858 0.97876 0.01061858 　　　　　　　　　　 0.047905 5 　　　 0.00408 0.991835435 0.004082 　　　　　　　　　 0.097511 6 　　　　 0.00200556 0.995989 0.002006 　　　　　　　　 0.155332 7 　　　　　 0.001259 0.997482 0.001259 　　　　　　　 0.19366 8 　　　　　　 0.00101 0.99798 0.00101 　　　　　　 0.188972 9 　　　　　　　 0.001035 0.99793 0.001035 　　　　　 0.144323 10 　　　　　　　　 0.001355 0.99729 0.001355 　　　　 0.086265 11 　　　　　　　　　 0.002267 0.995466 0.002267 　　　 0.040353 12 　　　　　　　　　　 0.004846 0.990307 0.004846 　　 0.014771 13 　　　　　　　　　　　 0.01324 0.97352 0.01324 　 0.00423 14 　　　　　　　　　　　　 0.046228 0.907543 0.046228 0.000861 15 　　　　　　　　　　　　　 0.227249 0.772751 4. 根据前面的介绍，我们从任意一个初始分布（实际是第4个相格=1，其他相格=0）与上面的矩阵做乘法，获得一个新的分布函数，以此分布函数再做矩阵乘法，如此做1万次，结果是获得的分布已经与正态分布函数很近了。见下图图中的变量的取值，应当修订为变量对应的相格位置编号 5. 这说明本转移矩阵就是正态分布函数的转移矩阵，或者说正态分布是本转移矩阵的极限分布。关于保持动态平衡时的正态分布所要求的转移矩阵的特征我们初步分析到此。

个人分类: （熵+统计）气象学|4411 次阅读|0 个评论

动平衡时的均匀分布要求的转移矩阵--《气象随机场-23》

zhangxw 2014-9-8 17:17

动平衡时的均匀分布要求的转移矩阵-- 《气象随机场 -23 》张学文，2014/9/5-8 我们针对气象场中气象变量的不同取值在气象场中占有的权重提出分布函数概念,而这种分布函数有很多理由是具有时间不变性的。可气象情况的随时的变化也提示分布函数的不变化是一种动态平衡下的不变化。这使我们进而关注各种气象变量在气象场中的分布函数的动态平衡所对应的转移矩阵是什么。在上一讲具体看到在分布函数离散化的情况下依靠已知的分布函数反求转移矩阵的每个元素依然是依据不足的：方程式的数量多于未知数数量。在这种背景下，具体分析某些特殊的分布函数，这显然是有启发意义的。现在分析概率论中称为均匀分布的所对应的转移矩阵（中的诸元素）可能是什么。而均匀分布可能是概率论中最简单的分布。均匀分布的特点是在给定的有限区间内各个状态的出现概率都相等。这种高度的对称性使得其转移矩阵也必然很多对称性。这意味着转移矩阵中向前向后相格（状态）的转移率是相等。在我们规定的一个时间步长仅可以向前后转移一个相格以及转移矩阵的a 2,2 元素的转移速度（是维持原状的概率）是0.98的规定下。我们不难根据前面的讨论直接获得下面的转移矩阵。一步转移以后的状态 X 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 X 9 X 10 初始状态 X 1 0.99 0.01 0 0 0 0 0 0 X 2 0.01 0.98 0.01 0 0 0 0 0 0 X 3 0 0.01 0.98 0.01 0 0 0 0 0 0 X 4 0 0 0.01 0.98 0.01 0 0 0 0 0 X 5 0 0 0 0.01 0.98 0.01 0 0 0 0 X 6 0 0 0 0 0.01 0.98 0.01 0 0 0 X 7 0 0 0 0 0 0.01 0.98 0.01 0 0 X 8 0 0 0 0 0 0 0.01 0.98 0.01 0 X 9 0 0 0 0 0 0 0 0.01 0.98 0.01 X 10 0 0 0 0 0 0 0 0 0.01 0.99 本表把分布函数值划分为10个离散状态（划分为更多或者更少的离散状态时，完全可以从这个实例中外延出来，所以我们没有另外给出通式）。表的矩阵元素值中，即体现了状态间隔两个相格（或者2以上）的转移系数都是0，也体现了任何的一步转移速度都是0.01.我们自然认同这种相同的转移速度会形成均匀的极限分布函数。大家不妨自己去做这个数值实验，以任何的初始状态值（任意的初始分布函数）用它与本矩阵相乘，并且把以上计算进行多次循环，则最后获得的分布函数都是一个均匀分布函数。换句话说。这个转移矩阵所对应的极限分布函数就是均匀分布函数。下面的表是我们从一个近乎荒唐的初始分布开始进行n次（n=1,2，…,4000）的矩阵乘法从而获得n步转移以后的分布函数。我们看到该函数逐步走向均匀分布。但是速度很慢。当转移4000步以后才接近极限的均匀分布。状态，相格 X 1 X 2 X 3 X 4 X 5 X 6 X 7 X 8 X 9 X 10 初始分布 0 0 0 1 0 0 0 0 0 0 1 步转移 0 0 0.01 0.98 0.01 0 0 0 0 0 2 步 0 0.0001 0.0196 0.9606 0.0196 0.0001 0 0 0 0 3 步 0.000001 0.000294 0.028815 0.94178 0.028815 0.000294 0.000001 0 0 0 5 步 9.65E-06 0.000941 0.046147 0.905803 0.046147 0.000941 9.6E-06 4.9E-08 1E-10 0 10 步 0.000106 0.003836 0.083688 0.824741 0.083688 0.003836 0.000104 1.86E-06 2.28E-08 1.95E-10 50 步 0.008969 0.050275 0.209427 0.462658 0.20942 0.050187 0.008019 0.000949 8.84E-05 7.15E-06 100 步 0.035641 0.095038 0.215824 0.306961 0.215624 0.093751 0.028847 0.006794 0.00129 0.00023 500 步 0.135612 0.138903 0.141626 0.13859 0.126588 0.106313 0.08184 0.058491 0.040739 0.031297 1000 步 0.131201 0.128871 0.124148 0.117035 0.107792 0.097077 0.085974 0.075852 0.06812 0.06393 4000 步 0.101784 0.101609 0.101277 0.10082 0.100283 0.099717 0.09918 0.098723 0.098391 0.098216 在熵气象学的研究中已经从大气压力的准静力学平衡的要求下按照力学原理获得了大气压力应当服从均匀分布。换句话说，你从大气中（无论那个高度，那个经纬度）任取单位质量的空气，其空气的压力（在0-1050百帕以内）为不同取值的概率是相同的。从最大熵原理也可以证明大气压力基本服从均匀分布。而现在我们进一步认识到大气压力的动态平衡要求各个压力下的空气转移到气体压力的比率总体上是等速度的。这对应认识大气统计特性与动态变化显然具有基础知识的意义。前面的讨论我们已经指出过50%的地球面积当时获得的太阳能是0（黑夜），而白天的半球上不同太阳能占有的面积是相等的，即1/2的地球（气象场）的太阳能的分布函数服从均匀分布。我们知道大气温度依赖于太阳能，温度分布自然也类似于太阳能分布。在熵气象学研究中的统计说明，全球的大气温度也是接近均匀分布的。自然具体分布起来这里需要讨论的问题依然很多。以上讨论分析说明此类的转移矩阵对应着的极限分布函数是均匀分布函数。但是均匀分布要求的动态平衡是否仅此一类？想一想似乎还可能有其他的转移矩阵，这些容以后再讨论吧。关于均匀分布对应的转移矩阵我们初步讨论到此，它简单、清楚。我们指望她也是我们分析其他类型的分布函数（如正态分布、gamma分布等等分布）的转移矩阵的跳板。这些以后再讨论。

个人分类: （熵+统计）气象学|5316 次阅读|0 个评论

新版从动态平衡分布求转移矩阵（分析）--《气象随机场-22》

zhangxw 2014-9-3 18:23

新版从动态平衡分布求转移矩阵（分析）-- 《气象随机场 -22 》张学文，2014/9/3 ( 注2014.9月3日发现我的2014.8.31版本 http://blog.sciencenet.cn/blog-2024-823740.html 从动态平衡分布求转移矩阵-- 《气象随机场 -22 》中有1段是错误的.并且这也影响了最后一段，现在的版本是删了错误以后的版本,前一个版本作废特此说明) 经过前面的分析与讨论，我们逐步认识到，面积很大的气象场（这通常理解是全球、半球或者面积很大的一个空间、区域）中的某气象变量在某时刻的分布函数经常具有稳定性。而前面还说明可以存在一种转移矩阵，把分布函数与转移矩阵做乘法而获得的新分布函数（一个时间步长）依然与原分布函数相同。而此时的分布函数称为极限分布函数。我们后面着重分析这种具有时间不变性的极限分布函数与其转移矩阵应当是什么关系。或者说我们是否可以从分布函数去推求它要求的转移矩阵。即可以使原分布函数在经过一个（以致充分多个）时间步长的转移矩阵作用以后依然没有变化。上一讲我们把这归结为公式： xA=x 现在探索已经知道 x 求 A 。这里的 x 是一个矢量，它的各个分量是分布函数的各个函数值（自变量是规定的有限个离散状态的相空间），而 A 是待求的转移矩阵。也许应当交代依据笔者的线性代数知识很差，以下的探索属于个人的经验摸索，错误难免，承望指教。而如果这里有一定的创新性，也希望指出，而引用者请注明出处。 1. 矩阵中的未知数数量：我们这里的 x 是已经知道的有 n 个离散值的 n 维矢量。而待求的转移矩阵 A 自然 n 2 个未知数（方阵中的元素数量）。我们要从 x 的 n 个已知数据中求得 n 2 个未知数数据。 2. 矩阵中的“0”很多：注意我们在第16讲（状态转移矩阵的时间步长问题 - 《气象随机场 -16 》 http://blog.sciencenet.cn/blog-2024-816969.html ），单独讨论过转移矩阵的时间步长问题，而特别指出我们可以把时间步长取得很短，以使在这么短的时间内气象场内各点（有时是指气象场内的元面积，有时是指空气微团）的气象状态仅可能是依然留在本相格（状态区间）内或者移到它的左右两个临近相格，而转移到离它更远的相格的百分率是0。所以对于有n 2 个元素转移矩阵 A ，它最多有3 n -2 个未知数。即此转移矩阵至少有个“0”。具体到矩阵的每一行，则其第1行和最后一行，仅有两个未知数，其他的行有三个未知数。 3. 转移矩阵的每行的合计值=1 ：转移矩阵的每行的各个元素的合计值代表了从本状态转移到各个状态的百分比，它的合计值自然=1。这样我们就可以获得n个合计值=1的方程式，从而使未知数再减少n个。于是我们未知数就仅有（2n-2）个了。 4. 细致平衡原则：在已经达到极限分布的情况下（我们现在就是），在马尔科夫过程的理论中有一条所谓细致平衡原则。即这时各个相格中的存在量（也就是分布函数矢量的每个分量）与它转移到指定相格的转移率（矩阵的元素）的乘积，与对方转移回来的对应量是相等的。写成为公式就是 x i a i,j =x j a j,i （ i.j=1,2 ， … ， n. 但是 i 不能 = j ）这里的 x i 或者 x j 表示分布函数的对这个矢量的对应分量，而 a i,j ， a j,i 表示转移矩阵中的对应元素值。它体现在达到动态平衡时任何一个相格中从另外相格的流入量与自己流出到对方的量是相等的。对此在马尔科夫过程的理论中有论及。我们这里就不再多说了。这个细致平衡原则可以消除多少未知数 ? 由于我们根据时间步长限制以及使很多的元素成为 0 了 . 所以现在仅需要分析这个原则仅可以用到矩阵祝对角线两侧的元素上的情况。参照下面的转移矩阵模型，显然只有斜对角上的两个变量存在以上的细致平衡关系。这些在矩阵中我们分别以绿色和蓝色表示它们。于是我们看到矩阵中细致平衡关系可以建立的等号关系式应当有 (n-1) 个。于是我们的未知数就只有 n-1 个了。 j=1 j=2 j=3 j=4 j=5 j=6 j=7 j=8 j=9 j=10 i=1 a 1,1 a 1,2 0 0 0 0 0 0 0 0 i=2 a 2,1 a 2,2 a 2,3 0 0 0 0 0 0 0 i=3 0 a 3,2 a 3,3 a 3,4 0 0 0 0 0 0 i=4 0 0 a 4,3 a 4,4 a 4,5 0 0 0 0 0 i=5 0 0 0 a 5,4 a 5,5 a 5,6 0 0 0 0 i=6 0 0 0 0 a 6,5 a 6,6 a 6,7 0 0 0 i=7 0 0 0 0 0 a 7,6 a 7,7 a 7,8 0 0 i=8 0 0 0 0 0 0 a 8,7 a 8,8 a 8,9 0 i=9 0 0 0 0 0 0 0 a 9,8 a 9,9 a 9,10 i=10 0 0 0 0 0 0 0 0 a 10,9 a 10,10 5. 给一个规定速度值：我们用限定一个时间步长相当短的规定已经使很多转移矩阵的元素值=0了。但是在没有具体规定时间步长的情况下，我们还是需要在转移矩阵的各个元素中，人为规定一个元素的值（一个时间步长的转移百分比），以具体体现转移的速度。在此我们一般规定转移矩阵中的 a 22 的值是我们事先给定的， a 22 的含义是处于第2个相格中的空气状态在下一个时间步长依然是留在本相格的百分比。而且我们一般令 a 22 =0.98 ，即一个时间步长内处于第2个相格的空气维持原状态的百分率是98%。这样我们就又减少了一个未知数。成为 n-2 个未知数了。 6. 转移矩阵的“解”不是唯一的：前面的分析指出如何在已知极限分布函数的情况下，并且在规定了 a 22 =0.98 的情况下，可以（？）求得对应的转移矩阵。显然，如果修改的 a 22 值，我们还会获得另外的转移矩阵。这说明转移矩阵并不是唯一的。即一个极限分布函数在不同转移速度下，对应这不同的转移矩阵。 7. 在极限分布函数已知的情况下、在限定一次转移最多是可以到达最近的邻态的假设下、在 a 22 =0.98 的规定下，在细致平衡原理的配合下，我们在理论上分析出从极限分布函数求得它要求的转移矩阵依然缺n-2个参数。。以上是在代数学、马尔科夫过程知识、气象变量知识特点的基础上的从极限分布函数求其转移矩阵的一般分析。我们在下一讲中要以具体的例子具体计算其转移矩阵。

个人分类: （熵+统计）气象学|3672 次阅读|0 个评论

从动态平衡分布求转移矩阵--《气象随机场-22》

zhangxw 2014-8-31 10:58

从动态平衡分布求转移矩阵-- 《气象随机场 -22 》张学文，2014/8/28-31 2014,9,3注：本稿的第4段在9月3日发现错误，这也影响了后面的结论。我已经用一个新版代替本稿，见 http://blog.sciencenet.cn/blog-2024-824687.html 。但是此稿依然保留在这里。经过前面的分析与讨论，我们逐步认识到，面积很大的气象场（这通常理解是全球、半球或者面积很大的一个空间、区域）中的某气象变量在某时刻的分布函数经常具有稳定性。而前面还说明可以存在一种转移矩阵，把分布函数与转移矩阵做乘法而获得的新分布函数（一个时间步长）依然与原分布函数相同。而此时的分布函数称为极限分布函数。我们后面着重分析这种具有时间不变性的极限分布函数与其转移矩阵应当是什么关系。或者说我们是否可以从分布函数去推求它要求的转移矩阵。即可以使原分布函数在经过一个（以致充分多个）时间步长的转移矩阵作用以后依然没有变化。上一讲我们把这归结为公式： xA=x 现在探索已经知道 x 求 A 。这里的 x 是一个矢量，它的各个分量是分布函数的各个函数值（自变量是规定的有限个离散状态的相空间），而 A 是待求的转移矩阵。也许应当交代依据笔者的线性代数知识很差，以下的探索属于个人的经验摸索。承望高手指教。而如果这里有一定的创新性，也希望指出，而引用者请注明出处。 1. 矩阵中的未知数数量：我们这里的 x 是已经知道的有 n 个离散值的 n 维矢量。而待求的转移矩阵 A 自然 n 2 个未知数（方阵中的元素数量）。我们要从 x 的 n 个已知数据中求得 n 2 个未知数数据。 2. 矩阵中的“0”很多：注意我们在第16讲（状态转移矩阵的时间步长问题 - 《气象随机场 -16 》 http://blog.sciencenet.cn/blog-2024-816969.html ），单独讨论过转移矩阵的时间步长问题，而特别指出我们可以把时间步长取得很短，以使在这么短的时间内气象场内各点（有时是指气象场内的元面积，有时是指空气微团）的气象状态仅可能是依然留在本相格（状态区间）内或者移到它的左右两个临近相格，而转移到离它更远的相格的百分率是0。所以对于有n 2 个元素转移矩阵 A ，它最多有3 n -2 个未知数。即此转移矩阵至少有个“0”。具体到矩阵的每一行，则其第1行和最后一行，仅有两个未知数，其他的行有三个未知数。 3. 转移矩阵的每行的合计值=1 ：转移矩阵的每行的各个元素的合计值代表了从本状态转移到各个状态的百分比，它的合计值自然=1。这样我们就可以获得n个合计值=1的方程式，从而使未知数再减少n个。于是我们未知数就仅有（2n-2）个了。 4. 已知分布函数解决了（n-1）个未知数：由于本问题中的极限分布函数矢量本身就代表着n个已知数，它们显然参与（限制）着转移矩阵的各个元素值。所以n维已知矢量本身就获得(n-1)个方程，从而可以获得(n-1)个未知数（注：由于分布函数的各个分量的合计值应当=1的限制，所以它仅具有(n-1)个独立已知数）。这样我们的未知数就从（2n-2）个减少为只有（n-1）个了 5. 细致平衡原则：在已经达到极限分布的情况下（我们现在就是），在马尔科夫过程的理论中有一条所谓细致平衡原则。即这时各个相格中的存在量（也就是分布函数矢量的每个分量）与它转移到指定相格的转移率（矩阵的元素）的乘积，与对方转移回来的对应量是相等的。写成为公式就是 x i a i,j =x j a j,i （ i.j=1,2 ， … ， n ）这里的 x i 或者 x j 表示分布函数的对这个矢量的对应分量，而 a i,j ， a j,i 表示转移矩阵中的对应元素值。它体现在达到动态平衡时任何一个相格中从另外相格的流入量与自己流出到对方的量是相等的。对此在马尔科夫过程的理论中有论及。我们这里就不再多说了。在转移矩阵的非 0 元素中，这个细致平衡关系又使未知数减少很多（本段待完善）。 6. 给一个规定速度值：我们用限定一个时间步长相当短的规定已经使很多转移矩阵的元素值=0了。但是在没有具体规定时间步长的情况下，我们还是需要在转移矩阵的各个元素中，人为规定一个元素的值（一个时间步长的转移百分比），以具体体现转移的速度。在此我们一般规定转移矩阵中的 a 22 的值是我们事先给定的， a 22 的含义是处于第2个相格中的空气状态在下一个时间步长依然是留在本相格的百分比。而且我们一般令 a 22 =0.98 ，即一个时间步长内处于第2个相格的空气维持原状态的百分率是98%。这样我们就又减少了一个未知数。 7. 转移矩阵的“解”不是唯一的：前面的分析指出如何在已知极限分布函数的情况下，并且在规定了 a 22 =0.98 的情况下，可以（？）求得对应的转移矩阵。显然，如果修改的 a 22 值，我们还会获得另外的转移矩阵。这说明转移矩阵并不是唯一的。即一个极限分布函数在不同转移速度下，对应这不同的转移矩阵。 8. 在极限分布函数已知的情况下、在限定一次转移最多是可以到达最近的邻态的假设下、在 a 22 =0.98 的规定下，在细致平衡原理的配合下，我们在理论上分析出可以从极限分布函数求得它要求的转移矩阵。极限分布函数也就是分布函数保持动态平衡（不变化）的分布函数。而它对应的转移矩阵则体现在动态平衡下的气象状态的变化规律。以上是在代数学、马尔科夫过程知识、气象变量知识特点的基础上的从极限分布函数求其转移矩阵的一般分析。我们在下一讲中要以具体的例子具体计算其转移矩阵。

个人分类: （熵+统计）气象学|3800 次阅读|0 个评论

动态平衡要求的转移矩阵--《气象随机场-21》

zhangxw 2014-8-26 12:47

动态平衡要求的转移矩阵-- 《气象随机场 -21 》张学文，2014/8/21-26 我们就某时刻（如今天0时）某气象变量（如太阳能强度、温度…）在一个气象场(如全球)中的分布引入了分布函数概念。它回避了气象场各个具体地点的气象变量的具体数值，而仅是笼统地告诉你，不同的气象变量值占据了这个气象场(面积，空间)的比例（如暴雨占了气象场总面积的1%）。我们随后指出临近的两个时刻（一个时间步长）的气象场的气象变量的变化还可以计算出分布函数的转移矩阵。而转移矩阵具有推算下一个时间步长的分布函数的意义（这无形中包括了转移矩阵自己不随时间而变化的认定）。在这个总思路下,我们介绍了很多气象场的分布函数,而且对个别气象变量还比较深入地讨论了其转移矩阵的一些特点。在这些讨论中我们偏重于对具体气象情况的描述，而比较缺少对应的数学语言描述。也可以说我们是从气象实践中提出了一些在方法论上比较统一的问题。而没有刻板地套数学名词。本讲则对我们先前的做法、用词所简要的归纳并且把问题引向动态平衡下的分布函数与其转移矩阵问题。 1. 分布函数：我们这里反复使用分布函数一词。其基本的物理含义是在某一个集体中，具有某特征量的个体，各有多少。例如在气象场内的1000个气象站中今天中午的温度为不同值的气象站各有多少，而这就是这个时刻的温度气象场的分布函数（温度是自变量，气象站数量是函数值）。这个函数值被总气象站数量（集体中的个体总数）N除，就获得了气象场中不同温度占有的百分比。它对应数学的概率论中的概率密度分布函数概念，但是又比概率分布概念具体一些。它对应的随机抽象是：在该气象场中任取一个气象站的温度，其温度的概率密度函数就是我们讲的相对分布函数（有时我们忽略了相对二字）。 2. 相空间与相格：这是统计物理学语言。我们把气象场中气象变量的出现范围称为相空间。如某气象场中温度的出现范围是10-40度。这10-40的区间就是相空间。如果我们规定每2度温度差是一个相格，那么气象场的温度相空间就有15个相格。 3. 气象变量离散化：很多气象变量过去被看作是连续变量，但是本研究则经常把它们离散化为有限个相邻（注意它们是有序的）的离散状态区间（相格）。这看似粗糙，可它也为随后的思考认识与计算带来很多好处。 4. 气象场内气象变量的转移矩阵：依据两个相邻时刻的气象场的该气象变量的离散化数据，可以获得（统计出）前时刻的各个气象状态（在那个相格）所对应的气象场中的位置在下一时刻转变为各个气象状态的百分比。不同初始状态与结局状态的不同转变百分比们就构成了一个转移矩阵。另外气象场中的某气象变量的分布函数的转移矩阵也可以从理论上（如目前我们从天文学分析中不仅获得了地球的大气上界获得的太阳能强度的分布函还获得了它对应的转移矩阵）。转移矩阵刻画了该气象变量在该气象场在该状态（相格）的变化的统计特征。但是无力描述（略去了）气象场内各个地点的空气状态的具体变化。尽管如此，我们应当承认气象场内的气象变量的分布函数的转移矩阵是具有普遍意义的刻画气象状态变化的统一的，新思路和新工具。 5. 大的气象场中分布函数的稳定性：面对每个气象场的气象变量的具体资料，我们都可以统计出不同的变量值占有的权重（面积百分比等等）。可以想见，如果气象场是指一个区域很大的温度场的天气图，而天气图上的等温线仅是移动而不是笼罩面积的扩大或者减少，那么不同温度占有的相对面积就可能变化不大或者没有变化。而我们经常看到的天气图上的温度系统主要移动为主。基于如上分析，这种移动并不改变特定温度所笼罩的面积，所以面积足够大的气象场的分布函数随时间具有比较高的稳定性（它不随时间有明显变化）。 6. 稳定性体现着熵最大等理论要求：在我们过去的研究中指出某些气象变量在气象场中的分布函数所以是这样不是其他的，体现了着一种熵达到了它的最大值。或者说分布函数所以稳定在这种分布状态下是熵最大原理的体现。所以分布函数具有稳定性具有比较深厚的理论背景。另外有些气象场的分布函数具有不随时间而变化的品质也可以来自其他的物理背景，如前面讨论的太阳能强度在气象场中的分布函数的稳定性来自天文学，全球的大气气压付出均匀分布来自大气具有准静力学平衡和大气付出理想气体状态方程（见熵气象学书）。 7. 分布函数的动态平衡：如果气象场是指全球的温度，我们容易认可不同温度在全球占有的百分比随时间的变化很小。但是我们也确实知道每个地点的温度的日变化明显。这提示我们气象场的分布函数的稳定性其实是一种动态平衡。所以气象场内气象要素的分布函数具有的稳定性，实际对应着全气象场的温度的动态平衡。转移矩阵是用来表达分布函数的变化的，它也表达（满足）分布函数的动态平衡（的要求）。 8. 转移矩阵是分布函数演化的机制：我们可以说分布函数是对气象场的一种定量描述。但是随后我们引入的分布函数的转移矩阵概念则具有演化规律的色彩。它帮助我们从探索事实走向表达演化规律。我们已经看到一些转移矩阵可以不顾最初的分布函数是什么，而让任意的初始分布逐步变化为一个动态平衡下的分布函数，一个与转移矩阵有关的动态平衡分布函数。 9. 概率论的背景：在我们分析气象场的分布函数时，我们无形中利用了概率论中的概率分布和概率密度分布函数概念。而在我们引入转移矩阵时，在背后支持我们的理论则进而有马尔科夫过程、离散的马尔科夫转移矩阵、马尔科夫矩阵的自乘、马尔科夫矩阵的极限。对此我们这里不细致地一一对号入座了。说好听了，作者自认为这里介绍的内容与概率论的有关内容既有密切联系又互相印证，但是它们不完全等价。也许我们的事例是对概率论的新应用和新事例。欢迎读者自己在联系它们时中提出见解、质疑。 10. 有的分布函数是转移矩阵的一个特征向量：我们已经认识到转移矩阵是每行的各个元素的合计值为1的一种矩阵。我们还知道用当前的分布函数的函数值（已经看做是一个矢量）去乘以转移矩阵以后就获得下一个时刻的分布函数值（对应一个矢量）。而当这种乘法进行多次以后，我们所获得的新分布函数如果与原分布函数是相同的。写成为公式就是： xA=x 这里我们用 x 表示在离散化情况下的气象场分布函数值的矢量，用 A 表示转移矩阵。而在线性代数的视角下， x 是转移矩阵 A 的特征向量，并且对应的特征值=1。而满足这个关系的分布函数在马尔科夫状态转移的角度下，它已经是所谓极限分布了。在我们的气象场语言下极限分布函数是处于动态平衡的一种分布函数。此时，分布函数不再随时间而变化，它与转移矩阵相乘依然是原分布函数。 11. 特别关注极限分布函数与转移矩阵的关系：在线性代数的视角下转移矩阵的特征矢量是气象场的一种特殊的分布函数。它是分布函数在与转移矩阵连乘中不再变化的一个矢量，是一种极限分布。而我们后面就特别关注从已经知道的分布（认为它是极限分布）去推求它要求的转移矩阵。如果把气象场的分布函数的存在看作是一种气象现象的存在，那么从分布函数的存在推求出对应的转移矩阵，就具有从现象看到了气象统计规律了。我们在后面特别讨论动态平衡下的分布函数与转移矩阵的关系。

个人分类: （熵+统计）气象学|3285 次阅读|0 个评论

太阳能强度的分布函数和转移矩阵.2--《气象随机场-20》

zhangxw 2014-8-21 12:23

太阳能强度的分布函数和转移矩阵.2-- 《气象随机场 -20 》张学文，2014/8/17-21 上一讲最后我们获得了一个以全球为气象场，以太阳能强度为变量的不同太阳能强度的笼罩的地球相对面积与太阳能强度的关系的分布函数，以及经过一个时间步长，当地的太阳能强度变化的权重（百分比）的表。请注意,我们固然在”之17，18”,中讨论了利用分布函数及其转移矩阵可以做气象变量的分布函数的预报的事。但是我们不想过分突出这个特点而是想突出这个思路的物理意义。而在第19讲讨论太阳能的分布函数和转移矩阵时，我们强调其分布函数和转移矩阵知识是天文学知识的一种变态表达。而且根据天文知识，直接获得了分布函数不随时间而变化的结论。我们分析这个问题显然不是为了做预报，而是在新的视角下看到太阳能知识的新面孔，估量它对气候、天气的影响。我们现在就利用上一讲提出的太阳能强度的转移矩阵做一些讨论,以深化认识。 1. 太阳能强度转移矩阵的含义上一讲的太阳能强度的转移矩阵表给出了当前的全球气象场中，其太阳能强度为不同值（黑夜的0，和白天的太阳能强度分别是常数1367瓦/平方米的0.5、0.15、…、0.95）时（表的左侧一列），该区域的面积中会有多大的百分比的面积在下一个时刻(经过一个时间步长)继续处于该太阳能强度内，以及以多大的面积比例转移到太阳能强度更大（小）的一个相格（以表的最上面的第一行列出）中。它体现着球形并且运动着的地球上的各地的太阳能强度的变化规律。这种转移矩阵应当标明其一个时间步长究竟是多少时间，最好还注明这是指冬季还是其他季节（这些问题后面有说明）。另外，显然转移矩阵的阶数对应着我们把太阳能强度人工地划分为几个离散状态。 2. 太阳能强度的转移矩阵使太阳能强度的分布函数实现了动态平衡我们看到在一个时间步长的太阳能强度转移矩阵中除了太阳能强度是0.0（黑夜）和0.95（日射头顶）这两个状态（相格）外，其他的太阳能强度状态继续维持在原相格内的百分比（机会、面积比例）都是0.95（95%），而转移到其上下两个状态的占有的百分比都是2.5%。也就是说，太阳能强度的变化速度与当时的太阳能强度（当时处的相格）无关：大家的转移相对速度（比例）都相同！注意，转移矩阵的主对角线以外的各个元素的值体现这气象状态从一个状态转移到其他状态的相对转移速度。例如表中的0.025，就表示经过一个时间步长，处于本状态的太阳能强度的面积中有2.5%的面积要变成为相邻状态去。自己动手按照前面的“之15”给的计算公式，就可以从前一时刻的太阳能强度分布函数与转移矩阵做矩阵乘法，而获得下一个时刻的太阳能强度分布函数。计算表明，如果初始的分布函数如19讲的图1，那么经受这个计算所获得的下一时刻的分布函数依然是原样，而没有变化。即只要转移矩阵就是前面给的转移矩阵，那么它可以保证分布函数经过变换以后确实没有变化。所谓没有“ 变化 ”是指分布函数没有变化，即不同太阳能强度占有的相对面积不变化，而所谓“ 变换 ”，是指经过这个时间步长确实有一些地方（面积）的太阳能强度变大或者变小了。既然这个转移矩阵恰好使原分布函数在一次转移中没有变化，而且由于转移矩阵本身不变化，那么分布函数进行多次转移（矩阵乘法）以后依然是原来的样子。即分布函数在多次转移过程中保持不变化。确实每经过一个时间步长，总有一些地方从黑夜变成了白天，总有一些地方太阳从最高的位置落下来一些。但是不同太阳能强度所笼罩的面积却是变化中保持不变，这是一种动态的平衡。太阳能强度的转移矩阵就是保证它在变化中维持原比例的一套变化系数（变化速度）。 3. 均匀分布具有稳定性要求的转移矩阵是各个状态（相格）的前后转移比例相同！可以说我们获得的太阳能强度的转移矩阵是具有很大的实验、凑合的成分。这种凑合的成功似乎告诉我们，一个保持动态平衡的均匀分布（指某气象变量在某气象场中），需要一个转移速度相同（指各个状态，相格）的转移矩阵。即均匀分布（概率论语言）要求的转移矩阵是各个状态（相格）的前后转移比例相同！转移矩阵的主对角线两侧的元素值在各行中相同。这是普遍关系吗？对此我们在后面再展开一些数学讨论。 4. 一个时间步长究竟有多长前面讨论太阳能强度的转移矩阵中没有明确一个时间步长究竟有多长。但是我们在19讲中提及一个时间步长可以使某太阳能强度状态变化2.5%（表中的0.025）。而“2.5%”无形中也提示了求得一个时间步长的线索。我们知道在春分和秋分日，太阳直射地球赤道。于是地球各地都是12小时白天12小时黑夜。即在春分、秋分日，全球各地的太阳能强度是24小时改变了100% 。据此，前面我们规定的转移矩阵中的太阳能强度改变2.5%是一个时间步长。这也就说明一个时间步长是一天的1/40之一。一天的40分之一是多少时间？是36分钟(其他场合的时间步长需要另外分析)。所以我们在太阳能强度转移矩阵中我们所人为规定的世界步长在春分、秋分日对应着36分钟。这样我们就初步解决了一年中的2个日子（春分、秋分日）的太阳能强度转移矩阵的时间步长具体长度问题。不难分析春分、秋分日也是太阳能强度变化最快的时候，在不是春分或者秋分的其他时节，24小时的时间长度不能使全球100%面积都发生过太阳能强度的变化。假设太阳一直是直射北极（这个设想在天文学看来过分了一些），那么尽管地球24小时依然旋转一周，但是各地的太阳高度却没有变化。此时地球上的太阳能强度的分布函数与现在相同，但是地球上的任何地方看到的太阳高度却是常年不变化的（太阳在天空的方向可以变化），于是各地的太阳能强度也是全年不变化的。也就是说此时的太阳能强度分布函数与现在相同，但是太阳能强度就没有向临近状态（太阳升高、降低）的转移情况了。换句话说太阳如果全年直射北极（或者南极），太阳能强度转移矩阵的主对角线的各个元素的值则都是1，而其左右的值都是0。或者说此时全球的太阳能强度的转移矩阵的转移速度慢到了等于0的程度（转移速度=0）。。我们知道在春秋分日，太阳的赤纬值δ是0。在夏至日，它是22.5度。在冬至日是-22.5度，而在我们设想的太阳位于北极或者南极时它是90，-90度。考虑到δ=0的时刻转移矩阵的转移速度最快，δ=90，-90度时转移速度慢到了=0，笔者猜测其转移速度与cosδ应当成正比例 ,( 这个猜想是首次提出，它有待进一步证实或者否定）。这就是说，把19讲的转移矩阵中的原先的0.025，修改为0.025cosδ就是一个步长（36分钟）的面积转移百分比（转移速度）。这里的δ是当天的太阳赤纬值。而对角线上的元素值是1-0.05cosδ. 我们在天文书籍上可以获得每天的赤纬值，于是我们也就知道了一年中每天的太阳能强度的转移矩阵的转移速度了。照此计算，在冬至、夏至日，太阳能强度的转移速度最慢。过去我们含糊地说太阳能是地球气候状况和天气变化的原因。但是太阳能的多少显然决定着地球的冷暖程度。但是气候的年变化、天气的日变化的速度与规模则应当与太阳能强度的变化速度有关。在19讲中给出的太阳能强度的转移矩阵就体现了各地太阳能强度的变化速度。而太阳能强度的转移矩阵的一个时间步长的具体长度随日期的变化也是理解气候与天气变化的环节。这些知识的揭露是否可以补充到现在时髦的气候变化模型中？这留给有关研究人员考虑吧。

个人分类: （熵+统计）气象学|3268 次阅读|0 个评论

太阳能强度的分布函数和转移矩阵.1--《气象随机场-19》

zhangxw 2014-8-17 11:20

太阳能强度的分布函数和转移矩阵.1-- 《气象随机场 -19 》张学文， 2014,8.13-17 气象学承认太阳能是气象变化的根源。可理论气象学在介绍大气的运动、变化时却主要是谈流体力学的方程、质量守恒方程等等，而使用所谓绝热假设把难处理的每天太阳能的具体作用忽略。而在气候学中对太阳辐射则基本给出一个太阳高度的天文学公式，再加一些说明与推导，好像关于太阳能的气象知识已经分析完了。至于这些知识如何与大气的运动方程组结合起来，则没有再去探索。气象变量在气象场中的分布函数概念与其转移矩阵概念的引入。似乎为我们找到了把太阳能强度的变化规律与天气变化规律的统一起来的技术途径。现在我们就把（1）太阳能强度在气象场上的分布函数分析一番，并且（2）分析其转移矩阵的特征。（ 1 ）太阳能强度在气象场上的分布函数分析作者先前单独分析过太阳能强度的分布函数，见天文气候中的两个分布函数沙漠与绿洲气象 2008 年 5 期 2 卷 11-14 页。以及本讲座的之 5 ， http://blog.sciencenet.cn/blog-2024-808108.html 。在哪里我们获得任何时刻的大气顶所收到的太阳能强度与其占有的地球面积的关系如下图（也是 ” 之 5” 中的图 2 ）。该图给出了任何一个时刻，不同强度的太阳能分别占了全球的多少面积。在图中我们把相对的太阳能强度离散化为11个区间（相格），没有太阳辐射时的太阳辐射强度=0的情况单独为一种状态，而且它总是占有地球总的表面积的50%。而辐射强度为太阳常数(它等于1367瓦/平方米)的1/10,2/10,3/10…10/10者所笼罩的全球相对面积分别是全球总面积的5%。这个关系是基于天文知识而求得的。它在任何时刻都是对的。如果不考虑没有太阳的夜间部分，那么我们可以说白天的太阳能呈均匀分布。或者说在有太阳的半球，不同能量的太阳辐射能所笼罩的地球面积都是(竟然)是相同的。这个关系对应一年四季的任何一天的任何时刻都是对的。以上的天文学分析无形中告诉我们：全球太阳能强度的分布函数（不同太阳能占有的相对面积）竟然是不随时间而变化的。（2）全球太阳能强度转移矩阵在认识了太阳能的分布函数的这个特征以后，我们再分析它的转移矩阵问题。即分析具有不同的太阳能强度的地方(当地) 经过了一段时间以后其太阳能强度的变化情况。白天我们在地球上总是可以看到太阳高度和太阳能强度的变化。在有日射的半球上，太阳能的强度是变化着的。这种变化反映到气象场（有太阳的半球）中的太阳能强度分布函数固然没有变化，但是它对应的转移矩阵的有关元素(转移的速度)却不全为零。现在的任务是探索太阳能强度的转移矩阵是什么。我们固然不能凭空去猜太阳能强度的转移矩阵，但是我们已经有了两个重要提示：一是，太阳能的分布函数总是不变的。另外一个是太阳能强度大于0时，太阳能强度的笼罩面积是均匀分布。这两个重要特征也给了我们解决转移矩阵是什么问题重要提示。另外，根据前面的讨论、设定和太阳能的变化是连续型的变化，如果把转移矩阵所对应的时间间隔(步长)是相当短的，那么太阳能强度的状态在一步状态转移中就只可能留在原状态相格内，或者转移到相邻的状态（相格）内。而不会跳到不相邻的相格中去. 据此容易看到，在转移矩阵是11阶的情况下，它的11×11=121个元素值中就应当有90个元素是0。即这个矩阵中只有31个元素的值不为0。这31个元素包括矩阵主对角线上的11个元素以及它左右两侧的各10个数据。考虑到分布函数的函数值是相同的（在太阳能强度大于0的部分），一个合理的猜想是主对角线两侧的数（状态转移速度）应当是相等的。这表明转移矩阵的各个元素值中除了90个为0以外，还有10个数据与另外的10个相同。我们在向求得转移矩阵的方向前进！考虑到这个矩阵是转移矩阵，即它的每一行的各个元素值的合计值显然应当等于1，即在转变中太阳能不增加也不减少。所以11行的矩阵应当有11个合计值=1的方程。这对应着我们的未知数又减少了11个。另外基于太阳能强度主要是均匀分布的特征，不同状态(相格)中的太阳能确定在相同的时间间隔内的转移量很可能也是相同的(各行的对应转移率)。这样我们求的转移矩阵就又出现了一些相等的元素。注意我们强调过转移矩阵涉及的时间间隔应当是相当小的，这用以保证在一步转移时，太阳能状态（强度）最多只能移到它的临近的状态（相格）。而究竟什么是相当小，并没有明确规定。言外之意就是我们可以自行规定一个时间步长，或者说规定一个（也算标准化,不是多个）合适的转移速度。在这些初步解释下，我们一般是规定转移矩阵的第2行第2列的元素为人为给定值。即它不是未知数，而是规定的。在本问题中我们规定该元素的值是0.95。即第2个太阳能强度状态（相格）在一个时间步长中依然维持原状态（留在原相格）的百分比是95%。根据以上的一些考虑。我们获得的一个全球（气象场）太阳能强度的转移矩阵如下。全球气象场中太阳能强度为不同值时,经过一个时间步长以后,当地太阳能强度(左边状态)转移到其他状态者(表的最上端状态)占有的比例(相等面积)表.表中灰色部分就是转移矩阵. 太阳能强度夜,0 0.05 0.15 0.25 0.35 0.45 0.55 0.65 0.75 0.85 0.95 夜,0 0.9975 0.0025 0 0 0 0 0 0 0 0 0 0.05 0.025 0.95 0.025 0 0 0 0 0 0 0 0 0.15 0 0.025 0.95 0.025 0 0 0 0 0 0 0 0.25 0 0 0.025 0.95 0.025 0 0 0 0 0 0 0.35 0 0 0 0.025 0.95 0.025 0 0 0 0 0 0.45 0 0 0 0 0.025 0.95 0.025 0 0 0 0 0.55 0 0 0 0 0 0.025 0.95 0.025 0 0 0 0.65 0 0 0 0 0 0 0.025 0.95 0.025 0 0 0.75 0 0 0 0 0 0 0 0.025 0.95 0.025 0 0.85 0 0 0 0 0 0 0 0 0.025 0.95 0.025 0.95 0 0 0 0 0 0 0 0 0 0.025 0.975 用这个转移矩阵去乘以当前的太阳能强度分布函数会获得什么?它的物理意义/气象意义是什么？这个时间步长究竟是多长？我们是否应当把这些进一步公式化一下？…这些都是接下来要讨论的事。但是，鉴于本讲已经比较长了，现在我们暂停讨论，读者也可以在这个表目前思考有关问题。

个人分类: （熵+统计）气象学|3162 次阅读|0 个评论

用转移矩阵做预告.2--《气象随机场-18》

zhangxw 2014-8-12 17:27

用转移矩阵做预告.2-- 《气象随机场 -18 》张学文， 2014,8.9-12 上一讲, http://blog.sciencenet.cn/blog-2024-818321.html 我们主要是讨论了用现在时刻的某气象变量在气象场上的分布函数和关于该变量和该气象场的转移矩阵去预告一个（以致多个）时间步长以后的分布函数问题。我们通过给出的例子说明这种运算以及经过成百上千个时间步长以后的分布函数的变化情况。本讲则继续讨论这种矩阵乘法计算的性质、意义、问题等等。前面的计算例子是在运算开始时假设了该气象场内的各个元面积（或者说各个气象站）的天空状态都是阴天状态，并且以此为出发点而开始逐步推求下一个时间步长的分布函数的。人们自然有一个问题，即如果起始时刻的分布函数不同，对后面的运算结果会是什么？我们的回答是开始时刻的分布函数不同会影响最近阶段的预报结果，但是在时间充分长了以后（多次迭代计算以后），初始时刻的气象状态就对未来情况没有影响了。或者说无论初始时刻的分布函数是什么，经过充分长的状态转移计算，其预报的分布函数就不再随时间而变化了。下面的计算结果表就是两个例子，那里的转移矩阵的含义、数值与上一讲的转移矩阵相同，但是最初的分布函数函数分布为两个极端情况：全气象场各地都是下暴雨、或者全是晴天。我们依然按照前面介绍的方法逐步进行分布函数与转移矩阵的乘法，从而获得了下面的多步（多个时间步长）转移以后的天空状态分布（不同天气在气象场中占有权重、百分比）。用前面的转移矩阵和初始天空状态全部是晴天去计算随后M个步长以后的各种天空状态在气象场中占有的百分比(占有的相对面积) 晴阴小雨中雨暴雨开始时的相对面积 1 0 0 0 0 N=1 0.985 0.015 0 0 0 N=2 0.970525 0.029325 0.00015 0 0 N=3 0.956554 0.043008 0.000437 1.5E-06 0 N=4 0.943065 0.056079 0.00085 5.78E-06 1.5E-08 N=5 0.930041 0.068568 0.001377 1.39E-05 7.16E-08 N=10 0.871253 0.123209 0.005396 0.00014 2.4E-06 N=15 0.821595 0.166926 0.011021 0.000446 1.25E-05 N=20 0.779439 0.20204 0.017542 0.000944 3.58E-05 N=50 0.625959 0.309709 0.057251 0.006561 0.00052 N=100 0.533733 0.352328 0.09618 0.016015 0.001745 N=200 0.493003 0.36341 0.117788 0.022978 0.002822 N=500 0.486344 0.364737 0.121568 0.024312 0.003039 N=1000 0.486322 0.364742 0.121581 0.024316 0.00304 用前面的转移矩阵和初始天空状态全部是暴雨去计算随后M个步长以后的各种天空状态在气象场中占有的百分比(占有的相对面积) 晴阴小雨中雨暴雨开始时的相对面积 0 0 0 0 1 N=1 0 0 0 0.08 0.92 N=2 0 0 0.004 0.1488 0.8472 N=3 0 0.00012 0.01128 0.207688 0.780912 N=4 2.4E-06 0.000455 0.021214 0.257812 0.720516 N=5 1.15E-05 0.001078 0.033261 0.300197 0.665453 N=10 0.000384 0.009933 0.110891 0.424672 0.45412 N=20 0.005721 0.056911 0.264439 0.443853 0.229076 N=50 0.083174 0.254548 0.384464 0.225517 0.052297 N=100 0.279163 0.373941 0.252363 0.081163 0.013371 N=200 0.451483 0.370905 0.141739 0.031627 0.004247 N=500 0.486205 0.364764 0.121648 0.02434 0.003043 N=1000 0.486322 0.364742 0.121581 0.024316 0.00304 通过这两个表我们看到转移的最初几步不同天气占有的比例逐步从晴天、暴雨状态扩散开。而在经过上百次状态转移（上百次的矩阵乘法）以后，不同天空状态占有的百分比不仅几乎没有新变化了，而且不同天空状态占有的百分比，无论最初全部暴雨是晴天、或者是阴天，结局都是相同的。这个结果的一般含义是：这种转移矩阵的气象预报方法不会随着预报时间的拉长而胡言乱语，而是给你一个平稳的气候平均比例分配，尽管它已经没有什么预报价值。--所以，我们不要过分看重它的预报价值而要先探索这种统计做法的物理-气象意义。以上的分析也可以用数学公式、数学语言来表达。它们涉及概率论中的马尔科夫过程的性质、矩阵的乘法等等我们这里就不一一列出了。以上的计算显然依赖转移矩阵是不随时间而变化的这样一个认定。从气象角度看，我们论及的气象场的面积如果越小。其转移矩阵就越是难以稳定。因为过分小的区域的天气变化会受到区域外的气象状况影响。反之，如果我们讨论的气象场的面积就是全球这种转移矩阵反而越是稳定。所以我们一般把这种预报看做是关于全球气象状况的预报。或者说全球气象体现着这种统计规律（转移矩阵稳定）。以上的做法显然不仅可以用到天空状态这个对象上，空气的温度、压力、湿度、风速、风向都可以。当然这些都有待进一步的验证和分析。

个人分类: （熵+统计）气象学|2809 次阅读|0 个评论

状态转移矩阵初议-《气象随机场的分布函数及其转移矩阵-15》

zhangxw 2014-7-30 11:46

状态转移矩阵初议 - 《气象随机场的分布函数及其转移矩阵 -15 》张学文， 2014,7,26-30 本讲初步讨论关于各种气象随机场的转移矩阵的一些认识 1. 从气象场资料获得气象随机场的转移矩阵上一讲实际上我们已经介绍了，只要你把分析的气象变量（如温度，压力，等等）的取值范围适当地离散化为有限个（ k 个）相格，并且有两个相近时刻的统一的气象场的气象变量的数据（如两张时间差 1 小时的中国区域的温度分布图），就可以经过统计分析而获得这个变量的气象场的状态变化的转移矩阵（ k × k 方阵）。气象工作者拥有的此类数据太多了 , 这是个新的统计气象分析园地。 2. 全球大气压力的转移矩阵的例子下面给的是一个理想的例子（它与实际有多少差别请大家核定），它分析的气象变量是大气压力，分析的范围是全球大气从地面到大气上界这个立体的气象场。假设我们具有 24 小时间隔的两个全球大气压力的数据（即这个空间内的每一质量相等的空气微团的压力 , 实际上经常有的资料是各个经纬度格点），并且把这些大气压力数据仅粗线条地分为 10 个相格（可分辨状态）。这样我们就有了（从资料中统计分析出）下面的全球大气压力转移矩阵。全球大气压力的24小时的变化，即空气微团从初始气压值变成（24小时）各种状态（气压值，相格）的比率（等价于概率、百分比）表。一天以后该位置处的空气微团的气压状态 0-100 100-200 200-300 300-400 400-500 500-600 600-700 700-800 800-950 ９00-1050 空气微团初始的气压状态（hPa） 0-100 0.99 0.01 0 0 0 0 0 0 0 0 100-200 .005 0.99 .005 0 0 0 0 0 0 0 200-300 0 .005 0.99 .005 0 0 0 0 0 0 300-400 0 0 .005 0.99 .005 0 0 0 0 0 400-500 0 0 0 .005 0.99 .005 0 0 0 0 500-600 0 0 0 0 .005 0.99 .005 0 0 0 600-700 0 0 0 0 0 .005 0.99 .005 0 0 700-800 0 0 0 0 0 0 .005 0.99 .005 0 800-900 0 0 0 0 0 0 0 .005 0.99 .005 900-1050 0 0 2 0 0 0 0 0 0 0.01 0.99 （注：表的上方用了下面的字样：一天以后该位置处的空气微团的气压状态，即我们所谓的空气微团的压力的变化，其实是指该几何位置的空气微团气压的24小时的变化，这对应流体力学中所谓的局地变化，而不是空气微团个体的变化。它并不跟踪24小时前的空气微团的现在状态。我们后面的全部计算都是这样，这在统计上是可操作。如果跟踪原始的空气微团在技术上几乎是不可能的）这个假想的表是把全球（包括地面到高空）各处的空气微团的两天的气压值作为统计原始对象而统计出来的。它给出空气微团从表的左侧的气压值范围（相格）在24小时以后转变为表的上方给的气压状态占空气微团数量的比率。例如它说明一个空气微团如果第一天的压力是530百帕，那么24小时以后它依然是在原状态（压力在500-600百帕这个相格内）的比例很高，达到了99%，而仅有1%的机会转变到相邻的气压区间（相格）。这个全球大气压力的转移矩阵显然还告诉我们在24小时内任何空气微团的气压变化大于200百帕（两个相格）的情况是不存在的。于是转移矩阵的多数的元素的值是零。 3. 用转移矩阵可以计算下一个时刻的分布函数我们前面强调转移矩阵是通过两个相邻的时刻的气象场做一番对应的统计而获得的。如果我们认可它就是两个时刻的分布函数的变化规律（这个话隐含了它在各个时刻都是对的），这也就提示可以利用它从现在的分布函数计算下一个时刻的分布函数。试想现在有20000个空气微团（空气质量单元）的气压在500-600百帕之间。那么下一个时刻这些空气微团依然是在500-600百帕的数量应当根据转移矩阵中的对应值0.99乘以20000，它应当是19800.并且依然根据转移矩阵表有100个空气微团（0.005*20000=100）转入了600-700百帕相格，还有100个原先是500-600百帕数据点则转入了400-500百帕的相格中。而转入其他相格的空气微团（数据点）是没有的。显然当我们知道了现在的气象场中处于各个相格的空气微团数量以及变量状态的转移矩阵以后，我们就可以计算出下一时刻的空气微团在各个相格中的数量，或者说这就获得了下一个时刻的气象场中该变量的分布函数。以上的计算过程也许可以简练地用如下公式表达 F 1 M = F 2 这里的 M 是前面介绍的转移矩阵。而 F 1 、 F 2 分别表示两个矢量，它们代表离散化的分布函数的各个离散值。前面已经指出我们对于本来应当用连续变量（实数）表示气象变量一事采取了离散化的处理，并且值离散值是有限个。在这种情况下，它的分布函数值也就就是有限个离散值。基于此，我们也可以把离散状态的分布函数的各个值统一看作是一个矢量的对应分量。这样我们就在离散化、用矢量表达离散化的分布函数值、存在转移矩阵的背景下，把对下一个时刻的分布函数的求算，变成了把现在的分布函数矢量与转移矩阵的乘法计算。 4. 各种气象场的状态转移矩阵是否具有时间稳定性是重要问题根据前面的初步分析如果我们在时刻都在变化的天气中找到了关于某变量的气象场的分布函数的转移矩阵变量具有稳定性，它就可以用于分布函数的预报。所以转移矩阵的稳定性是个重要问题。另外，转移矩阵的概念清楚，也没有人说它不能从理论角度可以通过推导而获得理论结果。所以从理论上探索转移矩阵及其稳定性也是一个环节。 5. 把气象变化问题变成一个转移矩阵有利于相关知识的引入科学地提出问题有时解决问题更重要，我们把气象场的分布函数的变化问题具体化为对一种特定的矩阵的讨论。这就为引入线性代数、随机过程理论等等理论提供了技术桥梁。后面我们要逐步利用这些思维工具，讨论气象场的变化问题。

个人分类: （熵+统计）气象学|4274 次阅读|0 个评论

《气象随机场的分布函数及其转移矩阵》-（之0：开场白）

热度 1 zhangxw 2014-6-22 15:47

《气象随机场的分布函数及其转移矩阵》 - （之 0 ：开场白）张学文， 2014/6/20 -22 最近我打算就《气象随机场的分布函数及其转移矩阵》这个主题写个连载。它是以一本书为目标的试笔。它是对过去我们写《熵气象学》的继承，我觉得也是关于统计气象的一种发展。《气象随机场的分布函数及其转移矩阵》这个标题本身就突出三点：气象学里的随机场、分布函数和转移矩阵。随机场、分布函数、转移矩阵，这三个词显然是我们想突出的要点。它们都是统计学的词汇，它们有密切联系，又是体现、分析气象状态的变化的一种工具。而且它具有理论高度，并且为理解、认识大气的变化提供了一种新的视角。气象随机场：单点（一个气象站）的气象变化是人们对气象的直接感受。但是它仅是地球的大气状态的很小的一部分。我们这里所谓的气象随机场就是一个远比单点的气象复杂的区域气象状态的一种数学抽象概括。这里的随机二字与概率论、统计数学里的“随机”二字是一个含义。这里的“场”字确实是指地球的某一块空间，而不是单点。这个空间可以是例如全中国面积，全亚洲、全北半球以致全球，这个空间可以是指从地面到高空，也可是单指某等压面上的区域。所以“气象随机场”就是指把某区域（场）的气象要素的具体数值看作是随机变量们组成的随机场。也可以这样说：气象领域的各种天气图、气候图、剖面图都是我们现在的气象随机场的特例、个例。或者说这里是对天气图的一种统计、概率角度的系统分析。分布函数某特定的气象变量值 x 当时占了该气象随机场的总容量（面积、体积、质量）的百分比如果是 y ，那么 x,y 的关系就是这个随机场的相对分布函数。不同雨量所笼罩的全国总面积的百分比与雨量的关系就是一例，不同温度占有了全国面积的百分比也是例子。过去的熵气象学里就大致列举过 30 类气象分布函数。每一张天气图都对应这一个（或者数个）随机场的分布函数。天气图的情况随时间的变化，它的分布函数也会变化。气象随机场的分布函数在单位时间的气候（一般）变化规律，我们以一个转移矩阵表示。我们要在讨论各种气象随机场的分布函数的基础上，进而利用分布函数的稳定性引出对应的转移矩阵。转移矩阵这是我比较冒险的一个想法（也可能在写的过程中宣布失败），即利用气象分布函数具有的时间准稳定性，反推出对应的离散马尔科夫过程中的类似的气象状态的转移矩阵。这个矩阵有能力对下一个 ( N 个 ) 时刻的分布函数做预报。做预报显然是十分可贵的特点，但是它不是对天气图（随机场）本身做预报，而仅是对其分布函数做预报。这样我们就在动力学之外，为分析气象场的状态及其变化引出了一个统计学思路、原理与技术。以上就是随后逐步展开的讨论的一个提要式的概括，算开场白吧。 ****** 从2014.8.4开始这个系列的总名称简化为“气象随机场”。2014.8.10注

个人分类: （熵+统计）气象学|2218 次阅读|2 个评论

水分循环有马尔科夫性质?！(10)-对转移矩阵数据的分析

zhangxw 2014-1-9 16:53

水分循环有马尔科夫性质 ? ！ (10)- 对转移矩阵数据的分析张学文， 2014/1/5-9 1. 前面谈及这个水分循环模型是符合马尔科夫过程所具有的特征的。对此不再多做说明 , 大家还可以参考有关马尔科夫的文献。下面我们讨论水分循环的转移矩阵中的 9 个转移系数（概率）如何从已经有的地理气象知识中求得的问题（前面表 5 中的数据仅是初步分析或者说随便设定的）。 2. 表 5 中给的 9 个数据中，其每行的三个转移系数的合计值都是 1 ，这在物理上保证了地球总水体数量在循环过程中只有转移但是没有减少，也没有增加。所以这 9 个数值满足前面给的公式（ 1 ）、（ 2 ）、（ 3 ）。即公式（ 1 ）、（ 2 ）、（ 3 ）已经帮助我们把 9 个未知数中的三个的问题解决了。我们还需要再寻找 6 个有关的约束公式，以与这三个公式共同确定 9 个未知数。 3. 表 3 中给出的海洋水变成陆地水的比率 C ol =0 ，这体现了地理学告诉我们海水是不能直接倒灌到陆地的。这样我们又知道了一个未知数 C ol , 它的值是 0 。这可以写为： C ol =0 （ 8 ） 4. 另外空中水转变为空中水的转移系数也是零，即 C aa =0 。它说明我们规定的一步转移的时间长度大约与空中水全部变成降水而落地所需要的时间相同。而气象学知识指出，这大约是 9-10 天空中水经受一次替换。所以我们规定 C aa =0 ，也就使一步转移所需要的时间的长度明朗了一层。而这又消除了一个未知数。于是有公式（ 9 ）： C aa =0 （ 9 ） 5. 前面的分析包含了 5 个约束，这意味着在转移系数一共有 9 个数中我们已经确定了其中的 5 个。我们还需要设法再找出 4 个约束关系，以推测另外 4 个未知数的值。 6. 我们还知道海洋上的降水比陆地大，这对应于空中水转化为海洋水的比例高于转化为陆地水的比率。根据表 4 中的陆地 / 海洋的流的数据 , 我们知道海洋与陆地的降水量的比例是（ 385/496 ）：（ 111/496 ）。即 0.776 ： 0.224. 考虑到前面指出 C aa =0, 以及公式 C ao +C al +C aa =1, 所以： C ao =0.776 （ 10 ） C al =0.224 （ 11 ） 7. 再就是地理气象学告诉我们，从陆地流入海洋的水分 ( 河水以及地下水 ) 小于陆地蒸发的水分，它们联系着矩阵中陆地水转变为海水的权重 ( 比率 ) 要小于陆地水蒸发为空中水的比率。根据表 4 每年的陆地水入海总水量 39700 km 3 /a, 而陆地的蒸发量是 71000 km 3 /a. 所以陆地的入海水量与蒸发水量的比例是397:710,即 C lo :C la =397:710 ，这写为公式（ 12 ）： C lo /C la =397/710 （ 12 ） 8. 现在再考虑海洋水分的出路 , 由于海水不能倒灌到陆地 , 所以海水只能保持是海洋或者蒸发进入大气 . 表 4 给出了海洋的蒸发量是 425000 km 3 /a , 而根据表 4 , 海洋的总水量是 1350000000 km 3 /a , 所以每年海水转化为空中水的比率是 425000/1350000000, 即 0.000315 。或者说每年只有万分之 3.15 的海水蒸发进入空中。 9. 现在的问题是我们是否可以把每年海水转化为空中水的比率是 425000/1350000000 或者说 0.000315 看作是水分循环一步转移的比例。由于我们已经知道空中水大约一年循环 40 次，所以 0.000315 是大约 40 次的水分循环海水给予空中水的比例，而不是一次循环给予空中的水量。注意到前面我们讨论的一次的大体含义是空中水全面更换一次的含义，以上 0.000315 被 40 除，才具有我们的转移矩阵中的 C oa /C oo 的意义。即： C oa /C oo =0.000315 /40= 0.000007875 （ 13 ） 10. 现在我们分析公式（ 1 ），即 C oo +C ol +C oa =1 。由于 C ol =0 ，所以 : C oo +C oa =1 (14) 11. 联立公式 (13),(14), 我们获得 : C oo =0.999992125 (15) C oa =0.000007875 (16) 根据表 4, 我们知道陆地的总水量是 35977800 km 3 /a , 也知道每年的入海水量是 39700 km 3 /a 以及每年水分循环大约是40次,所以名次水分循环中陆地水进入海洋的比例应当是 39700 /( 35977800 ×40),它等于 0.000027586 , 于是有公式 (17) ： C lo =0.000027586 (17) 根据公式 (17) 以及公式 (12) :C lo /C la =397/710 和公式 (2):C lo +C ll +C la =1, 我们又得到两个系数的值 : C la =0.00004934 (18) C ll =1-0.00004934-0.000027586=0.999923074 (19) 12. 好了 , 我们通过对地理气象知识的分析 , 在表 4 给的数据的基础上 , 几乎是求得了水分循环的转移矩阵的所有转移系数 , 或者说转移概率。表 9 根据表 4 等数据推算的一次水分循环中的对应转移矩阵数据（含符合和公式号码）海水陆地水空中水海水 C oo =0.999992125 (15) C ol =0 （ 8 ） C oa =0.000007875 (16) 陆地水 C lo =0.000027586 (17) C ll =0.999923074 (19) C la =0.00004934 (18) 空中水 C ao =0.776 （ 10 ） C al =0.224 （ 11 ） C aa =0 （ 9 ） 13. 好了，退休一下。余下的讨论后面再谈。

个人分类: 空中水科学|3062 次阅读|0 个评论

对偶谢尔宾斯基分形概率转移矩阵的特征值谱及其应用

热度 5 Fudanzhangzz 2012-7-15 11:16

对偶谢尔宾斯基分形概率转移矩阵的特征值谱及其应用伍顺琪　章忠志摘要：网络概率转移矩阵的特征值谱，包含了网络许多重要的结构性质，同时也与网路的众多动力学行为密切相关。本文研究了 d 维对偶谢尔宾斯基分形（即汉诺塔图）的概率转移矩阵。通过重整化群的方法，得到了该类分形的所有特征值及其重数。在此基础上，进一步根据所得的特征值，求得了此类分形网络的生成树数目以及网络上随机游走特征时间的解析表达式。相关结果已在《 Journal of Physics A 》正式发表。文章发表的 PDF 版本： Eigenvalue spectrum of transition matrix of dual Sierpinski gaskets and its appl.pdf

6172 次阅读|6 个评论

一个简单的马尔可夫链

热度 2 zjlcas 2011-12-1 15:04

一个简单的马尔可夫链在一个随机过程中，如果事件发生概率在t时刻所处的状态为已知时，它在t + 1时刻只与t时刻的状态有关，而与之前所处的状态无关，则称该过程具有马尔可夫性。时间和状态都是离散的马尔可夫过程称为马尔可夫链。马尔可夫链在经济学，社会学，生命科学领域有着广泛的应用。这里举例说明。例子：姜华平、陈海泳对某城市2002年居民出行方式所占比例进行了调查。结果如下公交车bus,自行车Bicycle,步行walk,其他other 19%, 14%, 56%, 11% 本时期各出行方式转移概率如下表(%) bus bicycle walk other Bus 90 4 2 4 bicycle 7 86 1 6 walk 8 7 80 5 other 10 2 3 85 假设该城市居民每天出行总人数为468万人次，出行人数不变，各出行方式的转移概率也不变，问题：（1）预测2006年该城市乘公交出行的人数（2）经历足够长的时间，求出行方式的比例是多少？解： ## 分析：这是一个时间齐次马尔科夫过程，可根据转移矩阵的初始定义进行推断 ## 第一问 ## 根据题目写出转移矩阵 T - matrix ( c ( 90 , 4 , 2 , 4 , 7 , 86 , 1 , 6 , 8 , 7 , 80 , 5 , 10 , 2 , 3 , 85 )/ 100 , nrow = 4 , ncol = 4 , byrow = TRUE ) # 初始矩阵 p - matrix ( c ( 19 , 14 , 56 , 11 )/ 100 , nrow = 1 , ncol = 4 , byrow = TRUE ) ## 下一年的概率应该为当年分配概率和转移矩阵的乘积 ## 2003 p1 - p %*% T ## 2004 p2 - p1 %*% T ## 2005 p3 - p2 %*% T ## 2006 p4 - p3 %*% T ## 2006 年乘坐公交车出行的总人数应为 res - 468 * p4 ## 第二问，用计算机模拟的方法，通过对转移矩阵的平衡状态近似求解 ## 初始化一个空向量 s - c () ## 假设一个人在初始时刻选择 1 公交车出行 s - 1 ## 则其在 t1 时刻选择任何一种出行方式的概率如下 T , ] ## 但是他选择的出行方式可以是随机的，故用 sample 按照前一个状态的概率，随机抽取一次 res - sample ( 1 : 4 , size = 1 , prob = T , ]) ## 抽取的结果，就是 t1 时的状态 ## 而 t2 时的状态只受到 t1 时状态的影响，因此又回到 T ,] ，至此完成一次模拟 ## 每一次抽样都是只受到前一次抽样的影响 for ( j in 2 : 50000 ) s - sample ( 1 : 4 , size = 1 , prob = T , ]) ## 在进行多次模拟后，马尔可夫链逐渐收敛。 ### 模拟 50000 代的概率分配如下 res - table ( s )/ 50000 names ( res ) - c ( "bus" , "bicycle" , "walk" , "other" ) ## 题外 ##### 无论假设 s = 1,2,3 还是 4 ，进行多次模拟后，所得的结果是非常接近的。这也表明，马尔可夫过程的平衡状态与初始值无关。

个人分类: 统计分析|27337 次阅读|5 个评论

开博说明(英)

TUGJAYZHAB 2010-1-20 02:46

My professional goals and experiences for the blog. I would like to open a web forum to discuss Chinese Ecosystem Research Network (CERN) Data Analysis and possibly develop this into a graduate level seminar/course. CERN data supposed to be three-subscript data: they comprise numerous samples, multiple variables, and repeated collections, that is D (i,j,k) , i=1,2,m, j=1,2,n, and k=1,2,o . I have extensive experience with these three-subscript data and designed a model, so called Multi-Dimensional Sphere Model, MDSM,specifically for analyzing these data. The forum/seminar would contain two parts. The first part of the forum will discuss the application of clustering analysis using cosine values as similarity coefficients. After the clustering analysis, the CERN three-subscript data would be converted into two-subscript data, D (i,k) , i=1,2,m, k=1,2,o . These two-subscript data can be considered as multi-component vector ( m -vector) time series. The second part of the forum/seminar would consider the temporal dynamic analysis for the m -vector time series. The temporal dynamic analysis would include Trend Analysis to discover the changing trends of the CERN data. After the trends were discovered, they would be used to Project the future states; furthermore, the projection would be updated by actual sampling using the so called Kalman Filter (Jameson, 1993); and the prediction error would be estimated. This whole procedure needs to be further tested with CERN data and to be published. However, this System Monitoring and Trend Analysis can be conducted using stock market data, asthe stock market data is a m -vecot time series too. My second professional goal is to organize/write a text book entitled Vegetation Sciences and Vector Analysis aimed at students whose majors are in Forestry, Rangelands, Ecology, Computer Science, and Quantitative Ecology. Vegetation is the primary producer and main body of the ecosystem, as it accounts for about 90% of the biomass of the ecosystem. Based on my research experiences, the vegetation can be considered as a resource sharing, exponential growth, time succession, multi-components system, and defined as m -system. An m -system can be expressed as an m -vector, an identity in multi-species space, m- space. A vector has both magnitude and direction. The magnitude expresses the amount of the m -system, such as biomass, energy, and the information, while the direction expresses the composition of the m -system, i.e., how the biomass, the energy, and the information are distributed among the different species. The m -vector analysis extends the traditional 3 -vector analysis to multi-dimension, and defined m -vector division (Bai, et. al., 1997) so that it can analyze exponential growth, as well as linear growth. The composition changes of an m -system can be imagined as rotation of an m -vector in m -space. The exciting aspect of these analyses is that the results can be projected on to a two dimensional plane and visually shown to students. With research colleagues from different fields, I would like to organize a research institute (hyper-bang) for the m -system approach. Presently, I have explored two fields that can adopt the m -system approach. The two are vegetation and the financial market. This research institute may include professionals from, but not limited to, Math, Computer Science, Geography, Forestry, Grasslands, Economy, and Finance. My third professional goal is to design a mathematically sound and easily accessed stock market index, for example, vector length, in addition to the existing old indices. My blog is entitled as m -Vector, m -Space, and m -System Monitoring. This blog and my service could greatly support and advance the Math, Ecology, Finance, and Economy, as well as the this ScienceNet. Information in ecology IS NOT one dimensional. Thus, a one dimensional real number, a scalar, may not be enough to fully explain our multi-component ecosystems. While studying ecosystems, we must explicitly treat them as systems, instead of a bunch of single variables. Thus, we may have to extend our view from one dimensional axis to multi-dimensional space, m -space, and to extend our research tools from scalars to multi-component vectors, m -vectors. In this blog I believe my articles would offer a view to analyze those inter-correlated and auto-correlated variables while they form a resource sharing, exponential growth, time succession, multi-component system, m -system. CERN, has functioned for many years, and has the goal of promoting temporal dynamic analysis to predict future states of the environment. However, discussions with my academic advisors, including later Academician Bo Li from the Chinese Academy , Prof. Song-ling Zhao at University of Lanzhou , and Dr. Donald Jameson at Colorado State University has convinced me that for ecological data the matrix inverse, or pseudo inverse, does not exist. Not finding a transition matrix may be one of the reasons that even with so many CERN stations, after so many years of data collection, researchers have been unable to accomplish a true temporal dynamic analysis. Based on my research, the transition matrix, if it exists, has to be diagonal matrix (Bai, 1998), or m -vector. On the other hand, the statistics that have been applied to these data were designed to work in sample space, n -space, to discover the relation among the variables, the so called R -analysis, but the temporal dynamic analysis that we propose is to work in variable space, m -space, to discover the relation among the samples, previous and present, the so called Q - and O -analysis (Legendre Legendre, 1998). Facing environmental and financial crises, scientists are required to investigate the world from different and multiple angles, to investigate the world as a whole, as a system. The importance of extending our view from scalar to m -vector, and switching our emphasis from R -analysis to Q - and O -analysis cannot be overstated in my opinion. Using Q - and O -analysis to perform temporal dynamic analysis would be a great breakthrough for CERN program. Thus, I am very optimistic that this blog will greatly advance the CERN research and benefit the Net and all the involved netters.

个人分类: MDSM 通讯|2663 次阅读|0 个评论

帐号		自动登录	找回密码
密码			注册

关闭安全验证

标签: 转移矩阵

相关帖子

相关日志

关闭 安全验证

标签: 转移矩阵

相关帖子

相关日志

关闭安全验证