个体 - 标志值 - 集合 和它的复杂程度之七 ( 7 )复杂程度的定律 (张学文, 2008-7-22 ) 1. 最复杂原理 l 个体集的随机性 掷一个骰子,它出现几点(那点向上)就有随机性,从一副麻将牌中随便取一张牌,它究竟是什么牌也有随机性。玩麻将牌者要拿 13 张牌,这 13 张牌就构成了一个个体集(群体)。显然在没有拿到牌之前,这付牌究竟是什么也有随机性。 100 位顾客买了那些东西,他们的花费各是多少?在 事先也有随机性。看来,某些 个体集及其分布函数究竟是什么的随机性问题是值得研究的 。而这也就引出了 不同的个体集 (如抓 13 张麻将牌) 有不同的出现概率问题 。现在我们设法把它量化和深化。 l 红绿灯模型 某人上班要经过 10 个红绿灯路口。针对每次上班可以问:你遇上了几次红绿灯。本问题的答案显然有随机性。从个体集语言的角度看,经过 10 个有红绿灯的路口等价一个个体集有 10 个个体,红灯、绿灯对应两种标志值。而回答了红灯(或者绿灯)的出现次数也就等价于知道了分布函数(不同颜色的灯各有多少)。如果遇到的红灯次数被概率计算出来了也就知道了 不同的个体集(分布函数)的出现概率(机会) 。 本问题是概率论中的二项分布问题。设红绿灯的出现概率都是 0.5 (相等),经过 10 次路口遇到 m 次红灯的概率 p ( m ) 为 p ( m ) = {10! / }(0.5) 10 ( 11 ) --- 表 8 第二行给出了不同的红绿灯次数 m 对应的不同的出现概率 p ( m ) ,第三行是利用复杂程度公式( 9 )计算出来的对应的复杂程度值。 表 8 不同红绿灯的出现概率 (不同的个体集、分布函数、复杂程度的出现概率不同) 红灯次数 m m =0 m =1 m =2 m =3 m =4 m =5 m =6 m =7 m =8 m =9 m =10 该事件出现的概率 1024 1 10 45 120 210 252 210 120 45 10 1 复杂程度 ( 比特 ) 0 4.6 7.2 8.8 9.7 10 9.7 8.8 7.2 4.6 0 表 8 说明: 出现概率最高的个体集(事件)也是复杂程度最大的个体集(事件) 。在概率的对数与复杂程度的坐标图(略)上它们是直线关系。 l 最复杂原理 如果标志值不仅只是两个(红绿灯)而是 k 个可能值 x 1 , x 2 ,, x i ,, x k 、而它们的出现的概率 p 1 , p 2 ,, p i ,, p k (也称为先验概率)可以彼此不相同、个体的总个数相当多(可以利用 Stirling 公式 ln N != N ln N-N ),利用概率论中的多项式分布公式,可以得到下面的关系 ln P = C + ni ln pi i=1,,k ( 12 ) n i 是概率为 p i 的标志值占有的个体数量。 --- 这个公式体现了不同的个体集的出现概率 P 与其复杂程度 C 的关系。 它表示该个体集的出现概率的对数等于该个体集的复杂程度再加上另外一项。显然当概率达到最大值时,复杂程度与另外一项的合计值也达到最大值。概率最大的事情自然是在一次实验中最容易出现,所以最容易出现的个体集是复杂程度与另外一项的合计值最大的个体集。 另外一项在本例中包括了各个结局的出现概率,它对应着一种限制、约束条件。在另外的场合它的外型可能不同。但是它都包括着一些约束条件。考虑到有的个体集的出现还会附有其他的约束条件,我们把另外一项更含糊化为在限制条件下。于是上面的公式、红绿灯的例子、概率公理和以后的例子,我们把: 有随机性的客观事物(个体集)都自动使自己内部状态的复杂程度在限制条件下达到最大值 称为 最复杂原理。 最复杂原理的正确性体现于多次实践中它经常是对的,而不是每次必然正确,它与正方形的面积等于边长的平方之类的确定性规律在品格上是不同的。 l 定性的例子 你在街上会遇到很多人,有买东西的、上学的、做生意的、出差的、看病的等等。把遇到的人看成是一个个体集,根据最复杂原理这个个体集内的人(个体)的活动目标(标志值)会自动最复杂化。从商店出来的人都买了相同商品的事件的出现概率就非常小的,最容易出现的情况是买什么东西的人都有。所以最容易出现的也正是复杂程度最大的。你把一个玻璃杯摔碎了,碎玻璃的大小都相同?根据最复杂原理,它们是尽量地不相同,碎玻璃的大小尽量复杂化。仔细想想,符合最复杂原理的事物几乎是司空见惯。 l 定量的例子 斩乱麻问题 最复杂原理不仅在生活的事例早已司空见惯,而且也可以推导出很多定量规律。 利用分布函数可以计算该个体集的复杂程度。对此也可以 反过来思考 :对于有随机性的个体集,根据最复杂原理(复杂程度最大),能否反算出分布函数? 这个问题非常有吸引力。但是,在离散变量的情况要利用求函数的极值的技巧反求自变量(分布函数)。在连续变量的情况下就要利用变分技术去反算未知函数(连续型的分布函数)。拉哥朗日乘子方法经常帮助我们达到目标。现以 斩乱麻问题 为例说明之。 把长为 L 的绳子 随机地 切割成充分多的 N 段,问 不同长度的线段各有多少 。这就是斩乱麻问题 。把切碎的绳子看作是个体集,这就是利用随机性从理论推测其分布函数。 切割的随机性造成了线段长短不齐,它体现了事物的 复杂性 。以 f(x) 这个分布函数表示不同长度的线段占的百分比(权重),那么它对应的复杂程度为 C =- Nf ( x )ln f ( x )d x ( 13 ) 切割当然不是烧掉,切割后的线头总长度应当等于 L ,即 L = Nxf(x )d x ( 14 ) 根据最复杂原理, C 应当在一定的约束条件下达到最大值。而上式是一个约束,另外百分比的合计值应当等于 1 ,即 1= f(x )d x ( 15 ) 也是一个约束条件。 现在的问题是:在( 14 )、( 15 )的约束条件下使 C 最大的分布函数 f(x ) 应当是什么。根据求泛函数极值的拉哥朗日方法,构造一个新的函数 F : F =- f(x )ln f( x)dx + C 1 + C 2 ( 16 ) -- 这里的 C 2 , C 2 是待定常数。很显然,复杂程度 C 达到最大值, F 也达到了最大值。在 F 达到最大值(体现最复杂原理,也考虑了本问题的特殊约束条件)时它对未知函数 f(x ) 的变分应当等于 0 。利用 F 对 f 的变分为 0 ,我们得到 f ( x )=exp ( -1+ C 1 x + C 2 )。 -- 利用( 14 )和( 15 )消去未知数 C 2 , C 2 解得 f(x )= ( N/L ) exp(- Nx/L ) 注意到 L/N 的含义是线头的平均长度,以 a 表示它 ( 也是常数 ) ,有 f(x )=(1/ a )exp ( 17 ) 它是一个负指数函数。即一堆斩乱麻中,不同长度的线头占的百分比(分布函数),应当是 负指数函数 (相对密度分布函数)。 它显示长度 x 短(小)的线头多而长线头很少。 根据相对密度分布函数的定义,线头长度在 x x+ x 范围的有 Nf(x ) x 段。如 L = 200 米 ,切成 N =20000 段(平均值 a = 1cm ),可以计算出长度在 3 4 cm 范围的线头有 604 段,占总量的 3% 。 我们可以做一个 数值模拟实验 以得到一个斩乱麻的样本。对比显示最复杂原理得到的理论分布与模拟实验结果的 一致的 。这说明最复杂原理与实际相符合。例子中虽然利用了复杂程度最大,但是没有计算复杂程度的最大值究竟是多少。原因是我们主要兴趣是利用复杂程度最大去推算理论的分布函数。 一般地说,只要某个体集具有随机性,就可以 利用最复杂原理配合不同的约束条件得到不同的理论分布函数 。客观存在的有随机性的个体集很多,所以利用最复杂原理求分布函数的一般方法有广泛的应用和价值。 l 熵原理与最复杂原理 我们从不同的个体 - 标志着 - 集合的出现概率入手,利用了概率最大对应复杂程度最大,从而得到了复杂程度最大的个体集也就是出现概率高的个体集。我们把它称为最复杂原理。由于已经说明热力学熵是复杂程度的特例,所以联系着热力学熵的热力学第二定律(熵原理,熵最大原理)也是最复杂原理的特例。 2. 复杂度定律 复杂程度是物质自身天然具有的属性,它和质量、能量一样地真实。关于物质的质量、物质的能量已经有了质量守恒、能量守恒定律,与之对应也应当 存在一个关于物质的复杂程度的变化规律,现在暂称为复杂度定律 。限于篇幅这里仅指出某些观点: l 个体集概念有层次性,复杂程度也具有层次性。不同层次(形态)的复杂程度都客观存在。这类似物质的能量有化学能和核能。不同形态的能量可以互相转化, 不同层次(形态)的复杂程度也可以互相转化。 l 有限的物质仅具有有限的质量和能量,它也仅具有有限的复杂程度。 物质可以无限分隔的观点等价于有限物质的复杂程度为无穷大,这个观点使复杂程度概念失去物质性,所以它是错误的。 l 建议 把目前流行的 世界的 三元观 (物质 + 能量 + 信息)修改为 物质属性 的三元观 (质量 + 能量 + 复杂程度)。 l 存在着质量变换机构(如木器厂)、能量变换机构(如水利发电厂)和信息变换机构(如电视机),但是使 输出的质量、能量、信息大于出入的变换机构是不存在的 。 l 爱因斯坦的质量能量公式可能要扩大为 质量、能量、复杂程度之间的定量互相转化关系 ,而其总量具有保守性。写为公式就是,对于孤立系统,有 m + E / v 2 + k C =0 ( 18 ) 这里的 v 是光速、 C 是复杂程度、 m , E 分别是质量和能量。而 k 是待定常数。 l 我们暂且 把上面的认识连同最复杂原理合称为复杂度定律 。 3. 小结 根据个体集(客观事物)的分布函数,利用公式( 9 )可以计算该广义集合的内部状态的复杂程度。具有随机性的广义集合,它的复杂程度常常是在一定约束条件下的最大值。利用这个最复杂原理可以推导很多事物(个体集)的理论分布函数。 复杂程度是客观物质具有的基本物理量,它与质量、能量一样的真实,在一定的意义下它与信息熵成正比例。关于客观事物的复杂程度的一般规律与最复杂原理一并称为复杂度定律。 本部分的内容取自 2002 年《物理与工程》杂志 12 卷第 5 期上 组成论 介绍(中)一文,但是做了一些删减、修订、补充。
个体 - 标志值 - 集合 和它的复杂程度之五 ( 5 )个体集的表示、运算和特征量 张学文 20080630 在数学中一切进步都是引入符号(表意符号)后的反应――皮亚诺( G.Peano ) 让个体概念进入科学领域,还需要引入有关的符号以及量化、运算方法 1. 字符多项式 我们一般地把有 p 项组成的 a 1 x 1 +a 2 x 2 ++a i x i +a p x p 的式子称为字符多项式。在外型上,字符多项式类似初等代数里的多元一次多项式,但是它们的各个 a i 和 x i 都可以是独立的,有一定意义的 字符串 (不再单纯是数了)。而 + 号也需要针对需要去定义(说明)。由于它们经常不再是数,所以连写在一起,也不具有数的乘法的意义。 这里有 9 个水果: 3 个苹果, 2 个梨, 4 个香蕉,可以用字符多项式写为 ( 3 个)(苹果) + ( 2 个)(梨) + ( 4 个)(香蕉)。它对应的字符多项式里的字符串见表 6 表 6 例子里的各个字符串在字符多项式一般公式中的含义 符号 a 1 a 2 a 3 x 1 x 2 x 3 含义 3 个 2 个 4 个 苹果 梨子 香蕉 而字符多项式里的 + 号具有还有的意义(不是强行把含义不同的东西做 代数 加法)。 数学老师会告诉我们 3 个苹果不能与 2 个梨做加法,因为它们的单位不同。但是这里对加号有了另外的理解,于是 3 个(苹果) +2 个 ( 梨 ) 就是合格的表达式了。显然, 3 个(苹果) +2 个 ( 梨 ) = 2 个 ( 梨 )+3 个(苹果)。 文献【 3 】初步讨论了字符多项式和它的一些应用。哪里还指出它可以表示各种表格。下面我们要用它表示个体集。 2. 个体集的符号表示 对于个体集本身,我们一般用被方括弧包起来的大写粗斜体的字母表示它(这与集合的表示类似)。如用 表示盘子里有 9 个水果: 3 个苹果, 2 个梨, 4 个香蕉。 、 、 等等都是可以用的符号。 3. 离散的分布函数的符号表示 鉴于经常出现分布函数的自变量不是过去常用的连续变量而可以是离散的特征标志(如名字是苹果、梨、香蕉的水果、兰色的,黄色的 .. ),所以我们推荐用 字符多项式去表示分布函数 。例如前面的例子里,我们就用下式表示这个个体集的分布函数 = ( 3 个)(苹果) + ( 2 个)(梨) + ( 4 个)(香蕉) 这里的 代表了一个个体集,而等号后面表示该个体集的分布函数。 显然 =15 个(儿童) +16 个(成年人) +9 个(老年人)表示了不同年龄段的人各有多少, 就是一个分布函数明确的个体集。这里把园括号省略了。 =14(70 分以下 )+25 ( 70-90 分) +10 ( 90 分以上)表示了一次考试的全班成绩的个体集的分布函数,它告诉我们 70 分以下的学生有 14 个, 70 到 90 分的学生 25 个,高于 90 分的学生有 10 个。 根据上面的说明,我们一般用方括弧包起来的大写粗斜体的字母表示个体集本身;而用字符多项式表示该个体集的分布函数。这里的等号=体现了前面的认识:知道了它的分布函数,也就 等于 知道了一个确定的个体集。而加号 + 的意义是还有、还包括有的意思。 如果再借用数学里的求和符号,个体集的分布函数就可以一般的写为下面格式: = n i x i 这里的各个 x i 是彼此不同的标志值(也称为变量);而各个 n i 是对应于该标志值的个体的数量(这里用符号 n 代替了 a , 它包含计量单位个)。我们也用系数称呼它。 对于分布函数是连续变量的情况(标志值是连续变化的),它们对应的个体数量也是连续变化的情况(在个体数量十分大的情况下才会出现化离散为连续的数学处理技巧问题)出现这个问题,我们依然可以用数学里惯用的连续函数去表示它。 4. 个体集的运算 如果我们给某概念一个比较严的定义,而提不出随后有什么好处(定量的计算、新规律的发现 )这样的定义也就没有吸引力了。 已知甲小学的不同年级各有多少学生,还知道乙小学不同年级各有多少学生。求两个学校合并以后的不同年级各有多少学生。如果用个体集 分别表示两个学校的学生个体集,两个小学合并以后的个体集用 表示,那么个体集 就是 、 的和。这里的和是一种数学运算,这可以写为 = + 如何对两个个体集做加法运算?其实,运用代数里的多项式加法(合并同类项)正合适。在这里已经看到我们定义的字符多项式的好处。 《组成论》里介绍了个体集(哪里称为广义集合)的某些运算规则。它把我们过去熟悉的一些逻辑和代数运算规则,如加、减、乘、除等,引用到个体集中。通过这些运算可以得到含义明确的新的个体集。个体集不仅成为可以运算的对象,而且通过运算扩展了我们的知识。 5. 个体集的某些特征量(参数) 个体集存在一些重要的特征量或者说重要参数。 5.1 个体集的 个体总数 N :由于我们突出了个体的完整性(量子化)、离散化(现在时髦的称呼是数字化)所有个体集里所包括的个体的数量应当是个正整数。这个正整数自然称为该个体集的个体总数。这个小学校有 400 学生,中国有 13 亿人、哪个盘子里有 7 个水果都是例子。根据定义,个体集的个体总数显然是个体集的分布函数多项式表示下的各个系数的和,即 N = n i i =1, ,p 5.2 个体集的标志值的 平均值 m :如果某一个体集的各个标志值 x i 是 物理量 (包括单位)而不是字符串,那么通过下面公式得到的数值显然应当称为该个体集的标志值的平均值(与统计学里的定义一致) m = n i x i /N ( i =1p) 公式中的 n i 和 x i 都是数,而且这里是真的在 n i 和 x i 进行普通的代数运算(相乘)。运算得到的 m 的量纲应当与 x i 相同。 甲班的学生 - 年龄个体集为 = 3 个( 12 岁) +15 个( 13 岁) +11 个( 14 岁) +1 个( 15 岁) 那么甲班学生的平均年龄 m 显然是 M=(3*12+15*13+14*11+1*15)/(12+15+14+1)=13.3 即平均年龄是 13.3 岁。 5.3 个体集内不同标志值占的百分比(权重) f i :它等于具有标志值 x i 的个体数量 n i 与总体内的个体总量 N 的比值。即 f i = n i / N 百分比本来就是大家熟悉的统计量。现在用到这里了。 显然,各个标志值的 f i 的合计值应当等于 1 。 有时这被称为归一性。 1= f i = n i /N i =1, ,p 表 7 可以帮助理解上面谈到的一些特征量的关系。 表 7 个体集的一些特征量的关系 一般符号表示 总计 标志值(区间) x 1 x 2 x i 从下界到上界 个体数量 n 1 n 2 n i N 比例 n 1 / N n 2 / N n i / N N / N 百分比 f 1 f 2 f i 下面是特例 总计 年龄(岁) 12 13 14 15 12-15 学生(个) 3 15 11 1 30 百分比 3/30 15/30 11/30 1/30 30/30 定义: 百分比矢量 f 是个体集必然具有的一个矢量,它的各个分量就是具有特定的标志值 x i 的个体的数量与个体集内个体总量的比值 n i / N ,即 f i ( i =1,2, )。 如本班有 50 个同学,女生占 30 人,男生 20 人,则这个个体集的百分比矢量 f 的两个分量(顺序是女,男)是( 0.6 , 0.4 )。任何一个个体集的百分比矢量的各个分量代数和等于 1 。 5.4 百分比的代数平均值和几何平均值 (冯向军博士 2004 年评论《组成论》的一篇短文指出了百分比或者概率的平方和的物理意义。这里是在该认识上的综合和发挥,在此特做说明,在笔者看来这是冯向军博士的一个重要贡献。) 假设个体集内的每个个体用一个卡片代表它,而在卡片上根据它原来的标志值 x i ,写上该标志值对应的百分比的值 f i 。那么也可以认为 百分比本身就是标志值 了。即这个个体的标志值 x i 就改用 x i 占的百分比 f i 来代替了。 由于百分比这个新的标志值是数值,我们自然可以求这个个体集内各个个体的百分比的平均值。而根据平均值的定义, m = n i x i /N ,注意到现在 f i 代替 x i (相当于对自变量的函数求平均值),而 f i = n i /N ,自然有百分比的平均值公式: m f = n i 2 / N 2 = f i 2 i =1, ,p 于是我们知道一个个体集内的不同的标志值占的百分比的平方和,就是各个个体的新标志(百分比)的平均值。按照统计学的语言,这种平均值应当称为代数平均值或者算术平均值。 对于直角坐标系下的平面上的一个矢量,我们知道其分量的平方和是个有意义的量(开平方以后是该矢量的长度)。在 p 维空间中的一个矢量,其各个分量的平方和也是有意义的。对于个体集来说,它的百分比矢量的平方和等于百分比的平均值。 另外,对百分比,还可以求其几何平均值。根据几何平均值的定义,个体集内的百分比的几何平均值 m' f 应当是 m' f N = f i ni i =1, ,p 以上两个平均值都是个体集的重要特征量,它们与熵有特殊关系,这些后面再讨论。 5.5 个体集的复杂程度 C :其定义是 C = N log N - n i log n i i =1, ,p 这个公式给复杂程度以定量的定义,它还把应用于热力学的熵和应用于通讯领域的信息熵扩展到更广的领域。我们在下一讲再展开讨论。