科学网

 找回密码
  注册

tag 标签: 集合

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

可拓学的理论体系
anley 2012-12-10 07:46
可拓学的理论体系
可拓学是 是用形式化模型研究事物拓展的可能性和开拓创新的规律与方法,并用以解决矛盾问题的科学。 它的 第一篇文章 ” 可拓集合和不相容问题 ” 发表于 1983 年 , 经过近 30 年的发展 , 至 2012 年,有 59 项国家自然科学基金项目支持这项研究。由科学出版社等出版可拓学专著 14 部 (包括可拓学丛书),国内外引用可拓学成果的著作、教材和论文集 34 部 , 有 367 家 期刊发表了关于可拓学的论文,这些论文、专著和项目构建了可拓学的理论体系 — 可拓论和方法体系 — 可拓创新方法 , 它们的应用称为可拓工程。可拓论、可拓创新方法和可拓工程构成一门新的学科 — 可拓学。 可拓论的理论体系有三个支柱:基元理论、可拓集合理论和可拓逻辑。
个人分类: 可拓学专题讨论|1564 次阅读|0 个评论
漫漫的无穷路
热度 2 HAITIAN136 2012-9-12 14:29
一场“ 统一无穷理论”之争,终于告一段落。从起点开始到终点,终点又回到起点,无穷之路依然漫长。 由于无法证明实数是可数的,最终“统一无穷”缺乏根基,无法立足。实数与线上的点一一对应,不容置疑。 康托尔的超限数理论依然是对的,无穷大至少有两个:可数无穷和不可数无穷, 2 ∞ ∞。 集合论是康托尔创建的,其目的也是要解决无穷大的问题 。可以说 康托尔已把集合论发挥到极致,他无法解决的无穷问题,已很难用集合论来解决了,除非有新的理论或新的构思。用集合论来反证康托尔的超限数理论不成立更是不太可能。 无穷,看似简单,到达其边缘,发现其实有太多的岔路,哪一条才是正确的呢? 由于集合论容易产生太多的自相矛盾的论据和推论,可以说每一个假设就产生一个不同的推论,单单靠集合论不可能解决无穷问题。要有其它的理论相结合,才能走上正确的无穷之路。 漫漫的无穷路,依然漫长 ……
3346 次阅读|5 个评论
怎么从新浪网上的图片浏览中下载喜欢的图片
zxczxc0417 2012-7-24 08:39
怎么从新浪网上的图片浏览中下载喜欢的图片 大家是不是在新浪网上的图片浏览中看过不少很好看的图片,很喜欢。可是不知道怎么下载,因为点右键是无法看到下载图片的选项的。那么怎么才能下载到喜欢的图片呢? 在空白处点击右键,然后点“查看源文件”,再“编辑”=》“查找”,输入“jpg”或者“jpeg”或者“bmp”或者“tiff”。然后就能找到类似于“ http://www.sinaimg.cn/dy/slidenews/8_t50/2010_08/203_18385_876675.jpg ”的地址。最后直接输入地址栏就能下载了。 比如:去 http://slide.mil.news.sina.com.cn/slide_8_203_2952.html 找到: http://www.sinaimg.cn/dy/slidenews/8_t50/2010_08/203_18385_876675.jpg 最后点右键保存。
个人分类: 好好学习|3044 次阅读|0 个评论
再论康托尔的对角线
热度 1 dulizhi95 2012-5-6 08:29
再论康托尔的对角线 最近有位注册用户,不知道其真实姓名和身份,但从其讲话的口气,感觉像是“审稿专家”,或“教授博导”。各位,有这样的审稿专家和教授博导我当然丝毫也不感到奇怪。 他是在我的博文“ 不对称的战争:杜立智反对康托尔 ”上留言的,下面是他的留言: trampzmj 康托对角线法不是指形状上的,如 7 楼所说,只是一个形象的叫法(中文思维害人?),其本质还是排中律。你把这个理解为几何形状,真是乱弹一气。 另外你的逻辑上的反驳(第一点)也有问题,“假定( 0 , 1 )之间的实数可列,全部列出来如下”这个只是一个假设,并不是一个你理解的“前提”,康托对角线法正是通过构造法来先证明这个假设不成立,然后根据排中律,这个假设的对立面“实数是不可数的”是成立的。你觉得它的矛盾之处正是它的论点所在。 第三点构造一个与所有自然数都不同的自然数的问题在于:在数学上,一个数 A 右端补无限个零还是等于原来的数 A ,但是,一个数 A 在左端补无限个零的数已经违反数的定义了,所有自然数还是会和自然数一一对应,是可数的。 其它点问题在于把逻辑关系理解为几何形状,这个是不行的,数学是个需要精确定义和论证的东西。 另外不承认排中律的数学学派也有,叫直觉主义,但是这样一来很多有趣的数学理论就不存在了,就比如康托对角线法 建议不要随便去推翻已经使用多年的数学基础方法和理论,没有意义。这些东西一般是经过很多年无数人的思考和论证的,正确性肯定是没问题的。但是你可以从这些基础出发,去思考还有没有遗漏的地方。 不会再删掉了吧?:) 下面是他所说的7楼的留言: yqlei 2012-4-22 22:31 对角线法,只是形象的 叫法 而已。反证法,排中律,构造主义 ; 下面是他们所说的排中律证法: 康托尔定理:用 P(X) 记 X 的一切子集构成的集,用 cardX 表示 X 的势,康托尔定理如下: cardXcardP(X)    . 证明:对于空集来说,上述结论显然成立,所以可设 X≠ 空集。因为 P(X) 含有 X 的一切单元素子集,故 cardX≤cardP(X), 现只需证明两者不相等。若相等,假定 f:X-P(X) 是双射,考察集合 A={x∈X|x 不 ∈f(x)} ,它由那样一些元素 x∈X,x 不含于它对应的集 f(x)∈P(X), ,组成的。因为 A∈P(X) ,所以必能找到一个元素 a∈X, 使 f(a)=A, 这个元素 a∈X 既不能有 a∈A( 据 A 的定义 ) ,也不能有 a 不 ∈A (也是根据 A 的定义) , 这与排中律矛盾。得证。 要评论我的博文,关键是必须首先透彻理解康托尔对角线形式的证法以及上述“排中律”证法,这两者的联系,以及他们的相通和重叠的程度,从那位大口气的评论者的留言可以绝对肯定,他根本没有理解这些。不客气地说:杂牌一点的士啊授啊,可能就不会透彻理解。 他对我的逐条反驳没有一点是着调的,可以看出,其人只善于背概念,稍微复杂一点的思维逻辑完全拎不清。可为什么讲话口气那么大呢?我判断是拥有教授博导头衔的“审稿专家”,若真的如此,毫不奇怪! 欢迎各位懂行者批评指正!
4540 次阅读|2 个评论
从哲学方法论到科学方法体系(双方由邹氏四类集合相互联系)
geneculture 2011-11-15 05:37
从哲学方法论到科学方法体系(双方由邹氏四类集合相互联系)
以上这幅精练且简美的图解凝聚着中西方寻求智慧的众多杰出人士的思想精华,在哲学方面他们分属还原论和整体论两个阵营,在数学和逻辑学上它得益于三次数学危机的启示和本人对数理逻辑的进一步思考,除了前述古希腊哲学黄金时期延续下来的理性反思的学问和近现代欧洲科学新兴时期接下来的多次科技革命的经验预测的学问这两大学术渊源之外,中国先秦人文思想黄金时期延续至今的由中文凝聚的收放自如的学问也是一股重要的源流,本人作为熟悉 (数学和汉语、汉语和英语)这两类双语信息处理的研究人员,不仅早在1997-2000年期间因发明了“一种知识信息数据处理方法及产品”(1)的构想而提练出了“物、意、文、义”四大基本范畴(宏观模型),而且,持之以恒地经过近十年的国内外交流探讨之后现已把它的微观模型都已经做到了间接形式化(2)的程度。以上图解的底层科学方法体系就是基于(1)的粗放模型和(2)的精细模型而建构的。 注释 : 题中“邹氏四类集合”即:单一集合、分层集合、标志集合、杂多集合。 文中“近十年的国内外交流探讨”即本人2001-2011期间在国内外相关领域所进行的学术交流探讨。 参考文献 : 0.邹晓辉.一种知识信息数据处理方法及产品 .发明公报 29-Nov-2000 http://ip.com/patapp/CN1274895 1. 邹晓辉.集合的分类——简论“标志集合”与“分层集合”的关系” . 前沿科学. 第 50 期, 2005 2. 邹晓辉. 解析“商集”竟然可导致方法论的重要突破(其中“单标志集合”的组成分析是一个关键步骤) 2006 http://survivor99.com/pscience/2006-3/zxh_methodology.htm 3.邹晓辉.间接计算模型和间接形式化方法 .软件.2011(05) 全文下载, 请见以下链接中的相关引文目录: http://blog.sciencenet.cn/home.php?mod=spaceuid=94143do=blogid=507896 附(晓辉的一个研究成果图解): http://blog.sciencenet.cn/home.php?mod=spaceuid=33982do=blogid=504751 geneculture 2011-11-15 05:29 解读或提示: 从哲学方法论到科学方法体系 其中是由四类集合相互联系的。 从哲学方法论到科学方法体系 http://kbs.cnki.net/forums/140507/ShowThread.aspx
个人分类: 学术研究|2581 次阅读|0 个评论
Latex不常用宏包介绍(5)
longxie1983 2011-5-19 10:52
Latex不常用宏包介绍(5)
用latex在写集合表达式的时候,为了美观代码还是有点罗嗦的,需要反复的使用\left, \right。即使是在最简单的情况下也需要两对,比如 \begin{equation} \left \{x \left | \right . \frac {1}{x-1} 1 \right \} \end{equation} 代码不是很美观,而且也容易出错。这次介绍的宏包braket可以有效的化简集合表达式的写法。braket宏包主要是为简化狄拉克记号设计的,但也提供了对集合的支持。 braket提供了两组命令,第一组为\bra \ket \braket \set;第二组为\Bra \Ket \Braket \Set。两组的区别为以小写字母开头的命令(第一组)使用固定大小的标记;相应的以大写字母开头的命令(第二组)则会根据包括内容的不同来自动调整标记的大小,同使用\left和\right的效果相似。 那么,如果使用braket宏包的\Set命令,前面的代码就会化简为 \begin{equation} \Set {x | \frac {1}{x-1} 1 } \end{equation} 代码更简洁,也更符合书写习惯。 最后,按照惯例用效果图来介绍本文:
个人分类: Latex|7173 次阅读|0 个评论
“个体”是比集合更基础的概念...
zhangxw 2010-8-6 12:00
个体 是比集合更基础的概念... 张学文, 2010.8.5 1. 2010.8.2 日我在新疆昌吉参加一个学术与教学的讨论会(刘全慧教授也到会了),可我思想跑题,想到了这样一个认识,即 个体是比集合更基础的概念 。于是回家把这个认识备存到日记里。我想,这可能正是我写的一本小册子的好书名。 2. 也是 8 月 2 日 , 李炳铁 先生在我的博客上留言说:感谢张学 文老 先生发起关于 个 的问题谈论。北京信息交叉科学研讨会( 2005 )后,张学 文老 先生就发起关于 个 的问题谈论,并主张大家共同议论,然后出一本小册子。当时我也参加了讨论,并提出两个观点, 1 是: 个 应该是比基本单位更基本的自然单位, 2 是: 个 与 次 并立。当 时张老 先生回复说 次也是个 ,我很赞同,只是保留了进一步思考这个问题。 今天看来,其重要性则在于,越是最基本的问题,越是具有普遍和深远的意义。也正是对这个问题的进一步的思考,才使得我在普朗克量子公式上,得到了应用,并得以修正普朗克量子公式和普朗克常数。 在拓变论之前的普朗克常数是 h=6.6260755*10^-34(J*s) ,普朗克量子公式是 E=h ; 拓变论修正后的普朗克常数为 h ( J ) =6.6260755*10^-34(J) ,拓变论修正后的普朗克量子公式是 E=Nh ( J ), N 为量子数,普朗克常数数值不变,单位由 h ( J*s )变为 h ( J )。 假如张学 文老 先生还关注本论坛的话,我敬请张学 文老 先生,将此内容纳入您那本要出的关于 个 的小册子当中,并衷心的希望您能够出这本小册子,其意义非常之大。 3. 2010 年 8 月 4 日 我开完会回乌鲁木齐,給李炳铁回复说:李炳铁你好! 好久没有联系了!关于 个 的事的过去的讨论和那些朋友都是值得回忆和再聚的。 去年我们新疆不能上网,我就低头完成了一个气象方面的书稿。其中的一个附录就是关于个体、个的问题,有 1 万多字。 今年我没有明确目标,年纪也大了。不能对自己提什么要求。不过 个体 的出书的事,倒是有一些进展。 蔡文的三基元中有物元、事元。 物 (如苹果)一般可以用 个 做自然单位, 事 (如盖个图章)一般可以用 次 做单位。这样个与次分别表示物与事的自然单位。 我现在是着手把 个体 变成一本小册子,也希望把大家的认识恰当地组织进去。如何恢复过去的讨论是个问题。 张学文 8.4 4. 8 月 6 日 ,今天,看到李朝辉博客文章 http://www.sciencenet.cn/m/user_content.aspx?id=350400 中有如下文字: 可拓逻辑则是以个体的特征及个体的结构作为认识世界的着眼点。以基元作为描述工具,研究它们的一般性质和关系,以达到认识世界的目的。因此,可拓逻辑不仅研究类和个体,还研究个体的特征或共轭部结构,即研究物元、事元、关系元和共轭部。 ,我当即表示对这个观点的支持,并且说:个体概念上有大量的认识需要展开! 5. 我除了在 2003 年出版的《组成论》里把个体作为科学概念提出外, 2005 在给冯向军的论文集稿子里继续延伸这个问题,该文的名称是横贯多个论域的一个概念和一个单位,那里说的概念就是个体,说的单位就是个。 6. 大约在 2005 年,我在潜科学等网站上就个体这个概念,个这个计量的自然单位展开了与多位朋友的讨论。 2009 年我写空中水文学初探,就把对个体的进一步的认识编入附录 1 。名称是个体集合和它的复杂程度。 1-2 万字。该书 2001 年 3 月由气象出版社出版。我的科学网博客 http://www.sciencenet.cn/u/zhangxw/ 分类中就有一个类称为:个体通论,其中有 8 篇文章 7. 今年 我打算做的事情之一就是把关于个体的小册子的事做推进。现在已经拟了数章,写好了第一章初稿。 8. 而此书的书名已经有好几个候选者:个体论、个体通论都是,个体是比集合更基础的概念是最近提出来的。这个题目突出,但是弱点是过分学术化。 9. 我打算把这个书放到网上写,即把没有定稿的东西就拿出来,欢迎大家批评、帮助、甚至一齐商量充实。 10. 今年我在可拓学方面思考了不少(学的不够)。我感到其三基元都是个体,不同类别的个体。所以可拓学需要给个体概念以基础地位。而这反过来也使我热心提倡的个体概念丰富了内容。实现了创新的知识之间的融合。 11. 也许这个说明就是我后面的个体通论(或者个体是比集合更基础的概念, )小册子的内容介绍(网络版)的开场白了 12. 欢迎关注新概念提炼的朋友关注,以致参加这个进行中的学术建设。
个人分类: 个体通论|4337 次阅读|0 个评论
个体集合和它的复杂程度
热度 1 zhangxw 2010-7-14 22:20
个体集合和它的复杂程度 张学文, 2010.7 说明: 个体集合和它的复杂程度 文稿,是 2010.3 出版的《空中水文学初探》一书的附录 1 ,原稿有 2 万字,有表和公式。这里仅列出它的目录和最初的一部分。想看全文请敲本文参考文献最后一个标题:个体集合和它的复杂程度。 本稿主要是把个体作为一个科学概念推进給读者。随后讨论个体 - 标志值 - 集合和它们联系的复杂程度概念等。 目录 ( 1 )前言 ... 1 ( 2 )把个体提炼为科学名词(科学概念) ... 2 ( 3 )个体 - 标志值 - 集合 ... 4 ( 4 )个体集的表示、运算和特征量 ... 7 ( 5 )复杂程度概念 ... 10 ( 6 )复杂程度的定律 ... 13 ( 7 )这些概念和定律的应用 ... 16 ( 1 )前言 现代科学之所以强大,除了它尊重事实、测量、规律、推理之外,还十分关注 科学概念的提炼。提炼科学领域的基本概念具有原始创新意义。 现代科学被划分为数千个分科,每个分科都有专属自己的若干专名词。它们在本学科内十分有用,但难以跨学科应用。显然,能发现和提炼具有跨学科应用能力的定量概念,就对各个学科的发展和各个学科的统一具有十分重要的价值。 这里推荐的个体概念、 个体 - 标志值 - 集合概念以及关于个体 - 标志值 - 集合的复杂程度概念等,都是可以横跨许多学科的通用性十分强的量化的概念。它们能把过去说不大清楚的事和物提炼为由含义清楚的个体 - 标志值 - 集合,并且送给你一些关于它们的量(如复杂程度)。而这些量化的对象就为研究、分析、发现新的定量规律做了准备。 个体 - 标志值 - 集合 和它的复杂程度 是一组概念模型,它们不仅可以在各个学科(自然的、社会的)中找到自己的身影 , 而且也能派上新用场、充当新的思维工具、计量工具、推理工具。它是《组成论》 ] 里的概念和原理部分的发展、提炼。 这里要突出这样一些认识: ㈠把个体,以及复杂这两个词提升为社会和自然科学通用的、量化的科学名词(概念)。 ㈡特意把以个体为元素,把每个个体的标志值都明确的集体称为 个体 - 标志值 - 集合 (简称个 体集合 或者 个体集 ) . ㈢给复杂程度概念以定量的定义,最后把这些认识与信息熵、热力学第二定律等概念和原理再横向地串起来。 这里也谈及有关的原理和应用,但是重心是新概念的引入。 ( 2 )把个体提炼为科学名词(科学概念) 1. 个体 5 个苹果, 3 个梨子,这里的每个苹果、每个梨子都是个体的特例。确实,小学生也知道个体二字的大概含义。生物个体、我国改革开放初期的个体户都是有关个体的著名例子。我们几乎找不到一个领域不能使用 个体 这两个字。对这个使用领域非常宽的词,进行一番科学提炼,说不定可以惠及各个科学学科。 2. 个体概念的定义 把 个体 提升为一个科学名词,就要给它更清楚的定义。在文献 ] 、 ] 的基础上,这里把 个体 定义为: 个体是总体(宇宙、世界、群体)的某一部分,它可以独立存在、与外界有比较清楚的边界、在边界内有比较清楚的特征(特定质地、性质、结构、功能、目标 ) 。 3. 个体的例子 每个电子、每个分子、每个细胞、每个生物体、每个人、每个城市、每个国家、每个星星、每个星系都符合个体的定义。所以过去在科学、生活和社会实践中大家理解的各种个体都符合这里的个体的定义。 有 10 张 100 元的钞票。每张钞票有清楚的边界,而且它们印有特定的图案文字,它们独立存在、使用,所以每张钞票就是一个个体。教室坐着 20 个学生,每个学生与其他学生都有清楚的分界,而且每个学生有特定内质,可以独立活动,自然应当承认每个学生是一个个体。 符合这个定义的个体不只这些类型。例如一个骰子,把它掷了 50 次,每次都与其他各次过程无关,应当承认每个过程与另外的过程有清楚的分界,每次过程都有确定的点数向上,每个掷骰子的 过程 都是一个独立过程。这种彼此独立的 过程 也可以算是过程(事件)个体。晚会上演唱了 10 个歌曲、我下了 5 盘象棋,这里的每个歌曲的演唱、每盘棋都是一个 过程(事件)个体 。 英文里有 26 个 字母 ,最近做了很多 梦 ,大家提出了很多 办法 这里的每个字母或者每个梦或者每个办法,都与抽象世界中的其他部分有清楚的边界,并且有特定的内容,而且它们独立存在。这些抽象对象也符合个体的定义。它们算抽象个体。 很多文章里用到我,我就是个体的个例。 4. 著名的个体 100 元一张的人民币,是个体,一个人,是个体。电脑、手机、飞机、轮船、人造卫星都是著名的个体。统计学里的一次采样结果、一届奥运会、 EXCEL 软件、一个歌曲、一次太空飞行都是著名的个体。系统科学研究系统,而每个具体的系统也是相对意义下的个体。 一个国家就是一个个体,多少人为建立一个国家而牺牲了自己;一个公司就是一个个体,多少人为建立一个公司而费尽心机,确实创立一个新个体(不是复制),一个在环境中得以稳定生存,以致发展的个体几乎都有一个不平凡的故事。 把个体作为科学名称来对待,我们就为研究一大类现象,找到了共同又精练的语言。个体应当成为科学领域的著名词汇。 5. 说明 l 个体的命名:只要有需要,我们可以为每个个体专门取一个特定的名词代表这个相对完整的对象。每个人有姓名。这个姓名不是属于某人的某部分而是该完整对象。它体现着个体具有整体完整性。对已经发现的每个星星有命名、对每个城市、国家有命名都是例子。对每个个体临时给个 号码 ,这也是对各个个体的命名。 l 个体的类别:某些个体如果具有某种一致的特点,我们经常为该一批、一类个体取相同的名字。当我们说到 5 个苹果或者 7 个羊、 9 个星星、 3 个电子时,苹果、羊、星星、电子是一类个体的统称。在该命名下的每个个体具有 相同的地位 。分别研究不同类别的个体,是科学得以分科的重要标准。 l 个体的边界:既然存在边界是个体的共性,单独研究边界自然是个合格的科学课题。曹鸿兴著《系统周界的一般理论 -- 界壳论》 ] ,开此研究之先河。 l 个体的内容:边界把个体与外界环境分开,而个体内部是具有特定质地、性质、结构以至功能、目标。每个苹果、人、星星、国家都有内部特有的质地、性质、结构以至功能、目标,这些内容太丰富了,它们是各个具体科学分科的研究内容。我们在这里分析涉及个体的一般特点、统计量和规律,但是不是代替各个学科对它们的分门别类做研究。 余下部分就不在这里出现了,打算看全文者,敲本文参考文献最后一个标题:个体集合和它的复杂程度。 张学文 . 组成论 ,合肥:中国科学技术大学出版社, 2003 张学文 . 组成论 ,合肥:中国科学技术大学出版社, 2003 张学文 . 横贯众多领域的一个概念和一个单位 ,《世界华人一般性科学论坛》论文集,智多星出版社, 2007 , 534-537 ,也见于 http://zxw.idm.cn 网站上的 http://zxw.idm.cn/common/ge0512.doc 文档 曹鸿兴 . 系统周界的一般理论―界壳论 ,北京:气象出版社, 1997 个体集合和它的复杂程度
个人分类: 个体通论|5429 次阅读|66 个评论
美国小学老师竟然这样教集合的并集合交集
热度 1 jiangxun 2010-4-28 08:08
作者:蒋迅 来源: reddit 上面这样图是在网上看到的一位美国小学老师讲集合的并集和交集时举的例子。这样的老师能够上岗真是让人跌破眼镜。好在我儿子没有遇到这样的老师。下面这张图是我儿子的数学作业,看美国小学教算术时很不规范。难怪大学生里很多人都这样写推导算式。
个人分类: 谈数学|7777 次阅读|4 个评论
一个数学问题(邱荣涛)
grandFT 2009-10-21 19:24
提问人:邱荣涛 这是一个数学问题,也许讨论它没有什么实际意义,我只是想弄清楚它,要知道,它折磨了我一个下午。问题如下: 对集合S, 设R是关于S中的元素的条件,如果S中的两个元素a,b满足条件R, 则称a与b有关系R, 记为aRb,否则称a与b无关系R. 如果对S中任意的元素a,都有aRa,则R有反身性; 如果aRb,则bRa,则称R有对称性; 如果aRb,且bRc,则aRc,则称R有传递性。 问题是:有没有这样的关系,它满足对称性和传递性,但没有反身性?有人说没有,并给出了证明,即有对称性和传递性,则必有反身性,但这个证明明显是错的;我觉得有,但没有找到。
个人分类: 提问讨论区|5558 次阅读|3 个评论
信息论的局限性及其根源分析
wangyong77 2009-3-16 21:07
信息论的局限性及其根源分析 1. 引言 香农(Shannon,又译仙农、申农)的信息论是针对通信问题的,对于现实中的信息问题并不一定非常适用 ,后人将他的信息论称为狭义信息论,而对应的广义信息不仅研究通信问题,还研究其他与信息有关的领域。针对广义信息,一些学者提出了全信息理论、广义信息论、统一信息理论等 。这些理论认识到了狭义信息论的某一些局限性,但是,并不能解决所有的信息论局限问题,本文试图从新的角度来分析狭义信息论的局限性。 2. 香农信息论针对现实信息问题的局限性 目前被认识到的香农信息论的局限性主要有如下几点:第一,信息论仅仅考虑到了随机不确定性,而没有考虑到信息表示中集合的局限性和信息的模糊性等不确定性,针对这一问题,一些学者提出了模糊集、粗糙集理论。第二,信息论没有考虑语义和语用,一些学者认为这是信息论的局限性的主要根源 。国内钟义信就提出包括语法信息、语义信息和语用信息全信息理论 。 笔者也发现信息论存在如下局限性:第一,信息论没有考虑信息的可靠性问题,而现实中的信息大多数都是不可靠的。而信息的可靠性却是信息价值的前提,比如情报类信息的可靠性就非常重要。信息的可靠性是信息的主要指标,但是信息论没有考虑,仅仅是考虑到信息的不确定性。第二,信息的完备性问题,信息论并没有考虑信息并不完全发送的情况,而现实中许多信息都是不完全(完备)、片面的,需要融合。在没有更加完备信息的场合下,人们往往权宜地将片面的信息姑且当作全面的信息来对待,这种情况下,可以认为不完备的信息相对于完备的信息而言是不可靠的 。第三,在信息论中一些简单的信道并联和串联可以合为一个信道,比如简单的两个串联信道的信道矩阵可以直接通过相乘而当作一个信道,但是信息论没有考虑信息复杂的多重传递,比如,信息从一个信源传递到中间信宿,而中间信宿又转发给一个最终信宿,而且在这个转换的过程中,信息的表示发生了改变,在这种多重传递的过程中,可能会产生多重不确定性。现实中的信息往往需要经过这种多重传递,导致多重不确定性。比如,当然如果考虑前面提到的模糊集合等,这种多重不确定性性将更加复杂。信息论没有考虑到信道矩阵的传递概率等参数的复杂性。现实中这种传输特性可能不是确定不变的,而可能是随机变量,甚至可能更加复杂。第四,信息论中以通信为研究对象,其传输的信号本身是确定的,然而现实中却存在许多不确定性问题。在通信中,定义信息为消除不确定性的东西无可厚非,但是面对本身不确定的信息,我们如果去消除其不确定性,只会导致信息失真,这是舍本逐末的。量子信息论就是对经典信息论的一种推广,量子比特除了是0和1外,还可以是0和1中间的一个叠加态。在文献 中,考虑了信息的可靠性问题,指出信息的可靠性比确定性更加重要,现实中,人们也是宁可选择不确定,但是可靠的消息,也不会选择不可靠而确定的消息。第五,信息论中的条件相对而言是简单的,而且多是以条件概率来表示的。然而现实中许多中的信息的条件是比较复杂的,比如,给出的条件可能是知识、规律等等,在已知先验概率的情况下,又得知某一个规律,通过这个规律并不能简单得出相应的条件概率来。第六,信息论用先验概率来表示已知的信息,然而,现实中,许多已知的信息并不是可以用先验概率来表示,比如可能包含未知数,可能是某个约束条件,可能是某个规律,甚至可能是完全未知的。第六,信息论由于不考虑语义,没有考虑到信息可能本身都是不相容的,自相矛盾的。现实中,有大量的信息可能是不一致和矛盾的。 3. 信息的实例分析 针对以上局限性,为了让问题更加明朗,可能通过举例来分析: 例子一:发送者给接收者发送重要情报:某两国即将开战。从信息论而言,这本身是一种信息量很大的信息,但是如果这个消息不正确,可能它就会造成很大的祸害,人们更加看重消息的可靠性,如果信息不可靠,通信是无意义的,信息的价值也不存在。信息论只是力图保证接收者接收到的消息是原来的消息,而对来自于信源的信息是否真正可靠,并没有进行研究。若以上信息不可靠,则两国开战的概率可能不是 1,而是介于0和1之间,这样概率值本身具有随机不确定性。为了不至于将概率的不确定性和信息的不确定性混淆,可以假设发送的情报改为:某两国即将开战的概率为0.7。如果这个情报不绝对可靠,则可能这个概率值不是0.7,而是在0.7附近,此时概率本身不是确定的,值0.7可能只是平均。这种可靠性问题还可能更加复杂,比如除了针对于是否开战可能不可靠外,还可能针对主语有不可靠的可能性,比如,可能不是两国,而是三国,或者两人等等。 例子二:某一事件 m的概率是由一些条件确定的,假设这些条件是c 1 ,c 2 ,,c n ,且假设事件m的概率可以表示为 P(m)= f(c 1 ,c 2 ,,c n ) 假如我们只是对于条件 c 1 未知,其他均已知,或许可以根据条件c 1 的概率分布,求出P(m)的平均值。针对具体的情况,条件c 1 却是已知且确定的,但是在未知该条件的情况下,我们只有权宜地利用该条件未知情况下的平均的概率值来代替真实的概率,这种情况下,两个概率值虽然相近,但是并不等同。当用平均值取代具体的某一值的时候,信息显然不可靠,因此,在本例子中的信息不完备的情况也可以转换为信息不可靠的问题。一般而言,知道的条件越多,条件越完备,得出的概率就越可能接近条件完备的情况下的概率,进而信息也越可靠。本例子的情况可能更加复杂,比如,m的概率在所有的条件都确定的情况下,依然可能是随机变量,好比量子力学中的测不准原理并不是因为隐参量的存在或者量子力学的不完备,而是一种自然的不确定性。 例子三:通过几次实验来测试某一事件 m发生的概率,当已知条件t:实验结果为P t (m)=0.7的情况下,我们并不能知道此条件下事件m发生的概率P(m∣t),只能确定P(m∣t)是在0.7附近的一个随机变量,如果一定要将该随机变量用固定的值0.7代替,该值就会带来可靠性的问题。概率论和信息论中都频频出现联合概率分布和条件概率,但是并没有说明许多条件下,条件概率或者联合概率分布中的概率值本身可能是随机变量,或者部分未知,甚至完全未知的。这样容易导致本来概率值不确定,但是却将不确定的概率值当作确定的概率值。 例子四:某生考试成绩一向非常理想,得优秀的概率为 0.875,但是在一次考试之前,因为生病而耽误了功课,所以其得优秀的概率会下降,假设降到0.75。在未知考生生病和耽误功课之前,我们知道的先验概率的不确定性要小于知道耽误功课以后的后验概率的不确定性。从信息论角度看,后者的信息量反而减少了。现实中,人们并不会因为先验概率不确定性小而选择它,而是会选择条件更加完备的情况下的后验概率,因为它更加贴近实际。这一点说明,以不确定来度量信息是受到限制的,这对于本身不确定的问题是不适用的,此外也说明信息需要有度量其可靠性和完备程度的指标,而且这一指标比度量信息不确定性的信息熵更加重要。 例子五:甲从乙处得到情报:敌人明天早晨百分之九十九要发动进攻。此后,甲同样从丙处得到相同的情报。从信息论角度来看,对于问题敌人明天早晨是否要发动进攻,不确定性是一样的,因而信息量一样,丙似乎并不提供新的信息。但是人们依然会感觉从丙处得到了信息,这种信息使得甲更加确定敌人明天早晨百分之九十九要发动进攻,这一例子进一步说明信息的可靠性应当是一个度量信息的指标。 例子六:当获得消息所有的事件都是等概率发生的的时候,对这句话的内容是什么,或者对于问题所有的事件发生呈现什么样的概率分布而言,它消除了不确定性。但是对于什么事件将发生情况,不可能是更加确定,信息量不可能增加而只可能是减少。这一点说明信息量仅仅是针对于消息本身的不确定性而言的,而该消息衍生出来的问题的不确定性并不与消息的信息量有必然联系,因此,信息熵这一度量的应用范围也是有限的,并不适合应用在日常的信息问题中。 例子七: Brillouin曾经提出了一个悖论:假如一段信息被以文本形式发送,文本的最后一部分却告诉接收者,说明此前的所有的信息都是不真实的。在这样的情况下,是否有信息被传输?Brillouin建议要关注负信息。在该悖论中,有两部分消息,第二部分消息是对前面的一种否定。笔者认为,这两部分消息前后矛盾的,它们的可靠性都是相对的,但是,在一般情况下,假如发送者是诚实的且没有故意开玩笑,则根据语境和情理分析,后面部分的消息正确的可能性大的多,这种情况下,综合前后部分的信息,可以认为没有发送有用的信息。当然也不能绝对地排除发送者在后面犯错误或者是发错消息的可能性。信息论中,消息的各个符号之间的关联采用冗余来表示,但是,该消息在一般情况下可以从整体上看成是一种冗余的编码,即不可能被发送的编码(发送概率为0的编码),由于通信中时延的存在(如果没有时延存在,一般情况下消息会是自恰的),使得本不相容的,也不可能被发送的信息在一个完整的消息中发送。 通过以上的例子分析,暴露出信息论的一些局限性,为挖掘信息论局限性的根源提供了基础。当然,还有许多局限性在这里不一一赘述。 4. 信息论局限性的根源 由以上例子分析可以得出,信息论没有考虑信息的可靠性,而信息的可靠性是一个非常重要的指标。在通信中,由于消息是确定的,因此,不确定性的消除与可靠性的增加有一定的联系。实际上,我们要消除不确定性是很容易的事情,而香农信息论的消除不确定性是以保证信息的可靠性和完备性为基础的,比如利用纠错码纠错,利用后验概率来增强信息的完备性。假如把信息的确定性当作唯一的指标,抛开信息的可靠性问题,则可以随便确定某一事件的概率为 1,其余事件的概率为0就可以了。再假如,我们把信息的确定性当作首要考虑的目标,其次考虑其可靠性,则我们也可以指定概率最大的事件概率为1,其余事件概率为0。这样首先保证了确定性,可靠性也在一定程度上得到了满足。如果如此,信息论和信息处理就变得相当的简单了。显然现实中人们不是这样的。根据以上多处的分析,可靠度是信息的一个首要指标。 以上的信息的可靠性、完备性以及经典集合的不切和实际都可以归结为对信息的多重不确定性的忽视,比如,在实例分析中,我们发现不可靠的信息,它的信息表示本身是不固定的,其概率值可能是随机变量,不完备的信息也是类似。对于模糊集和粗糙集之类的非经典集合,则可以认为是某一个集合包含的对象不确定而造成的,比如,在粗糙集中,对象 a 可能属于也可能不属于集合X,对象a 是否属于集合X就具有随机不确定性。其中一些不确定性与信息论原有的不确定性叠加起来就可能产生多重不确定性。这里的不确定性除了随机不确定性、模糊不确定性,还可能有更多形式的不确定性,包括某些不完全的约束条件造成的不确定性。可见,对信息多重不确定性的忽视是信息论的局限性的重要的根源。对信息可靠性的忽视也是信息论无法广泛应用的重要原因。鉴于所有的信息都很难可靠和完备,所以我们可以将可靠性和完备性问题总归为信息的相对性问题。实际上,现实中人们很难得出完全可靠的信息,只有权宜地采用相对可靠的信息,当有更加可靠的信息的时候,人们会利用更可靠的信息取代先验的信息。由于可靠性也与概率值的不确定性有关系,对信息可靠性的度量也可以借鉴香农对信息不确定性的度量,然而,计算概率的不确定性会比信息熵的计算复杂,因为概率需要满足更多的约束条件。 从 Brillouin悖论和例子四与例子六可以看出香农信息量公式仅仅是用来度量传输特定信息的时候最少的传输量,在通信场合也一定程度上反映可靠性,但是当考虑信息对应引申出来的意义的时候,信息量大小与消息的意义的确定性和内容的多寡并没有必然关系,且某一信息可能增加其他信息的不确定性,甚至一些信息可能一方面增加一些信息的不确定性,一方面减少另外一些信息的不确定性,比如今天下雨这一信息可能减少今天路上潮湿与否的不确定性,但是也会增加今天学生迟到与否的不确定性。可见,是否需要考虑负信息也是值得商榷的。 当然,信息论也与现实信息问题具有很强相似性,信息论的方法很值得在现实的信息问题的研究中(包括信息的可靠性的研究中)借鉴,比如 Brillouin悖论中的自相矛盾与纠错编码出现错误导致的不一致性很相似,可以类似采用取最大概率事件作为真正发生事件,而当概率都很相近的时候,可以类似删除信道进行信息删除。 总而言之,信息论的局限性是源于信息论是针对通信问题的,其模型本身具有的局限性。当然也与概率论的局限性有关系,由于对概率值随机性和多重随机不确定性研究的不足,使得人们容易陷入概率(包括联合概率分布)就是确定值,而不可能是随机变量, 给定条件就可以得出条件概率等思维定势中,而这些思维定势只是适用于现实概率论问题中的一部分。由于信息论的这些限制条件能够较好地满足通信问题,使得它能够在通信领域得到成功的应用,而推广到一般的信息领域则需要针对它的局限性解除相应的约束条件。 5. 结束语 本文分析了香农信息论的一部分局限性,通过对其局限性的研究,一方面可以明确它的适用范围,避免对信息论的滥用,将信息论应用在适用的领域。另一方面,可以为推广和借鉴信息论提供方向,比如可以根据信息表示中概率是固定值的局限性改进信息的表示来适应对信息可靠性研究的需要,进而推广信息论。此外,还为概率论的发展提出了新的方向。信息论也与现实中的信息问题有许多的相似性,如前面提到的对信息可靠性和完备性的考虑。这些相似性为借鉴信息论提供了条件。 参考
个人分类: 相对信息论|2160 次阅读|2 个评论
<个体-标志值-集合>和它的复杂程度之七
zhangxw 2008-7-22 17:53
个体 - 标志值 - 集合 和它的复杂程度之七 ( 7 )复杂程度的定律 (张学文, 2008-7-22 ) 1. 最复杂原理 l 个体集的随机性 掷一个骰子,它出现几点(那点向上)就有随机性,从一副麻将牌中随便取一张牌,它究竟是什么牌也有随机性。玩麻将牌者要拿 13 张牌,这 13 张牌就构成了一个个体集(群体)。显然在没有拿到牌之前,这付牌究竟是什么也有随机性。 100 位顾客买了那些东西,他们的花费各是多少?在 事先也有随机性。看来,某些 个体集及其分布函数究竟是什么的随机性问题是值得研究的 。而这也就引出了 不同的个体集 (如抓 13 张麻将牌) 有不同的出现概率问题 。现在我们设法把它量化和深化。 l 红绿灯模型 某人上班要经过 10 个红绿灯路口。针对每次上班可以问:你遇上了几次红绿灯。本问题的答案显然有随机性。从个体集语言的角度看,经过 10 个有红绿灯的路口等价一个个体集有 10 个个体,红灯、绿灯对应两种标志值。而回答了红灯(或者绿灯)的出现次数也就等价于知道了分布函数(不同颜色的灯各有多少)。如果遇到的红灯次数被概率计算出来了也就知道了 不同的个体集(分布函数)的出现概率(机会) 。 本问题是概率论中的二项分布问题。设红绿灯的出现概率都是 0.5 (相等),经过 10 次路口遇到 m 次红灯的概率 p ( m ) 为 p ( m ) = {10! / }(0.5) 10 ( 11 ) --- 表 8 第二行给出了不同的红绿灯次数 m 对应的不同的出现概率 p ( m ) ,第三行是利用复杂程度公式( 9 )计算出来的对应的复杂程度值。 表 8 不同红绿灯的出现概率 (不同的个体集、分布函数、复杂程度的出现概率不同) 红灯次数 m m =0 m =1 m =2 m =3 m =4 m =5 m =6 m =7 m =8 m =9 m =10 该事件出现的概率 1024 1 10 45 120 210 252 210 120 45 10 1 复杂程度 ( 比特 ) 0 4.6 7.2 8.8 9.7 10 9.7 8.8 7.2 4.6 0 表 8 说明: 出现概率最高的个体集(事件)也是复杂程度最大的个体集(事件) 。在概率的对数与复杂程度的坐标图(略)上它们是直线关系。 l 最复杂原理 如果标志值不仅只是两个(红绿灯)而是 k 个可能值 x 1 , x 2 ,, x i ,, x k 、而它们的出现的概率 p 1 , p 2 ,, p i ,, p k (也称为先验概率)可以彼此不相同、个体的总个数相当多(可以利用 Stirling 公式 ln N != N ln N-N ),利用概率论中的多项式分布公式,可以得到下面的关系 ln P = C + ni ln pi i=1,,k ( 12 ) n i 是概率为 p i 的标志值占有的个体数量。 --- 这个公式体现了不同的个体集的出现概率 P 与其复杂程度 C 的关系。 它表示该个体集的出现概率的对数等于该个体集的复杂程度再加上另外一项。显然当概率达到最大值时,复杂程度与另外一项的合计值也达到最大值。概率最大的事情自然是在一次实验中最容易出现,所以最容易出现的个体集是复杂程度与另外一项的合计值最大的个体集。 另外一项在本例中包括了各个结局的出现概率,它对应着一种限制、约束条件。在另外的场合它的外型可能不同。但是它都包括着一些约束条件。考虑到有的个体集的出现还会附有其他的约束条件,我们把另外一项更含糊化为在限制条件下。于是上面的公式、红绿灯的例子、概率公理和以后的例子,我们把: 有随机性的客观事物(个体集)都自动使自己内部状态的复杂程度在限制条件下达到最大值 称为 最复杂原理。 最复杂原理的正确性体现于多次实践中它经常是对的,而不是每次必然正确,它与正方形的面积等于边长的平方之类的确定性规律在品格上是不同的。 l 定性的例子 你在街上会遇到很多人,有买东西的、上学的、做生意的、出差的、看病的等等。把遇到的人看成是一个个体集,根据最复杂原理这个个体集内的人(个体)的活动目标(标志值)会自动最复杂化。从商店出来的人都买了相同商品的事件的出现概率就非常小的,最容易出现的情况是买什么东西的人都有。所以最容易出现的也正是复杂程度最大的。你把一个玻璃杯摔碎了,碎玻璃的大小都相同?根据最复杂原理,它们是尽量地不相同,碎玻璃的大小尽量复杂化。仔细想想,符合最复杂原理的事物几乎是司空见惯。 l 定量的例子 斩乱麻问题 最复杂原理不仅在生活的事例早已司空见惯,而且也可以推导出很多定量规律。 利用分布函数可以计算该个体集的复杂程度。对此也可以 反过来思考 :对于有随机性的个体集,根据最复杂原理(复杂程度最大),能否反算出分布函数? 这个问题非常有吸引力。但是,在离散变量的情况要利用求函数的极值的技巧反求自变量(分布函数)。在连续变量的情况下就要利用变分技术去反算未知函数(连续型的分布函数)。拉哥朗日乘子方法经常帮助我们达到目标。现以 斩乱麻问题 为例说明之。 把长为 L 的绳子 随机地 切割成充分多的 N 段,问 不同长度的线段各有多少 。这就是斩乱麻问题 。把切碎的绳子看作是个体集,这就是利用随机性从理论推测其分布函数。 切割的随机性造成了线段长短不齐,它体现了事物的 复杂性 。以 f(x) 这个分布函数表示不同长度的线段占的百分比(权重),那么它对应的复杂程度为 C =- Nf ( x )ln f ( x )d x ( 13 ) 切割当然不是烧掉,切割后的线头总长度应当等于 L ,即 L = Nxf(x )d x ( 14 ) 根据最复杂原理, C 应当在一定的约束条件下达到最大值。而上式是一个约束,另外百分比的合计值应当等于 1 ,即 1= f(x )d x ( 15 ) 也是一个约束条件。 现在的问题是:在( 14 )、( 15 )的约束条件下使 C 最大的分布函数 f(x ) 应当是什么。根据求泛函数极值的拉哥朗日方法,构造一个新的函数 F : F =- f(x )ln f( x)dx + C 1 + C 2 ( 16 ) -- 这里的 C 2 , C 2 是待定常数。很显然,复杂程度 C 达到最大值, F 也达到了最大值。在 F 达到最大值(体现最复杂原理,也考虑了本问题的特殊约束条件)时它对未知函数 f(x ) 的变分应当等于 0 。利用 F 对 f 的变分为 0 ,我们得到 f ( x )=exp ( -1+ C 1 x + C 2 )。 -- 利用( 14 )和( 15 )消去未知数 C 2 , C 2 解得 f(x )= ( N/L ) exp(- Nx/L ) 注意到 L/N 的含义是线头的平均长度,以 a 表示它 ( 也是常数 ) ,有 f(x )=(1/ a )exp ( 17 ) 它是一个负指数函数。即一堆斩乱麻中,不同长度的线头占的百分比(分布函数),应当是 负指数函数 (相对密度分布函数)。 它显示长度 x 短(小)的线头多而长线头很少。 根据相对密度分布函数的定义,线头长度在 x x+ x 范围的有 Nf(x ) x 段。如 L = 200 米 ,切成 N =20000 段(平均值 a = 1cm ),可以计算出长度在 3 4 cm 范围的线头有 604 段,占总量的 3% 。 我们可以做一个 数值模拟实验 以得到一个斩乱麻的样本。对比显示最复杂原理得到的理论分布与模拟实验结果的 一致的 。这说明最复杂原理与实际相符合。例子中虽然利用了复杂程度最大,但是没有计算复杂程度的最大值究竟是多少。原因是我们主要兴趣是利用复杂程度最大去推算理论的分布函数。 一般地说,只要某个体集具有随机性,就可以 利用最复杂原理配合不同的约束条件得到不同的理论分布函数 。客观存在的有随机性的个体集很多,所以利用最复杂原理求分布函数的一般方法有广泛的应用和价值。 l 熵原理与最复杂原理 我们从不同的个体 - 标志着 - 集合的出现概率入手,利用了概率最大对应复杂程度最大,从而得到了复杂程度最大的个体集也就是出现概率高的个体集。我们把它称为最复杂原理。由于已经说明热力学熵是复杂程度的特例,所以联系着热力学熵的热力学第二定律(熵原理,熵最大原理)也是最复杂原理的特例。 2. 复杂度定律 复杂程度是物质自身天然具有的属性,它和质量、能量一样地真实。关于物质的质量、物质的能量已经有了质量守恒、能量守恒定律,与之对应也应当 存在一个关于物质的复杂程度的变化规律,现在暂称为复杂度定律 。限于篇幅这里仅指出某些观点: l 个体集概念有层次性,复杂程度也具有层次性。不同层次(形态)的复杂程度都客观存在。这类似物质的能量有化学能和核能。不同形态的能量可以互相转化, 不同层次(形态)的复杂程度也可以互相转化。 l 有限的物质仅具有有限的质量和能量,它也仅具有有限的复杂程度。 物质可以无限分隔的观点等价于有限物质的复杂程度为无穷大,这个观点使复杂程度概念失去物质性,所以它是错误的。 l 建议 把目前流行的 世界的 三元观 (物质 + 能量 + 信息)修改为 物质属性 的三元观 (质量 + 能量 + 复杂程度)。 l 存在着质量变换机构(如木器厂)、能量变换机构(如水利发电厂)和信息变换机构(如电视机),但是使 输出的质量、能量、信息大于出入的变换机构是不存在的 。 l 爱因斯坦的质量能量公式可能要扩大为 质量、能量、复杂程度之间的定量互相转化关系 ,而其总量具有保守性。写为公式就是,对于孤立系统,有 m + E / v 2 + k C =0 ( 18 ) 这里的 v 是光速、 C 是复杂程度、 m , E 分别是质量和能量。而 k 是待定常数。 l 我们暂且 把上面的认识连同最复杂原理合称为复杂度定律 。 3. 小结 根据个体集(客观事物)的分布函数,利用公式( 9 )可以计算该广义集合的内部状态的复杂程度。具有随机性的广义集合,它的复杂程度常常是在一定约束条件下的最大值。利用这个最复杂原理可以推导很多事物(个体集)的理论分布函数。 复杂程度是客观物质具有的基本物理量,它与质量、能量一样的真实,在一定的意义下它与信息熵成正比例。关于客观事物的复杂程度的一般规律与最复杂原理一并称为复杂度定律。 本部分的内容取自 2002 年《物理与工程》杂志 12 卷第 5 期上 组成论 介绍(中)一文,但是做了一些删减、修订、补充。
个人分类: 组成论|4910 次阅读|0 个评论
<个体-标志值-集合>和它的复杂程度之六
zhangxw 2008-7-7 18:01
个体 - 标志值 - 集合 和它的复杂程度之六 张学文 20080707 (6 )复杂程度概念 1. 复杂和复杂程度 低年级的小学生就知道复杂二字的含义。可是从科学的角度看,要把复杂提炼为科学名词,就需要把它定量化。确实如果我们可以把复杂量化为一个可以计算的量,并且方便地用到十分广泛的领域,那么我们就提炼了一个重要概念。 在系统科学里人们要研究复杂的系统。最近 30 年所谓复杂性研究又成为热门。在这些领域都标榜自己研究涉及复杂的问题,如果对复杂的定量计量问题都没有很好的解决,那么这个研究必然存在基本的弱点。因此给复杂下个妥当的定义,并且在各种场合可以具体计算出来复杂程度是多少,这就是件重要的事情。 在前面交代了个体 - 概念 - 集合和分布函数概念,再引入复杂程度概念就十分方便了。 复杂程度: 用个体集的分布函数计算一个数(C) 对于由 N 个个体组成的一个个体集,根据其中每个标志值占有的个体数量 n i , ( i =1 , 2 , , p , 显然 pN ))都可以用下面的公式计算出一个数值来。我们用大写的 C 表示这个数: C = N log N - n i log n i ~~( i =1,2,, p ) 这里的各个 n i 就是各个标志值 x i 所对应的个体的数量。或者说是分布函数的函数值。 这里的 log 是数学里的取 对数 的意思(对数的底应当是大于 1 的实数)。如果对数是以 2 为底的,其复杂程度的单位就称为比特 , bite 。它与信息论里的单位是相同。 经过对这个量的多侧面分析,我们认为 把数值 C 称为该个体集的复杂程度是很妥当又十分需要的 。 只要每个个体集的分布函数是知道的,就可以计算出该个体集的复杂程度 C 。个体集可以用到物理、化学、生物、地理、天文以致社会科学,所以这个公式可以计算很多领域的研究对象(个体集)的复杂程度。 2. 计算复杂程度的例子 个体集 是指一个白球和两个黑球,求这个个体集的复杂程度 =1( 白球 )+2( 黑球 ) C A =3log3-1log1-2log2=2.75 比特(计算时对数以 2 为底,下同) 我们可以把它理解为个体集内标志值的差别程度、可区分的状态的丰富程度或者状态的混乱程度。如果 3 个球都是一个颜色,那么公式变成了 C =3log3-3log3 = 0 即其复杂程度为零,它说明清一色的系统,其复杂程度为零(再简单不过,所以复杂程度的最小值是 0 ,它没有负值)。而且无论这里有多少个个体,其复杂程度都是 0 。一个水库里有很多水分子,你可以说那里物质很多,但是该系统的内部的状态却是清一色的水,这十分单纯,所以状态的丰富(复杂)程度小到了最低值, 0 。 由 0 , 1 , 2 , , 9 这 10 个数组成的数的复杂程度= 10log 2 10=33.21928bite (注意 log1=0 )。由 26 个英文字母组成的个体集的复杂程度= 20log26=26 log26 3.321928=122.2 bite 。一副扑克牌有 54 张,每张都不同,根据复杂程度公式,其复杂程度= 54log54=310.76 bite( 比特 ) 。 钱夹里有 3 张 100 元的、 4 张 50 元的、 5 张 10 元的人民币,班里有 23 个女同学和 21 个男同学,这些个体集的复杂程度大家不难根据公式计算。 下面是求算复杂程度的更多的例子(题目),它们体现了很多领域都存在对应的复杂程度的计算。它们都用这里提供的公式,而这些我们过去可能没有想到。利用这些计算自然可以展开对应的分析研究。确实,过去不少人围绕平均值做了很多文章;现在我们看到一切可以计算平均值的数据都可以拿了再计算另外一个重要的数 -- 复杂程度 C ,所以利用复杂程度再写文章很多的机会已经来了。 l 已经知道不同年龄的中国人各有多少,于是可以求中国的人口年龄的复杂程度。 l 一个国家有 30 万公里的公路,已经知道不同等级的公路各有多少,求公路等级的复杂程度。 l 已经知道 500 强企业的资产,求企业的资产的复杂程度。 l 已经知道 10 万平方公里面积受到了不同烈度的地震灾害的面积各有多少,求该地区地震烈度的复杂程度。 l 已经知道本省 12 万平方公里面积上不同雨量分别占了多少面积,求雨量分布的复杂程度。 l 已经知道本岛屿上不同物种的动物各有多少,求该岛上动物的复杂程度。 l 知道班上 57 位同学的考试成绩,求考试成绩的复杂程度。 l 运动会的门票 1 等的 200 张, 2 等的 1000 张, 3 等的 1200 张,求运动会门票的复杂程度。 3. 复杂程度的重要性质 根据复杂程度公式,注意到 N , 以及各个 n i 都是正整数,不难知道复杂程度不会出现负值。而当每个标志值仅占有一个个体时(各个个体的标志值都不相同时,复杂程度达到它的最大值, C = N log N 。当 N = 1 时,即这个个体集里只有一个个体,其复杂程度= 0 。 个体集 与个体集 如果它们所包括的个体是同类个体,而且标志相同(标志值可以不同),当它们合并为一个个体集以后,新的个体集的复杂程度可以大于原个体集的复杂程度的和。如 是一个红球, 是 1 个白球,把它们合成一个由两个球组成的新的个体集,则新的个体集的复杂程度= 2log2 ,由于原个体集的复杂程度都是 0 ,所以个体集的合并(加法)体现了 0+00 的特点。它对哲学家热心讨论的 1+1 大于 2 问题给了一个严格的数学、物理论证 。 在信息论的语言里,面对一个个体集进行一次(不是 2 次,或者多次)抽样的结局的不确定性 H 被表示为 H =- p i log p i ~~ ( i =1,2,, p ) 注意到 p i = n i /N, 有 , C = NH, 即信息熵 H 的 N 倍就是复杂程度 C 。于是沿着现在的思路引入的复杂程度概念与信息论里的信息熵概念是成正比例的量(如果进行 N 次抽样,其结局的信息熵恰好等于复杂程度 C )。由于信息论中已经发现了信息熵的很多数学性质,借着这个关系,信息熵的很多知识也自动归入复杂程度的性质中。 《组成论》还指出在热力学领域,复杂程度(乘玻尔兹曼常数以后)就是物理学中的热力学熵。 于是我们看到复杂程度概念吸收了物理学的热力学熵、信息论的信息熵作为自己的特例,它同时把自己方便的用到一切 个体集 上。所以复杂程度概念的明朗化也是熵概念在新理解方式下的合理扩展(从热力学扩展到其它领域,这可以是概率领域,也可以是另外的)。 4. 复杂程度物理意义 应当说规定前面的计算量 C 为复杂程度的核心理由是它的计算结果符合大家在生活中对复杂一词的理解。这就使得用途十分广的复杂概念有了比较科学的量化途径。而各种场合对复杂二字的理解自然就成为理解复杂程度公式的多种思路。 前面已经看到该系统内(个体集)的不同(可分辨)的标志值(状态)越多则复杂程度越大(相同的标志值的数量越多复杂程度越小);个体数量( N ) 很大,则复杂程度大。在有些场合这个量,体现了该系统内部状态的多样性,复杂程度是个中性词。 热力学关注物质分子运动的混乱、差异、丰富程度,并且用热力学熵表示它,所以你可以借助热力学熵理解复杂程度,也可以反过来,借助复杂程度理解热力学熵(比较流行的把热力学熵说成为无序程度是不准确的,因为序不能简单的用复杂来度量,所以我们不使用这个提法)。在信息论里人们考虑抽样结局的不确定性,它现在也成为理解复杂程度概念的一个角度。相信大家在把它用到不同场合时会逐步加深对这个重要的词汇的理解和运用。 5. 关于复杂程度的定律 我们从个体概念的清晰化,引申出关于个体的集合概念,即个体 - 标志值 - 集合(个体集),随后提出了对个体集的分布函数概念的提炼和个体集的特征量的讨论,并且引出了复杂程度概念。复杂程度概念与热力学熵概念、信息熵概念的 联系固然是我们重要的收获,但是新概念的引入如果没有与新规律的揭露联系起来,人们可能就怀疑这样做是否值得。我们后面就要说明前面这些概念、公式的引入核心是为了引入一个定律,复杂度定律。
个人分类: 组成论|4321 次阅读|0 个评论
<个体-标志值-集合>和它的复杂程度之五
zhangxw 2008-6-30 16:55
个体 - 标志值 - 集合 和它的复杂程度之五 ( 5 )个体集的表示、运算和特征量 张学文 20080630 在数学中一切进步都是引入符号(表意符号)后的反应――皮亚诺( G.Peano ) 让个体概念进入科学领域,还需要引入有关的符号以及量化、运算方法 1. 字符多项式 我们一般地把有 p 项组成的 a 1 x 1 +a 2 x 2 ++a i x i +a p x p 的式子称为字符多项式。在外型上,字符多项式类似初等代数里的多元一次多项式,但是它们的各个 a i 和 x i 都可以是独立的,有一定意义的 字符串 (不再单纯是数了)。而 + 号也需要针对需要去定义(说明)。由于它们经常不再是数,所以连写在一起,也不具有数的乘法的意义。 这里有 9 个水果: 3 个苹果, 2 个梨, 4 个香蕉,可以用字符多项式写为 ( 3 个)(苹果) + ( 2 个)(梨) + ( 4 个)(香蕉)。它对应的字符多项式里的字符串见表 6 表 6 例子里的各个字符串在字符多项式一般公式中的含义 符号 a 1 a 2 a 3 x 1 x 2 x 3 含义 3 个 2 个 4 个 苹果 梨子 香蕉 而字符多项式里的 + 号具有还有的意义(不是强行把含义不同的东西做 代数 加法)。 数学老师会告诉我们 3 个苹果不能与 2 个梨做加法,因为它们的单位不同。但是这里对加号有了另外的理解,于是 3 个(苹果) +2 个 ( 梨 ) 就是合格的表达式了。显然, 3 个(苹果) +2 个 ( 梨 ) = 2 个 ( 梨 )+3 个(苹果)。 文献【 3 】初步讨论了字符多项式和它的一些应用。哪里还指出它可以表示各种表格。下面我们要用它表示个体集。 2. 个体集的符号表示 对于个体集本身,我们一般用被方括弧包起来的大写粗斜体的字母表示它(这与集合的表示类似)。如用 表示盘子里有 9 个水果: 3 个苹果, 2 个梨, 4 个香蕉。 、 、 等等都是可以用的符号。 3. 离散的分布函数的符号表示 鉴于经常出现分布函数的自变量不是过去常用的连续变量而可以是离散的特征标志(如名字是苹果、梨、香蕉的水果、兰色的,黄色的 .. ),所以我们推荐用 字符多项式去表示分布函数 。例如前面的例子里,我们就用下式表示这个个体集的分布函数 = ( 3 个)(苹果) + ( 2 个)(梨) + ( 4 个)(香蕉) 这里的 代表了一个个体集,而等号后面表示该个体集的分布函数。 显然 =15 个(儿童) +16 个(成年人) +9 个(老年人)表示了不同年龄段的人各有多少, 就是一个分布函数明确的个体集。这里把园括号省略了。 =14(70 分以下 )+25 ( 70-90 分) +10 ( 90 分以上)表示了一次考试的全班成绩的个体集的分布函数,它告诉我们 70 分以下的学生有 14 个, 70 到 90 分的学生 25 个,高于 90 分的学生有 10 个。 根据上面的说明,我们一般用方括弧包起来的大写粗斜体的字母表示个体集本身;而用字符多项式表示该个体集的分布函数。这里的等号=体现了前面的认识:知道了它的分布函数,也就 等于 知道了一个确定的个体集。而加号 + 的意义是还有、还包括有的意思。 如果再借用数学里的求和符号,个体集的分布函数就可以一般的写为下面格式: = n i x i 这里的各个 x i 是彼此不同的标志值(也称为变量);而各个 n i 是对应于该标志值的个体的数量(这里用符号 n 代替了 a , 它包含计量单位个)。我们也用系数称呼它。 对于分布函数是连续变量的情况(标志值是连续变化的),它们对应的个体数量也是连续变化的情况(在个体数量十分大的情况下才会出现化离散为连续的数学处理技巧问题)出现这个问题,我们依然可以用数学里惯用的连续函数去表示它。 4. 个体集的运算 如果我们给某概念一个比较严的定义,而提不出随后有什么好处(定量的计算、新规律的发现 )这样的定义也就没有吸引力了。 已知甲小学的不同年级各有多少学生,还知道乙小学不同年级各有多少学生。求两个学校合并以后的不同年级各有多少学生。如果用个体集 分别表示两个学校的学生个体集,两个小学合并以后的个体集用 表示,那么个体集 就是 、 的和。这里的和是一种数学运算,这可以写为 = + 如何对两个个体集做加法运算?其实,运用代数里的多项式加法(合并同类项)正合适。在这里已经看到我们定义的字符多项式的好处。 《组成论》里介绍了个体集(哪里称为广义集合)的某些运算规则。它把我们过去熟悉的一些逻辑和代数运算规则,如加、减、乘、除等,引用到个体集中。通过这些运算可以得到含义明确的新的个体集。个体集不仅成为可以运算的对象,而且通过运算扩展了我们的知识。 5. 个体集的某些特征量(参数) 个体集存在一些重要的特征量或者说重要参数。 5.1 个体集的 个体总数 N :由于我们突出了个体的完整性(量子化)、离散化(现在时髦的称呼是数字化)所有个体集里所包括的个体的数量应当是个正整数。这个正整数自然称为该个体集的个体总数。这个小学校有 400 学生,中国有 13 亿人、哪个盘子里有 7 个水果都是例子。根据定义,个体集的个体总数显然是个体集的分布函数多项式表示下的各个系数的和,即 N = n i i =1, ,p 5.2 个体集的标志值的 平均值 m :如果某一个体集的各个标志值 x i 是 物理量 (包括单位)而不是字符串,那么通过下面公式得到的数值显然应当称为该个体集的标志值的平均值(与统计学里的定义一致) m = n i x i /N ( i =1p) 公式中的 n i 和 x i 都是数,而且这里是真的在 n i 和 x i 进行普通的代数运算(相乘)。运算得到的 m 的量纲应当与 x i 相同。 甲班的学生 - 年龄个体集为 = 3 个( 12 岁) +15 个( 13 岁) +11 个( 14 岁) +1 个( 15 岁) 那么甲班学生的平均年龄 m 显然是 M=(3*12+15*13+14*11+1*15)/(12+15+14+1)=13.3 即平均年龄是 13.3 岁。 5.3 个体集内不同标志值占的百分比(权重) f i :它等于具有标志值 x i 的个体数量 n i 与总体内的个体总量 N 的比值。即 f i = n i / N 百分比本来就是大家熟悉的统计量。现在用到这里了。 显然,各个标志值的 f i 的合计值应当等于 1 。 有时这被称为归一性。 1= f i = n i /N i =1, ,p 表 7 可以帮助理解上面谈到的一些特征量的关系。 表 7 个体集的一些特征量的关系 一般符号表示 总计 标志值(区间) x 1 x 2 x i 从下界到上界 个体数量 n 1 n 2 n i N 比例 n 1 / N n 2 / N n i / N N / N 百分比 f 1 f 2 f i 下面是特例 总计 年龄(岁) 12 13 14 15 12-15 学生(个) 3 15 11 1 30 百分比 3/30 15/30 11/30 1/30 30/30 定义: 百分比矢量 f 是个体集必然具有的一个矢量,它的各个分量就是具有特定的标志值 x i 的个体的数量与个体集内个体总量的比值 n i / N ,即 f i ( i =1,2, )。 如本班有 50 个同学,女生占 30 人,男生 20 人,则这个个体集的百分比矢量 f 的两个分量(顺序是女,男)是( 0.6 , 0.4 )。任何一个个体集的百分比矢量的各个分量代数和等于 1 。 5.4 百分比的代数平均值和几何平均值 (冯向军博士 2004 年评论《组成论》的一篇短文指出了百分比或者概率的平方和的物理意义。这里是在该认识上的综合和发挥,在此特做说明,在笔者看来这是冯向军博士的一个重要贡献。) 假设个体集内的每个个体用一个卡片代表它,而在卡片上根据它原来的标志值 x i ,写上该标志值对应的百分比的值 f i 。那么也可以认为 百分比本身就是标志值 了。即这个个体的标志值 x i 就改用 x i 占的百分比 f i 来代替了。 由于百分比这个新的标志值是数值,我们自然可以求这个个体集内各个个体的百分比的平均值。而根据平均值的定义, m = n i x i /N ,注意到现在 f i 代替 x i (相当于对自变量的函数求平均值),而 f i = n i /N ,自然有百分比的平均值公式: m f = n i 2 / N 2 = f i 2 i =1, ,p 于是我们知道一个个体集内的不同的标志值占的百分比的平方和,就是各个个体的新标志(百分比)的平均值。按照统计学的语言,这种平均值应当称为代数平均值或者算术平均值。 对于直角坐标系下的平面上的一个矢量,我们知道其分量的平方和是个有意义的量(开平方以后是该矢量的长度)。在 p 维空间中的一个矢量,其各个分量的平方和也是有意义的。对于个体集来说,它的百分比矢量的平方和等于百分比的平均值。 另外,对百分比,还可以求其几何平均值。根据几何平均值的定义,个体集内的百分比的几何平均值 m' f 应当是 m' f N = f i ni i =1, ,p 以上两个平均值都是个体集的重要特征量,它们与熵有特殊关系,这些后面再讨论。 5.5 个体集的复杂程度 C :其定义是 C = N log N - n i log n i i =1, ,p 这个公式给复杂程度以定量的定义,它还把应用于热力学的熵和应用于通讯领域的信息熵扩展到更广的领域。我们在下一讲再展开讨论。
个人分类: 组成论|3841 次阅读|0 个评论
<个体-标志值-集合>和它的复杂程度之四
zhangxw 2008-6-27 10:37
个体 - 标志值 - 集合 和它的复杂程度之四 张学文 20080627 (4 )个体- 标志值- 集合 1. 个体的标志 根据个体的定义,每个个体有特定的边界和内在特征,所以每个 个体 都根据其边界或者内部特征而具有若干个特征 标志 。太阳系的每个行星都是一个个体。而这里的每个行星都具有自己的质量、体积、自转周期、它与太阳的距离等这些 特征标志 。对于本班的同学,我们可以说这里的每个同学都有特定的身高、体重、年龄等。身高、体重、年龄就是这些个体的统一的 特征标志 ,而质量、体积、自转周期、与太阳的距离是每个行星都具有的 特征标志 。确实,我们都是通过各个特征来认识各个个体的,所以个体具有特征标志的几乎是不言自明。 2. 个体的标志值 对于每个个体,它不仅具有若干个特征标志,而且对每个标志,在确定的时刻,它都有具体的、确定的 特征值 。例如对本班的学生甲(个体)身高 1.2 米 ,体重 24 千克 ,年龄 8 岁,这里的 1.2 米 就是身高这个特征标志的标志值。 24 千克 , 8 岁是分别是体重和年龄的特征值。 365 天自转一圈、半径是 6370 千米 分别地球这个个体的自转速度、体积这两个特征标志的标志值。 表 1 个体-标志-标志值举例 个体的名称 特征标志 标志值举例 一张麻将牌 条、并、万等 柒条 一个学生 学生的体重 体重 37 千克 一升 海水 海水的温度 温度 23 度 一本书 书的价格 15 元 一张选票 投票结果 赞成票 一张人民币 人民币票面值 五元 在上面的表中列了一些个体的特征标志和特征值。这里的多数例子的特征值是有单位的具体数值量,这些与物理量十分类似。而选举的例子中,其标志值不是数值量而是字符串。这说明特征值也可以是含义明确的字符串,而不限于是有单位的数。 在统计学和概率论里人们用 随机变量 概念,我们这里的标志相当于哪里的随机变量,而标志值是随机变量在特定时刻或者特定的抽象试验的结局的 取值 。以后我们把随机变量与标志两个词混同使用。请注意这里谈的标志值都是针对该个体在特定时刻(特定场合)而言的。不同的时刻该个体可能有不同的标志值。 3. 同类个体 定义 :具有某些相同的特征标志的个体称为 同类个体 。 同类个体往往有集体的名称(语言学里称为集体名词,以与特有名词相对)。行星、苹果、学生、劳动者、乘客、家用电器等这类个体的统称,都是它们的例子。 4. 个体 - 标志值 - 集合(个体集) 定义 :由若干个(一般是有限个)同类个体组成的集体里,如果就某一标志(或某 些 标志)而言,每个个体在确定时刻有确定的标志值,就把该集体称为 个体 - 标志值 - 集合 ,简称为 个体集 。 这里的 3 只羊的体重分别为 5 、 28 、 34 千克 。每个羊作为个体而存在,体重是它们都具体的特征标志,而 5 、 28 、 34 千克是每只羊的标志值(这里的标志值是有单位的数量)。它们就组成了一个 个体 - 标志值 - 集合 ,即 个体集 。有 5 个球, 3 红, 2 黄,球是个体,颜色是它们共同具有的标志,红色、黄色是它们各自的标志值(这里的标志值不是数,是字符串)。所以这 5 球组成的集体是一个 个体 - 标志值 - 集合 ,或者说是个明确的 个体集 。 已经知道本班 34 位同学的身高,这就是一个个体集。已经知道太阳系的各个行星的直径,也构成一个个体集。依然是这 34 位同学,知道每个学生的体重,也构成另外的一个个体 - 标志值-集合(个体集)。 《组成论》里讲的 广义集合 就是这里的 个体集 。通过本文,我把广义集合改称为 个体集 ,关于确定时刻的若干同类的个体以及各个个体的标志值的 知识集体 。 个体集内的每个个体具有的标志可能不只一个(如每个学生不仅具有身高,还具有体重、年龄 ),但是为了集中研究我们特别关注的侧面,我们通常只分析它们的一个或者两个等少数标志,而暂时回避其它的标志。《组成论》里提供了各个科学分支里大量的个体集的例子。 数学里早就有了集合概念。这里的个体 - 标志值 - 集合既借用了集合的概念,又突出了以 个体 为元素的这个物理特点,它还涉及了标志值概念,甚至于它还知道不同标志值的个体数量是多少(知道一个函数,见下)。这些知识自然比数学里的一般集合概念要丰富。我们指望它在自然和社会科学中更容易应用。您可以把它看作是集合概念向物理内容的靠拢。 5. 个体集的例子和类别 《组成论》提供了在各个领域的个体集(哪里称为广义集合)的大量例子,并且把它们分为六类(表 2 )。 表2 六类个体集的特点 类型 个体的特点 标志值的特点 例子 物质组成 物质名词(种) 物质名词(属) 三个苹果两个梨 时空场 空间、时间单元 空间或者时间的编号 一年有四季、礼堂座位编号 运动 时间单元 物体在空间的位置 一辆运行中的公共汽车。 物理场 空间单元(有时也是质量) 物体在该处的特征值 一张有等高线的地图 随机实验 与概率 每次随机实验 实验的结果 掷一次骰子 抽象事物 视问题而定 视问题而定 所有由假想事物构成(并不真的存在)的个体集都是其例。 6. 个体集的分布函数 对于每个明确的个体-标志值-集合(个体集),我们都可以提出这样一个问题: 在确定的时刻,具有不同标志值的个体各有多少 。 既然每个个体在确定时刻的标志值是多少(是什么)是确定的(有时是已经知道的),自然该个体集内的各个标志值 x i 和它对应的个体的数量 n i 的关系也是确定(唯一的)。如果已经知道每个同学的身高,自然知道本班的不同身高的同学各有多少,既然知道每只羊的体重,自然知道不同体重的羊各有多少。所以上面的问题必然有答案。 我们把这个答案称为该个体集的 分布函数 。这里的标志值是自变量 x i ,而各个标志值所对应的个体的数量 n i 是函数值。 根据这个说明,前面的两个个体集的例子的分布函数可以用表或者图表示。 表 3 三只羊( 5 个球)组成的个体集的分布函数 三只羊的个体集 自变量(体重 / 千克) 5 28 34 函数值(羊的个数) 1 1 1 5 个球的个体集 自变量(颜色) 红色 黄色 其它颜色 函数值(球的个数) 3 2 0 图 1 五个球组成的个体集的分布函数(略) 在每个确定时刻,每个个体只能有唯一的标志值。而不能是多值。所以分布函数是 单值函数 。 每个个体集在确定时刻有唯一的分布函数。它告诉我们标志值 x i 的个体的数量 n i 。用表的格式表示这个函数就是 表 4 分布函数的表格表示 自变量 x 1 x 2 x i x p 函数值 n 1 n 2 n i n p 用公式表示这个函数就是 n = f ( x ) (1) 这里的函数二字的含义与数学、逻辑中的含义是一致的。 既然每个个体集都伴有唯一的单值的分布函数,我们也就认为:知道了分布函数也就确定了该个体集。 7. 个体集的分布函数的例子 表 5 个体集的分布函数的例子 与分布函数对应的问题 标志值 函数值意义 不同身高的学生各有多少(如三年级) 学生身高 学生数量 不同的年产值的企业各有多少 企业年产值 企业数量 不同人口数量的国家各有多少 国家的人口数 国家数量 不同吨位的轮船各有多少 吨位 轮船数量 不同质量的恒星各有多少(如银河系) 质量 恒星数量 不同温度的日子各有多少(如 1 年中) 温度 天数 不同拔海高度的面积各有多少(如中国) 拔海高度 面积 不同的随机变量 x 值的出现概率是多少 随机变量 x 出现概率 标志值可以是离散变量,也可以是连续变量,而函数可以是连续函数也可以不连续。《组成论》里提供了更多的例子。 表中最后一个例子把所有的概率分布函数都归入个体集模型内,即它们是个体集的分布函数的特例。但是这里在 用词 上与那里 有一些差别 。这里的连续型分布函数对应于哪里的概率密度分布函数(哪里的概率分布函数是概率密度分布函数的从变量下限开始到目前值的积分)。 ( 旁白:我们慢吞吞的讨论大家早就熟悉的 个体 二字,现在居然发现同类个体的 集合必然存在着一个函数,好像我们走了一段熟路可居然看到前面出现了新景,有趣! )
个人分类: 组成论|5627 次阅读|0 个评论
<个体-标志值-集合>和它的复杂程度之三
zhangxw 2008-6-23 10:27
个体 - 标志值 - 集合 和它的复杂程度之三 张学文 20080623 (3 )把个体提炼为科学名词(科学概念) 1. 个体 5 个苹果, 3 个梨子,这里的每个苹果、每个梨子都是个体的特例。确实,小学生也知道个体二字的大概含义。生物个体、我国改革开放初期的个体户都是有关个体的著名例子。我们几乎找不到一个领域不能使用 个体 这两个字。在这个背景下,对这个使用领域非常宽的词,现在进行一番科学提炼,说不定可以惠及各个科学学科。 2. 个体概念的定义 把 个体 提升为一个科学名词,就要给它更清楚的定义。在《组成论》【 1 】里,个体是广义集合的基础,哪里给出了对它的说明。在《 横贯众多领域的一个概念和一个单位》 【 2 】一文中对个体的分析又进一步,并且给出了定义。 在参考文献【 2 】的基础上,这里把 个体 定义为: 个体是总体(宇宙、世界、群体)的某一部分,它可以独立存在、与外界有比较清楚的边界、在边界内有比较清楚的特征(特定质地、性质、结构、功能、目标 ) 。 3. 个体的例子 每个电子、每个分子、每个细胞、每个生物、每个人、每个城市、每个国家、每个星星、每个星系都符合个体的定义。所以过去在科学、生活和社会实践中大家理解的各种个体都符合这里的个体的定义。 有 10 张 100 元的钞票。每张钞票有清楚的边界,而且它们印有特定的图案文字,它们独立存在、使用,所以每张钞票就是一个个体。教室坐着 20 个学生,每个学生与其他学生都有清楚的分界,而且每个学生有特定内质,可以独立活动,自然应当承认每个学生是一个个体。 符合这个定义的个体不只这些类型。例如一个骰子,把它掷了 50 次,每次都与其他各次过程无关,应当承认每个过程与另外的过程有清楚的分界,每次过程都有确定的点数向上,每个掷骰子的 过程 都是一个独立过程。这种彼此独立的 过程 也可以算是过程(事件)个体。篮球赛每场 4 节,今天会议上有 10 个报告,我下了 5 盘象棋,这里的每个报告、每盘棋都是一个 过程(事件)个体 。 英文里有 26 个 字母 ,最近做了很多 恶梦 ,大家提出了很多 办法 这里的每个字母或者每个恶梦或者每个办法,都与抽象世界中的其他部分有清楚的边界,并且有特定的内容,而且它们独立存在。这些抽象对象也符合个体的定义。它们算抽象个体。 4. 著名的个体 100 元一张的人民币,谁不喜欢?它是著名的个体,一个人,是个体,也是万物之灵,自然界为什么出现这样的物质?太神了。电脑、手机、飞机、轮船、人造卫星都是著名的个体。统计学里的一次采样结果、一届奥运会、一个 EXCEL 软件、一次太空飞行都是著名的个体。 5. 说明 l 个体的命名:只要有需要,我们可以为每个个体专门取一个抽象的名词代表这个完整的对象。每个人有姓名。这个姓名不是属于某人的某部分而是该完整对象。体现着个体具有整体完整性。对已经发现的每个星星有命名、对每个城市、国家有命名都是例子。有时为了研究的方便,对每个个体临时给个 号码 ,这也是对各个个体的命名。 l 个体的类别:某些个体如果具有某种一致的特点,经常为该一批、一类个体取相同的名字。当我们说到 5 个苹果或者 7 个羊、 9 个星星、 3 个电子时,苹果、羊、星星、电子是一类个体的统称。在该命名下的每个个体具有 相同的地位 。分别研究不同类别的个体,是科学得以分科的重要标准。 l 个体的边界:既然存在边界是个体的共性,单独研究边界自然是个合格的科学课题。曹鸿兴研究员著《系统周界的一般理论 -- 界壳论》一书(气象出版社, 1997 ),开此研究之先河。 l 个体的内容:边界把个体与外界分开,而个体内部是具有特定质地、性质、结构 的。每个苹果、人、星星、国家都有内部特有的质地、性质、结构以至功能、目标,这些内容太丰富了,它们是各个具体科学分科的研究内容。我们只想从总体上概括它们,而不代替各个学科对它们的分门别类的研究。 6. 个体的重要性质 l 个体的完整性:个体这个名称是赋予该完整对象的,这个对象具有相对意义下的 不可再分性 。个体的存在体现在它的完整性。再分就失去了原来的定义和意义。我们不能说那里有 1/3 个人,不能把一张人民币撕开,一个分子再分就变成了另外的分子或者原子了。科学界经常用量子一词,用现在的语言讲,量子就是强调研究对象是以完整个体的形态存在。可以说, 量子就是个体 。 l 个体的相对性:我们所谓的个体其实仅是个相对概念。你可以把银河系这个完整整体看作是一个个体并且称它为银河系。但是也可以在另外的层次上,把银河系看作是一个集体、总体,而它里面的各个恒星(如太阳系)才是其中的一个一个的个体。这一切 取决于我们从什么层次上分析问题 。在一定的场合我们把一个人看作是个体,而在必要时又以一个人体器官、一个细胞、一个生物大分子为个体。所以个体概念有它的相对层次性。当代科学的一些分科就是在不同层次上研究不同层次意义下的个体。 l 个体存在的 量化 表示和 可加性 :存在与否是关于 个体 的基本问题。对这个问题可以用量化的办法表示: 1 与个连在一起表示该个体的存在。如一个苹果、一个人等,这里的一个二字体现着苹果或者人的存在。如果该个体不存在,就用 0 个表示,如我家有一个厨房、一个卫生间以及 0 个飞机和 0 个银行。这里的 1 和 0 ,不仅具有符号意义,而且具有数的意义,同类的独立存在的个体可以合并,其对应的 1 , 0 是可以做加法的( 我们已经无形中引入了关于个体的运算了! )。 7. 个体的量纲――个和量词 l 前面我们涉及了个体的存在与否的量化表示,而这种表示还涉及了对个体的数量的计量单位。这个单位就是个。当我们说有 1 千克 牛奶时,我们是以千克作为度量牛奶的单位的。类比的说,当我们说这里是 8 个苹果时,这里的个字就成为计量独立存在的苹果个体的数量单位了。用学术一点的话来说,个就是(也是)一种量纲。它是关于个体的量的单位。所以当我们把个体提升为科学名词以后,个字就成为计量个体数量的单位(量纲)。 l 10 个人、 100 个苹果以及 6023 10 20 个氧原子,这里的个字的含义大家都明确,无需多说。但是 6023 10 20 个氧原子也就是 1 摩尔氧原子。这说明个这个新的单位原来与化学中用的摩尔有着本质上相同的意义,其区别仅在于个的 6023 10 20 倍是摩尔。这类似我们在天文学里用光年计量长度,而在生活中用米计量长度。请注意摩尔是 7 个基本科学单位之一,它在科学中有基础地位。所以我们讨论个体而引入的单位个,早已经穿着摩尔的外衣进入了科学领域。这也提示我们:个体一词进入科学殿堂的前期准备工作已经就绪。 l 中文里有很多所谓量词, 3 匹马、 2 架飞机、 4 条鱼、 5 只鸡都是例子。匹、架、条、只,这些词在这里是所谓量词。可以认为它们是个这个关于个体的一般单位在特殊场合的特殊运用。应当承认它们与摩尔类似,都是个的特例。 l 根据以上认识,在明确了个体概念的科学地位以后,我们看到个是一个比摩尔的通用性更大的量纲。 8. 个体都具有若干特征 标志 :(内容见下一讲)
个人分类: 组成论|3616 次阅读|3 个评论
<个体-标志值-集合>和它的复杂程度之一、之二
zhangxw 2008-6-21 13:34
个体 - 标志值 - 集合 和它的复杂程度之一 张学文20080621 ( 1 )说明词 1. 个体 - 标志值 - 集合 和它的复杂程度 是一组有内在联系的短文的总称。笔者认为它们应当是各个学科(自然科学、社会科学)通用的基本概念和物理量。这些概念和物理量不仅应当在各个学科(自然的、社会的)中容易找到自己的身影 , 而且它们在您熟悉的领域也能派上新用场、充当新的思维工具、计量工具、推理工具。它们何许使您获得新的成功。我希望自己能够通俗、准确的介绍它们,至于在各个领域具体应用好它们,就是各位的事了。 2. 这里要突出这样一些认识:㈠把个体,以及复杂这两个词提升为社会和自然科学通用的、量化的科学名词(概念)。㈡我们特意把以个体为元素,把每个个体的标志值都明确的集体称为 个体 - 标志值 - 集合 (简称 个体集 );㈢给复杂程度概念以定量的定义,最后把这些认识与信息熵、热力学第二定律等概念和原理再横向地串起来。 3. 这里的认识主要来自作者的《组成论》一书( 2003 年中国科学技术大学)【 1 】,可也有新扩充。欢迎具有不同专业知识背景的人士关注这个主题。欢迎大家在这里挑三拣四。确实,它们等待大家的洗礼。 4. 本连载的形成背景还包括在系统科学论坛、潜科学论坛、奇迹论坛上的有关讨论以及科学时报的博客文章中大家对我的鼓励。我还特别感谢 张启斌 先生和一些同志希望我写一册关于个的小册子的动议。本连载不能认为就是原打算写的小册子,但是它包括了想在那里说的好多话。 个体 - 标志值 - 集合 和它的复杂程度之二 ( 2 )提炼基本科学概念(名词)的重要性 提炼一个重要概念比发现一个公式更重要 1. 现在大家普遍认可了科学的强大力量。如果问,科学的特征是什么。有人说科学里面包括很多稀罕的事实、客观的规律(公式)、神秘的仪器、神奇的材料等等。确实,谁发现了新的事实(新星、新物种、新的基本粒子)、新的公式、新的仪器或者新的材料,都是对科学的重要贡献。甚至得诺贝尔奖。 2. 除了上面说的事实、规律、仪器、材料 之外,如果问, 基本概念 在科学领域的地位如何,这个问题就不那么引人注意。其实,任何一个科学分科,都有一些基本概念,如长度、体积、力、能量、温度、电流概念等等。它们对构成科学知识体系是至关重要的理论基石。科学里的逻辑和数学推证都要以对应的科学概念为节点,没有它们你就无法准确的认识、描述事物。没有清楚的电压概念,我们能搞出那么多的电气设备来吗?提出新的科学概念,并且被实践认可,有时比发现新事实、新公式、新仪器、新材料,通常更重要。 提炼新的科学概念,在科学研究中具有原始创新意义。 3. 有的科学概念用途十分广泛,它几乎可以跨越很多科学分科,例如时间概念,质量概念就用途非常广。而另外一些科学概念,它们的应用领地就经常限于本领域。货币、遗传、激光都是对应领域(经济、生物、物理)中的重要的概念,但是它们的通用性就没有时间概念那么广。 寻找(包括提炼)到可以跨越很多学科的通用概念,显然具有重要的科学价值。 4. 科学概念与一般生活用词的一个区别就是它的含义要相当清晰。例如能量二字在 160 年以前就十分含糊。随着热与功的定量关系的明确,随着动能如何表示问题的明确(它与运动物体的质量成正比例,并且与速度的平反成正比例),随着能量守恒定律的明确,我们才有了精确的能量概念。 100 年前我们知道了如何用电报传文字符号,后来又知道了如何传声音,图像的方法。在这些传输过程中 传递 的核心内容并不是物质的数量、也不是能量而是传送信息。面对这个局面,我们就需要一个清晰的信息概念,而且需要有计量信息的多少的合理办法。如果科学界没有对信息量的准确把握,我们不可能有近 50 年来的信息革命,不能有那么多的卫星、照片、电视、电脑。显然精确的能量概念和精确的信息概念的提炼,在科学发展上是重要的里程碑式的事件。好多人崇拜定量的规律(公式),孰不知没有精确的概念,就没有办法表达定量的规律。没有电流、电压概念你不可能发现欧姆定律。我们可以说定量的科学概念的提炼为随后的定量规律的发现做了理论与表达工具的前期准备,这体现了 精确的科学概念的提炼在科学进程中的基础地位。 5. 我们谈了这些抽象的道理,是为要提炼新的概念做铺垫。这里涉及的概念就是个体、由个体组成的个体 - 标志值 - 集合以及关于个体 - 标志值 - 集合的复杂程度等等。后面要介绍这些名词的准确含义。大家将会看到它们是可以横跨许多学科的通用性十分强,又可以量化的概念。这样做有什么好处?我们说:如果你能把过去说不大清楚的(比较模糊的)事和物提炼为由含义清楚的个体 - 标志值 - 集合,那么这里就送给你一些关于它们的量(如复杂程度),有了这些量就为你研究、分析、发现新的定量规律做了技术准备。
个人分类: 组成论|4299 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-21 17:30

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部