科学网

 找回密码
  注册

tag 标签: 信息度量

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

信息是简单还是复杂的概念
accsys 2010-1-23 08:21
信息究竟是一个简单的概念还是复杂的概念?我给信息是这样下定义的: 信息是事物的表现或描述 。 这个信息的定义大家都能够理解,因而可以说信息是一个十分简单的概念。然而信息的问题讨论了上百年,如果真是这么简单,那么信息学的学者们不是太小题大做了吗?其实长期以来,信息概念的复杂度来自于我们对事物、表现和描述这三个基本概念的认识。 事物是指世间的万事万物。表现或描述是事物存在的基本特征。事物之间通过表现或描述进行相互联系作用。正因为信息是表现或描述,故而,信息可以存储、复制、转化、传播、由简单到复杂地综合、从复杂到简单地分析,这些是信息的基本属性。人为地进行信息属性方面的工作,就称为信息处理。待处理的信息是人们常说的数据。 信息所描述的对象叫 信息主体 ,信息赖以存在的物质形态叫 媒体 。由信息主体或媒体都可以来划分信息的种类。例如,商业信息,战争信息,这是从信息主体方面分类的。再如,电信息,光信息,文字信息,这是从媒体方面进行分类的。 信息长期的困惑就是信息量的问题,也就是信息如何度量。 信息的度量必须根据其具有的基本属性来进行。由于信息概念起源于通信学问题,从人类通信的角度来看,同一个消息,对受信者有知晓程度之分,故香浓前辈将信息量定义为未知程度的量度。显然,这种度量信息的方法,只可以说明信息对接受者的有用程度,但因为并没有一把统一的尺子,也就不具有客观性。 度量不仅要在同一属性内进行,而且一定要有一个统一固定的尺度,这两者缺一不可。香浓的信息量度量,虽然有同一属性的前提,但缺乏统一的尺度,因而不能对不同的信息进行统一的度量。 计算机的出现,使信息的度量有了客观的,统一的尺子。由于在计算机领域中,用二进制数可以表示一切信息,因而,信息量的大小就可以用二进制数表示的位长来量度,bit就是统一的尺度。这种量度不会因人而异,不必再通过通信的方式才能度量,所以客观实在,目前被人们普遍接受了。若一条信息是二进制数N,那么这个数的位数就是log 2 N,于是信息量n=log 2 N。 由于用数可以表示任何信息(这是理论上的,实际上要寻求具体的表达方式),当然用k进制数表达也完全可以。那时用k进制数N表示信息的信息量应是n=log k N,k是大于1的整数。 信息有许多属性,按着某一种属性都可以产生一种度量方法,前提必须能够找到统一的尺子。这就如同物体一样,你可以按照它的质量来量度它,也可以按照它的体积来量度,无论哪种度量都要有尺子。究竟我们要采用何种方式度量信息,这跟对信息的需求有关。在计算机科学和二进制通信中,以bit作为信息量的基本单位,统一量度大有好处。 信息的概念很容易理解,但由于表现和描述与科学的发展关系密切,故而体现出多种多样的复杂性。例如量子计算机中的量子bit就不是二进制的,两个量子纠缠的信息表示,很可能就是四进制的关系。如果是三个量子纠缠,信息的表示就可能是八进制的。如果我们能够找到用十进制表示全部信息的方法,那么信息N的信息量就应该是 n=logN。 至此我们应该不难理解,信息的复杂度来源于对信息如何表现和描述。用什么样的物质方式来描述信息,这会随着科学技术的发展,以及人们对客观世界的认识深入,不断地发生变化。物理学之中,对信息的概念研究太纠缠在信息的表达方式上了,这就造成了信息概念难以确定的假象。科学研究的目的不是要将简单的事情搞复杂,正相反,科学研究的目的,是要将复杂的问题简单化,让人们都能够理解它,掌握它,从而为我们的生产生活服务。 欢迎讨论。 2010-1-23
个人分类: 教学点滴|4381 次阅读|0 个评论
信息的定义
accsys 2009-11-15 09:04
如今,信息这个词用得非常之广。什么是信息?上世纪80年代,我在讲课中就给出过:信息是事物的表现或描述。后来,我将这个定义写入我撰写的书中,长时间来倒也未听到有人反对。其实,我很想找人讨论,利用博客既方便,又快捷,何乐而不为? 事物是指世间的万事万物,表现或描述是事物存在的基本特征,信息体现了事物之间的相互作用。因为信息是表现或描述,故而,信息可以存储、复制、传播、由简单到复杂地综合、从复杂到简单地分析,这些是信息的属性。人为地进行信息属性方面的工作,就称为信息处理。信息搜集和查询是信息处理的大众化说法而已。数据是待处理的信息。 信息的度量必须根据其具有的基本属性来进行。信息概念起源于通信学问题,从人类通信的角度来看,同一个消息,对受信者有知晓程度之分,故香浓前辈将信息量定义为未知程度的量度。显然,这种度量信息的方法,并没有一把统一的尺子,具有不客观性。 计算机的出现,使信息的度量有了客观的,统一的尺子。由于在计算机领域中,用二进制数可以表示一切信息,因而,信息量的大小就可以用二进制数表示的位长来量度。这种量度不会因人而异,不必再通过通信的方式才能度量,所以客观实在,目前被人们普遍接受了。 信息有许多属性,按着某一种属性都可以产生一种度量方法,就如同物体一样,你可以按照它的质量来量度它,也可以按照它的体积来量度。究竟我们要采用何种方式度量信息,这跟对信息的需求有关。在计算机科学中,以bit作为信息量的基本单位,统一量度大有好处。 2009-11-15
个人分类: 随笔|4411 次阅读|2 个评论
信息度量与系统复杂性问题分析
nipy 2008-6-14 22:17
信息度量与系统复杂性问题分析 . --- 关于信息定义与本质问题讨论的我见 一文的补充 信息科学与系统科学都是建立在事物之间存在普遍相互作用和相互联系的哲学观基础之上的。信息的度量直接涉及与系统复杂性的关系,从而进一步揭示信息概念与系统概念的内在联系。我们试作如下分析: 1. 信息定义与信息度量的关系 信息如何度量与信息是什么?应是信息概念研究中两个层次的问题,它们既有联系又有区别,不应等同,不应混淆 。对信息是什么?的不同答案可能会导致对 信息如何度量的不同理解。例如:如果定义信息是事物运动状态,那么事物状态的丰富程度可能成为度量信息量的基本参数。如果把信息定义为结构的表达,那么结构的差异、结构的复杂性等可能成为度量信息量的基本参数。但如果把丰富程度、复杂程度、差异程度、不均匀程度、有序性、组织程度等度量参数直接定义为信息,作为信息是什么?的答案,就容易使信息与信息量的概念产生混淆,也会影响对信息本质概念的认识。一般的说,似乎应该是在认清信息是什么?的基础上,再去探讨 信息如何度量问题,可能更容易搞清楚。但这两个问题也确实很难分割,信息概念和理论恰恰是在通信系统中研究如何提高传输效率(单位时间内传输更多的信息量)和收信者如何获得对它有用的信息(实得信息量)开始和形成的。因此,通过进一步研究信息度量问题来加深对信息本质概念的理解也是有意义的。 2. 本体层次与认识层次信息度量问题的关系 信息如何度量问题与信息的分类也有关,本体层次的属性信息与认识层次的知识信息两大类信息,虽然在被反映的物质属性这个信息本质概念上具有同一性,但在信息的表现方式、传递方式,利用方式等方面确实存在许多重要的差别和特点,因而导致这两类信息在 信息如何度量问题上也会有很大差别与不同特点,需要分别进行研究。但本体层次属性信息的度量问题具有更本质意义,它应该是认识层次的知识信息度量的基础。 3. 本体层次的信息的度量问题 。 本体层次的信息能否度量和如何度量问题,也应结合本体层次的信息本质概念进行分析。根据客观世界中事物之间存在普遍联系的哲学观,我们用 被反映的物质属性 作为信息本质概念的基础,并使用了 信息 是以一事物的属性为形式所表现出来的相关事物的属性内容 的信息定义。这种建立在事物普遍联系基础上的信息概念实际上也体现了系统观和系统概念,系统观也就是把客观世界相互联系的事物,看成是相互联系的系统,而每一个具体系统又由许多按一定结构关系联系的子系统(要素)组成。系统之间和系统要素之间的联系虽然是由物质、能量的相互作用形成的,但也必然产生属性的反映和信息的传递,并最终形成信息的联系。因此我们可以进一步 从信息与系统概念相结合的层次上研究事物联系的内涵和方式以及被反映物质属性的信息内容 。 辩证唯物主义哲学观认为:时空也是物质存在的形式,因此 事物的普遍联系也应该包括空间域与时间域的普遍联系。空间域中又包括横向无限交叠扩张的联系和纵向无限层次可分的联系;时间域中又包括后向无限历史过程的联系和前向无限发展趋向的联系 。事物时间域的联系体现了事物运动发展的特性。因此,任何一个给定时空域的具体事物(系统)属性中,也应反映以下信息内容:第一,横向空间相关事物属性的信息内容,也是系统环境属性在系统属性中的反映;第二,纵向空间相关事物属性的信息内容,也是系统所含子系统属性及内部结构属性在系统整体属性中的反映;第三,后向时间相关事物属性的信息内容,也即系统发展过程中过去的系统属性在当前系统属性中的反映;第四,前向时间相关事物属性的信息内容,也即在当前系统属性中应反映其发展趋势的各种可能性信息。 为了表明本体层次信息概念中信息与属性概念的联系和区别,我们还引入了 广义属性 和 属性信息 的概念。广义属性和属性信息的含义是:一个具体事物(系统)的属性不仅是它的表面属性,而且包括表面属性中所反映的内在本质属性以及与它相联系的其他事物的属性。传统的属性可称为狭义属性,它只能表征物质的直接存在,而 广义属性和属性信息则不仅可以表征物质的直接存在,而且还可表征物质的间接存在,因而能够更本质的表征客观物质世界事物存在普遍联系和运动发展的普遍属性。 根据上述对本体层次信息概念的分析,探讨本体层次属性信息能否度量和如何度量问题, 应该着眼于度量事物之间相互联系的特性和程度 。据此,我们是否可用 复杂性 和 有序性 来作为度量属性信息的两个基本参数。按一般理解,复杂性是指事物之间相互联系的复杂程度,用系统科学的概念来说就是,系统中要素数量大、层次多、结构关系复杂;有序性则表示事物之间相互联系的紧密或松散程度、稳定或不稳定程度、确定或不确定程度。如果把事物之间联系的不稳定性、不确定性也作为复杂性内涵(系统复杂性也还没有统一的定义),那么,我们是否可以直接使用系统复杂性作为度量本体层次属性信息量的基本的客观标准呢?从物理概念上,我们是否可以这样理解:一个复杂系统由于它所含子系统多、层次多、结构关系复杂、环境复杂、发展过程复杂、不确定和不稳定因素多,在它的表面属性中所反映的内部结构属性和相关事物的属性内容也必定非常丰富,因此广义属性信息内容的信息量也越大。例如,在自然界中,一个人比一棵树要复杂得多,因此表征人属性的信息量比表征树属性的信息量应该大得多。 4 . 认识层次的知识信息的度量问题 认识层次的信息是由人对客观事物的认识而形成和产生的,是客观事物广义属性在人脑中的高级反映。也可以说是客观世界的属性信息通过人的认知信息系统传递到人的大脑中去的。基于这一认识,我们引入了知识信息与广义知识概念。知识信息与广义知识涵盖了一切基于认识层次的各种具体形式的信息,如文字信息、图像信息、狭义的知识、数据信息、新闻、消息等等。这样在讨论认识层次信息度量问题时就可以有一个相对统一的信息概念的基础。 相对本体层次属性信息而言,认识层次知识信息有两个重要特点会影响知识信息的度量问题。这两个特点:第一是知识信息表达形式的特点;第二是知识信息的使用价值的特点。下面我们对此做一些具体分析: ( 1 ) 用编码结构量化属性来间接度量知识信息 按照知识信息是对客观事物属性的认识或反映的概念, 知识信息的度量应是对知识信息内容的度量,应该直接反映认识对象(事物)的复杂性 。也即人对复杂事物的认识所获得和产生的信息量应比对简单事物认识所获得的信息量大。因此,从总体上讲,认识层次的知识信息也是可以度量的,它直接建立在本体层次属性信息用复杂性度量的基础之上。当然这种度量仍然是定性的。在人类智能发展的进程中,人创造了语言、文字( 广义语言包括话音、文字、图像及各种编码数据 )来表述人对客观世界的认识,语言通常被设计成一种多层次的体系结构,即选择少量的语言基元如笔划、字母等、由这些基元按一定关系编码组合形成字、词、句、段和文来具体表述某种具体的知识信息内容,所以语言是一种用以表述和承载知识信息内容的通用编码结构形式。人类创造和使用语言来表述知识信息内容以后,自然就会想到使用语言中所用基元的数量来度量所表述知识信息内容的信息量,例如,一篇文章,人们自然会用文章所用字数来度量这篇文章内容的信息量,并且通常认为:一篇5万字长的文章比一篇5千字文章的信息量大。 但语言编码结构仅是人类智能设计的一种信息表述形式,实际上很难量化,但在人类社会中实际进行信息的传递、存储和处理过程中,这种语言编码结构形式又都要以及某种物质载体,如电、磁、光等的属性变化来表示,也即用物质载体的属性变化来反映语言编码结构的结构属性,这些物质载体的属性则是比较容易量化的,例如纸张的面积、张数、电平高低、磁化极性都可成为信息存贮载体的量化参数,因此语言基元数量实际上被映射到物质存贮载体的存贮量(所用存贮单元数)。换句话说, 人类社会中知识信息内容通常是用语言编码结构形式存贮在某种物质存贮载体中所占用的存贮单元数来度量的 。一篇文章的字数,只有写到纸上才能数得出来。一篇文章或一张照片存入到计算机的磁盘或光盘中,如果占用的存贮量越大,通常也就认为文章或照片中知识信息所含的信息量越大。 这种用存贮载体存贮量来度量知识信息内容信息量的方法,从信息本质上讲还是有意义的。因为知识信息的内容正是人脑对客观事物属性的反映、所反映的客观事物越复杂,人表述事物认识所用的语言基元数量和占用物质载体存贮单元数量也应该越大。但是这种信息度量方法,由于下几个因素,显然也存在很大局限性: * 个人智能因素 。个人智能和知识水平不同,观察同一事物所获得该事物属性的信息量是不同的。有人只看到事物的表面属性,获得的信息量就少,有人能通过表面属性观察到事物的内在、本质属性,获得的信息量就大。所以用存贮单元量表示的知识信息量,不一定能完全反映所观察对象的实际复杂程度。 * 个人认识主观性因素 。个人认识的主观性,有可能使基于认识所产生的信息并不完全是客观事物属性的正确反映,甚至可能是完全错误的。如某些迷信的思想也可以写成大块文章,占用一定的存储量。但这种脱离客观实际属性反映的认识(是否还能称为信息?)失去了本体层次复杂性的度量标准,用占用载体存贮量来度量其信息量,似乎更没有意义了。 * 个人语言表达能力的因素 。同样的信息内容,有人可能用几百字简练的表述,有人则可能噜嗦地用几千字才能表述。存贮量显然是不同的。 * 使用不同语言的因素 。同样一篇文章,用中文输入和用英文输入计算机占用的存贮量,也是很不相同的。 可见,用存贮载体存贮量来度量知识信息内容信息量的方法,只具有相对的意义和正确性,虽然它目前仍是比较常用的度量知识信息的方法。 ( 2 ) 知识信息价值与信息度量的关系 知识信息价值有两个既有区别又有联系方面:一是为人类共享的知识信息价值;二是个人使用知识信息所体现的价值。信息对使用者的价值与使用者获得的信息量是密切相关的。 人类共享的知识信息是指人类通过长期认识与实践所积累的科学知识,也是人类推动社会发展的主要信息资源。这种共享知识信息的价值取决于人类对客观世界认识的正确、全面和深刻程度。所以这种共享知识信息的度量,基本上可与本体层次的属性信息度量标准 复杂性对应。复杂的客观事物的属性在人认识层次上总是需要更多的信息量来反映和表述的。前面所用载体量化的属性来间接度量知识信息的方法,主要应是对这种人类共享知识信息而言。 人类共享知识库中的信息总量大体上应能对应人类在现阶段对客观世界整体认识的程度 。但它亦有相对性,因为人类对客观事物的认识是一个长期认识和反复实践的过程,客观世界也在不断运动、发展,人类共享知识库的知识信息也需要不断更新,随着人类对客观世界认识的不断深入,共享知识库中的信息总量应是不断增长的。 人类共享知识信息库中的共享知识信息虽然对人类社会整体来讲有它客观存在的价值和信息量,但对于每一个使用者体现的价值却可能大不相同,因为这与每个人的智能和他已有的知识有关。同样一本书,不同的人看后所获得的信息量是大不相同的,同一条消息对有的人可能会大吃一惊,对有的人可能是当耳边风。传统经典信息概念和信息定义中信宿对信源消除不确定性的程度实际上就是个人获得信息的度量,但似不应成为信息是什么?的答案。 研究知识信息的价值和度量问题,应该处理好共享知识与个人知识信息的关系。一本中学物理课本中的知识,对于大学生来说可能没有多少价值,看后可能得不到多少信息,但并不能因此否定该课本的知识信息价值,或认为没有多少信息量,只要课本中的知识确实是正确反映了客观世界的规律,它的价值和信息量仍然是客观存在的,中学生可以从中学习到对他有价值的知识,获得有用的信息。反过来讲,人类所有共享知识库中的知识信息,又都是由个人知识通过学习、交流逐步积累起来的。并最终通过个人的利用来体现其价值。因此, 在认识层次中考虑信息度量和信息量问题,不能不考虑具体信息内容对具体使用者的价值 。 倪鹏云
个人分类: 信息本质探索|5454 次阅读|1 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-6-3 09:26

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部