科学网

 找回密码
  注册

tag 标签: 互信息

相关帖子

版块 作者 回复/查看 最后发表

没有相关内容

相关日志

公布求解最大互信息和最大似然度的信道匹配算法—用以取代EM算法
热度 3 lcguang 2017-6-12 12:25
搜索最大似然度, 可见有33万篇文章: http://www.sciencedirect.com/science?_ob=ArticleListURL_method=list_ArticleListID=-1217372240_sort=r_st=13view=cmd5=32025f8bcf94febd17e33e7009f377cdsearchtype=a 搜索EM算法有8万多篇文章: http://www.sciencedirect.com/science?_ob=ArticleListURL_method=list_ArticleListID=-1217372349_sort=r_st=13view=cmd5=1c0dbe77532804b292213415558828cbsearchtype=a 最大互信息难以求解的, 所以Shannon用失真准则, 而不是互信息准则。 最大似然度——指香农信道没有确定时的最大平均对数似然度——也是难求的。 这两个难题应该说是信息论和统计理论中最顽固的堡垒。 两者只能用迭代方法求解。通常用牛顿法, 梯度法和EM算法。其中EM算法最具神秘性。 本文不是要在么庞大数子上增加一个1, 而是要重新评估以前的做法, 特别是EM算法! 本文提出新的算法是信道匹配算法——多数情况下3-5次就收敛。文中和EM算法做了比较,大多数情况下迭代次数降到1/3。还证明了前人的EM算法收敛证明完全错了。 新的算法是否简洁, 高效,易于理解, 详见最新文章: http://survivor99.com/lcg/CM.html 本来是想先投稿, 争取发表的, 但是一想到那么多人在最大互信息和最大似然度上耗费那么多宝贵时间,想到审稿之漫长, 辩解之麻烦, 我还是先公布算法吧! 语义信息方法历来遭遇主流歧视,因为要权威理解非常困难。这篇文章也是要向主流显示: 语义信息论是怎样powerful, 它可以解决经典方法难以解决的难题! 我有没有做到, 请看完理解再说! 欢迎批评!
个人分类: 信息的数学和哲学|5576 次阅读|7 个评论
“熵”- 再谈信息论的熵
热度 5 tianrong1945 2016-7-7 09:10
热统系列之5 自信息熵、条件熵、联合熵、互信息 香农根据概率取对数后的平均值定义信息熵。如果只有一个随机变量,比如一个信息源,定义的是源的自信息熵。如果有多个随机变量,可以定义它们的条件概率、联合概率等,相对应地,也就有了条件熵、联合熵、互信息等等,它们之间的关系如下面左图所示。 图 1 :条件熵、联合熵、和互信息 比如说,最简单的情况,只有两个随机变量 X 和 Y 。如果它们互相独立的话,那就只是将它们看成两个互相不影响的随机变量而已,在那种情形,上面图 1 左图中的两个圆圈没有交集,变量 X 和 Y 分别有自己的自信息熵 H(X) 和 H(Y) 。如果两个变量互相关联,则两个圆圈交叉的情况可以描述关联程度的多少。图 1 中的条件熵 H(X|Y) 表示的是,在给定随机变量 Y 的条件下 X 的平均信息量;相类似地,条件熵 H(Y|X) 是随机变量 X 被给定的条件下 Y 的平均信息量。联合熵 H(X,Y) ,则是两个变量 X,Y 同时出现(比如同时丢硬币和骰子)的信息熵,也就是描述这一对随机变量同时发生平均所需要的信息量。图 1 中两个圆的交叉部分 I(X;Y) 被称为互信息,是两个变量互相依赖程度的量度,或者可看作是两个随机变量共享的信息量。 信息论中的熵通常用大写字母 H 表示,如图中的 H(X) 、 H(Y) 、 H(X|Y) 、 H (Y|X) 等,但互信息通常被表示为 I(X;Y) ,不用字母 H 。其原因是因为它不是直接从概率函数的平均值所导出,而是首先被表示为“概率比值”的平均值。从图 1 右边的公式可见,联合熵是联合概率的平均值,条件熵是条件概率的平均值,互信息则是“联合概率除以两个边缘概率”的平均值。 直观地说,熵是随机变量不确定度的量度,条件熵 H(X|Y) 是给定 Y 之后 X 的剩余不确定度的量度。联合熵是 X 和 Y 一起出现时不确定度的量度。互信息 I(X;Y) 是给定 Y 之后 X 不确定性减少的程度。 互信息的概念在信息论中占有核心的地位,可以用于衡量信道的传输能力。 图 2 :信息传输过程中的互信息 如图 2 所示,信源(左)发出的信息通过信道(中)传给信宿(右)。信源发出的信号,和信宿收到的信号,是两个不同的随机变量,分别记作 X 和 Y 。信宿收到的 Y 与信源发出的 X 之间的关系不外乎两种可能:独立或相关。如果 Y 和 X 独立,说明由于信道中外界因素的干扰而造成信息完全损失了,这时候的互信息 I(X;Y)=0 ,通信中最糟糕的情况。如果互信息 I(X;Y) 不等于 0 ,如图中所示的橘色重叠部分,表明不确定性减少了。图中两个圆重叠部分越大,互信息越大,信息丢失得越少。如果 Y 和 X 完全相互依赖,它们的互信息最大,等于它们各自的自信息熵。 互信息在本质上也是一种熵,可以表示为两个随机变量 X 和 Y 相对于它们的联合熵的相对熵。相对熵又被称为互熵、交叉熵、 KL 散度 、等。 首先,对一个随机变量 X ,如果有两个概率函数 p(x), q(x) ,相对熵被定义为: 在互信息的情形,如图 1 右下方的 I(X;Y) 表达式,被两个随机变量 X 和 Y 定义,也可看成是相对熵,在一定程度上,可以看成是两个随机变量距离的度量。 两个随机变量的互信息不同于概率论中常用的相关系数( correlation )。相关系数表示两个随机变量的线性依赖关系,而互信息描述一般的依赖关系。相关系数一般只用于数值变量,互信息可用于更广泛的包括以符号表示的随机变量。 最大熵原理 热力学和统计物理中有热力学第二定律,即熵增加原理,信息论中则有最大熵原理。 我们在日常生活中经常碰到随机变量,也就是说,结果不确定的事件。诸如旋转硬币掷骰子,都是例子。还有比如说,球队 A 要与球队 B 进行一场球赛,结果或输或赢;明天的天气,或晴或雨或多云;股市中 15 个大公司的股价,半年后有可能是某个范围之内的任何数值……但是,在大多数情况下,人们并不知道随机变量的概率分布,或者说,只知道某个未知事件的部分知识而非全部,有时候往往需要根据这些片面的已知条件来猜测事件发生的概率。有时猜得准,有时猜不准,猜不准损失一点点,猜准了可能赚大钱。事件发生的随机性及不可知性,就是支持赌城的机器不停运转的赌徒心态的根源。 人们猜测事件发生的概率,多少带有一定的主观性,每个人有他自己的一套思维方法。如果是一个“正规理性”(这个概念当然很含糊,但假设大多数人属于此类)思维的人,肯定首先要充分利用所有已知的条件。比如说,如果小王知道球队 A 在过去与其他队的 10 场比赛中只赢过 3 次,而球队 B 的 10 场比赛赢过 5 次的话,他就应该将赌注下到球队 B 上。但是,小李可能了解了更多的消息:球队 B 的主要得力干将上个月跳槽到球队 A 来了,所以,他猜这次比赛球队 A 赢的可能性更大。 除了尽量利用已知信息外,还有没有什么其它客观一点的规律可循呢?也就是说,对于随机事件中的未知部分,人们“会”如何猜测?人们“应该”如何猜测?举例说,小王准备花一笔钱投资来买 15 个大公司的股票,如果他对这些公司一无所知,他选择的投资方案很可能是 15 种股票均分。如果有位行家告诉他,其中 B 公司最具潜力,其次是 G 公司。那么,他可能将更多的钱投资到 B 和 G ,其余的再均分到剩下的 13 种股票中。 上面的例子基本符合人们的常识,科学家却认识到这其中可能隐藏着某种大自然的玄机。大自然最玄妙的规律之一是最小作用量原理,造物主喜欢极值,或者说凡事讲究最优化。统计规律中的随机变量也可能遵循某种极值规律。 如上所述,随机变量的信息熵与变量的概率分布曲线对应。那么,随机变量遵循的极值规律也许与熵有关!信息熵来自于热力学熵,信息熵的“不确定程度的度量”也可以用来解释热力学熵。当然,热力学中(物理中)不确定性的来源有多种多样,必须一个一个具体分析。经典牛顿力学是确定的,但是,我们无法知道微观粒子的情况,这点带来了不确定性。也许是因为测量技术使我们无法跟踪,也许是因为粒子数太多而无法跟踪,也有可能是我们主观上懒得跟踪、不屑于跟踪,反正就是不跟踪,即“不确定”!如果考虑量子力学,还有不确定原理,那种非隐变量式的,爱因斯坦反对的本质上的不确定。即使是牛顿力学,也有因为初始条件的细微偏差而造成的“混沌现象”,蝴蝶效应式的不确定。此外,还有一种因为数学上对无穷概念的理解而产生的不确定。 总之,物理中的熵也能被理解为对不确定性的度量,物理中有熵增加原理,一切孤立物理系统的时间演化总是趋向于熵值最大,朝着最混乱的方向发展。那么,熵增加原理是否意味着最混乱的状态是客观事物最可能出现的状态?从信息论的角度看,熵最大意味着什么呢? 1957 年,美国圣路易斯华盛顿大学的物理学家 E.T.Jaynes 研究该问题并提出信息熵的最大熵原理,其主要思想可以用于解决上述例子中对随机变量概率的猜测:如果我们只掌握关于分布的部分知识,应该选取符合这些知识但熵值最大的概率分布。因为符合已知条件的概率分布一般有好些个。熵最大的那一个是我们可以作出的最随机,也是最符合客观情况的一种选择。 Jaynes 从数学上证明了:对随机事件的所有预测中,熵最大的预测出现的概率占绝对优势。 接下来的问题是:什么样的分布熵值最大?对完全未知的离散变量而言,等概率事件(均衡分布)的熵最大。这就是小王选择均分投资 15 种股票的原因,“不要把鸡蛋放到一个篮子里”,不偏不倚地每种股票都买一点,这样才能保留全部的不确定性,将风险降到最小。 如果不是对某随机事件完全无知的话,可以将已知的因素作为约束条件,同样可以使用最大熵原理得到合适的概率分布,用数学模型来描述就是求解约束条件下的极值问题。问题的解当然与约束条件有关。数学家们( Tribus 等)从一些常见的约束条件得到几个统计学中著名的典型分布,如高斯分布、伽马分布、指数分布等,这些自然界中常见分布,实际上都是最大熵原理的特殊情况。 最大熵理论再一次说明了造物主的“智慧”,也见证了“熵”这个物理量的威力! 马尔可夫链 到此为止,我们的讨论基本是针对随机变量而言。如果有一连串的随机变量按时间排列起来,就叫做随机过程。实际上,就广义而言,这儿的“过程”不一定仅仅代表“时间”序列,反正是一个序列就行,特别是对离散的、信息论中感兴趣的那些序列,比如文字这种东西,一个接一个,未必见得需要理解成时间。 本文的开头介绍过因多个(主要是两个)随机变量之间的关联情况而定义的“熵”。当我们考虑一连串的随机变量时,这些变量之间有可能互相关联。最简单的情况是下一个状态的条件概率分布仅仅只依赖于当前的状态,这种性质叫做“无记忆”的马尔可夫性质,因安德烈·马尔可夫( A.A.Markov , 1856 - 1922 )得名,如果是离散变量组成的具有马尔可夫性质的一连串随机变量,则被称为马尔可夫链。 在马尔可夫链的每一步,系统根据概率分布,从一个状态变到另一个状态。比如说,下图 a 所示表明某一天的天气转换到下一天天气的概率。 图 3 :马尔可夫链举例 这儿的所谓天气,只简单地用两个变量:雨或晴来表示。你每天早上 8 点醒来,便观察天气是“雨”或者“晴”,如果每天 8 点钟“雨晴”的变换规律是一个马尔可夫链,并简单地符合图 3a 给出的“雨晴”概率转换图(或可表示成一个 2x2 的矩阵),你可以从当天的状态,推测第二天“雨或晴”的概率。 随机漫步(布朗运动模型之一)是马尔可夫链的另一个典型例子。最简单的二维随机漫步(图 3b )中的每一步,可以移动到任何一个相邻的格点(这儿的变量数比“天气”例子中多了一点,有东南西北四个方向),且移动到每一个点的概率都是相同的,无论之前漫步路径如何,下一个点的位置只与当前这一个点的位置有关,然后依次类推。 Kolmogorov 熵 Kolmogorov 熵( K )是系统混沌性质的一种度量,它与 Lyapunov 指数之间存在一定的关系。 Kolmogorov 熵是常用的表征系统混沌性质的熵中的一种,是描述动力学系统轨道分裂数目渐进增长率的度量。动力学系统按其混沌程度可分为规则、确定性混沌和随机。对于规则运动, K=0 ;在完全随机运动中, K →∞;若系统表现为确定性混沌运动,则 K 是一个大于零的常数。因此, Kolmogorov 熵越大,系统的混沌程度越大,或者说动力系统越复杂。 拓 樸熵 (Topological Entropy) Kolmogorov 熵在拓扑空间中的相似定义。描述连续映射的不确定性。 上两个“熵”与混沌有关,但已经不属于信息论范围,就此打住。
个人分类: 系列科普|30763 次阅读|12 个评论
[请教] 相互独立的随机变量的方差计算
热度 5 zlyang 2014-10-14 15:18
相互独立的随机变量的方差计算 听说方差具有以下重要性质(假定以下所遇到的随机变量的方差存在): (1) 设 X 是 随机变量, C 是常数,则 D( CX )= C 2 D( X ) ,或写为 Var( CX ) = C 2 Var( X ) ; (2) 设 X , Y 是两个相互独立的随机变量,则有 D( X + Y )=D( X )+D( Y ) 或写为 Var( X + Y ) = Var( X )+ Var( Y ) 。 请教: ( 1 ) 这里的“相互独立”是什么意思? “相关系数 = 0 ”是“相互独立”吗? “互信息( mutual information ) =0 ”是“相互独立”吗? ( 2 ) 任意两个正态分布是“相互独立”的吗? ( 3 ) 一个正态分布,和一个“威布尔分布 Weibull distribution ”之间是“相互独立”的吗? (4) 一个正态分布,和一个“均匀分布”之间是“相互独立”的吗? (5) 一个正态分布,和一个“卡方分布”之间是“相互独立”的吗? (6) 一个均匀分布,和一个“ 均匀分布 ”之间是“相互独立”的吗? ———————————————————————————— 2006年 Thomas M. Cover, Joy A. Thomas 的 《Elements of Information Theory, 2nd Edition》 John Wiley Sons, Inc., http://as.wiley.com/WileyCDA/WileyTitle/productCd-0471241954.html ISBN: 978-0-471-24195-9 第252页截图: 感谢有关人员!感谢您的讲解!
18364 次阅读|15 个评论
[请教] 相关系数和互信息之间的解析关系
zlyang 2014-3-4 21:57
相关系数和互信息之间的解析关系 文件《第 三章:连续信源的信息熵 》 http://wenku.baidu.com/view/328a5a778e9951e79b8927ff.html 给出了: 请教: (1)上述两个解析公式的可信性怎样? (2)您能不能通俗地介绍一下其含义? (3)最重要地:请您提供近期权威的书籍和参考文献,里面有这些公式的详细解释。 感谢您的指教!  相关链接: 2012-07-30,《 相关系数、n阶相关、互信息 》 http://blog.sciencenet.cn/blog-107667-597293.html ¾¾¾¾¾¾¾ 出自 ¾¾¾¾¾¾¾ Thomas M. Cover, Joy A. Thomas. Elements of InformationTheory (Second Edition) . USA :Hoboken, New Jersey, John Wiley Sons, Inc., 2006. ( 1 ) Page 244 Example 8.1.2 ( Normaldistribution ) Then calculating the differential entropy in nats, we obtain Changing the base of the logarithm, we have ( 2 ) Page 252 Example 8.5.1 ( Mutual information betweencorrelated Gaussian random variables with correlation ρ ) If ρ = 0, X and Y are independent and the mutual information is 0. If ρ = ±1, X and Y are perfectly correlated and the mutual information is infinite.
13478 次阅读|2 个评论
mutual information与conditional mutual information
热度 1 lishangtong33 2013-1-1 14:01
互信息(Mutual Information)是源自信息论的概念,其意义为知道了两个随机变量中的一个后,在多大程度上可以减小另一个的不确定性。用以描述两个随机变量间的互相依赖程度或是相关性。数学表示为(以离散变量为例). \ 其中,p(x)和p(y)是他们各自的概率函数, p ( x , y )是联合概率,显然,当X与Y完全不相关,即为独立事件时,联合概率等于两个事件概率的乘积。 \ 条件互信息(Conditional mutual information)是互信息概念的延伸,描述的是两个变量在给定第三个变量条件下的互信息(以离散变量为例)。 或者
个人分类: 概念|5917 次阅读|1 个评论
[转载]基于复杂性测度和OntoTest软件的仿真模型可信度验证方法
qhhuangscut 2010-7-30 13:13
基于复杂性测度和OntoTest软件的仿真模型可信度验证方法 北京树优信息技术有限公司 摘 要 系统仿真的可信度验证是直接影响产品性能、可靠性和安全性的重大问题.本文提出了基于复杂性测度的模型验证方法和OntoTest软件实现,通过将信息熵、互信息和系统结构认知图方法进行综合,能够定量、客观、真实地评价复杂非线性动态系统的试验数据和仿真数据的整体一致性,并为仿真工程师提供模型改善的建议. 对某家庭轿车40%重叠可变形壁障偏置碰撞的实证研究表明,本方法是一种切实可行的仿真模型可信度验证方法,在复杂非线性动态系统仿真验证方面具有广泛的应用前景. 关键词 复杂性,OntoTest,模型可信度验证,VVA,信息熵,互信息,系统图,乘员约束系统,Madymo 一、引言: 近二十年来,系统仿真研究取得了惊人成就,已经成为现代产品研制必不可少的手段,其可信度直接影响产品综合性能、可靠性和安全性 . 为了得到具有预测性的仿真计算结果,如何进行系统仿真可信度评估一直是仿真界探索的重大问题之一 . 一般而言 , 仿真模型可信度评估的主要工作包括仿真模型的校核、验证和认定 (Verification , Validation , and Accreditation ,简称 VVA) . 其中,校核主要关心模型是否准确地表示了开发者的概念描述和需求规范,验证关心的是模型在具体的应用中多大程度地反映了真实世界的情况,确认是权威机构验收模型、确定模型是否可用于具体应用的过程 . 对仿真人员和决策人员而言, VVA 中最重要的环节是仿真模型可信度验证 (Model Credibility Validation), 其最基本的方法是考察在相同的输入条件下仿真模型的输出与实物试验结果是否一致及一致性的程度 . 由于真是的物理现象往往是十分复杂和非线性动力学问题,因此其模型可信度验证方法必须能够客观、定量和真实地反映该问题的整体复杂性特征 . 但是,传统方法很难处理复杂非线性动态系统模型的可行性验证问题 . 从目前文献看, 传统的模型可信度验证方法分为定性方法、定量方法和定性定量综合方法, 这些方法包括相似理论 、假设检验 、现代谱估计 、系统辨识法 、模糊综合评判法 、层次分析法 、灰色关联分析法 等 . 但是 , 这些方法往往存在如下问题 : 需要人为主观判断因素、对数据序列需要进行预处理,或者对样本数量、概率分布、平稳性等有较多要求,因此不可避免地造成部分信息的丢失或人为地加进一些信息 , 从而产生了误差 . 因此,系统仿真可行性验证问题需要通过与复杂性有关的非线性、非平衡、动态的思想和系统方法来解决 . 目前,信息熵、 互信息与复杂性测度是描述非线性时间序列信息量的重要参数 . 信息熵和 互信息来源于信息理论 , 应用广泛 . 复杂性测度最初定义是由 Kolmogorov 于 1965 年提出的,表征为能够产生某一 (0 , 1) 序列所需的最短程序的比特数,并经 Lempel 和 Ziv 发展成为具体的复杂度算法 . Marczyk 于 2006 年提出复杂性测度是系统结构化信息度量的定义 ,并通过模型无关的计算方法进行复杂系统信息拓扑结构的抽取,广泛应用于非线性科学的研究中 . 然而,将复杂性测度引入到仿真模型可信度验证方面的研究尚未见报道 . 本文基于 Marzyck 的复杂性测度,在仿真数据和试验结果的整体复杂度一致性测量基础上,提出模型可信度验证的评价体系,并形成商业化软件 OntoTest. 该方法的优点是 : 从系统全局分析仿真和试验数据的差异,不需要对数据进行预处理,对样本的分布没有要求,不引入人为主观判断因素,能够处理有噪声、不完全、小样本的数据,因此是一种客观、真实反映系统整体复杂性特征的模型可信度验证方法 . 二、算法简介 2.1 基本思想 基于复杂性测度的仿真模型可信度验证的基本思想是 : 根据原始数据包含的信息熵和变量间的信息结构,计算试验数据和仿真数据的复杂性构成,并根据仿真数据与试验数据之间的复杂性差异作为评价指标,主要包括四大步骤 : Step 1 计算仿真数据的复杂性测度 Cmodel Step 2 计算试验数据的复杂性测度 Ctest Step 3 比较仿真模型与实验结果的一致性,得到可信度指标 (MCI , Model Credibility Index)=(Cmodel-Ctest)/Ctest*100% Step 4 识别对可信度指标贡献最大的变量,用于指导模型改进 . 2.2 复杂性指标的 计算 Step 1 相空间信息分析 : 包括构造相空间(Anthill),计算信息熵(Entropy)、基于互信息(Mutural Information)的广义相关系数(Generalized Correlation Coefficient)、有效相空间(Quick View)识别 . Step 2 整体信息结构认知 : 包括相空间模糊化(Fuzzification)、模糊规则抽取(Fuzzy Rules Extraction)、构造系统认知图(System Map) . Step 3 测量复杂性 : 根据系统图代表的信息拓扑结构(Topology),以及变量之间的信息熵,计算复杂性 . 2.3 相空间信息分析 相空间构造方法是:将每两个变量的样本数据构成散点图(Anthill图), 如图1所示. 相空间所包含的信息通过Shannon 熵测度进行定量计算. 相空间变量之间的非线性相关性通过基于互信息测度的广义相关系数(Generalized Correlation Coefficient)进行定量计算. 广义相关系数采用互信息测度分析两个随机变量中隐含的信息,能够很好地量化线性和非线性的相关性 ,优于传统的Pearson(皮尔森)相关系数、Spearman(斯皮尔曼)等级相关系数和Kendall(肯德尔)的tau 相关系数 .广义相关系数定义如下: 其中 I 为互信息,是两个随机变量统计相关性的测度。 2.4 整体信息结构认知 根据Zadeh 不相容原理(Principal of Incompatibility),复杂系统的不确定性越高,对其的精确描述越困难. 因此,按照一定的模糊水平数将相空间分割成模糊单元,可以快速有效地抽取复杂系统中变量之间的模糊依赖规则 . 模糊水平数可以选择3 水平、5 水平和7 水平,取决于分析粒度(Data Granularity)(图2).经过模糊单元划分后,每个样本点属于某一个模糊单元,即每个样本点的精确数值转化为等价模糊状态向量. 在排除高信息熵和低相关性的相空间图后,得到存在有效信息和结构的相空间。在有效相空间的模糊状态向量上进行模糊规则抽取,形成If-then 形式的模糊推理语句,即: If +Delta X = Delta Y IfDelta X= Delta Y If +Delta X = Delta Y If +Delta X = Delta Y 在所有模糊规则计算的基础上,通过系统图(System Map)对系统整体信息结构进行描述(图3).系统图源自模糊认知图(Fuzzy Cognitive Map)的思想,是一种知识表达和推理技术,用于获取变量间的因果联系和依赖关系 ,也可视为一种复杂系统分析和建模的方法. 系统图System Map是一个三元组U=(V, L, C), 其中: 系统图中节点(即变量)的度(Degree)代表了它与其他变量之间联系的程度,其中度值最大的变量称 为核心变量(Hub). 度有两种定义方法: 4 实证分析 4.1 问题描述 本例考查某轿车正面40%重叠可变形壁障碰撞仿真模型可信度验证问题。由于汽车碰撞是一个十分复杂和强非线性动力学问题,包含了大位移、大转角、大应变、接触碰撞现象,因此其模型可信度验证方法必须能够客观、定量和真实地反映该问题的整体复杂性特征. 利用Madymo 7.1进行某轿车正面40%重叠可变形壁障碰撞仿真,碰撞速度为56km/h. 在前排驾驶员和乘员位置分别放置一个Hybrid III 型第50百分位男性假人,试验时该假人佩戴安全带,用以考核安全带性能和测量前排人员受伤害情况. 根据C-NCAP试验规程,选择有代表意义的动态性能参数进行一致性比较,包括: 偏置碰撞中假人胸部压缩量(chest_dis),胸部三个方向的加速度(chest_accx,chest_accy,chest_accz),髋部三个方向加速度(pelvis_accx,pelvis_accy,palvis_accz) ,大腿载荷(femur). 由于仿真模型全局时间步长对计算结果稳定性影响很大,考虑到模型中有airbag、gasflow 的影响,选取模型时间步长为1e-6s,计算时间从0ms 到200ms. 试验和仿真数据文件的样本点数均为2000个. 从图4 所示时间序列上可以定性、直观地看到数据一致性比较差. 4.2 结果分析 通过4 个步骤考察仿真模型整体可信度,并为改善模型提供参考建议: Step1: 单个变量: 统计信息(定量) Step2: 两变量: 相空间形态(定性); 非线性相关性(定量) Step3: 多变量: 系统图形态(定性); 系统整体复杂性测度(定量); Step4: 模型改进建议: 识别对误差贡献率最大的变量,以便进一步改善模型可信度. 表1 是单个变量的仿真数据与试验数据统计信息差异对比表,可以定量地看到单个变量仿真结果 和试验结果存在较大差异. 图5 和图6 定性地表明仿真结果存在较大随机性和波动,模型存在较大数值噪音. 表2 和表3 表 明仿真和试验数据中相关性最强的前十组变量存在较大差异. 图7 表明试验数据中共有4 个核心变量(Hub),分别是:chest-accx, chest-accz, pelvis-accy, pelvis-accz,它们与其他变量之间的相关性最强; 而仿真数据中共有5 个核心变量,除了chest-accx, chest-accz, pelvis-accy, pelvis-accz 之外,增加了一个变量chest-accy,这说明仿真模型放大了原本不重要的变量. 通过分析系统图的差异得到仿真模型可信度指标MCI=45.9%. 从整体角度看,仿真与试验的一致性只有45.9%,因此,该模型不能用于汽车安全性设计,需要修改仿真模型参数提高仿真模型可信度.图8 表明pelvis-accz 和pelvis-accy 两个变量对误差的贡献达到40%左右.因此,可以通过敏度分析进一步考察对pelvis-accz 和pelvis-accy 影响最大的Madymo 模型参数(比如: 安全带织带刚度缩放系数、安全带限力特性函数、安全带预紧特性函数、安全气囊泄气孔直径缩放系数、仪表板特性函数、座椅座垫刚度加载函数等),并通过试验设计或优化匹配等方法提高仿真模型可信度指标MCI. 5 结论和展望 本文讨论了基于复杂性测度的仿真模型可信度验证方法,以及其软件实现OntoTest 软件在某轿车 正面40%重叠可变形壁障碰撞仿真模型验证中的应用. 实证研究表明,本方法能够从整体角度分析试验和仿真数据一致性,不需要对数据进行预处理, 对样本的分布没有要求,不引入人为主观判断因素,可以处理有噪声、不完全、小样本的数据,因此 是一种能够客观、真实反映系统复杂性特征的模型可信度验证方法,适合于对复杂非线性动态系统的 仿真模型验证. 参考文献 Jeong Keun Lee,Soon Gu Hong,Soon Jo Park. A Correlation Methodology of Airbag Body Block Test and Simulation Using Optimization Technique. SAE World Congress,2004 Balci O. Validation,verification and testing techniques throughout the life cycle of a simulation study. Proc. of WSC' 94 (Winter Simulation Conference), 1994. 郭巍,李云芝,姜振东. 用相似理论讨论仿真的可信度 ,系统仿真学报,1999,l0(2):113-115. 吴晓燕 赵敏荣 刘兴堂 李彦彬. 仿真系统可信度评估及模型验证方法研究. 计算机仿真. 2002 19(3): 李鹏波,谢红卫. 现代谱估计方法在仿真可信度研究中的应用, 计算机仿真,1999,16(1):45-48. 蔡金狮等. 飞行器系统辨识. 中国宇航出版社. 1995 杨惠珍,康凤举,李俊.基于模糊AHP 的系统仿真可信度评估方法 ,计算机仿真,2003,20(8): 43-5. 杨惠珍,康凤举等,层次分析法在水下航行器系统仿真可信度评估中的应用研究,系统仿真学报,2002(10). 魏华梁,李钟武. 灰色关联分析及其在导弹系统仿真模型验证中的应用. 系统工程与电子技术, 1997(2):55-61. 邢修三. 物理熵、信息熵及其演化方程.中国科学(A 辑),31(l):77-86 E.T Jaynes,Information Theory and Statistical Mechanics.Phys Rev,1957,106(4):620-630 Lempel A,Ziv J. On the complexity of finite sequences . IEEE Transactions on Information Theory, 1976, IT-22(1):75-81. J Marczyk,Principles of Simulation-Based Computer-Aided Engineering,FIM Publications, Madrid, 1999. J Marczyk,B Deshpande, Measuring and Tracking Complexity in Science,Inter Journal Complex Systems. 2006 Shannon C E. The mathematical theory of communication. Bell Sys Tech J,1948,27(3,4): 373-423, 623-656 S. Aumonier,Generalized Correlation Power Analysis,in the proceedings of the ECRYPT Workshop on Tools For Cryptanalysis,Krakow,Poland,September 2007 Celluci, C. J.,A.M. Albano,and P.E. Rapp (2005),Statistical validation of mutual information calculations: Comparisons of alternative numerical algorithms Phys. Rev. E,71,066208 Zadeh L A. Fuzzy sets and information granularity. in: Advances in Fuzzy Set Theory and Applications, Gupta, N., Ragade, R. and Yager, R. (Eds.), North-Holland, Amsterdam, 3-18, 1979. CD Stylios,PP Groumpos. Fuzzy Cognitive Map in Modeling Supervisory Control Systems . Journal of Intelligent and Fuzzy Systems,2000,18 (2):83-98. 本文引用地址: http://sciencenet.cn/m/user_content.aspx?id=337135
个人分类: 科研天地|3950 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-4-26 21:06

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部