科学网

 找回密码
  注册
科学网 标签 博弈论 相关日志

tag 标签: 博弈论

相关日志

[转载]杨六省:囚徒困境让博弈论和经济学界蒙羞
zhpd55 2020-6-30 21:31
说明:因杨六省(13572503691@163.com)老师之邀,将其一篇关于“囚徒困境让博弈论和经济学界蒙羞”吗的回答新作转载于下,请行家进行评议,也可以直接与杨六省老师联系。 囚徒困境让博弈论和经济学界蒙羞 杨六省 问题: 两名嫌犯A和B被警方抓获,被分别关押在不同的房间里接受警方的盘问。他们被告知:如果一人认罪,另一人不认罪,认罪者可获释,不认罪者将获刑20年;如果两人都认罪,他们将均获刑10年;如果两人都不认罪,他们将均获刑1年。为简明起见,我们用下表反映问题条件。 两人各会有什么盘算呢? 嫌犯A可能会这样想:假设B选择认罪,我若不认罪,将获刑20年,若认罪,只获刑10年,当然选择认罪有利;假设B选择不认罪,我若也不认罪,将获刑1年,我若认罪,则可获释,显然还是认罪有利。总之,不管对方选择认罪还是不认罪,认罪对我都是最佳选择。 同样,嫌犯B的盘算结果也是认为,选择认罪是最佳方案。然而,如果两人都选择不认罪的话,他们都只会获刑1年,而不是10年。 上述这个与客观事实(指两个囚徒都应该选择不认罪的策略)相矛盾的推理结论(指两个囚徒都应该选择认罪的策略),就是著名的囚徒困境,也叫囚徒悖论。 作者评析:参与者追求个人利益最大化是博弈活动的灵魂。但是,这个灵魂(策略选择的动机)不应该像一匹脱缰的野马那样任性,因为赛场上还有其他的马匹也参与比赛。所以,这个灵魂应该由“一根缰绳”来约束,“这根缰绳”就是一致性原则。如果把前者(参与者追求个人利益最大化的动机)叫做“本能”,那么,后者(遵守一致性原则)所反映的就是“理性”,换句话说,参与者既是自私的,但也应该是理性的,这是我们讨论问题的假设前提。但遗憾的是,人们常常只考虑前者而忽视了后者,甚至误以为,理性人概念的全部意义似乎只在于追求个人利益最大化,而不考虑其做法是否符合一致性原则。这种原则性的错误所引发的矛盾有时会是令人惊讶的!例如,在囚徒困境中,声称认罪是每个参与者的占优战略(占优策略是指,无论什么情况都应该采取的策略选择),但这一结论却被客观事实(题目条件)所否决。 任何一个理论系统,如果它是合理的,那么,其自身必然是无矛盾的,与其他学科必然是相容的,与客观事实必然是相一致的。学术界尚未解决的难题比比皆是。但是,目前尚无能力解决难题是一回事,而容忍矛盾的存在,甚至为矛盾的存在进行辩护则是另一回事。前者并不令人蒙羞,但后者会令学界蒙羞!囚徒困境问题的现状就属于后者,例如,学界认为,“认罪是每个参与者的占优策略”,但两人都认罪却不是问题的最优解;纳什均衡是反映稳定性的概念,但最优解(两人都不认罪)却不是纳什均衡;最优解明明客观存在,却认为不可证,即理由不可知;帕累托最优是个合理的概念,但学界却认为纳什均衡概念与帕累托最优概念是冲突的;亚当·斯密的“看不见的手原理”是合理的,但学界却认为纳什均衡概念挑战了亚当·斯密的“看不见的手原理”;当推理结论(指囚徒应该选择认罪策略)与客观事实发生冲突时,不是去质疑推理,否定推理,而是容忍冲突,为冲突辩护,说什么这种冲突是因为个人理性与集体理性相矛盾的缘故,试问,一个具有一致性的理论,其个人理性与集体理性难道会是不相容的吗?……上述种种矛盾是应该拒斥和消除的,但博弈论和经济学界却容忍上述矛盾,并为之进行辩护,这着实让博弈论和经济学界蒙羞! 囚徒困境所引发的矛盾和冲突是如此之多,这足以表明,博弈论与经济学必须为博弈行为制订规矩。 博弈行为准则:任何一个参与者,其策略选择的动机均在于追求利益最大化,但不得违反一致性原则,即不得引发矛盾。 “假设对方选择不认罪策略,则我应当选择认罪策略”这一观点似乎已为学界所公认,并被冠以“个人理性”之美名!下面我们就来说明,以往人们的推理为什么是无效的,错误究竟出在哪里? 嫌犯A既然以“假设B选择不认罪策略”作为推理前提,依据博弈行为准则,A就得认可B的这种策略选择是为了达到、并且也应该达到其收益大于或等于A的收益。但是,当A又利用“假设自己选择认罪策略”进行推理时,就是又认可了自己的策略选择动机,即要使自己的收益大于或等于B的收益,但依据警方告知的条件,两人的策略选择动机不可能是相容的,这表明A在推理中应用了互不相容的条件,这是有效推理所不允许的(注:错误之处不在于假设前者,而在于在假设前者的前提下又假设后者,或者更确切地说,错误在于,最终没有否定后者),所以,A关于“假设对方选择不认罪策略,则我应当选择认罪策略”的证明是无效的。此说法对于B同样成立,因为B和A在博弈中所充当的角色是对称的。 纳什因纳什均衡概念的提出而获得诺贝尔经济学奖。诺贝尔经济学奖得主梅耶森认为,发现纳什均衡的意义,可以和生命科学中发现DNA的双螺旋结构相媲美。但笔者认为,纳什均衡概念的内涵是有缺陷的,是不完整的,因此,梅耶森对纳什均衡的评价显然是过誉了。事实上,“在科学院的投票中,纳什与1994年度诺贝尔经济学奖的另外两名候选人勉强以微弱多数胜出,这是历史上最接近失败的一次评选。”(参见《美丽心灵——纳什传》第469页) 本帖只是一个引子。关于囚徒困境问题的详细讨论,参见杨六省著《悖论是什么——70个悖论的消解》,汉斯出版社,2020年6月出版。 杨六省老师原文: 囚徒困境让博弈论和经济学界蒙羞.doc
个人分类: 数学研究|4203 次阅读|0 个评论
博弈论及其改进求解组合权重
dayon 2020-6-28 23:41
博弈论是一种在多个权重之间进行协调的方法 英文解释为: %当n=2,即对两个基础权重进行组合时 u1= ;%基础权重1 u2= ;%基础权重2 a= ; b= ; omg=a\\b%组合系数 omg=omg./sum(omg) comw=omg(1)*u1+omg(2)*u2%组合权重 改进博弈论 改进原因:未经过改进的博弈论在求解组合系数的时候,有可能会出现负数,这明显是不符合实际情况。因此,根据文献研究,对其进行改进,保证组合系数始终为正数。 u1= ; u2= ; up= ; m1=u1*up'; m2=u2*up'; mm=m1+m2; coeff=mm/norm(mm) alpha=coeff/sum(coeff)%组合系数 comw=alpha(1)*u1+alpha(2)*u2%组合权重 组合赋权_模糊聚类算法的改进及其在洪灾风险评价的应用_潘汀超.pdf
个人分类: 科研笔记|1 次阅读|0 个评论
专题讨论班:竞技策略与数学(二)(田远鸿)
GrandFT 2018-12-2 09:51
专题讨论班:竞技策略与数学(二) 主讲:田远鸿 时间:2018年12月2日(星期日)上午10:00 地点:天津大学新校区32楼302 1.远胜利条件下的阶段分类 2.近胜利条件的边缘博弈分析
个人分类: 专题讨论班|1584 次阅读|0 个评论
新录IEEE Communications Letters 论文-D2D 网络分布式信道接入
sunyouming10 2016-10-3 10:53
最近以第一作者身份被IEEE Communications Letters期刊录用一篇论文 标题为:Distributed Channel Access for Device-to-Device Communications: A Hypergraph-based Learning Solution 作者: Sun Youming; Wu Qihui; Xu Yuhua; Zhang Yuli; Sun Fenggang; Wang Jinlong Abstract: In this letter, we propose a learning solution fordistributed channel access in device-to-device communications based on hypergraph interference model. We first define a new interference metric for hypergraph model, and then formulate this distributed channel access problem as a local altruistic game, which is proved to be an exact potential game admitting at least one pure strategy Nash equilibrium (PNE). A distributed learning algorithm is designed to quickly achieve the optimal PNE, which can minimize the defined networks’ interference metric. Simulation results show that the proposed algorithm outperforms the existing schemes and significantly improves the spectrum efficiency. 考虑在未来密集网络中(D2D网络,小蜂窝网络)存在诸多弱干扰源,传统的二元干扰图只强调了成对节点间的强干扰关系,但是忽略了干扰叠加效用。因此该论文从图模型出发,利用超图干扰模型刻画累计干扰关系。目前虽已经有部分研究工作关注超图干扰模型,但是这部分工作都是基于集中式的资源分配方法,需要全局的信息交互,因而难以适用到具有高度动态性和缺乏信息交互的D2D网络场景。该论文将D2D网络中的分布式信道接入问题建模为局部互利博弈模型,并证明该博弈为精确势能博弈。然后设计了一种快速学习算法收敛到博弈的纯策略纳什均衡解。
个人分类: 学术论坛|4460 次阅读|0 个评论

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-5-19 19:53

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部