荣智海的blog分享 http://blog.sciencenet.cn/u/rongzhh

博文

时间尺度的多样性促进零行列式策略在网络系统中涌现

已有 3973 次阅读 2015-4-1 15:36 |系统分类:论文交流|关键词:学者

 零行列式(Zero-determinant strategy, ZD)策略是近年来博弈论关注的一类重要策略,使用零行列式策略的个体可以单方面保证双方期望收益满足线性关系[1]。零行列式策略为刻画博弈双方作用关系提供了全新的研究视角,正在改变博弈理论的研究范式[2]。剥削策略(Extortion strategy)——它可以使自身收益是对手的任意倍——作为一类重要的零行列式策略近年来被广泛关注。最近的研究指出,剥削策略在种群中通常不是演化稳定的,但它可以作为触媒促使合作行为在种群中涌现[34]。因此,以剥削策略为代表的零行列式策略在种群中的演化机理正被深入研究[56]

 NJP2015_RongWuHaoChenZhou+SI.pdfEPL2013_RongWuChen_102_6_68005.pdf网络演化博弈中存在两类相互耦合的网络:相互作用网络和策略演化网络,前者描述了个体与谁博弈;后者刻画了个体行为的变化,二者演化的时间尺度可能不同。基于前期网络中时间尺度演化研究[7]的基础上,荣智海教授、吴枝喜教授(兰州大学)、郝东博士、Michael Chen博士(香港大学)、周涛教授合作探讨了策略演化时间尺度的多样性对剥削策略的演化作用机理[8]。考虑获得高收益的个体更倾向于维持当前行为而减缓策略演化速度,因此可以将策略演化时间尺度与个体收益联系,研究因收益导致的不同时间尺度的个体在规则格子、随机网络和无标度网络中的剥削策略演化过程。不同于过去认为剥削策略在均匀混合种群中的演化不稳定,该文发现策略演化时间尺度因素的引入会促使剥削策略在网络环境中的稳定存在,并进一步导致合作行为的涌现。由于个体收益与时间尺度之间的反馈作用,无标度网络中大度节点更倾向于采取剥削策略,促使合作行为在异质的无标度网络中更容易涌现。这可以为群体行为调控和多智能体协议设计提供理论指导。

 

参考文献:

[1]W. Press, F. Dyson (2012), Iterated Prisoner’s Dilemma contains strategies that dominate any evolutionary opponent, Proceedings of the National Academy of Sciences, vol. 109, pp. 10409–10413.

[2]A. J. Stewart, J. B. Plotkin (2012), Extortion and cooperation in the Prisoner’s Dilemma, Proceedings of the National Academy of Sciences, vol.109, pp.10134–10135.

[3]C. Adami, A. Hintze (2012), Winning isn’t everything: Evolutionary stability of zero determinant strategies, Nature Communications, vol.4, pp.3193.

[4]C. Hilbe, M. A. Nowak, K. Sigmund (2013), Evolution of extortion in iterated Prisoner's Dilemma games, Proceedings of the National Academy of Sciences, vol.110, pp.6913-6918.

[5]A. J. Stewart, J. B. Plotkin (2013), From extortion to generosity, the evolution of zero-determinant strategies in the prisoner's dilemma, Proceedings of the National Academy of Sciences, vol. 110, pp.15348-15353.C.

[6] A. J. Stewart, J. B. Plotkin (2014), Collapse of cooperation in evolving games, Proceedings of the National Academy of Sciences, vol.111, pp.17558–17563.

[7]Z. Rong(荣智海), Z. Wu(吴枝喜), G. Chen(陈关荣) (2013), Coevolution of strategy-selection time scale and cooperation in spatial prisoner's dilemma gameEPL, vol.102, pp.68005.

[8]Z. Rong(荣智海), Z. Wu(吴枝喜), D. Hao(郝东), Michael Z. Q. Chen(陈志强), T. Zhou(周涛) (2015), Diversity of time scale promotes the maintenance of extortioners in spatial prisoner's dilemma game, New Journal of Physicsvol.17, pp.033032.

论文链接:http://iopscience.iop.org/1367-2630/17/3/033032




https://m.sciencenet.cn/blog-41909-879027.html


下一篇:适当的个体期望水平可以促进空间囚徒困境博弈上的宽容行为

1 黄盼华

该博文允许注册用户评论 请点击登录 评论 (2 个评论)

数据加载中...

Archiver|手机版|科学网 ( 京ICP备07017567号-12 )

GMT+8, 2024-3-29 00:13

Powered by ScienceNet.cn

Copyright © 2007- 中国科学报社

返回顶部