预测地点间的人群移动量是交通工程学、经济地理学、社会物理学等领域的一个基本科学问题。一百多年来,研究者们陆续提出了多种人群移动量预测模型,这些模型在经济地理学中称为空间交互模型,在交通科学中称为出行分布模型。其中,引力模型是最经典的出行分布预测模型之一。引力模型的提出最早可以追溯到 Henry Carey 在 1858 出版的《 Principles of Social Science 》一书。经典的引力模型与牛顿万有引力定律的形式非常类似,它假设两个地点之间的出行量与两地点的人口数成正比,与两地点之间距离的幂次(不一定是平方)成反比 。这一模型形式简单、概念易懂,不仅被广泛地应用于交通规划中的出行分布预测,还被应用在包括国家或地区之间的移民量预测、贸易量预测、货运量预测、通讯量预测等诸多问题上。但是,引力模型存在的最大问题是包含待定参数,必须根据出行调查数据进行模型的参数估计之后才能实施预测,当缺乏这类数据时则无法使用。类似的问题在介入机会模型、随机效用模型等预测模型 中也同样存在。 针对上述问题, 2012 年 Barabási 小组提出一个名为辐射模型的出行分布预测模型 ,它的基本假设是出行者在选择目的地时,会选择距出行起点最近且比起点机会数多的一个地点出行(这里的机会数是按正比于地点人口数随机抽样的)。辐射模型的突出特点是不需要任何可调参数、仅输入各地点的人口分布数据就可以相当准确地预测城市间的人群移动量,克服了引力模型存在的缺陷。但是,辐射模型在运用于城市内人群移动量预测时结果却与实际有较大的偏差。下图显示了我们用北京市出租车 GPS 数据进行的一个对比,图中最左列是辐射模型预测结果,中间一列是实际的出行数据,最右列是我们模型的预测结果。从图中可以看出,辐射模型预测的人群出行范围明显小于实际情况。 我们通过分析认为,造成辐射模型预测偏差的可能原因是:由于城市的聚集范围相对较小,出行者在选择目的地时不是仅仅考虑距离起点最近的高机会目的地,而是会综合衡量城市范围内所有潜在目的地的出行机会数。一般而言,对于具有相同机会数的目的地来说,出行者更倾向于选择近的目的地;而对于距离相近的目的地来说,机会数多的地点对出行者的吸引力更大。换句话说,一个地点被出行者所感受的机会数是该地点的实际机会数按某种方式衰减后剩余的部分。在引力模型中是用一个幂律距离函数来描述这种衰减,但这一函数中不可避免的要引入可调参数。是否存在更自然的、不依赖于具体参数的方式来描述这种机会衰减现象呢?我们在最近的工作中 提出了一个新的衰减机制,认为目的地的机会数会按照起终点之间的人口总数加权衰减,即出行者选择一个目的地的概率正比于目的地的机会数,反比于出行者所在地点到目的地之间的人口总数(再减去一个有限尺度效应)。我们将这一模型命名为人口权重机会模型。由于地点机会数可以假设为正比于地点人口数,因此这个模型中所需要的输入数据仅仅是各地点的人口分布,与辐射模型一样是不需要任何可调参数的。 为验证人口权重机会模型的预测效果,我们收集了尽可能多的城市人群移动数据,既包括传统的居民出行调查数据(五个美国城市),也包括新型的人群移动轨迹数据如手机用户数据(一个非洲城市)、社交网络签到数据(六个欧洲城市)和出租车 GPS 数据(两个中国城市)。下图是在 14 个案例城市中用人口权重机会模型和辐射模型进行出行预测的准确率对比,从中可以看到我们模型的预测准确率在所有案例中都高于辐射模型。尽管这些城市在人口数量和城市规模、社会文化背景、经济发展水平等方面是非常多样化的,但我们模型却取得了十分稳定的预测效果(准确率都在 70% 左右),暗示着我们的模型或许抓住了与具体城市背景无关的人群移动模式形成的普遍机制。 人口权重机会模型以其低数据输入需求、高预测精度的特点,为城市规划、交通工程、疾病传播研究等领域提供了一种新的人群移动量预测手段,特别是在缺乏大规模交通调查数据的情况下,这一模型更具有实用价值。该工作近期已被英国皇家学会《交界》期刊( Journal of the Royal Society Interface )接收。可点击 http://rsif.royalsocietypublishing.org/content/11/100/20140834.full 或 http://arxiv.org/abs/1307.7502v2 获取全文。 参考文献: Ortúzar J D, Willumsen L G. Modelling transport. Wiley, 2001. Simini F, González M C, Maritan A, Barabási A-L. A universal model for mobility and migration patterns. Nature, 2012, 484: 96-100. Yan X-Y, Zhao C, Fan Y, Di Z, Wang W-X. Universal predictability of mobility patterns in cities. J R Soc Interface, 2014, 11: 0834 附:写给交通规划师的实际操作指南 因为我本人做过一些实际的交通规划项目,我不愿看到我们的模型仅仅停留在纸面上,而是希望有更多的人能够在实际工程中使用它。因此,在这里写一点实际应用这个模型时的注解,希望对交通工程、城市规划等领域的技术人员有所帮助: 人口权重机会模型适合于在没有居民出行调查数据的情况下进行出行分布预测时使用(比如交评或预算有限的规划项目)。所需的基本输入数据有两类:一是城市人口分布,另一个是人均日出行次数。 其中,城市人口分布数据的最佳来源当然是人口普查数据,但这种数据其实在国内也不好获取。目前可行的办法是找替代数据。现在互联网社交签到数据很火,很多研究都用爬取的 POI 签到密度来近似人口密度,这样再有城市人口总量后,就可以得到近似的城市人口分布了。另外,如果有手机通讯记录数据也可以(当然手机数据在国内也不好拿到),处理方法与签到数据类似。 关于人均日出行次数,一般国内的城市大多在 2.5 次 / 人日左右,当然如果有历史调查的或类似城市的数据可以参考更好。如果没有可以做小样本的调查,几百人的抽样规模就足以得到准确的人均日出行次数了。 最后一个小提示,论文中的人口权重机会模型只是带起点出行约束的模型,不能保证终点出行约束。但用 Furness 方法等迭代技术很容易对模型结果进行双约束,具体方法可随便参考一本交通规划教材,大部分教材都有这方面的技术实现步骤。 这里 pwo.zip 是人口权重机会模型的 C# 程序代码以及示例数据。如果您在使用我们模型时有任何问题或改进建议,欢迎随时与我联系。我的 email 是 :kaiseryxy at 163 dot com.
2013 年上映的电影《地心引力》浓墨重彩地描述了人类 失去 赖以生存的母体作用,生命也将随时面临危机,其关联关系显而易见。然而,万有引力与网络科学,与互联网有什么关系呢? 最近,虎哥的处女作 ” Gravity Effects on Information Filtering and Network Evolving ” 刚刚在 PLoSONE 上发表,详细地阐述了这方面的研究进展。 利用万有引力模型,进行社会经济信息方面的研究由来已久。如人口迁移 ,国际贸易 ,交通分析 ,人类空间行为预测 等。然而,在人类在线行为分析、建模和预测的工作中,万有引力模型的应用还很少见。本文利用人们的在线标注行为中的蕴藏的丰富信息,将用户和物品的标签数视为“质量”,将二者之间的共同兴趣大小 ( 相同标签个数 ) 视为“距离”,这样很自然地将引力模型引入到推荐系统中,刻画和预测未知二元关系的似然程度。进一步地,为了理解“万有引力”和网络增长的关系,我们将所改进的引力模型和 ER 及 BA 模型进行比较,发现基于引力模型演化的网络,其拓扑性质比 ER 、 BA 等随机网络更加贴近真实网络结构。总结而言,本文的贡献有以下三点: 1. 将万有引力模型引入到推荐系统中,方法简洁而新颖,结果也更优; 2. 基于兴趣的万有引力模型,比随机网络模型更能刻画真实网络; 3. 在推荐算法设计中,没有像传统推荐模型一样,显式地利用网络关系,而是从人的兴趣行为这一根本驱动力出发,匹配“人 - 物”这一对二元关系。更优算法的结果预示着人的兴趣行为可以用来有效地预测网络结构。这种从网络底层到网络表层的预测方法,越来越显示出一系列有趣、有效也更有解释性的优越性,我们在后面其他的工作中还会持续介绍。 另外,本文用到的数据,可在 论文官方网页 上提供免费下载。 编后注:利用引力模型做信息推荐,最初的灵感来自于博友 章成志 对博主一篇博文的评论,并介绍了一篇相关的计算机会议论文。当时我看完后,第一感觉是,问题很有趣,方法太繁琐,有如隔靴搔痒般的不爽利。经过大家几番试验后,终于采用最接近引力模型原始方式来处理。可以说,本工作完全是来自于科学网互动交流的启发。本文在最后也特别致谢了 章成志 博友。 参考文献: Karemera D, Oguledo VI, Davis B (2000) Agravity model analysis of international migration to north america. Appl Econ 32: 1745 – 1755. Rose AK (2004) Do we really know that thewto increases trade. Am Econ Rev 94: 98 – 114. Jung, WS, Wang F, Stanley, HE (2008)Gravity model in the Korean highway. EPL. 81: 48005 Simini, F, Gonz á lez MC, Maritan A, Barab á si, AL (2012). A universal model for mobility and migration patterns. Nature 484, 96-100 论文信息 :Jin-Hu Liu, Zi-Ke Zhang, Chengcheng Yang, Lingjiao Chen, Chuang Liu, XueqiWang. Gravity Effects on Information Filtering and Network Evolving. PLoS ONE 9(2014) e91070. 论文在线: http://www.plosone.org/article/info%3Adoi%2F10.1371%2Fjournal.pone.0091070 本地下载: 2014PO-Gravity Effects on Information Filtering and Network Evolving.pdf
引力模型的数学证明 邓 宏 广州大学商学院 所属研究领域:国际经济学 摘要:大多数国际贸易理论只能定性解释贸易与其他经济变量的关系。在定量成果研究中,引力模型是一个重要工具。但一般认为引力模型缺乏理论依据。本文以劳动分工为出发点,以总产出的 增加值 统计方法为依据,从数学上证明了引力模型的存在。证明过程显示出引力模型反映的是生产与流通这两个基本环节的数量关系,这种关系在国际贸易和国内贸易中同样适用。 关键词:贸易,引力模型,数学证明, A Mathematical Derivation Of The Gravity Equation Abstract: Popular theories concerning international trades can give only qualitative explanation. In the quantitative research literatures, the gravity equation is an important approach. But the theoretical foundation of the equation is uncertain. Based on a new recognition of labor division and the accounting principles of value added for output, this paper derives mathematically this gravity equation. The derivation process shows that the gravity equation reflects the quantitative association between production and circulation. It is applicable both in international trade and domestic trade. Key words: trade, gravity equation, mathematical derivation 引力模型的数学证明 1. 引言 国际贸易方面的研究成果很多,但对于贸易额与其他经济变量之间的关系,大多数理论只能给出定性解释,并不能给出定量解释。在定量考察方面,引力模型是一个重要工具。 引力模型其基本形式是 ( 1 ) 式中 X 是两个国家之间的贸易额, Y 1 、 Y 2 是这两个国家的国内生产总值( GDP ), d 是两个国家之间的距离, G 是一个常数。 该模型最早是由 Tinbergen ( 1962 ) 提出的,它在形式上不过是对牛顿万有引力定律的模仿,一般认为缺乏理论依据。 由于缺乏理论依据,引力模型在应用中的效果也不理想。比如 McCallum(1995) 在运用引力模型进行实证研究时发现,加拿大本国各省之间的贸易量是他们与美国某一州之间贸易量的 20 多倍,他将这种现象解释为边境效应 ( border effect) 的影响。 其他许多学者在对边境效应进行考察的同时,还对引力模型进行了各种修改,试图使引力模型更加实用 (Anderson 1979, Anderson and Wincoop 2001, Evans 2003, Baltagi and Pfaffermayr 2003, Egger and Pfaffermayr 2003) 。不过这些修改后的模型已经不再具有引力模型的形式。 一些学者认为,像比较成本论、资源禀赋论、规模经济论等应该是引力模型的理论基础 (Evenett and Keller 2002, McPherson and Redfearn 2001, Tiiu Paas and Egle Tafenau 2005) 。但他们从这些理论并不能定量得到一个确定的引力模型 (Tiiu Paas and Egle Tafenau 2005) 。换言之,引力模型 的理论基础问题并没有真正解决。 本文以劳动分工为出发点,以总产出的增加值计算规则为依据,发现产量与流通量之间存在确定的数量关系。一个区域的产量通常以国内生产总值( GDP )表示,该区域与其他区域之间的流通量通常以贸易额表示。从事经济活动的劳动者具有一定的空间分布,流通是劳动者分工合作以及实现生产和消费的必要过程。以商品的移动成本表示劳动者之间的距离,并运用一定的假设将问题简化后可以证明,任何两个经济之间的流通量与二者之间的经济距离的平方成反比,与二者的经济总量的乘积成正比。也就是说,用引力模型来表达生产量与流通量的一般关系,有着确切的理论依据。 本文不仅从理论上确定了生产与流通的数量关系,使引力模型中变量的实际意义更为明确,更重要的是,本文所展示的分析方法对于相关理论研究很有启示意义。 2. 贸易――价值实现的必要环节 现代社会生产的一个重要特征是劳动分工。任何一个经济的产出都是由大量的劳动者通过分工协作完成的。 假设一个经济中含有 N 个劳动者,每个劳动者的产出量为 q ,则该经济的总产出为: Q = Nq (2) 现实当中,每个劳动者的产出量一般并不相同,这里我们采用平均产出,即 q 可以视为是一个代表性劳动者的产出。 注意到所有的劳动者不可能在同一地点从事生产和消费活动,每个劳动者处在不同的地理位置。因此,流通实际上就是把需要交换的产品移动到需要它的地方并完成交换的整个贸易过程。因此,流通是实现市场交换的必要条件。通常我们把企业之间或者企业与消费者之间的交易视为流通,是因为这些活动的交易额便于分别计算;我们不把企业内部的物品从一个车间移动到另一个车间视为流通,是因为这些活动不便于分别计算,并且通常都计算到生产成本中去了。 根据国内生产总值( GDP )的统计规则,不参与市场交易的产品或劳动是不被计入 GDP 的。也就是说,如果没有流通,就没有市场交换,也就没有 GDP 。比如说,尽管人人都在劳动,并且有产品生产出来,但如果没有流通和交换,每个劳动者的产品都在原地不动,按照 GDP 的统计规则,经济系统的总产出为零。 现在我们根据 GDP 的增加值统计方法来考察流通与产出的数量关系。 在( 2 )式所给出的生产情况下,当没有贸易发生时,经济系统的产出额为 0 。 当有一定数量的产品 为了交换而从劳动者 B 移动至劳动者 A 时,假设运送费率为 f ,则我们可观察到一个产出增加值: ( 3 ) 不论是谁完成了产品的运送,这个贡献值 必是劳动者 A 的产出 q 中的一部分。 比如, 当运送是由 A 完成的,则 f 就是 A 对产出增加值的贡献;当运送是由他人完成的,则 A 必须从自己的劳动产品增加值中支付相等的数量,否则就不能实现等价交换。 此外,我们不必追究所运送商品的全部价值,因为 GDP 的统计只需观察经济活动对产出贡献的增加值。 3. 平方反比律 现在来考察距离为 r 的两个劳动者 A 与 B 之间的贸易。 . 让我们画一个半径为 r 的圆环,如图 1 所示, 劳动者 A 位于圆心,劳动者 B 位于环上。 每个所考察的劳动者和代表性的劳动者完全一样。即他们的产出相同,产品也相同,谁都不比他人更具有特权。 由于圆环上所有劳动者(包括 B )与 A 的距离都相同,所以他们与 A 的贸易额也应该都相同,记为 。 假设劳动者是均匀连续分布的,注意到环上每个劳动者所占的面积为 ,则他们与 A 之间的贸易额之和为 ( 4 ) 令环的宽度为一个劳动者所占的宽度,即 dr = 1 ,则上式简化为: ( 5 ) 一个劳动者的产出越大,他与周围其他劳动者的交易量就应该越大。因此可以近似认为 与 q 成正比 : ( 6 ) θ r B A 图 1 ? 两个劳动者之间的贸易 这里 h 可以认为是常数。 由 (5) 和 (6) 可得 (7) 根据实际经验,可以近似认为运输费率与运输距离成正比。即 f = kr ( 8 ) 式中 k 为常数。 于是( 7 )可以写为 ( 9 ) 或者 ( 10 ) 显然式中 r 和 f 的意义相似,即他们都反映了产品移动成本的高低。我们不妨将产品移动成本称为经济距离。 ( 10 )式的意义是,两个劳动者之间的贸易额与他们之间经济距离的平方成反比。这是一个平方反比律。 4. 贸易额与产出额 假设劳动者 A 所处的经济包含有 N 个劳动者,劳动者 B 所处的经济包含有 M 个劳动者(图 2 ),则两个经济之间的贸易额应该是每个经济中所有的劳动者与另一个经济中所有劳动者之间的贸易额之和。即 ( 11 ) M N ? B A ? A r 图 2 两个经济 M 和 N 式中 X 是经济 N 与经济 M 之间的贸易额,求和符号下的 N 和 M 表示在这两个经济区域范围内求和。 由于每个劳动者的位置不同,经济距离 f 是应该变量。但当两个经济 N 和 M 的尺度相对于他们之间的经济距离 f ( 或 r ) 很小时, f 可以近似视为一个常数。于是( 11 )式的求和比较简单: ( 12 ) 根据( 2 )式,( 12 )可以写为 ( 13 ) 式中 和 是两个经济 M 和 N 的产出量。 或者 ( 14 ) 式中 P 1 和 P 2 分别是两个经济的价格水平, 和 分别是两个经济的 GDP 。 记 , 则 (13) 式可以写为 ( 15 ) (15) 式明确给出了任意两个经济的产量与流通量的数量关系,它与引力模型的数学形式完全一致。式中的 G 可以称为流通常数或贸易常数。 5. 结论及进一步讨论 流通和生产是经济活动不可或缺的两个基本环节。任何具有一定规模的经济,只要有生产,就必然有流通,并且二者存在确定的数量关系。 流通量和产量之间的数量关系可以近似表达为引力模型,即任何两个经济之间的流通量或贸易额与二者之间的经济距离的平方成反比,与二者的经济总量的乘积成正比。而传统的国际贸易理论均无法解释引力模型。 从本文的分析可以看到,国内贸易与国际贸易并没有本质的区别,二者的主要差异不过是经济距离的差异。此外,经济距离概念的提出,在一定程度上可以解释所谓边界效应。因为国际贸易中的关税和其他贸易壁垒,风险以及其他成本较大,这些因素在地理距离一定的情况下,使经济距离大大增加。因此,与国内贸易相比,贸易额会大大降低。 注意到流通常数 ,从本文的推导过程可以理解, h 和 k 应该是相当稳定的参数。而 q 反映了全球经济的生产能力,它一般会随着时间推移而增长,因此 G 可能会随着时间的推移而有所减小。 最后我们把本文推导过程中所使用的基本假设概括一下。 1 )每个劳动者的生产力在全球均匀分布。 2 )世界经济是一个平面。 3 )产品的移动成本与移动的地理距离成正比。 4 )任何两个劳动者之间的交易是均衡的(即贸易差额为 0 )。 不难看出,这些假设虽然都是近似的,但都有真实的客观基础。 参考文献 Anderson, J. E. 1979. A Theoretical Foundation for the Gravity Equation. American Economic Review , 69. Anderson J E, Wincoop E. Borders, 2001. Trade and Welfare, National Bureau of Economic Research. Working Paper Cambridge, MA No 8515, October 2001. Baltagi, B.H., Egger, P., Pfaffermayr, M. 2003. A generalized design for bilateral trade flow models, Economics Letters, 80, 391-397. Evenett Simon, Keller Wolfgang. 2002. On Theories Explaining the Success of the Gravity Equation. Journal of Political Economy, 110: 281 Evans C. 2003. The Economic Significance of National Border Effects. American Economic Review, 93: 1291 ~ 1312. Egger, P., and Pfaffermayr, M . 2003. The proper panel econometric specification of the gravity equation: A three-way model with bilateral interaction effects, Emprical Economics, No. 28, 571-580. McCallum J. 1995. National Borders Matter: Canada - U. S. Regional Trade Patterns. American Economic Review, 85: 615 ~ 623. McPherson, Michael A, Redfearn, Michael R, Tieslau, Margie, 2001. International trade and developing countries: an empirical Investigation of the Linder hypothesis, Journal Applied Economics , 33: 649-57 . Pyhnen P. 1963. A Tentative Model For the Flows of Trade Between Countries. Weltwirts- chatftliches Archiv, 90 (1) . Tiiu Paas and Egle Tafenau, 2005. European trade integration in the Baltic Sea Region -A gravity equation based analysis, HWWA Discussion Paper 331, Hamburgisches Weltwirtschafts Archiv, Hamburg Institute of International Economics 2005 Tinbergen J. 1962. Shaping the World Economy: Suggestion for an International Economic Policy. New York: The Twentieth Century Fund. 作者简介: 邓宏,广州大学商学院副教授,系统工程专业博士,主要从事经济学研究 地址:广州市大学城外环西路 邮编: 510006 电话: 020-31877311 , 13342885951 Email : forex2005@yahoo.com.cn 换一个角度也可以理解正比关系。劳动者从他人那里购买的产品 可以视为投入,他自己生产的产品是产出,产出应该与投入成正比。 word版