物质扩散和热传导过程物理过程已经在信息过滤领域发挥了重要作用:基于物质扩散过程的推荐算法可以提供很高的准确度,但在推荐列表多样性方面表现一般。而基于热传导过程的算法具有很高的推荐多样性,然而,准确性却表现不佳。我们认为,热传导算法之所以表现不佳,其原因在于给非流行的产品过多的权重。因此应该适当地给予度信息不太小的产品一些推荐权重,也提出了相应的基于偏向热传导的推荐算法。尽管操作简单,但是算法的准确度却可以和混合算法 达到相当的准确度,而推荐列表多样性比混合算法的结果还要好。 进一步对推荐列表中的产品进行分析发现,算法之所以表现好是以为既能将流行产品放到推荐列表的顶端,也能适当地将冷门产品放在推荐列表的顶端。这与Facebook中用户的兴趣可以分为两大类(大众都喜欢的流行产品和自己独特喜好的冷门产品)的结果相吻合。 Information filtering via biased heat conduction Heat conduction process hasrecently found its application in personalized recommendation , which is of highdiversity but low accuracy. By decreasing the temperatures ofsmall-degree objects, we present an improved algorithm, calledbiased heat conduction (BHC), which could simultaneously enhance theaccuracy and diversity. Extensive experimental analyses demonstratethat the accuracy on MovieLens, Netflix and Delicious datasets couldbe improved by 43.5%, 55.4% and 19.2% compared with the standardheat conduction algorithm, and the diversity is also increased orapproximately unchanged. Further statistical analyses suggest thatthe present algorithm could simultaneously identify users'mainstream and special tastes, resulting in better performance thanthe standard heat conduction algorithm. This work provides acreditable way for highly efficient information filtering. PhysRevE.84.037101.pdf
Information filtering via preferential diffusion Linyuan L ü and Weiping Liu Phys. Rev. E 83, 066119 (2011) 全文链接: http://pre.aps.org/abstract/PRE/v83/i6/e066119 全文下载: Information Filtering via Preferential Diffusion.pdf Recommender systems have shown great potential in addressing the information overload problem, namely helping users in finding interesting and relevant objects within a huge information space. Some physical dynamics, including the heat conduction process and mass or energy diffusion on networks, have recently found applications in personalized recommendation. Most of the previous studies focus overwhelmingly on recommendation accuracy as the only important factor, while overlooking the significance of diversity and novelty that indeed provide the vitality of the system. In this paper, we propose a recommendation algorithm based on the preferential diffusion process on a user-object bipartite network. Numerical analyses on two benchmark data sets, MovieLens and Netflix , indicate that our method outperforms the state-of-the-art methods. Specifically, it can not only provide more accurate recommendations, but also generate more diverse and novel recommendations by accurately recommending unpopular objects. 一个好的推荐算法不仅要有高的精确度(即推荐的东西用户喜欢)也要有一定的多样性。这里的多样性有两个方面: 1) 针对一个用户而言的多样性:推荐算法能够找到用户喜欢的冷门 item 的能力。比如我喜欢动画片,如果推荐系统给我推荐了《功夫熊猫 2 》我肯定喜欢(高精确度),但是我并不满意这次推荐,因为对于这种热片我早已在电影院看过了。相比较如果能给我推荐一部我不知道的动画片,又符合我的口味,那么这次推荐就是相当成功的。我们用 Intrasimilarity 刻画这种多样性。一个用户的推荐列表中推荐产品的相似性越低表示推荐多样性越高。 PD 算法在此方面具有优势。 一个好的推荐算法能够开拓用户的视野,就像一个凹透镜可将用户的兴趣发散出去,当然这种发散也最好是在不影响精度的前提下进行。 2) 用户间的推荐多样性:针对不同用户的推荐尽可能的不同。这个指标用两个推荐列表的 Hamming 距离衡量,即在长度为 L 的两个推荐列表中有多少是不同的 item 。显然此值越大表示越多样。 给定推荐列表长度 L ,针对一种推荐算法统计推荐的结果中不同的 item 数目,以及每个 item 被推荐的次数 Q ,按照 Q 从大到小排序得到下图。其中 NBI 为最基本的物质扩散算法 , HPH 为物质扩散和热传导的混合算法 。可以看出,相比较 NBI 和 HPH , PD 能够推荐更多不同的 item 给用户。例如在 MovieLens 数据集上,当 L=50 时, NBI 只能推荐 293 个 item , HPH 可以推荐 787 个,而 PD 可以推荐上千种产品。在 Netflix 上, PD 可以推荐 5000 以上的产品。由于 Neflix 一共才 5586 个 item ,这意味着几乎所有的 item 都有机会被推荐。由此可见, PD 能够产生更加多样性的推荐结果。 推荐系统的大部分研究过分强调了推荐的精确性而忽略了多样性问题。然而精确的推荐不一定是用户满意的推荐。用户更喜欢新奇的体验,从而在很大程度上提高系统的粘性。虽然已经有一些指标刻画推荐的满意度,如 half-life utility ,但是这些指标是否能够反应真实系统中用户的体验感呢?如何设计以用户体验为中心的推荐系统仍然是一个长期具有挑战的的问题。