集群规模越大,关联长度越长 拓扑结构的网络 一个用户链接到一个对象上,强化了用户i与对象l之间的相似性,进而增强了与所有和对象

来源: 2010-12-13 05:12:44 [博客] [旧帖] [给我悄悄话] 本文已被阅读:

推荐系统影响下的评价网络

本质是势场连势场,势半径几何指数扩大


随着网络信息冗余度的增加,在无数的网络信息中找到自己需要的,或者说,碰到自己需要的不是一件容易的事情.我知道我有很多东西我能找到,因为有谷歌和百度;也知道我们有很多东西我们找不到,因为有GFW;我知道有多少东西我不知道,但是不怕,我有推荐系统;可是我不知道我有多少东西不知道,因为我还没有找到一个好用的推荐系统.比如说,推荐系统的可靠性(精度),多样性(个性化)[1],还有一个可能忽略的,这个该死的推荐系统在给我找到好东西的时候,永久地毁掉了多少更好的东西?这个问题或许可以这样描述,长期使用推荐系统,会不会对我们周围的评价网络生长造成坏的影响?

目前流行的推荐系统[2]可以大体划分为基于文本挖掘技术,和基于模型的技术.在基于模型里面,比较成熟的有神经网络学习方法,协同过滤方法和由此派生的一系列算法.前者通过模型自动学习,好设计不好理解,而后者要自行设计过滤规则,好理解却不好设计(按照某大神的说法,高中数学足够了).

由最简单的,只有拓扑结构的网络推荐算法[3]来讨论前面提出的问题.算法的核心是找到网络中各个节点的相似性,再按照对相似性加权计算推荐的可能性.一个用户链接到一个对象上,强化了用户i与对象l之间的相似性,进而增强了与所有和对象l相似的用户j的相似性.如果可以用一个多维的连续空间描述这个过程,应该可以看到用户与用户之间的距离变化:选择了一个与周围用户相似的对象,则趋向与周围用户结合更紧密;反之,则意味着用户品味的变化而离开这个群体.在没有推荐系统的情况下,用户自发的选择对象,最终能移动到一个适合自己的位置;或者说没有稳定的位置而是在自由的晃荡.但是,在推荐算法作用下,不是这样了.

基于模型的算法的核心是,由历史数据估计用户的喜好.而初始数据的收集是一件困难的事情,(冷启动问题).在常规的推荐算法下,历史数据推断出来的用户的喜好只会是原来的喜好;原来只是喜欢吃鱼的同学会发现他们周围聚集了越来越多的吃鱼的同学,因为他们接受系统的推荐吃鱼之后相似性加强了.其实,有不少人内心还是觉得吃肉也不错的...

当然,这个问题也不是不可以解决.比如,对历史数据按照时间加权(免得小时候玩泥巴的喜好影响我找到一个小时候也爱玩泥巴的女朋友);引入排斥过程(吃腻了就吐了再也不来了)等.可是如果芙蓉出钱让你吐啊吐啊还是满屏的芙蓉呢?甚至,如果周围的人吐啊吐啊就觉得芙蓉其实也是一个不错的话题,我们就完了.因为这时,周围的评价网络已经变质了.

所以说,潜藏在算法后面的,还有设计者的良知.


一篇很有意思的集群方面的文章

这期PNAS上,我最崇拜的 G.Parisi他们发的(我有他老人家的签名!嘿嘿),集群中的无标度关联。

Scale-free correlations in starling flocks Cavagna, A; Cimarelli, A; Giardina, I; et al.

PROCEEDINGS OF THE NATIONAL ACADEMY OF SCIENCES OF THE UNITED STATES OF AMERICA 107 (26): 11865-11870 JUN 29 2010

http://www.pnas.org/content/107/26/11865

文章旗帜鲜明的指出集群有序形成的两种路线斗争,分别是由上至下的领导者带领下的个人崇拜的修正路线,以及由下至上的丰富多彩的体现自组织临界性的群众路线。由于广大群众对路线斗争的不敏感,一般都忽略了这两面旗帜斗争的重要性。伟大的统计物理学家Parisi语重心长的告知我们,无标度是广泛存在于复杂的系统斗争中的,革命小将欧掠鸟们向我们展示了无标度的伟大力量。

言归正传。。。

文章利用相对速度的空间关联性定义了三维空间中欧掠鸟观测数据的关联长度。发现,关联长度与集群的规模成幂律关系。
利用人造数据模拟表明,关联长度大约是集群规模的4倍。改变不同的噪声强度发现,欧掠鸟群集处于临界状态。
本文引用地址:http://www.sciencenet.cn/blog/user_content.aspx?id=347991
* 本文仅代表博主个人观点,与科学网无关。
本文关键词: 复杂系统 集群动力学
相关文章: [转载]重点项目刊物分类总目录
[转载]中科院理论物理研究所召集的统计物理与复杂系统研讨会
社会经济复杂系统研究的新方法论:市场与政府关系的三角结构模型
复杂系统行为预测的“机理+辨识”策略
语言动力系统简介
“网络科学专刊”《复杂系统与复杂性科学》第2-3期合刊最新总序
[转载]复杂系统的统计物理与数学国际会议 Oct 23-27,2010 武汉
空间网络综述 此文拟送《复杂系统与复杂性科学》网络科学专刊发
[转载]复杂系统与网络国际研讨会(报告专辑)
献给祖国:《发酵原理》第2版(内容简介)




当前推荐数:0

[3] 标题:
发表评论人:lidercoocer [2010-8-5 11:00:59]
你终于在科学网开博啦

[2] 标题:
发表评论人:[游客]hpzhou2885 [2010-7-30 10:43:59] ip:58.42.243.*
关联长度越大,集群规模越小吗? 如何解释
博主回复:不是吧?应该是反过来看,集群规模越大,关联长度越长。^_^