《基于社交网络的信息传播模型分析-黄宏程.pdf》由会员分享,可在线阅读,更多相关《基于社交网络的信息传播模型分析-黄宏程.pdf(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、第33卷第9期2016年9月计算机应用研究Application Research of ComputersV0133 No9Sep2016基于社交网络的信息传播模型分析黄宏程,蒋艾玲,胡敏(重庆邮电大学通信与信息工程学院,重庆400065)摘要:随着社交网络的蓬勃发展,网络舆论的控制变得越来越重要。信息传播模型能够揭示信息传播的规律,从而达到对传播过程进行预测的目的,因此社交网络信息传播模型的研究具有重要意义。针对经典传染病模型的不足进行了分析,结合社交网络的网络拓扑特点,考虑了网络中用户的不同感染状态,引入感染用户的衰减函数,提出了适合社交网络的信息传播模型。在真实email网络中进行模型
2、仿真,对比分析了不同模型的结果,研究了模型中各个影响因子对传播过程的影响。结果表明,不同的模型参数反映了传播趋势的差异,模型反映出的传播规律更符合信息在现实网络中的传播过程。关键词:社交网络;信息传播;传染病模型中图分类号:TP39307 文献标志码:A 文章编号:10013695(2016)09273805doi:103969jissn10013695201609040Analysis of information diffusion model on social network,Huang Hongeheng,Jiang Ailing,Hu Min(School of Communica
3、tionInformation Engineering,Chongqing University of PostsTelecommunications,Chongqing 400065,China)Abstract:With the development of sucial network,keeping control of the opinion in the network becomes more and more importantThe information diffusion model can show the laws of information spreadingth
4、us it can achieve the aim of forecastingthe propagation processso the research on the information diffusion model for the social network is extremely significantThispaper analysed the shortness of classic infeetious model and the characteristics of social networks topologytook into accountthe differ
5、ent infection status of the users and introduced a decay funcfion about infected usersfinallyit proposed an idonna-tion dissemination model for social networkThe model was simulated on the real e-mail data and compared witll other modelsit also investigated the effect of influencing factors on propa
6、gation processThe simulation results show that different parametersreflect the different spreading trends,the propagation model is more exactly close to the laws of information spreading in the realsocial networksKey words:social network:information diffusion;SIR model0 引言互联网的普及和高速发展给人们带来了新的获取信息的方式和
7、途径,网络带来的便利也让人们越来越依赖网络。哈佛大学的心理学教授Milgram在1967年创立了六度分割理论。1l,为社交网络的出现奠定了基础。社交网络通过聊天工具、博客和社区共享等途径扩大社交圈,最终形成一个庞大的网络社交圈。社交网络关系结构可以是现实世界中朋友、同事、亲属等双向关系。,也可以是拥有某类兴趣用户的单向关注结构。国外的社交网络如Facebook是全世界最大的社交网站,截止到2014年7月,其用户数量已经超过22亿1。国内的社交网络的发展也愈发迅速,如常见的新浪微博、腾讯微博等。社交网络作为复杂网络的一种,将网络用户定义为节点,利用用户之间的连边关系进行信息的传播,其网络拓扑具有
8、明显的小世界特性和无标度特性,因此信息在网络中传播阈值几乎为零5 J。另外,由于社交网络中的信息多种多样,大部分情况用户不为自己的言论负责,这也导致部分敏感信息在社交网络上的传播舆论导向以及扩散面积、速度等均难以控制。信息传播模型能够对信息传播的过程和趋势进行描述,从而达到对社交网络中的突发信息扩散过程进行预测的目的,能够为政府控制舆论、发布价值信息等工作提供参考。由此可以看出,社交网络中的信息传播模型具有极其重要的研究意义。在目前的社交网络信息传播模型的研究中,通常通过设计合理的传播机制并建立信息传播模型,但建模的方式和侧重点却各有不同。由于医学中的传染病发展变化模式与现实中信息传播极其相似
9、,所以在早期信息传播模型主要沿用传统的传染病模型,包括SI(susceptible infective)、SIS(susceptible infective susceptible)、SIR(susceptible infective removal)模型坤。在后续的模型研究进程中,很多研究者将这些传统模型进行了改进,以此来更好地揭示信息在社交网络中的传播规律,而SIR模型是信息传播模型研究中应用最广泛的一种。2011年,Woo等人o 7J在SIR模型的基础上提出了网页论坛的话题传播模型,以此来评估一个话题的最大参与人数以及对整个论坛的传染力度;而后一年,该小组就此研究点继续提出了eventd
10、rivenSIR模型【8 J,通过评估论坛中帖子的影响力来分析事件的影响收稿13期:20150622;修回13期:20150805 基金项目:国家自然科学基金资助项目(61371097);重庆市科委基础和前沿研究项目(cstc2014jcyjA40039);重庆市教委科学技术研究项目(KJl400402)作者简介:黄宏程(1979),男,河南南阳人,副教授,博士研究生,主要研究方向为信息处理、复杂网络(huanghccqupteducn);蒋艾玲(1991一),女硕士研究生,主要研究方向为社交网络;胡敏(1971一),女,副教授,硕士,主要研究方向为复杂网络万方数据第9期 黄宏程,等:基于社交
11、网络的信息传播模型分析 2739力度,并与SIR模型进行对比,结果表明文献提出的模型比起SIR模型更符合论坛中事件的热门程度。Gong等人一1分析了无标度网络中的传染扩散机制,考虑了网络中节点的个人警觉性对感染概率的影响提出了新的无标度网络传染模型。在2012年,Wang等人叫考虑了社会加强因素对传播的影响,在SIR模型的基础上提出了在线社交网络中的谣言传播模型CSR(eredulOUS spreader rationals)。在2013年王辉等人o改进了CSR模型的传播规则和传播动力学方程,考虑个人接受阈值对接受概率的影响,提出基于移动社交网络的谣言传播模型。张彦超等人引结合复杂网络和传染病
12、动力学理论,构造了一个基于社交网络的信息传播模型,并对模型进行数值仿真。BorgeHohhoefer等人1引将社交网络中用户的活跃度和对信息的感知度加入到信息传播模型中,使模型更符合现实的社交网络信息传播过程。Garg等人4 o结合sI传染病模型对社交网络的传播行为和过程进行了分析。通过对现存模型的分析可知,社交网络中的信息传播模型存在很多问题:a)在传播过程中,参与传播的用户对信息的态度千差万别,而现存模型往往忽略了这一差异性;b)均匀网络的传播规则与计算方式运用于社交网络是不合理的,必然与现实传播过程存在较大差异,一些研究者结合复杂网络知识进行了相关研究,但大多考虑了全局性传播机理,没有考
13、虑网络中个体用户的局部传播与全局的差异性;e)沿用传统传染模型中对感染者的接触式转换,没有考虑信息的生命周期,不符合社交网络信息传播的现实情况。本文针对上述问题,基于复杂网络理论,建立传播动力学微分方程组,考虑了模型中参数的影响并在真实的网络中进行模型仿真,使建立的模型更好地描述信息在社交网络中的传播过程,为社交网络中的舆论控制研究奠定基础。1 基于社交网络的信息传播模型通过以上分析可知,经典的传染病模型并不适用于描述社交网络中的信息传播过程,本文提出的基于社交网络的信息传播模型描述如下。11 网络用户状态分类将社交网络中每个用户定义为一个节点,用户之间的关注关系定义为边,从而将社交网络结构转
14、换成一个具体的可知的网络拓扑。当信息从某个或者某几个节点开始向整个网络传播时,由于网络中用户所拥有的知识、兴趣的不同,导致对同一信息存在不同的心理状态,从而产生与第一时刻发布信息的用户即初始传播用户相同或不同的言论,使信息传播的走向出现不同的情况,所以本文将网络中的用户可能存在的状态进行分类:a)S状态易感染用户,指可能接收到信息但还未接收信息的用户;b),。状态感染用户,指与初始传播用户具有相同观点的用户,参与信息的传播;c)L状态感染用户,指与初始传播用户具有不同观点的用户,参与信息的传播;d)R状态免疫用户,指已经接收到信息但对信息不感兴趣,选择忽略或者参与过但已经不再参与信息传播的用户
15、。12传播机理在社交网络中,用户的状态随着信息传播的过程发生转变,从而对整个传播过程产生影响。由于社交网络的拓扑结构在短时间内容易发生小范围局部变化,所以本文的传播模型假设:在信息发布和传播过程中,网络的拓扑结构不发生变化,即网络中用户数及关系是固定的。基于上述假设,结合网络中用户的不同状态,用户状态转换机理即信息传播机理如图1所示。根据图1中的网络用户状态转换机理,联系经典SIR传播的微分方程推导原理,本文模型用微分方程可以表示为掣=Al(邮(c)_d(睨(f)柏(f)+岛(1)拍)Taid(t)砌删刊屯()一州舢川(1),v掣=咄s(f)_A2(f)sm,s(f)、,掣=d()EIo(小)
16、ms(I)其中:代表网络中总用户数;S代表S状态易感染用户数;,n代表L状态感染用户数;厶代表L状态感染用户数;R代表尺状态免疫用户数;A。、A:、卢。、卢:代表易感染用户的被感染概率渺。代表易感染用户忽略信息的概率;d代表感染用户由于信息的生命周期限制而逐渐衰减的衰减函数。基于模型的图形及数学表达,模型的具体传播机理如下:a)当一个s状态用户浏览到邻居L状态用户发布的消息时,S状态用户以A的概率发生状态转换。当A,的值大于感染阈值8时,转换为L类感染用户。b)当一个s状态用户浏览到邻居L状态用户发布的消息时,s状态用户以A:的概率发生状态转换。当A:的值大于感染阈值占时,转换为厶状态用户。c
17、)当用户A同时浏览到L、,d状态两种感染用户发布的消息时,比较A。、A:的大小。当A。A:,用户A转换为L状态;当A,1)。如前文传播机理所述,当每种感染概率的值满足相应的条件时,用户状态发生改变。122信息忽略概率由于网络中用户的兴趣和知识背景等差异,对信息的感知能力和态度都不同。对于社交网络,用户对信息的忽略可有很多方面的原因,可能是用户不在线没有浏览到信息,或者用户对信息不感兴趣不参与转发传播,也可能由于用户活跃度不高不经常参与转发信息等。在本文模型中,在用户社会性方面不作重点研究,因此通过设置一个信息忽略阈值来判断用户是否参与信息的传播,从而揭示用户对待信息的态度影响整个信息传播过程的
18、变化规律。当信息忽略概率值大于阈值时,用户A从易感染状态转换为免疫状态,不参与信息的传播。123感染状态用户衰减函数在经典的SIR传播模型中,感染用户接触免疫用户,则以一定概率转换为免疫状态,停止信息的传播行为。现有的一些传播模型沿用了这一机制。在社交网络中,免疫用户指不参加信息的转发传播的用户,即此类用户对整个传播过程已经不产生影响。因此,结合社交网络的现实情况,免疫状态用户并不能够使感染状态用户转换为免疫用户,说明传统模型的这种机制并不适合社交网络。研究发现,信息存在一定的生命周期,信息在网络中的传播通常经历萌发、爆发、消亡的过程。造成某条信息在网络中消亡的原因有很多,可能是因为用户对信息
19、的新鲜感消失,也有可能是由于其他信息对前一条信息的传播覆盖。Zhao等人ois引入了谣言传播者遗忘机制来代替传统模型的接触转换机制;另外文献16中考虑了信息的传播延迟,并运用Parato分布函数来作为传播者的退化函数。Parato分布函数源自意大利的瑞士经济学教授Vil能doParet,冈0被提出时很多经济学家采用它对各种收入数据进行拟合研究分析;在后续的研究中,Pareto分布族的应用已经推广到社会科学、经济科学、环境科学等诸多领域并发挥了重要的作用。本文的信息传播模型中引入广义Pareto分布族中的Parato(I)分布函数作为感染用户衰减函数。d(n)=l一万1 (8)其中:a代表感染用
20、户衰减的速度(a0),a越大,衰减越快。在本文模型中,从用户第一次接收到信息并转换为感染状态开始,随着传播层级n的增大,d(n)逐渐增大,当d(凡)大于转换概率r(用户状态的变化分为转换或者保持原状两种情况,因此转换的概率为。O5,从而本文中r取05)时,感染用户转变为免疫状态。2数值模拟及结果分析21模型仿真在一个真实的email网络中进行模型的仿真验证。在初始状态设置中,网络中只存在两个感染状态用户,即L和厶,其余节点全部为易感染用户。运用社会网络分析软件gephi画出网络拓扑图以及初始感染用户在用户中的位置如图3所示。图3中,红色点表示初始,。状态用户,绿色点表示初始L状态用户(见电子版
21、)。该网络的基本特征数据如下:节点总数量为1 133,总边数为5 451,平均度为9622,最大度为71,平均聚类系数为0254,平均路径长度为3606,网络直径为8。根据上述网络特征数据可以看出,该网络符合小世界网络的特征。网络中度k以及相应节点数(数据已进行归一化处理)的部分数据如表1所示。表1 节点度及相应归一化节点数k 11 12 13 14 15n() 0037 0 0039 7 0031 7 0022 0 0017 6k 16 17 18 19 20 n(E)0018 5 0013 2 0014 1 0010 5 0010 5 通过对度k与其相应的节点数进行分析可以发现,两者满足n
22、()一k。 (9)其中:k为节点度数;凡(k)是网络中度为k的节点数;r是取值135137间的固定参数。由此可知,此网络的度分布具有幂律分布的特点。万方数据第9期 黄宏程,等:基于社交网络的信息传播模型分析 2741在目前关于信息传播模型的研究中,并没有考虑到感染用户的不同言论倾向,如SIR传播模型、文献1113,16中提出的模型。以文献16为例,文章沿用了SIR模型中将用户分为未知者、传播者和免疫者三类的思想,考虑了用户的免疫力变化以及外部社会加强对传播的影响等因素,构建了基于在线社交网络的消息传播模型(D-SIR)。在本文模型的数值仿真中,通过设置初始感染用户,研究网络中各类状态用户的数量
23、随着传播层级数的变化情况。本文、SIR以及DSIR模型的仿真结果如图46所示。从图4可以看出,易感染状态用户数量初期呈现出较快的下降趋势,在一定阶段后趋于一个定值;两种感染状态用户数量在初始阶段快速增长,当达到最大值后逐渐衰减,呈现固定的生命周期,最后趋向于零;免疫用户数量则是保持增加的趋势。从图46的对比可以看出,本文模型由于定义了不同状态的感染用户,所以在仿真结果中存在两类感染用户的数量曲线,比起另外两个模型更能体现出网络中信息传播趋势的多样性。另外,在实际社交网络的信息传播过程中,信息的发布初期传播速度并不会极其迅速,而在爆发时网络中的易感染用户会很快收到信息并发生状态转变,因此易感染用
24、户的曲线变化应该是先平缓而后突然下降,形成一个陡峭下滑的趋势,本文模型中易感染(s类)用户的减少趋势正是符合这一点。但在SIR模型中,曲线的变化一直平缓减少,并没有出现骤减的情况。三种模型感染状态用户峰值对比如图7所示。从图7可以看出,传播过程中感染用户(I类)的峰值本文模型较SIR、DSIR模型更高,说明信息在网络中的覆盖面越广。特此说明,由于本文模型将感染用户分为两类,所以感染用户总数量为两类感染用户数量相加。20000080060(】4002000图3网络拓扑及 图4本文模型各类初始感染用广|位置 状态用户的数量变化一l。一I。一S一尺7:请r?:垃i 佟oI!:嘶戡幽5 SIR模型各类
25、状态 幽6 DSIR模型各类状态用户的数量变化 用户的数量变化22不同影响因子对比分析221 初始感染用户不同的情况s、R状态用户数量随传播层级数变化如图8、9所示。当仿真设置不同的初始感染用户时,从图8、9可以看出,当初始感染用户的度较大时,信息在整个网络中的传播速度较快,网络中易感染用户接收到消息以及被感染的速度也就越快,因此易感染用户的数量下降速度越快,免疫用户的增加速度也越快。L、L状态用户数量随传播层级数变化如图10、11所示。对于感染状态用户,如图10、11所示,两种感染用户的数量增加速度和初始感染用户的度数成正比关系,当感染用户生命周期结束时转变为免疫用户。在社交网络中,一些度数
26、较高的用户在一定程度上加快了信息在网络中的传播速度,但是一旦它们成为免疫用户,同样对信息传播速度有很大影响。信息在社交网络中的传播与现实社会网络类似,一些中心重要节点往往具有较大的社会影响力,知名人士发布的信息、观点更能得到大众的认可,从而引导舆论方向,造成较大的社会影响,本文模型的仿真结果较好地体现了这一特性。1ISIR模型DSIR模型本文模型图7 三种模型感染状态用户峰值对比图2 3 4 5 6 7 8 910 ll 12传播层级数訇8 S状态用户数量随传播层级数变化图图9 R状态爿j户数量 图10厶状态用户数量随传播层级数变化图 随传播层级数变化图222信,息忽略阈值不同的情况信息忽略概
27、率反映了网络中的用户对信息的感知和用户活跃度,此概率越大,代表用户活跃度较低或对信息不感兴趣选择不参与转发评论的概率越大。在本文模型中,通过随机生成一个信息忽略概率来反映用户的上线概率和信息感知度,并设置相应的信息忽略阈值。R状态用户数量随传播层级数变化如图12所示。从图12可以看出,信息忽略阈值越大,用户忽略信息的概率越小,转换为免疫用户的概率越小,从而免疫节点的增加速度越慢。图13反映的是信息传播结束后,随着信息忽略阈值的不同,网络中易感染用户中未被感染过的数量变化。从图13中可以看出,信息忽略阈值越大,信息越不容易被忽略,用户被感染的概率越大,在整个传播过程中被感染过的节点越多,因此网络
28、中最终未被感染过的用户越少。l!;J 5 6 7 x u I】fl l二1i 、h HJ Ilj I二I悔藉壕蔽奴 博捕层城奴图11厶状态用户数量 图12 R状态用户数量随传播层级数变化 随传播层级数变化223感染用户衰减速度不同的情况信息在网络中的传播通常具有一定的生命周期,而信息的传播与感染用户的数量有着密切联系,因此本文模型引入感染用户衰减函数来表征信息传播的衰退直至消亡。L、L状态用户数量随传播层级数变化如图14、15所示。从图14和15可以看出,衰减速度越大,网络中感染用户的存活时间越短,即信息的生命周期也越短,用户从感染状态转换为免疫状态的速度越快。研究衰减速度与传播层级数的关系,
29、衰减速度越大,感染用户停止信息传播的速度越快,信息传播结束越早,从而传播的层级数也越少,图16则是呈现这一特性。裟揣裟|i墨星。万方数据2742 计算机应用研究 第33卷;1雾k。翥300。20l 、 100秀避薹蓁l 3 5 7 9 11 13 15 17 19 2传播层级数图15,d状态用户数量随传播层级数变化3结束语传播层级数图14厶状态用户数量随传播层级数变化403530r搬2m15。105,0 -一。+*r一一-一睡巷鬈爨蝼乡0瑶瑶瑶,冬多感染用户衰减速率图16传播层级数随感染用户衰减速率变化本文结合信息在社交网络中的传播特征,提出了一种基于社交网络的信息传播模型,并对该模型进行分析
30、。本文通过定义模型的传播规则,结合无标度网络理论,建立传播动力学微分方程组,并且考虑了模型中各个重要参数的影响,使建立的模型更符合社交网络的特点。最后通过在真实的网络中进行模型仿真并与不同模型进行对比,分析了模型中不同参数对整个传播过程的影响。仿真结果表明,初始感染用户的度数越大,信息在网络中传播速度越快;信息忽略阈值越大,信息被忽略的概率越小,网络中被感染的用户越多;感染用户衰减速度越快,信息生命周期越短,传播结束越早。本文所建立的模型更加符合信息在真实社交网络中的传播趋势和过程,为网络信息传播的进一步研究打下了基础。由于本文的传播模型是基于网络拓扑固定不变的情况,而在社交网络中,网络拓扑可
31、能在信息传播过程中发生局部变化,所以下一阶段将是在网络变化的情况下进一步研究自适应网络拓扑变化的信息传播模型。参考文献:1孙茜Web 20的含义、特征与应用研究J现代情报2006,26(2):69-702王莉,程苏琦,沈华伟,等在线社会网络共演化的结构推断与预测J计算机研究与发展,2013,50(12):249225033腾讯科技Facebook用户总数达到22亿人占全球总人口13EBOL(201407-25)20150601http:techqqcorna20140725000288htm4许丹,李翔,汪小帆复杂网络理论在互联网病毒传播研究中的应用J复杂系统与复杂性科学,2004,1(3):
32、10265Newman M E JThe structure and function of complex networksJSIAM Review,2003,45(2):1672566张发,李璐,宣慧玉传染病传播模型综述J系统工程理论与实践,2011,31(9):1736-17447Woo J,Son J,Chen HAn SIR model for violent topic diffusion in social mediaCProc of IEEE Interuational Conference on Intelligenee and Security Informatics201
33、 l:15-198Woo J,Chen HAn eventdriyen SIR model for topic diffusion in WebforumsCProc of IEEE International Conference on Intelligenceand Security lnformatics2012:1081139Gong Yongwang,Song Yurong,Jiang GuopingEpidemic spreading inserefree networks including the effect of individual vigilanceJChinese P
34、hysics B,2012,21(1):414510Wang Hui,Dang Lin,Xie Fei,et a1A new rumor pmpagation modelon SNS structureCIProe of IEEE International Conference onGranular Computing2012:49950311王辉,韩江洪,邓林,等基于移动社交网络的谣言传播动力学研究J物理学报,2013,62(11):9810912张彦超,刘云,张海峰,等基于在线社交网络的信息传播模型J物理学报,2011,60(5):606613BorgeHolthoefer J,Melo
35、ni S,Goncalves B,et a1Emergence ofinfluential spreaders in modified 17diuor modelsJJoumal of Statis-tical Physics,2013,151(12):383-39314Garg S,Kumar SModeling and analyzing information diffusion beha-viour of social networksC 1Proc of Interuational Conference on IssuesChallenges in Intelligent Compu
36、ting Techniques2014:566-57215Zhao蜥nn,Xie Wanlin,Gao H 0,et a1A rumor spreading modelwith variableforgetting rateJPhysicaA:StatisticalMechanics&its Applications,2013,392(23):6146615416蒙在桥,傅秀芬基于社交网络的动态消息传播模型J计算机应用,2014,34(7):19601963(上接第2734页)6Nazir B,Hasbullah HDynamic sleep scheduling for minimizing
37、 delayin wireless sensor networkCPrec of Saudi International Electro-nicsCommunications and Photonics Conference201 1:157Ye Wei,Heidemann J,Estrin DAn energy-efficient MAC protocol forwireless sensor networksCProc of the 21 st Annual Joint Conference of the IEEE Computer and Communications Societies
38、2002:156715768Armstrong TWake-up based power management in multi-hop wirelessnetworksDS1:University ofToronto,2005:2389Deng Jing,Han Y S,Heinzelman W B,et a1Scheduling sleepingnodes in high density clusterbased sensor networksJMobile Networks and Applications,2005,10(6):825-83510Zheng Tao,Radhakfish
39、nan S,Sarangan VPMACfan adaptive energyefficient MAC protocol for wireless sensor networksCProc of the19th IEEE International Parallel and Distributed Processing Symposium2005:811Yang S H,Tseng H W,Wu E H K,et a1Utilization based duty cycletuning MAC protocol for wireless sensor networksCProc of IEE
40、EGlobal Telecommunications Conference2005:326212Saravanakumar R,Susila S G,Raja JAn energy efficient cluster basednode scheduling protocol for wireless sensor networksCProc ofthe 10th IEEE Intemational Conference on SolidState and IntegratedCircuit Technology2010:2053205713Sasikala V,Nadu C TCluster
41、 based sleep wakeup scheduhng tech-nique for WSNJIntemational Joumal of Computer Applica-tions,2013,72(8):15-2214Shah G,Akan O BCognitive adaptive medium access control in cognitive radio sensor networksJIEEE Trans on Vehicular Techno-Iogy,2015,64(2):75776715Heinzelman W B,Chandrakasan A P,Balakrishnan HAn applicationspecific protocol architecture for wireless microsensor networksJIEEE Trans on Wireless Communications,2002,1(4):660-670万方数据