《基于人工免疫的p2p文件共享防污染系统21933.docx》由会员分享,可在线阅读,更多相关《基于人工免疫的p2p文件共享防污染系统21933.docx(16页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、基于人工免疫的P2P文件共享防污染系统摘 要:文件污染是当前P2P文件共享系统普遍存在的问题,极大的降低了系统的可用性。P2P文件共享系统和生物免疫系统一样,都是高度分布、自适应和自组织的。利用向量空间相似度赋予投票权重,采用自适应的信誉阈值判断文件可信性,建立了基于人工免疫的防污染对象信誉机制来进行邻居节点集的选取,以改进系统可用性。仿真实验表明,系统具有很高的识别精确度,能够以低通讯代价很好的抑制污染文件在网络中的传播。关键词:污染;人工免疫系统;可用性;文件共享;P2P引 言目前,P22P文件件共享已已经成为为Intternnet上上的主要要应用之之一,对对Intternnet的的使用和
2、和流量产产生了巨巨大的影响。PP2P网网络具有有很多优优良特性性,但是是它的分分布性、开开放性和和自治性性使它不不可避免免的遭遇安全全问题的挑挑战,比比如P22P文件件共享系系统中的的文件污污染问题题。所谓文件污污染问题题,是指指在P2PP文件共共享系统统中,恶恶意用户户发布与与所标示示主题不不相符合合的文件件内容,并通过P2P文件共享进行传播。文件污染问题给P2P文件共享系统造成了很大的危害:首先,如果用户频繁遭遇污染文件,其感受到的可用性会急剧降低,甚至最终放弃使用该系统;而且,它为病毒、蠕虫等恶意程序的传播提供了便利,造成了网络安全上的隐患。对P2P网网络的实实际测量量数据表表明,现现实
3、存在在的文件件污染现现象十分分普遍,尤尤其是对对于最近近流行的的内容。在在FasstTrrackk/KaaZaAA、eDDonkkey、OOverrnett等P22P系统统中,有有半数流流行内容容的拷贝贝是被污污染的或或是伪造造的1122。作为一个高高度进化化的复杂杂系统,生生物免疫疫系统能能够区分分外部有有害物质质和自身身组织,从从而清除除病原并并保持有有机体的的稳定。从从计算的的角度来来看,生生物免疫疫系统具具有高度度分布、自自适应和和自组织织的特性,具备很强的的学习、识识别、记记忆和特特征提取取能力。受受到生物免免疫系统统的启发,人人们提出出了人工工免疫系系统(Arttifiiciaal
4、 IImmuune Sysstemm, AAIS)的概念念3。由于它提提供了一一种强大大的信息息处理和和问题求求解范式式,近年年来,基基于免疫疫系统原原理的各各种模型型和算法法已经被被广泛的应用在在信息安安全44、模模式识别别5、数据据挖掘6、智智能优化化7等研究领域域中。与生物免疫疫系统一一样,P22P文件件共享系系统也具具有高度度分布、自自适应和和自组织织等特性性。在PP2P文文件共享享系统中中,通过过建立基于于人工免免疫原理理的对象象信誉机机制,使使用人工工免疫方方法进行行邻居节点点的选择择过程,对候选选的节点点使用人人工免疫疫算法进进行筛选选,选取取出和本本节点具具有较高投票相似似度的
5、邻邻居节点点,可以以减少恶恶意节点点传播污污染文件件的可能能性,避避免恶意意节点的的共谋攻攻击,从从而提高高文件共共享系统统的可用用性。本文以下部部分的结结构为:第一部分介绍绍相关研研究工作作,第二部分描述述对象信信誉机制制,第三部分提出出基于人人工免疫疫原理的的邻居选选择算法法,第四部分进行行仿真实实验分析析,最后总总结本文文并展望望下一步步工作。1. 相关研究工工作抑制文件污污染的方方法有很很多8,比如如基于原原始文件件的方法法、基于于专家意意见的方方法、基基于简单单投票的的方法、基基于信任任关系的的方法等等。在基于简单单投票方方法的基基础上,通通过对历历史行为为的分析析,某些些专家节节点
6、被认认为比其其它节点点更为可可信,于于是它们们的投票票就被赋赋予较大大的权重重,使用用一个信信誉系统统来保存存、更新新和传播播这些权权重,然然后结合合投票来来对文件件的可信信性进行行评估。CCreddencce系统统9采用基基于对象象信誉的的方法,节节点通过过gosssipp过程收收集其它它节点的的投票,使使用Peearsson相相关相似似系数作作为节点点投票相相似度的的衡量标标准,赋赋予其它它节点的的投票以以权重,并并对所收收集的投投票进行行二次抽抽样。由由于采用用gosssipp过程,需需要对投投票逐一一进行加加密和解解密验证证,带来来了很大大开销,而而且没有有解决ffreeeloaadi
7、nng问题题,也没没有考虑虑到邻居居节点的的选取。XRep10和X2Repp11系统都都引入了了对象信信誉,并并依据过过去的投投票行为为赋予节节点以权权重,但但是都没没有在节节点之间间共享信信誉信息息,并且且要求节节点在评评价阶段段在线进进行投票票的计算算和传播播,不适适合动态态的P22P环境境。在KaZaaA12系统中中,节点点对自己己所共享享的文件件给出评评分,表表示为四四个级别别的真实实度。但但是,系系统是根根据节点点自己对对所共享享文件的的评分来来决定文文件的信信誉值,没没有节点点之间相相互评分分的机制制,使信信誉系统统容易受受到恶意意节点的的攻击。eMulee和eDDonkkey网网
8、络通过过Juggle reaal-ttimee FaakeCChecck服务务13来抑制制文件污污染,但但是很容容易受到到暂时副副本诱骗骗的攻击击。在查询的返返回结果果中选取取下载地地址时,有有的系统统采用选选取最佳佳返回结结果的策策略,容容易受到到恶意节节点的欺欺骗攻击击。于是是,很多多系统采采用随机机选取返返回结果果的策略略来抑制制污染的的传播,能能够使可可信文件件的搜索索结果随随攻击者者数目的的增加呈呈线性下下降,但但是在污污染程度度很低的的时候,却却造成较较大的性性能损失失14。大多数推荐荐系统中中采用了了相关的的协同过过滤技术术,但是是它们依依赖于集集中式的的控制,不不合适于于具有分
9、分布特性性的P22P系统统。2. 对象信誉机机制在P2P文文件共享享网络上上,建立基基于对象象的信誉誉机制,从从而抵御御文件污污染。这里的的对象信信誉,是是指系统统中所共共享的文文件对象象的可信信程度。在网络中的的每个节节点上存存储两个个哈希表表,一个个是投票票箱(BBalllot Boxx),一一个是相相似度表表(Siimillariity Tabble)。投票票箱中的的每一项项对应着着对某个个文件的的投票集集,是一一个子哈哈希表,子子哈希表表中的每每一项则则对应着着某个节节点对该该文件的的投票。相相似度表表的每一一项对应应着本节节点与某某个节点点的投票票相似度度,相似似度值在在-11,1之
10、间,显显然,每每个节点点与自身身的相似似度为11.0。2.1 初初始化过过程每个节点开开始共享享自己的的文件时时,对自自己的每每个文件件进行投投票。由由于对文文件受污污染与否否的判断断结论是是确定性性的,不不需要采采用多等等级的评评定标准准,同时时为了能能够表达达中性的的意见,采采用最简简单的奇奇数等级级值,将将评分分分为-1,00,+11三个个等级,其其中,-1表示示用户认认为该文文件为污污染文件件,+11表示用用户认为为该文件件为可信信文件,00表示用用户没有有进行评评价。恶意节点为为了使污污染文件件能够得得到广泛泛的传播播,会将将对污染染文件的的投票值值也设为为+1。2.2投票票收集过过
11、程查询消息可可以被用用来触发发节点传传播投票票,在节节点进行行搜索的的过程中中,收到到查询的的节点除除了要完完成转发发处理的的任务,如如果它对对这个文文件有投投票,还还要返回回自己的的投票给给发起查查询的节节点,假假设底层层P2PP网络的的路由传传输是安安全可靠靠的,恶恶意节点点不能够够任意操操控网络络上传输输的消息息,所以以发起查查询的节节点能够够保证得得到的这这个投票票是真实实的。这这个节点点将收集集到的投投票加入入投票箱箱中,然然后进行行相似度度表的更更新过程程。2.3相似似度的计计算在传统的人人工免疫疫系统模模型里,抗体和抗原的亲和力,一般是采用简单的Euclidean距离、Manha
12、ttan距离或Hamming距离等字符串距离或向量距离来表示的。在这里的对对象信誉誉机制中,节点点的投票票相似度度就是匹匹配特异异性。对对投票箱箱中存在在投票的的每个文文件,统统计本节节点和待待评估节节点的投投票,计计算两者者的相似似度,并并记入相相似度表表中。相似度的计计算,一一般有相相似距离离和相似似系数两两类衡量量方法,相相比而言言,后者者更为精精确的反反映了数数据之间间的相似似程度,其其中包括括Peaarsoon相关关相似系系数、指指数相似似系数、向向量空间间相似系系数等多多种衡量量标准。这里采用以以向量夹夹角余弦弦表示的的向量空空间相似似系数作作为衡量量标准来来计算节节点投票票之间的
13、的相似度度。(1)节点投票构构成了KK维文件件对象空空间上的的向量,如如果节点点没有对对某个文文件进行行评价,则则相应分分量为00。设节节点nii和节点点nj在K维维文件对对象空间间上的投投票值分分别表示示为K维维向量和和,则节节点nii和节点点nj之间的的投票相相似度为为:其中,节点点ni和nj共同投投票的文文件集合合用Iiij表示示,节点点ni和nj投票的的文件集集合分别别用Iii和Ij表示,VVi,kk和Vj,k分别别表示节节点nii和nj对文件件k的投投票值。2.4文件件可信性性的判定定更新相似度度表之后后,在投投票箱中中查询对对该文件件的投票票,在相相似度表表中查询询相应投投票节点点
14、与本节节点的相相似度,将将投票值值与相似似度的乘乘积累加加得到文文件的信信誉值eestiimatte。当当esttimaate超超过某个个阈值aacceeptTThreeshoold时时,接受受这个文文件;当当esttimaate低低于某个个阈值rrejeectTThreeshoold时时,拒绝绝这个文文件;介介于两者者之间,则则以概率率接受这这个文件件。一般来说,判判断文件件是否污污染的信信誉阈值值有三种种取值方方案:全全局阈值值、多数数阈值、本本地阈值值。全局局阈值方方案由全全局共享享一个固固定的值值,不能能够灵活活取值;多数阈阈值方案案由局部部的大多多数节点点共同决决定一个个值,存存在节
15、点点之间相相互信任任的问题题。所以以采用本本地阈值值方案,并并且引入入自适应应的阈值值取值方方案。G(t)和和P(tt)分别别表示在在时刻tt,系统中中可信文文件和污污染文件件的数目目,则表示污污染文件件所占的的比例,也就是是污染文文件的扩扩散程度度。用户感感知污染染率表示示用户在在下载过过程中遭遭遇污染染文件的的概率,h(tt)和污污染文件件的扩散散程度相相关,表示相相关程度度的()是单单调增函函数。表示节点点采用对对象信誉誉机制时时在处理理一个可可信文件件时接受受它的概概率,表示节节点采用用对象信信誉机制制时在处处理一个个污染文文件时拒拒绝它的的概率。显然,和的值越越接近11,系统的的精确
16、度度越高。(2)在引入对象象信誉机机制之后后,用户感感知污染染率由原原来的hh(t)变为:H(t)的的值用户户可以通通过统计计得到。用户对对衡量系系统精确确度的指指标和的值并并不知情情,只能能通过统统计得到到的用户户感知污污染率HH(t)来评判判当前的的系统性性能。当H(t)超过用用户预期期的值HH时,同同时提高高acccepttThrreshholdd和reejecctThhressholld的值值;当HH(t)低于某某个很小小的值时,同同时降低低acccepttThrreshholdd和reejecctThhressholld的值值。采用用自适应应的阈值值取值方方案,使使得系统统在网络络动
17、态变变化的情情况下,仍仍然能够够保持和的值同同时处于于较高水水平。3. 邻居选择算算法通过不断调调整P22P文件件共享系系统ovverllay网网络的拓拓扑结构构,可以以增强普普通节点点的集聚聚性,而而对恶意意节点进进行有效效的屏蔽蔽,从而而减少恶恶意节点点传播污污染文件件的可能能,提高高文件共共享系统统的可用用性。由由于P22P网络络的分布布性特点点,从单单个节点点的角度度来看,可可以采用用有效的的邻居选选择算法法,以达到这这个目的的。为了能够在在网络节节点中找找到一个个子集,作作为自己己的邻居居节点,节点需需要采用用一种有有效的邻邻居选择择算法,如果仅仅选取与自身相似度最高的k个节点作为邻
18、居,这样做并不能够选取出最具有潜力的良好节点来防止文件污染,而且容易遭到共谋攻击的威胁。生物免疫系系统具有有高度分分布、自自适应和和自组织织的特性性。通过过模仿自自然生物物免疫,建建立人工工免疫系系统来进行节节点的邻邻居选择择过程,对对候选的的节点使使用人工工免疫算算法进行行筛选,选选取出和和本节点点具有高高相似度度的邻居居节点,同时,保持邻居节点的多样性,从而使系统达到很高的集聚性。算法的伪代代码如下下所示:(1)AAIS系系统初始始化;(2)将将本地的的投票信息息编码为为抗原AAg;(3)WWHILLE还有有候选节节点存在在(4)加入下下一个候候选节点点;(5)将其投投票信息息编码为为抗体
19、Abb;(6)计算AAg与Ab的的投票相相似度;(7)计算AAb与其它抗抗体的投投票相似似度;(8)WHIILE 邻居节节点集合合未满(9)执行浓度度更新过过程;(10)EEND WHIILE(11)ENDD WHHILEE其中,浓浓度更新新过程的的算法伪代代码如下下所示:(1)根根据Abb与Ag的相相似度提提高Abb的浓度度;(2)根据据Ab与与其它抗抗体的相相似度降降低Abb的浓度度;(3)根根据自然然衰减常常数降低低Ab的的浓度;(4)IIF AAb的浓浓度大于于某个阈阈值(5)将Ab加加入到邻居集集合中;(6)EELSEE(7)将Ab清清除出候候选集合合;根据算法所所描述的的抗体浓浓度
20、更新新过程,得得到抗体体Ab的的浓度变变化满足足以下微分分方程式式:其中,xii表示抗抗体Abb的浓度度,y表表示抗原原Ag的的浓度,xxj表示其其它抗体体的浓度度,N是是其它抗抗体的个个数,kk1、k2、k3是相应应的常数数参数。方方程式中中的第一一项表示示抗体AAb的抗抗原刺激激,它的的强度与与Ab和Ag的相相似度mmi成正比比,第二二项表示示抗体被被其它抗抗体识别别时所受受到的抑抑制,它它的强度度与Abb和其它它抗体的的相似度度mijj成正比比,第三三项表示示抗体细细胞没有有受到刺刺激而自自然衰亡亡的过程程。4. 仿真实验分分析4.1实验验场景通过在开源源的P22P模拟拟器Neeuroo
21、Griid SSimuulattor15的基础础上加入入文件共共享功能能,使得被被搜索到到的文件件能够在在网络中中复制传传播,然后根根据前面面描述的的节点投投票算法法和人工工免疫算算法,实现基于于人工免免疫的对对象信誉誉机制模块块,来验证证该机制制抑制PP2P系系统中文文件污染染的能力力。实验场景为为模拟一一个具有有10000个节节点和1100000个初初始文件件对象(G(00)+PP(0)=1000000)的PP2P文文件共享享网络,网络拓拓扑结构构符合参参数为(1.55, 11.0)的Poowerr-laaw分布布,节点上上的文件件分布和和文件中中的关键键字分布布都符合合Zippf分布布规
22、律。网络中中查询消消息的TTTL设设为7,平均每每个节点点每天发发起100次搜索索,模拟进进行100天(tt=100)共发发生10000000次搜搜索。另外,系系统中设置(x) =x,即用用户感知知污染率率h(tt)与污污染文件件的扩散散程度pp(t)相同。节点角色分分为三种种:良好节节点(BBeniign Peeer)、恶恶意节点点(Addverrsarriall Peeer)、搭便便车节点点(Frreerridiing Peeer)。三种所所占比例例设为:BENNIGNN_RAATE =800%,AADVEERSAARY_RATTE=110%,FREEERIIDINNG_RRATEE=10
23、0%。4.2 实实验结果果很多P2PP客户端端将查询询的结果果按照所所发现的的文件拷拷贝数降降序排列列,这就产产生了马马太效应应,用户更更愿意选选择拷贝贝数多的的文件进进行下载载,而这又又进一步步增加了了其拷贝贝数。所以系系统初始始状态对对整个系系统的精精确度性性能表现现影响很很大。在对比比系统精精确度时时,设置两组参数数:POLLLUTTIONN_RAATE分分别为110%和和50%,模拟拟低污染染率和高高污染率率两种环环境,其它实实验中,设置置POLLLUTTIONN_RAATE为为高污染染率条件件,即550%。图1 低低污染率率下对象象识别的的精确度度 图22 高高污染率率下对象象识别的
24、的精确度度由实验结果果图1和和图2可可见,在各种种污染程程度下,系统的的精确度度值(BeeniggnPeeerss Beeta)都能够达到90%以上,对搭便车节点的惩罚(Freeriders Beta)也随着污染程度的增加而变得更为严厉。在图1的低污染率条件下,搭便车节点利用系统所获得的识别精确度非常接近于良好节点;而在图2的高污染率条件下,搭便车节点利用系统所获得的识别精确度大大降低,搭便车节点几乎不能够从对象信誉机制中得到益处。从图3可以以看到可可信文件件与污染染文件传传播速度度的对比比,可信信文件在在系统中中持续增增长,而而污染文文件只是是略有增增加,两两者的差差距越来来越悬殊殊,污染染
25、文件的的传播受受到了很很大的抑抑制。4.3收敛敛速度由于网络带带宽和节节点计算算能力的的限制,节点进进行投票票收集的的范围是是受限的的,同时,人人工免疫疫系统还还处在初初始阶段段,因此此系统在在启动初初期由于于节点之之间没有有充分的的共享投投票信息息,所以处处于不稳稳定的状状态,对象识识别的精精确度有有一个收收敛过程程。通过实实验结果果图1和和图2可可以看出出,该系统统具有较较短的学学习曲线线,虽然在在初始启启动阶段段(小于于Dayy2时)处处于不稳稳定的抖抖动状态态,但能能够在较较短时间间内(在在Dayy2附近近)达到到并保持持稳定状状态。采用带有有有效期的的路径缓缓存机制制或是受受控的更更
26、新传播播方案可可以带来来收敛速速度和性性能的进进一步改改善。4.4系统统开销对象信誉机机制的引引入会带带来额外外的开销销,由于应应用范围围是文件件共享系系统,所以主要要关注的的性能指指标是通通信开销销。从图4可以以看到,额外的的投票通通信开销销与搜索索本身产产生的开开销相比比起来很很小(介介于0.06%-0.11%),不会加加重网络络的负载载。图3 可可信文件件与污染染文件的的传播 图4 对象象信誉机机制通信信开销5. 结论与展望望在P2P文文件共享享系统中中,建立立了基于人人工免疫疫原理的的对象信信誉机制制,使用用人工免免疫算法法从候选选节点中中选取出出和本节节点具有有较高投投票相似似度的节
27、节点作为为邻居节节点。在在该系统统中,通通过计算算节点之之间投票票向量的的夹角余余弦来衡衡量节点点投票的的相似性性,并以以此赋予予投票权权重,在在判断文文件可信信性时运运用自适适应的信信誉阈值值。该系系统以较较低的开开销有效效的抑制制了污染染文件在在文件共共享网络络中的传传播扩散散,避免免了恶意节节点的共共谋攻击击,提高高了P22P文件件共享系系统的可可用性。在下一步的的工作中中,希望建建立动态态自适应应的邻居居选择算算法以进进一步优优化拓扑扑结构;利用文文件的流流行度信信息,针对易易受污染染的热门门文件进进行投票票,以降低低系统开开销;另外,研究如如何利用用兴趣类类聚提高高网络的的集聚度度也
28、是下下一步的的工作。参考文献:1 J. Liiangg, RR. KKumaar, Y. Xi,et al. Poolluutioon iin PP2P Fille SSharringg Syysteems. Prroceeediingss off IEEEE Inffocoom 220055,Miaami, FLL, USSA, Maarchh 20005.2 J. Liiangg, NN. NNaouumovv, KK.W. Rooss. Thhe IIndeex PPoissoniing Atttackk inn P22P FFilee-Shhariing Sysstemms.Procc
29、eeddinggs oof IIEEEE Innfoccom 20006, Barrcellonaa, Sppainn, AApriil 220066.3 Dasguuptaa D, Atttohh-Okkinee N. Immmunnityy baasedd syysteems: A surrveyy. PProcceeddinggs oofIEEEE Intternnatiionaal CConffereencee onn Syysteems, Maan, andd Cyyberrnetticss, OOrlaandoo, Flloriida, 19997. 36693744.4 Kim
30、JJ, BBenttleyy P. Toowarrds an arttifiiciaal iimmuune sysstemm foor nnetwworkk inntruusioon ddeteectiion: Ann innvesstiggatiion of cloonall seelecctioon wwithh a neggatiive sellecttionn opperaatorr. PProcceeddinggs oofCoongrresss onnEvooluttionnaryy Coompuutattionn, SSeouul, Korrea, 20001. 277300.5
31、Carteer JJ H. Thhe iimmuune sysstemm ass a moddel forr paatteern reccognnitiion andd cllasssifiicattionn. JJourrnall off thhe AAmerricaan MMediicall Innforrmatticss Asssocciattionn, 220000, 77(3):288411.6 Timmiis JJ, NNeall M. A ressourrce limmiteed aartiificciall immmunne ssysttem forr daata anaaly
32、ssis. Knnowlledgge BBaseed SSysttemss, 220011, 114(33-4):12211130.7 Chun J SS, LLim J PP, JJungg H K. Opttimaal ddesiign of synnchrronoous mottor witth pparaametter corrrecctioon uusinng iimmuune alggoriithmm. IIEEEE Trranssacttionn onn Ennerggy CConvverssionn, 119999, 114(33):66106155.8 Neil Dasswa
33、nni, Hecctorr Gaarciia-Mollinaa, BBeveerlyy Yaang. Oppen Proobleems in Datta-SSharringg Peeer-to-Peeer SSysttemss. Prroceeediingss off thhe 99th Intternnatiionaal CConffereencee onn Daatabbasee Thheorry, Jaanuaary 08-10, 20003. 115.9 K. Waalshh, EE. GG. SSireer. Expperiiencce wwithh ann Obbjecct RRe
34、puutattionn Syysteem ffor Peeer-tto-PPeerr Fiilessharringg. PProcceeddinggs oof SSympposiium on Nettworrkedd Syysteems Dessignn annd IImpllemeentaatioon 220066, SSan Josse, USAA, MMay 20006.10 E. Daamiaani, S.D.CC. ddi VVimeercaati, S. Paarabboscchi, ett all. A Repputaatioon-BBaseed AApprroacch ffor
35、 Chooosiing Relliabble Ressourrcess inn Peeer-to-Peeer NNetwworkks. Prooceeedinngs of ACMM Coonfeerennce on Commputterss annd CCommmuniicattionns SSecuuritty, Wasshinngtoon, DC, USAA, Occtobber 20002.11 N. Cuurtiis, R. Saffavii-Naainii,W. Suusillo. X2Repp: EEnhaanceed TTrusst SSemaantiics forr thhe
36、XXRepp Prrotoocoll. PProcceeddinggs oof AApplliedd Crrypttogrraphhy aand Nettworrk SSecuuritty,Yellloww Moounttainn, Chhinaa, JJunee 20004.12 Kazaaa. hhttpp:/wwww.kaazaaa.coom.13 Juglee reeal-timme ffakee chheckk foor eeMulle aand eDoonkeey. htttp:/wwww.jjuglle.nnet.14 D. Duumittriuu, EE. KKnigghtll
37、y, A. Kuzzmannoviic, et al. Deeniaal-oof-sservvicee reesilliennce in peeer-tto-ppeerr fiile-shaarinng ssysttemss. Prroceeediingss off ACCM SSigmmetrricss 20005,Bannff, Caanadda, Junne 220055.15 S. Joosepph. An exttenddiblle oopenn soourcce PP2P simmulaatorr. PP2P Jouurnaal, Noovemmberr 20003.115.Art
38、ifficiial Immmunoologgy BBaseed AAntii-Poolluutioon PP2P Fille SSharringg SyysteemAbstrractt:Thee prrobllem of fille ppolllutiion is preevallentt inn p22p ffilee shhariing sysstemm noowaddayss. TThe pollluttionn reeducces thee avvaillabiilitty oof ssysttem shaarplly. As thee saame as natturaal iimmu
39、une sysstemm, pp2p fille ssharringg syysteem iis aalsoo hiighlly ddisttribbutiive, seelf-adaaptiive andd seelf-orgganiizedd. VVecttor spaace simmilaaritty iis ccompputeed tto wweigght thee vootess coolleecteed ffromm ottherr peeerss. SSelff-addapttivee reeputtatiion thrreshholdd scchemme iis aadoppt
40、edd too esstimmatee thhe ffilee auutheentiicitty. Arttifiiciaal iimmuunollogyy baasedd annti-pollluttionn obbjecct rrepuutattionn meechaanissm iis eestaabliisheed tto sseleect neiighbbor peeer sset andd immproove thee syysteem aavaiilabbiliity. Siimullatiion ressultts sshoww thhat thee syysteem ccan disstinnguiish bettweeen ggoodd annd ppollluteed ffilees aaccuurattelyy annd tthwaart thee prroliiferratiion of pollluttionn inn thhe nnetwworkk wiith loww coommuuniccatiion cosst.Key wwordds:pollluttionn; AAIS; avvaillabiilitty; fille ssharringg; ppeerr-too-peeer