一种P2P内容下载缓存系统设计和下载软件开发.doc

上传人:豆**** 文档编号:17175271 上传时间:2022-05-22 格式:DOC 页数:46 大小:462.50KB
返回 下载 相关 举报
一种P2P内容下载缓存系统设计和下载软件开发.doc_第1页
第1页 / 共46页
一种P2P内容下载缓存系统设计和下载软件开发.doc_第2页
第2页 / 共46页
点击查看更多>>
资源描述

《一种P2P内容下载缓存系统设计和下载软件开发.doc》由会员分享,可在线阅读,更多相关《一种P2P内容下载缓存系统设计和下载软件开发.doc(46页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。

1、【精品文档】如有侵权,请联系网站删除,仅供学习与交流一种P2P内容下载缓存系统设计和下载软件开发.精品文档.一种P2P内容下载缓存系统设计和下载软件开发毕业设计(论文)原创性声明和使用授权说明原创性声明本人郑重承诺:所呈交的毕业设计(论文),是我个人在指导教师的指导下进行的研究工作及取得的成果。尽我所知,除文中特别加以标注和致谢的地方外,不包含其他人或组织已经发表或公布过的研究成果,也不包含我为获得 及其它教育机构的学位或学历而使用过的材料。对本研究提供过帮助和做出过贡献的个人或集体,均已在文中作了明确的说明并表示了谢意。作 者 签 名: 日 期: 指导教师签名: 日期: 使用授权说明本人完全

2、了解 大学关于收集、保存、使用毕业设计(论文)的规定,即:按照学校要求提交毕业设计(论文)的印刷本和电子版本;学校有权保存毕业设计(论文)的印刷本和电子版,并提供目录检索与阅览服务;学校可以采用影印、缩印、数字化或其它复制手段保存论文;在不以赢利为目的前提下,学校可以公布论文的部分或全部内容。作者签名: 日 期: 学位论文原创性声明本人郑重声明:所呈交的论文是本人在导师的指导下独立进行研究所取得的研究成果。除了文中特别加以标注引用的内容外,本论文不包含任何其他个人或集体已经发表或撰写的成果作品。对本文的研究做出重要贡献的个人和集体,均已在文中以明确方式标明。本人完全意识到本声明的法律后果由本人

3、承担。作者签名: 日期: 年 月 日学位论文版权使用授权书本学位论文作者完全了解学校有关保留、使用学位论文的规定,同意学校保留并向国家有关部门或机构送交论文的复印件和电子版,允许论文被查阅和借阅。本人授权 大学可以将本学位论文的全部或部分内容编入有关数据库进行检索,可以采用影印、缩印或扫描等复制手段保存和汇编本学位论文。涉密论文按学校规定处理。作者签名:日期: 年 月 日导师签名: 日期: 年 月 日指导教师评阅书指导教师评价:一、撰写(设计)过程1、学生在论文(设计)过程中的治学态度、工作精神 优 良 中 及格 不及格2、学生掌握专业知识、技能的扎实程度 优 良 中 及格 不及格3、学生综合

4、运用所学知识和专业技能分析和解决问题的能力 优 良 中 及格 不及格4、研究方法的科学性;技术线路的可行性;设计方案的合理性 优 良 中 及格 不及格5、完成毕业论文(设计)期间的出勤情况 优 良 中 及格 不及格二、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格三、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中

5、 及格 不及格建议成绩: 优 良 中 及格 不及格(在所选等级前的内画“”)指导教师: (签名) 单位: (盖章)年 月 日评阅教师评阅书评阅教师评价:一、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格二、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格建议成绩: 优 良 中 及格 不及格(在所选等级

6、前的内画“”)评阅教师: (签名) 单位: (盖章)年 月 日教研室(或答辩小组)及教学系意见教研室(或答辩小组)评价:一、答辩过程1、毕业论文(设计)的基本要点和见解的叙述情况 优 良 中 及格 不及格2、对答辩问题的反应、理解、表达情况 优 良 中 及格 不及格3、学生答辩过程中的精神状态 优 良 中 及格 不及格二、论文(设计)质量1、论文(设计)的整体结构是否符合撰写规范? 优 良 中 及格 不及格2、是否完成指定的论文(设计)任务(包括装订及附件)? 优 良 中 及格 不及格三、论文(设计)水平1、论文(设计)的理论意义或对解决实际问题的指导意义 优 良 中 及格 不及格2、论文的观

7、念是否有新意?设计是否有创意? 优 良 中 及格 不及格3、论文(设计说明书)所体现的整体水平 优 良 中 及格 不及格评定成绩: 优 良 中 及格 不及格(在所选等级前的内画“”)教研室主任(或答辩小组组长): (签名)年 月 日教学系意见:系主任: (签名)年 月 日一种P2P内容下载缓存系统设计和下载软件开发摘 要随着BitTorrent(以下简称BT)等一系列P2P应用的兴起,网络流量犹如洪水到来,互联网服务提供商(InternetServiceProvider,以下简称ISP)正在面临巨大的网络带宽压力。据统计,目前我国互联网P2P流量已占总流量的70%左右,而以BT为主的P2P下载

8、流量已占P2P总流量的80%,因此为了缓解BT等应用带来的大量带宽的占用,ISP通过充分挖掘基础网络设备功能来达到最基本的效果。本论文主张采取正确引导P2P流量的策略的方法,借鉴Web Caching技术与CDN内容分发网络技术的基本原理,提出设置P2P内容缓存服务器的方法和关键技术。首先将用户请求的内容转移到P2P内容缓存服务器中,然后再通知用户到P2P内容缓存服务器中下载,尽量将P2P流量控制在ISP网络内部,从而有效控制ISP出口网络带宽拥挤的状况。同时,实现了网络运营商对P2P内容的监管,为P2P技术推动互联网健康快速的发展起到了重要的作用。 关键词:BitTorrent,P2P,互联

9、网服务提供商,流量,网络带宽,P2P内容缓存服务器A Design and Development of P2P Content Downloading Cache SystemAbstractWith the development of the use of P2P such as BitTorrent, Internet Service Provider (ISP for short) is facing the huge pressure of network bandwidth. At present, the Internet flow of P2P is about 70% of

10、 the total flow in our country according to the statistics, and especially the P2P download of BitTorrent is 80% of the P2P total flow. Thus, in order to reduce the using of large bandwidth taken by BT, ISP obtains the basic effect by exploiting the function of the basal internet equipment. The main

11、 work in this paper is to take a right way to lead P2P flow correctly and put forward a method of setting Content Cache Server of P2P by using the principle of Web Caching technology and Content Delivery Network technology. First, the work is to transfer the content of the users request to P2P Conte

12、nt Cache Server, and then to inform him to download the content from it, controlling the P2P flow in the ISP network as far as possible, in order to control the jam of bandwidth at the export of ISP network. Meanwhile, the method puts forward the supervision of P2P by Internet Service Provider, and

13、it takes an important part in promoting the development of Internet healthily and rapidly.Key words: BitTorrent; peer-to-peer; Internet Service Provider; flow; network bandwidth; P2P Content Cache Server1绪论12P2P技术介绍22.1传统资源共享方式22.2P2P网络共享方式22.2.1P2P网络原理22.2.2P2P网络应用模式32.2.3P2P网络路由模型32.3P2P流量的特征分析与识别

14、32.3.1P2P流量特征32.3.2P2P流量识别与检测42.4P2P应用对ISP造成的影响52.5目前对P2P应用的解决办法63目前一些缓存技术分析和P2P内容缓存系统的可行性73.1Web Caching技术73.2CDN内容分发网络83.2.1CDN工作原理83.2.2CDN框架结构83.3Web Caching与CDN系统比较93.4Web Caching技术可行性报告93.5CDN技术可行性报告103.6本章小结114P2P内容缓存系统研究与设计124.1P2P内容缓存系统设计目标124.2P2P内容缓存系统总体设计概要134.2.1系统设计层次结构134.2.2系统功能模块134

15、.2.3系统关键技术154.3系统方案设计174.3.1方案一174.3.2方案二184.3.3方案比较195用于缓存系统的下载软件开发与调试205.1系统开发环境与开发环境205.2程序结构与程序流程分析205.2.1进程设计205.2.2程序流程图225.3数据结构与关键算法分析255.4系统软件测试285.4.1系统测试环境285.4.2系统测试时遇到的问题295.5系统实现功能及特性说明305.6系统可扩展方案研究说明306结 论326.1设计过程与实现结果分析326.2系统遗留问题及工作展望32参考文献33致 谢34作者简介:34声 明351 绪论近几年来,随着以BitTorrent

16、为代表的P2P技术的快速发展,彻底打破了传统的C/S资源共享模式,网络流量急剧增加,同时也影响了ISP的运营模式,使得ISP出口带宽紧缺,为了解决这些问题,ISP提出了很多方案,例如:阻塞常用P2P端口、限制用户上限带宽、干扰peer间通信等措施,但是最终取得的效果却并不理想,因此当前需要一种新型的网络解决方案实现缓解ISP出口带宽紧缺的问题。而P2P带宽解决方案的关键技术1在于:高速应用层协议识别、范围控制与本地服务、高速数据内容检测、数据流重定向。本论文的研究目的就在于设计出一种P2P内容下载缓存系统,通过P2P流量检测技术,将所有经过ISP出口的P2P流量重定向到P2P内容缓存服务器中,

17、P2P内容缓存器完成P2P内容数据的集中,然后再将这些P2P内容数据传送给请求的用户,使绝大多数的P2P流量控制在ISP内部,从而缓解ISP出口的带宽压力。本文在深入分析当前ISP缓解网络带宽方案的基础上,结合Web Caching技术与CDN内容分法网络的缓存系统原理,提出基于BitTorrent应用的P2P内容下载缓存系统,并通过编写代码,实现用于P2P内容缓存服务的软件系统。该系统应能够支持基于BT协议的P2P下载控制以及将P2P缓存服务器中存在的P2P内容数据高速的传送给请求该内容的用户。目前,暂时还没有关于使用P2P内容缓存服务器的方式来引导P2P流量的研究方案和实用系统,因此本系统

18、的研究为P2P合理有效的利用和监管提供了新的方向和思路,对P2P技术的合理发展将起到一定的促进作用。2 P2P技术介绍2.1 传统资源共享方式在如今的互联网时代,资源共享是其非常重要的功能之一。传统的资源共享方式主要是C/S模式(客户端/服务器,Client/Server),其主要由客户应用程序(Client)、服务器管理程序(Server)和中间件(Middleware)三个部件组成2。客户应用程序是系统中用户与数据进行交互的部件。服务器程序负责有效地管理系统资源,如管理一个信息数据库,其主要工作是当多个客户并发地请求服务器上的相同资源时,对这些资源进行最优化管理。中间件负责联结客户应用程序

19、与服务器管理程序,协同完成一个作业,以满足用户查询管理数据的要求。比较经典的应用有FTP和WWW服务,其是FIP,它的全称就是“文件传送协议”,FTP协议以其稳定、高速、简单的文件传输而一直保持着很大的生命力。C/S结构在技术上很成熟,它的主要特点是交互性强、具有安全的存取模式、网络通信量低、响应速度快、利于处理大量数据。但是随着网络技术的不断发展和网络用户增多,服务器非常容易产生瓶颈问题,影响用户的正常访问。2.2 P2P网络共享方式P2P技术的诞生,彻底打破了传统的文件下载方式。目前基于P2P技术的BitTorrent协议的文件下载软件风靡全球,BT的优越性在于克服了传统文件下载技术的速度

20、瓶颈问题,文件的下载速度反而随着用户数的增加而得到提高。2.2.1 P2P网络原理P2P是peer-to-peer的缩写,是一种分布式网络,网络的参与者共享他们所拥有的一部分硬件资源(处理能力、存储能力、网络连接能力、打印机等),这些共享资源需要由网络提供服务和内容,能被其它对等节点(peer)直接访问而无需经过中间实体。在此网络中的参与者既是资源(服务和内容)提供者(Server),又是资源获取者(Client)。P2P打破了传统的C/S模式,在网络中的每个结点的地位都是对等的。每个结点既充当服务器,为其他结点提供服务,同时也享用其他结点提供的服务。P2P的技术特点见表1-1:表1-1 P2

21、P与C/S模式统计数据之间的对比性能P2P模式C/S模式数据发布性好差数据接收性中好数据互动性好差数据即时性好差数据安全性差好数据更新好差数据质量中好数据成本控制好差数据管理方便性差好2.2.2 P2P网络应用模式当初Internet产生和发展的主要动力是资源共享,这也正是P2P提出的最初目标,以P2P技术为基础的文件内容共享应用也是P2P最重要的应用。同时,随着Internet的发展和人们对P2P思想的理解,其他一些基于P2P的应用也不断出现3。(1) 文件内容共享和下载:例如Napster、eDonkey、eMule、Maze、BT、迅雷等;(2) 计算能力和存储共享:例如SETIhome

22、、Avaki、Popular Power等;(3) 基于P2P技术的协同与服务共享平台:例如JXTA、Magi、Groove等;(4) 即时通讯工具:包括ICQ、QQ、Yahoo Messenger、MSN Messenger等;(5) P2P通讯与信息共享:例如Skype、Crowds、Onion Routing等; (6) 基于P2P技术的网络电视:沸点、PPStream、 PPLive、 QQLive、 SopCast等;(7) 基于P2P技术的网络游戏;2.2.3 P2P网络路由模型所有的对等网络有一个共同点,那就是实际的数据传输是在资源的请求者与接收者间直接进行的。但是, P2P的控

23、制层面的实现有不同的方式,据此所有的对等网络的应用可以归结为如下四种体系结构4: 集中式网络模型,中心服务器存储所有节点的信息的目录,而信息本身存在各个节点中。 分布式网络模型,无中心服务器,各节点直接通过“洪泛”模式传递搜索消息。 混合式网络模型,引入了超级节点的概念,超级节点域内采用集中结构工作模式,超级节点之间是分布结构工作模式。 结构化网络模型,一种采用纯分布式的消息传递机制和根据关键字进行查找的定位服务,目前的主流方法是采用分布式哈希表(DHT)技术,这也是目前扩展性最好的P2P路由方式之一。目前比较成熟的DHT协议主要有:Chord、CAN、Pastry、Kademlia。2.3

24、P2P流量的特征分析与识别2.3.1 P2P流量特征(1) 数据量大。对于资源共享和基于P2P技术的网络电视应用来说,数据量是巨大的。(2) 数据突发性强。用户发送数据在时间上具有很大的随机性,分布不均匀。(3) 高速传输。由于P2P中每一个节点都是服务器,为其他节点服务,所以数据传输速率比传统C/S模式更快。(4) 在线时间长5。P2P模式打破传统C/S模式,将服务器分散到每一个节点,节点在下载完毕时,仍然可以在线作为服务器,为其他对等节点服务,而且很多P2P应用软件为了充分发挥P2P技术的优越性,都有一定的激励措施,鼓励用户长期在线。(5) 上下行流量对称。P2P中的节点既是客户端,也是服

25、务器,在下载的同时,也在为其他对等节点服务,提供上传业务,因此,上下行基本对称。(6) 业务分布广泛。目前P2P技术的应用很广,涉及到很多领域,在空间分布上也比较广泛。(7) 连接端口不确定。P2P应用占据很多的带宽,因此在很多情况下,P2P业务被屏蔽,为了解决这个问题,很多P2P应用软件端口可以根据用户要求改变。(8) 连接IP地址特征5。P2P是多点到多点的连接模式,因此,客户端同时与多个IP地址建立连接,但在一段时间内平均连接每个IP地址的次数不多。2.3.2 P2P流量识别与检测对于P2P流量合理有效地识别应该包含如下内容。第一,对P2P流量的特征必须具有良好的分布特征和可区分性;第二

26、,识别P2P流量和整个P2P覆盖网络,这样才可能依此提出新的针对于P2P网络的积极防御模式和机制。目前常用的流量识别方法6主要有:(1) 端口匹配识别:完成固定端口的常规业务和P2P 业务应用识别。通过取出流中的源端口或者目的端口,然后查找常用端口映射表,如存在,则识别成功,并考虑伪端口的存在(如一些P2P 为了伪装而借用常用端口),予以剔除。(2) 净荷检测识别:若通过静态的端口映射表无法识别,则表明这些流量是非标准协议或者动态端口的,需要采用特征字符串来匹配净荷的方式来识别这些业务或应用。(常用P2P应用流量特征比特串见表3-1)(3) 连接模式识别:不同的业务其建立连接的方式都有相应特征

27、,可通过IP 地址和端口的相应关系识别P2P业务。主要是统计(IP,port)所连接到的各个IP、端口号、数据报大小和传送流量大小。如果连接到的IP 地址个数和port个数相近,则认为是P2P 流量。相反,如果连接到的IP数和port 数相差大到10个以上,则认为是非P2P流量。(4) 拓扑特性识别:不同的业务其拓扑也有各自特征,可通过分析协助识别。(5) 应用协议分析识别:对于非标准协议的应用,但协议又是公开的,比如eMule等应用,可通过应用协议分析引擎对此类业务进行识别。(6) (TCP/UDP) IP pair 法识别:根据观察和研究,同时采用了TCP和UDP协议的应用绝大部分都是P2

28、P 流量,除了特殊的几个应用,如:DNS,NETBIOS,IRC,游戏和多媒体业务流量,但这些应用都有特定的端口,如135,137,139,445,53,3531 等,可以通过端口匹配识别这些流量(见图1),其余的业务流量同时应用了TCP和UDP协议的流量,即为P2P 流量。表3-1常用P2P应用流量特征比特串P2P协议名称净荷比特字符串eDonkey20000xe319010000Fasttract“Get ./hash”Bitterront0x13Bittorrent protocolAres“Get hash:”(7) 流统计特性的识别:在IP层通过流量统计特征的方式识别P2P流。P2P

29、流量具有长时固定连接特点,因此理论上基于流状态的统计识别方式可以识别一切大规模P2P流量。(8) 采用双向识别:当某个方向的流(五元组定义的流)被识别为P2P流,则其反方向流必然也是P2P流。对于衡量某种流量识别方法的好坏,其技术指标主要有三个基本原则:(1)尽量提高检测精度;(2)在检测精度中偏重于降低虚警率(False Positive Rata,FP%),维持适当漏报率(False Negative Rata,FN%);(3)维持适当的计算复杂度。2.4 P2P应用对ISP造成的影响P2P以其独特的技术优势在这几年内迅速发展,其应用不断增长。互联网用户数的增长率一直保持在10到20,但是

30、带宽的需求却呈现300倍到500倍的增长,其中带宽需求的增长来源则主要是P2P应用,P2P应用的流量已经远远超过了http应用的流量,成为Internet流量的主体。但是,P2P流量在所有Internet流量中的比例却由于所处地域的不同而存在着相当的差异7,见表1-2。据统计目前我国P2P流量占据了70%-80%的互联网流量。表1-2 2004年Internet流量在不同地区的分布areaAsiaEuropeEnglandAmericaPopular P2P traffic (%)64534361Other P2P traffic (%)183176Http traffic (%)212171

31、0Other traffic (%)16322324注:Popular P2P traffic主要是指BT,eDonkey,FastTrack以及Gnutella的流量P2P 技术在中国的大规模应用是从2003 年下半年开始,以BT为代表的P2P 技术急速升温,用户数量飞速发展。作为一种新兴的技术,基于该技术的应用已成为互联网上最流行的应用之一,对整个通信产业和传媒业都带来了巨大的冲击8。(1) 对传统语音业务的冲击VoIP(voice over IP)业务因其低廉的资费冲击着传统的语音业务,据市场咨询公司IDC称,到2009年底VoIP用户将达到2700万。而P2P技术的出现,无疑是给VoI

32、P插上了翅膀,使其保持低资费的条件下,大大提高了服务质量,其语音质量已与传统的PSTN 语音相接近,进一步加速了VoIP对传统语音的替代趋势。典型的代表就是Skype。P2P的VoIP 业务对传统语音业务形成了巨大的分流, 同时也促使电信运营商降低价格应对竞争, 导致了其收入的剧减。(2) 对网络带宽的蚕食在P2P应用出现之前,互联网的主要流量来自于浏览网页、FTP传输和邮件等,下载的业务类型基本上都是基于Client/Server模式的,由于服务器容量等的限制,使用户接入带宽很少处于满的状态。而P2P技术的出现,完全改变了这种状况,用户长时间在线与其他用户共享信息,用户接入带宽长时间处于饱和

33、状态,网络流量急剧上升。目前,P2P应用早已超过HTTP应用,成为互联网上最为普遍的应用,给运营商带来了新的挑战。P2P应用使ISP陷入困境。一方面P2P应用是最终用户的需求,现有的网络结构却难以完全满足;另一方面,ISP没有有效地控制P2P流量的方法,这将导致整个网络的服务质量下降,进而影响其他业务的开展。(3) 内容的扩散无法控制目前各电信运营商都在向综合信息服务提供商转型,需要利用其网络和服务资源优势,整合内容提供商的内容资源,打造整个互联网产业价值链,而这些都要在版权保护的前提下进行。但是在P2P应用中, 每个人都可以向别人提供文件和信息,因此导致数字产品的版权变得难以控制,数字产品的

34、开发商同样也难以向私下共享的网民收取许可费用。目前,虽然P2P下载已新生出许多合法的应用,但非法复制仍是P2P下载的主体,所以它必然更加直接地影响到各版权所有人的利益,因此,P2P的非法内容下载不仅影响了内容版权所有人的利益,也给电信运营商带来了冲击。2.5 目前对P2P应用的解决办法由于P2P的应用对于ISP的冲击是巨大的,这要求ISP尽快找到解决这种状的办法,目前各大ISP对于P2P应用采取的措施9主要有以下几种:(1) 扩容网络,增强基础网络的承载能力扩容网络是传统解决网络带宽拥塞的主要办法,但是由于P2P应用的增长速度迅速,新扩容的网络带宽在扩容后不久就被占用完,因此它只能暂时缓解网络

35、拥挤压力,不能从根本上解决问题。(2) 限制P2P应用根据网络使用的具体情况采取不同的限制措施,比如限制用户带宽、封杀P2P应用、限制P2P连接数目等等。这种办法可以很好的解决网络拥挤的状况,但会引起网络用户的不满,而且从技术实现上,还存在一定的问题。同时,这种方法,也不利于P2P技术的发展,互联网的发展。(3) 实施新的商业运营模式例如恢复互联网初期实行的基于流量的收费方式,实现对用户网络流量的细化管理,从而限制网络用户对P2P应用的使用情况,但是这相对于目前ISP实行的粗放型的宽带包月收费制度,网络用户不太容易接受。从目前情况来看,以上几种方式都存在一定的问题,需要找出一种新的方法来有效控

36、制P2P使用,构建多方共赢的价值网络, 降低网络投资, 提高网络性能, 改进用户体验, 获得更好的经济效益和社会效益。因此,本论文主张采取正确引导P2P流量的策略的方法,提出P2P内容缓存服务器的概念,利用缓存技术,将P2P内容放ISP设置的缓存器中来解决ISP出口拥挤的状况。3 目前一些缓存技术分析和P2P内容缓存系统的可行性3.1 Web Caching技术Web Caching技术是为了解决网络带宽不足、服务质量差而提出来的,它依据统计学原理,将可能进一步使用或重复使用的内容缓存在相对高速的Cache服务器中,当有相同的请求时,直接在Cache中提取,从而提高网络响应效率。Web Cac

37、hing技术在现有网络架构的基础之上,利用传输本地化的方法达到了优化使用网络带宽、提高网络服务质量、增强网络信息可用性及提高网络灵活性的目的。Web高速缓存服务器10通常是网络中的一个专用的计算机系统,它监视Web对象请求, 获得这些对象, 然后存储这些对象。 其工作原理如图2-1所示。图2-1中,为缓存服务器接受浏览器请求;为缓存服务器从原始服务器获得缓存中的未存储对象(Cache Miss);为缓存服务器存储获得的对象,并将拷贝发送给浏览器。此后,当用户对相同的对象(网站)提出访问请求时,就由缓存服务器来满足其要求,将已存储对象(Cache Hit)的拷贝发送给浏览器。Web网络缓存系统使

38、得用户请求不必再通过Internet路由到达原始服务器而取回所请求的对象,从而降低了可能引起的服务延迟。同时,Web高速缓存技术的应用还可以缓解Web服务器的负担。因为大量的用户请求不再需要原始服务器进行处理。Web高速缓存技术能够提供一种廉价而可靠的Web服务器负载分担方案。图2-1Web 缓存技术的基本原理Web Caching技术是一种基于客户请求查询的技术,可以称作是一种“拉”的技术,它在技术上的实现主要有三个方面的好处:(1) 节省网络带宽,降低了ISP的运营成本,减少了扩容压力。虽然配备Cache缓存服务器需要成本,但是其成本相对于扩容网络的成本要小很多。(2) 减少了终端用户的响

39、应时间,客户端的效率提高,也增加了用户对ISP的满意度。(3) 网络客观性加强,缓存引擎提供了访问控制与监测策略,使管理员很容易对某些不友好的请求进行隔离;另外,缓存引擎还提供了全面的可操作的日志记录。3.2 CDN内容分发网络3.2.1 CDN工作原理CDN的全称是Content Delivery Network,即内容分发网络。其目的是通过在现有的Internet中增加一层新的网络架构,将网站的内容发布到最接近用户的网络“边缘”,使用户可以就近取得所需的内容,解决Internet网络拥塞状况,提高用户访问网站的响应速度。从技术上全面解决由于网络带宽小、用户访问量大、网点分布不均等原因,解决

40、用户访问网站的响应速度慢的根本原因。CDN的工作原理11:当用户访问已经加入CDN服务的网站时,首先通过DNS重定向技术确定最接近用户的最佳CDN节点,同时将用户的请求指向该节点。当用户的请求到达指定节点时,CDN的服务器(节点上的高速缓存)负责将用户请求的内容提供给用户。 其用户访问的基本流程如下: (1) 用户在浏览器中输入要访问的网站的域名;浏览器向本地DNS请求对该域名的解析;(2) 本地DNS将请求发到网站的主DNS,主DNS再将域名解析请求转发到重定向DNS;(3) 重定向DNS根据一系列的策略确定当时最适当的CDN节点,并将解析的结果(IP地址)发给用户;(4) 用户向给定的CD

41、N节点请求相应网站的内容;(5) CDN节点中的服务器负责响应用户的请求,提供所需的内容。 3.2.2 CDN框架结构CDN网络架构主要由两大部分,分为中心和边缘两部分,中心指CDN网管中心和DNS重定向解析中心,负责全局负载均衡,设备系统安装在管理中心机房,边缘主要指异地节点,CDN分发的载体,主要由Cache和负载均衡器等组成。而根据功能特性,一个典型CDN网络由内容缓存设备、内容交换机、内容路由器、CDN内容管理、内容分发系统五部分组成11,如图2-2所示。各部分功能见表2-1。图2-2 CDN网络组成结构图表2-1 CND各部分功能表内容缓存位于 POP接入点或多点 IDC中,可缓存静

42、态的Web内容和流媒体内容内容交换机在IDC中,可对内容缓存负载平衡及访问控制内容路由器在POP点或IDC中,负载为用户的请求选择最佳的访问站点内容分发系统内容缓存只可缓存静态内容而对于一些要求对其所有分布站点的内容作镜像的用户,我们需要一个内容镜像系统,这就是内容分发系统CDN管理系统由于CDN系统是提供给多个用户共享,所以需要一个中心管理系统作为 CDN的集中管理。3.3 Web Caching与CDN系统比较对于都是为了提高网络服务质量的两种技术Web Caching技术和CDN内容分发网络技术,二者之间具有一定的联系,同时也存在不同之处,表2-2是对两种技术的比较:表2-2 Web C

43、aching与CDN技术比较比较选项Web Caching技术CDN技术设计目标减小客户请求响应时间,节省网络带宽实现手段移动Web内容的位置实现机制客户端到服务器抓取服务器向客户端推送所处位置网络边缘,分布在网络不同位置网络中心和边缘相结合系统特点快速访问、健壮性好、透明性、可扩展性可管理性、安全可靠性技术手段代理缓存、基于组播技术的缓存高速缓存、镜像服务器评价指标客户访问时延、吞吐率、命中率Web服务器负载、Web服务器负载均衡性能特性不理想(35%-50%Web内容不可缓存)性能比较理想服务对象部分客户端部分服务器受益对象所有Web服务器所有客户端CDN中通过位于网络不同节点处的Cont

44、ent Server缓存或复制源服务器的部分或全部内容,并由请求路由功能把不用的用户请求以透明的方式引导至不同的Content Server,这样相对于单纯的Web Caching技术更有效地达到减少网络数据流量、节约网络带宽、缩短用户访问时延等目的,从而提高了网络服务质量。3.4 Web Caching技术可行性报告作为早期解决网页浏览速度不理想的Web Caching技术与P2P内容缓存系统具有很多相似的地方,如都是终端用户首先提出请求,然后利用缓存机制将请求内容放到设置的缓存中,当下次用户请求时,直接到缓存中获取,这样就达到节省网络带宽的目的。但是Web Caching在P2P内容缓存系统中是否可行呢

展开阅读全文
相关资源
相关搜索

当前位置:首页 > 教育专区 > 小学资料

本站为文档C TO C交易模式,本站只提供存储空间、用户上传的文档直接被用户下载,本站只是中间服务平台,本站所有文档下载所得的收益归上传人(含作者)所有。本站仅对用户上传内容的表现方式做保护处理,对上载内容本身不做任何修改或编辑。若文档所含内容侵犯了您的版权或隐私,请立即通知淘文阁网,我们立即给予删除!客服QQ:136780468 微信:18945177775 电话:18904686070

工信部备案号:黑ICP备15003705号© 2020-2023 www.taowenge.com 淘文阁