《《体系论文答辩》PPT课件.ppt》由会员分享,可在线阅读,更多相关《《体系论文答辩》PPT课件.ppt(30页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、体系论文答辩引言引言w一个银行需要一台主机用来存放所有的数据,这一个银行需要一台主机用来存放所有的数据,这些数据需要在即使地震,机房倒塌,也要保证所些数据需要在即使地震,机房倒塌,也要保证所有的远程访问都能达到,我们需要什么?有的远程访问都能达到,我们需要什么?w一个小公司刚起步时需要一个服务器,但是因为一个小公司刚起步时需要一个服务器,但是因为资金有限,只能购买相对数量和性能都较差的多资金有限,只能购买相对数量和性能都较差的多处理机,但是不排除以后会对其进行扩展和升级,处理机,但是不排除以后会对其进行扩展和升级,我们需要什么?我们需要什么?w现在你试图解决一个数学上的难题,一个需要进现在你试
2、图解决一个数学上的难题,一个需要进行数亿次上的计算,但是你又无力购买一个超级行数亿次上的计算,但是你又无力购买一个超级计算机,此时你会怎么办?计算机,此时你会怎么办?标题标题w主标题:多处理计算机导论w副标题:浅谈集群计算机技术w作者:王上丹 姚雯w时间:2006年6月内容摘要内容摘要摘要:使用计算机集群系统进行并行计算是一种既经济又高效的解决方法,开发资源丰富,成本低廉。随着应用程序和各种计算对计算机性能要求的不断提高,集群系统将成为有效解决这以问题的可行的途径。本文主要通过对集群系统(设计原理,需要解决的问题,软硬件需求等)的分析和研究来学习体系结构中集群计算系统以及分布式计算的相关知识,
3、并希望通过这样的学习,可以更好的理解和学习体系结构中的相关知识。目目 录录摘要及关键词概述集群计算技术简介集群计算机的体系结构和设计原理集群技术的发展与挑战结束语选题选题w选题目的:选择集群技术作为本论文的研究对象,主要是希望对其的学习能够对多处理机的系统有所了解,以集群系统为主,研究高性能和高扩展性以及高可用性计算机。w背景介绍:早在20世纪60年代,IBM公司就提出了集群计算机的概念,但是当时的计算机硬件技术以及制造业的落后,使得集群计算机只能停留在蓝图上,但是到了80年代,随着计算机产业的飞速发展,集群系统才开始慢慢进入研究室,进入工厂,如今,集群计算机以其高的性价比获得市场的认可,因而
4、成为目前市场的主流。相关概念介绍相关概念介绍w集群技术集群是一种并行或分布式多处理系统,该系统由两个或多个计算机(简称为节点)通过网络连接而成。节点可以是一台PC机,也可以是工作站或者SMP,分别构成PC集群,工作站集群,SMP集群。每一个节点都由单独的处理器、主存储器、辅助存储器、I/O接口及操作系统。可以单独执行串行应用程序,也可以作为集群中的一个节点执行并行的应用程序,协同完成并行任务。相关概念介绍相关概念介绍w高可用性计算集群技术:是指以减少服务中断(宕机)时间为目的的服务器集群技术。w高性能计算集群技术:是指以提高科学计算能力为目的计算机集群技术。w高高可可扩扩展展性性集集群群技技术
5、术:是是带带均均衡衡策策略略(算算法法)的的服服务务器器群群集集。w负载均衡群集:在多节点之间按照一定的策略(算法)分发网络或计算处理负载。负载均衡建立在现有网络结构之上,它提供了一种廉价有效的方法来扩展服务器带宽,增加吞吐量,提高数据处理能力,同时又可以避免单点故障。集群计算机体系结构粗略图集群计算机体系结构粗略图 集群中间件Pc/工作站(处理器,存储器,I/O,操作系统等)Pc/工作站(处理器,存储器,I/O,操作系统等)Pc/工作站(处理器,存储器,I/O,操作系统等)高 速 网 络串行程序并行程序下文中将进行详细的阐述内容介绍内容介绍w集群架构w资源管理和负载平衡w集群硬件(集群中间件
6、)w集群软件平台w集群的三大技术w技术支持(负载均衡算法)w集群计算机的挑战和发展集群架构集群架构w目前常见的集群架构有两种:Web/Internet Cluster System 和 平 行 运 算(Parallel Algorithms Cluster System)。前者主要将资料放置在不同的主机上,亦即由多部主机同时负责一项服务;后者将同一个运算的工作,交给整个Cluster 里面的所有的CPU来进行同步运算,由于使用到多个CPU的运算能力,所以可以加快运算的速度。资源管理和负载平衡资源管理和负载平衡w资源(包括CPU,存储设备,I/O等)管理与调度:是集群计算技术中一个非常重要的方面
7、,从系统的角度来看,集群系统的资源使用率是最重要的问题。系统资源使用越高,说明系统的吞吐能力越大,资源共享的效果也越好。w负载平衡的实现机制有两种:初始放置或者远程执行,初始放置技术是当进程在某一个计算节点产生时,根据负载平衡的要求将进程转移到其它的节点远程执行的方法。集群硬件集群硬件w集群中间件 集群中间件处于节点操作系统与用户环境之间,它与操作系统一起为所有的节点提供访问系统资源的各种途径,集群系统的设计目标集中体现在支持应用程序的资源管理,系统可扩展性和可用性的完全透明。中间件应提供以下主要服务:唯一地址空间:唯一用户界面:唯一的进程空间:检查点设置:除此以外,还包括单点管理和控制、唯一
8、虚拟网络,唯一文件层次等功能。集群软件平台集群软件平台w操作系统wLinux操作系统wSolaris操作系统wWindows NT操作系统w编程环境集群中的每一个用户可以使用不同的编程工具,开发和调试自己的分布式成熟,因此,集群环境应该包括接口,API和传统开发工具等等,共同为用户提供丰富的开发环境。PVM:并行虚拟机。MPI:消息传递接口。例子,M 集群的三大技术集群的三大技术w高 可 用 性 集 群 技 术(High Availability Cluster(HA Cluster))w高高性性能能计计算算集集群群技技术术High Performance Computing Cluster(
9、HPC Cluster)w高可扩展性集群技术高可扩展性集群技术技术支持(负载平衡算法)技术支持(负载平衡算法)负载均衡的作用就像轮流值日制度,把任务分给大家来完成,以免让一个人过度劳累。但是与轮流值日制度不同的是,负载均衡是一种动态均衡,它通过一些工具实时地分析数据包,掌握网络中的数据流量状况,把任务理分配出去。对于不同的应用环境(如电子商务网站,它的计 算负荷大;再如网络数据库应用,读写频繁,服务器的存储子系统系统面临很大压力;再如视频服务应用,数据传输量大,网络接口负担重压。),使用的均衡策略(算法)是不同的。所以均衡策略(算法)也就有了多种多样的形式,广义上的负载均衡既可以设置专门的网关
10、、负载均衡器,也可以通过一些专用软件与协议来实现。在OSI七层协议模型中的第二(数据链路层)、第三(网络层)、第四(传输层)、第七层(应用层)都有相应的负载均衡策略(算法),在数据链路层上实现负载均衡的原理是根据数据包的目的MAC地址选择不同的路径;在网络层上可利用基于IP地址的分配方式将数据流疏通到多个节点;而传输层和应用层的交换(Switch),本身便是一种 基 于 访 问 流 量 的 控 制 方 式,能 够 实 现 负 载 均 衡。技术支持(负载平衡算法)技术支持(负载平衡算法)目前,基于均衡算法主要有三种:轮循(Round-Robin)、最小连接数(Least Connections
11、First),和快速响应优先(Faster Response Precedence)。轮循算法,就是将来自网络的请求依次分配给集群中的服务器进行处理。最小连接数算法,就是为集群中的每台服务器设置一个记数器,记录每个服务器当前的连接数,负载均衡系统总是选择当前连接数最少的服务器分配任务。这要比轮循算法好很多,因为在有些场合中,简单的轮循不能判断哪个服务器的负载更低,也许新的工作又被分配给了一个已经很忙的服务器了。快速响应优先算法,是根据群集中的服务器状态(CPU、内存等主要处理部分)来分配任务。这一点很难做到,事实上到目前为止,采用这个算法的负载均衡系统还很少。尤其对于硬件负载均衡设备来说,只能
12、在TCP/IP协议方面做工作,几乎不可能深入到服务器的处理系统中进行监测。但是它是未来发展的方向。集群计算的发展和挑战集群计算的发展和挑战面临的挑战分布式计算式程序(指那些相对适合进行分布式计算的程序)的开发和普及。集群中的网络传输速率的提高。技术的推广和普及发展的趋势目前的情况未来的发展2003年统计数据(一)年统计数据(一)2003年统计数据(二)年统计数据(二)2003年统计数据(三)年统计数据(三)2003年统计数据(四)年统计数据(四)未来的发展(一)未来的发展(一)w64位系统逐渐成为主流w种商业化的高速互连网络wSAN系统作为集群的存储设备w科学计算a大规模模拟应用a三维网格模拟
13、应用所需的内存可以轻易突破2GBa生物信息学a基因拼接等应用需要大量的内存,实际应用中内存不足是主要问题之一a素数运算a需要用到大量64位整数运算和大内存未来的发展(二)未来的发展(二)w商业应用a海量数据处理aDB in memorya媒体播放服务器a大内存a高内存带宽a减少访问磁盘次数,可将性能提高近一个数量级w引发新的设计理念w现有的很多算法是基于内存不足设计的,因此很多精力花费在用时间换取空间上w64位系统提供了访问更大内存的机会,因此很多应用可能要基于新的理念进行设计,以获得64位所带来的好处w并非所有用户都需要现在就转向64位w代码膨胀,性能反而可能会下降w需要根据自己的应用特性来
14、分析w是否需要2GB以上的内存w是否有大量64位整数运算题外话题外话w2003年一年,全美总计被淘汰的pc数量是4000万台,这些pc不是因为部件损坏,而是因为性能的落后而被淘汰。w中国2004年淘汰的pc数量为350万台。w。wPc电脑的平均生命周期从20世界末的5年到现在3年,性能的不断提高,造成了许多电子资源的浪费。w由于被淘汰的pc很多没有被很好的处理,这些pc不光造成了资源的浪费也成为电子污染物。w设想!如果你可以通过两台性能一般的电脑来达到一台性能很强的电脑,这样的方式是否可以比较好的解决这样的局面,所以集群计算机技术有其非常强大的优势。合理地普及这样的技术,可以节省很多的资源,并
15、且提高pc利用率。结束语结束语w高性能计算集群综合了多台计算结或节点的计算能力,集群的存储空间在各个节点上聚集了巨大的资源。通过一种有效的方式来开发和利用这些分布式的资源,我们可以将可以开发出超高性能的计算机系统。而使用何种方式来有效的利用这些资源成为了集群系统发展中的一大挑战。w随着科技的不断发展,集群系统和专用的并行计算机之间的差距会越来越小,而集群系统又比专用并行计算机有着更多的优点,这是一种更为经济的方法,并且一定意义上可以充分利用那些已被淘汰的计算机,不但减少了很多污染还节省了很多资源。w不能发现,不久的将来,集群计算机必将成为未来的超级计算机,也必然将成为未来高性能计算机的主角。收
16、获和不足收获和不足w收获:w通过这次论文,对论文的格式规范和行文要求有了一定的了解,为以后的论文撰写作了准备。w通过对集群系统的学习,对集群系统有了一个全面的了解,扩展自己的知识面。w在整个论文的过程中,经过资料的整理,提高了自己的学习和搜索能力。收获和不足收获和不足w不足:w选题的时候不够慎重并且目的性不明确,导致了最后由于面太广成了科普文。并不像学术论文。w资料的来源要找最新的学术文章,避免找老资料,因为技术和学科都会变化。w要多和其他的同学,老师交流,可以得到很多宝贵的建议。w由于条件不允许缺少实践和实验。w因为最后修改得比较仓促,所以可能有些排版的问题。参考文献参考文献w参考文献w张晨曦等 计算机体系结构(第二版)w等搜索网站w集群系统发展趋势郑纬民 清华大学计算机系高性能所致致 谢谢 谢谢大家!Any question?