《集群系统发展趋势.ppt》由会员分享,可在线阅读,更多相关《集群系统发展趋势.ppt(32页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、集群系统发展趋势郑纬民清华大学计算机系高性能所计算机科学与技术系Department of Computer Science and TechnologyTOP 500(2003年11月)中的集群 计算机科学与技术系Department of Computer Science and TechnologyTop500中的集群系统(节录)资料来源:www.top500.org,2002年11月数据,共有93个集群系统进入Top500排行。计算机科学与技术系Department of Computer Science and TechnologyTOP 500(2003年11月)中的集群 计算机科
2、学与技术系Department of Computer Science and TechnologyTOP 500过去10年体系结构演化计算机科学与技术系Department of Computer Science and TechnologyTOP 500过去10年体系结构演化计算机科学与技术系Department of Computer Science and Technology从TOP500看集群系统n在高性能计算领域,集群系统已经成为主流的系统结构,并将进一步扩大其所占份额n在Top10中,集群结构占了7个,说明在构建超大规模计算系统的时候,集群是主要的系统构成方式计算机科学与技术系
3、Department of Computer Science and Technology集群系统的发展趋势n64位系统逐渐成为主流n多种商业化的高速互连网络nSAN系统作为集群的存储设备计算机科学与技术系Department of Computer Science and Technology64位:突破2GB的系统内存瓶颈n科学计算n大规模模拟应用n三维网格模拟应用所需的内存可以轻易突破2GBn生物信息学n基因拼接等应用需要大量的内存,实际应用中内存不足是主要问题之一n素数运算n需要用到大量64位整数运算和大内存计算机科学与技术系Department of Computer Science
4、 and Technologyn商业应用n海量数据处理nDB in memoryn媒体播放服务器n大内存n高内存带宽n减少访问磁盘次数,可将性能提高近一个数量级64位:突破2GB的系统内存瓶颈计算机科学与技术系Department of Computer Science and Technology64位:新的设计理念n引发新的设计理念n现有的很多算法是基于内存不足设计的,因此很多精力花费在用时间换取空间上n64位系统提供了访问更大内存的机会,因此很多应用可能要基于新的理念进行设计,以获得64位所带来的好处计算机科学与技术系Department of Computer Science and
5、Technology64位:不是万能灵药n并非所有用户都需要现在就转向64位n代码膨胀,性能反而可能会下降n需要根据自己的应用特性来分析n是否需要2GB以上的内存n是否有大量64位整数运算n如果上述问题的答案都是否,那么不一定能够从64位系统中得到预期的好处n某些应用可以从特定的64位处理器获得很大的性能提高,但这不是64位本身的特性,而是依赖于特定处理器,需要具体分析实际情况计算机科学与技术系Department of Computer Science and Technology集群系统的互连网络n评价互连网络的指标n延迟n带宽n功能支持n价格计算机科学与技术系Department of
6、Computer Science and Technology集群系统的互连网络InterconnectInterfaceMPI Latency(us)Uni-directional Bandwidth(MB/s)说明GB EtherPCI 30-50100最便宜MyrinetPCI-X6248SCIPCI1.4326延迟最小Quadrics IIIPCI5340InfiniBand 4xPCI-X7.5805带宽最高计算机科学与技术系Department of Computer Science and Technology集群系统的互连网络n功能支持n都支持MPI,除GB Ethernet外
7、都实现了高效率的通信协议nSCI和Quadrics还提供了共享内存的支持,但是其远程通信延迟仍然在us数量级,对于细粒度的共享内存程序,仍然无法很好地支持(对比SGI Altrix系列的远程访问延迟在200ns以下)计算机科学与技术系Department of Computer Science and Technology集群系统的互连网络n主要运行粗粒度并行程序的小规模集群系统用户,可以使用千兆以太网进行互连n大规模集群系统中,千兆以太网很可能成为系统瓶颈,宜选取专用高速网络互连nInfiniBand因其规模效益,可能成为将来的主流互连设备计算机科学与技术系Department of Com
8、puter Science and Technology网络存储-可靠高效的存储方案n用户对存储的需求n可管理性:存储资源的一致管理,可扩展性n高性能高带宽,并行文件访问n可靠备份,快照,镜像n高性价比计算机科学与技术系Department of Computer Science and Technology资源管理(1)本地存储方案计算机科学与技术系Department of Computer Science and Technology资源管理(2)网络存储方案计算机科学与技术系Department of Computer Science and Technology可扩展性(1)计算机科
9、学与技术系Department of Computer Science and Technology可扩展性(2)计算机科学与技术系Department of Computer Science and Technology可管理性拥有成本对比计算机科学与技术系Department of Computer Science and Technology高性能SAN的读带宽计算机科学与技术系Department of Computer Science and Technology高性能-并行文件系统n并行文件系统n支持多台主机对同一个磁盘分区进行同时读写n现有的并行文件系统nLustrenPVFS2
10、nGPFSnCXFS计算机科学与技术系Department of Computer Science and Technology可靠性备份计算机科学与技术系Department of Computer Science and Technology可靠性镜像计算机科学与技术系Department of Computer Science and Technology可靠性快照计算机科学与技术系Department of Computer Science and Technology高性价比n现有的SAN解决方案非常昂贵n清华大学计算机系高性能所开发的SAN解决方案拥有全套软件解决方案nFC-SAN
11、nIP-SANn备份,镜像,快照n完整的管理工具n已在胜利油田等部门得到实际应用计算机科学与技术系Department of Computer Science and Technology集群系统所面临的挑战n能耗问题n不仅仅是集群系统的问题n从芯片,单机和集群系统等多个层次来共同解决这个问题n管理性n监控n自我修复n管理信息的过滤与提取n分区计算机科学与技术系Department of Computer Science and Technology集群系统所面临的挑战n程序开发与优化问题nCluster OpenMP?nMPI 2会有更好的性能?n如何更好地利用多个层次的并行性,MPI-OPENMP 混合编程还是仅用MPI?nCore内的指令级并行nCore之间的并行nSMP内不同CPU的并行nSMP节点间的并行计算机科学与技术系Department of Computer Science and Technology总结n集群系统已经得到广泛接受,成为高性能计算机的主要体系结构n64位处理器,高速互联网络和SAN系统使得集群系统的能力更加强大,是今后一段时间集群系统的发展趋势n能耗、可管理性和程序开发问题是集群进一步发展所面对的挑战。谢谢!