《云计算产品与技术方案分析报告范本.docx》由会员分享,可在线阅读,更多相关《云计算产品与技术方案分析报告范本.docx(23页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、云计算产品及技术方案分析报告北京邮电大学网络与交换技术国家重点实验室2010年11月19日目录1 引言 当前,云计算技术成为IT领域的研究热点。目前的云计算产品和技术方案层出不穷,国内外研究机构、IT软硬件厂家、标准化组织、开源软件组织都在十分积极的推出云计算产品和技术解决方案。本报告在学习和了解相关云计算技术资料、产品白皮书以及软件手册的基础上,希望对现有产品和技术解决方案给予归纳、整理和分析,实现对各类产品的清晰认识,以便于选择和使用。2 云计算产品分类 云计算产品大体分软件和硬件产品两大类。其中硬件产品是主要依赖于大型服务器设备的提供商实现的面向云特征的具有分布式并行计算能力的设备,代表
2、有IBM、SUM、曙光机等。软件产品是云计算产品的主流,包括虚拟机管理平台、数据存储平台、分布式计算平台等,主要有的平台有Google应用软件引擎(Google App Engine)、微软的Azure平台、亚马逊网络服务(Amazon AWS)、IBM蓝云、Platform Computing的ISF以及VMware的云产品。同时,国内的友友系统和美地森公司在云存储方面也走在了云技术发展的前沿。 3 国外的主流产品 从Google提出云计算技术,到现在,国际上几乎所有一线的IT企业都积极参与进入这块新兴领域,并依据自己传统的技术领域和市场策略提出自己的云计算架构。他们通过深挖技术基础,把大量
3、以前的产品和技术的云计算特征挖掘出来,如软件的虚拟化、分布式存储系统,在此基础上建立自己的云计算产品线。3.1 Amazon云计算方案3.1.1 介绍专业IT企业提供的云计算多多少少会限制在自己提供的系统之上,亚马逊公司不是IT系统制定者而是应用者,所以Amazon平台是开放的。技术特征:弹性虚拟平台核心技术:虚拟化技术Xen企业服务:EC2 S3 SimpleDB SQS开源情况:开源3.1.2 Amazon Web Services(AWS)平台类型:PaaS IaaS SaaS虚拟化技术:Xen支持语言:多种语言运行环境:位于云端的Amazon平台 应用程序间的隔离:不同的应用运行在不同
4、的虚拟机实现隔离开发限制:较少(支持所有操作系统、开源代码或商业软件)可扩展性:手动或通过编程自动增加所需要虚拟机数量计费方式:按实际使用量付费(EC2计算服务0.10.8美元/小时,S3存储服务每GB大约0.15美元/月) 收费机制较复杂 有免费体验(EC2 今年11月1日可以申请一年免费体验)服务类型:任意选择服务组合,服务耦合度低实现功能:较多3.1.3 弹性计算云EC2服务类型:IaaS虚拟机的使用:用户根据需要设置虚拟机的硬件配置模型:1个AMI+若干实例(每个用户最多20个实例)容错机制:弹性IP地址(与用户账号绑定) 当正在使用的实例出现故障,用户只需将弹性IP地址重新映射到一个
5、新的实例 易用性:稍差(Amazon提供模块供用户组建自己的程序)运行环境:用户自行提供运行程序所需的AMI(Amazon机器映像)构建自己的服务器平台灵活性:很好 允许用户对运行的实例数量和类型自行配置 允许用户选择实例运行的地理位置安全性:很好 基于密钥对机制的SSH方式访问 可配置的防火墙机制 允许用户对其应用程序进行监控适用的应用程序:任意3.1.4 简单存储服务S3概述:架构在Dynamo之上,提供一个字节到数GB字节的支持,大概有520亿对象。结构:桶对象 两级模式扩展性:增加桶中的对象数量进行扩充 手动或编程自动扩容容错性:冗余存储 数据监听回传 Merkle哈希树存储限制:对象
6、(5GB)桶(100个/用户) 不限制桶中对象的个数数据交互:用户从获得授权的对象中取得数据数据缓存:对Master中元数据进行缓存数据一致性:最终一致性模型 后一次操作直接覆盖前一次操作安全性:身份认证(基于HMAC-SHA1的数字签名) 访问控制列表负载均衡数据恢复3.1.5 数据库服务SimpleDB概述:非传统的关系模型系统结构:域条目属性值 四级模式查询语言:支持有限的SQL 数据类型:结构化数据可扩展性:超级可扩展性查询功能:查询结果只包含条目名称不包括相应的属性值 相应时间不能超过5秒,否则报错安全策略:每一个容器数据在微软数据中心有多个备份 数据更新时间:有延迟 新数据复制到其
7、他服务器上存在延迟其他功能:很少 没有事务(Transaction)的概念 不支持Join操作 实际存储的数据类型过于单一(所有的数据都以字符串形式存储)备注:用户相对大的数据存储在S3中 SDB中只保存指向某个特定文件位置的指针3.2 Google云计算方案3.2.1 介绍建立在其搜索引擎技术的基础上,是一个没有“端”的系统:用户通过一个简单的搜索框完成对海量计算的搜索技术特性:存储及运算水平扩充能力核心技术:平行分散技术MapReduce,BigTable,GFS企业服务:Google App Engine开源情况:不开源3.2.2 Google App Engine平台类型:PaaS(用
8、户在其上开发软件,在Google基础设施上运行,无需服务器维护)应用服务器:Python应用服务器群 低端服务器虚拟化技术:没有应用支持语言:只支持Python、Java运行环境:Google提供在云端的应用程序环境 功能完整的本地开发环境,开发人员可以在本地模拟Google App Engine环境应用程序间的隔离:通过沙盒实现(同时也给程序员带来很多限制)开发限制:较多 开发语言支持少 沙盒的使用带来的限制可扩展性:自动扩充所需资源并进行复杂均衡计费方式:每一个Google账户有一定额度的免费流量和空间支持 存在收费项目服务类型:所有服务捆绑在一起,耦合度高用户通过特定API来使用相应服务
9、实现功能:较少3.2.3 计算服务MapReduce服务类型:PaaS虚拟机的使用:没有应用模型:1个Master+若干Worker(分别执行map和reduce)容错机制:Master周期设置检查点,任务失败,从最近的检查点恢复并重新执行 Master失效,整个MapReduce重新运行 Worker失效,其任务调度到其他Worker重新执行通用性:很好运行环境:Google自身提供,用户无法自行调配灵活性:稍差(现只是搜索企业的选择)适用的应用程序:可以并行处理的程序3.2.4 存储服务GFS(Google File System)概述:面向不可信服务器节点的分布式文件系统,文件分块存储结
10、构:1个Master(储存元数据)+众多ChunkServer(储存文件块)服务器:大量分散的普通廉价服务器扩展性:动态插入节点(ChunkServer)(普通电脑),自动扩容容错性:ChunkServer冗余备份(3份) Master瘫痪,有Shadow作为替补访问效率:高效 通过GFS上层的BigTable实现存储限制:无特别限制数据交互:一般情况下,Application 和ChunkServer在同一台服务器上Application与ChunkServer进行数据交互 可以被多个用户同时访问数据缓存:对Master中元数据进行缓存数据一致性负载均衡数据恢复备注:不完全适应海量小文件存储
11、3.2.5 数据库服务Data Store概述:分布式存储数据库,随着应用程序访问量的增加而增加系统结构:Model实体组实体 三级模式查询语言:GQL数据类型:结构化和半结构化数据可扩展性:无限扩展查询功能:查询结果以Model类的实例形式来返回实体 返回的结果不能超过1000条事务功能:通过乐观锁定实现事务的并发控制 一个事务操作一个实体组,同一组内的实体存储在一起(应用程序可以在实体创建时将实体分配到组) 数据库在一个事务中执行多种操作,有一个操作失败则回滚整个事务数据更新时间:有延迟,但不是常态3.3 Mirosoft云计算方案3.3.1 介绍“云+端”云计算构想最新的Windows
12、Server被设计成可让应用在数据中心和云之间迁移,但是只有在两者是非常相似的Windows Server环境下才可以实现。技术特性:整合其所用软件及数据服务核心技术:大型应用软件开发技术企业服务:Azure平台开源情况:不开源3.3.2 Windows Azure平台类型:PaaS虚拟化技术:Hyper-V支持语言:C#,.NET平台,PHP,Python等多种语言运行环境:支持在云中和本地系统中的应用程序服务类型:可以任意选择服务组合,耦合度低应用程序间的隔离:不同的应用在不同的虚拟机上开发限制:较少计费方式:按实际使用量付费 存储与计算分开计费 定价机制过于僵硬,成本过高可扩展性:需要手
13、动或者编程自动增加所需要的虚拟机数量 用户也可以选择增加虚拟机的功率实现功能:较多3.3.3 计算服务服务类型:PaaS虚拟机的使用:根据用户上传的配置文件XML,系统自动分配、配置虚拟机 虚拟机分为Web和Worker角色模型:若干Web(提供Wen服务,与用户交互)+若干Worker(类似于Windows服务)运行环境:程序运行在系统自动为用户生成的装有Windows Server 2008的虚拟机上负载均衡:当有用户请求时,根据需决定是否运行新的Web角色 根据负载大小自动扩展或减少Worker上实例运行的数量灵活性:较好易用性:较好适用的应用程序:任意可在Windows Server2
14、008上运行的程序尤其支持运行有大量并行用户的大型应用程序 3.3.4 存储服务Blob/Table存储概述:用来存储大型数据对象结构:容器Blob两级模式(Blob中的数据再分成Block) TablePartition(分区)Row(实体)扩展性:增加容器中的Blob数量进行扩充 手动或编程自动扩容容错性:冗余备份 只传输出错的Block访问效率:Blob访问控制策略 Table分成多个分区,存储在多个服务器,提高访问效率 存储限制:Blob的大小有限制(50GB) 对容器和Blob的数量没有限制数据交互:用户从获得授权的Blob中取得数据数据缓存:Table相同分区的实体存储在一起进行高
15、效缓存 数据一致性:Timestamp(时间戳) 单表一致性(事务性的快照隔离) 跨表一致性 负载均衡:数据恢复备注:Blob适宜存储无结构数据 Table适宜存储结构性很强的数据 另有:Queue存储应用程序各个部分之间的交互信息(例如Web和Worker的通信)3.3.5 数据库SQL服务(SDS)概述:非传统的关系模型系统结构:Authority容器实体 三级模式(ACE模型)查询语言:SQL数据类型:结构化、半结构化和非结构化数据可扩展性:全球可扩展性查询功能:查询对象为容器查询结果返回若干数量的实体 返回的结果不能超过500页安全策略:每一个容器数据在微软数据中心有多个备份 数据更新
16、时间:没有延迟其他功能:很多3.4 IBM蓝云3.4.1 概述高端服务器战略(X86刀片服务器)为用户在自己已有的IT环境中建立自己的私有云,并提供与公有云的无缝连接;同时,IBM也提供可供用户及合作伙伴直接使用的云服务和软件技术特性:整合其所有软件及硬件服务核心技术:网格技术、分布式存储、动态负载企业服务:虚拟资源池提供,企业云计算整合方案开源情况:不开源3.4.2 云计算架构3.4.3 云计算相关产品 IBM WebSphere CloudBurst 云环境管理工具,以物理器件形式发布,即插即用, WebSphere CloudBurst使用户能够在“私有云”中轻松的创建、安全的部署和管理
17、应用环境,同时让用户将自己在SOA方面的投资无缝的扩展到云服务环境。 WebSphere Virtual Enterprise 软件解决方案,对中间件和应用栈进行虚拟化,为应用创建一个共享的应用云或是共享的资源池而不必考虑特定的应用容器,并实行负载均衡和资源调度。 XIV IBM的新一代云存储产品,基于网格技术,具有海量存储设备+大容量文件系统+高吞吐量互联网数据访问接口+管理系统的设计特征。内置虚拟化技术,快照功能,瞬间克隆数据卷。帮助用户部署可靠、多用途、可用的信息基础结构,同时可提升存储管理、配置,以及改进的资产利用率。3.5 Platform云计算方案3.5.1 介绍在HPC方面有很强
18、的技术力量,建立在网格计算管理软件的基础上3.5.2 Platform ISF(Infrastructure Sharing Facility)计算服务平台类型:IaaS端到端的私有云管理软件 主要特点:可配置程度高资源整合:将分布式和异构IT资源整合 从众多异构服务器、存储设备以及互联中创建一台共享计算机 支持主要行业的标准硬件支持的操作系统:Linux Windows虚拟技术:VMware ESX,Xen,Citrix XenServer,Microsoft Hyper-V和Red Hat KVM服务类型:很多即开即用的第三方工具(目录服务、安全、监控和报警)交付服务:自主入口用户在几分钟
19、(30万次IPOS每秒延迟:20微秒数据备份:支持虚拟机集中式脱离主机备份 支持虚拟机的增量、差异和完整映像备份和恢复 为Windows和linux虚拟机提供文件级备份支持可用性:拥有经济有效的适用于所有应用的高可用解决方案当服务器故障时,自动重新启动虚拟机容错性:使用DRS和VMotion(在线迁移虚拟机)消除计划内宕机在不同的主机上同步运行相同的虚拟机 出现硬件故障,所有虚拟机均可实现零宕机时间、零数据损失故障切换数据恢复:通过vCenter实现集中式管理 虚拟机的无代理、基于磁盘的备份和恢复 支持虚拟机、文件级别的恢复安全性:API通过检查与管理程序一起使用的虚拟组件来保护虚拟机 动态防
20、火墙策略 动态安全容量 安全策略自动适应网络重新配置或升级可扩展性:根据需要和优先级调整容量 热添加CPU和内存 热添加和删除存储设备和网络设备 热扩展虚拟磁盘 以零宕机时间横向扩展虚拟机3.6.3 云存储服务EMC Atoms特色:采用基于策略的管理系统来创建不同层次的云存储重要数据,多份复制,分布存储不常用数据,复制份数和存储地点较少不再使用的数据,压缩,复制备份在更少的地方为非付费用户和付费用户创建不同的服务级别多样的管理服务:复制,版本控制,压缩,重复数据删除,磁盘休眠等可用性:应用程序接口包括Rest和Soap,能够整合所有的应用程序多租户:支持多客户共享功能,同一基础架构执行多种应
21、用程序,并被安全隔离现有版本:120TB 240TB 360TB 基于X86服务器并支持千兆或10GbE以太网连接4 国内云存储产品4.1 美地森概述:分布式存储,网络容错,集群存储结构:元数据服务器MDS+块数据服务器CDS 文件分块存储(每一块大小固定在50MB)服务器:低成本、符合工业标准的通用硬件设备(Linux系统)扩展性:动态插入节点,无需复杂配置 自动在线扩容(几秒) 容量与节点成线性增长关系容错性:CDS冗余备份(3份) 存在35台MDS,保存相同元数据,同一时间只有一台工作,一旦瘫痪,备用的立即替补通用性:通过NAS集群网关的方式为Windows、Linux、Unix、Mac
22、等操作系统提供NFS协议访问接口 兼容所有操作系统平台易用性:单一名字命名空间 所有应用服务器看到所有的文件访问效率:每秒数十万个文件查询 同时多条数据通道读写数据存储限制:PB级存储空间数据交互:用户与CDS进行数据交互数据缓存:对MDS中元数据进行缓存负载均衡:自动进行负载均衡数据恢复:本地数据存储两份,自动恢复 2TB数据恢复时间15min备注:不完全适应海量小文件存储 实时性? 局域网内,100台服务器左右,异地备份?WSS?4.2 友友系统4.2.1 DataCell介绍DataCell能够有效地解决业务系统在运营过程中收集和产生的大量实时数据以及企业在长期的业务发展过程中积累下来的
23、海量数据的存储和处理系列问题,尤其面对PB数量级的数据容量和上亿个存储文件的处理需求时,在降低整体成本提高系统整体可用性上可以发挥突出作用。虚拟技术:采用扩容性:在新加入的硬件上安装DataCell,即可加入虚拟存储机可移植性:DataCell软件具有高度的可移植性,没有实际系统软硬件的限制数据传输:结合数流平台(Bitsflow),高效4.2.2 DataCell FS非结构化存储系统针对非结构化数据架构:1个控制节点(存储元数据等)+ 若干的存储节点(细分为各存储块)可扩展性:热部署(TBPB更高级别的平滑扩展),性能线性增长灵活性:基于业务策略自动切分数据进行存储(存储块的大小是不固定的
24、) 用户可以通过定义策略来实现让适当的数据在适当的时间自动保存在适当的位置虚拟技术:将用户所使用的各类存储硬件无缝虚拟化多租户:同一存储结构服务于多个应用程序,数据分区隔离容错性:冗余备份 热备控制节点数据恢复:自动检测故障节点 自动恢复访问效率:支持并发访问 用户可为云服务构建自定义查询负载均衡:所有系统节点间透明地移动数据 自动动态调整数据备份数安全性:访问控制权限应用程序访问机制:支持NFS 、HTTP、WebDAV、FTP及FUSE等多种接口 应用程序可以不做修改即可迁移数据平台4.2.3 DataCell DB结构化数据存储系统针对结构化和半结构化数据解决了目前通用关系型数据库在面对
25、multi-TB或PB量级结构化数据的存储和处理需求时出现的性能和容量瓶颈问题不完全支持关系数据库,但支持常用的关系操作(select、insert、delete、update)架构:完全无中心节点的分布式系统 逻辑环容错性:相邻节点互为热备份 简单快捷的数据导出工具 自定义冗余策略可扩展性:热部署存储机制:支持用户自定义的各种数据格式 同时支持内存和磁盘数据库访问效率:在内存存储模式下,多进程并发随机读写支持超过20万次/秒 尤其适用于海量小文件存储与访问的应用场景支持语言:C+ 、Java其他功能:l 支持包括哈希表、树、数组在内的多种内部结构l 支持包含内存、硬盘、网络存储等多种不同存储
26、机制l 基于策略的的数据存取方式,支持包括冗余数和存储位置等在内的自定义策略l 支持数据表操作类似的查询机制和简单的条件查询l 支持用户定义的记录类型和数据字典l 支持事务处理l 支持复杂的索引规则l 异步存储拷贝,支持snapshotl 提供binary log,支持服务器热备和冗余l 完全支持多进程、多线程的高并发访问l 支持分布式事务l 远程图形化管理界面4.2.4 其他相关产品 数流平台(Bitsflow)高容错、高性能的数据传输中间层工具 DataCell Echo有效实现跨区域、异构分布式数据库的实时数据同步。它可以同时处理同一系统内的多个异构数据库系统之间的数据交换和同步。通过对
27、各个数据库系统内数据的动态划分和管理,Echo还可在一个或多个数据库中支持多个Master和Slave并存5 几种开源云平台5.1 Hadoop(Apache基金会)完全模仿Google体系架构做的一个开源项目,主要包括Map/Reduce和HDFS文件系统。Java语言开发,主从式的HDFS文件系统位于下层,主从式的Map/Reduce处理位于上层,基本思想是“计算向存储迁移”计算时各节点读取存储在自己节点的数据进行处理。Map处理过程中一般没有数据的传输,只是在Reduce过程中需要向主节点传送计算结果,有效的解决了并行计算中网络数据传输的瓶颈问题。HDFS以64MB为单位对文件分块,对于
28、小文件及频繁存取的数据没有太大的优势。5.2 Ecualyptus项目(加利福尼亚大学)创建了一个使企业能够使用它们内部IT资源(包括服务器、存储系统、网络设备)的开源界面,来建立能够和Amazon EC2兼容的云。选择Xen和KVM作为虚拟化的管理程序。基本架构:5.3 AbiCloud(Abiquo公司)用于公司的开源的云平台,使公司能够以快速、简单和可扩展的方式创建和管理大型、复杂的IT基础设施(包括虚拟服务器、网络、应用、存储设备等)5,.4 MongoDB(10gen)高性能、开源、无模式的文档型数据库,在许多场景下可用于替代传统的关系型数据库或键/存储方式5.5 Enomalism
29、弹性计算平台提供了一个功能类似于EC2的云计算框架。Enomalism基于Linux,同时支持Xen和KVM。与其他的纯IaaS解决方案不同的是,Enomalism提供了一个基于Turbo Gears Web应用框架和Python的软件栈5.6 Nimbus(网格中间件Globus)Nimbus面向科学计算需求,通过一组开源工具来实现IaaS的云计算解决方案6 国内外主要云计算标准化组织和论坛6.1 分布式管理任务组(DMTF)工作目标:2009年,成立DMTF开放式云标准孵化器(DMFT Open Cloud Standards Incubator),制定开放式云计算管理标准。 另有:开放式
30、虚拟化格式(OVF),云可互操作性白皮书DMTF等成员:AMD CISCO EMC HP IBM Microsoft Sun Redhat VMware等6.2 开放网格论坛(OGF)工作目标:开发管理云计算基础设施的API,创建能与云基础设施(IaaS)进行交互的实际可用的解决方案等。成员:Microsoft Sun Oracle IBM Intel HP AT&T等6.3 结构化信息标准促进组织(OASIS)工作目标:致力于基于现存标准Web Services、SOA等建设云模型及轮廓相关标准。最近成立云技术委员会IDCloud TC,定位于云计算中的识别管理安全。6.4 全国信息技术标准
31、化技术委员会SOA标准化工作室工作目标:云计算标准研究报告,开展云计算、相关SOA、中间件、虚拟化等技术标准的制定成员:IBM、大唐软件、东方通、浪潮、北邮、复旦,世纪互联等6.5 其他 中国云计算技术与产业联盟 云计算互操作论坛(CCIF) 网络存储工业协会(SNIA)等7 相关对比分析Google App Engine没有使用虚拟化技术,其云计算理念是与主流公司的战略是相反的,其现阶段提供的平台虽然可以为用户提供现成的在线的应用套件,但还受到很多的限制,其中支持的编程语言(只支持Java和Python)太少就是其很大的劣势。而且,由于没有本地端,应用程序只能通过提供的网址抓取和电子邮件服务
32、访问互联网中的计算机,这也给用户带来一定的不便。同Google一样,Amazon的产品在国内没有销售。但值得一提的是Amazon作为电子商务公司,它的云平台的安全性做的很出色,对于平台的配置上也给了用户更多的选择权。另外,Amazon自己作为应用者,其平台具有高度的开放性,支持所有的操作系统、开源代码或者商业软件。但是,Amazon有一些特殊的存储要求,需要考虑应用所需的带宽大小和计算时间。微软的云平台最大的特色是它的“云+端”思想,Azure服务平台既可以在云端下被调用,也可以被本地系统调用,也就是说用户可以在VS.NET2008以上的版本+Cloudservice+AzureSdk下实现云
33、计算开发。但总体上来说,微软云平台的软件过于“Microsoft化”,对于其他公司产品的兼容性较差,例如不支持Java(好像)。从应用上看,EC2主要是吸引资源密集型软件,如企业应用等,而Azure的应用主要是服务于LAN或工作组模式的用户群体。VMware的云计算的核心是虚拟化,虚拟架构技术做的很好,但是开放性弱,不支持特定开发。Platform在HPC领域有着很强的技术力量,正将自身定位从网格计算过渡到云计算,它在国内的应用有北京超算中心,但是超算中心主要以数学计算为主,数据量比较小,计算的种类也相对集中,参考性不大。IBM的ComputingonDemand主要针对高性能计算,诸如汽车和航天工业模拟计算、生命科学领域的染色体组建模等等。并且,它的定位是高端服务器,相比与其他公司的方案,性价比难说。从云存储方面看,国内的两个公司均做的很出色。但友友系统有一个明显的优势:它的DataCell DB尤其适用于海量小文件存储与访问的应用场景。这是其他的文件分块存储系统所不具备的。