《云计算毕业设计.pdf》由会员分享,可在线阅读,更多相关《云计算毕业设计.pdf(50页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、-1-摘 要【中文】本毕业设计的技术特点是企业内部云计算系统的组建。企业的计算中心或数据中心可以将防火墙内的IT 资源以云计算的形式为企业内部提供服务,这就是企业内部私有云,并且根据运行状况,可以考虑将企业的剩余资源运行在外部云上提供给外部的客户,从而取得收益。本设计实现云计算的关键是Hadoop,通过将服务器集中,使数据中心几百上千的服务器,可以并行计算分布存储。本毕业设系统的搭建对企业IT 系统的升级换代、合理利用企业IT 设备、降低企业IT 成本具有重要的作用。关键词:云计算、搭建企业内部私有云、云平台系统-2-目录摘 要【中文】.11 引言.42 认识云计算.52.1 什么是云计算.5
2、2.2 云计算的兴起.62.3 云计算的发展.72.4 云计算的特点.10 3 云计算架构.11 3.1 云计算基础原理.11 3.2 云计算模式下的网络.12 3.3 云计算基础架构.13 3.3.1 云计算实现机制.13 3.3.2 云计算服务层次.15 3.3.3 云计算技术层次.16 3.4 云计算应用.17 3.4.1SaaS(软件即服务).17 3.4.2 平台即服务.18 3.4.3 按需计算(Utility Computing).18 3.5 云计算对企业的影响.20 3.6 典型云计算平台.21 3.6.1 Google File System 文件系统.22 3.6.2 M
3、apReduce 分布式编程环境.24 3.6.3 分布式大规模数据库管理系统BigTable.25 3.6.4 Google的云应用.26 4 内部云(私有云).27 4.1 私有云的定义.27 4.2 创建私有云的几种模式.28 4.3 企业所面临的问题.29 4.4 私有云的优势.30 4.5 私有云 VS公有云.31 5 企业内部私有云平台的搭建.32 5.1 系统设计.33 5.1.1 系统整体架构.33-3-5.1.2 系统功能分析.34 5.1.3 系统工作流程.35 5.2 认识 Hadoop.36 5.2.1 Hadoop 简介.36 5.2.2 前提和设计目标.36 5.3
4、 Hadoop 安装说明 Cloud Computing.38 5.3.1 Hadoop 安装步骤.38 5.3.2 遇到的问题.46 5.4 成果截图.47 总结.52 致谢.54 参 考 文 献.55-4-1 引言2009年,企业面对几十年来最具挑战性的IT 环境。IT 组织将不得不与各种不利条件短兵相接,例如IT 预算削减、高度复杂的分布式计算环境以及金融衰退之下用户不断提高的要求和期望值。而这时云计算时代正扑面而来。云计算是当前 IT 业界最炙手可热的技术,就像10 年前的 Internet一样,云计算是目前IT 业界公认的互联网进化的下一阶段。目前美国各大 IT 厂商纷纷进入这一领域
5、,推出自己的产品,并参与制定标准,有的已经开始取得收益,比如IBM、EMC、Vmware、Cisco、亚马逊、谷歌、微软等。云计算主要是把IT 资源转化成一种动态分配的按需索取的服务。现在公认的主要有SaaS,PaaS,IaaS,即软件做为一种服务,平台作为一种服务,基础设施作为一种服务。与 IT 厂商热衷于云计算的推进不同,在用户眼中,云计算更多地被看作是中小企业的福音,因为这种按IT 的实际需求采购软硬件和服务的模式非常适合IT 基础建设程度不高,并且IT 预算有限的企业。但对于那些已经过多年IT 建设,信息化程度较高的大型企业而言,他们对于将自身主业务系统运行在云计算上持怀疑态度。于是,
6、一种构建在企业内部的云计算模式被提出。本设计的技术特点是企业内部云计算系统的组建。终端用户端来看,用户可以随时随地按需索取需要的 IT 资源,以运行自己的应用程序计算,而不需要了解内部复杂的实现。而云端本身可以动态地分配各种IT 资源,随时动态地扩展或增加资源,而不影响客户的应用。目前许多大型 IT 厂商纷纷推出自己商业化的产品,为的是在云计算领域分一杯羹。他们的产品一般互操作性不好,价格昂贵,用户受制于一家厂商。在企业内部组建云计算系统可以带来以下好处:首先降低了投资成本,产品本身是免费的,从而可以为企业节省开支。比如服务器虚拟化,VMware 的产品需要license,一个 license
7、需要几百美元。由于源代码是开放的,可以灵活配置,按照客户的环境定制,提高效率;另一个好处是门槛比较高,可以增加竞争优势。美林证券估计全球云计算的市场在1000 亿美元以上。国内的市场和企业也必须跟上市场和技术的潮流。十几年前国内企业Intranet和 Internet的起步就比国际晚了约 5 年,现在已逐步赶上。目前云计算正像当年的Internet一样方兴未-5-艾,而国内企业经过 10 年 Internet的实施经验和教育,在应用互联网技术方面已经有了长足的发展,提高了企业内部信息的流动和使用效率。众多企业利用internet技术实现 B2B,从而扩大了产品销售,增加了订单,打开了市场。所以
8、企业已经认清了互联网技术带来给企业信息化的好处,必然能够更快速的接受这种新技术,与国际接轨。本设计的目标是整合企业内部的IT 资源,移植和虚拟化老的应用及新的应用,为企业量身定做一个适合自己需要的基于开放源代码的企业内部云计算模式。企业内部云计算有些类似10 年前的 Intranet及企业内部网,现在绝大多数企业已经建立了Intranet,越早进入市场,就越容易取得先机。2 认识云计算2.1 什么是云计算什么是云计算(Cloud Computing)?云计算是一种基于互联网的超级计算模式,在远程的数据中心里,成千上万台电脑和服务器连接成一片电脑云。因此,云计算可以让你体验每秒10 万亿次的运算
9、能力,拥有这么强大的计算能力,可以模拟核爆炸、预测天气变化和市场发展趋势。用户通过电脑、笔记本、手机等方式接入数据中心,按自己的需求进行运算。云计算是一种商业计算模型。它将计算任务分布在大量计算机构成的资源池上,使各种应用系统能够根据需要获取计算力、存储空间和信息服务。云计算是对分布式处理(Distributed Computing)、并行处理(Parallel Computing)和网格计算(Grid Computing)及分布式数据库的改进处理,其前身是利用并行计算解决大型文体的网格计算和将计算资源作为计量的服务提供的公共计算,在互联网宽带计算和虚拟化技术发展后萌生出云计算。如图 1 所示
10、为云计算的概念模型-6-图 1 云计算的概念模型2.2 云计算的兴起云计算是一种全新的领先信息技术,结合IT 技术和互联网实现超级技术和存储能力,而推动云计算兴起的动力是高速互联网和虚拟化技术的发展、更加廉价的且功能强劲的芯片及硬盘、数据中心的发展。云计算作为下一代企业数据中心,基本形式为大量链接在一起的共享IT 基础设施,不受本地和远程计算机资源的限制,可以很方便地访问云中的“虚拟”资源,使用户和云服务提供商之间可以像访问网络一样进行交互操作。具体来讲,云计算的兴起有以下的因素。(1)高速互联网技术发展网络用于信息交换、信息发布、信息收集、信息处理。网络内容不再向早些年那样是静态的,门户网站
11、随时在更新着网站中的内容,网络的功能、网络速度也起着非常大的变化,网络成为人们学习、工作和生活的一部分。不过网站只是云计算应用和服务的缩影,云计算强大的功能在高速互联网时代正崭露头角。云计算能够利用现有的IT 基础设施在极短的时间内处理大量的信息以满足动态网络的高性能需求。-7-(2)资源利用率需求能源问题是众多企业特别是IT 企业重点关注的。企业数据中心降温及用电等能耗问题,计算能力利用率过低,通常的企业多数计算服务器运行中只有少量的工作负荷得到利用。引入云计算模式后可以通过整合资源或采用租用存储空间、租用计算能力等服务来降低企业运行成本和节省能源。同时利用云计算将资源集中,统一提供可靠服务
12、,并能减少企业成本,提升企业灵活性,企业可以把更多的时间用于服务客户和进一步研发新的产品上。(3)简单与创新要求在实际的业务需求中,越来越多的企业用户都在期待着使用计算机操作能简单化,能直接通过购买软件或硬件服务而不是软件或硬件实体,为自己的学习、生活和工作带来更多的便利,能在学习场所、工作场所、住所直接建立便利的文件或资料共享的纽带,则是多数用户希望的。而对资源的利用可以简化到通过接入网络就可以实现自己想要实现的一切,就需要在技术上有所创新,利用云计算来提供这一切,将我们需要的资料、数据、文档、程序等全部放在云端实现同步。(4)其他需求连接设备、实时数据流、SOA的采用以及搜索、开放协作、社
13、会网络和移动商务等这样的 Web 2.0 应用急剧增长,数字元器件性能的提升也使IT 环境的规模大幅度提高,从而进一步加强了对一个由统一的云进行管理的需求。2.3 云计算的发展云计算已经成为未来发展的重要趋势之一,是业界的热点名词和技术,许多公司提供这各种各样的云计算服务,随着云计算理念和应用的推广,云计算的优势已经作家得到了用户的肯定。目前,IBM、微软、Google、Amazon等信息业巨头都已经参与到云计算研究和开发中。-8-图 2 2006年,Sun公司推出了机遇云计算理论的“黑盒子”计划,其数据中心内置了各种计算机硬件以及必要的供电和冷却设备,作为大中型企业的一定数据中心用于实现可移
14、动的计算机系统。“黑盒子”可以将很大小的资源集中起来利用,也可将大资源分开使用,以提高资源使用率。而云计算以数据为核心,便利的一定和部署特性使其发展前景十分广阔。2007 年 11 月,蓝色巨人IBM在上海推出了“蓝云(Blue Cloud)”计划,充分利用云计算包括云应用的能力,通过基于SOA 的 Web服务,与现有的IT 基础架构的集成。“蓝云”关注 IT 管理简化方面的突破性需求,以保证安全性、隐私性、可靠性、高使用率和高效率。“蓝云”建立在 IBM在领先的大规模计算领域的专业技术,将基于由 IBM软件、系统技术和服务支持的开放标准和开源软件。全球超过 200 名 IBM研究人员参与开放
15、的“蓝云”,政府机构、大学和互联网企业展开云计算方面的合作,并于2008 年正式推出能随着某一应用工作负载的变化动态地提高和分配资源的“蓝云”处理器系统产品,通过管理服务器来确保基于需求的最佳性能。另外,IBM还提高了一个 System Z“大型主机”云环境,及基于高密度机架集群云环境。-9-微软全世界有数亿计的Windows用户,通过 Windows Live 提供云计算服务实现一般的设备存储转移到任何时间都可以存储的模式;2008 年微软推出Windows Azure 云计算平台,为进军云计算领域的又一大举措,将能够使企业使用其数据中心来运行网络应用程序和制作网络程序。互联网企业的先锋Go
16、ogle 的搜索引擎,其开放式的平台体现了云计算模式的精髓,其云计算服务所需要的绝大部分基础软件都是开源的;Google 在 2006年推出 Google Apps的企业服务即为云计算服务的雏形。用户只需要通过浏览器连接到 Google,就可以进行相应的存储和计算处理。Google 提供了在线文档处理、电子表格处理及电子邮件、IM、日历、网页创建等服务,并能实现多人办公。目前 Google 的战略部署为开源浏览器Chrome。而 Google Docs、Google Desktop、Google Picasa等作为 Google 提供给个人网络用户的在线软件应用及云计算模式的初步体验。图 3
17、互联网上最大的在线零售商亚马孙提供弹性计算云,为独立开发人员及开发商提供云计算服务平台弹性计算云(Elastic Compute Cloud,EC2)。亚马孙将弹性计算云建立在大规模集群计算的平台上,用户可以通过网络去操作在云计算平台上的各个实例,而用户根据自己的使用情况进行付费。虚拟化技术先驱 Vmware于 2008 年宣布加入云计算研究和开发队伍,并宣布其云计算策略和技术路线图,并论证了构建私有云的关键要素。资料表明越来越-10-多的 IT 企业、软件开发团队、服务提供商卷入到“云战争”中,抢占云计算这一新型服务领域,近期国外已有专门定位于云计算应用的终端设备发布,被称为云计算计算机和云
18、操作系统。而无论是IT 企业、普通用户,都对云计算有着浓厚的兴起,无论是政府的机构还是科研预计按所,都对云计算的研究倾注了极大的热情。随着云计算规范的统一和应用进一步明朗,云计算团队将迅速终端,并延伸出广阔的产业链,无论是个人用户还是企业用户都能充分体验到云计算带来的好处。2.4 云计算的特点云计算平台与传统应用模式相比,具有如下特点。(1)虚拟化技术。现有的云计算平台的最大的特点是利用软件来实现硬件资源的虚拟化管理、调度及应用。通过虚拟平台用户使用网络资源、技术资源、数据库资源、硬件资源、存储资源等,与在自己的本地计算机上使用的感觉是一样的,相当于是在操作自己的计算机,而在云计算中利用虚拟化
19、技术可大大降低维护成本和提高资源的利用率。(2)灵活定制在云计算时代,用户可以根据自己的需要或喜好定制相应的服务、应用及资源,云计算平台可以按照用户的需求来部署相应的资源、技术能力、服务及应用。用户不必关心资源在哪里、如何部署,只需要把自己的需求告诉云,剩下的工作就交给云了,云将返回用户定制的结果,当然用户也可以对定制的服务进行管理,如退订或删除一些服务等(3)动态可扩展性在云计算体系中,可以将服务器实时加入到现有服务器群中,提高“云”处理能力,如果某计算节点出现故障,则通过相应策略抛弃掉该节点,并将任务交给别的节点,而在节点故障排除后可实时加入现有集群中。(4)高可靠性和安全性用户数据存储在
20、服务器端,而应用程序在服务器端运行,计算由服务器端来-11-处理。所有的服务分别在不同的服务器上,如果什么地方出问题就终止它,另外再启动一个程序或节点,即自动处理失败节点,保证了应用和计算的正常进行,而用户端不必备份,可以任意节点恢复。在云计算服务器端提高了最可靠、最安全的数据存储中心,有全世界最专业的团队管理信息,有全世界最先进的数据中心保存数据,严格的权限管理策略可以帮助用户放心地与指定的人共享数据。另一方面,数据被复制到多个服务器节点上有多个副本,存车处在云里的数据即使意外删除或硬件崩溃都不会受到影响。(5)高性价比云计算对用户端的硬件设备要求最低,使用起来也最方便,软件不要购买和升级至
21、需要定制就可以了,而服务器端也可以用价格低廉的PC组成云,而计算能力却可以超过大型主机,而用户在软硬件维护和升级上的投入大大减少。(6)数据、软件在服务器端云计算模式下,用户的所有数据直接存储在云端,在需要的时候直接从云端下载使用;用户使用的软件由服务商统一部署在云端运行,软件维护有服务商来完成,当个人计算出现故障或崩溃,也不会影响该用户对其软件的试用,用户只需要换个 PC就可以继续自己的动作,包括文档实时编辑和协作开发等。(7)超前大的计算和存储能力用户可以在任何时间、任何地点,采用任何设备登录云计算系统后就可以进行计算服务;云计算云端由成千上万台甚至更多服务器组成的集群具有无限空间、无限速
22、度。3 云计算架构3.1 云计算基础原理云计算的基本原理为:利用非本地或远程服务器的分布式计算机为互联网用户提供服务。这使得用户可以将资源切换到需要的应用上,根据需求访问计算机和存储系统。云计算可以把普通的服务器或者PC连接起来以获得超级计算机的计算和存储等功能,但是成本更低。云计算真正实现了按需计算,从而有效地提-12-高了对软硬件资源的利用效率。云计算的出现使高性并行计算不再是科学家和专业人士的专利,普通的用户也能通过云计算所带来的便利,使人人都有机会使用并行机,从而大大提高了工作效率和计算资源的利用率。云计算模式中用户不需要了解服务器在哪里,不用关心内部如何运作,通过高速互联网就可以透明
23、的使用各种资源。云计算是全新的机遇互联网的超级计算理念和模式,实现云计算需要多种技术集合,并且需要用该软件实现将硬件资源进行虚拟化管理和调度,形成一个巨大的虚拟化资源池,把存储在个人电脑、移动设备和其他设备上的大量信息和处理器资源集中在一起,协同工作。3.2 云计算模式下的网络网络已经深刻地改变了我们的工作、学习和生活,随着云计算这种新型模式的出现,网络在传统模式中的角色发生了巨大的转变,将网络的效能提升到前所未有的高度。在单机计算机时代,用户对软件、硬件及相应服务的需求也是体现在实体上。使用计算机前需要首先是按照配置购买组装硬件看,购买安装操作系统,安装需要用到的应用软件、服务软件包括常用的
24、Office套件、杀毒软件、媒体播放器等。在计算机网络时代,连接到互联网的计算机用户软件、硬件及相应服务的需求也是体现在实体上。和单机计算机时代相比,网络中提供了大量的免费资源、付费软件及其他的免费和付费资源。部分资源需要先下载再应用,而部分资源在网络高速发展的今天已经初现云计算身影,如 Bit 软件的下载处理方式就是利用并行计算和分布式处理方式来完成的。网络完成传统的资源信息的处理。进入云计算时代,其最终目标是将计算、服务和应用作为一种公共设施提供给公众用户,使人们能够像使用水、电、煤气和电话那样使用计算资源。在 2006年底“Google101计划”推出后引领业界将包括并行计算、分布式计算
25、、网格计算、服务计算等在内的心的计算范型的研究和实现。以用户为中心的云计算中,服务提供商可以使用网格技术或并行计算技术将大量的服务器或价格低廉的个人计算机互联在一起提供云服务。网络在云计算新兴基础架构中附加了角色,其-13-一各类软件提供 Inernet提供软件服务;其二云服务商通过网络提供云计算、云存储服务;其三云服务提供商通过网络提供开发平台接口服务,开发人员可以租用平台及接口进行自己的专业开发及维护;其四可以通过网络提供商业服务和管理服务等。云服务商与 IT 巨头在云计算时代通过网络实现人们希望实现的一切,在云端附加服务,云用户端定制服务和接收服务。在云用户端只需要有一台能连上互联网的,
26、预置了“云操作系统”的浏览器端即可,用户要应用的软件及硬件均是云的服务形式,在此模式下,网络不仅传送信息,还传送服务,网络成了服务和信息的传送媒介。3.3 云计算基础架构云计算充分利用网络和计算机计算实现资源的共享和服务,解决云进化、云控制、云推理和软计算等负责问题,其基础架构可以用云计算体系结构来描述,而云计算的服务层次则从提高服务类型角度描述云计算对应提高的功能或服务,云计算技术层次从云计算软硬件结合角度说明云计算平台的构成。3.3.1 云计算实现机制云计算平台是一个强大的“云”网络,连接了大量并发的网络计算和服务,可利用虚拟化技术扩展每一个服务器的能力,将各自的资源通过云计算平台结合起来
27、,提供超级计算机和存储能力。通用的云计算体系结构如图4 所示:-14-图 4 云计算实现机制云用户端:提供云用户请求服务的交互界面,也是用户使用云的入口,用户通过 Web浏览器可以注册、登录及定制服务、配置和管理用户。打开应用实例与本地操作桌面系统一样。服务目录:云用户在取得相应权限(付费或其他限制)后可以选择或定制的服务列表,也可以对已有服务进行退订的操作,在云用户端解密那生成相应的图标或列表的形式展示相关的服务。系统管理和配置工具:提供管理和服务,能管理云用户,能对用户授权、认证、登录进行管理,并可以管理可用计算资源和服务,接收用户发送的请求,根据用户请求并转发到相应的应用程序,调度资源智
28、能地部署资源和应用,动态地部署、配置和回收资源。监控统计:监控和计量云系统资源的使用情况,以便做出迅速反应,完成节点同步配置、负载均衡和资源监控,确保资源能顺利分配给合适的用户。计算/存储资源:虚拟的或物理的服务器,由系统管理,负责高并发量的用户请求处理、大运算量计算处理、用户 Web应用服务,云数据存储时采用相应数据切割算法采用并行方式上传和下载大容量数据。用户可通过云用户端从列表中选择所需的服务,其请求通过管理系统调度相-15-应的资源,并通过部署工具分发请求、配置Web应用。3.3.2 云计算服务层次在云计算中,根据其服务集合所提供的服务类型,整个云计算服务集合被划分成 4 个层次:应用
29、层、平台层、基础设施层和虚拟化层。这4 个层次每一层都对应着一个子服务集合,如图5 所示为云计算服务层次。图 5 云计算服务体系结构云计算的服务层次是根据服务类型即服务来划分,与计算机网络体系结构中层次的划分不同。在计算机网络中每个层次都实现一定的功能,层与层之间有一定关联。而云计算体系结构中的层次是可以分割的,即某一层次可以单独完成一项用户的请求而不需要其他层次为其提供必要的服务和支持。在云计算服务体系结构中各层次与相关云产品对应。如图6 所示:图 6 云计算四层模型云服务集合中的子服务应用层软件即服务平台层基础设施层虚拟化层硬件即服务基础设施即服务平台即服务-16-3.3.3 云计算技术层
30、次云计算技术层次和云计算服务层次不是一个概念,后者从服务的角度来划分云的层次,主要突出了云服务能我们带来什么。而云计算的技术层次主要从系统属性和设计思想角度来说明云,是对软硬件资源在云计算技术中所充当角色的说明。从云计算技术角度来分,云计算大约有 4 部分构成:物理资源、虚拟化资源、中间件资源、和服务接口,如图7 所示:图 7 云计算技术体系结构服务接口:统一规定了在云计算时代使用计算机的各种规范、云计算服务的各种标准等,用户端与云端交互操作的入口,可以完成有用户或服务注册,对服务的定制和使用。服务管理中间件:在云计算技术中,中间件位于服务和服务器集群之间,提供管理和服务即云计算体系结构中的管
31、理系统。对标识、认证、授权、目录、安全性等服务进行标识化化操作,为应用提供统一的标准化程序接口和协议,隐藏底层硬件、操作系统和网络的异构性,统一管理网络资源。虚拟化资源:指一些可以实现一定操作具有一定功能,但其本身是虚拟而本身真是的资源,如计算池、存储池和网络池、数据库资源等,通过软件技术来实现相关的虚拟化功能,包括虚拟环境、虚拟系统、虚拟平台。物理资源:主要指能支持计算机正常运行的一些硬件设备及技术,可以是价-17-格低廉的PC,也可以是价格昂贵的服务器及磁盘阵列等设备,可以通过现有网络计算和并行技术、分布式技术将分散的计算机组成一个可以提供超强功能的集群用于计算和存储等云计算操作。在云计算
32、时代,本地计算机可能不再像传统计算机那样需要空间足够的硬盘、大功率的处理器和大容量的内存,指需要一些必要的硬件设备如网络设备和基本的输入输出设备等。3.4 云计算应用云计算的表现形式多种多样,简单的云计算在人们日常网络应用中随处可见,如腾讯 QQ空间提供在线制作Flash 图片,彩字秀提供的个性文字图片的处理,Google Doc 和 Google Apps、zoho、用远程软件进行 Office处理。云计算可提供的服务类型有:3.4.1 SaaS(软件即服务)软件厂商将应用软件统一部署在服务器或服务器集群上,通过互联网提供软件给用户。用户也可以根据自己实际需要向软件厂商定制或租用适合自己的应
33、用软件,提供租用方式使用基于Web的软件来管理企业经营活动。软件厂商服负责管理和维护软件,对于许多小型企业来说,SaaS 是采用先进技术的最好途径,它消除了企业购买、构建和维护基础设施和应用程序的需要,近年来,SaaS 的兴起已经给传统软件企业带来强劲的压力。在这种模式下,客户不再像传统模式那样花费大量投资用于硬件、软件、人员,而只需要支出一定的租赁服务费用,通过互联网编可以享受到相应的硬件、软件和维护服务,享有软件使用权和不断升级,这是网络应用最具效益的营运模式。SaaS 通常被企业管理软件领域、产品技术和市场,国内的厂商已八百客、沃利森为主,主要开发CRM、ERP等在线应用。用友、金蝶等老
34、牌管理软件厂商也 推出 在线 财 务 SaaS 产品。国 际 上 其他大 型 软 件 企业 中,微软 提 出 了Software+SaaS 的模式,谷歌推出了与微软Office竞争的 Google Apps,Oracle在收购 Sieble 升级 Sieble on-demend后推出 Oracle On-demend,SAP推出了采用传统和 SaaS的杂交(Hybird)模式。-18-3.4.2 平台即服务平台即服务 PaaS(Platform as a Service)是提供开发环境、服务器平台、硬件资源等服务给用户,用户可以在服务提供商的基础架构基础上开发程序并通过互联网和其服务器传给其
35、他用户。PaaS 能够提供企业或个人定制研发的中间件平台,提供应用软件开发、数据库、应用服务器、试验、托管及应用服务,为个人用户或企业的团队协作。在云计算服务中,平台即服务包括以下类型服务。(1)提供基础开发环境云服务提供商开发、测试、部署、维护应用程序等服务,满足不同用户需要的不同开发周期和基础开发环境,多用户互动测试,版本控制,部署和回滚。(2)基础 Web服务和数据库支持 SOAP 和 REST 的借口,组成多个网络服务,支持多用户使用不同数据库的平台,协作用户实现云计算设计。(3)支持团队协作平台服务通过共享代码和预定义方式,可以界定、更新和跟踪设计人员,开发、测试、质量控制、完成团队
36、协作。(4)提供实用设备以租用方式提供相应设备(如大型机器系统,存储系统等)以端到端方式给用户。平台系统比应用软件系统复杂,是一系列的软件硬件协议的系统集合。把平台独立于软件之外来另立为单独的服务项目,能够让服务更具有目的化,易于管理和维护。PaaS能给客户带来更高性能、更个性化的服务,也是SaaS今后发展的趋势,一个 SaaS软件也能给客户在互联网上提供开发、测试、在线部署应用程序的功能。Salesforce的 平台和八百客的800APP是 PaaS的代表产品。PaaS厂商也吸引软件开发商在PaaS平台上开发、运行并销售在线软件。3.4.3 按需计算(Utility Computing)按需
37、计算,是将多台服务器组成的“云端”计算资源包括计算和存储,作为计量服务提供个用户,由IT 领域巨头如 IBM的蓝云、Amazon的 AWS 及提供存储-19-服务的虚拟技术厂商的参与应用于云计算结合的一种商业模式,它将内存、I/O设备、存储和计算能力整合成一个虚拟的资源池为整个业界提供所需要的存储资源和虚拟化服务器等服务。按需计算用于提供数据中心创建的解决方案,帮助企业用户创建虚拟的数据中心,诸如 3Tera 的 AppLogic,Cohesive Flexible Technologies的按需实现弹性扩展的服务器。Liquid Computing公司的 LiquidQ 提供类似的服务,能帮
38、助企业将内存、I/O、存储和计算容量通过网络基础为一个虚拟的资源池提供服务。按需计算方式的优点在于用户只需要低成本硬件,按需租用相应计算能力或存储能力,大大降低了用户在硬件上的开销。(1)MSP(管理服务提供商)管理服务是面向 IT 厂商的一种应用软件,常用于应用程序监控服务、桌面管理系统、邮件病毒扫描、反垃圾邮件服务等。目前瑞星杀毒软件早已推出云杀毒的方式,而 SecureWorks、IBM提供的管理安全服务属于应用软件监控服务类。(2)商业服务平台商业服务平台是 SaaS和 MSP 的混合应用,提供一种与用户结合的服务采集器,是用户和提供商之间的互动平台,如费用管理系统中用户可以订购其设定
39、范围的服务于价格相符的产品或服务。(3)网络集成网络集成是云计算的基础服务的集成,采用通用的“云计算总线”,整合互联网服务类似的云计算公司,方便用户对服务供应商的比较和选择,为客户提供完整的服务。软件服务提供商OpSource 推出了 OpSource Services Bus,使用的就是被称为 Boomi的云集成技术。(4)云端网络服务网络服务供应商提供API 能帮助开发组开发基于互联网的应用,提供网络拓展功能性。服务范围从提供分散的商业服务(诸如Strike Iron 和 Xignite)到涉及 Google Maps、ADP薪资处理流程、美国邮电服务、Bloomberg 和常规的信用卡处
40、理服务等的全套API 服务。云计算在工作和生活中最重要的体现就是计算、存储与服务,当然计算和存-20-储从某种意义上讲属于云计算提供的服务,因此也验证了云计算即是一种服务,是一种网络服务。3.5 云计算对企业的影响云计算模式能极大地降低企业或学校的信息系统建设的成本。对他们来讲,通过投资建立计算中心成本较大,并且难以与他们的信息系统的快速成长和服务多元化要求相匹配。云计算模式为各团体机构提供了合适的借鉴方案,行业机构数据中心、网络中心的相关任务将可以选用云计算服务来完成,通过云计算提供的 IT 基础架构,可以节约成本,不用投资购买昂贵的硬件设备,负担频繁的维护与升级。同时,云计算也将有效地消除
41、行业信息系统中的“孤岛”现象。网络技术给出了消除信息孤岛的解决方案,作为网格运算模式的发展,云计算提供了更强的管理机制,自动化和高层次的虚拟化,将实现网络虚拟环境上的最大化资源共享和协同工作。具体来讲,云计算为企业带来的便利归纳为以下几个方面。(1)商业模式和理念的转变IT 公司的商业模式从实体的软件或硬件产品销售转变为相应的软硬件服务的提供。通过云计算,更多的应用能够以互联网服务的方式进行。云计算的先驱者之一谷歌甚至强调未来几乎所有的软件都可以搬上互联网,以服务取代软件。云计算将带动整个商业模式的转变,延伸出新的商业体系,特别是IT 企业商业理念也需要转变,当前的软件销售转变为服务销售,将实
42、体变为未来中的相关服务提供给个人用户或企业用户。(2)提供管理效率、服务水平利用云计算的商业服务平台提供用户和提供商之间交换的平台,用户不要花精力去开发相应的软件或提供相应平台,只需要付少量的费用就能实现现代化的信息管理,将更多的精力用在企业的实质管理和服务客户,增强了企业的自动化度,能提高企业的管理效率及相应的服务水平。(3)降低运行维护成本企业只需要定制相应的服务,由云服务商或云端提供需要的基础架构、服务、软硬件资源等,可以节约成本,不要投资购买昂贵的硬件设备,负担频繁的维护-21-与升级,企业不需要建立自己的数据中心、大型机房、服务器中心等并相应减少软硬件的运行维护费用。(4)提高了资源
43、利用率云计算模式中多企业共用相应的基础架构,由云计算提供更强的管理机制、自动化部和高层次的虚拟化,将实现网络虚拟环境上的最大化资源共享和协同工作。企业可以自己组建多个企业共享云计算基础设施,在节约成本的同时提高资源的利用率。(5)云计算将扩大软硬件应用的外延并改变软硬件产品的应用模式按照流行说法,云计算模式即为电厂集中供电的模式。也就是说,通过云计算,用户可以不必购买新的服务器和部署软件,只需要定制或租用就可以得到应用环境或者应用本身。对于用户来说,软硬件不必是部署在自己身边的、专属也自己的产品,而是可以变身为可利用的、虚拟的一种资源。(6)影响产业链云计算作为一种应用模式,其兴起和推广,必将
44、对产业链产生深远的影响。传统的 IT 产品的开放方向及技术发展方向发生改变,在推出云计算后,都是围绕云计算进行,包括数据中心改造,软件服务、硬件服务的提供替代传统的软件开发和硬件开发及销售,衍生出相应的产业链,甚至不少企业为了谋求更好的发展构建行业联盟,整个产业将进行大的整合,并能细分出更多的云计算相关的服务企业。(7)其他影响在云计算时代,IT 不要担心不断服务器升级、软件升级及其他计算问题,从而解放 IT 部门,可以将更多的精力投入创新中;企业可以更方便获取外界信息,可以任何一种语言与客户和合作伙伴交流,有利于更好地进行企业决策。3.6 典型云计算平台Google 的云计算技术实际上是针对
45、Google 特定的网络应用程序而定制的。针对内部网络数据规模超大的特点,Google 提出了一整套基于分布式并行集群方式的基础架构,利用软件的能力来处理集群中经常发生的节点失效问题。-22-从 2003 年开始,Google 连续几年在计算机系统研究领域的最顶级会议与杂志上发表论文,揭示其内部的分布式数据处理方法,向外界展示其使用的云计算核 心技术。从其近几年发表的论文来看,Google 使用的云计算基础架构模式包括四个相互独立又紧密结合在一起的系统。包括Google 建立在集群之上的文件系统 Google File System,针对 Google 应用程序的特点提出的Map/Reduce
46、编程模式,分布式的锁机制Chubby以及 Google 开发的模型简化的大规模分布式数据库 BigTable。图 8 3.6.1 Google File System 文件系统为了满足 Google 迅速增长的数据处理需求,Google 设计并实现了 Google文件系统(GFS,Google File System)。GFS 与过去的分布式文件系统拥有许多相同的目标,例如性能、可伸缩性、可靠性以及可用性。然而,它的设计还受到 Google 应用负载和技术环境的影响。主要体现在以下四个方面:(1)集群中的节点失效是一种常态,而不是一种异常。由于参与运算与处理的节点数目非常庞大,通常会使用上千个
47、节点进行共同计算,因此,每时每刻总会有节点处在失效状态。需要通过软件程序模块,监视系统的动态运行状况,侦测错误,并且将容错以及自动恢复系统集成在系统中。-23-(2)Google系统中的文件大小与通常文件系统中的文件大小概念不一样,文件大小通常以 G字节计。另外文件系统中的文件含义与通常文件不同,一个大文件可能包含大量数目的通常意义上的小文件。所以,设计预期和参数,例如I/O 操作和块尺寸都要重新考虑。(3)Google文件系统中的文件读写模式和传统的文件系统不同。在Google应用(如搜索)中对大部分文件的修改,不是覆盖原有数据,而是在文件尾追加新 数据。对文件的随机写是几乎不存在的。对于这
48、类巨大文件的访问模式,客户端对数据块缓存失去了意义,追加操作成为性能优化和原子性(把一个事务看做是一个程序。它要么被完整地执行,要么完全不执行)保证的焦点。(4)文件系统的某些具体操作不再透明,而且需要应用程序的协助完成,应用程序和文件系统API 的协同设计提高了整个系统的灵活性。例如,放松了对GFS一致性 模型的要求,这样不用加重应用程序的负担,就大大简化了文件系统的设计。还引入了原子性的追加操作,这样多个客户端同时进行追加的时候,就不需要额外的同步操作了。总之,GFS 是为 Google 应用程序本身而设计的。据称,Google 已经部署了许多 GFS集群。有的集群拥有超过1000个存储节
49、点,超过 300T的硬盘空间,被不同机器上的数百个客户端连续不断地频繁访问着。图 9 给出了 Google File System的系统架构,一个GFS集群包含一个主服务器和多个块服务器,被多个客户端访问。文件被分割成固定尺寸的块。在每个块创建的时候,服务器分配给它一个不变的、全球惟一的 64位块句柄对它进行标识。块服务器把块作为linux文件保存在本地硬盘上,并根据指定的块句柄和字节范围来读写块数据。为 了保证可靠性,每个块都会复制到多个块服务器上,缺省保存三个备份。主服务器管理文件系统所有的元数据,包括名字空间、访问控制信息和文件到块的映射信息,以及块当前所在的位置。GFS 客户端代码被嵌
50、入到每个程序里,它实现了Google 文件系统 API,帮助应用程序与主服务器和块服务器通信,对数据进行读写。客户端跟主服务器交互进行元数据操作,但是所有的数据操作的通信都是直接和块服务器进行的。客户端提供的访问接口类似于 POSIX接口,但有一定的修改,并不完全兼容 POSIX标准。通过服务器端-24-和客户端的联合设计,Google File System能够针对它本身的应用获得最大的性能以及可用性效果。图 9 图 10 3.6.2 MapReduce 分布式编程环境为了让内部非分布式系统方向背景的员工能够有机会将应用程序建立在大规模的集群基础之上,Google 还设计并实现了一套大规模数