《H3C存储基础知识白皮书.pdf》由会员分享,可在线阅读,更多相关《H3C存储基础知识白皮书.pdf(92页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、华为3com技术有限公司Huawei-3Com Technologies Co.Ltd.产品版本Product version密级Confidentiality level产品名称Product name:Total 92pages 共92页存储基础知识白皮书(仅供内部使用)For internal use only拟制:Prepared by日期:Dateyyyy-mm-dd审核:Reviewed by日期:Dateyyyy-mm-dd审核:Reviewed by日期:Dateyyyy-mm-dd批准:Granted by日期:Dateyyyy-mm-dd华为3com华为3com技术有限公司
2、Huawei-3com Technologies Co.,Ltd.版权所有侵权必究All rights reserved修订记录Revision record日期Date修订版本Revisionversion修改描述change Description作者Author2005-06-281.00初稿完成 initial transmittal作者名nameyyyy-mm-dd1.01修改 XXX revised xxx作者名nameyyyy-mm-dd1.02修改 XXX revised xxx作者名name.yyyy-mm-dd2.00修改 XXX revised xxx作者名name目录第
3、i 章网络存储主要技术61.1 概述.61.2 D A S:直接附加存储.71.3 S A N:存储区域网络.81.3.1 什么是S A N?.81.3.2 S A N 的误区.81.3.3 S A N 的组成.81.3.4 F C S A N 的问题.91.3.5 IPS A N.1 01.4 N A S:网络附加存储.II1.5 S A N fl IN A S.1 2第2 章主要协议和相关技术.1 32.1 S CS I.1 32.2 FC(光纤通道).1 42.3 i S CS I.1 52.4 i S CS I与光纤通道的比较.1 6第3 章文件系统相关知识.1 83.1 什么是文件系
4、统.1 83.2 主流文件系统和特点.1 93.3 N FS 和CIFS 网络文件系统工作原理和特点.2 23.4 存储系统与文件系统的关系.2 3第4 章 R A ID技术.2 44.1 R A ID 概述.2 44.2 R A ID级另I J.2 44.2.1 R A ID0.2 44.2.2 R A ID 1.2 54.2.3 R A ID2.2 64.2.4 R A ID3.2 64.2.5 R A ID4.2 74.2.6 R A ID5.2 74.2.7 R A ID6.2 84.2.8 RAID10.294.2.9 RAIDO1.304.2.10 JBOD.304.3 不同RAI
5、D级别对比.31第5章主机系统高可用技术.335.1 概述.335.1.1 双机热备份方式.355.1.2 双机互备份方式.395.1.3 群集并发存取方式.415.2 工作模式.435.2.1 双机热备份方式.435.2.2 双机互备方式.435.2.3 群集并发存取方式.435.3 适用场合.445.4 对存储系统的要求.44第6章数据一致性.456.1 数据一致性概述.456.2 Cache引起的数据一致性问题.466.3 时间不同步引起的数据致性问题.476.4 文件共享中的数据一致性问题.47第7章数据复制与容灾.487.1 灾难恢复/业务连续性.487.2 数据备份系统.527.2
6、.1 数据备份.527.2.2 数据复制.547.3 数据一致性.567.4 总结.57第8章备份技术.588.1 什么是备份.588.2 备份与拷贝、归档的区别.588.3 常规备份的实现方式.598.4 LAN Free和Serverless备份.608.5 主流备份软件和介质.618.6 备份技术新趋势.65第9章存储连接设备.689.1 HBA卡介绍.689.1.1 FCHBA 相关知识:.689.1.2 主要HBA卡厂商.699.1.3 iSCSI HBA相关知识:.699.1.4 iSCSI HBA和TOE网卡主要厂商.709.2 FC连接设备介绍.709.2.1 FC HUB相关
7、知识:.709.2.2 FC Switch相关知识:.709.2.3 FC Director相关知识:.709.2.4 iSCSI-FC存储路由器.709.2.5 FC Switch和FC Director主要厂商.71第10章信息生命周期.7110.1 什么是信息生命周期.7110.2 信息生命周期的实现.7210.3 实现ILM的技术保障和面临的挑战.7210.4 信息生命周期管理现状.7210.5 法规遵从与信息生命周期管理.7310.6 与信息生命周期相关的存储技术.7310.6.1 固定内容管理:.7310.6.2 WORM:.7410.7 怎样看待信息生命周期管理.74第11章其他
8、存储技术及标准.7411.1 S M I-S.7411.2 CDP(持续数据保护).7511.3 虚拟存储.751 1.4 网格计算.7 61 1.5 高性能计算.7 61 1.6 负载均衡.7 7第1 2 章常见主机及操作系统.7 71 2.1 主机架构及操作系统概述.7 71 2.1.1 主机架构.7 71 2.1.2 操作系统.7 81 2.1.3 操作系统比较.7 81 2.2 常见主机厂商及常见产品介绍.7 81 2.2.1 IB M:.7 81 2.2.2 S U N:.7 91 2.2.3 Fu j i t s u:.8 01 2.2.4 HP:.8 11 2.3 操作系统应用特
9、点.8 2第1 3 章 常见数据库及应用系统.8 21 3.1 数据库厂商介绍.8 21 3.1.1 Or a c l e.8 21 3.1.2 D B 2.8 71 3.1.3 S y b a s e.9 01 3.1.4 M S S Q L S e r v e r.9 1第1章 网络存储主要技术1.1 概述存储系统是整个1 T 系统的基石,是I T 技术赖以存在和发挥效能的基础平台。早先的存储形式是存储设备(通常是磁盘)与应用服务器其他硬件直接安装于同一个机箱之内,并且该存储设备是给本台应用服务器独占使用的。随着服务器数量的增多,磁盘数量也在增加,且分散在不同的服务器匕查看每一个磁盘的运行
10、状况都需要到不同的应用服务器上去查看。更换磁盘也需要拆开服务器,中断应用。于是,一种希望将磁盘从服务器中脱离出来,集中到一起管理的需求出现了。不过,一个问题:如何将服务器和盘阵连接起来?面临这样的问题,有厂商提出了SCSI协议,通过专用的线缆将服务器的总线和存储设备连接起来,通过专门的SCSI指令来实现数据的存储。后来发展到FC协议。这样,多个服务器可以通过SCSI线缆或光纤建立与存储系统的连接。这样的方式,我们称之为直接附加存 储(D A S)。1.2 DAS:直接附加存储DAS(Direct Attached Storage一直接附加存储)是指将存储设备通过SCSI线缆或光纤通道直接连接到
11、服务器上。一个SCSI环路或称为SCSI通道可以挂载最多16台设备;FC可以在仲裁环的方式下支持126个设备;DAS方式实现了机内存储到存储子系统的跨越,但是缺点依然有很多:扩展性差,服务器与存储设备直接连接的方式导致出现新的应用需求时,只能为新增的服务器单独配置存储设备,造成重复投资。资源利用率低,DAS方式的存储长期来看存储空间无法充分利用,存在浪费。不同的应用服务器面对的存储数据量是不致的,同时业务发展的状况也决定这存储数据量的变化。因此,出现了部分应用对应的存储空间不够用,另一些却有大量的存储空间闲置。可管理性差,DAS方式数据依然是分散的,不同的应用各有一套存储设备。管理分散,无法集
12、中。异构化严重,DAS方式使得企业在不同阶段采购了不同型号不同厂商的存储设备,设备之间异构化现象严重,导致维护成本据高不下。1.3 SAN:存储区域网络AppUcanoniSCSI Appliance1.3.1 什么是SAN?SAN(Storage Aera Network)存储区域网络,是一种通过网络方式连接存储设备和应用服务器的存储构架,这个网络专用于主机和存储设备之间的访问。当有数据的存取需求时,数据可以通过存储区域网络在服务器和后台存储设备之间高速传输。1.3.2 SAN的误区SAN的发展历程较短,从90年代后期兴起,由于当时以太网的带宽有限,而FC协议在当时就可以支持1Gb的带宽,因
13、此早期的SAN存储系统多数由FC存储设备构成,导致很多用户误以为SAN就是光纤通道设备,其实S AN代表的是一种专用于存储的网络架构,与协议和设备类型无关,随着千兆以太网的普及和万兆以太网的实现,人们对于S A N 的理解将更为全面。1.3.3 SAN的组成S A N 由服务器,后端存储系统,S A N 连接设备组成;后端存储系统由SAN控制器和磁盘系统构成,控制器是后端存储系统的关键,它提供存储接入,数据操作及备份,数据共享、数据快照等数据安全管理,及系统管理等一系列功能。后端存储系统为SAN解决方案提供了存储空间。使用磁盘阵列和RAID策略为数据提供存储空间和安全保护措施。连接设备包括交换
14、机,HBA卡和各种介质的连接线。S AN的优点:设备整合,多台服务器可以通过存储网络同时访问后端存储系统,不必为每台服务器单独购买存储设备,降低存储设备异构化程度,减轻维护工作量,降低维护费用;数据集中,不同应用和服务器的数据实现了物理上的集中,空间调整和数据复制等工作可以在一台设备上完成,大大提高了存储资源利用率;高扩展性,存储网络架构使得服务器可以方便的接入现有SAN环境,较好的适应应用变化的需求;总体拥有成本低,存储设备的整合和数据集中管理,大大降低了重复投资率和长期管理维护成本;1.3.4 FCSAN 的问题 兼容性差,FC协议发展时间短,开发和产品化的大厂商较少,而且厂商之间各自遵循
15、内部标准,导致不同厂商的FC产品之间兼容性和互操作差,即使同一厂商的不同版本不同型号的FC产品也存在类似的问题;成本高昂,FCSAN的成本包括先期设备成本和长期维护成本,由于FC协议在成熟度和互联性上无法与以太网相比,导致FC协议只能局限于存储系统应用,无法实现大规模推广,这直接导致了FC产品价格的昂贵;同样与FC-SAN相关的所有产品都身价高昂,无论是备份软件的FC-SAN模块,甚至SCSI硬盘简单更换连接口成为FC硬盘,都要翻上几倍的价钱;另外兼容性差也导致了用户无法自己维护FC设备,必须购买昂贵的厂商服务,如果用户的环境中包括多种FC存储设备,用户每年花在FC-SAN的系统保修服务的费用
16、占当年采购成本的15%左右。如果再算上系统安装部署阶段的专业服务费用支出,以5年计算,整个服务费用支出与系统采购达到1:1:扩展能力差,FC-SAN高昂的成本和协议封闭,使得产品的开发、升级、扩容代价高昂。从2000年以来,存储市场中最大的中端部分就一直5年不变地维持着前端两个存储控制器,后端两个(最多四个)光纤环路的结构。不仅产品本身无法进行性能和处理能力扩展,产品型号向上的升级付出的代价几乎相当于购买一套新的设备;异构化严重,各厂商按照自有标准开发各种功能,如快照、复制、镜像等,导致不同厂商存储设备之间功能无法互通,结果又出现的DAS方式的各种问题,重复投资、难以管理的局面SAN的出现,从
17、根本上是要建立一个开放、高性能、高可靠、高可扩展性的存储资源平台,从而能够应对快速的业务变化和数据增长,然而以上问题使得用户使用网络存储的目标产生了严重的偏离,很多用户甚至开始质疑为什么要放弃DAS而使用昂贵复杂的FC-SAN。1.3.5 IPSANIP网络是一个开放,高性能,高可扩展,可靠性高的网络平台。IP网是国际互连网,企业内部网络的主要形式。经过多年发展,IP网络实现了最高的可管理性和互操作性。TCP/IP协议弹性强,适应网络的各种变化,无需停止服务即可实网络变更。1G的以太网已经普及,2006年会扩展到10G。FC在2008年才能至U4G。不同厂家的IP网设备兼容性好。网络设备采购成
18、本低廉。以太网知识普及,以太网多年的发展培养了无数的网络管理人员。IP SAN的基本想法是通过高速以太网络连接服务器和后端存储系统。将SCSI指令和数据块经过高速以太网传输,继承以太网的优点,实现建立一个开放、高性能、高可靠性,高可扩展的存储资源平台。IPSANiSCSI AttachediSCSI ApplianceiSCSI PiotocolBlock IOApplication将数据块和SCSI指令通过TCP/IP协议承裁,通过千兆/万兆专用的以太网络连接应用服务器和存储设备,这样的解决方案称为IPSAN。IP SAN遵循IETF的iSCSI标准,通过以太网实现对存储空间的块级访问,由于
19、F 先以太网速度,数据安全性以及系统级高容错要求等问题,这一标准经历了三年的认证过程,在包括IBM、HP、SUN、COMPAQ、DELL、Intek Microsoft、EMC、HDS、Brocade等众多家厂商的努力,和万兆/千兆以太网10GBit Ethernet支撑下,IP SAN/iSCSI已解决了网络瓶颈,数据安全和容错等问题,进入了实用阶段。IP SAN继承了IP网络的优点:实现弹性扩展的存储网络,能自适应应用的改变。已经验证的传输设备保证运行的可靠性 以太网从1G向I0G及更高速过渡,只需通过简单的升级便可得到极大的性能提升,并保护投资 IP跨长距离扩展能力,轻松实现远程数据复制
20、和灾难恢复 大量熟悉的网络技术和管理的人才减少培训和人力成本将以太网的经济性引入存储降低用户总体拥有成本。1.4 N A S:网络附加存储Network Attached StorageFile Protocol(CIFSJSIFS.HTTPTTP.etc)-NAS ApplianceNAS(Network Attached Storage一网络附加存储),是一种文件共享服务。拥有自己的文件系统,通过NFS或CIFS对外提供文件访问服务。NAS包括存储器件(例如硬盘驱动器阵列、CD或DVD驱动器、磁带驱动器或可移动的存储介质)和专用服务器。专用服务器上装有专门的操作系统,通常是简化的unix/
21、linux操作系统,或者是一个特殊的win2000内核。它为文件系统管理和访问做了专门的优化。专用服务器利用NFS或C IFS,充当远程文件服务器,对外提供文件级的访问。NAS的优点:NAS可以即插即用。NAS通过TCP/IP网络连接到应用服务器,因此可以基于已有的企业网络方便连接。专用的操作系统支持不同的文件系统,提供不同操作系统的文件共享。经过优化的文件系统提高了文件的访问效率,也支持相应的网络协议。即使应用服务器不再工作了,仍然可以读出数据。NAS的缺点:1、NAS设备与客户机通过企业网进行连接,因此数据备份或存储过程中会占用网络的带宽。这必然会影响企业内部网络上的其他网络应用。共用网络
22、带宽成为限制NAS性能的主要问题。2、NAS的可扩展性受到设备大小的限制。增加另一台NAS设备非常容易,但是要想将两个NAS设备的存储空间无缝合并并不容易,因为NAS设备通常具有独特的网络标识符,存储空间的扩大上有限。3、NAS访问需要经过文件系统格式转换,所以是以文件一级来访问。不适和Block级的应用,尤其是要求使用裸设备的数据库系统。1.5 SAN 和 NASSAN和NAS经常被视为两种竞争技术,实际上,二者能够很好地相互补充,以提供对不同类型数据的访问。SAN针对海量、面向数据块的数据传输,而NAS则提供文件级的数据访问和共享服务。尽管这两种技术类似,但严格意义上讲NAS其实只是一种文
23、件服务。NAS和SAN不仅各有应用场合,也相互结合,许多SAN部署于NAS后台,为NAS设备提供高性能海量存储空间。NAS和SAN结合中出现了NAS网关这个部件。NAS网关主要由专为提供文件服务而优化的操作系统和相关硬件组成,可以看作是一个专门的文件管理器。NAS网关连接到后端上的SAN匕 使的SAN的大容量存储空间可以为NAS所用。因此,NAS网关后面的存储空间可以根据环境的需求扩展到非常大的容量。“NAS网关”方案主要是在NAS一端增加了可与SAN相连的“接口”,系统对外只有一个用户接口。NAS网关系统虽然在一定程度上解决了 NAS与SAN系统的存储设备级的共享问题,但在文件级的共享问题上
24、却与传统的NAS系统遇到了同样的可扩展性问题。当一个文件系统负载很大时,NAS网关很可能成为系统的瓶颈。第2章主要协议和相关技术关键字:SCSI FC iSCSI2.1 SCSISCSI是小型计算机系统接口(Small Computer System Interface)的简称,于1979首次提出,是为小型机研制的一种接口技术,现在己完全普及到了小型机,高低端服务器以及普通PC上。SCSI可以划分为SCSI-1SCSI-2、SCSI-3,最新的为SCSI-3,也是目前应用最广泛的SCSI版本。1、SCSI-1:1979年提出,支持同步和异步SCSI外围设备;支持7台8位的外围设备,最大数据传输
25、速度为5MB/S。2、SCSI-2:1992年提出,也称为Fast S C S I,数据传输率提高到20MB/s。3、SCSI-3:1995年提出,Ultra SCSI(Fast-20)。Ultra 2 SCSI(Fast-40)出现于 1997年,最图传输速率可达80MB/S。1998年9月,Ultra 3 SCSI(Utra 160 SCSI)正式发布,最局数据传输率为160MB/S。Ultra 320 SCSI的最高数据传输率已经达到了320MB/S。2.2 FC(光纤通道)FC光纤通道:用于计算机设备之间数据传输,传输率达到2G(将来会达到4G)。光纤通道用于服务器共享存储设备的连接,
26、存储控制器和驱动器之间的内部连接。OSI参考模型将传输的信息转换为接收服务器可以识别的格式(例如ASCII)应用层对信息传输,压缩和加密表示层有关通信会话的详细信息会话层数据分块传输层追加地址和路由信息网络层为向专用途径或物理媒介通信准备数据数据链路层从服务器向媒介进行传输(例如.铜,光)物理层数据和应用FC-4高层协议映射FC-3:通用服务FC-2:数据分发FC-1:字节编码FC-O:物理界面此图需要更换协议基本架构:FC-4 Upper Layer Protocol:SCSI,HIPPI,SBCCS,802.2,ATM,Vl,IPFC-3 common serviceFC-2 Framin
27、g Protocol/Flow ControlFC-1 Encode/DecodeFC-0 Media:Optical or copper,1 OOMB/sec to 1.062GB/sec协议层说明:FC-0:物理层,定制了不同介质,传输距离,信号机制标准,也定义了光纤和铜线接口以及电缆指标FC-1:定义编码和解码的标准FC-2:定义了帧、流控制、和服务质量等FC-3:定义了常用服务,如数据加密和压缩FC-4:协议映射层,定义了光纤通道和上层应用之间的接口,上层应用比如:串行SCSI协议,HBA的驱动提供了FC-4的接口函数,F C 4 支持多协议,如:FCP-SCSI,FC-IP,FC-V
28、I协议简介:FCP-SCSI:FCP-SCSI:是将SCSI并行接口转化为串行接口方式的协议,应用于存储系统和服务器之间的数据传输。新的ANSI T10标准,支持SAN上存储系统之间通过数据迁移应用来直接移动数据。FCP-SCSI提供200MB/S(全双工独占带宽)的传输速率,每连接最远达10公里,最大16000000个节点。FCP-SCSI使用帧传输取代块传输。帧传输以大数据流传输方式传输短的小的事务数据。2.3 iSCSIiSCSI(互联网小型计算机系统接口)是一种在TCP/IP上进行数据块传输的标准。它是山Cisco和IBM两家发起的,并且得到了各大存储厂商的大力支持。iSCSI可以实现
29、在IP网络上运行SCSI协议,使其能够在诸如高速千兆以太网上进行快速的数据存取备份操作。iSCSI标准在2003年2月11日由IETF(互联网工程任务组)认证通过。iSCSI继承了两大最传统技术:SCSI和TCP/IP协议。这为iSCSI的发展奠定了坚实的基础。基于iSCSI的存储系统只需要不多的投资便可实现SAN存储功能,甚至直接利用现有的TCP/IP网络。相对于以往的网络存储技术,它解决了开放性、容量、传输速度、兼容性、安全性等问题,其优越的性能使其备受始关注与青睐。iSCSI的数据包结构:TCP segmentE thernetHeaderIP HeaderTCPHeaderISCSIH
30、eaderISCSIDataE therrTrailerIP datagramE thernet frame工作流程:iSCSI系统由SCSI适配器发送一个SCSI命令。命令封装到TCP/IP包中并送入到以太网络。接收方从TCP/IP包中抽取SCSI命令并执行相关操作。把返回的SCSI命令和数据封装到TCP/IP包中,将它们发回到发送方。系统提取出数据或命令,并把它们传回SCSI子系统。安全性描述:iSCSI协议本身提供了 QoS及安全特性。可以限制initiator仅向target列表中的目标发登录请求,再由target确认并返回响应,之后才允许通信;通过IPSec将数据包加密之后传输,包括
31、数据完整性、确定性及机密性检测等;iSCSI的优势(1)广泛分布的以太网为iSCSI的部署提供了基础。(2)千兆/万兆以太网的普及为iSCSI提供了更大的运行带宽。(3)以太网知识的普及为基于iSCSI技术的存储技术提供了大量的管理人才。(4)由于基于TCP/IP网络,完全解决数据远程复制(Data Replication)及灾难恢复(DisasterRecover)等传输距离上的难题。(5)得益于以太网设备的价格优势和TCP/IP网络的开放性和便利的管理性,设备扩充和应用调整的成本付出小。2.4 iSCSI与光纤通道的比较从传输层看,光纤通道的传输采用其FC协议,iSCSI采用TCP/IP协
32、议。FC协议与现有的以太网是完全异构的,两者不能相互接驳。因此光纤通道是具有封闭性的,而且不仅与现有的企业内部网络(以太网)接入,也与其他不同厂商的光纤通道网络接入(由于厂家对FC标准的理解的异样,FC设备的兼容性是一个巨大的难题)。因此,对于以后存储网络的扩展由于兼容性的问题而成为了难题。而且,FC协议由于其协议特性,网络建完后,加入新的存储子网时,必须要重新配置整个网络,这也是FC网络扩展的障碍。iSCSI基于的TCP/IP协议,它本身就运行于以太网之上,因此可以和现有的企业内部以太网无缝结合。TCP/IP网络设备之间的兼容性已经无需讨论,迅猛发展的internent网上运行着全球无数家网
33、络设备厂商提供的网络设备,这是一个最好的佐证。从网络管理的角度看,运行FC协议的光网络,其技术难度相当之大。其管理采用了专有的软件,因此需要专门的管理人员,且其培训费用高昂。TCP/IP网络的知识通过这些年的普及,已有大量的网络管理人才,并且,由于支持TCP/IP的设备对协议的支持一致性好,即使是不同厂家的设备,其网络管理方法也是基本一致的。FC运行于光网络之上,其速度是非常快的,现在已经达到了2G的带宽,这也是它的主要优势所在。下一代的FC标准正在制定当中,其速度可以达到4G,今天的千兆以太网已经在普及当中,这也是基于TCP/IP的iSCSI协议进入实用的保证。得益于优秀的设计,以太网从诞生
34、到现在,遍及了所有有网络的地方,到现在依然表现出非凡的生命力,在全球无数网络厂商的共同努力下,以太网的速度稳步提升,千兆网络已经实际应用,万兆网络呼之欲出,以太网的主要部件交换机路由器均已有万兆级别的产品。随着产品的不断丰富,以及设备厂商间的剧烈竞争,其建设成本在不断下降,万兆网络的普及已日益临近。当iSCSI以10Gb的高速传输数据时,基于iSCSI协议的存储技术将无可争议的成为网络存储的王者。第3章文件系统相关知识3.1 什么是文件系统文件系统定义了把文件存储于磁盘时所必须的数据结构及磁盘数据的管理方式。我们知道,磁盘是由很多个扇区(S e c t o r)组成的,如果扇区之间不建立任何的
35、关系,写入其中的文件就无法访问,因为无法知道文件从哪个扇区开始,文件占多少个扇区,文件有什么属性。为了访问磁盘中的数据,就必需在扇区之间建立联系,也就是需要一种逻辑上的数据存储结构。建立这种逻辑结构就是文件系统要做的事情,在磁盘上建立文件系统的过程通常称为“格式化”。以W i n d o w s 平台下最常见的F A T 文件系统为例。F A T 文件系统有两个重要的组成部分:F A T表(F il e A l l o c at io n T ab l e)和数据存储区。F A T 表是F A T 文件系统的名称来源,它定义了存储数据的簇(C l u s t e r,由2的n 次方个S e c
36、 t o r 组成,n 值根据分区大小而定,需综合考虑数据存取效率和存储空间的利用率)之间的链接关系,这种链接关系是一个单向链表,指向O x F F表示结束。依据一个簇编号所用b it 数的不同,可分为F A T 1 2、F A T 1 6 和F A T 3 2文件系统。数据区存储的数据包含文件目录项(D ir e c t o r y E n t r ie s)和文件数据。文件目录项存储的是-个文件或目录的属性信息,包括文件名称(把目录也看成是文件)、读写属性、文件大小、创建时间、起始簇编号等,一个目录下的每个子目录和文件都对应一个表项记录。文件目录项以固定3 2字节的长度存储,以树型结构管理
37、,其中根H录的位置是确定的。也就是说,根据分区根目录可以找到下级子目录和文件的起始簇编号,根据下级子目录又可以找到更下级目录或文件的起始簇编号。可见,F A T 表和文件目录项是为了文件的访问和管理而建立的。应用程序要访问一个文件时,根据文件路径(逻辑分区号+目录,如F:s o f t w ar e)和文件名 称(如s e t u p.e x e)可从文件目录项中获得存储文件数据的起始簇号,之后从F A T 表查询这个簇号对应的链表,就可以获得该文件对应的全部簇编号。从这些簇中读出全部数据,就得到一个完整的文件。一般来说,文件系统是和操作系统紧密结合在起的,不同的操作系统使用不同的文件系统,但
38、有时为了兼容,不同操作系统也使用相同的文件系统。3.2 主流文件系统和特点在Windows系列操作系统中,MS-DOS和Windows 3.x使用FAT16文件系统,默认情况下Windows 98也使用FAT16,Windows 98和Windows Me可以同时支持FAT16、FAT32两种文件系统,Windows NT则支持FAT16、NTFS两种文件系统,Windows 2000可以支持FAT16、FAT32、NTFS三种文件系统.每一种文件系统提供的功能与特点各不相同。比如FAT32文件系统。,采用32位的文件分配表,磁盘的管理能力大为增强。但由于文件分配表的增大,性能相对来说有所下降
39、。此外,这个版本的文件系统不能向下兼容。NTFS是 随 着 Windows NT操作系统而产生的,它的优点和FAT文件系统相比是有更好的安全性和稳定性,在使用中不易产生文件碎片,NTFS分区对用户权限作出了非常严格的限制,同时它还提供了容错结构日志,从而保护了系统的安全。但NTFS分区格式的兼容性不好,Windows 98/ME操作系统均不能直接访问该分区。对于超过4GB以上.的硬盘,使用NTFS分区,可以减少磁盘碎片的数量,大大提高硬盘的利用率;NTFS可以支持的文件大小可以达到64GB,远远大于FAT32下的4GB:支持长文件名,支持的最大分区为2TBo在Linux系统中,每个分区都是一个
40、文件系统,都有自己的目录层次结构。Linux的最重要特征之一-就是支持多种文件系统,并可以和许多其它种操作系统共存。随着Linux的不断发展,它所支持的文件格式系统也在迅速扩充。特别是Linux 2.4内核正式推出后,出现了大量新的文件系统.Linux系统可以支持十多种文件系统类型包括:JFS、ext、ext2、ext3、IS09660.XFS、Minx、MSDOS.UMSDOS,VFAT、NTFS,HPFS、NFS、SMB、SysV、PROC等。各主流操作系统和平台的文件系统名称和特点如下表所示操作系统文件系统特点W i n d o ws 9 5、Wi n d o ws 9 8、O S R
41、2、Wi n d o ws 9 8 S E、Wi n d o ws M e、Wi n d o ws 2 0 0 0 和Wi n d o ws X PF a t 文件系统F A T 1 2/F A T 1 6 和F A T 3 2可以允许多种操作系统访问,如M S-D O S、Wi n d o ws3.x、Wi n d o ws 9 x,Wi n d o ws N T 和O S/2 等。这一文件系统在使用时遵循8.3 命名规则(即文件名最多为8 个字符,扩展名为3 个字符)。最大的限制在于兼容性方面,F a t 3 2 不能保持向下兼容。当分区小于5 1 2 M 时,F a t 3 2 不会发生
42、作用。单个文件不能大于4 G。Wi n d o wsN T/2 0 0 0N T F S 文件系统支持文件系统故障恢复,尤其是大存储媒体、长文件名。分区大小可以达到2 T B。通过使用标准的事物处理日志和恢复技术来保证分区的一致性。只能被Wi n d o ws N T/2 0 0 0 所识别,不能被F A T 文件系统所存取Wi n d o wsl o n g h o r nWi n f s用以组织、搜索和共享多种多样的信息的存储平台。朽n F S 被设计为在无结构文件和数据库数据之间建立起更好的互操作性,从而提供快捷的文件浏览和搜索功能L in u xE x t 2/ex t 3/X F S
43、 等文件系统是一种日志式文件系统。日志式文件系统的优越性在于:由于文件系统都有快取层参与运作,如不使用时必须将文件系统卸卜,以便将快取层的资料写回磁盘中。因此每当系统要关机时,必须将其所有的文件系统全部卸下后才能进行关机U N I X 系统N F S网络文件系统,允许多台计算机之间共享文件系统,易于从所有这些计算机存放文件W i n d o w s 系列C I F S网络文件系统,允许多台计算机之间共享文件系统,易于从所有这些计算机存放文件A I XJ F S具有可伸缩性和健壮性,与非日志文件系统相比,它的优点是其快速重启能力:J fs 能够在几秒或几分钟内就把文件系统恢复到一致状态。为满足服
44、务器(从单处理器系统到高级多处理器和群集系统)的高吞吐量和可靠性需求而设计的。使用数据库日志处理技术,j s f能在几秒或几分钟之内把文件系统恢复到一致状态。S C O U n ix W a r e,V x fsU F S日志式文件系统.建立文件的索引区,将操作记录V x fs在事件日志中,当系统发生意外时,能让系统迅速、完3.3 NFS和CIFS网络文件系统工作原理和特点NFS(Network File System,网络文件系统)是当前主流异构平台共享文件系统之一.主要应用在UNIX环境下。最早是山SUN microsystem开发,现在能够支持在不同类型的系统之间通过网络进行文件共享,广
45、泛应用在FreeBSD、SCO,Solaris等等异构操作系统平台,允许一个系统在网络上与它人共享目录和文件。通过使用NFS,用户和程序可以象访问本地文件一样访问远端系统上的文件,使得每个计算机的节点能够像使用本地资源一样方便地使用网上资源。换言之,NFS可用于不同类型计算机、操作系统、网络架构和传输协议运行环境中的网络文件远程访问和共享。NFS的工作原理是使用客户端/服务器架构,由一个客户端程序和服务器程序组成。服务器程序向其它计算机提供对文件系统的访问,其过程就叫做“输出”。NFS客户端程序对共享文件系统进行访问时:把它们从NFS服务器中“输送”出来。文件通常以“块”为单位进行传输.其尺寸
46、是8K(虽然它可能会将操作分成更小尺寸的分片).NFS传输协议用于服务器和客户机之间文件访问和共享的通信,从而使客户机远程地访问保存在存储设备上的数据。CIFS(Common Internet File S y s te,公共互联网文件系统)是当前主流异构平台共享文 件 系 统 之 主要应用在NT/Windows环境下,是由M icrosoft公司开发。其工作原理是让CIFS协议运行于TCP/IP通信协议之上,让Unix计算机可以在网络邻居上被Windows计算机看到。共享文件系统特点:异构平台下的文件共享:不同平台下的多个客户端可以很容易的共享NAS中的同一个文件。充分利用现有的LAN网络结
47、构,保护现有投资。容易安装,使用和管理都很方便,实现即插即用。广泛的连接性:由于基于TP/Ethernet以及标准的NFS和 C IFS,可以适应复杂的网络环境。内部资源的整合:可以将内部的磁盘整合成一个统一的存储池,以卷的方式提供给不同的用户,每个卷可以格式化成不同的文件系统 允许应用进程打开一个远地文件,并能够在该文件的某一个特定的位置上开始读写数据。N F S 可使用户只复制一个大文件中的一个很小的片段,而不需复制整个大文件,在网络上传送的只是少量的修改数据。需要注意的是,C I F S 和N F S 虽然同样也是文件系统(F i l e S y s t e m),但它并不能用于在磁盘中
48、存储和管理数据,它定义的是通过T C P/I P 网络传输文件时的文件组织格式和数据传输方式。利用C I F S 和N F S 共享文件实际涉及到两次的文件系统转换。客户端从服务器端申请一个文件时,服务器端首先从本地读出文件(本地文件系统格式),并以N F S/C I F S 的格式封装成1 P 报文并发送给客户端。客户端收到1 P 报文以后,把文件存储与本地磁盘中(本地文件系统格式)。3.4存储系统与文件系统的关系提到N A S,通常会想到传统的N A S 设备,它具有自己的文件系统,具有较大的存储容量,具有一定的文件管理和服务功能。N A S 设备和客户端之间通过I P 网络连接,基于N
49、F S/C I F S 协议在不同平台之间共享文件,数据的传输以文件为组织单位。虽然N A S 设备常被认为是一种存储架构,但N A S 设备最核心的东西实际上在存储之外,那就是文件管理服务。从功能上来看,传统NA S 设备就是一个带有D A S 存储的文件服务器。从数据的1 0 路径来看,它的数据1 0 发生在NA S 设备内部,这种架构与D A S 毫无分别。而事实上,很多NA S 设备内部的文件服务模块与磁盘之间是通过S C S I 总线连接的。至于通过NFS/C I FS 共享文件,完全属于高层协议通信,根本就不在数据1 0 路径上,所以数据的传输不可能以块来组织。正是由于这种功能上的
50、重叠,在S A N出现以后,NA S 头设备(或NA S 网关)逐渐发展起来,NA S o ve r S A N的方案越来越多,NA S 回归了其文件服务的本质。由此可知,NA S 与一般的应用主机在网络层次上的位置是相同的,为了在磁盘中存储数据,就必须要建立文件系统。有的NA S 设备采用专有文件系统,而有的NA S 设备则直接借用其操作系统支持的文件系统。由于不同的0 S 平台之间文件系统不兼容,所以NA S 设备和客户端之间就采用通用的NFS/C I FS 来共享文件。至于S A N,它提供给应用主机的就是一块未建立文件系统的“虚拟磁盘”。在上面建立什么样的文件系统,完全由主机操作系统确