《2022年数字化档案馆存储解决方案.doc》由会员分享,可在线阅读,更多相关《2022年数字化档案馆存储解决方案.doc(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数字化档案馆存储处理方案北京天地空间科技2008-05-05目 录一、 背景分析 3二、 数字化档案馆网络系统构造 4三、 数字存储技术的根本方式 5四、 数字存储方案在数字化档案馆中的应用 6 方案分类 方案应用五、 针对本案的处理方案 8附件一。公司介绍 附件二。产品线介绍 一、 背景分析 建立数字化档案馆是目前档案信息化的一项中心工作。建立效劳主导型的数字档案馆,即“文件构成电子化,传播档案信息网络化,在线编研系统化,档案利用超市化,馆藏档案数字化,来馆利用趋零化”等一系列新理念和新设想,利用高科技手段塑造档案馆的新形象,努力打破过去对档案馆陈旧保守的错误观念,提高档案馆在社会效劳中的地
2、位,成为档案界的共识。这些都使得高速大容量的数字化先进技术在档案治理领域的使用成为必定!数字化档案馆的建立打破了传统的、封闭的档案治理方式,实现了档案工作以手工治理为主向以计算机治理为主、以治理档案实体为主向以治理档案信息为主、以档案存储保管为主向利用效劳为主的转变。数字化档案馆的开放系统包容了纸质档案、实物档案、图片档案、影视档案的各方面及档案信息的产生、搜集、整理、保管、利用的全过程,将不同介质、不同类别互相独立的档案信息整合成统一的资源库,并确定其互相关联关系,增加了档案治理工作的科技含量,为各企事业单位消费、运营提供了平安、优质、高效的信息效劳手段,充分发挥档案信息的经济价值和社会价值
3、。随着各企事业单位整体治理水平的不断提高,现代科学技术在各行业中的广泛应用,传统的档案治理方式已不能满足日新月异的新情势的需要,这主要表如今: 1. 传统的档案治理是以纸质档案为主体,以手工检索为根本手段。而目前的各企事业单位,从基层班组到单位的决策机关,计算机应用已十分普及,电子信息传输日益广泛,电子文件的大量涌现,各专业应用系统的广泛运用,使传统档案治理面临严峻挑战; 2. 传统的档案治理采纳手工治理方式,档案治理的工作效率和质量,直截了当遭到档案人员的思想觉悟、工作态度、文化程度、业务水平、身体条件、情绪变化等诸多要素的制约,一旦某一方面发生征询题,都会给工作带来妨碍; 3. 传统的档案
4、治理与档案构成过程脱节,即先文后档,档案构成过程中出现的不标准、不真实的情况给档案治理造成了特别大的困难,特别是特别多档案图物不符的征询题,不断是困扰档案部门的顽症,尽管档案部门十分注重文档一体化工作,但事实上仍然文是文,档是档。档案部门特别难做到超前操纵、跟踪治理。这对档案构成质量和提供利用效劳的质量都会有一定的妨碍。 以上种种不习惯新情势要求的情况,在客观上对档案工作、档案部门和档案人员在治理中的作用、地位和形象都会造成消极的妨碍,迫使我们去考虑、探究和研究档案治理改革的征询题,建立数字化档案馆已成为广大档案治理者和档案工作者的共同愿望和要求。二、 数字化档案馆网络系统构造数字化档案馆通常
5、以机房为中心,各客户端通过内部局域网或Internet发布进展访征询。在多级综合网络中,档案馆内部主要包括:1. 档案搜集:搜集各种具有保存价值的文件、声像材料,各级机关、企事业单位公文、会议交流材料等。这一过程中需要各用户端搜集整理,并汇总到统一存储系统。2. 档案整理:主要包括分类、组卷、目录编制等工作,然后将各种档案进展数字化录入。这一过程同样可在采集数据存储系统中进展即可。3. 档案治理:利用各操作终端在专用的治理系统上对档案即时编辑治理。4. 档案保护:档案的转存、备份及平安防护。在这一过程中,平安的存储及备份系统是整个数字化档案工作的关键。5. 档案利用:通过内部共享或WEB发布提
6、供。强有力的容灾存储系统及全面的网络平安是数据平安的重要保障。多媒体数字档案馆的根底模型 而广义的网络构造主要包括:政府通讯专网、档案馆内网、档案馆外网,Internet网。我们这里只是针对档案馆的内部信息化提供存储方案。三、 数字存储技术的根本方式1. DAS(直截了当连接存储):将外置存储设备通过连接电缆,直截了当连接到一台计算机上。采纳直截了当外挂存储方案的效劳器构造好像PC机架构,外部数据存储设备采纳SCSI技术,或者FC技术,直截了当挂接在内部总线上的方式,数据存储是整个效劳器构造的一部分,在这种情况下往往是数据和操作系统都未别离。DAS这种直连方式,能够处理单台效劳器的存储空间扩展
7、、高功能传输需求,同时单台外置存储系统的容量,已经从不到1TB,开展到了2TB,随着大容量硬盘的推出,单台外置存储系统容量还会上升。此外,DAS还能够构成基于磁盘阵列的双机高可用系统,满足数据存储对高可用的要求。从趋势上看,DAS仍然会作为一种存储方式,接着得到应用。2. SAN(存储区域网络)1991年,IBM公司在S/390效劳器中推出了ESCON(Enterprise System Connection)技术,它是基于光纤介质,最大传输速率达17MB/s的效劳器访征询存储器的一种连接方式。在此根底上,进一步推出了功能更强的ESCON Director(一种FC Switch),构建了一套
8、最原始的SAN系统。为了更好的满足沉着量、功能、可用性、数据平安、数据共享、数据整合等方面的应用,对存储提出的要求,必须采纳网络化的存储体系。存储网络化顺应了计算机效劳器体系构造网络化的趋势,即目前的内部总线架构将逐步走向消亡,构成交换式(fabrics)网络化开展方向的趋势。最初数据存储、计算处理和I/O是合为一体的,而目前数据存储部分已经独立出来,将来将是I/O和计算处理的进一步别离,构成数据存储、计算处理、I/O吞吐三足鼎立的场面,这确实是真正的效劳器网络化体系构造,HPS(Highperformance server,高功能效劳器)和存储区域网络(SAN),是这种趋势的两个重要表达。
9、总的来说,DAS、NAS、SAN三种存储方式,已经特别好地满足目前企事业单位信息化应用在单效劳器扩容、效劳器双机高可用集群、高功能、高可用、高扩展的网络存储和简单易用的网络文件共享等方面的需求。随着信息化建立朝深度和广度开展,新兴的存储方式也必将会逐步走向普及应用。但哪种数字存储方式更符合数字参考征询系统的需要,我们要接着讨论。3. NAS(网络附加存储)NAS作为一种概念是1996年从美国硅谷提出的,其主要特征是把存储设备和网络接口,如今主要是以太网技术,集成在一起,直截了当通过以太网网络存取数据。也确实是说,把存储功能从通用文件效劳器中别离出来,使其更加专门化,从而获得更高的存取效率,更低
10、的存储本钱。NAS设备近两年开场流行,可靠稳定的功能、特别优化的文件治理系统和低廉的价格使NAS市场得到了一定的增长。NAS作为一个网络附加存储设备,采纳了信息技术中的流行技术嵌入式技术。嵌入式技术的采纳,使得NAS具有无人值守、高度职能、功能稳定、功能专注的特点。四、 数字存储方案在数字化档案馆中的应用方案分类:DAS方案 DAS方案是保持数字参考征询系统原有的构造,采纳与效劳器直截了当连接的存储设备作为网络存储设备。比方说,天地空间公司的ZA12/16UR磁盘阵列以skis方式与效劳器相连,同时为效劳器增加新的SCSI卡,把磁盘阵列与效劳器进展连接。效劳器上磁盘阵列以共享方式使用,用户访征
11、询需要通过现有的效劳器处理,对效劳器功能要求较高。DAS方案的优点是投资较少,只要增加磁盘阵列与SCSI卡就能满足需要,并保持系统原有构造,缺点是系统依赖于效劳器平台,对效劳器压力较大,数据治理不方便。SAN方案 SAN的支撑技术是光纤通道Fiber Channel(FC)技术,FC是ANSI为网络和通道I/O接口建立的一个标准集成。支持HIPPI、IPI、SCSI、IP、ATM等多种高级协议,它的最大特性是将网络和设备的通讯协议与传输物理介质隔离开。如此多种协议可在同一个物理连接上同时传送,高功能存储体和宽带网络使用单I/O接口,使得系统的本钱和复杂程度大大降低。光纤通道支持多种拓扑构造,主
12、要有:点到点(Links)、仲裁环(FCAL)、交换式网络构造(FCXS)。 点对点方式的例子是一台主机与一台磁盘阵列透过光纤通道连接,能够实现DAS应用。FCXS交换式架构下,主机和存储装置之间透过智能型的光纤通道交换器连接,并存储网络的治理软件统一治理,这种方式确实是SAN。由于采纳了FC技术,SAN具有更高的带宽。FC使用全双工串行通讯原理传输数据,在1Gb标准下,传输速率高达1062.5Mbps,即为100MB/S,双环可达200MB/S,2Gb下,上述数字将翻倍。FC标准下能够通过同轴线、光纤介质进展设备间的信号传输,使用同轴线传输间隔为30米,使用单模光纤传输间隔可达10公里以上,
13、这使得在SAN方式下实现物理上别离的、不在机房的存储变得特别容易。NAS方案 NAS设备近两年开场流行,可靠稳定的功能、特别优化的文件治理系统和低廉的价格使NAS市场得到了一定的增长。NAS作为一个网络附加存储设备,采纳了信息技术中的流行技术嵌入式技术。嵌入式技术的采纳,使得NAS具有无人值守、高度职能、功能稳定、功能专注的特点。 NAS设备内置优化的独立存储操作系统,能够有效、密地释放系统总线资源,全力支持I/O存储,同时NAS设备一般集本钱地的备份软件,能够不通过效劳器将NAS设备中的重要数据进展本地备份,而且NAS设备提供硬盘RAID、冗余的电源和风扇以及冗余的操纵器,能够满足保证NAS
14、的稳定应用。 NAS设备主要用来实如今不同操作系统平台下的文件共享应用,与传统的效劳器或DAS存储设备相比,NAS设备的安装、调试、使用和治理特别简单,采纳NAS能够节约一定的设备治理与维护费用。NAS设备提供RJ45接口和单独的IP地址,能够将其直截了当挂接在主干网的交换机或其它局域网的Hub上,通过简单的设置(如设置机器的IP地址等)就能够在网络即插即用地使用NAS设备,而且进展网络数据在线扩容时也无需停顿,从而保证数据流畅存储。 在NAS应用里,用户无需改造现有网络,就可通过不同的网络协议进入一样的文档,NAS设备就可无缝混合应用在多种操作系统平台下。另外,NAS关于已建立的网络的用户来
15、说也不存在任何威胁,NAS设备完全交融在已建立起来的网络中,它能够作为独立的数据存储设备搭配其它的各种效劳器,既保护了用户的原有投资,又将整个网络的功能提高到一个新的层次。此外,NAS设备采纳集中式存储构造,摒弃了DAS的分散存储方式,网络治理员能够方便地治理数据和维护设备。 NAS是在用户的局域网(LAN)上,以文件为单元,进展数据存取,也确实是说利用网络文件系统、TCP/IP协议、以太网络设备,实现数据存取。以太网是目前绝大部分用户都采纳的局域网络技术,NAS方式能够充分利用用户现有的局域网络设备,大大节约了用户在存储上的投资,这是NAS的一个优点。但这同样是NAS的一个弱点,以太网络的带
16、宽目前是1Gbit/s和SCSI的160MB/s,与FC(光纤通道)的2Gbit/s相比,差距不小。同时TCP/IP的帧传输方式,使得带宽利用率不高,一般情况下,NAS设备的数据传输带宽仅能到达915MB/s,另外,NAS是在TCP/IP技术上,以文件为单元进展传输,TCP/IP在帧传输时的丢包,也限制了NAS的速度,甚至威胁到数据唯一性和平安,速度、平安、功能成为NAS的一个弱点。目前大部分的(70)数据都是基于关系型数据库进展存储的,关系型数据库在操作上,需要实时高速的数据读取和存储,一般数据库都采纳“块”(Block)的方式进展数据传输,如此NAS就无法进展数据应用的主流:数据库应用上。
17、方案应用 :多种存储设备的复合使用是处理数字化档案馆网络存储需求的最正确方式。档案馆中的数据将会以文件和数据块两种方式并存。NAS在处理文件级数据集中存储与共享需求上是不可或缺的一部分。SAN网络的构建能够最大程度的进展存储扩展,并保障数据的平安。而DAS在某些重要的、相对独立的应用上仍然会接着发挥作用。利用NAS及IP-SAN方案给效劳器和安装千兆网卡,组成一种拓扑构造,这种构造把效劳器压力大大减弱,使得特别多应用能够在本地处理完后直截了当存入到存储设备上。在投资高、要求稳定的更高应用层面,FC-SAN无疑是最好的选择。在NAS及iSCSI网上数字化档案馆资源共享方案中,存储设备以网上独立设
18、备存在,用户无需通过网络效劳器,就可利用客户机上WWW阅读器、网络邻居、FTP等标准的PC界面工具,对NAS设备中的资源直截了当进展访征询。即便网络效劳器发生崩溃,用户仍然照常访征询NAS设备中的资源。治理员能够在任何一台客户端机上治理存储设备,无须另购治理软件,整体花费比FC-SAN低特别多。除此之外,NAS及iSCSI存储设备多自带用户认证机制,可保证数据平安。关键数据的平安存储,能够满足最终用户大量文件级数据共享的需求,而且还能提供充足的存储扩展才能,并充分利用现有的网络资源,在最短时间内以较少的IT投入处理集中存储的征询题。以某大学档案馆为例,在构建其数据库时,确实是用PC Serve
19、r来做数据库Server,实现数据集中、共享,将数据库移入后台的存储设备中,同时能够进展数据库操作。在Server上运转的平台考虑选用为Windows操作系统。其他的Client端要求进展数据、文件的集中存储,要实现文件的共享,其运转的平台有Windows、Linux、Windows98等。方案中使用8个NAS4300构成NAS阵列,容量到达6.4TB,在满足所有需求的前提下,减少了总体的治理本钱,提供了一个性价比拟高的方案。五、 针对本案的处理方案1. 容量需求分析 以国内某数字档案馆应用软件的图片格式PDG为例计算,一所档案馆的总容量:按照平均每册书有300页来计算,每一页的大小约是35K
20、B,一本材料的大小是:35KB/页300页=10500KB10.3MB那么,按照一所档案馆现有的材料量80万册计算:10.3MB/册800,000册=8240,000MB8046.9GB7.9TB几年后这所档案馆的藏书量会到达150万册:10.3MB/册1500,000册=15,450,000MB1,5087.9GB14.7TB2. 技术分析我们建议客户分阶段建立数字档案馆,这是依照档案馆建立方式和充分保护客户的投资角度来考虑的。从IT行业的开展趋势来看,磁盘阵列在近几年开场充满市场,在存储领域iSCSI和NAS结合正逐步取代替代SCSI和FC的产品。从保护用户投资的角度来看,如今假如购置10TB的存储设备,会是一种资源的浪费,通过刚刚计算,第一阶段需求是3TB左右,每年会增长300GB-400GB,在加上多媒体材料的增加(按1TB计算),每年的存储需求量会在1.3TB左右,如此要在5-6年后才能到达10TB的容量,随着SATA硬盘的及千兆网络配件本钱不断地下降,能够为用户节约大量的资金。综上所述,我们建议客户采纳以带有NAS及iSCSI两重功能的磁盘阵列为主的IP-SAN网络。3. 系统构造4. 核心设备5. 方案优势