《机房运维服务方案(可编辑Word版).docx》由会员分享,可在线阅读,更多相关《机房运维服务方案(可编辑Word版).docx(14页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、机房运维服务方案(最新可编辑Word版)目录一、服务范围2二、服务内容4(一)维保服务4(二)系统应急及优化方案服务5(三)重大活动保障服务8(四)培训及技术指导9(五)信息安全服务9三、服务要求13(一)项目主要人员构成13(二)现场服务要求13(三)保密要求142现场软件升级首先分析软件升级的必 要性和风险,配合用户 进行软件升级3现场故障诊断按服务级别:7X24小 时5X8小时4电话远程技术支持7X24小时5问题管理系统对遇到的问题进行汇总 和发布(2)主机、存储系统运维服务主机、存储系统的运维服务包括:主机、存储设备的日常监控,设备的运行状态监控,故障处理,操作系统维护,补丁升级等内容
2、。主机存储系统基本服务内容:序号服务模块内容描述提财1现场备件安装配合用户进行。按备件到达现 场时间工程师到达现场2补丁服务消除软件漏洞给系统带来的安 全隐患,并对安装补丁所引起 的系统连锁反应进行合理的平 衡。3升级服务对系统进行软件或硬件的升 级,以改进、完善现有系统或 消除现有系统的漏洞。4现场故障诊断按服务级别:7X24小时5X8小时5电话远程技术支 持7X24小时6问题管理系统对遇到的问题进行汇总和发布7系统优化对客户系统的括主机、存储设 备、操作系统、提供优化服务。(3)数据库系统运维服务数据库运行维护服务是包括主动数据库性能管理,数据库的主动性能管理对系统运维非常重要。通过主动式
3、性能管理可了解数据库的 日常运行状态,识别数据库的性能问题发生在什么地方,有针对性地 进行性能优化。同时,密切注意数据库系统的变化,主动地预防可能 发生的问题。数据库运行维护服务还包括快速发现、诊断和解决性能问题,在 出现问题时,及时找出性能瓶颈,解决数据库性能问题,维护高效的 应用系统。数据库运行维护服务,主要工作是使用技术手段来达到管理的目 标,以系统最终的运行维护为目标,提高用户的工作效率。具体数据库运行维护监控的基本服务内容包括:1 f rr 号服务模块内容描述提供 方1Oracle数据库 7*24电话支持服 务每周7天,每天24小时支持中心电话, 电子邮件答询,以满足业务发展的需要。
4、 Oracle产品技术专家直接同客户对话, 帮助解决客户提出的疑难问题。根据问题的严重程度,将优先解决客户 认为是关键而紧急的任务。对客户提出的一般性问题进行技术咨 询、指导。定期的客户管理报告,避免问题再度发 生。2Oracle数据库产 品现场服务响应数据库宕机数据坏块影响业务不能进行的产品问题 软件产品的更新及维护。三、服务要求I 1 f 序 号服务模块内容描述提供 方3Oracle数据库产 品系统健康检查对系统的配置及运作框架提出建议,以 帮助您得到一个更坚强可靠的运作环境 降低系统潜在的风险,包括数据丢失、 安全漏洞、系统崩溃、性能降低及资源 紧张检查并分析系统日志及跟踪文件,发现 并
5、排除数据库系统错误隐患检查数据库系统是否需要应用最新的补 丁集检查数据库空间的使用情况 协助进行数据库空间的规划管理 检查数据库备份的完整性 监控数据库性能 确认系统的资源需求 明确您系统的能力及不足 优化Oracle Server的表现 通过改善系统环境的稳定性来降低潜在 的系统宕机时间4Oracle数据库产 品性能调优分析用户的应用类型和用户行为 评价并修改ORACLE数据库的参数设置 评价并调整ORACLE数据库的数据分布 评价应用对硬件和系统的使用情况,并 提出建议利用先进的性能调整工具实施数据库的 性能调整培训用户有关性能调整的概念 提供用户完整的性能调整报告和解决方 法(一) 项目
6、主要人员构成项目负责人1名,负责整个项目的管理、协调、组织等。(1) 技术负责人1名,负责技术咨询、培训、整改优化方案制 定等。(2) 现场驻点维护人至少1名,常驻采购人(食宿自理),专职 采购人机房系统维护、巡检、现场培训等工作。(二) 现场服务要求(1) 提供7大24小时的全程服务,服务时间为星期一至星期天, 包括公共节假日。中标公司接到报障电话30分钟内,须进行故障分 析判定。对影响到主要业务正常运行的故障,须在2小时以内恢复。(2) 制订严谨的维护服务规范,提供管理技术热线,并对采购 人的故障及需求进行即时的跟踪。(3) 配备资深专家或经验丰富的工程师对采购人提供技术咨询 和技术指导。
7、(4) 安排至少1人,常驻采购人(食宿自理)专职负责本项目 技防系统维护工作。(5) 设有专用的服务及投诉电话,并配有专门人员对投诉电话进行协调、跟踪、处理及解释。(三) 保密要求(1) 在进行服务过程中,必须遵守国家法律法规,签订采购人 系统维护保密协议及其他安全协议。(2) 不得通过网络、报刊、杂志、广播、电视等发布、传播采 购人不允许的文字、图片、视频信息。(3) 维护过程中不得将任何存储设备带离采购人。(4) 非经允许维护方不得对数据做出复制、移动、修改、删除 等相关操作。(5) 不得向第三方提供采购人相关人员姓名、地址及联系方式、 采购人地理位置、方位布局、行政建制、罪犯信息、系统信
8、息等信息。(6) 因现场维护人员疏忽或其他单方原因造成涉密,则应完全承担相应的安全违约责任。、服务范本次运维服务范围包括机关1个数据中心机房和基层单位7个机房,清单如下:序号分类维护内容1机房与机房基础设施机房2电器系统3空调系统4消防系统5防雷接地系统6环境监控系统7综合布线系统8网络设施路由器9交换机10通信设备11传输设备12传输链路13计算与存储设施服务器14磁盘阵列15云服务平台16相关计算设备17存储设备18指挥调度设备大屏显示设备19音频设备20视频设备21管控设备22报警设备23调度设备24操作终端25会议系统26视频点名系统27安防设施视频监控系统28广播系统29对讲系统30
9、报警系统31出入口系统32安检系统33门禁系统34信息安全防火墙35网闸36漏洞扫描设备37入侵检测设备38防病毒网关39加密卡40USB Key通过专业的技术支持为数据中心运行维护工作提供专业的技术平台,可以满足多种应用运行环境稳定的要求,可以满足系统及数据高效、可靠和安全运行的要求,可以满足运行设备统一管理、及时的故障恢复的要求,可以保证在数据中心构建的应用系统和数据集中运行的设备平台正常运行,达到高效、稳定、安全和高扩展性的要求。二、服务内容(一)维保服务设备更换将出现严重故障、无法修复的设备进行更换、调试,保证设备后续正常工作。(1) 巡检现场巡检服务是对客户的设备及网络进行全面检查的
10、服务项目,通过该服务可使客户获得设备运行的第一手资料,最大可能地发现存 在的隐患,保障设备稳定运行。同时,将有针对性地提出预警及解决 建议,使客户能够提早预防,最大限度降低运营风险。巡检包括的内容如下:编号巡检内容1硬件运行状态检查项目单板状态检查电源模块状态检查风扇状态检查整机指示灯状态检查机框防尘网检查机房温度、湿度检查设备地线检查2软件运行情况检查项目设备运行情况检查网络报文分析设备对接运行状况检查路由运行情况检查3网络整体运行情况调查网络运行问题调查网络变更情况调查网络历史故障调查(3)设备状态评估每半年对精密空调、机房消防设施等设备进行检测和运行状态评 估,提交完整的评估报告报科技信
11、息处。(3) 其他如遇不可抗力或人为原因造成系统故障或损坏时,积极主动做好 技术服务工作;提供维护过程中所需辅材(包含水晶头、网络跳线、 光纤跳线、扎带、胶布、线卡等综合布线耗材)及工具。(二)系统应急及优化方案服务为确保系统及机房安全与稳定,以保证正常运行为宗旨,按照“预 防为主,积极处置”的原则,本着建立一个有效处置突发事件,建立 统一指挥、职责明确运转有序、反应迅速处置有力的机房安全体系的 目标,将正在发生或已发生事故的损害程度减轻到最低,确保员工安 全,特制定本应急处置预案。系统故障应急流程故障发生系统运维服务小组可从以下途径得知故障的发生:运维服务中心通过网管告警发现故障维护站点通过
12、维护巡检发现故障,用户发现故障,报给呼叫中心驻场工程师发现故障(1) 报障受理运维服务小组得知系统故障发生后,立即响应,并向报障人或单 位详细了解系统故障情况。(2) 信息研判运维服务小组根据了解到的系统故障情况进行分析判断,以确定 采用一般故障处理流程还是立即启动系统突发故障应急处理预案。(3) 预案启动如需启动应急预案,则立刻通知系统突发故障应急领导小组,由 领导小组启动应急预案,对系统突发故障应急事件进行全面管控处 理。(4) 资源确认系统突发故障应急预案启动后,首先是根据现场突发故障实际状 况、紧急程度、技术难度、备品备件等情况对相关资源(主要是参与 人员)依据经验进行调度和确认,主要
13、有以下资源:我公司技术支持人员;A相关厂家技术支持人员;A我公司聘请的技术专家;(5) 预案执行按照既定的预案进行突发故障抢修,如遇到问题及时向系统突发故障应急领导小组汇报。(6) 预案终止预案的终止时间由故障现场技术人员根据现场的实际进展情况, 在与用户单位有关部门协调后报系统突发故障应急领导小组决定。(7) 结果上报预案中止后,相关预案参与人员将整个事件过程中的经验和教 训,修改、完善事件应急预案。然后集中上报至系统突发故障应急领 导小组。(8) 突发事件处理原则1) 预防为主。立足安全防护,加强预警,重点保护基础信息网络 和关系信息安全、稳定的重要信息系统,从预防、监控、应急处理、 应急
14、保障等环节,在管理、技术、人员等方面采取多种措施充分发挥 各方面的作用,共同构筑安全保障体系。2) 快速反应。突发事件发生时,按照快速反应机制,及时获取 充分而准确的信息,跟踪研判,果断决策,迅速处置,最大程度地减 少危害和影响。3) 分级负责。按照“谁主管、谁负责的原则,建立和完善安全 责任制及联动工作机制。根据各负责人的职能,各司其职,加强各负 责人的协调与配合,共同履行应急处置工作的管理职责。4) 以人为本。把保障人员以及公共利益的安全作为首要任务。5) 常备不懈。加强技术储备,规范应急处置措施与操作流程,定期进行预案演练,确保应急预案切实有效,实现网络与信息安全突发公共事件应急处置的科
15、学化、程序化与规范化。(三)重大活动保障服务1=1在重要会议或法定假日前一周内须开展全面安全巡检工作;(1) 巡检内容包括但不限于:桌面、综合布线、机房环境、硬 件设施、操作系统、数据库、磁盘阵列、应用软件、配置数据、数据 备份等;重要会议或节假日前的准备工作:A值班表:在重要会议或节假日前5个工作日,服务台、维护中 心应制定值班安排表,并报送各相关部门,节假日值班表,包括客服 中心值班表和维保厂商值班表;A安全检查:在重要节假日或重大生产保障前3-5天,进行一 次设备现场安全检查,如发现隐患应及时排除;A自检:在重大节假日应提前3天内提前做好自检工作,以保证 稳定性、可用性;(2) 在节假日
16、期间监控人员和当班维护工程师要严格执行各项 维护流程,严守值班纪律,尽职尽责,维护工程师在当班期间必须留 守在本地,以保证能第一时间赶至现场;(3) 所有维护人员在任何时间、任何地点都必须保证24小时通 讯畅通,若通讯工具存在障碍(无信号、无电等),必须要第一时间告知上级主管有效联系方式。(四)培训及技术指导U!(1)技术培训服务为提高客户的运维人员的技术水平及运维管理能力,我公司将派 遣具有丰富实施经验的技术专家定期对客户进行相关专业(主机、存 储、数通、网络、安全、机房环境等)的培训。培训可以采用灵活多样的方式如面对面交流、课堂授课、邮件沟 通等。(2)远程技术支持服务远程技术服务主要是通过电话或其他方式受理客户和驻点工程 师的疑难问题,通过沟通来指导客户或驻点工程师解决问题,同时远 程技术服务工程师还通过电话或者其他方式与客户主动沟通来提高 客户管理和运维能力。(五)信息安全服务(1)网络、安全系统运维服务从网络的连通性、网络的性能、网络的监控管理三个方面实现对 网络系统的运维管理。网络、安全系统基本服务内容:序号服务模块内容描述提岫1现场备件安装配合用户进行,按备件 到达现场时间工程师到 达现场