《国家知识产权局专利局IT监控智能分析管理平台资料.doc》由会员分享,可在线阅读,更多相关《国家知识产权局专利局IT监控智能分析管理平台资料.doc(100页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、Good is good, but better carries it.精益求精,善益求善。国家知识产权局专利局IT监控智能分析管理平台-国家知识产权局专利局IT监控智能分析管理平台招标需求(技术部分)2013年06月目录1概述41.1建设背景41.2建设目标51.3建设内容71.4建设周期82项目建设单位概况93现有系统基础环境情况113.1专利局IT基础架构情况123.2S系统(局内)基本情况123.3相关运维保障系统情况134项目建设需求154.1系统开发需求154.1.1S系统(局内)业务全景呈现154.1.2S系统(局内)用户感知管理164.1.33D机房展示子系统184.1.4S系
2、统(局内)统计分析管理204.1.5S系统(局内)桌面门户展现224.1.6S系统(局内)资源配置管理234.1.7S系统(局内)业务影响分析254.1.8S系统(局内)故障根源定位264.1.9S系统(局内)智能阈值分析274.1.10告警短信回复子系统274.1.11监控管理流程电子化284.1.12S系统(局内)应用监控数据采集294.1.13S系统(局内)用户感知数据采集294.1.14TRS检索引擎数据采集324.1.15设备硬件告警采集324.1.16国产平台软件监控采集334.2外部接口需求344.2.1机房动环监控接口344.2.2网络主机监控接口354.2.3存储管理集成接口
3、354.2.4大机监控系统接口364.2.5短信邮件通知接口364.2.6大屏双屏呈现接口364.3系统集成需求374.3.1系统集成要求384.3.2安全等级要求384.3.3工作范围394.3.4工作内容404.4制度完善需求425系统技术指标实现要求435.1系统建设原则435.2关键质量需求436项目培训要求467项目测试验收要求477.1进场前的检验和测试477.2项目现场安装、调试、检验与测试477.3评估要求487.4验收要求488项目维护服务要求498.1系统开发的运维服务要求498.2系统集成的运维服务要求519投标方要求5410技术文件5611技术支持与服务5712知识产权
4、5813保密6014违约责任115索赔216投标方保证317人员变更418人员承诺519转包与分包61 20中标方履约延误7概述1.1 建设背景国家知识产权局专利局(以下简称“专利局”)是我国保护知识产权和专利工作的国家机构,负责我国专利的受理、审查等工作。专利局当前的重要任务是牵头落实国务院颁布的国家知识产权战略纲要,实施国家知识产权战略、建设知识产权强局。这两项中心任务的实现均需要强有力的IT服务支撑。专利局已经建成多套业务信息化系统,用来支撑全国的专利申请、审批、信息查询、检索服务等专利业务。其中,核心业务系统包括中国专利电子审批系统(简称E系统)、中国专利检索与服务系统(简称S系统局内
5、和S系统公众)、专利外观审查系统(简称D系统)等。其中,S系统以专利局数据资源为依托,借助于其它数据资源,向局内审查员提供数据全面、质量较高,功能齐全、适于专业检索要求的检索服务。随着业务战略的不断深入、专利业务的迅猛发展,专利局信息化系统数量越来越多,复杂性越来越高,在专利审查、查询、管理等业务中发挥的作用越来越大,对系统稳定、可靠、高效运行的要求也越来越高。目前专利局信息系统运行故障和隐患的发现,主要依赖维护人员人工巡检、业务用户人工报障、集中监控管理平台自动监控等手段。随着业务系统的不断扩大和日趋复杂,人工巡检周期将越来越长,快速发现业务系统运行异常越来越难。集中监控管理平台作为系统监视
6、的重要手段,弥补了人工巡检实时性不足的缺陷,能够及时发现系统运行异常。但该手段主要局限于IT基础架构层面,对应用和业务运行情况缺乏有效监控,缺乏把IT基础架构、应用、业务关联到一起进行深入、智能分析的能力,难以先于使用人员发现深层次故障和隐患,无法对故障根源定位、业务影响评估等故障分析和解决工作提供有效支撑。从技术架构看,S系统(局内)包括检索应用、检索引擎、图像浏览和数据装载4个相对独立的模块。除了承建厂商自行开发功能之外,还集成了TRS检索引擎、福昕PDF处理组件等第三方软件;需要从数十套系统中自动或者人工装载专利数据;用户的一个专利检索操作,会贯穿各个应用模块,使用各类专利数据。任意模块
7、和数据的故障,均可能影响用户检索操作的成败、快慢和准确。用户反馈检索失效或主观感觉缓慢时,无法核实和还原真实交易情形、无法定位故障根源模块,不利于深入分析故障、快速排除事故、提升服务水平。为此专利局提出IT监控智能分析管理平台的建设任务,从用户感知、故障根源和业务影响等方面进行全方面监控。1.2 建设目标IT监控智能分析管理平台总体建设目标是:以S系统(局内)为核心,对应用系统、业务逻辑和客户感知进行全方位监控,结合集中监控管理平台提供的IT基础架构监控信息,进行智能分析和直观呈现,包括如下具体目标:1) 实现对S系统(局内)全方位多层级的立体监控。a) 建设用户感知管理子系统,通过多种途径获
8、取S系统(局内)用户检索操作的真实交易记录,随时还原指定交易的实际过程和步骤,检查各步骤所用时间和成败情况;b) 建设应用监控子系统,实现对S系统(局内)各模块的应用进程、运行日志、服务端口和URL可用性的监测,实时获取S系统(局内)应用模块的运行状态、故障情况和性能信息;c) 通过与机房动环管理、存储管理、网络主机监控、大机监控等系统的接口,获取S系统(局内)相关的服务器、存储、网络、机房动环设备等对象的运行状态、故障情况和性能信息。2) 实现对S系统(局内)细粒度多维度的智能分析。a) 梳理S系统(局内)相关平台、应用、业务资源配置数据,形成网络连接、安装部署、业务支撑等关系模型,为S系统
9、(局内)内不同层面、不同模块间业务影响、故障根源的分析提供支撑;b) 分析S系统(局内)主要交易平均响应时长、关键进程资源占用情况、核心设备负载、骨干网络和存储端口流量等重要指标的历史变化趋势,形成性能基线和动态阈值,及时发现指标异动,分析指标变化趋势;c) 根据资源关系模型和历史告警数据,分析S系统(局内)平台、应用、业务等不同层面资源准同时发生多例告警的关联关系,协助定位故障根源,提升快速故障定位能力;d) 分析S系统(局内)相关的平台、应用、业务资源之间的影响关系和程度,形成业务影响和健康度模型,基于监控告警数据得到S系统(局内)各个业务模块的健康度指标,直观呈现其健康度、可用性和业务影
10、响关系;e) 提供S系统(局内)容量分析、可用性评价、运行质量评价分析等决策类统计分析功能,为系统扩容升级、系统优化决策提供科学依据;3) 实现对S系统(局内)架构和运行状态的直观呈现a) 通过虚拟3D机房技术,直观展示S系统(局内)所在机房的外观、内部布置、各类设备等真实位置和状态,提高设备规划和告警发现效率;b) 建设S系统(局内)业务全景呈现视图,直观呈现S系统(局内)相关的平台、应用、业务模块、相互影响和支撑关系以及当前状态;c) 建设用户感知呈现视图,直观呈现S系统(局内)客户检索交易的业务过程和统计数据,并随时追溯某笔交易的具体过程。4) 完善监控管理体系、制度和流程a) 牵头制定
11、和完善监控接入和策略调整制度和流程,并实现电子化,保证监控和分析数据的全面性、有效性;b) 牵头制定和完善告警处理、分析制度和流程,保证告警及时有效处理、定期对运行状况进行总结分析;c) 辅助制定和完善监控考核指标、管理制度和考核措施,实现对运维单位的量化管理。5) 实现与周边系统的紧密衔接a) 实现与S系统(局内)、E系统及其周边系统的接口,有效获取业务层、应用层的运行状态、告警和性能数据;b) 实现与机房动环、存储管理、大机监控、网络主机监控等系统的接口,保证全面实时获取相关IT基础架构的运行状态、告警和性能数据;c) 实现与短信、邮件、流程、大屏、双屏等系统的接口,保证监控和分析结果的直
12、观呈现和实时通报。1.3 建设内容本项目建设包括功能开发、接口建设、集成实施和制度完善四部分,相关工作所需费用均应包含在本项目投标报价中,包括但不限于S系统(局内)及相关系统调研分析、运维工作调研分析、智能分析管理需求分析、系统架构设计、软件开发测试、系统集成实施、制度研究完善、培训落实推广、系统支持维护等。特别说明,接口建设中需要第三方配套改造的,对方所需配套改造费用由投标方负担;需求、设计评审,培训推广落实中所需要的培训费、场地费、推广费用也由投标方负担。 功能开发本系统功能以建设数据采集平台、智能分析管理平台、综合呈现平台三大平台为核心,共分为16个子系统。具体包括设备硬件告警采集子系统
13、、国产平台软件监控采集子系统、S系统(局内)应用监控数据采集子系统、S系统(局内)用户感知数据采集子系统、S系统(局内)检索引擎交易响应数据采集子系统、资源配置管理子系统、业务影响分析子系统、故障根源定位子系统、智能阈值分析子系统、业务全景呈现子系统、用户感知管理子系统、告警短信回复子系统、3D机房展示子系统、统计分析子系统、IT监控智能分析展现子系统、监控管理流程电子化。 接口建设本系统需要与S系统(局内)中检索应用、检索引擎、图像浏览和数据装载等子系统集成,实时获取各类业务交易的全量过程数据;需要与机房动环监控、存储监控、网络主机监控、大机监控等多种监控管理系统集成,以全面获取所需配置、告
14、警和资源数据,从数据源头上保证智能分析的全面性和有效性;需要与短信、邮件、流程、大屏、双屏等系统对接,保证智能分析结果的直观呈现和实时通报。 集成实施IT监控智能分析管理平台是集“应用监控、客户感知、智能分析与管理考核”于一体的监控分析管理平台。投标方不但需要负责系统开发相关的联调测试、数据准备、配置部署等集成工作,还需要负责本系统所需的硬件设备的安装调测等集成实施工作,负责信息安全等级保护要求的配套设备和系统的安装调测、配置部署等集成实施工作,负责与E、S等系统的深度分析和集成工作,与机房动环、存储管理、网络主机、大机监控等现有系统的集成整合工作,以及与短信、邮件、工单等系统的接口集成工作,
15、实现局内运维管理分析体系的统一规划、实施和管理。 制度完善IT监控智能分析平台的使用、维护和管理涉及的相关部门或单位包括决策领导、管理部门、运维单位等。为保证系统建设对运行管理工作发挥积极有效的作用,需建设和完善相关监控、分析、管理、考核制度、指标和流程,并把该系统运行所需流程进行电子化,以技术手段推动制度、职责的落实。1.4 建设周期本项目要求在合同签订6个月内完成全部建设任务,达到项目初验标准。2 项目建设单位概况项目的建设单位是国家知识产权局专利局。国家知识产权局是我国保护知识产权和专利工作的国家机构,负责我国专利的受理、审查和复审工作;专利局是国家知识产权局的直属事业单位,内设16个司
16、级部门和1个挂靠企业。专利局自动化部、中国专利信息中心两个单位共同负责局内信息系统的建设和运营。自动化部是两局信息化服务工作的主要负责部门,从IT规划和管理等方面推动信息化系统的建设、相关管理制度和流程的落实,促进两局信息化的发展。中国专利信息中心是专利局内部服务提供者,主要负责已交维信息系统的运行维护,应自动化部要求参与项目建设工作。在运维管理工作中,自动化部作为决策和管理部门,通过运维处对各已建成交维系统的运维工作进行管理;通过各项目PMO对未交维系统的运维工作进行管理,如S系统、E系统等。信息中心和各设备提供商、系统建设商一起承担机房、网络、存储以及数十套已交维业务系统的运维保障工作;未
17、交维系统的承建集成商承担其系统的运维保障工作。本项目建设围绕S系统(局内)进行全方位立体监控和多维度智能分析,既涉及尚未交维的S系统、E系统,又涉及已经交维的机房、网络、存储和相关业务系统。项目干系方包括自动化部运维处、S系统PMO、E系统PMO、信息中心、E系统承建方、S系统承建方、存储系统承建方、机房动环建设方等。在这些相关单位中,自动化部下属的运维处、各项目PMO等是并列的配合关系,与信息中心是委托服务关系,与各厂商是合同关系。有的厂商是与信息中心签署服务合同,与自动化部没有直接关系。这些单位和部门均是IT监控智能分析管理平台的使用者,有的是该平台的管理者,有的是该平台的管理和考核对象。
18、3 本项目中与所有干系方的协调、配合、集成、接口、培训等工作,以及各干系方为此产生的各种费用,均由投标方承担。现有系统基础环境情况与本项目相关的现有业务系统、监控系统和其他系统如下图所示。其中,业务系统共有数十套,用来支撑全国的专利申请、审批、信息查询、检索服务等专利业务。其中最为重要的包括: 专利电子审批系统实审子系统(E系统):实现从专利申请的提出到专利权失效全部法律程序、全流程、全方位的电子化和网络化。审查员在专利审查过程中,通过E系统间接登录S系统完成专利检索工作。 专利检索与服务系统(S系统):向局内和公众用户提供专利信息检索服务。本项目主要实现S系统业务和运行情况的智能分析,需要从
19、其检索应用模块获取用户检索操作数据、从检索引擎模块获取具体的检索步骤和详细过程数据、从图像浏览模块获取调图具体过程数据、从数据装载模块获得各数据源系统接口的运行状态。 专利外观审查系统(D系统):提供外观专利信息检索服务。其他系统的介绍参见后续章节。3.1 专利局IT基础架构情况目前全局信息化管理系统涉及的基础架构资源分布在全国10多个机房中,总计约6000多台套,包括: 机房动环设备:UPS、空调、门禁、水浸、温湿度、摄像头、硬盘录像机等 网络设备:交换机、路由器、负载均衡器等 安全设备:防火墙、IDS、IPS等; 平台设备:大型机、小型机、PC服务器、磁盘阵列、磁带库等; 平台软件:数据库
20、、中间件(包括国产数据库、中间件)等3.2 S系统(局内)基本情况S系统依托海量专利文献数据,为审查员用户提供数据全面、功能齐全的检索服务。检索是专利审查程序中的一个关键环节。S系统(局内)包括检索任务、检索准备、检索要素表、检索报告、系统工具集、统计分析等子系统,支撑检索、浏览等核心检索功能。概括起来说,该系统为审查员主要提供了检索准备、检索、浏览以及检索报告等主要功能。 检索准备主要是协助审查员创建、维护检索任务,管理维护各种检索条件; 检索主要是根据审查员输入的条件生成检索式并调用检索引擎查找相关的文献; 检索结果浏览是将检索到的文献摘要、全文和图像信息提供给审查员检阅; 检索报告是协助
21、审查员记录总结完整的检索过程。目前,S系统(局内)每天在线用户2000多人,执行检索交易总结数十万次,对应URL请求上百万条,TRS检索日志上千万次。从技术架构看,S系统(局内)包括检索应用、检索引擎、图像浏览和数据装载4个相对独立的模块: 检索应用模块主要提供人机界面,管理和维护检索条件,把其他模块整合成整体。该模块是J2EE架构BS系统,部署在30多台小型机和PC服务器上。 检索引擎模块采用拓尔思软件,实现检索后台的核心功能并提供概览数据。该模块是C开发的后台系统,部署在100多台PC服务器上; 图像浏览模块采用了福昕的PDF处理组件,提供PDF格式文档的分段调取浏览功能。该模块提供Act
22、iveX控件与用户交互,部署在20多台小型机和PC服务器上; 上述每套检索库均对应一套专利数据库系统,数据加载是对上述数十种专利数据库进行数据抽取和转换,并加载给图像浏览模块和检索引擎。该模块10多台PC服务器上。3.3 相关运维保障系统情况专利局目前拥有多套监控管理系统,分别对机房动环设备、网络主机设备、存储备份设备、大机(Mainframe)等进行监控管理,并通过大屏、双屏、短信、邮件等手段展示呈现。集中监控管理平台把上述监控和呈现手段进行了整合集成,实现了集中拓扑呈现、配置管理、告警处理等功能。1) 机房动环监控系统:专利局13个机房各有1套机房动环监控系统,实现对温湿度、新风、配电及U
23、PS、漏水、门禁、视频监控、精密空调、消防监控、防雷接地等设备的监控。不同机房、不同动力环境设备的监控手段和集成方式不尽相同,中建公司承建的机房大多采用艾默生的机房动环监控系统,其配置、告警和性能数据均需要集成到本系统中,视频监控的视频信号也要集成到本系统中;2) 网络主机监控系统:主要实现网络设备、服务器、数据库、中间件等IT基础架构的监控。目前已纳入网络主机监控系统管理的设备约2000台,初步实现了信息系统运行可视、可监的目标。各设备和软件的配置、告警和性能数据均需集成到本系统中;3) 存储管理系统:专利局统一存储架构及监控管理系统正在整合和建设过程中,预计2013年上半年建设完成,建成后
24、可以实现对磁盘阵列、SAN交换机、NAS存储等的全面监控;专利局S系统(公众)、IDC机房及亦庄机房等存储的监控管理正在规划。各类各套存储系统的配置、告警和性能数据均需集成到本系统中;4) 大机监控系统:通过OMEGAMON软件监控大机操作系统和CICS,在主机上已经部署OMEGAMON,在开放端安装了OMEGAMON服务器,并进行了相应的客户化工作,可以实现对主要KPI的实时监控。大机系统的配置、告警和性能数据需集成到本系统中;5) 短信和邮件系统:本系统的重要告警,需要通过短信和邮件的方式发送给各管理人员和运维人员,并支持短信回复确认和清除功能。6) 电子化流程平台:采用IBMMaximo
25、软件,以6000号内线电话为依托的帮助台系统,实现了各业务系统用户对信息系统的咨询、报障、投诉等服务请求的电子化记录、流转和统计分析。7) 大屏及LED:专利局机房监控室有一块由18块屏幕(3*6)组成的大屏系统,本系统的全景视图、3D机房、系统拓扑以及机房监控录像等需要呈现在该大屏系统中,且保证呈现美观逼真。专利检索数量等重要业务指标需要呈现在大屏上方的LED屏幕上。8) 双屏系统:专利局会议室有一个由2块屏幕组成的双屏系统,本系统的统计分析和管理考核数据需要呈现在双屏系统中,保证数据准确、分析到位。4 项目建设需求本项目采用开发、集成、整合等手段,全面采集与S系统(局内)有关的IT基础架构
26、、应用模块和业务逻辑相关的运行状态、指标和交易数据,进行智能分析和直观呈现,直观呈现S系统(局内)业务实况、实现单笔交易溯源和回放,及时发现运行异常,辅助故障定位和影响分析。本系统涉及S系统(局内)深层的数据架构、应用架构、业务架构,与S系统(局内)有着密切的关系。本项目建设内容主要包括系统开发、外部接口、系统集成和制度完善。4.1 系统开发需求本系统功能以建设数据采集平台、智能分析管理平台、综合呈现平台等三大平台为核心,共分为16个子系统,包括设备硬件告警采集子系统、国产平台软件监控采集子系统、S系统(局内)应用监控数据采集子系统、S系统(局内)用户感知数据采集子系统、S系统(局内)检索引擎
27、交易响应数据采集子系统、资源配置管理子系统、业务影响分析子系统、故障根源定位子系统、智能阈值分析子系统、业务全景呈现子系统、用户感知管理子系统、告警短信回复子系统、3D机房展示子系统、统计分析子系统、IT监控智能分析展现子系统、监控管理流程电子化。4.1.1 S系统(局内)业务全景呈现对于专利局决策层与管理层来说,最关注的是业务运行状态。提供业务运行状态全景图,使决策层及管理层能够直观查看业务系统运行状态,提升业务服务质量。业务全景图功能需求包括:1) 以逻辑拓扑和真实拓扑相结合的形式,展示S系统(局内)业务拓扑、应用拓扑、基础平台拓扑。2) 业务拓扑中应包含S系统(局内)各类交易,及其先后顺
28、序关系;3) 应用拓扑应包含S系统(局内)各应用软件和模块,及其数据流和接口关系;4) 基础平台拓扑应该包含S系统(局内)相关的服务器、网络、存储等设备,及其物理连接关系;5) 基础平台拓扑与应用拓扑之间、应用拓扑与业务拓扑之间,应该体现对象间相互支撑和依赖的关系;6) 在拓扑图各个节点上,应能直观展示各业务、应用和平台资源节点运行状态和健康度情况;7) 应能基于某对象节点,展开改节点向上的业务影响和向下的故障根源情况;8) 各层拓扑可以按层逐级展开,显示更为详实的资料和实时数据。9) 业务全景内容需要投射到局内3*6块等离子屏幕上。呈现内容应能有效避开屏幕间接缝位置,保证信息美观、完整。4.
29、1.2 S系统(局内)用户感知管理用户感知管理通过S系统(局内)对应的子系统获得全量业务交易端到端响应时长、业务活动状态、业务活动量等指标,进行用户操作行为分析,直观反映业务系统运行状态及业务服务质量。用户感知管理包括感知问题分析、感知预警、用户平均访问时间分析、业务流程完整率分析等。1) 影响用户感知的最关键因素是系统的各种类型错误,包括网络、系统、应用等等。用户感知问题分析的功能需求包括:a) 能够统计分析业务量及业务失败率。b) 能够统计构成业务的各个业务活动的失败率。c) 能够分析业务失败的主要因素是哪些业务活动。2) 用户平均访问时间是衡量IT服务的重要指标,从侧面反映IT服务的易用
30、性和稳定性。用户平均访问时间分析功能需求包括:a) 能够统计用户日访问次数(会话次数)。b) 能够统计每次访问的时间。c) 能够计算每个用户的平均访问时间。d) 设定某个合理的时间片段作为合理区间,当低于该合理区间的用户数超过90%,则认为用户使用的该IT服务是易用的,且运行相对稳定。3) 业务是由一系列业务活动组成的,只有构成该业务的业务活动都被执行时,一次业务服务才算完整。服务完整率分析功能需求包括:a) 能够按服务分类统计每日启动的服务次数,以及最后完全完成的服务次数。b) 能够计算每日各类服务完整率。c) 能对各类服务完整率进行趋势分析。4) 从检索引擎交易响应数据采集子系统接收TRS
31、检索响应时长、检索执行状态等指标,进行应用分析与预警。a) 监控TRS引擎应用的各后台进程的执行状态。b) 提供TRS检索响应时长相对于历史性能水平的分析图表。c) 与智能阈值分析模块产生的历史动态阈值进行比较,对性能异动进行实时预警。d) 提供TRS检索成功、失败等情况分析。e) 提供最快N个、最慢N个检索的具体检索式、检索任务等信息,为系统优化及改进提供相关信息。f) 统计分析TRS后台进程执行状态,提供相关统计图表,并对执行状态异常的进程进行告警。5) 如果用户感知业务活动响应时长发生异常,智能监控平台应该及时发出预警,以便运维人员及时处理,避免持续的不良用户感知发生,影响用户对业务系统
32、的满意度:a) 能够针对感知指标设置预警阈值及其预警策略。预警阈值初期采用固定阈值设定方式进行设定(可以是用户服务水平指标或经验值),后期应当与历史性能数据进行比较,根据智能动态阈值进行预警。b) 能够针对新采集或计算的用户感知指标数据进行预警策略分析c) 能够对符合预警策略的感知指标数据生成预警事件,并向运维管理人员发出预警。6) 用户感知主要内容需要投射到局内3*6块等离子屏幕上。呈现内容应能有效避开屏幕间接缝位置,保证信息美观、完整。4.1.3 3D机房展示子系统通过3D技术对S系统(局内)所在机房的外观、内部布置、各类设备等进行仿真3D建模再现,直观展示机房空间、设备、环境等信息。系统
33、应提供机房3D建模功能:1) 整体建模:对机房所在位置、建筑外观、周边环境进行建模,总体呈现机房所在位置和环境。同时,平衡硬件性能与环境粒度问题,采取适当的建模粒度展示周边环境。2) 机房建模:拍摄和勘测机房内部环境,建立机房内部结构模型,高精度再现机房内部原貌。对于机房内部环境,建模过程需要根据环境的重要性,重要环境细节精细建模,其他环境粗略建模。3) IT与动环设备建模:统计和搜集机房现有IT设备以及动环设备的型号和相关模型参数,建立IT与动环设备模型库。设备建模按服务器、交换机、UPS、空调等设备类型进行分类的基础上,根据设备的大小和关键外形特征建立模型。4) 其他设备建模:对机房其他办
34、公设备的种类、位置以及相关模型参数进行统计,建立模型库。在对其他设备建模时,需要充分考虑模型对硬件性能的影响,对于重要性较低的设备粗略建模。虚拟化3D机房监控需要在建立模型的基础上,对机房环境及设备提供多种视角的展示。从不同的观察角度,全面有效地展示机房状况。1) 自动巡视:实现对各个机房或同一机房中不同机房区域环绕视角的自动巡视功能,能够全方位自动展示机房各个局部细节情况。同时,自动巡视过程中主动发起各类数据更新请求,准确及时地展示当前监控状态。当有事件告警出现时,将自动进行语音播报,并以不同的颜色闪现,提示具体的告警设备及其位置。2) 移步式巡视:允许工作/参观人员通过各种互动手段控制巡视
35、视角,主动地对机房的特定角度和位置进行检测。通过视角的远近、设备的触摸可以细致观察不同设备的详细信息并主动触发设备数据更新。3) 多视角切换:在自动巡视的全局视图中,能够按照业务/应用/设备类型等多种模式区分显示机房中所有设备。如通过视角切换,按照应用展示该机房中某一应用系统的设备,以满足分层次展示需求,使参观人员系统地了解机房内设备情况。4) 3D机房内容需要投射到局内3*6块等离子屏幕上。呈现内容应能有效避开屏幕间接缝位置,保证信息美观、完整。为了应对不同的视角和操作需求,虚拟3D机房需要提供多种交互模式来实现人机交互。1) 键鼠操控:能够使用最基本的有线/无线键盘/鼠标进行操作。2) 平
36、板触控:能够通过iPad平板电脑等触控设备进行操作。在机房内设备发生变更的时候,虚拟3D机房内的设备模型及展示指标数据也应当同步变更,因此需要提供可扩展的后台配置工具,使工作人员可以方便地对机房中的设备模型、拟展示数据项进行增、删、改等操作。1) 可扩展的模型配置工具:提供可扩展的机房设备模型配置工具,实现机房现有设备模型在机房/机柜空间上的增加、删除、移位等各类操作;对新的设备模型,实现模型库的扩展以添加新的设备。2) 展示数据配置:能够按机房、按设备查询选择IT智能监控管理平台资源配置管理数据库中的相关设备及配置指标数据,实现设备模型的展示数据配置。4.1.4 S系统(局内)统计分析管理对
37、海量运维数据进行多视角、多维度分析,用于评估运维现状、预测趋势,以及为系统扩容升级、系统优化提供决策依据。统计分析与决策支持的主要方法,包括趋势分析、对比分析、构成分析等方法。统计分析与决策支持的主要功能需求应包括:决策支持类、性能报表类、事件报表类。统计分析部分重要内容需要投射到局内会议室双屏上。呈现内容应能有效支撑部例行工作会议需要,保证信息简洁、准确。决策类统计分析包括容量分析、系统可用性评价、系统运行质量评价分析三部分,目的在于为系统扩容升级、系统优化决策提供科学依据。1) 应用系统容量分析:用单位时间事务处理量指标来衡量,应用系统容量分析功能需求应包括:a) 支持按应用系统进行设计容
38、量值的设定。b) 计算指定时间段内的单位时间事务处理量历史数据。c) 支持对上述历史数据的趋势分析。d) 支持与设计容量值的对比。2) 服务器计算容量分析:服务器计算容量标准,可通过服务器负载指标来衡量。a) 能获得服务器CPU内核数量。b) 能获得指定时间段内服务器负载指标历史数据。c) 支持对上述历史数据的趋势分析。3) 服务器存储容量分析:根据服务器文件系统使用率指标表征。a) 能获得指定时间段内服务器文件系统使用率历史数据。b) 能对上述历史数据进行趋势分析。c) 能够以图表方式展现以上趋势分析数据。系统可用性是指在指定周期内用系统健康运行时间除以周期总时长计算得到的百分数。系统可用性
39、评价是指对一段时间内(如月、季、年),每天或每周的系统可用性数据进行的稳定性分析,以帮助决策人员对系统稳定行进行判定;对可用性不稳定的系统,决策人员可决定是否升级改造。系统可用性评价的主要功能需求是:1) 能够选定评价对象,如某台服务器、某个应用系统。2) 能够指定评价时间段,如2012年9月、2012年第一季度。3) 能够获取指定时间段内评价对象的可用性数据序列。4) 支持质量控制图分析方法(如均值控制图),能够通过观察图形结果,判定系统是否稳定。故障征兆分析,是指针对已发生的某些重大故障,分析其发生前的预兆因素,以便建立相关预警策略,以实现提前预警,提高运维水平,保障服务质量,提升客户满意
40、度的目标。故障征兆分析的功能需求包括:1) 能够选择已发生的同类故障。2) 能够针对该故障发生前故障资源的性能数据进行趋势分析。3) 能够针对该故障的每次发生进行异常事件的时间关联性分析。在基础报表的基础上,添加周期性的分析简报,包含运维类(告警分析、运维分析)、管理类(运维分析、资源容量分析、影响性分析)和决策类(业务系统状况)。1) 除报表基本统计的内容以外,应能针对这些内容进行人工分析,加入人工分析内容。具体简报内容需要按照实际情况进行实施。2) 提供报表自定制功能,用户能够按照不同需要进行报表类别、报表统计周期、报表内容进行定制呈现。3) 每一个报表为分析人员提供多种展示方式:WEB页
41、面的直接展示(HTML)、PDF文件的展示、EXCEL文件的展示、生成图片以图片的形式、WORD文档、TXT文档。4) 提供报表直接打印功能。4.1.5 S系统(局内)桌面门户展现提供桌面各层视图首界面显示信息的自定制功能,以快速响应各角色的展示信息需求。1) 实现决策层视图,从用户关注、日常审批、总结等多方面进行页面设计,更多地体现支持决策的相关信息。展示内容包括待审批的工单、当前的重大事件以及其影响范围和程度、重大事件的解决情况、系统全局健康度拓扑展示、业务量的变化趋势、各部门运维水平总体统计。2) 实现管理层视图,分处室、分PMO组进行设计。根据每个处室或PMO关注点、日常审批、总结等多
42、方面进行细化。展示内容包括待办的工单、所辖系统当前的重大事件以及其影响范围和程度、所辖系统重大事件的解决情况、所辖系统事件频发的设备统计和故障类别统计、所辖系统健康度拓扑展示、所辖系统无故障健康时长分析、所辖职员的运维情况统计分析。3) 将运维角色进行梳理优化,并按照角色职能进行相关运维内容展现,提升运维人员工作效率。展示内容包括待办的工单、所负责系统或设备当前的重大事件、所负责系统或设备的健康度展示、所负责系统或设备的无故障健康时长分析,针对运维管理人员还应当有所辖职员的运维情况统计分析。4.1.6 S系统(局内)资源配置管理资源配置管理主要管理各类资源,包括机房环境资源、网络资源、主机资源
43、、存储资源、系统软件、应用软件、业务交易等,同时管理资源之间的关联关系,为故障定位、业务影响分析提供依据。资源配置管理功能需求主要包括配置项管理、配置关系管理、配置自动发现、关系模型拓扑管理、配置项查询统计。1) 配置项管理的主要功能需求包括:a) 支持配置项类别的图标表示,不同类别的配置项,有不同的图标。b) 支持配置项类别的扩充。c) 支持配置项属性的扩展。d) 支持经授权的配置项信息的增、删、改、查。e) 支持手工录入或者批量导入配置项信息。2) 配置关系管理是指针对配置项之间关联关系管理,功能需求包括:a) 关系类别至少包含构成、协作、承载、部署、物理连接、IP连接、服务连接等。b)
44、支持业务/应用关系模型的建立。业务/应用关系模型包括业务/子业务服务目录、承载业务/子业务服务目录项的应用组件,以及这些配置项之间的关系。c) 支持应用/平台关系模型的建立。应用/平台关系模型包括应用组件(功能模块/进程或可划分的应用模块和配置文件)、承载应用组件的服务器、数据库、存储以及网络等配置项,以及这些配置项之间的关系。d) 支持配置项之间关系类别的扩充。e) 支持配置项关系的编辑和维护。支持配置项类型关系约束范围内配置项之间关联关系的建立。3) 由于配置项包含了业务、应用、基础平台的各种关联配置信息,种类多,关系复杂,因此其配置项的配置及管理都非常复杂,不能依赖于人工发现与手工维护。
45、配置项及其关联关系的自动发现功能包括:a) 能够自动发现高层配置项,如网络设备、服务器等,包括设备型号、设备制造商、IP地址等。b) 能够发现具体某一高层配置项下的子配置项,例如发现具体服务器的CPU(包括型号、主频)、内存(包括内存已用数量、内存总量等)、网卡。c) 能够发现服务器上运行操作系统,包括版本、补丁等。4) 配置查询与统计是资源配置管理对配置数据进行分类查询与统计的管理模块。其功能需求包括:a) 能够从配置项类型维度,按照服务器、网络设备、存储、数据库、中间件等进行分类查询统计。b) 能够从业务系统维度,按照服务器、网络设备、存储、数据库、中间件等进行分类查询统计。c) 能够从地
46、理位置维度,按照服务器、网络设备、存储、数据库、中间件等进行分类查询统计。d) 支持组合检索条件对配置项查询结果过滤。e) 能够对配置查询统计表格列是否显示、显示顺序进行定制。f) 支持以EXCEL或PDF格式导出查询统计结果。5) 拓扑管理将配置项与配置项之间关系,按照拓扑图形方式展现的管理,其主要功能需求包括:a) 能够生成以配置项为节点,关系为节点间连线的初始拓扑图。b) 支持全展开模式和层次化模式两种拓扑图形。全展开模式是指关系模型中的配置项全部展开;层次化模式是指按父节点、业务服务目录项节点分层次,逐步展开的拓扑图模式。c) 支持关系模型的拓扑图形再定制,可改变关系的描述方式,也能够
47、隐藏不关注的配置项和关系。d) 持一个系统的关系模型可以拥有多拓扑图,可按照用户的关注点显示不同的拓扑图。e) 支持缺省拓扑的设置,以便其呈现时,无需选择。f) 支持图形上的浮动提示和右键菜单。4.1.7 S系统(局内)业务影响分析当发生故障或资源变更时,需要根据业务、应用、资源之间的关联关系,自动分析故障对相关资源、业务的影响范围及影响程度,对可能影响的业务进行预警,提升客户的满意度;同时根据业务影响分析结果自动判断故障处理的优先级,为运维管理人员判断故障处理的优先级提供管理依据。业务影响性分析主要分析故障或变更对资源及业务的影响范围和影响程度。影响范围依靠资源关系模型确定,影响程度依靠资源间的权重算法。以用户感知时长变化来直观、量化反应业务性能的影响程度。1) 系统应该能够通过查询资源配置管理数据库中业务、应用、平台资源之间的关联关系,实现业务影响的自动化分析。通过业务影响分析,确定根源故障的影响范围及影响程度,帮助用户判断故障处理的优先级顺序及时效;同时对可能影响的业务进行预警,提高客户满意度。2) 能够依据根源故障的故障级别以及配置项