《2022年重庆应用监控需求 2.pdf》由会员分享,可在线阅读,更多相关《2022年重庆应用监控需求 2.pdf(4页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、应用监控需求1 需求背景:随着电信业务的发展,业务支撑系统日趋复杂。而应用系统是否正常工作、系统之间接口数据是否准确、 以及如何及时发现问题并及时通知相关维护人员处理,是 IT 支撑系统自身需要解决的问题。2 整体需求:应用监控系统应从业务应用视角对各个业务应用系统进行集中、统一监控,能提供对业务数据逻辑进行稽核等功能。一方面,通过多种方式, 从业务应用角度,对应用程序进行监控; 另一方面, 系统中的故障和告警都将反映到对业务的影响,从业务应用的角度进行监控,提升了管理能力。3 名词解释:监控网元:是指应用监控平台监控的对象,如,一台主机上的某个进程、文件系统等。监控指标: 对某个监控网元定义
2、的监控内容,如,对一个文件系统定义一个监控指标,该指标可以定义多个属性,如文件系统的大小、文件的个数等。监控项: 一个和多个监控指标的集合,以便综合分析器从应用系统的角度进行分析,判断应用是否正常。综合分析器: 对每个监控项下面的一个或多个监控指标从业务逻辑进行分析,并判断是否需要告警,以及告警的级别。将告警信息发送给告警模块。4 系统架构系统由 Agent、综合处理层、信息展现层、告警层等组成。其中, Agent 可分为通用Agent 和专用 Agent,通用 Agent 指的是对采集内容可以通过配置名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - -
3、 - - - - - 名师精心整理 - - - - - - - 第 1 页,共 4 页 - - - - - - - - - 来实现,新增一个监控项或者修改一个监控项内容,只需要通过配置即可实现。专用Agent指的是对那些不能通过通用Agent 实现的监控项,必须通过程序开发来实现。综合处理层指的是对Agent 采集的内容进行业务方面的分析,得到需要的内容。信息展现层是将综合处理层分析的结果通过web 的形式展现出来,其中展现的内容和格式可以进行定制, 用户只需要拖拉相应的内容即可以实现定制。系统可以通过不同的形式对需要告警的内容进行告警,如将不同等级的告警信息在页面上通过不同的颜色展示,并能够
4、通过短信或者电话告警。5 监控各个模块的需求5.1 监控指标定义:应用监控平台能够对每个监控指标定义属性,监控指标的各个属性能够以预定义的格式(如文本文件等)输出,以便采集模块对监控的指标进行采集。5.2 监控指标数据的采集(agent )系统支持部署到多种操作系统平台上。对预定义的监控指标进行定时或准实时的采集,并将采集的数据发送到监控平台,以便综合分析器对每个监控项的监控指标进行逻辑分析。要求对被监控主机性能影响小。Cpu 占用小于 3,内存小于 100M,文件系统小于 200M。部署的 agent应当对原有系统的程序不冲突。支持直接能够获取的监控数据类型:获取指定数据库表的数据,通过获取
5、的数据情况以及告警条件,用来判断监控项是否正常。支持判断指定主机上的进程(含进程数量)是否存在,是否僵死。支持获取指定主机文件系统上的文件是否存在,文件内容是否符合给定的逻辑。支持获取指定主机文件系统上的应用进程的日志,获取时间点和关键字,用来判断监控项是否正常。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 2 页,共 4 页 - - - - - - - - - 通用监控接口:支持通用接口,如文件接口,可按照通用接口格式, 生成监控结果文件。 Agent即可到指定目录下获取监控结果
6、文件后,后续处理方式相同。 如果监控项发生改变或者监控项的内容发生变化,可以直接进行配置,不需要另行开发程序。监控数据来源:1应用系统主动向应用监控平台提供数据;2应用监控平台主动获取数据;3通过特殊程序生成数据后向应用监控平台提供;无论是哪一种数据源, agent 应能够在正确的采集数据,并根据不同的数据项对应的在监控界面中展示出来。智能化巡检:支持每个监控网元的监控项,定制监控周期。5.3 综合分析器综合分析器对采集到的监控指标数据进行逻辑分析,能够对多个监控指标进行加、减、乘、除等数学运算;能够对多个监控指标进行与、或、非等逻辑运算。并根据预定义的监控项的告警要求,将监控结果信息发送给展
7、现模块。支持不同时间获取的监控数据之间的比较,来判断是否告警。对综合分析器有较高的要求,需要从业务层面进行分析,通过对业务规则的配置或者开发专门的程序,从业务处理的层面对监控项进行分析。5.4 监控结果信息的展现:监控的结果信息能够通过Web页面进行展现, 并对告警信息用声、 光、色进行告警。告警信息方式:以短信的方式发送到相关处理人员。短信需要支持手机和PHS。短信猫名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 4 页 - - - - - - - - - 或短信网关。
8、支持系统能够对历史的监控数据进行查询和展现。能够提供图形曲线进行分析。监控界面应支持定时自动刷新界面。5.5 权限控制:监控系统能够对多个系统进行监控, 每个监控人员只能对自己监控的监控项进行监控。权限能够控制到每一个监控网元任务。由于监控系统需要访问多个数据库或主机,则需要保存多个主机或数据库的用户和密码,监控平台能够对各个主机的用户和密码进行加密处理,不允许在脚本或配置文件重出现明码。5.6 管理界面要求监控网元,可以定制我的桌面。对监控网元的展示,建议通过树型的方式展示。至于如何展示或者展示的层次,可以进行配置,可以在界面上通过拖拉等方式创建。5.7 故障结果的记录:对监控到故障能够有故障处理人记录处理的方法和步骤,并能够以知识库的方式保存。对知识库能够按照监控项进行查询。5.8 系统的备份和恢复:系统需要提供完整的备份、恢复策略,包括各个被监控主机上的脚本、程序、监控平台自身的配置文件、程序。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 4 页,共 4 页 - - - - - - - - -