《IT运维之自动化运维.docx》由会员分享,可在线阅读,更多相关《IT运维之自动化运维.docx(6页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、所谓自动化运维,即在最少的人工干预下,结合运用脚本与第三方工具,保证 业务系统7*24小时高效稳定运行。这应该是所有业务系统运维终极目标。按照运维的发展成熟度来看,运维大致可分为三个阶段:O依靠纯手工,重复的进行软件的部署与运维;O通过编写脚本,方便的进行软件的部署与运维;O借助第三方工具,高效的进行软件的部署与运维;我们对运维的要求通常是:1、事前预警对各业务系统和底层的软硬件进行监控,以保证业务系统的 正常运行。做到事前预警,避免故障来临,后知后觉。2、事中解决天有不测风云,即使是再完美的方案也可能有预料之外的故障,为保证 在最短时间内恢复业务,系统必须能快速定位故障点。并进行告警分派并解
2、决(三)、事后闭环这里更加强调运维管理的流程方法,针对已产生的告警进行告警分派, 解决。形成告警的闭环管理。要实现以上要求,需要一个经验丰富且高效的运维团队,随着我们的业务系统 不断增加,业务量的不断上升,传统依靠纯手工的运维方式,逐渐被淘汰。我们更多的将注意力集中在通过脚本与借助第三方工具的运维方式上,这样不 仅能满足我们对运维的要求,解放生产力,还能使我们的运维管理更加规范 化,标准化,从而真正意义上的实现自动化运维。自动化运维的实现工具(脚本与第三方工具,通常这两者须结合使用。)脚本(SHELL、DOC)1、硬件状态监控:通过编写脚本,对CPU、MEM DISK、TOPProcesses
3、 Network等关键硬件参数状态进行实时监控,发现异常触发告警信息给管理 员;2、业务拨测:通过编写脚本对常用业务的网站实时进行拨测,发现网站页面异 常触发告警信息给管理员;3、系统安全加固:通过编写脚本对常用的Windows、Linux、Unix服务器进行 快速的安全加固;4、数据备份:通过编写脚本实现关键业务数据,关键日志,数据库,操作系 统,中间件等的快速备份(本地与异地);第三方管理工具(运维监控系统一PIGOSS BSM )针对一些比较重要的业务系统,我们建议可以使用比较成熟的第三方运维监控 工具。运维监控工具一般都能实现以上运维需求,而且管理操作起来也更加方 便。服务器监控PIG
4、OSS BSM可通过带外、带内方式对PC服务器、小机及刀箱底层硬件状态进 行全面的监控,包括处理器、内存、硬盘、电源、风扇、温度、插槽等硬件状 态和配置信息,代替管理员的日常机房巡检工作,使管理员实时了解到服务器 底层硬件的运行情况IT运维监控平台大屏信现=7所有资源 硬件监测主机设备数据库网络设备更多分组,图指标列表资源概要图指标列表资源概要资源 硬件监测 DELL服务器服务器信息侬DELL服务器10.2 1633DELL服务器10.2 1633雌:68.8%ip地址品牌型号机箱电源Dell服务器节状态异常。状态正常告警数量:13创建时间2017/08/29硬件健康度电源电压。状态JE常。状
5、态一正常O状态.正常 O处理器内存III IIIIIIIIII淳常。状态:正常Oracle,虚拟化、AIX等专业的应用监控O状态.舁常。状态.异常PIGOSS BSM对于Oracle的监控是汲取了专业的Oracle DBA的一线经验,把实 际应用场景对于Oracle的关注信息沉淀到产品中,其中SQL-TOP排序、ORA错 误日志等功能得到用户的极大认可,通过一体化视图呈现Oracle的整体运行状o虚拟化监控通过图形化方式构建出宿主机、虚拟机、虚拟网络、数据存储间资 源使用情况,从全局到局部的一体化视图,便于用户直观全面了解当前虚拟化 环境的健康状况。合我的关注大麻现状态监控=资产管理0 嘴 O
6、告警管理拓扑管理报表管理e工具箱上超级管理员个人信息所有资源主机网络设备数据库更多分组O 标签管理分组管理阔值模板I资源定义资源视图指标列表资源 数据库 Oracle Oracle保存为默认恢复默认资源概要基础信息表空间信息SQL-TOP列设置添加窗口Oracle健康度:97.2%指标数:54告警数量:5创建时间:2019/07/31标签1应用系统Oracle主机基本信息O :;:0 O x数据库详细信息O X0 0 XIPifitlt端口1521连接数与会话信息当前状态ACTIVE数据库版本活动会话数43会话数52启动时间2018-12-03 22:53:17会话使用率11.02进程使用率1
7、8.33CPU内存统计摘要.语句执行命中率94.36pin命中率1002命中率98.59无效索引-重做日志空间等待融排队等待畋一CPU总使用率6.58%内存使用率48.33%死锁和超时总数-会话堵塞数-内存信息PGA一Buffer Cache可用空间:446.25MB总空间:624MB可用空间:66.06MB总空间:1552MB数据文件信息O0 0 X日志文件大小数据文件大小临时文件大小600MB2710MB161MB进程信息0O 0 XPMON进程内存1.63MBSMON进程内存2.93MBDBWR进程内存10.61MBLGWR进程内存2.13MBCKPT进程内存1.96MBREC。进程内存
8、2.55MB可用空间:1024MB 总空间:1552MB业务大屏PIGOSS BSM的业务大屏对各类业务系统,从基础网络、系统服务、中间件、数 据库和存储设备多个层级进行全方位监控,为运维管理人员提供全局的业务健 康度一览。业务雷达图及状态矩阵实时扫描各业务系统的最新告警及业务健康 度,产出故障可直接追溯到最底层的告警源设备,便于运维工程师快速找到故 障点。IT运缰监控平台诲覆大黑rf 3 只 admin业务状态矩阵险分状图矩阵业务健康度会员管理3130 ;信贷系统0 一隹警详情:EI4C-VNX101011.10;11-04 1707=-三三三三 100%移动支付0 100%多趋势对比图11
9、/0416cO211/04 1630711/04161211/0416:1711/041&2211/041W7 11AM 16:3211/0416c37 ll/O 1&4211/041&4711/04 165211/041&5711/04 17X)2第三方的运维工具是运维工作中不可或缺的一部分,如何构建适合自己的运维 工具,每家的需求不一样,每个运维面对的痛点也不尽相同,但不管有什么需 求,多少需求,万变不离其宗。运维监控的路上,我们一起前行。解决方案 PIG0SS保障制造业全面数字化转型升级(制造业运维解决方案) “取消高速公路省界收费站”运维解决方案 PIG0SS与各专业服务商的多种合作模式 PIGOSS BSM签约国家统计局浙江调查总队助力其打造智能运维环境PIGOSS TOC智慧服务中心解决方案