《2022年2022年机房业务系统应急演练方案 .pdf》由会员分享,可在线阅读,更多相关《2022年2022年机房业务系统应急演练方案 .pdf(7页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、机房业务系统应急演练方案名师资料总结-精品资料欢迎下载-名师精心整理-第 1 页,共 7 页 -目录一、背景.3 二、演练时间与地点.3 三、演练目的.3 四、演练组织机构.3 五、演练影响范围.3 六、系统总体架构.3 七、演练内容及相关安排.3 1.演练前准备.4 1.1 告警信息.4 1.2 演练准备工作.4 1.3 演练前检查工作.4 2.演练操作.5 2.1 登录验证.5 2.3 业务应急验证.5 2.4 业务测试.7 名师资料总结-精品资料欢迎下载-名师精心整理-第 2 页,共 7 页 -一、背景为了保障业务平台安全稳定运行,定于20XX年 X月 X日晚进行业务平台系统的应急演练。
2、二、演练时间与地点演练时间:20XX年 X月 X日 23:00 演练地点:机房三、演练目的1、检验在突发硬件故障的情况下的应急处理能力。2、保证在硬件单点故障的时候,平台仍然能够安全稳定运行。四、演练组织机构演练总负责人:XXX 演练小组成员:XXX、XXX 五、演练影响范围web 服务器做双机互备,在出现单点故障的时候,不影响正常业务的运行。如双台同时出现故障,业务平台将无法正常运行,不能处理平台中的业务。六、系统总体架构七、演练内容及相关安排名师资料总结-精品资料欢迎下载-名师精心整理-第 3 页,共 7 页 -1.演练前准备1.1 告警信息演练期间,将出现以下告警:(1)Web 服务器其
3、中一台8080 端口告警(2)数据库服务器其中一台1521 端口告警(3)文件服务器其中一台21 端口告警1.2 演练准备工作1.2.1 远程登录环境测试以下备份工作要求在操作当日20:00 前确认完成NO.事项主要负责人1 VPN 拨入机房,能够远程登录到平台所有服务器。演练小组成员1.2.2 数据备份以下备份工作要求在测试当日22:00 前确认已完成准备。NO.事项主要负责人1 备份数据库执行准备好的数据库备份脚本演练小组成员2 备份两台web服务器配置文件和程序文件:(1)tomcat 配置文件/usr/local/tomcat/conf目录复制到对方服务器的/bak/目录下面(2)程序
4、文件/usr/local/java目录复制到对方服务器的/bak/目录下面演练小组成员1.3 演练前检查工作NO.事项主要负责人名师资料总结-精品资料欢迎下载-名师精心整理-第 4 页,共 7 页 -1 nagios 监控平台上无异常告警。演练小组成员2 web发布服务与ftp服务运行状态:#ps ef|grep java#ps ef|grep vsftp 演练小组成员2.演练操作2.1 登录验证NO.操作注意事项与操作目的时间点对现网影响主要负责人1 配置好 VPN客户端23:00 业务无影响演练小组成员2 连接成功后SSH到系统23:05-23:10 业务无影响演练小组成员3 取得登陆用户
5、和密码后登陆设备23:10-23:15 业务无影响演练小组成员2.3业务应急验证2.3.1 应急 web 服务器单点故障测试验证:演练时间:23:20-23:30 演练内容web服务器单台主机故障演练目的确认单点故障不影响该节点主机业务的正常开展演练方法及注意事项演练方法:登入 web双机设备主机执行#ps-ef|grep java 查看双机 tomcat 发布是否正常执行关闭其中一台的tomcat 命令#killall java 注意事项:使用命令#ps-ef|grep java查看那台 tomcat 是否关闭访问平台页面是否正常显示名师资料总结-精品资料欢迎下载-名师精心整理-第 5 页,
6、共 7 页 -操作人员XXX 操作时刻23:20 平台检查说明1、登录无故障服务器,查看tomcat 发布器是否正常运行。2、输入平台地址:能正常显示页面。预计结果/现象1、关闭其中一台的tomcat 发布服务后,能正常访问业务平台实际结果/现象恢复方法执行 service tomcat start 重新启动发布服务恢复后现象及验证方法#ps ef|grep java 查看 tomcat 发布进程是否存在#netstat tlnp 查看 java 端口是否已经存恢复时刻恢复时间演练总结2.3.2 应急数据库单点故障:演练内容Oracle 数据库服务器单台主机故障演练目的单点故障不影响该节点主机业务的正常开展平台检查说明登录无故障数据库服务器,查看数据库是否运行正常。应用程序与PL/SQL客户端等连接数据库是否正常等名师资料总结-精品资料欢迎下载-名师精心整理-第 6 页,共 7 页 -恢复方法重新启动故障节点的数据库实例与监听等;启动完成后查看数据库运行状态等;恢复后现象及验证方法ps aux|grep ora_等命令查看后台进程是否已成功启动等;或 sqlplus/as sysdba sql desc tab;查看此实例是否已可成功访问数据库等;恢复时刻恢复时间2.4业务测试测试时间:测试报告文档:名师资料总结-精品资料欢迎下载-名师精心整理-第 7 页,共 7 页 -