《数据库运维作业指导书.doc》由会员分享,可在线阅读,更多相关《数据库运维作业指导书.doc(111页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、数据库运维作业指导书 前前 言言 为进一步加强数据库运维管理,规范数据库运维管理作业过程, 统一数据库管理策略,强化数据库标准化管理,保障应用系统的稳 定运行及服务的持续性,减少故障停机时间,特制订本作业指导书 本作业指导书由*提出。 本作业指导书由*管理。 本作业指导书由*负责解释。 本作业指导书主要起草单位: * 本作业指导书主要起草人:* 目目 次次 *数据库运维作业指导书数据库运维作业指导书.1 1 1 总则总则.1 2 2 适用范围适用范围.1 3 3 规范性引用文件规范性引用文件 .1 4 4 支持文件支持文件.1 5 5 术语与定义术语与定义.1 6 6 安全及预控措施安全及预控
2、措施 .2 6.1 关闭数据库服务.2 6.2 巡检.2 6.3 数据备份 .2 6.4 数据恢复.2 6.5 数据库安全加固.2 6.6 删除数据库用户账号.2 6.7 定期维护.3 6.8 数据文件或日志文件的存放空间扩容 .3 7 7 作业准备作业准备.3 8 8 作业周期作业周期.3 9 9 工期定额工期定额.4 1010 作业流程作业流程.5 10.1 启动系统 .5 10.2 停止系统 .6 10.3 数据备份有效性检查指导.7 10.4 数据恢复 .8 10.5 日常巡检 .9 10.6 深度巡检 .10 10.7 周定期维护 .11 10.8 月定期运维 .12 10.9 其他
3、定期维护 .13 10.10 安全基线配置 .17 1111 作业项目作业项目.18 11.1 ORACLE数据库.18 11.2 SQL SERVER 数据库.25 11.3 MY SQL .29 1212 作业中异常现象及主要对策作业中异常现象及主要对策.33 12.1 ORACLE 数据库.33 12.2 SQL SERVER 数据库.35 12.3 MY SQL 数据库 .36 1313 附录附录 .36 0 *数据库运维作业指导书数据库运维作业指导书 1 1 总则总则 为进一步加强数据库运维管理,规范数据库运维管理 作业过程,统一数据库管理策略,强化数据库标准化管理, 保障应用系统的
4、稳定运行及服务的持续性,减少故障停机 时间,特制订本作业指导书 2 2 适用范围适用范围 本作业指导书适用于*数据库管理系统(DBMS)运行 管理及维护,指导对象包括*公司、*公司的数据库管 理员。 3 3 规范性引用文件规范性引用文件 - (*- 2014) - (*- 2014) 1 - (*- 2014) - (*- 2014) - (*- 2014) 4 4 支持文件支持文件 附件 SQL SERVER 日常运维作业支持文件.docx *数据库运维作业系统环境表(含地址、用户名、 密码) 5 5 术语与定义术语与定义 5.1 数据库管理系统(DBMS) 数据库管理系统(Database
5、 Management System)是一种 操纵和管理数据库的大型软件,用于建立、使用和维护数 据库。它对数据库进行统一的管理和控制,以保证数据库 的安全性和完整性。用户通过 DBMS 访问数据库中的数据, 2 数据库管理员也通过 dbms 进行数据库的维护工作。 5.2 统计信息 统计信息是一个数据库及数据库对象的详细集合,这 些统计信息被用于优化器的使用,让其为每条 SQL 语句选 择最佳的执行计划。 5.3 热备份 指在数据库正常运行情况下执行备份的备份方式。 6 6 安全及预控措施安全及预控措施 6.1 关闭数据库服务 6.1.1 风险分析: 没有严格按照流程关闭数据库服务,可能造成
6、关闭耗时 过长、数据丢失,甚至 无法再次启动数据库。 6.1.2 安全措施: 严格按照流程执行数据库服务关闭操作。 3 6.2 巡检 6.2.1 风险分析: 某些巡检脚本可能会批量收集数据,执行时影响数据库 性能。 6.2.2 安全措施: 筛选出这样的巡检脚本,避免在业务高峰期执行批量数 据收集。 6.3 数据备份 6.3.1 风险分析: 执行数据备份时会降低数据库性能;同时也会占用大量 存储空间,可能造成磁盘空 间满导致备份失败。 6.3.2 安全措施: 为系统制定针对性的数据备份策略,测试相应备份脚本, 定期检查备份情况,做好备份恢复演练。 6.4 数据恢复 6.4.1 风险分析: 4 执
7、行错误的数据恢复流程,造成数据恢复失败,数据损 坏。 6.4.2 安全措施: 针对不同的恢复场景制定正确的恢复流程,定期进行恢 复演练。 6.5 数据库安全加固 6.5.1 风险分析: 若数据库升级补丁失败,可能造成数据库服务无法正常 启动。 6.5.2 安全措施: 变更操作前按正确的步骤停止数据库服务,备份数据库 数据及安装目录。 6.6 删除数据库用户账号 6.6.1 风险分析: 数据库管理员误删除用户账号导致某些业务操作无法执 行,或导致数据丢失。 6.6.2 安全措施: 5 当用户账户需要删除时,使用锁定账号方式实现拒绝用 户访问效果,当发现该用户账户需使用时可快速恢复 6.7 定期维
8、护 6.7.1 风险分析: 在业务高峰期执行一些消耗数据库性能的维护操作,导 致数据库处理能力急剧下降,甚至造成数据库挂起。如碎 片整理、统计信息收集等. 6.7.2 安全措施: 避免在非业务高峰期执行定期维护操作,合理设置执行 时间。 6.8 数据文件或日志文件的存放空间扩容 6.8.1 风险分析: (1)由于添加或扩展数据文件,导致磁盘空间使用率过 高(接近 100%) ,将会引起数据库服务不可用; (2)日志文件未能及时清理,累计到一定数量会导致磁 盘空间满,从而导致数据库服务不可用。 6.8.2 安全措施: 6 定期检查数据文件和日志文件存放的磁盘空间,避免由 于磁盘空间满导致数据库服
9、务异常。 7 7 作业准备作业准备 *数据库管理系统定期维护需要做好以下准备工作: 序序 号号 名称名称数量数量 备注备注 1 作业通知发布 1 作业包括计划或 非计划 2 变更申请 1 1 3 远程运维审计系统 (HAC)帐号 1 4 数据库服务器操 作系统管理员帐号 1 每一台服务器对 应 1 个账号 5 数据库管理员账 号 1 每一套数据库对 应 1 个账号 6 笔记本电脑 1 7 7 安全扫描工具 1 8 人员要求 2 3 年运维工作经 验以上 8 8 作业周期作业周期 序序 号号 名称名称作业周期作业周期备注备注 1 启动无固定周期 2 停止无固定周期 3 数据备份及有 效性检查 1
10、 按需进行 4 数据恢复 1 按需进行 5 日常巡检 每工作日 1 次 仅对大集中模式 关键应用系统 6 深度巡检每周 1 次 仅对大集中模式 关键应用系统 8 7 周定期维护每周一次 8 月定期维护每月一次 9 其他定期维护按需进行 根据不同应用系 统的需要定制作 业周期。 10 安全基线配置 按需进行 9 9 工期定额工期定额 序号序号工作项工作项定额时间定额时间备注备注 1 启动3 小时 2 停止2 小时 3 数据备份及有 效性检查 3 小时 4 数据恢复1 天 5 日常巡检1 小时 6 深度巡检3 小时 7 周定期维护2 小时 9 8 月定期运维3 小时 9 其他定期维护3 小时 10
11、 安全基线配置1-24 小时 根据安全加固项 来决定时长 1010 作业流程作业流程 10.1 启动系统(Q/*-L1) * * * * * * * * *公公司司应应用用系系统统启启动动作作业业流流程程 信信息息中中心心 信信息息中中 心心 * * *运运维维 科科 软软件件 平平台台 运运维维 专专责责/ / 系系统统 管管理理 员员 应应用用 系系统统 运运维维 专专责责/ / 应应用用 管管理理 员员 开始启动操作系统启动集群应用 启动数据库系统状态检查 启动应用 检查应用状态结束 10 10.2 停止系统(Q/*-L2) * * * *公公司司应应用用系系统统停停止止作作业业流流程程
12、信信息息中中心心 信信息息中中 心心 * * *运运维维 科科 应应用用 系系统统 运运维维 专专责责/ / 应应用用 管管理理 员员 软软件件 平平台台 运运维维 专专责责/ / 系系统统 管管理理 员员 开始系统状态检查 停止应用 停止数据库 停止集群应用 停止操作系统结束 11 10.3 数据备份有效性检查指导(Q/*-L3) 应应用用系系统统数数据据备备份份及及有有效效性性检检查查作作业业流流程程信信息息中中心心* * * *公公司司 信信息息中中 心心 * * *运运维维 科科 软软件件 平平台台 运运维维 专专责责/ / 系系统统 管管理理 员员 开始 检查热备份日志信 息 检查主
13、数据库的归 档日志 检查备份路径下文 件生产时间 检查备份集的相关 备份内容 结束 12 10.4 数据恢复(Q/*-L4) 应应用用系系统统数数据据恢恢复复作作业业流流程程信信息息中中心心 逻辑备份导入物理备份恢复 * * * *公公司司 信信息息中中 心心 * * *运运维维 科科 软软件件 平平台台 运运维维 专专责责/ / 系系统统 管管理理 员员 应应用用 系系统统 运运维维 专专责责/ / 应应用用 管管理理 员员 开始 创建相关表空间 创建用户 导入逻辑备份数据 重建索引、约束等 创建数据库 启动应用 结束 还原控制文件 还原数据文件 恢复数据库 启动数据库 还原参数文件 13
14、10.5 日常巡检(Q/*-L5) 应应用用系系统统日日常常巡巡检检作作业业流流程程 信信息息中中心心 * * * *公公司司 信信息息中中 心心 * * *运运维维 科科 软软件件 平平台台 运运维维 专专责责/ / 系系统统 管管理理 员员 开始 确认所有的数据库 状态正常 检查文件系统的使 用(剩余空间) 检查日志文件和 trace文件记录 检查数据库当日备 份的有效性 检查数据文件的状 态 检查表空间的使用 情况 检查数据库系统性 能 结束 14 10.6 深度巡检(Q/*-L6) 应应用用系系统统深深度度巡巡检检作作业业流流程程信信息息中中心心 信信息息中中 心心 * * *运运维维
15、 科科 软软件件 平平台台 运运维维 专专责责/ / 系系统统 管管理理 员员 * * * *公公司司 开始 检查文件完整性检查对象关系完整 性 检查数据文件坏块 检查备份的完整有 效 检查数据库无效对 象 检查告警日志全方位检查数据库性能评估 结束 15 10.7 周定期维护(Q/*-L7) 应应用用系系统统周周定定期期维维护护作作业业流流程程信信息息中中心心 * * * *公公司司 软软件件 平平台台 运运维维 专专责责/ / 系系统统 管管理理 员员 * * *运运维维 科科 信信息息中中 心心 开始 监控数据库对象的 空间扩展情况 监控数据量的增长 情况 处理无效的数据库 对象 处理失
16、效的约束 处理无效的触发器 结束 16 10.8 月定期运维(Q/*-L8) 应应用用系系统统月月定定期期运运维维作作业业流流程程信信息息中中心心* * * *公公司司 信信息息中中 心心 * * *运运维维 科科 软软件件 平平台台 运运维维 专专责责/ / 系系统统 管管理理 员员 开始 对索引进行维护管 理 对索引进行重建 对查询语句进行分 析 回收数据库高水位 对数据库性能进行 调整 规划表空间管理 规划下一步空间管 理 检查数据库健康 结束 17 10.9 其他定期维护(Q/*-L9) 开始 查看数据库定时 收集统计信息的 服务 确定统计信息的 采样率 进行统计信息收集 结束 应应用
17、用系系统统其其他他定定期期维维护护作作业业流流程程信信息息中中心心 统计信息收集 信信息息中中 心心 * * *运运维维 科科 软软件件 平平台台 运运维维 专专责责/ / 系系统统 管管理理 员员 * * * *公公司司 18 应应用用系系统统其其他他定定期期维维护护作作业业流流程程信信息息中中心心 开始 删除回收站的表数 据 回收站管理 清空回收站数据 结束 * * * *公公司司 信信息息中中 心心 * * *运运维维 科科 软软件件 平平台台 运运维维 专专责责/ / 系系统统 管管理理 员员 19 应应用用系系统统其其他他定定期期维维护护作作业业流流程程信信息息中中心心 开始 备份数
18、据 检查无效对象 修改无效对象 结束 删除无效对象 无效对象管理 * * * *公公司司 信信息息中中 心心 * * *运运维维 科科 软软件件 平平台台 运运维维 专专责责/ / 系系统统 管管理理 员员 20 应应用用系系统统其其他他定定期期维维护护作作业业流流程程信信息息中中心心 开始 备份数据 检查数据库碎片情 况 执行碎片管理 结束 检查数据库备份 情况 数据库碎片整理 软软件件 平平台台 运运维维 专专责责/ / 系系统统 管管理理 员员 * * *运运维维 科科 信信息息中中 心心 * * * *公公司司 21 10.10 安全基线配置(Q/*-L10) 应应用用系系统统安安全全
19、基基线线配配置置作作业业流流程程信信息息中中心心 开始 定期检查数据库 用户数量,配置 数据库用户基线 定期检查数据库 权限分配,配置 数据库权限基线 定期检查数据库表 空间容量,配置数 据库容量基线 , 结束 * * * *公公司司 信信息息中中 心心 * * *运运维维 科科 软软件件 平平台台 运运维维 专专责责/ / 系系统统 管管理理 员员 22 1111 作业项目作业项目 11.1 Oracle 数据库 序号序号工作内容工作内容工作内容及方法工作内容及方法注意事项注意事项 1 单台服务 器的数据 库启动 1. 启动操作系统 2. 启动数据库监听程序 AIX 或 linux 操作系统
20、: #su - oracle $lsnrctl start Windows 操作系统: 使用 cmd 命令进入控制台 输入 lsnrctl start 并回车 3.启动数据库 AIX 或 linux 操作系统: $sqlplus / as sysdba SQLstartup Windows 操作系统: C: sqlplus / as sysdba SQLstartup 4. 检查实例状态 SQLselect * from gv$instance; 23 若正常启动,下列字段结果为: INST_ID 字段显示所有实例 ID STATUS 字段的值等于 OPEN LOGINS 字段的值等于 ALL
21、OWED DATABASE_STATUS 字段的值等于 ACTIVE ACTIVE_STATE 字段的值等于 NORMAL 2 单台服务 器的数据 库停止 1. 登录数据库实例并检查实例状态 AIX 或 linux 操作系统: #su - oracle $sqlplus / as sysdba SQLselect * from gv$instance; Windows 操作系统: C: sqlplus / as sysdba SQLselect * from gv$instance; 2. 停止监听 SQLlsnrctl stop 3.关闭数据库实例 SQLshutdown immediate
22、 3 数据库集 群启动 1. 启动操作系统 略 2. 启动数据库集群软件 24 AIX 或 linux 操作系统: #su - oracle(适用 oracle10g) #su - grid (适用 oracle 11g) $crsctl start crs Windows 操作系统: C: crsctl start crs 3. 启动数据库实例 AIX 或 linux 操作系统: #su - oracle (适用 oracle10g) #su - grid (适用 oracle10g $sqlplus / as sysdba SQLstartup Windows 操作系统: C: sqlpl
23、us / as sysdba SQLstartup 4. 检查实例状态 SQLselect * from gv$instance; 若正常启动,下列字段结果为: INST_ID 字段显示所有实例 ID STATUS 字段的值等于 OPEN LOGINS 字段的值等于 ALLOWED DATABASE_STATUS 字段的值等于 ACTIVE 25 ACTIVE_STATE 字段的值等于 NORMAL 5. 启动应用 略 6. 检查应用状态 略 4 集群数据 库停止 1.检查集群状态 AIX 或 linux 操作系统: su - oracle $crs_stat t Windows 操作系统:
24、C: $crs_stat t 2.查看数据库状态 AIX 或 linux 操作系统: su - oracle $sqlplus / as sysdba SQLselect * from gv$instance; Windows 操作系统: C: sqlplus / as sysdba SQL select * from gv$instance; 3.停止应用 略 4.停止监听 26 AIX 或 linux 操作系统: $ srvctl stop listener -n /所有节点执行 5.停止实例 $ srvctl stop database -d -i /所有节点执行 或执行 $ srvct
25、l stop database -d /在其中一节点执行,同时停止双节点 实例 Windows 操作系统: C: srvctl stop listener -n /所有节点执行 5.停止实例 C: srvctl stop database -d -i /所有节点执行 或执行 C: srvctl stop database -d /在其中一节点执行,同时停止双节点 实例 27 6.停止集群应用 AIX 或 linux 操作系统: $ srvctl stop nodeapps -n Windows 操作系统: C: srvctl stop nodeapps -n 5 数据备份 有效性检 查 数据库
26、备份步骤: 1.RAMN 备份 RMAN backup database plus archivelog delete input; /备份全库及控制文件、服务器参数文 件与所有归档的重做日志,并删除旧的 归档日志 数据库备份有效性检查指导 1. 检查热备份日志信息 AIX 或 linux 操作系统: $more /.log 查 看是否存在 error/warning 关键字 Windows 操作系统: C: type / .log 查看是否存在 error/warning 关键 字 28 2. 检查主数据库的归档日志 AIX 或 linux 操作系统: ls -l 查看是否缺失 归档 Win
27、dows 操作系统: 进入 查看是否缺失归 档 3. 检查备份路径下文件产生的时间 AIX 或 linux 操作系统: ls -l 查看产生时间 与备份时间是否匹配 Windows 操作系统: 进入 查看产生时间与 备份 4. 检查备份集的相关备份内容 AIX 或 linux 操作系统:e $rman target / RMANlist backup 查看备份是否完整 Windows 操作系统: C: rman target / RMANlist backup 查看备份是否完整 5.查看 RMAN 日志 29 查看 rman 所有备份的历史信息 SELECT j.session_key, TO
28、_CHAR (J.START_TIME, yyyy-mm-dd hh24:mi:ss) start_time, TO_CHAR (j.end_time, yyyy- mm-dd hh24:mi:ss) end_time, J.TIME_TAKEN_DISPLAY, J.INPUT_BYTES_DISPLAY INPUT(SUM), J.OUTPUT_BYTES_DISPLAY OUTPUT(SUM), J.OUTPUT_DEVICE_TYPE, J.STATUS, J.INPUT_TYPE, J.INPUT_BYTES_PER_SEC_DISPLAY INPUT(s), J.OUTPUT_BY
29、TES_PER_SEC_DISPLAY OUTPUT(s) FROM V$rman_Backup_Job_Details 30 j; 查看 rman 的日志信息 set lines 120 set pages 200 set feedback off set verify off set scan on select output from v$rman_output o where o.session_key= 6 数据恢复 1.imp/impdp 数据导入方式 创建数据库 AIX 或 linux 操作系统: #su - oracle $dbca /进入图形化界面创建数据库 Windows
30、操作系统: C: dbca /进入图形化界面创建数据 库 创建相关表空间 AIX 或 linux 操作系统: #su - oracle $sqlplus / as sysdba Windows 操作系统: 31 C: sqlplus / as sysdba SQLcreate tablespace datafile /.dbf size k /最大不超多 (32*1024*1024-1)K 创建用户 AIX 或 linux 操作系统: #su - oracle $sqlplus / as sysdba Windows 操作系统: C: sqlplus / as sysdba SQLcreate
31、 user defualt tablespace ; 逻辑备份导入方式 AIX 或 linux 操作系统: # su - oracle 注意区分操作系统 $ imp / file= full=y ignore=y Windows 操作系统: C: imp / file= full=y 32 ignore=y 2、RMAN 恢复方式 登录 RMAN 窗口 AIX 或 linux 操作系统: $ rman target / Windows 操作系统: C: rman target / 启动数据库到 MOUNT 状态 RMAN startup mount; 还原数据库 RMAN restore da
32、tabase; 恢复数据 RMAN recover database; 33 启动数据库 RMAN alter database open; 1. 确认所有的数据库状态正常 AIX 或 linux 操作系统: su - oracle $sqlplus / as sysdba SQLselect * from gv$instance; Windows 操作系统: C: sqlplus / as sysdba SQLselect * from gv$instance; 2. 检查文件系统的使用(剩余空间) AIX 或 linux 操作系统: #df -g /IBM-AIX #bdf /HP-UNIX #df -h /linux Windows 操作系统: 打开我的电脑查看磁盘状态 /windows 7 日常巡检 3. 检查日志文件和告警文件记录 AIX 或 linux 操作系统: more /crsd.log more 34 /alter_.log Windo