《2022年服务器机房点检标准 .pdf》由会员分享,可在线阅读,更多相关《2022年服务器机房点检标准 .pdf(3页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、服务器点检标准:一 、点检的 目的在系统运行时期,需要每日定时检查各设备的运行状况,提早发现问题和解决问题,确保整个系统持续、稳定地运行。二 、点检的 内容需要点检的设备清单如下:1.机房环境的温度和湿度2.2 台 IBM P650 服务器3.1 台 IBM 7133-D40 磁盘阵列机4.1 台 CISCO PIX 515E 防火墙5.2 台 CISCO catalyst 4500 三层交换机6.1 台 APC UPS 不间断电源7.2 台 海尔空调三 、点检规 程1.机房温、湿度情况查看并记录机房的温、湿度情况。当发现空调机故障或计算机机房环境温度、湿度超出允许范围时(温度大于24 度,湿
2、度小于20%)或空调机发生报警时,应及时向空调维修部门报修。当计算机机房环境温度达摄氏26 度或湿度小于20%时,工作人员再次向公司相关部门报告并紧急呼叫空调维修部门要求组织紧急抢修,同时做好停机前的各项准备工作。并密切注意机房环境温、湿度的变化。一旦计算机机房环境温度达摄氏28 度或湿度大于85%或小于 15%时,且在短期内无修复的可能并温度在继续上升时,由工作人员实行强制关机并报公司相关部门。2. P650 服务器2.1 文件系统点检用 root 用户登录两个服务器的控制台或仿真终端上,检查所有文件系统的使用率,键入如下命令:df -kFilesystem 1024-blocks Free
3、 %Used Iused %Iused Mounted on /dev/hd4 163840 10864 94% 1502 2% / /dev/hd2 1703936 7892 100% 49574 12% /usr /dev/hd9var 32768 13300 60% 674 9% /var /dev/hd3 557056 474016 15% 158 1% /tmp /dev/hd1 32768 31640 4% 70 1% /home /dev/ptf_lv 3276800 597408 82% 1377 1% /ptf 检查 %Used一栏,如果有文件系统使用率超过90,则需要适当放
4、大此文件系统。命令如下:名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 1 页,共 3 页 - - - - - - - - - chfs -a size=+100M /usr将/usr 放大 100M 空间将所有使用率超过90的文件系统信息收集,并通知系统工程师。2.2 错误报告的点检用 root 用户登录两个服务器的控制台或仿真终端上,检查所有错误信息报告,键入如下命令:errpt | more IDENTIFIER TIMESTAMP T C RESOURCE_NAME DESC
5、RIPTION AFA89905 0422205503 I O grpsvcs Group Services daemon started 192AC071 0422201003 T O errdemon ERROR LOGGING TURNED OFF 864D2CE3 0422195603 P S topsvcs NIM thread blocked A6DF45AA 0422093103 I O RMCdaemon The daemon is started. 2BFA76F6 0422090403 T S SYSPROC SYSTEM SHUTDOWN BY USER 9DBCFDEE
6、 0422093103 T O errdemon ERROR LOGGING TURNED ON 625E6B9A 0422090403 P H ssa1 ADAPTER DETECTED OPEN SERIAL LINK 625E6B9A 0422090303 P H ssa0 ADAPTER DETECTED OPEN SERIAL LINK 499B30CC 0422083203 T H ent0 ETHERNET DOWN 当 T 一栏出现 P,C 一栏出现 H 时,可能有硬件出现问题,需执行如下操作errpt -a /tmp/errpt.out 然后将 errpt.out 文件下传,
7、并发给系统工程师进一步分析、查找错误原因。2.3 网络状况的点检检查两个服务器IP 地址是否能够PING 通网关。utsp01 *.*.*.2 utsp02 *.*.*.3 Gateway *.*.*.1 3. IBM 7133 磁盘阵列1) 打开机柜前门, 检查机柜中磁盘阵列的状态灯, 如果两排共10个磁盘状态灯均为绿色, 表示磁盘状态正常。如果出现黄灯,表示磁盘有硬件故障,应紧急报告相关工程师处理。2)用 root 用户登录两个服务器的控制台或仿真终端上,用操作系统命令检查磁盘情况,键入如下命令:utsp01root/lsdev -Cc disk hdisk0 Available 1Z-0
8、8-00-8,0 16 Bit LVD SCSI Disk Drive hdisk1 Available 1Z-08-00-9,0 16 Bit LVD SCSI Disk Drive hdisk2 Available 1Z-08-00-10,0 16 Bit LVD SCSI Disk Drive hdisk3 Available 14-08-L SSA Logical Disk Drive hdisk4 Available 14-08-L SSA Logical Disk Drive 名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - -
9、- - 名师精心整理 - - - - - - - 第 2 页,共 3 页 - - - - - - - - - 硬盘状态为Available ,表示磁盘正常。4. 数据备份点检用 root 用户登录两个服务器的控制台或仿真终端上,检查数据备份完成情况,键入如下命令:utsp01root/tail -f /home/scripts/log/tar_fs.out Wed Aug 17 13:15:05 BEIST 2005 应用程序备份到硬盘成功! Wed Aug 17 13:16:11 BEIST 2005 应用程序备份到磁带成功! 5. 防火墙点检看防火墙前面板指示灯三个POWER,ACT一直亮
10、黄灯,NETWORK一直闪黄灯,为正常情况。6. 三层交换机点检看交换机前面都亮黄灯,INPUT OK 、 FAN OK 、FAN STATUS 都亮黄灯。 如果 OUTPUT FAIL 亮起红灯,就是三层交换机出问题了,需要报修。7. UPS 点检看 UPS 显示面板,负载一般为26%,报警灯为绿色,如果变红就是有警报,需要按*按键,查看报警信息。8. 空调点检看空调显示面板,为室温,一般在20 摄氏度左右,并且空调模式应为制冷状态。伸手在出风口处,看是否有冷气。如果温度不对可按键查看设定温度是否正常(停电后初始化为24摄氏度)。名师资料总结 - - -精品资料欢迎下载 - - - - - - - - - - - - - - - - - - 名师精心整理 - - - - - - - 第 3 页,共 3 页 - - - - - - - - -