《AIX日常检查指导(共9页).doc》由会员分享,可在线阅读,更多相关《AIX日常检查指导(共9页).doc(9页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、精选优质文档-倾情为你奉上AIX主机日常检查指导 一、机房环境检查检测项目方法或结果机房温度10 40 最佳 18 - 22机房湿度8% 80%UPS电源工作情况以及负载查看UPS负载值机房有无设备声音报警无声音报警二、AIX主机硬件状态检查项目方法或结果可用CPUlsdev -Cc processorbindprocessor -q可用内存lsattr -El mem0或lsconf中的Memory Size: XX MB Good Memory Size: XX MB或ASMI中查看memory主机硬盘lsdev -Cc disk故障告警灯不亮关闭小型机橙色告警灯:使用root用户登陆系统
2、,执行“diag”命令,回车继续;1、选择“Task Selection”,回车继续;2、选择“Identify and Attention Indicators”,回车继续;3、选择“Set System Attention Indicator to Normal”,回车,“Set SystemAttention Indicator to Normal”前面出现“”号,表示选定此项;4、按“F7”提交。以上步骤可以熄灭小型机橙色告警灯电源灯常亮HBA卡工作灯闪烁工作。网卡工作灯闪烁工作。系统其它扩展卡三、磁盘阵列硬件状态检查项目方法或结果故障告警灯故障灯不亮电源灯常亮控制器故障灯不亮硬盘灯所
3、有硬盘指示灯一样,无红色或异常颜色告警raid状态使用SM工具连接到两个控制器查看盘阵工作状态。IBM DS4K/5K:A控 192.168.128.101 192.168.129.101B控 192.168.128.102 192.168.129.102fget_config Avmpio_get_config -Av四、AIX操作系统状态检查1,系统信息操作系统版本oslevel -r操作系统补丁instfix -i |grep ML内核bootinfo -K微码lsmcode -cHA版本lslpp -l cluster2,系统状态检测项目方法和结果系统错误日志系统错误报告(Error
4、Log)的检查: 硬件故障检测命令:# errpt -d H -T PERM软件故障检测命令:# errpt -d S -T PERM操作系统mail#mail1) 观察所有未读消息,注意有关diagela的消息。2) 常用命令:h Display headings of group containing message t Display messages in or current message.n Display next message.q Quit 文件系统使用率#df -g%Used为文件系统的使用率。所有文件系统的使用率不能大于80%逻辑卷状态#lsvg -l rootvg不能
5、有“stale”状态的逻辑卷内存交换区使用率#lsps a使用率不能超过70网络通信网卡状态#ifconfig-a 输出判断: 主备网卡的flag为UP属正常。同时检查ip地址和netmask是否正确。路由状态#lsattr-Elinet0网卡通信#pingipaddress输出判断: 用ping命令对/etc/hosts文件中的IP地址进行操作,检测网络是否联通。数据安全rootvg镜像#lsvg l rootvg 检查LPs :PPs是1:2关系是否有最近os备份将一盘新磁带或无用磁带插入磁带机#tctl-f/dev/rmt0rewind(重绕磁带设备)备份#smitty mksysb磁带
6、机是否需要清洗#lsdev -Cc tape查看磁带机黄灯是否亮,亮黄灯表示要清洗。#/usr/lpp/diagnostics/bin/utape -cd rmt0 n显示结果为磁带机使用的小时数,若大于72小时,则不论磁带机黄灯是否亮都应用清洁带清洗。系统dump设置#sysdumpdev-lprimary /dev/lg_dumplv 或 /dev/hd6secondary /dev/sysdumpnullcopy directory /var/adm/rasforced copy flag TRUEalways allow dump FALSEdump compression ON #s
7、ysdumpdev -e#lslv lg_dumplv#lslv -l lg_dumplv若不正确请用下列命令修改:#sysdumdev P p /dev/XXX s /dev/sysdumpnullHA资源组状态查看资源组配置#lsvg o查看资源组卷组是否激活IP地址cat hostsnetstat inHACMP 配置检测 Cluster Verification#lssrc -g cluster查看服务# /usr/sbin/cluster/diag/clconfig -v -tr输出判断:结果无Fail项输出。diag诊断命令顺序为: 1#diag2.Enter3.Diagnosti
8、c Routines4.System Verification5.All Resources6.F7输出判断:结果应为No trouble was found.Topas & Vmstatos参数Vmo参数检查:vmo -a | egrep -i maxclient|minperm|maxperm|strict_maxperm更改:/usr/sbin/vmo -o maxclient%=20 -o minperm%=10 -o maxperm%=20 -o strict_maxperm=1mkitab vmocfg:2:once:/usr/sbin/vmo -o maxclient%=20 -
9、o minperm%=10 -o maxperm%=20 -o strict_maxperm=1limits参数#ulimit a输出判断:结果应为time(seconds) unlimitedfile(blocks) unlimiteddata(kbytes) unlimitedstack(kbytes) 32768memory(kbytes) 32768coredump(blocks) nofiles(descriptors) 2000更改命令为:#vi /etc/security/limitsaio参数# lsdev -Cc aio输出判断:结果应为aio0 Available Asyn
10、chronous I/O# lsattr -El aio0输出判断:结果应为autoconfig available STATE to be configured at system restart Truefastpath enable State of fast path Truekprocprio 39 Server PRIORITY Truemaxreqs 4096 Maximum number of REQUESTS Truemaxservers 10 MAXIMUM number of servers per cpu Trueminservers 1 MINIMUM number
11、of servers True更改命令为:#smitty aioAIO通常只对文件系统起作用,对裸设备没有作用。最大为10X并行磁盘数 Configure Defined Asynchronous I/O 然后回车执行; 、激活系统中的AIO设备 smitty aio - Change / Show Characteristics of Asynchronous I/O回车出现AIO配置对话框,将对话框中STATE to be configured at system restart域选择为“available”,然后回车执行; 注:系统会提示只有在重起后才能生效。HIGH water mar
12、k for pending write I/Os# lsattr -El sys0 |grep maxpout输出判断:结果应为maxpout 33 HIGH water mark for pending write I/Os per file TrueLOW water mark for pending write I/Os# lsattr -El sys0|grep minpout输出判断:结果应为minpout 24 LOW water mark for pending write I/Os per file True更改命令为:#chdev -l sys0 -a maxpout=33 -a minpout=24Syncd参数# grep syncd /sbin/rc.boot输出判断:结果应为nohup /usr/sbin/syncd 10 /dev/null 2&1 &更改命令为:#vi /sbin/rc.bootASMI管理口默认IP:Power5是192.168.2/3.147Power6/7是169.254.2/3.147专心-专注-专业