《AIX高级系统管理培训手册.ppt》由会员分享,可在线阅读,更多相关《AIX高级系统管理培训手册.ppt(141页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、IBM Systems&Technology Group 2006 IBM CorporationAIX 高级系统管理 IBM Systems&Technology Group 2006 IBM Corporation第四章磁盘管理IBM Systems&Technology Group 2003 IBM Corporation学会描述学会描述LVM的信息的信息解决解决ODM库的问题库的问题如何建立镜像如何建立镜像可以解释可以解释quorum机制机制能够描述物理硬盘的状态能够描述物理硬盘的状态3IBM Systems&Technology Group 2003 IBM CorporationL
2、VM概念4IBM Systems&Technology Group 2003 IBM CorporationMirror 概念5IBM Systems&Technology Group 2003 IBM CorporationStripe的概念6IBM Systems&Technology Group 2003 IBM CorporationRaid级别的介绍常用的常用的raid级别级别0,1,5,10的区别的区别不同的不同的raid的不同的优势的不同的优势了解系统级了解系统级raid0和和raid1的概念的概念介绍硬件级别的介绍硬件级别的raid产品(产品(fastT,ssa)7IBM Sy
3、stems&Technology Group 2003 IBM Corporation基本的逻辑卷管理了解什么是了解什么是LVM管理管理如何创建卷组如何创建卷组如何识别如何识别pv如何使用如何使用pv如何创建如何创建lv如何创建文件系统如何创建文件系统Lv和和fs的关系的关系如何管理如何管理lv和和fs8IBM Systems&Technology Group 2003 IBM Corporation概念Vgda(卷组描述区)(卷组描述区)Vgsa(由镜像产生)(由镜像产生)LVCB(逻辑卷控制块)(逻辑卷控制块)AIX文件文件9IBM Systems&Technology Group 200
4、3 IBM CorporationVGDA10IBM Systems&Technology Group 2003 IBM Corporation如何查看VGDA11IBM Systems&Technology Group 2003 IBM Corporation如何查看LVCB12IBM Systems&Technology Group 2003 IBM CorporationODMandVGDA13IBM Systems&Technology Group 2003 IBM CorporationPV在ODM中的信息14IBM Systems&Technology Group 2003 IBM
5、 Corporation续15IBM Systems&Technology Group 2003 IBM Corporation续16IBM Systems&Technology Group 2003 IBM Corporation与VG相关的ODM库17IBM Systems&Technology Group 2003 IBM Corporation续18IBM Systems&Technology Group 2003 IBM Corporation与LV相关的ODM19IBM Systems&Technology Group 2003 IBM CorporationODM相关的LV的错误
6、20IBM Systems&Technology Group 2003 IBM Corporation解决问题21IBM Systems&Technology Group 2003 IBM CorporationRootvg的ODM错误22IBM Systems&Technology Group 2003 IBM Corporation下面介绍mirror23IBM Systems&Technology Group 2003 IBM Corporation系统级的镜像Rootvg镜像镜像镜像的方法镜像的方法镜像以后的工作镜像以后的工作如何完成一个完整的如何完成一个完整的rootvg镜像镜像24
7、IBM Systems&Technology Group 2003 IBM Corporation非rootvg的镜像概念概念Mklvcopy镜像的方法镜像的方法如何查询镜像的结果如何查询镜像的结果25IBM Systems&Technology Group 2003 IBM Corporation镜像中的问题26IBM Systems&Technology Group 2003 IBM Corporation如何创建mirrorLV27IBM Systems&Technology Group 2003 IBM CorporationVGDA的数量28IBM Systems&Technolog
8、y Group 2003 IBM CorporationQuorum的概念29IBM Systems&Technology Group 2003 IBM Corporation如何理解一个没有quorum的卷组Quorum的用途的用途Mirror不需要不需要quorum(默认)(默认)30IBM Systems&Technology Group 2003 IBM Corporation如何varyonvg不正常的VG31IBM Systems&Technology Group 2003 IBM CorporationMirror的联系练习做练习做rootvg的的mirror练习做练习做lv的的
9、copy联系作联系作mklvcopy32IBM Systems&Technology Group 2003 IBM Corporation第四章磁盘管理在任何情况下替换磁盘在任何情况下替换磁盘Vg fail的解决的解决如何纠正不一致的错误如何纠正不一致的错误导入导出卷组导入导出卷组33IBM Systems&Technology Group 2003 IBM Corporation磁盘替代的过程34IBM Systems&Technology Group 2003 IBM Corporation情况一(disk mirror)35IBM Systems&Technology Group 200
10、3 IBM Corporation在线应用的磁盘36IBM Systems&Technology Group 2003 IBM Corporation特别对于rootvg37IBM Systems&Technology Group 2003 IBM Corporation磁盘彻底损坏38IBM Systems&Technology Group 2003 IBM Corporation续39IBM Systems&Technology Group 2003 IBM Corporation非rootvg磁盘的彻底损坏40IBM Systems&Technology Group 2003 IBM C
11、orporation磁盘删除问题41IBM Systems&Technology Group 2003 IBM Corporation解决方案42IBM Systems&Technology Group 2003 IBM CorporationExportvg和importvg43IBM Systems&Technology Group 2003 IBM Corporationimportvg44IBM Systems&Technology Group 2003 IBM CorporationImportvg问题45IBM Systems&Technology Group 2003 IBM C
12、orporation文件系统冲突46IBM Systems&Technology Group 2003 IBM Corporation如何同时mount两个同名fs47IBM Systems&Technology Group 2003 IBM Corporation续Importvg之前没有使用之前没有使用exportvg解决方法解决方法48IBM Systems&Technology Group 2003 IBM Corporation49IBM Systems&Technology Group 2003 IBM Corporation50IBM Systems&Technology Gro
13、up 2006 IBM Corporation第五章备份恢复IBM Systems&Technology Group 2003 IBM CorporationVG的保存和恢复创建,鉴别,恢复创建,鉴别,恢复mksysb利用利用mksysb创建创建clone如何减小文件系统和逻辑卷如何减小文件系统和逻辑卷替换磁盘安装替换磁盘安装备份,恢复非备份,恢复非rootvg如何进行如何进行jfs的在线备份的在线备份52IBM Systems&Technology Group 2003 IBM Corporationmksysb53IBM Systems&Technology Group 2003 IBM
14、Corporation磁带中的内容54IBM Systems&Technology Group 2003 IBM Corporation验证系统备份验证系统备份的方法验证系统备份的方法55IBM Systems&Technology Group 2003 IBM CorporationMksysb的控制文件56IBM Systems&Technology Group 2003 IBM Corporation磁带安装的恢复57IBM Systems&Technology Group 2003 IBM Corporation续58IBM Systems&Technology Group 2003
15、IBM Corporation用mksysb克隆系统59IBM Systems&Technology Group 2003 IBM Corporation恢复时修改pp60IBM Systems&Technology Group 2003 IBM Corporation恢复系统并减小文件系统61IBM Systems&Technology Group 2003 IBM Corporation硬盘克隆62IBM Systems&Technology Group 2003 IBM Corporation第一种方法63IBM Systems&Technology Group 2003 IBM Cor
16、poration通过smit完成64IBM Systems&Technology Group 2003 IBM Corporation磁盘的克隆65IBM Systems&Technology Group 2003 IBM Corporation通过smit进行66IBM Systems&Technology Group 2003 IBM Corporation删除67IBM Systems&Technology Group 2003 IBM Corporation如何备份非rootvg68IBM Systems&Technology Group 2003 IBM CorporationVgn
17、ame.data69IBM Systems&Technology Group 2003 IBM CorporationSavevg的恢复70IBM Systems&Technology Group 2003 IBM Corporation在线的fs备份71IBM Systems&Technology Group 2003 IBM Corporation分开这个mirror72IBM Systems&Technology Group 2003 IBM Corporation重新整合这个fs73IBM Systems&Technology Group 2003 IBM Corporationlin
18、ux和unix下常用解压和压缩命令:-.tar解包:解包:tar xvf FileName.tar打包:打包:tar cvf FileName.tar DirName(注:(注:tar是打包,不是压缩!是打包,不是压缩!)-.gz解压解压1:gunzip FileName.gz解压解压2:gzip-d FileName.gz压缩:压缩:gzip 解压:解压:tar zxvf 压缩:压缩:tar zcvf DirName74IBM Systems&Technology Group 2003 IBM Corporationlinux和unix下常用解压和压缩命令:.Z解压:解压:uncompres
19、s FileName.Z压缩:压缩:compress 解压:解压:tar Zxvf 压缩:压缩:tar Zcvf DirName-.tgz解压:解压:tar zxvf FileName.tgz解压:解压:tar zxvf 压缩:压缩:tar zcvf FileName-.zip解压:解压:unzip FileName.zip压缩:压缩:zip FileName.zip DirName75IBM Systems&Technology Group 2006 IBM Corporation第六章系统DUMPIBM Systems&Technology Group 2003 IBM Corporati
20、on本章目的了解在系统了解在系统dump时保存的数据时保存的数据确认和改变主确认和改变主dump设备和第二设备和第二dump设备设备创建系统的创建系统的dump77IBM Systems&Technology Group 2003 IBM Corporation系统DUMP概述当发生一个意外的系统中断或系统故障就会创建一个系当发生一个意外的系统中断或系统故障就会创建一个系统统DUMPDUMP是指把系统物理内存中部分或全部内容复制到指是指把系统物理内存中部分或全部内容复制到指定的设备,即把内核所使用的内存区域的数据保存。定的设备,即把内核所使用的内存区域的数据保存。系统崩溃或手工执行,对操作系统
21、状态的快照系统崩溃或手工执行,对操作系统状态的快照0c0:DUMP成功成功78IBM Systems&Technology Group 2003 IBM Corporationsmitty dumpsysdumpdev lsysdumpdev esysdumpdev P p|-s lvnamesydumpdev L显示统计信息显示统计信息snap79IBM Systems&Technology Group 2003 IBM Corporation产生dump的途径Copies kernel data structure to a dump deviceVia keyboard initiati
22、onVia reset buttonAt unexpected system haltVia smitVia comandClassial RS/6000 only80IBM Systems&Technology Group 2003 IBM CorporationDump 里的内容不包含不包含PAGED MEMORY的内容的内容包含系统的变量和状态包含系统的变量和状态进程表进程表当前运行的进程和其相关信息用户区用户区当前用户运行的进程和其相关的详细信息文件描述表(FDT)虚拟文件系统的信息虚拟文件系统的信息当前mounted的文件系统Inode tableopen file table81I
23、BM Systems&Technology Group 2003 IBM CorporationDump 里的内容(续)内核堆栈内核堆栈系统系统Buffer终端信息终端信息MbufsThese are the memory buffers for data which have been sent/received across a networkSocketsTimers82IBM Systems&Technology Group 2003 IBM Corporation命令sysdumpdev列出当前的列出当前的dump设备及状态设备及状态#sysdumpdev-lprimary /dev
24、/hd6secondary /dev/sysdumpnullcopy directory /var/adm/rasforced copy flag TRUEalways allow dump FALSE83IBM Systems&Technology Group 2003 IBM Corporation命令sysdumpdev(续)设置设置dump设备设备#sysdumpdev-P-p|-s device参数P代表永久的改变,参数p代表主dump设备查看当前系统的查看当前系统的dump大小大小#sysdumpdev-e0453-041 Estimated dump size in bytes:
25、31631360显示出以前显示出以前dump的信息的信息#sysdumpdev-L84IBM Systems&Technology Group 2003 IBM CorporationMethods of Starting a Dump85IBM Systems&Technology Group 2003 IBM Corporation通过smit产生dump#smit dump86IBM Systems&Technology Group 2003 IBM Corporation拷贝系统的Dump87IBM Systems&Technology Group 2003 IBM Corporati
26、on发送dump到IBM系统支持中心拷贝拷贝dump到磁带上到磁带上#/usr/sbin/snap-gfkD-o/dev/rmtxdump磁带的标记磁带的标记PMR(Problem Management Record)号创建磁带的命令块大小IBM通过通过crash命令处理命令处理dump磁带磁带88IBM Systems&Technology Group 2006 IBM Corporation第七章错误分析和诊断IBM Systems&Technology Group 2003 IBM Corporation本章目的了解了解AIX错误报告工具的组成部分错误报告工具的组成部分解释错误报告解释错
27、误报告监测和维护错误日志监测和维护错误日志90IBM Systems&Technology Group 2003 IBM Corporation错误日志和系统日志能够分析错误日志能够分析错误日志能够鉴别和维护产生的错误能够鉴别和维护产生的错误用用syslogd纪录系统消息纪录系统消息91IBM Systems&Technology Group 2003 IBM Corporation错误日志的目的在监测到硬件、软件和操作错误时记录相应的信息在监测到硬件、软件和操作错误时记录相应的信息用户其他的相关信息被记录下来用户其他的相关信息被记录下来报告通过记录产生报告通过记录产生用户能够客户化错误信息用
28、户能够客户化错误信息当发生某些特定的错误时,系统发出指定信息当发生某些特定的错误时,系统发出指定信息可以查询到建议操作可以查询到建议操作92IBM Systems&Technology Group 2003 IBM CorporationErrorlog过程93IBM Systems&Technology Group 2003 IBM Corporationsyslogd配置文件:配置文件:/etc/syslog.conf选择器:功能名,功能名选择器:功能名,功能名.优先级;优先级;处理方法:接受信息目标位置(文件、用户、主处理方法:接受信息目标位置(文件、用户、主机)机)循环:循环:94IB
29、M Systems&Technology Group 2003 IBM Corporation通过smit使用error log功能95IBM Systems&Technology Group 2003 IBM Corporation通过smit产生错误报告96IBM Systems&Technology Group 2003 IBM Corporation通过smit产生错误报告显示所有的错误报告显示所有的错误报告#errpt打印错误报告的模板打印错误报告的模板#errpt-t按时间产生报告按时间产生报告#errpt-a-s mmddhhmmyy只报告硬件错误只报告硬件错误#errpt-d-
30、H描述描述ID为为F49E2A17的错误报告的错误报告#errpt-a-j F49E2A1797IBM Systems&Technology Group 2003 IBM Corporation报告实例#errpt 98IBM Systems&Technology Group 2003 IBM Corporation参数详解标识标识C:错误归类:错误归类H:硬件S:软件O:系统信息已经记录U:不能确定标识标识T:错误类型:错误类型PERM(并且C为H):显示系统遇到硬件问题并且无法自动修复PERD(并且C为H):系统硬件变为不可用并引起一系列错误系统PERM(并且C为S):显示系统遇到软件问题
31、并且无法自动修复TEMP(并且C为S):显示系统遇到软件问题并且已经自动修复99IBM Systems&Technology Group 2003 IBM Corporation磁盘错误类型DISK_ERR1(cd,disk or R/W optical operation failure)PERMfailure of physical volume mediaDISK_ERR2(cd,disk or R/W optical operation failure)PERMfailure in disk assembly(for example,poer loss)DISK_ERR3(cd,dis
32、k or R/W optical operation failure)PERMfailure was detected by the SCSI adapter100IBM Systems&Technology Group 2003 IBM Corporation磁盘错误类型(续)DISK_ERR4(cd,disk or R/W optical recovered error)TEMPerror caused by a bad block or event of a recovered errorDISK_ERR5(Undetermined Error)PERMSCSI device drive
33、r failure of unknown type101IBM Systems&Technology Group 2003 IBM Corporation磁盘错误的处理诊断程序诊断程序帮助确定问题的严重性可以格式化磁盘或进行磁盘片的检查磁盘片的检查磁盘片的检查检查在磁盘上的每一个块报告磁盘全面状况总结报告三种应该更换磁盘的情况三种应该更换磁盘的情况噪声很大(Noise)经常出错错误严重102IBM Systems&Technology Group 2003 IBM Corporation错误日志的清除(自动)在在root用户的用户的cron表中,缺省有两个表中,缺省有两个entry0 11*/
34、usr/bin/errclear-d S,O 30每天清除一次,清除三十天以前的软件错误0 12*/usr/bin/errclear-d H 90 每天清除一次,清除九十天以前的硬件错误103IBM Systems&Technology Group 2003 IBM Corporation错误日志的清除(手工)root用户通过手工命令用户通过手工命令errclear直接清除错误日志直接清除错误日志#errclear 10清除10天以前的所有日志#errclear-d H 0清除所有硬件的错误#errclear-N disk 0删除所有资源组为disk的记录#errclear-T UNKN 0删
35、除所有类型为unknown的记录#errclear 0删除所有记录104IBM Systems&Technology Group 2003 IBM Corporation在出错日志中加入信息#errlogger “(字符)(字符)”105IBM Systems&Technology Group 2003 IBM Corporation通过errdemon命令管理错误日志(壹)显示显示error log的特性的特性#/usr/lib/errdemon-lError Log Attributes-Log File /var/adm/ras/errlogLog Size 1048576 bytesM
36、emory Buffer Size 8192 bytes 106IBM Systems&Technology Group 2003 IBM Corporation通过errdemon命令管理错误日志(贰)改变错误日志的存放文件改变错误日志的存放文件#/usr/lib/errdemon-i filename改变文件的大小改变文件的大小#/usr/lib/errdemon-s logsize改变内存缓冲区的大小改变内存缓冲区的大小#/usr/lib/errdemon-B buffersize107IBM Systems&Technology Group 2003 IBM Corporation出错
37、处理命令软件包bos.rte 包含包含errinstall,errupdate,errstop命令命令bos_sysmgt.serv_aid包含包含errmsg,errclear,errdead,errlogger,errmsg,errpt,sysdumpstart 命令命令108IBM Systems&Technology Group 2006 IBM Corporation第八章性能监测和优化IBM Systems&Technology Group 2003 IBM Corporation本章目的通过通过AIX标准命令研究系统中标准命令研究系统中CPU,内存和,内存和I/O瓶颈瓶颈了解了解
38、AIX相关的相关的AIX命令命令使用使用PDT产生系统状况的报告产生系统状况的报告使用使用perfpmr工具工具调整内核参数调整内核参数110IBM Systems&Technology Group 2003 IBM Corporation硬件资源和逻辑资源硬件资源硬件资源逻辑资源逻辑资源CPU时间片时间片内存内存页面桢页面桢堆栈堆栈缓存区缓存区队列队列表表磁盘空间磁盘空间逻辑卷逻辑卷文件系统文件系统文件文件通信通信数据包数据包通道通道111IBM Systems&Technology Group 2003 IBM CorporationPerformance Tools#nice#renic
39、e#ps#sar#vmstat#iostat#tprof#svmon#filemonPDT(Performance Diagnostic Tool)perfpmr(Performance Problem Management Report)112IBM Systems&Technology Group 2003 IBM CorporationCPUCPU瓶颈?瓶颈?瓶颈?瓶颈?内存瓶颈?内存瓶颈?内存瓶颈?内存瓶颈?I/OI/O瓶颈?瓶颈?瓶颈?瓶颈?网络瓶颈?网络瓶颈?网络瓶颈?网络瓶颈?vmstatvmstatpspslspslspssvmonsvmonvmstatvmstatsar sa
40、r nicenicepspsiostatiostatlslvlslvfilemonfilemonfileplacefileplaceMore testMore testnetstatnetstatnfsstatnfsstatnfsonfsononoifconfigifconfignetpmonnetpmonY YY YY YY YN NN NN NN N113IBM Systems&Technology Group 2003 IBM Corporation进程的生命周期图示114IBM Systems&Technology Group 2003 IBM Corporation进程的生命周期说明
41、(一)初始化初始化(I)阶段阶段Before a process is created,itneeds a slot in the process table;at this stage it is in the SNONE stateWhile a process is undergoing creation,waiting for resources to be allocated,it is in the SIDL state115IBM Systems&Technology Group 2003 IBM Corporation进程的生命周期说明(二)运行(运行(A)阶段)阶段R:Rea
42、dy to runS:等待I/O操作T:stop 与restart 中的暂停阶段Runing:运行阶段退出死亡(退出死亡(A)阶段)阶段When a process dies(exit)it becomes a zombie116IBM Systems&Technology Group 2003 IBM Corporation进程的优先级优先级由优先级由run-queue slot 确定确定最高的优先级为最高的优先级为0,最低为,最低为127优先级分为两种:优先级分为两种:固定的:确定的内核进程通过setpri()设置为实时应用没有nice值不固定的:Run at initial priori
43、ty level which subsequently changesCPU-intensive(running)processes not favoredI/O-intensive(sleeping)processes favored117IBM Systems&Technology Group 2003 IBM Corporation优先级的查看参数参数C:recent CPU usage value参数参数PRI:priority value优先级优先级参数参数NI:nice value118IBM Systems&Technology Group 2003 IBM Corporatio
44、n优先级的计算priority value=base value+nice value+(CPU penalty based on recent CPU usage)base value(the user-process-priority value):40在ksh下,默认的nice值:前台是20,后台是24CPU penalty=(recent CPU use value)*(r value/32)r 默认值为16119IBM Systems&Technology Group 2003 IBM Corporationnice行命令格式#nice-i command 参数参数i(或者或者n):
45、从默认的从默认的NI值中增加或减少相应的值。值中增加或减少相应的值。参数参数范围为范围为-24到到+19,缺省为缺省为10120IBM Systems&Technology Group 2003 IBM Corporation命令nice 示例#nice-10 sleep 100000nice-n-15 sleep 100000nice-n-10 sleep 100000nice-n-10 sleep 100000用ps-le|grep sleep命令输出如下:F S UID PID PPID C PRI NI ADDR SZ WCHAN TTY TIME CMD200001 A
46、0 18112 2492 0 74 34 35fa 44 9ef72d8 pts/3 0:00 sleep200001 A 0 9666 2492 0 49 9 2bf5 44 9ef7658 pts/3 0:00 sleep200001 A 0 16068 2492 0 54 14 21f0 44 9ef7698 pts/3 0:00 sleep200001 A 0 10182 2492 0 50 10 fe7 44 9ef76d8 pts/3 0:00 sleep121IBM Systems&Technology Group 2003 IBM Corporationrenice行命令格式用
47、来改变一个正在运行的进程用来改变一个正在运行的进程NI值值renice -p-u 122IBM Systems&Technology Group 2003 IBM Corporation命令psps-efE选项:列出所有的用户进程l选项:列出优先级信息#ps aux查看所有进程占用CPU,内存,时间#ps-mo ThREADTID 参数:象PID一样是Thread-idBND 参数:使用数123IBM Systems&Technology Group 2003 IBM Corporation性能分析流程124IBM Systems&Technology Group 2003 IBM Corpo
48、ration性能分析流程125IBM Systems&Technology Group 2003 IBM CorporationCPU 使用情况(一)#sar 1 10 当%usr+%sys 80%时,CPU 紧张126IBM Systems&Technology Group 2003 IBM CorporationCPU 使用情况(二)#sar-q 1 3系统队列活动情况runq-sz:average length of run queue%runocc:percentage of time run queue occupiedswpq-sz%swpocc:当runq-sz大于4时,CPU资
49、源紧张127IBM Systems&Technology Group 2003 IBM Corporationsar a 3 5查看文件读查看文件读/写情况写情况iget/s:每秒调用每秒调用I节点查找函数的次数节点查找函数的次数lookuppn/s:每秒调用目录查找函数的次数:每秒调用目录查找函数的次数dirblk/s:为一个文件调用目录查找函数的次数:为一个文件调用目录查找函数的次数128IBM Systems&Technology Group 2003 IBM Corporationsar d块设备活动情况块设备活动情况%busy 50%或或 avwait avscrv则需要查看磁则需要
50、查看磁盘盘I/Osar c系统调用情况系统调用情况129IBM Systems&Technology Group 2003 IBM Corporationsar r 查看页面调度情况查看页面调度情况slots:页面空间上空闲页数量:页面空间上空闲页数量cycle/s:每秒页面交换周期数:每秒页面交换周期数fault/s:每秒页面错误个数:每秒页面错误个数odio/s:每秒非磁盘:每秒非磁盘I/O页面调用数页面调用数130IBM Systems&Technology Group 2003 IBM CorporationPaging 信息(一)#vmstat 1 3当内存资源十分紧张时,将引起pa