《linux入门教程之系统故障分析与排查ppt课件.ppt》由会员分享,可在线阅读,更多相关《linux入门教程之系统故障分析与排查ppt课件.ppt(36页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。第九章第九章 系统故障分析与排查系统故障分析与排查1本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。如何判断一个文件是否存在?如何进行整数变量的四则运算?if语句从结构上分为哪几类?for、while、until在循环流程上有何区别?课程回顾2本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机
2、组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。熟悉常见的日志文件及分析方法会解决常见的启动登录类故障会解决常见的软件包安装类故障会解决常见的文件系统、磁盘类故障熟悉常见的系统性能监控方法技能展示3本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。本章结构日志分析及管日志分析及管理理 主要日志文件主要日志文件 修复文件系统修复文件系统 日志文件分析日志文件分析 磁盘资源耗尽故障磁盘资源耗尽故障 日志管理策略日志管理策略 系统启动类故系
3、统启动类故障排除障排除 文件系统、磁文件系统、磁盘类故障排除盘类故障排除 MBR扇区故障扇区故障/etc/inittab文件丢失文件丢失 rpm数据库损坏数据库损坏 缺少缺少*.so类文件类文件 软件包类故障软件包类故障排除排除 检测硬盘坏道检测硬盘坏道 无法卸载已挂载设备无法卸载已挂载设备 查看查看CPU负载负载 查看系统性能查看系统性能状况状况 查看内存使用情况查看内存使用情况 GRUB引导故障引导故障/etc/fstab文件丢失文件丢失 遗忘遗忘root用户的密码用户的密码 磁盘磁盘I/O性能监控性能监控 系统故障分系统故障分析与排查析与排查4本标准适用于已投入商业运行的火力发电厂纯凝式
4、汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。日志的功能 用于记录系统、程序运行中发生的各种事件通过阅读日志,有助于诊断和解决系统故障日志文件的分类内核及系统日志 由系统服务syslog统一进行管理,日志格式基本相似用户日志 记录系统用户登录及退出系统的相关信息程序日志 由各种应用程序独立管理的日志文件,记录格式不统一日志分析及管理5本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。日志保存位置默认位于:
5、/var/log 目录下主要日志文件介绍内核及公共消息日志:/var/log/messages计划任务日志:/var/log/cron系统引导日志:/var/log/dmesg邮件系统日志:/var/log/maillog用户登录日志:/var/log/lastlog、/var/log/secure、/var/log/wtmp、/var/run/utmp日志分析及管理6本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。由系统服务 syslogd 统一管理软件包:sysklogd-
6、1.4.1-39.2 主要程序:/sbin/klogd、/sbin/syslogd配置文件:/etc/syslog.conf内核及系统日志rootlocalhost#grep -v#/etc/syslog.conf|grep -v$*.info;mail.none;authpriv.none;cron.none/var/log/messagesauthpriv.*/var/log/securemail.*-/var/log/maillogcron.*/var/log/cron设备类别设备类别.日志级别日志级别消息发送位置消息发送位置7本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供
7、热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。日志消息的级别0 EMERG(紧急):会导致主机系统不可用的情况1 ALERT(警告):必须马上采取措施解决的问题2 CRIT(严重):比较严重的情况3 ERR(错误):运行出现错误4 WARNING(提醒):可能会影响系统功能的事件5 NOTICE(注意):不会影响系统但值得注意6 INFO(信息):一般信息7 DEBUG(调试):程序或系统调试信息等内核及系统日志数字越小,表示优先级数字越小,表示优先级越高、问题越严重越高、问题越严重8本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发
8、电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。日志记录的一般格式内核及系统日志rootlocalhost#tail -5 /var/log/messagesSep 14 11:22:44 localhost kernel:sdb:cache data unavailableSep 14 11:22:44 localhost kernel:sdb:assuming drive cache:write throughSep 14 11:22:44 localhost kernel:sdb:sdb1Sep 14 11:23:37
9、localhost kernel:VFS:Cant find ext3 filesystem on dev sdb1.Sep 14 16:54:48 localhost NetworkManager:starting.时间标签时间标签主机名主机名子系统名子系统名消息字段消息字段9本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。保存了用户登录、退出系统等相关信息/var/log/lastlog:最近的用户登录事件/var/log/wtmp:用户登录、注销及系统开、关机事件/var
10、/run/utmp:当前登录的每个用户的详细信息/var/log/secure:与用户验证相关的安全性事件分析工具who、w、user、last、ac用户日志分析10本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。由相应的应用程序独立进行管理Web服务:/var/log/httpd/access_log、error_log 代理服务:/var/log/squid/access.log、cache.log、squid.out、store.logFTP服务:/var/log/xfe
11、rlog 分析工具文本查看、grep过滤检索、Webmin管理套件中查看awk、sed等文本过滤、格式化编辑工具Webalizer、Awstats等专用日志分析工具程序日志分析11本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。及时作好备份和归档延长日志保存期限控制日志访问权限日志中可能会包含各类敏感信息,如账户、口令等集中管理日志便于日志信息的统一收集、整理和分析杜绝日志信息的意外丢失、恶意篡改或删除日志管理策略12本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供
12、热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。应用示例:调整syslogd服务设置,建立集中管理的日志服务器将客户机B中crond服务产生的日志消息,自动发送到服务器A的/var/log/cron文件中日志管理策略rootlocalhost#vi/etc/sysconfig/syslogSYSLOGD_OPTIONS=-r-x-m 0rootlocalhost#vi/etc/syslog.confcron.*173.17.17.3服务器服务器A客户机客户机B13本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组
13、的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。故障原因病毒、木马等造成的破坏不正确的分区操作、磁盘读写误操作故障现象找不到引导程序,启动中断无法加载操作系统,开机后黑屏解决思路应提前作好备份文件以RHEL5安装光盘引导进入急救模式从备份文件中恢复修复MBR扇区故障14本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。应用示例:1.备份MBR扇区数据 dd if=/dev/sda of=/backup/sda.mbr.bak bs=51
14、2 count=12.模拟MBR被破坏的故障 dd if=/dev/zero of=/dev/sda bs=512 count=13.RHEL5光盘引导,进入急救模式 boot:linux rescue4.从备份文件中恢复MBR扇区 dd if=/tempdir/sda.mbr.bak of=/dev/sda bs=512 count=1修复MBR扇区故障15本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。故障原因MBR中的GRUB引导程序遭到破坏grub.conf文件丢失、引
15、导配置有误故障现象系统引导停滞,显示“grub”提示符解决思路尝试手动输入引导命令进入急救模式,从备份中恢复 grub.conf向MBR扇区中重建grub程序修复GRUB引导故障16本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。应用示例1:在“grub”提示符后,手动输入引导命令成功进入系统后,恢复或重建 grub.conf 配置文件修复GRUB引导故障grub root (hd0,0)grub kernel /vmlinuz-2.6.18-8.el5 ro root=/de
16、v/VolGroup00/LogVol00 rhgb quietgrub initrd /initrd-2.6.18-8.el5.imggrub bootrootlocalhost#cd /boot/grub/rootlocalhost#cp grub.conf.bak grub.conf 从备份文件恢复从备份文件恢复17本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。应用示例2:进入急救模式,从备份文件中恢复 grub.conf 文件向MBR扇区中重建GRUB程序修复GRUB
17、引导故障sh-3.1#chroot /mnt/sysimagesh-3.1#cd /boot/grub/sh-3.1#cp grub.conf.bak grub.confsh-3.1#grub-install /dev/sda18本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。故障原因inittab文件被误删除,或者存在配置错误故障现象启动中提示“.INIT:No inittab file found”系统停滞,无法完成初始化解决思路进入急救模式,从备份文件中恢复或者,在急救模
18、式中重新安装 initscripts 软件包 rpm -ivh -replacepkgs initscripts-8.45.14.EL.i386.rpm/etc/inittab文件丢失19本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。故障原因fstab文件被误删除,或者存在配置错误故障现象启动中提示“./etc/fstab:No such file or directory”系统启动失败,或文件系统不能正常访问解决思路进入急救模式,手动查找并挂载根分区 查找逻辑卷:lvm v
19、gscan 激活指定的逻辑卷:lvm vgchange-ay /dev/VolGroup00恢复或重建fstab配置文件/etc/fstab文件丢失20本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。故障原因遗忘root用户的密码故障现象无法进行需要root权限的管理操作若没有其他可用帐号,将无法登录系统解决思路引导进入单用户模式,然后重设密码 grub kernel .single 或或 s 或或 1或进入急救模式,然后重设密码 遗忘root用户的密码 21本标准适用于已投入
20、商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。请思考:Linux系统中最常用的公共日志文件是什么?负责管理内核日志的系统服务是什么?如何进入单用户模式?使用RHEL5光盘引导时,如何进入修复模式?如何向MBR中重建GRUB程序?小结22本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。故障原因非正常关机、误删除运行中的程序文件RPM数据文件被误写或删除故障现象不能正常查询rpm包
21、信息无法安装、升级或卸载软件包等解决思路重建RPM数据库 rpm -rebuilddb 或或 rpm -initdb软件包类故障 rpm数据库损坏 23本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。故障原因软件正常运行所需要的依赖包没有安装系统找不到依赖包的*.so 共享链接库故障现象无法正常编译、安装或运行软件报错提示“缺少.so文件”解决思路确认已安装能提供相应*.so 共享库的软件包添加库文件搜索路径,并更新缓存软件包类故障 缺少*.so类文件 rootlocalhos
22、t#vi/etc/ld.so.conf/usr/local/mysql/lib/mysqlrootlocalhost#ldconfig24本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。故障原因非正常关机、突然断电、设备读写失误等文件系统的超级块(super-block)信息被破坏故障现象无法向分区中读取或写入数据启动后提示“Give root password for maintenance”解决思路根据提示输入root口令,进入修复状态使用fsck命令进行修复修复损坏的文件
23、系统25本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。应用示例:模拟对/dev/sdb1分区的破坏操作 dd if=/dev/zero of=/dev/sdb1 bs=512 count=4检查是否能挂载该分区 报错:报错:mount:you must specify the filesystem type对/dev/sdb1分区进行修复 fsck-yt ext3/dev/sdb1再次挂载该分区修复损坏的文件系统26本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供
24、热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。故障原因磁盘空间已被大量的数据占满,空间耗尽虽然还有可用空间,但文件数i节点耗尽 故障现象无法写入新的文件,提示“:设备上没有空间”部分程序无法运行,甚至系统无法启动解决思路清理磁盘空间,删除无用、冗余的文件转移或删除占用大量i节点的琐碎文件进入单用户模式、急救模式进行修复为用户设置磁盘配额磁盘资源耗尽故障27本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。故障原因需要卸载
25、的设备正在被使用故障现象无法卸载设备,提示“.device is busy”解决思路将工作目录切换到挂载点以外退出正在使用该设备的程序或使用fuser命令找出相关进程,并终止该进程无法卸载已挂载的设备 rootlocalhost mnt#fuser-mv/media/cdrom USER PID ACCESS COMMAND/media/cdrom:root 3297 .c.bashrootlocalhost mnt#fuser-k/media/cdrom28本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组
26、可参照本标准执行,并增补指标。故障原因磁盘设备中存在坏道(逻辑的或物理的)故障现象部分文件无法正常访问,提示文件损坏新建立的分区无法完成格式化访问磁盘设备时死机,磁盘发出异常声响解决思路检测硬盘中是否存在坏道 mkfs -t ext3 -c /dev/sdb1 或或 badblocks -sv /dev/sdb1修复硬盘,或更换新的硬盘检测硬盘中的坏道 29本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。执行uptime命令运行时间,登录用户数,CPU平均负载查看/proc/l
27、oadavg文件CPU平均负载,活动进程数/总数,最近进程的PID系统性能监控 查看CPU负载 rootlocalhost#uptime 05:33:11 up 7:22,2 users,load average:0.04,0.09,0.08rootlocalhost#cat/proc/loadavg0.15 0.03 0.01 4/84 2569730本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。vmstat命令报告系统虚拟存储使用情况,包括内存使用信息 free命令显示系
28、统的物理内存和交换空间的使用情况系统性能监控 查看内存使用情况 rootlocalhost#vmstatprocs -memory-swap-io-system-cpu-r b swpd free buff cache si so bi bo in cs us sy id wa st0 0 0 304280 27084 145844 0 0 29 8 1007 20 0 2 98 0 0rootlocalhost#free total used free shared buffers cachedMem:515600 211320 304280 0 27264 145852-/+buffers
29、/cache:38204 477396Swap:1048568 0 104856831本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。iostat命令用于查看系统磁盘I/O统计信息由软件包sysstat-7.0.0-3.el5.i386.rpm提供 sysstat还提供了 mpstat 命令,用于显示进程负载信息系统性能监控 磁盘I/O性能监控rootlocalhost#iostat-dkt 5Linux 2.6.18-8.el5(localhost.localdomain)2
30、009年年05月月24日日Time:16时时17分分49秒秒Device:tps kB_read/s kB_wrtn/s kB_read kB_wrtnsda 1.28 15.12 6.54 167183 72314sdb 0.83 11.95 1.95 132182 21526dm-0 2.40 14.95 6.54 165325 72312dm-1 0.01 0.04 0.00 456 0hdc 0.02 0.07 0.00 746 0rootlocalhost#mpstatLinux 2.6.18-8.el5(localhost.localdomain)2009年年05月月25日日05时
31、时18分分11秒秒 CPU%user%nice%sys%iowait%irq%soft%steal%idle intr/s05时时18分分11秒秒 all 0.45 0.02 1.93 3.08 0.02 0.07 0.00 94.43 1010.03 32本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。本章结构日志分析及管日志分析及管理理 主要日志文件主要日志文件 修复文件系统修复文件系统 日志文件分析日志文件分析 磁盘资源耗尽故障磁盘资源耗尽故障 日志管理策略日志管理策略
32、系统启动类故系统启动类故障排除障排除 文件系统、磁文件系统、磁盘类故障排除盘类故障排除 MBR扇区故障扇区故障/etc/inittab文件丢失文件丢失 rpm数据库损坏数据库损坏 缺少缺少*.so类文件类文件 软件包类故障软件包类故障排除排除 检测硬盘坏道检测硬盘坏道 无法卸载已挂载设备无法卸载已挂载设备 查看查看CPU负载负载 查看系统性能查看系统性能状况状况 查看内存使用情况查看内存使用情况 GRUB引导故障引导故障/etc/fstab文件丢失文件丢失 遗忘遗忘root用户的密码用户的密码 磁盘磁盘I/O性能监控性能监控 系统故障分系统故障分析与排查析与排查33本标准适用于已投入商业运行的
33、火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。需求描述基于syslog构建集中管理的日志服务器 保存另一台Linux主机的cron日志信息备份磁盘sda的MBR扇区,并学会MBR的恢复过程系统故障模拟及修复 通过单用户模式进入Linux系统,重设root帐号的密码 将/etc/inittab、/etc/fstab 文件改名,重启后进行修复 通过重新安装GRUB引导程序的方式,修复GRUB引导故障 使用uptime、free、iostat等命令查看主机的性能状况参考教材中的示例,熟悉各种故障分析及排除过程
34、实验案例:日志管理及系统故障修复34本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。实现思路任务1基于syslog构建集中管理的日志服务器 日志服务器需修改/etc/sysconfig/syslog 文件:SYSLOGD_OPTIONS=-r-x-m 0 日志客户机需修改/etc/syslog.conf 文件:cron.*173.17.17.3 均需重新加载syslog服务,然后进行验证备份磁盘sda的MBR扇区,并学会MBR的恢复过程 使用dd命令时要谨慎确认,以免发生数据损
35、坏 备份的目标文件应保存到不同的磁盘中实验案例:日志管理及系统故障修复35本标准适用于已投入商业运行的火力发电厂纯凝式汽轮发电机组和供热汽轮发电机组的技术经济指标的统计和评价。燃机机组、余热锅炉以及联合循环机组可参照本标准执行,并增补指标。实现思路任务2系统故障模拟及修复 通过单用户模式进入Linux系统,重设root帐号的密码 将/etc/inittab、/etc/fstab 文件改名,重启后进行修复 通过重新安装GRUB引导程序的方式,修复GRUB引导故障 使用uptime、free、iostat等命令查看主机的性能状况参考教材中的示例,熟悉各种故障分析及排除过程实验案例:日志管理及系统故障修复36