《系统监控性能评估通信电子监控_通信电子-监控.pdf》由会员分享,可在线阅读,更多相关《系统监控性能评估通信电子监控_通信电子-监控.pdf(5页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、 总控服务器性能:、Cpu性能评估 Vmstat命令的参数解释:对上面每项的输出解释如下:procs r 列表示运行和等待 cpu 时间片的进程数,这个值如果长期大于系统 CPU 的个数,说明 CPU 不足,需要增加 CPU?b 列表示在等待资源的进程数,比如正在等待 I/O、或者内存交换等。Memory swpd 列表示切换到内存交换区的内存数量(以 k 为单位)。如果 swpd 的值不为 0,或者比 较大,只要 si、so 的值长期为 0,这种情况下一般不用担心,不会影响系统性能。free 列表示当前空闲的物理内存数量(以 k 为单位)buff 列表示 buffers cache 的内存
2、数量,一般对块设备的读写才需要缓冲。cache 列表示 page cached的内存数量,一般作为文件系统 cached,频繁访问的文件都会被 cached,如果 cache 值较大,说明 cached 的文件数较多,如果此时 IO 中 bi 比较小,说明 文件系统效率比较好。swap si 列表示由磁盘调入内存,也就是内存进入内存交换区的数量。so 列表示由内存调入磁盘,也就是内存交换区进入内存的数量。一般情况下,si、so 的值都为 0,如果 si、so 的值长期不为 0,则表示系统内存不足。需 要增加系统内存。IO 项显示磁盘读写状况 Bi 列表示从块设备读入数据的总量(即读磁盘)(每秒
3、 kb)。Bo 列表示写入到块设备的数据总量(即写磁盘)(每秒 kb)这里我们设置的 bi+bo 参考值为 1000,如果超过 1000,而且 wa 值较大,则表示系统磁盘 IO 有问题,应该考虑提高磁盘的读写性能。system 显示采集间隔内发生的中断数 in 列表示在某一时间间隔中观测到的每秒设备中断数。cs 列表示每秒产生的上下文切换次数。上面这 2 个值越大,会看到由内核消耗的 CPU 时间会越多。CPU 项显示了 CPU 的使用状态,此列是我们关注的重点。us 列显示了用户进程消耗的 CPU 时间百分比。us 的值比较高时,说明用户进程消耗的 cpu 时间多,但是如果长期大于 50%
4、就需要考虑优化程序或算法。sy 列显示了内核进程消耗的 CPU 时间百分比。Sy 的值较高时,说明内核消耗的 CPU 资源很 多。根据经验,us+sy 的参考值为 80%如果 us+sy 大于 80%说明可能存在 CPU 资源不足。id 列显示了 CPU 处在空闲状态的时间百分比。wa 列显示了 IO 等待所占用的 CPU 时间百分比。wa 值越高,说明 IO 等待越严重,根据经验,wa 的参考值为 20%如果 wa 超过 20%说明 IO 等待严重,引起 IO 等待的原因可能是磁盘大量随机读写造成的,也可能是磁盘或者磁盘 控制器的带宽瓶颈造成的(主要是块操作)。综上所述,在对 CPU 的评估
5、中,需要重点注意果长期大于系统的个数说明不足需要增加列表示在等待资源的进程数比如正在等待或者内存交换等列表示切换到内存交换区的内存数量以为单位如果的值不为或者比较大只要的值长期为这种情况下一般不用担心不会影响系统性能列作为文件系统频繁访问的文件都会被如果值较大说明的文件数较多如果此时中比较小说明文件系统效率比较好列表示由磁盘入内存也就是内存进入内存交换区的数量列表示由内存入磁盘也就是内存交换区进入内存的数量一般情况下的总量即读磁盘每秒列表示写入到块设备的数据总量即写磁盘每秒这里我们设置的参考值为如果超过而且值较大则表示系统磁盘有问题应该考虑提高磁盘的读写性能显示采集间隔内发生的中断数列表示在某
6、一时间间隔中观测到的每的是 procs 项 r 列的值和 CPU 项中 us、sy 和 id 列的值。1.CPU 使用情况:us+sy:2+79=8180%;us+sy 大于 80%说明可能存在 CPU 资源不足 逻辑 CPU 个数:cat/proc/cpu info|grep processor|sort-u|wc-l 查看物理 CPU 个数 grep physical id/proc/cpuinfo|sort-u|wc-l xSwapl i nux-hve:xSwap$l inuK-hve4:cat/proc/cpuinfo|grep processor I sort-ulwc-1 2”*
7、KSwap01inu)c-hve4 grep physical id*/proc/cpuinfo I sort m|wc-1 1.r:r2 长期大于系统 CPU 的个数,说明 CPU 不足,需要增加 CPU 综合上述情况,说明 CPU 资源不足 uptime是监控系统性能最常用的一个命令,主要用来统计系统当前的运行状况,输出的信息依次为:系统现在的时间、系统从上次开机到现在运行了多长时间、系统目前有多少登陆用户、系统在一分钟内、五分钟内、十五分钟内的平均负载。看下面的一个输出:rootwebserver#uptime 要注意的是load average这个输出值,这三个值的大小一般不能大于系统
8、 CPU的 个数,例如,本输出中系统有 2个CPU,load average的三个值长期大于2时,说 明CPU很繁忙,负载很高,可能会影响系统性能,但是偶尔大于 2时,倒不用担 心,一般不会影响系统性能。相反,如果load average的输出值小于CPU的个数,则表示CPU还有空闲的时间片。2.10 使用请客:wa 17%wa值越高,说明IO等待越严重,根据经验,wa的参考值为20%,如果wa超过20%,说明IO等待严重,引起IO等待的原因可能是磁盘大量随机读写造成的,也可能 xSwrap01inux-rLve4:?VIDS t at procs 一 _亠-rftory-*-如一 r b s
9、wpd free buff cache 呂 i so 5 0 1217472 23332 0 1SS3840 2 0 zSwaplinu)c-hvE4:vmsl at procs-emory-swap一 r b swpd free buff cache si so 5 0 1217472 23412 0 1884620 2 0 KSwrap 1 inuihve4:vmsi at procs-memory-swap一 r b swpd free buff cache si 6 0 1217472 23336 0 1B84620 2 0 jtSwapftlinuif-hve4!:vnst at -
10、10-system-CPU-bi bo in cs us sy id vra.st 2 643 S3 1 2 79 2 1?2=口严=q 二 5:y31 亡口二 J=&acpU=bi bo in cs us sy id vt包 st 2 64S 88 1 2 79 2 17 2 -ip-system一一 bi bo in cs 2 648 8S 1 -CPU-us sy id wa st 2 79 2 17 2 procs -Binory-swap r b swpd free buff cache si so Q 0 1217472 23056 0 1834692 2 syst 色 m bi
11、bo in cs 2 648 88 1 epu us sy id wa st 2 79 2 17 2 这里需 3.60,3.35,果长期大于系统的个数说明不足需要增加列表示在等待资源的进程数比如正在等待或者内存交换等列表示切换到内存交换区的内存数量以为单位如果的值不为或者比较大只要的值长期为这种情况下一般不用担心不会影响系统性能列作为文件系统频繁访问的文件都会被如果值较大说明的文件数较多如果此时中比较小说明文件系统效率比较好列表示由磁盘入内存也就是内存进入内存交换区的数量列表示由内存入磁盘也就是内存交换区进入内存的数量一般情况下的总量即读磁盘每秒列表示写入到块设备的数据总量即写磁盘每秒这里我们
12、设置的参考值为如果超过而且值较大则表示系统磁盘有问题应该考虑提高磁盘的读写性能显示采集间隔内发生的中断数列表示在某一时间间隔中观测到的每是磁盘或者磁盘控制器的带宽瓶颈造成的(主要是块操作)、内存评估 命令:Free-m xSpjapg!I i nux-hve4:free-tr:used free shared buffers cached 3793 37?1 22 0 0 1842 I-/+buffers/cache:192B 1865|Swap:8189 _._ 11S8 7000 “free-m”表示以M为单位查看内存使用情况,在这个输出中,重点关注的应 该是free列与cached列的输
13、出值,由输出可知,此系统共 4G内存,系统空闲内 存还有22M,其中,Buffer Cache 占用了 0M,Page Cache 占用了 1842M,由此可 知系统缓存很多,而对于应用程序来说,可以使用的内存还有 1865M,当然这个 1865M 包含了 Buffer Cache和Page Cache的值。在swap项可以看出,交换分区 使用1188m 所以从应用的角度来说,1865/3792=49%此系统内存资源系统内存 资源基本能满足应用需求 一般有这样一个经验公式:应用程序可用内存/系统物理内存70%时,表示系统 内存资源非常充足,不影响系统性能,应用程序可用内存/系统物理内存20%时
14、,表示系统内存资源紧缺,需要增加系统内存,20%应用程序可用内存/系统物理 内存70%时,表示系统内存资源基本能满足应用需求,暂时不影响系统性能。free命令还可以适时的监控内存的使用状况,使用“-s”参数可以在指定的时间 段内不间断的监控内存的使用情,例如:free-ms 5 在 5秒钟内不间断监控内 存 linux 发行版都带有这个工具,通过 watch,可以 令,watch 就会自动重复去运行这个命令,默认是 2 秒钟执行一次,并把执行的结果更新在 屏幕上。例如:rootwebserver#watch-n 3-d free-m Every 3.0s:free Sun Nov 30 16:
15、23:20 2008 total used free shared buffers cached Mem:8306544 7349548 956996 0 203296 6500024-/+buffers/cache:646228 7660316 Swap:8385888 160 8385728其中,“-n”指定重复执行的时间,“-d”表示高亮显示变动。2.3 vmstat 命令监控内存 vmstat命令在监控系统内存方面功能强大,请看下面的一个输出:procs-memory-swap-io-system-cpu r b swpd free buff cache si so bi bo in
16、cs us sy id wa 0 0 906440 22796 155616 1325496 340 180 2 4 1 4 80 0 10 10 0 0 906440 42796 155616 1325496 320 289 0 54 1095 287 70 15 0 15 0 0 906440 42884 155624 1325748 236 387 2 102 1064 276 78 2 5 15 x諭aplinux-hv&4:vnstat procs ineiDory -Ewap-i sys t em-cpu-r b swpd free buff cache si so bi bo i
17、n cs us sy id st 1 0 1217540 22540 0 1835308 2 2 64?83 2 4 79 2 17 2 0 对于内存的监控,在vmstat中重点关注的是swpd、si和so行,从这个输出可以 看出,此系统内watch 是一个非常有用的命令,几乎每个 动态的监控命令的运行结果,省去手动执行的麻烦。可以在 watch 后面跟上需要运行的命 果长期大于系统的个数说明不足需要增加列表示在等待资源的进程数比如正在等待或者内存交换等列表示切换到内存交换区的内存数量以为单位如果的值不为或者比较大只要的值长期为这种情况下一般不用担心不会影响系统性能列作为文件系统频繁访问的文件
18、都会被如果值较大说明的文件数较多如果此时中比较小说明文件系统效率比较好列表示由磁盘入内存也就是内存进入内存交换区的数量列表示由内存入磁盘也就是内存交换区进入内存的数量一般情况下的总量即读磁盘每秒列表示写入到块设备的数据总量即写磁盘每秒这里我们设置的参考值为如果超过而且值较大则表示系统磁盘有问题应该考虑提高磁盘的读写性能显示采集间隔内发生的中断数列表示在某一时间间隔中观测到的每存资源紧缺,swpd占用了 1200M左右内存,si、so的值长期不 为 0,则表示系统内存不足,而由于系统内存的紧缺,导致出现 17%左右的系统 等待,此时增加系统的内存最好的选择。综合上述:建议增加内存,内存资源比较紧
19、张 三、网络评估 4.2通过netstat-i组合检测网络接口状况 netstat命令提供了网络接口的详细信息,请看下面的输出:rootwebserver#n etstat-i/-r Kernel In terface table Iface MTU Met RX-OK RX-ERR RX-DRP RX-OVR TX-OK TX-ERR TX-DRP TX-OVR Flg eth0 1500 0 1313129253 0 0 0 1320686497 0 0 0 BMRU eth1 1500 0 494902025 0 0 0 292358810 0 0 0 BMRU lo 16436 0 4
20、1901601 0 0 0 41901601 0 0 0 LRU 对上面每项的输出解释如下:?Iface 表示网络设备的接口名称。?MTU表示最大传输单元,单位字节。?RX-OK/TX-OK 表示已经准确无误的接收/发送了多少数据包。?RX-ERR/TX-ERR表示接收/发送数 据包时产生了多少错误。?RX-DRP/TX-DRP表示接收/发送数据包时丢弃了多少数 据包。?RX-OVR/TX-OVR表示由于误差而遗失了多少数据包。?Fig表示接口标记,其中:?L:表示该接口是个回环设备。?B:表示设置了广播地址。?M:表示 接收所有数据包。?R:表示接口正在运行。?U:表示接口处于活动状态。?O
21、:表示在该接口上禁用 arp。?P:表示一个点到点的连接。正常情况下,RX-ERR/TX-ERR RX-DRP/TX-DRP和 RX-OVR/TX-OVR的值都应该为 0,如果这几个选项 的值不为0,并且很大,那么网络质量肯定有问题,网络传输性能也一定会下降。当网络传输存在问题是,可以检测网卡设备是否存在故障,如果可能,可以升级 为千兆网卡或者光纤网络,还可以检查网络部署环境是否合理。果长期大于系统的个数说明不足需要增加列表示在等待资源的进程数比如正在等待或者内存交换等列表示切换到内存交换区的内存数量以为单位如果的值不为或者比较大只要的值长期为这种情况下一般不用担心不会影响系统性能列作为文件系统频繁访问的文件都会被如果值较大说明的文件数较多如果此时中比较小说明文件系统效率比较好列表示由磁盘入内存也就是内存进入内存交换区的数量列表示由内存入磁盘也就是内存交换区进入内存的数量一般情况下的总量即读磁盘每秒列表示写入到块设备的数据总量即写磁盘每秒这里我们设置的参考值为如果超过而且值较大则表示系统磁盘有问题应该考虑提高磁盘的读写性能显示采集间隔内发生的中断数列表示在某一时间间隔中观测到的每