《性能测试工具Lmbench使用说明4373.pdf》由会员分享,可在线阅读,更多相关《性能测试工具Lmbench使用说明4373.pdf(8页珍藏版)》请在taowenge.com淘文阁网|工程机械CAD图纸|机械工程制图|CAD装配图下载|SolidWorks_CaTia_CAD_UG_PROE_设计图分享下载上搜索。
1、cos 性能测试工具 Lmbench 的安装使用与参数说明 1 工具简介 Linux 性能测试工具 Lmbench 是一套简易可移植的,符合 ANSI/C 标准为 UNIX/POSIX而制定的微型测评工具。一般来说,它衡量两个关键 特征:反应时间和带宽。Lmbench 旨在使系统开发者深入了解关键操作的基础成本。其官方网站是:/lmbench/。2 安装过程及一般错误解决办法 安装使用 Linux 性能测试工具 Lmbench 的安装相对比较简单,到其官方网站下载压缩包下面以在/opt 目录下为列,说明安装方法 解压 tar-xzvf lmbench3 make results 如果在 mak
2、e 的时候出错,提示类似$make results make1:Entering directory/home/kyuan/lmbench3/src gmake2:Entering directory/home/kyuan/lmbench3/src gmake2:*No rule to make target./SCCS/,needed by.gmake2:Leaving directory/home/kyuan/lmbench3/src make1:*lmbench Error 2 make1:Leaving directory/home/kyuan/lmbench3/src make:*r
3、esults Error 2 这 是 需 要 修 改src/Makefile,将 这 么 一 行(在231 行 的 样 子),将$O/lmbench:./scripts/lmbench 中的 去掉,就可以了。如果编译没有错误,就会出现一些选择提示以对测试进行一个配置并生成配置脚本,首先出现的如下(:If you are running on an MP machine and you want to try running multiple copies of lmbench in parallel,you can specify how many here.Using this option
4、 will make the benchmark run 100 x slower(sorry).NOTE:WARNING!This feature is experimental and many results are known to be incorrect or random!MULTIPLE COPIES default 1 此处是提示你同时运行多少个并行的测试,对应为结果中的 scal load 项 接下来是选择作业调度控制方法,选 1 允许调度作业即可。如下:Options to control job placement 1)Allow scheduler to place
5、jobs 2)Assign each benchmark process with any attendent child processes to its own processor 3)Assign each benchmark process with any attendent child processes to its own processor,except that it will be as far as possible from other processes 4)Assign each benchmark and attendent processes to their
6、 own processors 5)Assign each benchmark and attendent processes to their own processors,except that they will be as far as possible from each other and other processes 6)Custom placement:you assign each benchmark process with attendent child processes to processors 7)Custom placement:you assign each
7、 benchmark and attendent 8)processes to processors 9)Note:some benchmarks,such as bw_pipe,create attendent child 10)processes for each benchmark process.For example,bw_pipe 11)needs a second process to send data down the pipe to be read 12)by the benchmark process.If you have three copies of the 13)
8、benchmark process running,then you actually have six processes;14)three attendent child processes sending data down the pipes and 15)three benchmark processes reading data and doing the measurements.16)Job placement selection:1 17)再接下来就是指定内存,本次指定为 512M,如下=Several benchmarks operate on a range of mem
9、ory.This memory should be sized such that it is at least 4 times as big as the external caches on your system.It should be no more than 80%of your physical memory.The bigger the range,the more accurate the results,but larger sizes take somewhat longer to run the benchmark.MB default 2814 512 下一步为所要运
10、行的子集,默认为全部,本次我们用默认值即可,如下 lmbench measures a wide variety of system performance,and the full suite of benchmarks can take a long time on some platforms.Consequently,we offer the capability to run only predefined subsets of benchmarks,one for operating system specific benchmarks and one for hardware s
11、pecific benchmarks.We also offer the option of running only selected benchmarks which is useful during operating system development.Please remember that if you intend to publish the results you either need to do a full run or one of the predefined OS or hardware subsets.SUBSET(ALL|HARWARE|OS|DEVELOP
12、MENT)default all 最后出现如下画面即为测试开始了,下面只需耐心的等就可以了。Confguration done,thanks.There is a mailing list for discussing lmbench hosted at BitMover.Send mail to to join the list.Using config in 2013 年 11 月 11 日 星期一 10:06:07 CST Latency measurements 2013 年 11 月 11 日 星期一 10:06:45 CST Calculating file system late
13、ncy 2013 年 11 月 11 日 星期一 10:06:49 CST Local networking 2013 年 11 月 11 日 星期一 10:08:29 CST Bandwidth measurements 3 测试结果查看 测试完毕执行 make see 可查看到测试结果报告 Lmbench 的结果及其说明、本次测试结果如下 cd results&make summary percent 2/dev/null|more make1:正在进入目录/opt/performance/lmbench3/results L M B E N C H 3.0 S U M M A R Y -
14、(Alpha software,do not distribute)Basic system parameters -Host OS Description Mhz tlb cache mem scal pages line par load bytes -user2-VT3 Linux i686-pc-linux-gnu 1598 88 128 1 Processor,Processes-times in microseconds-smaller is better -Host OS Mhz null null open slct sig sig fork exec sh call I/O
15、stat clos TCP inst hndl proc proc proc-user2-VT3 Linux 1598 647.1873 4330 Basic integer operations-times in nanoseconds-smaller is better-Host OS intgr intgr intgr intgr intgr bit add mul div mod -ser2-VT3 Linux Basic float operations-times in nanoseconds-smaller is better -Host OS float float float
16、 float add mul div bogo-user2-VT3 Linux Basic double operations-times in nanoseconds-smaller is better-Host OS double double double double add mul div bogo-user2-VT3 Linux Context switching-times in microseconds-smaller is better-Host OS 2p/0K 2p/16K 2p/64K 8p/16K 8p/64K 16p/16K 16p/64K ctxsw ctxsw
17、ctxsw ctxsw ctxsw ctxsw ctxsw-user2-VT3 Linux *Local*Communication latencies in microseconds-smaller is better-Host OS 2p/0K Pipe AF UDP RPC/TCP RPC/TCP ctxsw UNIX UDP TCP conn-user2-VT3 Linux 106.File&VM system latencies in microseconds-smaller is better-Host OS 0K File 10K File Mmap Prot Page 100f
18、d Create Delete Create Delete Latency Fault Fault selct-user2-VT3 Linux *Local*Communication bandwidths in MB/s-bigger is better-Host OS Pipe AF TCP File Mmap Bcopy Bcopy Mem Mem UNIX reread reread(libc)(hand)read write-user2-VT3 Linux 759.1214 833.2874 1517.Memory latencies in nanoseconds-smaller i
19、s better (WARNING-may not be correct,check graphs)-Host OS Mhz L1$L2$Main mem Rand mem Guesses-user2-VT3 Linux 1598 make1:正在离开目录/opt/performance/lmbench3/results 4 相关测试结果参数说明如下 ID 测 试 分类 技术参数 中文名称 测试结果 测试项描述 1 Basic system parameters Tlb pages 转换缓存页数 88 转换后备缓存的页面数 2 Cache line bytes 缓存行字节数 128 高速缓存行
20、字节数 3 Mem par 存储器分层并行化 存储器分层并行化 4 Scal load 并行负载 1 并行执行的 lmbench数目 5 Processor,Processes Null call 简单系统调用(取进程号)(单位:s)简单系统调用所花时间(单位微秒)6 Null I/O 简 单IO操作(空读写的平均)(单位:s)简单 IO 操作(空读写的平均时间)7 stat 取文档状态的操作(单位:s)取文档状态的操作所花时间 8 Open clos 打开然后立即关闭文档操作 (单位:s)打开文档,然后再关闭文档操作所花的时间 9 Slct tcp Select 设置(单位:s)Select
21、 设置所花时间 10 Sig hndl 捕获处理信号(单位:s)捕获处理信号所花的时间 11 Fork proc Fork进程后直接退出 647(单位:s)Fork 进程后址接退出所花的时间 12 Exec proc Fork后执行execve 调用再退出 1873(单位:s)Fork 后执行 execve调用再退出所花的时间 13 Sh proc Fork后执行shell再退出 4330(单位:s)Fork 后执行 shell 再退出所花的时间 14 Basic float operations intgr bitadd/mul/div/mod 整数位操作加乘除求模操作(单位:ns)整数位操
22、作,加,乘,除,等的运算所花时间 15 Basic float operations Float/add/mul/div/bogo 浮点型操作加乘(单位:ns)浮点数操作,加,乘,除,等的运算所花时间 16 Basic double operations Double add/mul/div/bogo 双精度数操作加乘除(单位:ns)双精度数操作,加,乘,除,等的运算所花时间 17 Context switching 2p/0k ctxsw 2 个并行处 理 0K大小的数据(单位:s)2 个并行处理 0K 大小的数据所花时间 18 2p/16k ctxsw 2 个并行处理 16K大小的数据(单
23、位:s)2 个并行处理 16K 大小的数据所花的时间 19 2p/64k ctxsw 2 个并行处理 64K大小的数据(单位:s)2 个并行处理 64K 大小的数据所花时间 20 8p/16k ctxsw 8 个并行处理 16K大小的数据(单位:s)8 个并行处理 16K 大小的数据所花时间 21 8p/64k ctxsw 8 个并行处理 64K大小的数据(单位:s)8 个并行处理 64K 大小的数据所花时间 22 16p/16k ctxsw 16 个 并行 处 理16K 大小的数据(单位:s)16 个并行处理 16K大小的数据所花时间 23 16p/64k ctxsw 16 个 并行 处 理
24、(单位:s)16 个并行处理 64K大小的数据所花时间 64K 大小的数据 24 Local*Communication latencies Pipe 本地管道通信延时(单位:s)本地管道通信延时时间 25 AF UNIX 26 UDP 本地 UDP 通信延时时间 27 TCP 本地 TCP 通信延时时间 28 Tcp conn TCP 建立connect并关闭描述字 106 TCP 建立连接并关闭所花时间 29 File&VM system latencies 0k file create/delete 0K 文 件创建与删除(单位:s)0K 文件创建删除所花的时间 30 10k file
25、create/delete 10K 文件创建与删除(单位:s)10K 文件创建删除所花的时间 31 Prot fault 保护页(单位:s)保护页延时时间 32 Page fault 缺页(单位:s)缺页延时时间 33 100fd selct 对 100 个文档描述符 配 置select(单位:s)对 100 个文档描述符配置 select 的时间 34 Local*Communication bandwidths Pipe 本地通信带宽方面管道操作 759MBs 本地通信带宽方面管道操作速度 35 File reread 文档重复读 s 文档重复读取的速度 36 Mmap reread 内存映射重复读取 s 内存映射重复读取速度 37 bcopy(libc)内存拷贝 s 内存拷贝使用 libc 38 bcopy(hand)内存拷贝 s 内存拷贝手工拷贝速度 39 Mem read 内存读 2874MB/s 内存读取速度 40 Mem write 内存写 1517MB/s 内存写入速度 41 Memory latencies L1 L1 缓存(单位:ns)L1 缓存操作延时 42 L2 L2 缓存(单位:ns)L2 缓存操作延时 43 Main mem 连续内存(单位:ns)系统内存连续操作延时 44 Rand mem 内存随机访问延时(单位:ns)系统内存随机访问操作延时