性能测试分析与性能调优诊断--史上最全的服务器性能分析监控调优篇 (2)

日期：2021-10-07 栏目：程序人生浏览：次

cache是第6列的监控数据，表示用来给已经打开的文件做缓冲的内存大小，cache直接用来记忆我们打开的文件，把空闲的物理内存的一部分拿来做文件和目录的缓存，是为了提高程序执行的性能，当程序使用内存时，buffer/cached会很快地被使用，当空闲的物理内存不足时（即free的内存不足），这些缓存的内存便可以释放出来。

si是第7列的监控数据，表示每秒从磁盘（虚拟内存swap）读入到内存的大小，如果这个值长期大于0，那物理运行内存可能已经是不够用了。

so是第8列的监控数据，表示每秒写入磁盘（虚拟内存swap）的内存大小，so刚好和si相反，si一般是将磁盘空间调入内存，so一般是将内存数据调入磁盘。

bi是第9列的监控数据，表示块设备每秒读取的块数量（从磁盘读取数据，这个值一般表示每秒读取了磁盘的多少个block），这里的块设备（block）是指系统上所有的磁盘和其他块设备，默认块大小是1024byte。

bo是第10列的监控数据，表示块设备每秒写入的块数量（往磁盘写入数据，这个值一般表示每秒有多少个block写入了磁盘）。通常情况下，随机磁盘读写的时候，bi和bo这2个值越大（如超出1024k)，能看到CPU在IO等待的值也会越大。

in是第11列的监控数据，表示每秒CPU的中断次数，包括时钟中断。

cs是第12列的监控数据，表示 CPU每秒上下文切换次数，例如我们调用系统函数，就要进行上下文切换，线程的切换，也要进程上下文切换，这个值要越小越好，太大了，要考虑调低线程或者进程的数目,例如在apache和nginx这种web服务器中，我们一般做性能测试时会进行几千并发甚至几万并发的测试，选择web服务器的进程可以由进程或者线程的峰值一直下调，压测，直到cs到一个比较小的值，这个进程和线程数就是比较合适的值了。系统调用也是，每次调用系统函数，我们的代码就会进入内核空间，导致上下文切换，这个是很耗资源，也要尽量避免频繁调用系统函数。上下文切换次数过多表示你的CPU大部分浪费在上下文切换，导致CPU干正经事的时间少了，CPU没有充分利用，是不可取的。系统运行时，如果观察到in和cs 这两个指标非常高，那就需要对系统进行性能调优了。

us（user time）是第13列的监控数据，表示用户模式CPU使用时间的百分比，该值一般越高，说明CPU被正常利用的越好，笔者曾经在给一个机器学习算法（密集型CPU应用）做压力测试时，us的值可以接近100，那说明CPU已经充分被算法服务使用了。

sy是第14列的监控数据，表示系统内核进程执行时间百分比(system time)，sy的值高时，说明系统内核消耗的CPU资源多，这并不是一个服务器性能好的表现，通常in、cs、io的频繁操作等过高，都会引起sy的指标过高，这个时候我们应该要去定位原因了。

id是第15列的监控数据，表示空闲 CPU时间的占比，一般来说，id + us + sy = 100,一般可以认为id是空闲CPU使用率，us是用户CPU使用率，sy是系统CPU使用率。

wa是第16列的监控数据，表示I/O等待时间百分比，wa的值高时，说明IO等待比较严重，这可能由于磁盘大量作随机访问造成，也有可能磁盘出现瓶颈（块操作）

st是第17列的监控数据，表示CPU等待虚拟机调度的时间占比，这个指标一般在虚拟机中才会有，物理机中，该值一般维持为0，我们都知道虚拟机中的CPU一般是物理机CPU的虚拟核，一台物理机一般会有多个虚拟机同时在运行，那么此时虚拟机之间就会存在CPU的争抢情况，比如某台虚拟机上运行着占用CPU很高的密集型计算，就会导致其他的虚拟机上的CPU需要一直等待密集型计算的虚拟机上CPU的释放，st就是等待时间占CPU时间的占比，该值如果一直持续很高，那么表示虚拟服务器需要长期等待CPU，运行在该服务器的应用程序的性能会受到直接的影响，笔者曾经在压测时发现，该值越高，也会引起sy的值变高（因为操作系统内核需要不断的去调度CPU）。

vmstat还可以支持其他的参数使用，我们可以通过执行vmstat --help 命令查看到它支持的其他参数

转载注明出处：https://www.heiqu.com/zwyyjw.html

性能测试分析与性能调优诊断--史上最全的服务器性能分析监控调优篇 (2)

相关推荐