Linux vmstat命令详解

guiyun affiliate

Linux命令千千万,而我们在日常工作中真真切切用到的命令应该不超过50个,在接下来的日子里,我会对我经常使用的命令,以及使用过程中不熟悉的命令进行一个总结,一是自我总结,加深记忆;二是和大家分享。

vmstat是Virtual Meomory Statistics(虚拟内存统计)的缩写,可对操作系统的虚拟内存、进程、CPU活动进行监控。它是对系统的整体情况进行统计,不足之处是无法对某个进程进行深入分析。vmstat工具提供了一种低开销的系统性能观察方式。因为vmstat本身就是低开销工具,在非常高负荷的服务器上,你需要查看并监控系统的健康情况,在控制窗口还是能够使用vmstat输出结果。

虚拟内存原理

上面说到了vmstat是虚拟内存统计工具,那咱就不得不说一说虚拟内存原理。

在系统中运行的每个进程都需要使用到内存,但不是每个进程都需要每时每刻使用系统分配的内存空间。当系统运行所需内存超过实际的物理内存,内核会释放某些进程所占用但未使用的部分或所有物理内存,将这部分资料存储在磁盘上直到进程下一次调用,并将释放出的内存提供给有需要的进程使用。

在Linux内存管理中,主要是通过“调页Paging”和“交换Swapping”来完成上述的内存调度。调页算法是将内存中最近不常使用的页面换到磁盘上,把活动页面保留在内存中供进程使用。交换技术是将整个进程,而不是部分页面,全部交换到磁盘上。

分页(Page)写入磁盘的过程被称作Page-Out,分页(Page)从磁盘重新回到内存的过程被称作Page-In。当内核需要一个分页时,但发现此分页不在物理内存中(因为已经被Page-Out了),此时就发生了分页错误(Page Fault)。

当系统内核发现可运行内存变少时,就会通过Page-Out来释放一部分物理内存。经管Page-Out不是经常发生,但是如果Page-out频繁不断的发生,直到当内核管理分页的时间超过运行程式的时间时,系统效能会急剧下降。这时的系统已经运行非常慢或进入暂停状态,这种状态亦被称作thrashing(颠簸)。

命令详解

vmstat常用命令格式如下:

  1. vmstat [-a] [-n] [-S unit] [delay [ count]]

  2. vmstat [-s] [-n] [-S unit]

  3. vmstat [-m] [-n] [delay [ count]]

  4. vmstat [-d] [-n] [delay [ count]]

  5. vmstat [-p disk partition] [-n] [delay [ count]]

  6. vmstat [-f]

  7. vmstat [-V]

命令选项说明如下:

  1. -a:显示活跃和非活跃内存

  2. -f:显示从系统启动至今的fork数量 。

  3. -m:显示slabinfo

  4. -n:只在开始时显示一次各字段名称。

  5. -s:显示内存相关统计信息及多种系统活动数量。

  6. delay:刷新时间间隔。如果不指定,只显示一条结果。

  7. count:刷新次数。如果不指定刷新次数,但指定了刷新时间间隔,这时刷新次数为无穷。

  8. -d:显示磁盘相关统计信息。

  9. -p:显示指定磁盘分区统计信息

  10. -S:使用指定单位显示。参数有 k 、K 、m 、M,分别代表1000、1024、1000000、1048576字节(byte)。默认单位为K(1024 bytes)

  11. -V:显示vmstat版本信息。 下面就对我们常用的使用方式进行详细的总结。

 

使用实例

输入命令:vmstat 1
输出结果:

  1. procs -----------memory---------- ---swap-- -----io---- -system-- ------cpu-----

  2. r  b   swpd   free   buff  cache   si   so    bi    bo   in   cs us sy id wa st

  3. 3  0 361396 196772  55820 359372    0    0    13    21    1    1  2  0 98  0  0

  4. 1  0 361392 196524  55820 359616    8    0   236     0  411  527  1  0 90  9  0

  5. 2  1 361392 196524  55828 359608    0    0     0    48  370  503  1  1 98  0  0

  6. 4  0 361392 196524  55828 359616    0    0     0     0  442  559  1  0 99  0  0

字段说明:

  • procs(进程)

    • r:当前运行队列中线程的数目,代表线程处于可运行状态,但CPU还未能执行.,这个值可以作为判断CPU是否繁忙的一个指标;当这个值超过了CPU数目,就会出现CPU瓶颈了;这个我们可以结合top命令的负载值同步评估系统性能;

    • b:等待IO的进程数量;如果该值一直都很大,说明IO比较繁忙,处理较慢;

  • memory(内存)

    • swpd:虚拟内存已使用的大小;如果swpd的值不为0,但是si,so的值长期为0,这种情况不会影响系统性能;

    • free:空闲的物理内存的大小;

    • buff:用作缓冲的内存大小;

    • cache:用作缓存的内存大小;如果cache的值大的时候,说明cache处的文件数多,如果频繁访问到的文件都能被cache处,那么磁盘的读IO bi会非常小;

  • swap(交换空间,单位:KB);内存够用的时候,这2个值都是0,如果这2个值长期大于0时,系统性能会受到影响,磁盘IO和CPU资源都会被消耗。有时我们看到空闲内存(free)很少的或接近于0时,就认为内存不够用了,不能光看这一点,还要结合si和so,如果free很少,但是si和so也很少(大多时候是0),那么不用担心,系统性能这时不会受到影响的;

    • si:每秒从交换区写到内存的大小;

    • so:每秒写入交换区的内存大小;

  • io(单位:块/秒)

    • bi:每秒读取的块数;

    • bo:每秒写入的块数;随机磁盘读写的时候,这2个值越大,能看到CPU在IO等待的值也会越大;

  • system(系统);这2个值越大,会看到由内核消耗的CPU时间会越大;

    • in:每秒中断数,包括时钟中断;

    • cs:每秒上下文切换数;

  • cpu(以百分比表示)

    • us:用户进程执行时间(user time);

    • sy:系统进程执行时间(system time);

    • id:空闲时间(包括IO等待时间);

    • wa:等待IO时间;wa的值高时,说明IO等待比较严重,这可能由于磁盘大量作随机访问造成,也有可能磁盘出现瓶颈。


原文:https://www.guji.work/archives/664

guiyun affiliate

作者头像
南宫俊逸创始人

君子好学,自强不息~

上一篇:MySQL不能远程登录的解决
下一篇:MTR – Linux的网络诊断工具

发表评论