Linux 性能分析之top命令详解

概述

top命令是Linux下常用的性能分析工具,能够实时显示系统中各个进程的资源占用状况,其作用类似于windows系统中的任务管理器。

top命令可以动态显示系统的负载情况,本文将详细介绍top命令的方方面面。

常用参数

top命令支持一些参数,下面是一些常用的参数:

-d:设置刷新频率。-n:设置刷新的次数。-p:显示指定进程的信息。-u:显示指定用户的进程信息。-o:指定排序字段。-h:显示帮助信息。

显示每 2 秒刷新一次且仅刷新 10 次的进程信息:

top -d 2 -n 10

显示指定用户 root 的进程信息:

top -u root

显示指定进程 ID 为 123 的信息:

top -p 123

以内存使用率排序:

top -o %MEM

top命令内容

通常top命令的输出如下所示,它包含了很多方面的数据,例如CPU,内存,系统的任务等等数据。

top - 10:32:42 up 38 min, 2 users, load average: 0.00, 0.00, 0.00

Tasks: 237 total, 1 running, 236 sleeping, 0 stopped, 0 zombie

%Cpu(s): 0.3 us, 0.4 sy, 0.0 ni, 99.1 id, 0.0 wa, 0.1 hi, 0.1 si, 0.0 st

MiB Mem : 3635.0 total, 3229.8 free, 441.0 used, 170.1 buff/cache

MiB Swap: 2072.0 total, 2072.0 free, 0.0 used. 3194.0 avail Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

1461 root 20 0 7252 3672 3280 S 0.7 0.1 0:00.03 bash

1621 root 20 0 10700 4360 3476 R 0.7 0.1 0:00.05 top

1477 root 20 0 0 0 0 I 0.3 0.0 0:00.01 kworker/0:0-events

1 root 20 0 103372 12748 9724 S 0.0 0.3 0:02.18 systemd

2 root 20 0 0 0 0 S 0.0 0.0 0:00.04 kthreadd

3 root 0 -20 0 0 0 I 0.0 0.0 0:00.00 rcu_gp

4 root 0 -20 0 0 0 I 0.0 0.0 0:00.00 rcu_par_gp

5 root 0 -20 0 0 0 I 0.0 0.0 0:00.00 slub_flushwq

6 root 0 -20 0 0 0 I 0.0 0.0 0:00.00 netns

8 root 0 -20 0 0 0 I 0.0 0.0 0:00.00 kworker/0:0H-events_highpri

10 root 0 -20 0 0 0 I 0.0 0.0 0:00.00 kworker/0:1H-events_highpri

11 root 0 -20 0 0 0 I 0.0 0.0 0:00.00 mm_percpu_wq

13 root 20 0 0 0 0 I 0.0 0.0 0:00.00 rcu_tasks_kthre

下面便一行一行的看看top命令的数据。

第一行其实代表了系统的启动时间和系统的平均负载。

top - 10:32:42 up 38 min, 2 users, load average: 0.00, 0.00, 0.00

top - 10:32:42 up 38 min 代表当前系统的时间是10:32:42,并且该机器已经启动了38 min。2 users代表当前有两个用户登录。load average: 0.00, 0.00, 0.00代表的是系统最近5、10和15分钟内的平均负载。

这里需要注意的是平均负载并不是代表CPU的使用率。简单来说,平均负载是指单位时间内,系统处于可运行状态和不可中断状态的平均进程数,也就是平均活跃进程数。

所谓可运行状态和不可中断状态是指:

可运行状态®:正在CPU上运行或者正在等待CPU的进程状态,如上;不可中断状态(D):不可中断是指一些正在处于内核关键流程的进程,如果盲目打断,会造成不可预知的后果,比如正在写磁盘的进程,盲目被打断,可能会造成读写不一致的问题。

因此这里再次强调load average和CPU使用率并没有直接关系,其值可以大于100。

其实第一行的显示数据和命令uptime的作用是一样的。

第二行显示的是关于进程状态的总结。

进程可以处于不同的状态,这里显示了处于各种状态的进程数量,例如正在运行的任务、睡眠的任务、停止的任务、僵尸进程的数量等。

在下面的显示中, 系统总共有237个进程,其中1个进程处于running状态,236个进程处于sleeping状态,0个进程处于stop状态,0个进程处于僵尸进程状态。

Tasks: 237 total, 1 running, 236 sleeping, 0 stopped, 0 zombie

第三行是比较关键的一行,线上定位问题的时候,会经常关注这个点。

%Cpu(s): 0.3 us, 0.4 sy, 0.0 ni, 99.1 id, 0.0 wa, 0.1 hi, 0.1 si, 0.0 st

这里的每一个参数的含义如下所示:

us, user: 用户空间的CPU百分比sy,system: 内核空间占用的CPU百分比ni,niced:调整过优先级的用户进程占用CPU百分比id,idle: 空闲CPU的百分比wa,IO wait: 用于等待IO完成的CPU时间hi:处理硬件中断的CPU时间si: 处理软件中断的CPU时间st:这个虚拟机被hypervisor偷去的CPU时间(译注:如果当前处于一个hypervisor下的vm,实际上hypervisor也是要消耗一部分CPU处理时间的)。

第四部分是关于内存部分的数据。这里包含了两行,

第一行是物理内存的使用情况,第二行是关于交换分区的使用情况。

MiB Mem : 3635.0 total, 3229.8 free, 441.0 used, 170.1 buff/cache

MiB Swap: 2072.0 total, 2072.0 free, 0.0 used. 3194.0 avail Mem

第一行的含义如下:

3635.0 total — 物理内存总量(3265MB )3229.8 free — 空闲的内存总量( 3229.8MB )441.0 used — 使用中的内存总量( 441.0MB )170.1 buff/cache — block buffer + page cache 所占用的内存大小 (169M)

这里补充一句buff/cache的内容,在Linux 2.4以前,page cache和buffer cache是两个独立的缓存,Linux 2.4开始page cache和buffer cache进行了统一。

第二行的含义如下:

2072.0 total - 交换分区的总量2072.0 free - 空闲的交换分区的总量0.0 used - 已使用的交换分区大小3194.0 avail Mem: 这个值是系统的估算值,表示可用于启动新程序的物理内存大小(不包括 swap 空间)

第五部分是关于每个进程的数据:

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

1461 root 20 0 7252 3672 3280 S 0.7 0.1 0:00.03 bash

1621 root 20 0 10700 4360 3476 R 0.7 0.1 0:00.05 top

1477 root 20 0 0 0 0 I 0.3 0.0 0:00.01 kworker/0:0-events

1 root 20 0 103372 12748 9724 S 0.0 0.3 0:02.18 systemd

2 root 20 0 0 0 0 S 0.0 0.0 0:00.04 kthreadd

3 root 0 -20 0 0 0 I 0.0 0.0 0:00.00 rcu_gp

在横向列出的系统属性和状态下面,是以列显示的进程。不同的列代表下面要解释的不同属性。

PID:进程ID,进程的唯一标识符USER:进程所有者的实际用户名。PR:进程的调度优先级。这个字段的一些值是’rt’。这意味这这些进程运行在实时态。NI:进程的nice值(优先级)。NI的值处于[-20, 19],越小的值意味着越高的优先级。VIRT:进程使用的虚拟内存。默认是KB。RES:驻留内存大小。驻留内存是任务使用的非交换物理内存大小,默认是KB。SHR:SHR是进程使用的共享内存,默认是KB。S:这个是进程的状态。它有以下不同的值:

D – 不可中断的睡眠态。R – 运行态S – 睡眠态T – 被跟踪或已停止Z – 僵尸态 CPU:自从上一次更新时到现在任务所使用的CPU时间百分比。MEM:进程使用的可用物理内存百分比。TIME:任务启动后到现在所使用的全部CPU时间,精确到百分之一秒。COMMAND:运行进程所使用的命令。

使用技巧

多核CPU监控

在top的基本视图中,按数字1,可以监控每个逻辑CPU的状况,例如下面的例子,我的虚拟机包含了4个cpu,这里显示了4个CPU的运行状况。

top - 13:35:11 up 3:40, 2 users, load average: 0.00, 0.02, 0.00

Tasks: 234 total, 1 running, 233 sleeping, 0 stopped, 0 zombie

%Cpu0 : 0.3 us, 0.7 sy, 0.0 ni, 98.7 id, 0.0 wa, 0.3 hi, 0.0 si, 0.0 st

%Cpu1 : 0.7 us, 0.3 sy, 0.0 ni, 98.7 id, 0.0 wa, 0.0 hi, 0.3 si, 0.0 st

%Cpu2 : 0.3 us, 0.7 sy, 0.0 ni, 99.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st

%Cpu3 : 0.3 us, 0.3 sy, 0.0 ni, 99.3 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st

MiB Mem : 3635.0 total, 3188.5 free, 461.1 used, 209.5 buff/cache

MiB Swap: 2072.0 total, 2072.0 free, 0.0 used. 3173.9 avail Mem

切换内存的单位

切换任务区的内存单位

在top的基本试图中,按字母e,可以切换每个任务占用内存的大小的单位, 从 KB、MB、GB、TB、PB 到 EB 循环切换。下面切换为了以MB为单位:

top - 14:45:06 up 4:59, 1 user, load average: 0.02, 0.01, 0.00

Tasks: 228 total, 2 running, 226 sleeping, 0 stopped, 0 zombie

%Cpu(s): 0.3 us, 0.3 sy, 0.0 ni, 99.2 id, 0.0 wa, 0.1 hi, 0.1 si, 0.0 st

MiB Mem : 3635.0 total, 3193.4 free, 454.6 used, 211.3 buff/cache

MiB Swap: 2072.0 total, 2072.0 free, 0.0 used. 3180.4 avail Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

94996 root 20 0 10.4m 4.3m 3.4m R 0.7 0.1 0:00.05 top

1712 root 20 0 0.0m 0.0m 0.0m I 0.3 0.0 0:35.48 kworker/0:0-events

1 root 20 0 165.1m 12.5m 9.6m S 0.0 0.3 1:38.13 systemd

2 root 20 0 0.0m 0.0m 0.0m S 0.0 0.0 0:00.05 kthreadd

3 root 0 -20 0.0m 0.0m 0.0m I 0.0 0.0 0:00.00 rcu_gp

4 root 0 -20 0.0m 0.0m 0.0m I 0.0 0.0 0:00.00 rcu_par_gp

切换汇总区的内存单位 使用大小字母E,可以实现汇总区域的内存的单位从 KB、MB、GB、TB、PB 到 EB 循环切换。

top - 14:54:18 up 5:08, 1 user, load average: 0.02, 0.02, 0.00

Tasks: 227 total, 2 running, 225 sleeping, 0 stopped, 0 zombie

%Cpu(s): 0.3 us, 0.4 sy, 0.0 ni, 99.1 id, 0.0 wa, 0.1 hi, 0.1 si, 0.0 st

KiB Mem : 3722236 total, 3268096 free, 467500 used, 216364 buff/cache

KiB Swap: 2121724 total, 2121724 free, 0 used. 3254736 avail Mem

top - 14:54:34 up 5:08, 1 user, load average: 0.02, 0.02, 0.00

Tasks: 227 total, 1 running, 226 sleeping, 0 stopped, 0 zombie

%Cpu(s): 0.4 us, 0.4 sy, 0.0 ni, 99.0 id, 0.0 wa, 0.0 hi, 0.1 si, 0.0 st

MiB Mem : 3635.0 total, 3186.9 free, 461.2 used, 211.3 buff/cache

MiB Swap: 2072.0 total, 2072.0 free, 0.0 used. 3173.8 avail Mem

top - 14:54:44 up 5:08, 1 user, load average: 0.01, 0.02, 0.00

Tasks: 227 total, 1 running, 226 sleeping, 0 stopped, 0 zombie

%Cpu(s): 0.0 us, 0.0 sy, 0.0 ni,100.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st

GiB Mem : 3.5 total, 3.1 free, 0.4 used, 0.2 buff/cache

GiB Swap: 2.0 total, 2.0 free, 0.0 used. 3.1 avail Mem

限制展示任务的数量

快捷键 n 用于限制要展示的任务的数量,0 表示无限制。默认是全部展示(超过一页需要翻页)。

这里输入n之后,再输入5,选择只显示5条记录

top - 14:47:34 up 5:01, 1 user, load average: 0.05, 0.03, 0.00

Tasks: 227 total, 1 running, 226 sleeping, 0 stopped, 0 zombie

%Cpu(s): 1.5 us, 1.5 sy, 0.0 ni, 97.0 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st

MiB Mem : 3635.0 total, 3187.3 free, 460.8 used, 211.3 buff/cache

MiB Swap: 2072.0 total, 2072.0 free, 0.0 used. 3174.2 avail Mem

Maximum tasks = 0, change to (0 is unlimited)5

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

1 root 20 0 169040 12832 9800 S 0.0 0.3 1:38.14 systemd

2 root 20 0 0 0 0 S 0.0 0.0 0:00.05 kthreadd

显示如下:

top - 14:48:16 up 5:02, 1 user, load average: 0.02, 0.02, 0.00

Tasks: 228 total, 1 running, 227 sleeping, 0 stopped, 0 zombie

%Cpu(s): 0.3 us, 0.5 sy, 0.0 ni, 99.0 id, 0.0 wa, 0.1 hi, 0.1 si, 0.0 st

MiB Mem : 3635.0 total, 3190.8 free, 457.2 used, 211.3 buff/cache

MiB Swap: 2072.0 total, 2072.0 free, 0.0 used. 3177.8 avail Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

1386 root 20 0 84320 22744 19808 S 0.3 0.6 0:00.09 smbd

1514 root 20 0 7252 3696 3304 S 0.3 0.1 0:51.33 bash

90783 root 20 0 0 0 0 I 0.3 0.0 0:00.02 kworker/2:2-mm_percpu_wq

95906 root 20 0 10700 4356 3472 R 0.3 0.1 0:00.05 top

1 root 20 0 169040 12832 9800 S 0.0 0.3 1:38.14 systemd

只展示指定用户的任务

快捷键 u 表示要过滤的用户,可以加 ! 前缀表示反向条件。可以输入 UID 或者 username,直接回车表示取消这个过滤条件。

top - 14:49:30 up 5:03, 1 user, load average: 0.00, 0.02, 0.00

Tasks: 229 total, 2 running, 227 sleeping, 0 stopped, 0 zombie

%Cpu(s): 0.5 us, 0.4 sy, 0.0 ni, 98.9 id, 0.0 wa, 0.1 hi, 0.1 si, 0.0 st

MiB Mem : 3635.0 total, 3190.0 free, 458.0 used, 211.3 buff/cache

MiB Swap: 2072.0 total, 2072.0 free, 0.0 used. 3177.0 avail Mem

Which user (blank for all) root

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

46 root 20 0 0 0 0 S 0.3 0.0 0:00.28 kcompactd0

1454 root 20 0 19112 7260 5176 S 0.3 0.2 0:33.76 sshd

1514 root 20 0 7252 3696 3304 S 0.3 0.1 0:51.54 bash

按照CPU占用量进行排序

运行top命令后,键入大写字母P,可以对任务的CPU使用情况进行排序,有两种途径:

打开大写键盘的情况下,直接按p为打开大写键盘的情况下,shift+p。

top - 15:01:01 up 5:15, 1 user, load average: 0.02, 0.03, 0.00

Tasks: 228 total, 2 running, 226 sleeping, 0 stopped, 0 zombie

%Cpu(s): 2.8 us, 2.8 sy, 0.0 ni, 94.4 id, 0.0 wa, 0.0 hi, 0.0 si, 0.0 st

MiB Mem : 3635.0 total, 3189.3 free, 458.8 used, 211.3 buff/cache

MiB Swap: 2072.0 total, 2072.0 free, 0.0 used. 3176.2 avail Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

727 root 20 0 26128 9688 8596 S 7.4 0.3 0:00.16 systemd-journal

99654 root 20 0 10700 4356 3476 R 3.7 0.1 0:00.74 top

1 root 20 0 169040 12832 9800 S 0.0 0.3 1:38.14 systemd

2 root 20 0 0 0 0 S 0.0 0.0 0:00.05 kthreadd

3 root 0 -20 0 0 0 I 0.0 0.0 0:00.00 rcu_gp

按照任务的内存使用量进行排序

运行top命令后,键入大写字母M,可以对任务的CPU使用情况进行排序,有两种途径:

打开大写键盘的情况下,直接按m为打开大写键盘的情况下,shift+m。

top - 15:02:25 up 5:16, 1 user, load average: 0.00, 0.02, 0.00

Tasks: 229 total, 1 running, 228 sleeping, 0 stopped, 0 zombie

%Cpu(s): 0.4 us, 0.4 sy, 0.0 ni, 99.0 id, 0.0 wa, 0.1 hi, 0.1 si, 0.0 st

MiB Mem : 3635.0 total, 3187.3 free, 460.8 used, 211.3 buff/cache

MiB Swap: 2072.0 total, 2072.0 free, 0.0 used. 3174.2 avail Mem

PID USER PR NI VIRT RES SHR S %CPU %MEM TIME+ COMMAND

1386 root 20 0 84320 22744 19808 S 0.0 0.6 0:00.09 smbd

813 root 20 0 257068 21184 16536 S 0.0 0.6 0:01.22 NetworkManager

872 root 20 0 72880 17140 14664 S 0.0 0.5 0:00.62 nmbd

1 root 20 0 169040 12832 9800 S 0.0 0.3 1:38.14 systemd

1436 root 20 0 18764 12060 10248 S 0.0 0.3 0:00.03 sshd

1433 root 20 0 18756 12036 10184 S 0.0 0.3 0:00.04 sshd

top交互模式下查看帮助

在交互模式下,敲入h可以查看帮助信息:

参考阅读

评论可见,请评论后查看内容,谢谢!!!评论后请刷新页面。