Linux下进程相关知识

2023-04-03 00:00:00 命令 运行 进程 终止 信号


1. ps命令

进程是在你的系统上运行的程序。它们由内核管理,每个进程都有一个与之关联的ID,称为**进程ID(PID)**。这个PID是按照进程创建的顺序分配的。

运行ps命令查看正在运行的进程列表:

ubuntu@ubuntu:~$ ps
   PID TTY          TIME CMD
  3309 pts/1    00:00:00 bash
  3794 pts/1    00:00:00 ps
ubuntu@ubuntu:~
  • PID:进程ID
  • TTY:控制与进程相关联的终端
  • TIME:总CPU使用时间
  • CMD:可执行/命令的名称

如果你看一下ps的man手册,你会发现有很多命令选项可以传递,它们会根据你想使用的选项而变化输出结果。

ubuntu@ubuntu:~$ ps --help all

Usage:
 ps [options]

Basic options:
 -A, -e               all processes
 -a                   all with tty, except session leaders
  a                   all with tty, including other users
 -d                   all except session leaders
 -N, --deselect       negate selection
  r                   only running processes
  T                   all processes on this terminal
  x                   processes without controlling ttys

Selection by list:
 -C <command>         command name
 -G, --Group <GID>    real group id or name
 -g, --group <group>  session or effective group name
 -pp, --pid <PID>   process id
        --ppid <PID>  parent process id
 -q, q, --quick-pid <PID>
                      process id (quick mode)
 -s, --sid <session>  session id
 -t, t, --tty <tty>   terminal
 -u, U, --user <UID>  effective user id or name
 -U, --User <UID>     real user id or name

  The selection options take as their argument either:
    a comma-separated list e.g. '-u root,nobody' or
    a blank-separated list e.g. '-p 123 4567'

Output formats:
 -F                   extra full
 -f                   full-format, including command lines
  f, --forest         ascii art process tree
 -H                   show process hierarchy
 -j                   jobs format
  j                   BSD job control format
 -l                   long format
  l                   BSD long format
 -M, Z                add security data (for SELinux)
 -O <format>          preloaded with default columns
  O <format>          as -O, with BSD personality
 -oo, --format <format>
                      user-defined format
  s                   signal format
  u                   user-oriented format
  v                   virtual memory format
  X                   register format
 -y                   do not show flags, show rss vs. addr (used with -l)
     --context        display security context (for SELinux)
     --headers        repeat header lines, one per page
     --no-headers     do not print header at all
     --cols, --columns, --width <num>
                      set screen width
     --rows, --lines <num>
                      set screen height

Show threads:
  H                   as if they were processes
 -L                   possibly with LWP and NLWP columns
 -mm                after processes
 -T                   possibly with SPID column

Miscellaneous options:
 -c                   show scheduling class with -l option
  c                   show true command name
  e                   show the environment after command
  k,    --sort        specify sort order as: [+|-]key[,[+|-]key[,...]]
  L                   show format specifiers
  n                   display numeric uid and wchan
  S,    --cumulative  include some dead child process data
 -y                   do not show flags, show rss (only with -l)
 -V, V, --version     display version information and exit
 -ww                unlimited output width

        --help <simple|list|output|threads|misc|all>
                      display help and exit

For more details see ps(1).

常用的操作命令:

ps aux


  • USER:有效用户(我们正在使用其访问权限的用户)
  • PID:进程号
  • %CPU: CPU使用时间除以进程运行时间
  • %MEM:进程的常驻集大小与机器上物理内存的比率
  • VSZ:整个进程的虚拟内存使用情况
  • RSS:常驻集大小,任务使用的非交换物理内存
  • TTY:控制与进程关联的终端
  • STAT:进程状态码
  • START:进程的开始时间
  • TIME:总CPU使用时间
  • COMMAND:可执行文件/命令的名称

另一个非常有用的命令是top命令,top为你提供有关系统上运行的进程的实时信息,而不是快照。默认情况下,你会每10秒刷新一次。top是一个非常有用的工具,可以查看哪些进程占用了大量资源。此处我们对top命令不做过多的讲解,想了解的小伙伴可以查看我之前的文章,有对top命令做详细的讲解。

2. 进程的细节

在我们深入了解进程的更多实际应用之前,我们必须了解它是什么以及它是如何工作的。

我们上面说过,进程是系统上正在运行的程序,更准确地说,它是系统分配内存、CPU、I/O以使程序运行的过程。一个进程是一个正在运行的程序的实例,打开3个终端窗口,在两个窗口中运行cat命令,不传递任何选项(cat进程将作为一个进程保持打开状态,因为它期望stdin)。现在在第三个窗口运行:ps aux | grep cat。将看到cat有两个进程,尽管它们调用的是同一个程序。


内核负责进程,当我们运行一个程序时,内核将程序的代码加载到内存中,确定和分配资源,然后监视每个进程:

  • 进程的状态
  • 进程正在使用和接收的资源
  • 进程所有者
  • 进程信号处理
  • 基本上所有的其他事情

所有进程都在占用资源,内核的工作是确保进程根据自身需求获得正确数量的资源。当一个进程结束时,它所使用的资源将被释放给其他进程使用。

3. 进程创建

当创建一个新进程时,现有进程基本上会使用称为fork系统调用的函数克隆自己。fork系统调用创建了一个基本相同的子进程,这个子进程有一个新的进程ID(PID),原始进程成为它的父进程,并有一个称为父进程ID PPID的东西。之后,子进程可以继续使用其父进程之前使用的相同程序,或者更经常地使用execve系统调用来启动一个新程序。这个系统调用破坏了内核为该进程设置的内存管理,并为新程序设置了新的内存管理。


l选项为我们提供了正在运行的进程的“长格式”甚至更详细的视图。你会看到一个标记为PPID的列,这是父ID。现在看看你的终端,你将看到正在运行的进程是你的shell,因此在我的系统上有一个运行bash的进程。现在请记住,当你运行ps l命令时,是从运行bash的进程中运行它的。bash shell的PID是ps l命令的PPID。

当系统启动时,内核创建了一个名为init的进程,它的PID为1。除非系统关闭,否则无法终止init进程。它以根权限运行,并运行许多保持系统运行的进程。

4. 进程终止

上面我们知道创建进程时会发生什么,那么当我们不再需要它时会发生什么呢?

进程可以使用_exit系统调用退出,这将释放进程用于重新分配的资源。因此,当一个进程准备终止时,它会用一个叫做终止状态的东西让内核知道它为什么要终止。通常情况下,状态为0表示进程终止成功。然而,这还不足以完全终止一个流程。父进程必须通过使用等待系统调用来确认子进程的终止,这是为了检查子进程的终止状态。

  • 孤儿进程当父进程在子进程之前死亡时,内核知道它不会得到一个等待调用,所以它会让这些进程成为“孤儿”,并将它们置于init(记住所有进程的父进程)的照顾下。init将终为这些孤儿执行等待系统调用,以便它们可以终止。

  • 僵尸进程当子进程终止而父进程还没有调用wait时会发生什么? 我们仍然希望能够看到子进程是如何终止的,因此即使子进程完成了,内核也会将子进程变成僵尸进程。子进程使用的资源仍然被释放给其他进程使用,但是进程表中仍然有这个僵尸进程的条目。僵尸进程也不能被杀死,因为它们在技术上是“死亡”的,所以你不能使用信号来杀死它们。终,如果父进程调用等待系统调用,僵尸进程将消失,这被称为“收割”。如果父进程没有执行等待调用,init将收养僵尸进程并自动执行等待并移除僵尸进程。僵尸进程太多可能是一件坏事,因为它们会占用进程表上的空间,如果它被填满,就会阻止其他进程运行。

5. 信号

信号是对进程的通知,告诉它发生了什么事情。

为什么有信号?

它是软件中断,有很多用途:

  • 用户可以输入一个特殊的终端字符(Ctrl-C)或(Ctrl-Z)来终止、中断或挂起进程
  • 硬件问题发生时,内核想要通知进程
  • 软件问题发生时,内核想要通知进程
  • 进程通信的方式

信号处理

当一个信号由某个事件生成时,它被传递给一个进程,在传递之前它被认为处于挂起状态。当进程运行时,信号将被传递。但是,进程具有信号掩码,如果指定的话,它们可以将信号传递设置为阻塞。当一个信号被传递时,进程可以做很多事情:

  • 忽略信号
  • “捕获”信号并执行特定的处理程序例程
  • 进程可以终止,而不是正常的退出系统调用
  • 阻塞信号,取决于信号掩码

常见的信号

每个信号都由具有符号名的整数定义,符号名的形式为SIGxxx。一些常见的信号是:

  • SIGHUP或HUP或1:挂机
  • SIGINT或INT或2:中断
  • SIGKILL或KILL或9:杀死
  • SIGSEGV或SEGV或11:分割错误
  • SIGTERM或TERM或15:软件终止
  • SIGSTOP或STOP:停止
    数字会随着信号的变化而变化,所以通常用它们的名字来表示。

有些信号是不可阻挡的,例如SIGKILL信号。KILL信号杀死进程。

6. kill命令

可以发送终止进程的信号,这样的命令被命名为kill命令。

kill 12345

12345是要终止的进程的PID。默认情况下,它发送一个TERM信号。SIGTERM信号被发送到进程,进程释放其资源并保存其状态来请求终止进程。

还可以使用kill命令指定一个信号:

kill -9 12345

这将运行SIGKILL信号并终止进程。

SIGHUP, SIGINT, SIGTERM, SIGKILL, SIGSTOP信号

这些信号看起来都相似,但它们确实有不同之处。

  • SIGHUP 挂起,当控制终端关闭时发送给进程。例如,如果关闭了一个终端窗口,其中正在运行一个进程,那么将得到一个SIGHUP信号。
  • SIGINT 是一个中断信号,因此可以使用Ctrl-C,系统将尝试优雅地终止进程
  • SIGTERM 终止进程,但允许它先做一些清理工作
  • SIGKILL 杀死进程,不做任何清理
  • SIGSTOP 停止/挂起进程

7. 进程优先级

当你在电脑上同时运行多个程序时,比如Chrome、Microsoft Word或Photoshop,看起来这些进程是同时运行的,但事实并非如此。

进程使用CPU的时间,称为时间片。然后它们暂停几毫秒,另一个进程得到一点时间切片。默认情况下,进程调度以这种循环方式进行。每个进程都有足够的时间片,直到它完成处理。内核处理所有这些进程的切换,并且大多数时候它都做得很好。

进程无法决定何时以及多长时间获得CPU时间,如果所有进程正常运行,它们将大致获得相同数量的CPU时间。但是,有一种方法可以用一个不错的值来影响内核的进程调度算法。优先级它的意思是进程有一个数字来确定它们对CPU的优先级。数值高意味着进程很好,对CPU的优先级较低,数值低或为负数意味着进程不是很好,它想要尽可能多地获得CPU。

要更改进程优先级别,可以使用nicerenice命令:

nice -n 5 apt upgrade
renice 10 -p 3245

nice命令用于设置新进程的优先级。renice命令用于设置已存在进程的优先级。

8. 进程状态

我们再来看一下:ps aux命令

在STAT列中,看到许多值。linux进程可以处于许多不同的状态。你将看到的常见的如下所示:


  • R: running或runnable,它只是在等待CPU处理它
  • S:可中断休眠,等待一个事件完成,例如来自终端的输入
  • D:不间断睡眠,不能被信号杀死或中断的进程,通常要让它们消失,你必须重新启动或修复问题
  • Z:僵尸进程,僵尸是正在等待收集其状态的终止进程
  • T: Stopped,已挂起/停止的进程

9. /proc文件系统

在Linux中一切皆文件,包括进程。进程信息存储在一个称为/proc文件系统的特殊文件系统中。


这里看到多个值,每个PID都有子目录。如果查看ps输出中的PID,则可以在/proc目录中找到它。

进入其中一个进程并查看该文件:


你能看到进程状态信息以及更详细的信息。/proc目录是内核查看系统的方式,因此这里有比ps中更多的信息。

10. Job控制

假设你正在一个终端窗口上工作,并且正在运行一个命令,该命令将花费很长时间。在它完成之前,你不能与shell交互,但是我们希望继续在我们的机器上工作,因此我们需要打开shell。我们可以控制我们的进程如何运行:

将工作发送到后台

在命令后添加&号将在后台运行该命令:

sleep 1000 &
sleep 1001 &
sleep 1002 &

查看后台进程


将进程从后台移动到前台

要将进程移出后台,只需指定所需的进程ID。如果不带任何选项地运行fg,它将带回近的后台进程。



相关文章