CPU使用率到了,先别慌!

2021-08-13 00:00:00 服务器 逻辑 物理 进程 可以看到

背景 

以下文章来源于涛歌依旧  

近,一位同事急匆匆跑过来跟我说:糟糕了,服务器CPU的使用率达了。

我心想不可能啊,CPU有那么多核,怎会跑满?于是看了一眼,结果虚惊一场。

这位同事看到的,并非指整个CPU使用率到了,而是指CPU某些核的使用率到了.

趁此机会,我来聊聊与CPU相关的概念,对很多软件开发和运维人员来说,这些概念是必须要掌握的:

  • CPU主频

  • 多个CPU

  • 多核CPU

  • 逻辑核(超线程)

  • 大小端


以一款CPU为例,看下具体参数:

      

CPU主频(时钟频率) 

在上面这些参数中,人们熟知的是CPU主频(时钟频率)。买电脑时,肯定需要看CPU主频是多少。

我们知道CPU时钟越快,产生上升沿/下降沿的速度就越快,就能更快地迫使其它器件做相应工作。

CPU的时钟,就像龙舟比赛的击鼓人,击鼓频率越快,就迫使划船的人跟上节奏,结果龙舟也越快。

从CPU参数可以看到,该CPU有12个物理核,每个物理核对应2个逻辑核(超线程技术)。所以,从外部看,该CPU有24个核(逻辑核)。

也就是说,该CPU有12个物理上的运算器&控制器,有24个逻辑上的运算器&控制器。


多个CPU

我们看linux命令lscpu给出的信息:


Socket(s): 2


可以看到,在这台服务器上,总共插了2个CPU,  这2个CPU是物理上的CPU, 人眼可以看到,手也可以触摸到:


多核CPU


我们看linux命令lscpu给出的信息:
Core(s) per socket: 12
可以看到,针对每一个物理CPU而言,内部有12个物理核。也就是说,在一个物理CPU内,有12个物理层面的运算器&控制器,它们是实实在在存在的。
很霸气的感觉,12个物理核如下图所示:


逻辑核(超线程)


我们看linux命令lscpu给出的信息:
Thread(s) per core:    2
由于Intel采用了超线程技术,所以每个物理核对应2个逻辑核:

要注意,在物理上看来,只有一个核,但采用了超线程技术,在使用时,实际效果是2个核在同时并行(不是同步并发)工作,也即有2个逻辑核,如下图所示:

那么,在上面这台服务器中,有多少个逻辑核呢?
服务器中插有2个物理CPU, 每个物理CPU有12个物理核,每个物理核有2个逻辑核,故总共48个逻辑核。
因此,当操作系统俯视CPU硬件时,它看到的是,在计算机中,有48个核,即有48个运算器&控制器。

对于操作系统而言,它可以认为有48个CPU核在同时并行(不是同步并发)为它提供服务,lscpu查出的信息如下:
CPU(s):                48
这里的48个CPU(s), 其实就是48个逻辑核。有时,我们也可以说,这台服务器有48个核。
这台服务器有2个CPU, 针对其中一个CPU,我们也可以说,它是"12核24线程"。


操作系统对核的分配 


需要注意的是,如上的服务器有2个CPU,  每个CPU有12物理核,每个物理核有2个逻辑核,这仅仅是针对特定服务器和CPU的。
其他计算机或者CPU, 就不一定如此了。来看我的另外一台服务器,配置略微寒酸:总共只有1个CPU, 1个物理核,1个逻辑核:
ubuntu@VM--15-ubuntu:~$ lscpuArchitecture:          x86_64CPU op-mode(s):        32-bit, 64-bitByte Order:            Little EndianCPU(s):                1On-line CPU(s) list:   Thread(s) per core:    1Core(s) per socket:    1Socket(s):             1NUMA node(s):          1Vendor ID:             GenuineIntelCPU family:            6Model:                 79Model name:            Intel(R) Xeon(R) CPU E5-26xx v4Stepping:              1CPU MHz:               2394.446BogoMIPS:              4788.89Hypervisor vendor:     KVMVirtualization type:   fullL1d cache:             32KL1i cache:             32KL2 cache:              4096KNUMA node0 CPU(s):     Flags:                 fpu vme de pse tsc msr pae mce cx8 apic sep mtrr pge mca cmov pat pse36 clflush mmx fxsr sse sse2 ss ht syscall nx lm constant_tsc rep_good nopl eagerfpu pni pclmulqdq ssse3 fma cx16 pcid sse4_1 sse4_2 x2apic movbe popcnt tsc_deadline_timer aes xsave avx f16c rdrand hypervisor lahf_lm abm 3dnowprefetch bmi1 avx2 bmi2 rdseed adx xsaveoptubuntu@VM--15-ubuntu:~$

如果在这个单核服务器上,运行如下的死循环程序,会如何呢?
#include <stdio.h>int main(){  while(1);  // 死循环  return 0;}
观察top命令给出的结果,可以看到,1个进程就消耗了大约99.0%的CPU,整个CPU的使用率达到99.7%:
        
那么,如果开启2个进程并发执行呢?可以看到,每个进程几乎都是占用49.x%的CPU,整个CPU的使用率达到99.7%:

那么,如果开启3个进程并发执行呢?可以看到,每个进程几乎都是占用32.x%的CPU,整个CPU的使用率达到98.7%:

可以看到,整个CPU几乎被瓜分殆尽。这种调度和分配,是由操作系统完成的。

再来看多核CPU的情况,我找了另一台服务器,有32个逻辑核,简称32个核。运行一下死循环进程,用top命令来分析。
可以看到,1个进程占满1个核,使用率, 而服务器32个核的使用率是3.6%:

运行2个进程,可以看到,2个进程都占用99.7%的核,而服务器32个核的使用率是6.5%:

运行3个进程,可以看到,3个进程都占用的核,而服务器32个核的使用率是9.8%:

看到使用率为时,不要紧张,不要以为CPU就用完了,这台服务器有32个核呢(拥有3200%的能力)。
来看下3个进程时,每个核的具体使用情况(3个进程,总共大概占用300%的核):

这些值会动态地变化,而且不一定是消耗在某些固定的核上。核的调度和资源分配,由操作系统来完成:


CPU大小端


后,来看一个大小端的问题,看lscpu命令的信息:
Byte Order: Little Endian
它的含义是: CPU是小端模式。相信几乎所有的程序员都听说过这个概念,我们具体来测试一下。

下面是在Intel CPU + Windows + VC++6.0上的测试结果,可以看到:低位的0x78存储在地址较小的位置(端模式):

下面是对8051单片机进行的仿真测试,可以看到:高位的0x12存储在地址较小的位置(大端模式):
至此为止,我们对CPU的基本参数有了大致了解,这也是linux相关的开发、运维人员必须掌握的。
以后也可以谈笑风生地聊多个CPU、多核CPU、逻辑核和大小端了,而不是一如既往地一知半解。


相关文章