GCC 指令详解及动态库、静态库的使用方法

2022-11-13 19:11:08 静态 指令 使用方法

一、GCC

1.1 GCC 介绍

GCC 是 linux 下的编译工具集,是「GNU Compiler Collection」的缩写,包含 gcc、g++ 等编译器。这个工具集不仅包含编译器,还包含其他工具集,例如 ar、nm 等。

GCC 工具集不仅能编译 C/C++ 语言,其他例如 Objective-C、Pascal、Fortran、Java、Ada 等语言均能进行编译。GCC 还可以根据不同的硬件平台进行编译,即能进行交叉编译,在 A 平台上编译 B 平台的程序,支持常见的 X86、ARM、Powerpc、mips 等,以及 Linux、windows 等软件平台。

1.2 安装 GCC

首先,查看 gcc 是否安装:

# 查看 gcc 版本
$ gcc -v
$ gcc --version

# 查看 g++ 版本
$ g++ -v
$ g++ --version

如果在输入指令后可以获取到 gcc 版本,那么就表明你的 Linux 中已经安装了 gcc:

如果没有安装,则可按照如下方法安装 gcc:

# Centos
$ sudo yum update   		# 更新本地的软件下载列表, 得到最新的下载地址
$ sudo yum install gcc g++	# 通过下载列表中提供的地址下载安装包, 并安装

1.3 GCC 工作流程

1.3.1 一般使用流程

首先准备一个 C 语言代码,并命名为 test.c:

#include <stdio.h>
#define MAX 3
int main()
{
    int i;
    for (i = 1; i <= MAX; i++) 
    {
        printf("Hello World\n"); // 输出 Hello World
    }

    return 0;
}

一般情况下,我们可以直接通过 $ gcc test.c -o test编译 test.c,并通过$ ./test指令运行生成的可执行文件:

-o:output,是 gcc 编译器的可选参数,用于指定输出文件名及路径,默认输出到当前路径下。下图展示了如何通过 -o 参数修改输出路径:

或者不使用 -o 参数,则生成一个默认名称的可执行文件 a.out:

实际上,GCC 编译器在对程序进行编译的时候,分为了四个步骤:

  • 预处理(Pre-Processing):

    • 在这个阶段主要做了三件事:展开头文件 、宏替换 、去掉注释行
    • 结果得到的还是一个 C 程序,通常是以 .i 作为文件扩展名
  • 编译(Compiling) :

    • 在这个阶段中,gcc 首先要检查代码的规范性、是否有语法错误等,以确定代码实际要做的工作
    • 在检查无误后,gcc 把代码编译成汇编代码,得到一个以 .s 作为文件拓展名的汇编文件。

汇编(Assembling):

+ 汇编阶段是把编译阶段生成的 .s 文件转化成目标文件
+ 最终得到一个以 .o 结尾的二进制文件
  • 链接(Linking):这个阶段需要 GCC 调用链接器对程序需要调用的进行链接,最终得到一个可执行的二进制文件

而 GCC 的编译器可以将这 4 个步骤合并成一个,这也就是为什么我们使用$ gcc test.c -o test就可以直接生成可执行文件 test 的原因。下面我们对这 4 个步骤做个详细的介绍。

1.3.2 详细的工作流程

1.3.2.1 预处理
# 通过添加参数 -E 生成预处理后的 C 文件 test.i
# 必须通过 -o 参数指定输出的文件名
$ gcc -E test.c -o test.i

让我们来观察一下 test.i 中的代码内容(太长了,只观察 main 函数中的替换情况):

int main()
{
    int i;
    for (i = 1; i <= 3; i++)
    {
        printf("Hello World\n");
    }

    return 0;
}

通过分析 test.i 可以发现:

  • 宏定义 MAX 被替换为了相应的值 3
  • 注释「// 输出 Hello World」也被去掉了
1.3.2.2 编译
# 通过添加参数 -S 将 test.i 转换为汇编文件 test.s(默认生成 .s 文件)
$ gcc -S test.i
$ gcc -S test.i -o test.s # 写法二
1.3.2.3 汇编
# 通过汇编得到二进制文件 test.o(默认生成 .o 文件,object)
$ gcc -c test.s
$ gcc -c test.s -o test.o # 写法二
1.3.2.4 链接
# 通过链接得到可执行文件 test
$ gcc test.o -o test

在成功生成 test.o 文件后,就进入了链接阶段。在这里涉及到一个重要的概念:函数库。

在 test.c 的代码中,我们通过print()函数打印 Hello World 语句;但是在这段程序中并没有定义 printf 的函数实现,且在预编译中包含进去的「stdio.h」中也只有该函数的声明extern int printf (const char *__restrict __fORMat, ...);,而没有定义函数的实现,那么是在哪里实现的呢?

答案就是:系统把这些函数实现都做到了名为 libc.so.6 的库文件中去了,在没有特别指定时,gcc 会到系统默认的搜索路径 /usr/lib64 下进行查找,也就是链接到 libc.so.6 库函数中去,这样就有函数 printf 的实现了,而这也就是链接的作用。

而函数库一般分为静态库和动态库两种:

  • 静态库是指在编译链接时,把库文件的代码全部加入到可执行文件中,因此生成的文件比较大,但在运行时也就不需要库文件了。在 Linux 中静态库一般以 .a 作为后缀。
  • 动态库与之相反,在编译链接时并没有把库文件的代码加入到可执行文件中,而是在程序执行时链接文件加载库,这样就可以节省系统的开销。在 Linux 中动态库一般以 .so 作为后缀。

如前面所述的 libc.so.6 就是动态库,gcc 在编译时默认使用动态库。完成了链接之后,gcc 就可以生成可执行文件了。

有关动态库和静态库的详细介绍,将在下文进行具体讲解。

1.3.2.5 总结

最后,通过一张图来总结一下上述流程:

在 Linux 下使用 GCC 编译器编译单个文件十分简单,直接使用$ gcc test.c(test.c 为要编译的 C 语言的源文件),GCC 会自动生成文件名为 a.out 的可执行文件(也可以通过参数 -o 指定生成的文件名);也就是通过一个简单的命令就可以将上边提到的 4 个步骤全部执行完毕了;但是如果想要单步执行也是没问题的。

1.4 GCC 常用参数

下面的表格中列出了一些常用的 gcc 参数,这些参数在 gcc 命令中没有位置要求,只需要编译程序的时候将需要的参数指定出来即可。

gcc 编译选项解释说明
-E预处理,主要是进行宏展开等步骤,生成 test.i
-S编译指定的源文件,但是不进行汇编,生成 test.s
-c编译、汇编源文件,但是不进行链接,生成 test.o
-o指定链接的文件名及路径
-g在编译的时候,生成调试信息,该程序可以被调试器调试
-D在程序编译的时候,指定一个宏
-std指定 C 方言,如 -std=c99。gcc 默认的方言是 GNU C
-l在程序编译的时候,指定使用的库(库的名字一定要掐头去尾,如 libtest.so 变为 test)
-L在程序编译的时候,指定使用的库的路径
-fpic生成与位置无关的代码
-shared生成共享目标文件,通常用在建立动态库时

1.4.1 指定一个宏(-D)

在程序中我们可以通过使用#define定义一个宏,也可以通过宏控制某段代码是否能够被执行。

#include <stdio.h>

int main()
{
    int num = 60;
    printf("num = %d\n", num);
#ifdef DEBUG
    printf("定义了 DEBUG 宏, num++\n");
    num++;
#else
    printf("未定义 DEBUG 宏, num--\n");
    num--;
#endif

    printf("num = %d\n", num);

    return 0;
}

由于我们在程序中并没有定义 DEBUG 宏,所以第 8~9 行的代码就不会被执行:

那么如何才能够在程序中不定义 DEBUG 宏的情况下执行第 8~9 行的代码呢?答案是通过 -D 参数:

需要注意的是,-D 参数必须在生成 test.o 前使用(链接前)。如下所示,是无效的:

说了这么多,-D 参数有什么用呢?下面我们简单叙述一下 -D 参数的应用场景。

1.4.1.1 应用场景一

在发布程序的时候,一般都会要求将程序中所有的 log 输出去掉,如果不去掉会影响程序的执行效率,很显然删除这些打印 log 的源代码是一件很麻烦的事情,解决方案是这样的:

  • 将所有的打印 log 的代码都写到一个宏判定中,可以模仿上边的例子;
  • 在调试程序的时候指定 -D,就会有 log 输出;
  • 在发布程序的时候不指定 -D,log 就不会输出;
1.4.1.2 应用场景二

或者,你编写的一个软件,某个付费功能只对已付费的用户 A 开放,但不对白嫖的用户 B 开放,其中一种解决方法是:

  • 每个用户对应一个维护分支,用户 A 对应 project_1 分支包含付费功能的代码,用户 B 对应的 project_2 分支不包含付费功能的代码。
  • 当用户 B 付费订阅时,再将付费项目的代码拷贝到 project_2 中

如果再来一个用户 C 呢?有没有感觉很麻烦的样子?那么我们完全可以这样做:

#include <stdio.h>

int main()
{
#ifdef CHARGE
    //付费用户执行流程
    printf("该用户已付费,执行付费功\n");
#else
    //白嫖用户执行流程
    printf("白嫖用户,拒绝执行付费功能\n");
#endif

    printf("公共功能\n");

    return 0;
}

在编译付费用户的时候,添加 -D CHARGE 参数;编译白嫖用户,则不添加。这样的话,不管来多少用户,都只需要维护一个分支即可。

1.4.2 指定 C 方言(-std)

对于如下 C 语言代码:

#include <stdio.h>

int main()
{
    for (int i = 1; i <= 3; i++)
    {
        printf("i = %d\n", i);
    }

    return 0;
}

在编译时是会报错的:

但如果我们加上 -std=c99,就可以了:

二、静态库和动态库

2.1 扫盲

库是「已经写好的、供使用的」可复用代码,每个程序都要依赖很多基础的底层库。

从本质上,库是一种可执行代码的二进制形式,可以被操作系统载入内存执行。程序中调用的库有两种「静态库和动态库」,所谓的「静态、动态」指的是链接的过程。

2.2 静态库

2.2.1 静态库简介

在 Linux 中静态库以 lib 作为前缀、以 .a 作为后缀,形如 libxxx.a(其中的 xxx 是库的名字,自己指定即可)。静态库以之所以称之为「静态库」,是因为在链接阶段,会将汇编生成的目标文件 .o 与引用的库一起链接到可执行文件中,对应的链接方式称为静态链接。

2.2.2 静态库的生成

在 Linux 中静态库由程序 ar 生成。生成静态库,需要先对源文件进行汇编操作得到二进制格式的目标文件(以 .o 结尾的文件),然后再通过 ar 工具将目标文件打包就可以得到静态库文件了。

使用 ar 工具创建静态库的一般格式为$ ar -rcs libxxx.a 若干原材料(.o文件)

2.2.3 静态库的制作举例

在某目录中有如下源文件,用来实现一个简单的计算器。

add.c

#include <stdio.h>

int add(int a, int b)
{
    return a + b;
}

sub.c

#include <stdio.h>

int subtract(int a, int b)
{
    return a - b;
}

mult.c

#include <stdio.h>

int multiply(int a, int b)
{
    return a * b;
}

具体操作步骤如下:

# 第一步:将源文件 add.c、sub.c、mult.c 进行汇编,得到二进制目标文件 add.o、sub.o、mult.o
$ gcc -c add.c sub.c mult.c

# 第二步:将生成的目标文件通过 ar 工具打包生成静态库
$ ar rcs libcalc.a add.o sub.o mult.o

2.2.4 静态库的使用

定义 main 函数如下所示:

main.c

#include <stdio.h>

int main()
{
    int a = 20;
    int b = 12;

    printf("a = %d, b = %d\n", a, b);
    printf("a + b = %d\n", add(a, b));
    printf("a - b = %d\n", subtract(a, b));
    printf("a * b = %d\n", multiply(a, b));

    return 0;
}

并将静态库 libcalc.a 置于同级目录下:

通过指令$ gcc main.c -o main -L ./ -l calc编译 main.c 文件,并链接静态库 libcalc.a:

  • -L:指定使用的库的路径(因为在同一级目录下,所以可以直接用了./,或者使用绝对路径也是可以的)
  • -l:指定使用的库(库的名字一定要掐头去尾。如:libcalc.a 变为 calc)

编译结果会提示三个 warning,这是由于没有定义这些函数导致的,先暂时不用管。

运行 main 结果如下:

我们思考这么一个问题:由于静态库是我们自己制作的,其所包含的函数我们很清楚,直接链接并使用即可。但如果别人想要使用呢?他们可不清楚静态库中的函数该如何调用,所以我们有必要提供一个头文件,这样将静态库及头文件交给其他人时,他们知道该如何用了。

head.h

#ifndef _HEAD_H_
#define _HEAD_H_

int add(int a, int b);

int subtract(int a, int b);

int multiply(int a, int b);

#endif

还记得之前的报错吗?现在有了头文件就要使用起来。

main.c

#include <stdio.h>
#include "head.h"

int main()
{
    int a = 20;
    int b = 12;

    printf("a = %d, b = %d\n", a, b);
    printf("a + b = %d\n", add(a, b));
    printf("a - b = %d\n", subtract(a, b));
    printf("a * b = %d\n", multiply(a, b));

    return 0;
}

编译、链接、运行,一气呵成:

2.2.5 ar 命令参数介绍

制作静态库时所使用的指令$ ar rcs libcalc.a add.o sub.o mult.o div.o共有三个参数:

  • -c:创建一个库,不管库是否存在,都将创建。这个很好理解,就不做过多的解释了。

  • -r:在库中插入(替换)模块 。默认新的成员添加在库的结尾处,如果模块名已经在库中存在,则替换同名的模块。

  • -s:创建目标文件索引,这在创建较大的库时能加快时间。

参数 -r 的详细解释

假设现在有了新的需求,需要静态库 libcalc.a 提供除法运算的功能模块,该怎么操作呢?

首先我们需要新建一个除法运算的源文件 div.c:

#include <stdio.h>

double divide(int a, int b)
{
    return (double)a / b;
}

并通过汇编操作生成目标文件 div.o。

接下来我们可以通过 -r 参数将除法运算的模块添加到静态库中:$ ar -r libcalc.a div.o

并且要在 head.h 中增加对除法运算的声明:

#ifndef _HEAD_H_
#define _HEAD_H_

// Other

double divide(int a, int b);

#endif

参数 -s 的详细解释

在获取一个静态库的时候,我们可以通过$ nm -s libcalc.a来显示库文件中的索引表:

而索引的生成就要归功于 -s 参数了。

如果不需要创建索引,可改成 -S 参数。

如果 libcalc.a 缺少索引,可以使用$ ranlib libcalc.a 指令添加。

2.2.6 其他命令介绍

# 显示库文件中有哪些目标文件,只显示名称
$ ar t libcalc.a

# 显示库文件中有哪些目标文件,显示文件名、时间、大小等详细信息
$ ar tv libcalc.a

# 显示库文件中的索引表
$ nm -s libcalc.a

# 为库文件创建索引表
$ ranlib libcalc.a

2.3 动态库

2.3.1 动态库简介

在 Linux 中动态库以 lib 作为前缀、以 .so 作为后缀,形如 libxxx.so(其中的 xxx 是库的名字,自己指定即可)。相比于静态库,使用动态库的程序,在程序编译时并不会链接到目标代码中,而是在运行时才被载入。不同的应用程序如果调用相同的库,那么在内存中只需要有一份该共享库的实例,避免了空间浪费问题。同时也解决了静态库对程序的更新的依赖,用户只需更新动态库即可。

2.3.2 动态库的生成

生成动态库是直接使用 gcc 命令,并且需要添加 -fpic 以及 -shared 参数:

  • -fpic 参数的作用是使得 gcc 生成的代码是与位置无关的,也就是使用相对位置。
  • -shared 参数的作用是告诉编译器生成一个动态链接库。

2.3.3 动态库的制作举例

还是以上述程序 add.c、sub.c、mult.c 为例:

# 第一步:将源文件 add.c、sub.c、mult.c 进行汇编,得到二进制目标文件 add.o、sub.o、mult.o
$ gcc -c -fpic add.c sub.c mult.c

# 第二步:将得到的 .o 文件打包成动态库
$ gcc -shared add.o sub.o mult.o -o libcalc.so

# 第三步:发布动态库和头文件
1. 提供头文件 head.h
2. 提供动态库 libcalc.so

至于为什么需要提供头文件,在讲解静态库时已经做了说明,此处不再赘述。

2.3.4 动态库的使用

head.h

#ifndef _HEAD_H_
#define _HEAD_H_

int add(int a, int b);

int subtract(int a, int b);

int multiply(int a, int b);

#endif

main.c

#include <stdio.h>
#include "head.h"

int main()
{
    int a = 20;
    int b = 12;

    printf("a = %d, b = %d\n", a, b);
    printf("a + b = %d\n", add(a, b));
    printf("a - b = %d\n", subtract(a, b));
    printf("a * b = %d\n", multiply(a, b));

    return 0;
}

和静态库的链接方式一样,都是通过指令$ gcc main.c -o main -L ./ -l calc来进行链接库操作。

gcc 通过指定的动态库信息生成了可执行程序 main,但是可执行程序运行却提示无法加载到动态库:

./main: error while loading shared libraries: libcalc.so: cannot open shared object file: No such file or directory

这是怎么回事呢?

2.3.5 解决动态库加载失败的问题

首先来看一下不同库的工作原理:

  • 静态库如何被加载:
    • 在程序编译的最后一个阶段也就是链接阶段,提供的静态库会被打包到可执行程序中。
    • 当可执行程序被执行,静态库中的代码也会一并被加载到内存中,因此不会出现静态库找不到无法被加载的问题。
  • 动态库如何被加载:
    • 在程序编译的最后一个阶段也就是链接阶段,在 gcc 命令中虽然指定了库路径,但是这个路径并没有被记录到可执行程序中,只是检查了这个路径下的库文件是否存在。同样对应的动态库文件也没有被打包到可执行程序中,只是在可执行程序中记录了库的名字。
    • 当可执行程序被执行起来之后:
      • 程序会先检测所需的动态库是否可以被加载,加载不到就会提示上边的错误信息。
      • 当动态库中的函数在程序中被调用了,这个时候动态库才加载到内存,如果不被调用就不加载。

动态库的检测和内存加载操作都是由动态链接器来完成的

动态链接器是一个独立于应用程序的进程,属于操作系统。当用户的程序需要加载动态库的时候动态连接器就开始工作了,很显然动态连接器根本就不知道用户通过 gcc 编译程序的时候通过参数 -L 指定的路径。

那么动态链接器是如何搜索某一个动态库的呢,在它内部有一个默认的搜索顺序,按照优先级从高到低的顺序分别是:

  • 可执行文件内部的 DT_RPATH 段。

  • 系统的环境变量 LD_LIBRARY_PATH。

  • 系统动态库的缓存文件 /etc/ld.so.cache。

  • 存储「静态库 / 动态库」的系统目录 /lib、/usr/lib 等。

按照以上四个顺序,依次搜索,找到之后结束遍历。若检索到最终还是没找到,那么动态连接器就会提示动态库找不到的错误信息。一般情况下,我们都是通过修改系统的环境变量的方式设置动态库的地址。

将动态库路径追加到环境变量 LD_LIBRARY_PATH 中:$ LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:动态库的绝对路径

比如,我所需要的动态库的绝对路径为 /mnt/hgfs/SharedFolders/DynamicLibrary,那么:

$ LD_LIBRARY_PATH=${LD_LIBRARY_PATH}:/mnt/hgfs/SharedFolders/DynamicLibrary

这样的话,我在运行 main,就不会报错了。

但是通过这种方式设置的环境变量尽在当前的终端中有效,那么怎样才能让这个设置永久生效呢?

通过指令$ vim ~/.bashrc打开并修改该文件:

修改后,使用$ source ~/.bashrc使修改立即生效。

经过上述操作,就不用每次开启终端都需要修改环境变量了。当然这种永久生效的方式仅适用于动态库路径唯一的情况,如果你每次使用的动态库都在不同的位置,那么这么设置也没啥用?

2.4 动态库与静态库的比较

2.4.1 静态库的特点

  • 静态库对函数库的链接是在编译期完成的。
  • 静态库在程序编译时会链接到目标代码中,因此使可执行文件变大。
  • 当链接好静态库后,在程序运行时就不需要静态库了。
  • 对程序的更新、部署与发布不方便,需要全量更新。
  • 如果某一个静态库更新了,所有使用它的应用程序都需要重新编译、发布给用户。

2.4.2 动态库的特点

  • 动态库把对一些库函数的链接载入推迟到程序运行时期。
  • 可以实现进程之间的资源共享,因此动态库也称为共享库。
  • 将一些程序升级变得简单,不需要重新编译,属于增量更新。

2.5 使用库的目的

在项目中使用库一般有两个目的:

  • 为了使程序更加简洁不需要在项目中维护太多的源文件。
  • 另一方面是为了源代码保密,毕竟不是所有人都想把自己编写的程序开源出来。

当我们拿到了库文件(动态库、静态库)之后要想使用还必须有这些库中提供的 api 函数的声明,也就是头文件,把这些都添加到项目中,就可以快乐的写代码了。

参考资料

  • GCC | 爱编程的大丙 (subingwen.cn)
  • GCC编译的四个阶段
  • Linux 静态库和动态库 | 爱编程的大丙 (subingwen.cn)
  • linux命令之ar—创建静态库.a文件
  • 静态库和动态库 - 简书 (jianshu.com)
  • linux中 ldd命令简介
  • collect2: error: ld returned 1 exit status(解决方案大总结)

到此这篇关于GCC 指令详解及动态库、静态库的使用方法的文章就介绍到这了,更多相关GCC 指令使用动态库、静态库内容请搜索以前的文章或继续浏览下面的相关文章希望大家以后多多支持!

相关文章