1.前言
当我们写下C语言代码(源文件、以.c为后缀)的时候,他需要经过一个翻译环境,被处理后形成一个可执行程序(以.exe为后缀)。形成的这个可执行程序里面放的都是二进制信息,它可以被机器读懂
(全文都在Windows环境下)
2.什么是翻译环境
翻译环境(Translation Environment)是指用于将源代码翻译为目标代码的一系列工具和软件组成的环境。它其实是由编译和链接两个大的过程组成的,而编译又可以分为:预处理、编译、汇编三个过程。
2.1编译
源文件经过编译器编译后,形成一个目标文件(以.obg为后缀)
2.1.1预处理
预处理器是执行预处理的工具,它根据预处理指令(以#开头)对源代码进行处理。
预处理的主要作用有:
-
文件包含:使用预处理指令
#include
可以将一个文件的内容插入到另一个文件中。这是C语言中模块化编程的一种方式,可以将功能相关的代码组织在不同的文件中,并通过包含文件来使用这些代码。 -
宏替换:使用
#define
指令可以定义宏,预处理器会在编译之前扫描源代码,将代码中出现的宏名称替换为对应的宏定义。宏替换可以简化代码,提高代码的可读性和维护性。 -
条件编译:使用
#if
、#ifdef
、#ifndef
等条件指令可以根据条件编译不同的代码。通过条件编译,我们可以根据不同的平台、编译选项或宏定义来选择性地编译不同的代码块。 -
注释删除:预处理器会将源代码中的注释删除,这样在编译阶段就不会再考虑这些注释了。
预处理是在编译之前进行的,它处理的是纯文本的源代码,生成的是经过预处理后的代码。预处理阶段的结果会成为编译器的输入,在编译器对处理后的代码进行词法分析、语法分析和语义分析等操作后,生成最终的目标代码。
2.1.2编译
在预处理阶段之后,编译器会对经过预处理的源代码进行词法分析、语法分析、语义分析等处理,然后生成目标代码。
- 词法分析:将源代码分解成一个个的标记,如关键字、标识 符、运算符等。词法分析器会扫描源代码并生成标记序列供后续的语法分析使用。
- 语法分析:根据所使用的语法规则,将标记序列生成语法树。语法分析器会遵循语法规则检查源代码的语法是否正确,并生成语法树用于语义分析。
- 语义分析:对语法树进行静态语义检查,包括类型检查、作用域分析等。语义分析器会检查标识符的使用是否正确,进行类型推导和类型转换等操作。
2.1.3汇编
汇编器的主要任务是将汇编语言代码转换为机器指令。就是根据汇编指令和机器指令的对照表一一的进行翻译,也不做指令优化。
2.2链接
链接是将多个目标代码文件或库文件合并成一个可执行文件的过程。
链接的主要任务是将所有的目标代码文件合并,并解决函数和变量的引用关系。
-
符号解析:在目标代码中,各个函数和变量使用符号来表示。链接器会遍历所有目标代码文件,通过符号表来解析函数和变量的引用关系。
-
地址重定位:在链接过程中,各个目标代码文件的地址空间是相互独立的,需要进行地址的重定位。链接器会根据每个目标代码文件在内存中的位置,调整代码中的地址引用,使其正确指向目标地址。
-
文件合并:链接器会将所有目标代码文件中的可执行代码和数据段合并成一个整体。这涉及到对各个目标代码文件的段进行合并和对齐操作。
-
符号解析与重定义:在链接过程中,可能会遇到多个目标代码文件中定义了相同的函数或变量。链接器会解析这些符号,并根据一定的规则进行重定义,以确保每个符号只有一个定义。
-
库文件链接:除了链接目标代码文件外,链接器还可以将库文件链接到可执行文件中。库文件中包含了一组已编译好的函数和变量的实现,通过链接库文件可以避免重复编写相同的代码。
3.运行环境
- 程序必须载入内存中,在有操作系统的环境中:一般由这个操作系统完成,在独立的环境中,程序的载入必须由手工安排,也可能是通过可执行代码置入只读内存来完成
- 程序的执行便开始,接着便调用main函数
- 开始执行程序代码,这个时候程序将使用一个运行时堆栈,存储函数的局部变量和返回地址。程序同时也可以使用静态内存,存储于静态内存中的变量在程序的整个执行过程中一直保留他们的值
- 终止程序,正常终止main函数;也有可能是意外终止。