0.引言
hello.c(源程序)是一条高级C语言程序,虽然它是以一种易读的形式,让人们容易理解。但是,它却无法直接驱动硬件CPU直接执行。为了我们编写的hello.c程序可以被执行,驱动硬件电路工作,hello.c程序必须经过一些列处理步骤,将源程序转化为可执行性的目标程序。
而我们知道,机器语言就是处理器可以直接理解(与生俱来就能理解)的编程语言,机器语言有时也被叫做原生代码(Native Code)[1],而机器语言是一种以“0、1、0、1”的表现形式二进制代码,因此源程序的编译过程任务即就是:将以高级语言编写的程序转换为以二进制代码的可执行性目标程序。
1.编译过程的四个阶段
源程序到目标程序执行的四个阶段如图1所示,GCC编译C源代码有四个步骤:预处理—->编译—->汇编—->链接。
以源程序hello.c为例
#include <stdio.h>
int main()
{
printf("happy new year!\n");
return 0;
}
2.预处理阶段(.c—.i)
编译器将C程序的头文件编译进来,还有宏的替换,可以用gcc的参数-E来参看。
命令:unix>gcc –o hello hello.c
作用:将hello.c预处理输出hello.i
3 编译(.i—.s)转换为汇编语言文件
这个阶段编译器主要做词法分析、语法分析、语义分析等,在检查无错误后后,把代码翻译成汇编语言[2]。可用gcc的参数-S来参看。
编译器(ccl)将文本文件hello.i 翻译成文本文件hello.s, 它包含一个汇编语言程序。
一条低级机器语言指令。
命令:gcc -S hello.i -o hello.s
作用:将预处理输出文件hello.i汇编成hello.s文件
4.汇编阶段(.s—.o)得到机器语言
汇编器as 将hello.s 翻译成机器语言保存在hello.o 中(二进制文本形式)。
5.链接阶段
printf函数存在于一个名为printf.o的单独预编译目标文件中。必须得将其并入到hello.o的程序中,链接器就是负责处理这两个的并入,结果得到hello文件,它就是一个可执行的目标文件。