20. 预处理

20.1 预处理的步骤

现在我们全面了解一下C编译器做语法解析之前的预处理步骤。

把第2.2节提到过的三连符替换成相应的单字符。
把用\斜线续行的多行代码接成一行。

例如：
```
#define STR "hello, "\
		"world"
```
经过这个预处理步骤之后接成一行：
```
#define STR "hello, "		"world"
```
这种续行的写法要求\斜线后面紧跟换行（在第2.1节提过，Windows平台的文本文件用\r\n做换行符，而Linux平台的文本文件用\n做换行符，C编译器一般都能处理各种不同的换行符，所以本章不考虑这个细节问题。），中间不能有其他字符（有空格或Tab也不行）。
把每个注释（不管是单行注释还是多行注释）替换成一个空格。
经过以上两步之后去掉了一些换行，有的换行在续行过程中去掉了，有的换行在多行注释之中，也随着注释一起去掉了，剩下的代码行称为逻辑代码行。然后预处理器把每个逻辑代码行划分成Token和空白字符（在第2.6节讲过C语言规定的空白字符包括空格、\t、\v、\r、\n、\f），这时的Token称为预处理Token，包括标识符、关键字、整数常量、浮点数常量、字符常量、字符串字面值、运算符和其他标点符号，在划分Token时要遵循第6.3节讲过的最长匹配原则。

继续分析上面的例子，在处理完续行之后两个源代码行被接成一个逻辑代码行，然后这个逻辑代码行被划分成Token和空白字符：#，define，空格，STR，空格，"hello,␣"，Tab，Tab，"world"，换行。
在Token中识别出宏定义和预处理指示，如果遇到宏定义则做宏展开，遇到预处理指示则做相应的预处理动作。

如果遇到#include预处理指示，则把相应的源文件包含进来，并对该源文件做以上1～5步预处理。

我们早在第8.2节就引入了预处理指示这个概念，现在给出它的严格定义。

一条预处理指示由一个逻辑代码行组成，第一个预处理Token是#号，后面跟若干个预处理Token，在逻辑代码行的开头、结尾以及各预处理Token之间可以出现任意多个空格和Tab，但不允许出现其他空白字符（除预处理指示之外的其他逻辑代码行对空白字符没有此限制）。
找出字符常量或字符串字面值中的转义序列，用相应的字节来替换它，比如把\n替换成字节0x0a。
把相邻的字符串字面值连接起来。

继续上面的例子，如果代码中有：
```
printf(
	STR);
```
经过第4步预处理之后划分成以下Token：printf，(，换行，Tab，STR，)，;，换行。经过第5步宏展开后变成以下Token：printf，(，换行，Tab，"hello, "，Tab，Tab，"world"，)，;，换行。然后把相邻的字符串连接起来，变成以下Token：printf，(，换行，Tab，"hello, world"，)，;，换行。
经过以上处理之后，把空白字符丢掉，把Token交给C编译器做语法解析，这时就不再是预处理Token，而称为C Token了。

继续上面的例子，最后交给C编译器做语法解析的Token是：printf，(，"hello, world"，)，;。

注意，把一个预处理指示写成多行要用\斜线续行，因为根据定义，一条预处理指示只能由一个逻辑代码行组成，而把C代码写成多行则不必用\斜线续行，因为换行在C代码中只不过是一种空白字符，在做语法解析时所有空白字符都已经丢掉了。

20.2 宏定义

较大的项目都会用大量的宏定义来组织代码，你可以看看/usr/include下面的头文件中用了多少个宏定义。

看起来宏展开只是做个替换而已，其实里面有比较复杂的规则，C语言有很多复杂但不常用的语法规则本书并不深入讲解，但有关宏展开的语法规则很重要也很常用，本节将会做全面详细的解释。

函数式宏定义

变量式宏定义

以前我们用过的#define N 20或#define STR "hello, world"这种宏定义可以称为变量式宏定义（Object-like Macro），宏定义名可以像变量一样在代码中使用。
函数式宏定义

另外一种宏定义可以像函数调用一样在代码中使用，称为函数式宏定义（Function-like Macro）。

例如编辑一个文件main.c：
```
#define MAX(a, b) ((a)>(b)?(a):(b))
k = MAX(i&0x0f, j&0x0f)
```
我们想看第二行的表达式展开成什么样，可以用gcc的-E选项或cpp命令，尽管这个C程序不合语法，但没关系，我们只做预处理而不编译，不会检查程序是否符合C语法。
```
$ cpp main.c
# 1 "main1.c"
# 1 "<built-in>"
# 1 "<command-line>"
# 1 "main1.c"

k = ((i&0x0f)>(j&0x0f)?(i&0x0f):(j&0x0f))
```
就像函数调用一样，把两个实参表达式分别替换到宏定义中形参a和b的位置。
函数式宏定义和函数调用之间的区别

注意这种函数式宏定义和真正的函数调用之间的区别：
1. 函数式宏定义的参数没有类型，预处理器只负责做形式上的替换，而不做参数类型检查，所以传参时要格外小心。
2. 调用真正的函数和调用函数式宏定义的代码编译生成的指令不同。
  
  如果MAX是个真正的函数，那么它的函数体return a > b ? a : b;要编译生成指令，代码中出现的每次调用也要编译生成传参指令和call指令。
  
  而如果MAX是个函数式宏定义，这个宏定义本身倒不必编译生成指令，但是代码中出现的每次调用编译生成的指令都相当于一个函数体，而不是简单的几条传参指令和call指令。
  
  所以，使用函数式宏定义编译生成的目标文件会比较大。
3. 括号和优先级
  
  定义这种宏要格外小心，如果上面的定义写成#define MAX(a, b) (a>b?a:b)，省略内层括号，则宏展开就成了k = (i&0x0f>j&0x0f?i&0x0f:j&0x0f)，运算的优先级就错了。
  
  同样道理，这个宏定义的外层括号也不能省，想一想为什么。
4. 形参如果在宏定义中出现多次，实参表达式可能被重复求值，实参表达式中的 side effect 可能会发生多次。
  
  调用函数时先求实参表达式的值再传给形参，如果实参表达式有Side Effect，那么这些Side Effect只发生一次。
  
  例如MAX(++a, b)，如果MAX是个真正的函数，a只增加一次。
  
  但如果MAX是上面那样的宏定义，则要展开成k =((++a)>(b)?(++a):(b))，a可能增加一次也可能增加两次。
5. 即使实参表达式中没有 side effect，代码的执行效率也可能较低。
  
  上面的例子说明：如果形参在宏定义中出现多次，实参表达式可能被重复求值。
  
  这种宏定义要小心使用，即使实参表达式没有Side Effect，执行结果也未必理想，因为代码的执行效率可能较低。
  
  下面举一个极端的例子，也是个很有意思的例子。
```
#define MAX(a, b) ((a)>(b)?(a):(b))
int a[] = { 9, 3, 5, 2, 1, 0, 8, 7, 6, 4 };
int max(int n)
{
    return n == 0 ? a[0] : MAX(a[n], max(n-1));
}

int main(void)
{
    max(9);
    return 0;
}
```
  这段代码从一个数组中找出最大的数，如果MAX是个真正的函数，这个算法就是从前到后遍历一遍数组，时间复杂度是Θ(n)，而现在MAX是这样一个函数式宏定义，思考一下这个算法的时间复杂度是多少？
尽管函数式宏定义有缺点，但小心使用能提高代码效率

尽管函数式宏定义和真正的函数相比有很多缺点，但只要小心使用还是会显著提高代码的执行效率，毕竟省去了分配和释放栈帧、传参、传返回值等一系列工作。
什么函数适合用函数式宏定义来代替实现

一般来说简短的、被频繁调用的函数适合用函数式宏定义来代替实现。
函数式宏定义例子：do {...} while(0)

函数式宏定义经常写成这样的形式（取自内核代码include/linux/pm.h）：
```
#define device_init_wakeup(dev,val) \
        do { \
                device_can_wakeup(dev) = !!(val); \
                device_set_wakeup_enable(dev,val); \
        } while(0)
```
为什么要用do {...} while(0)括起来呢？

不括起来会有什么问题呢？假如这样定义和使用函数式宏定义：
```
#define device_init_wakeup(dev,val) \
                device_can_wakeup(dev) = !!(val); \
                device_set_wakeup_enable(dev,val);

if (n > 0)
        device_init_wakeup(d, v);
```
则宏展开之后函数体的第二条语句不在if条件中，结果是错的。

那么，如果简单地用{...}括起来组成一个语句块不行吗？看下面的代码：
```
#define device_init_wakeup(dev,val) \
                { device_can_wakeup(dev) = !!(val); \
                device_set_wakeup_enable(dev,val); }

if (n > 0)
        device_init_wakeup(d, v);
else
        continue;
```
问题出在device_init_wakeup(d, v);末尾的;号：如果不允许写这个;号，看起来不像个函数调用；可如果写了这个;号，宏展开之后就有语法错误。

展开之后的形式是if (...) {...}; else ...，其中{...}是一个由语句块组成的语句，而;号是一个空语句，也就是“if (控制表达式) 语句语句 else 语句”的格式，这不符合“if (控制表达式) 语句 else 语句”的语法。

用do {...} while(0)是一种比较好的解决办法，展开之后的形式是if (...) do {...} while (0); else ...，其中do {...} while (0);就是一条语句。

内联函数

C99引入一个新关键字inline，用于定义内联函数（Inline Function）。这种用法在内核代码中很常见，例如include/linux/rwsem.h中：

static inline void down_read(struct rw_semaphore *sem)
{
        might_sleep();
        rwsemtrace(sem,"Entering down_read");
        __down_read(sem);
        rwsemtrace(sem,"Leaving down_read");
}

inline关键字告诉编译器，这个函数的调用要尽可能快，可以当普通的函数调用实现，也可以用宏展开的办法实现。

我们做个实验，把上一节的例子改一下：

inline int MAX(int a, int b)
{
        return a > b ? a : b;
}

int a[] = { 9, 3, 5, 2, 1, 0, 8, 7, 6, 4 };

int max(int n)
{
        return n == 0 ? a[0] : MAX(a[n], max(n-1));
}

int main(void)
{
        max(9);
        return 0;
}

按往常的步骤编译然后反汇编：

$ gcc main.c -g
$ objdump -dS a.out
...
int max(int n)
{
 80483c5:       55                      push   %ebp
 80483c6:       89 e5                   mov    %esp,%ebp
 80483c8:       83 ec 18                sub    $0x18,%esp
        return n == 0 ? a[0] : MAX(a[n], max(n-1));
 80483cb:       83 7d 08 00             cmpl   $0x0,0x8(%ebp)
 80483cf:       75 07                   jne    80483d8 <max+0x13>
 80483d1:       a1 40 a0 04 08          mov    0x804a040,%eax
 80483d6:       eb 24                   jmp    80483fc <max+0x37>
 80483d8:       8b 45 08                mov    0x8(%ebp),%eax
 80483db:       83 e8 01                sub    $0x1,%eax
 80483de:       89 04 24                mov    %eax,(%esp)
 80483e1:       e8 df ff ff ff          call   80483c5 <max>
 80483e6:       8b 55 08                mov    0x8(%ebp),%edx
 80483e9:       8b 14 95 40 a0 04 08    mov    0x804a040(,%edx,4),%edx
 80483f0:       89 44 24 04             mov    %eax,0x4(%esp)
 80483f4:       89 14 24                mov    %edx,(%esp)
 80483f7:       e8 b8 ff ff ff          call   80483b4 <MAX>
}
 80483fc:       c9                      leave
 80483fd:       c3                      ret

可以看到MAX是作为普通函数调用的。如果指定优化选项编译，然后反汇编：

$ gcc main.c -g -O
$ objdump -dS a.out
...
int max(int n)
{
 80483c5:       55                      push   %ebp
 80483c6:       89 e5                   mov    %esp,%ebp
 80483c8:       53                      push   %ebx
 80483c9:       83 ec 14                sub    $0x14,%esp
 80483cc:       8b 5d 08                mov    0x8(%ebp),%ebx
        return n == 0 ? a[0] : MAX(a[n], max(n-1));
 80483cf:       85 db                   test   %ebx,%ebx
 80483d1:       75 07                   jne    80483da <max+0x15>
 80483d3:       a1 40 a0 04 08          mov    0x804a040,%eax
 80483d8:       eb 18                   jmp    80483f2 <max+0x2d>
 80483da:       8d 43 ff                lea    -0x1(%ebx),%eax
 80483dd:       89 04 24                mov    %eax,(%esp)
 80483e0:       e8 e0 ff ff ff          call   80483c5 <max>
inline int MAX(int a, int b)
{
        return a > b ? a : b;
 80483e5:       8b 14 9d 40 a0 04 08    mov    0x804a040(,%ebx,4),%edx
 80483ec:       39 d0                   cmp    %edx,%eax
 80483ee:       7d 02                   jge    80483f2 <max+0x2d>
 80483f0:       89 d0                   mov    %edx,%eax
int a[] = { 9, 3, 5, 2, 1, 0, 8, 7, 6, 4 };

int max(int n)
{
        return n == 0 ? a[0] : MAX(a[n], max(n-1));
}
 80483f2:       83 c4 14                add    $0x14,%esp
 80483f5:       5b                      pop    %ebx
 80483f6:       5d                      pop    %ebp
 80483f7:       c3                      ret
...

可以看到并没有生成调用MAX函数的call指令，事实上MAX函数并不独立存在，它的指令内联在max函数中，由于源代码和指令的次序无法对应，max和MAX函数的源代码也交错在一起显示。

请读者从开发和调试的角度思考一下，inline函数与函数式宏定义相比有哪些优点？

#、##运算符和可变参数

#和##是两个预处理运算符（注意不是C语言表达式的运算符）。

在函数式宏定义中，#号运算符后面应该跟一个形参（#号和形参之间可以有空格或Tab），用于创建字符串字面值，例如：

#define STR(s) # s
STR(hello       world)

用cpp命令预处理之后是"hello␣world"，预处理器用"号把实参括起来成为一个字符串字面值，并且实参中的连续多个空白字符被替换成一个空格。

再比如：

#define STR(s) #s
fputs(STR(strncmp("ab\"c\0d", "abc", '\4"')
        == 0) STR(: @\n), s);

预处理之后是fputs("strncmp(\"ab\\\"c\\0d\", \"abc\", '\\4\"') == 0" ": @\n", s);，注意如果实参中包含字符常量或字符串字面值，则宏展开之后字符串的界定符"要替换成\"，字符常量或字符串字面值中的\和"字符要替换成\\和\"。

在宏定义中可以用##运算符把前后两个预处理Token连接成一个预处理Token。和#号运算符不同，##运算符不仅限于函数式宏定义，变量式宏定义也可以用。例如：

#define CONCAT(a, b) a##b
CONCAT(con, cat)

预处理之后是concat。

再比如，要定义一个宏展开成两个#号，可以这样定义：

#define HASH_HASH # ## #

这个宏定义由三个Token组成：#、##和#。中间的##是运算符，宏展开时前后两个#号被这个运算符连接在一起。注意中间的两个空格是不可少的，如果写成####，根据最长匹配原则会被划分成##和##两个Token，而根据定义##运算符用于连接前后两个预处理Token，不能出现在宏定义的开头或末尾，所以会报错。

我们知道printf函数带有可变参数，函数式宏定义也可以带可变参数，同样是在参数列表中用...表示可变参数。例如：

#define showlist(...) printf(#__VA_ARGS__)
#define report(test, ...) ((test)?printf(#test):\
        printf(__VA_ARGS__))
showlist(The first, second, and third items.);
report(x>y, "x is %d but y is %d", x, y);

预处理之后变成：

printf("The first, second, and third items.");
((x>y)?printf("x>y"): printf("x is %d but y is %d", x, y));

宏定义中可变参数的部分用__VA_ARGS__表示，在宏展开时和...对应的几个实参可以看成一个实参来替换掉__VA_ARGS__。

调用函数式宏定义允许传空参数，这一点和函数调用不同，我们通过下面几个例子理解空参数的用法。

#define FOO() foo
FOO()

预处理之后变成foo。FOO在定义时不带参数，在调用时也不允许传参数给它。

#define FOO(a) foo##a
FOO(bar)
FOO()

预处理之后变成：

foobar
foo

FOO在定义时带一个参数，在调用时必须传一个参数给它，如果不传参数则表示传了一个空参数。

#define FOO(a, b, c) a##b##c
FOO(1,2,3)
FOO(1,2,)
FOO(1,,3)
FOO(,,3)

预处理之后变成：

FOO在定义时带三个参数，在调用时也必须传三个参数给它，空参数的位置可以空着，但必须给足三个参数，用两个逗号隔开，FOO(1,2)这样的调用是错误的。

#define FOO(a, ...) a##__VA_ARGS__
FOO(1)
FOO(1,2,3,)

预处理之后变成：

1
12,3,

FOO(1)这个调用相当于可变参数部分传了一个空参数，FOO(1,2,3,)这个调用相当于可变参数部分传了三个参数，第三个是空参数。

gcc有一种扩展语法，如果##运算符用在__VA_ARGS__前面，除了起连接Token的作用之外还有一种特殊用法，例如内核代码net/netfilter/nf_conntrack_proto_sctp.c中的：

#define DEBUGP(format, ...) printk(format, ## __VA_ARGS__)

内核函数printk类似于printf，也带有格式化字符串和可变参数，由于内核不能调用libc的库函数，所以另外实现了这样一个打印函数。这个函数式宏定义可以这样调用：DEBUGP("info no. %d", 1)。也可以这样调用：DEBUGP("info")。后者相当于可变参数部分传了一个空参数，但展开之后并不是printk("info",)，而是printk("info")，当__VA_ARGS__是空参数时，##运算符把它前面的逗号“吃”掉了。

#undef 预处理指示

可以重复定义一个宏，但是宏的定义要一模一样

如果在一个编译单元中重复定义一个宏，C语言规定这些重复的宏定义必须一模一样。
什么样的定义是一模一样的

例如这样的重复定义是允许的：
```
#define OBJ_LIKE (1 - 1)
#define OBJ_LIKE /* comment */ (1/* comment */-/* comment */ 1)/* comment */
```
在定义的前后多些空白或少些空白没有关系（这里的空白包括空格、Tab、注释，因为前一步预处理要把注释替换成空格），在定义中间连续多个空白等价于一个空白。
什么样的定义是不一样的

但在定义中间有空白和没有空白被认为是不同的，所以这样的重复定义是不允许的：
```
#define OBJ_LIKE (1 - 1)
#define OBJ_LIKE (1-1)
```
不一样的宏定义之间要加 #undef

如果需要重新定义一个宏，和原来的定义不同，可以先用#undef取消原来的定义，再重新定义，例如：
```
#define X 3
... /* X is 3 */
#undef X
... /* X has no defintion */
#define X 2
... /* now X is 2 */
```
前面没有 #define X 3，后面用#undef X也不算错

#undef的语法比较宽松。

如果前面没有#define X 3，后面用#undef X取消X的定义也不算错，当然这么写也不起任何作用。
取消宏定义时有多个 #undef X 也不算错

如果前面定义了#define X 3，后面用#undef X取消X的定义之后，再用#undef X取消一遍也不算错。

总之，重复定义一个宏必须定义得一模一样才算对，否则算错，而重复取消一个宏的定义不算错。

宏展开的步骤

以上列举的宏展开的例子都是最简单的，有些宏展开的过程需要做多次替换，例如：

#define sh(x) printf("n" #x "=%d, or %d\n",n##x,alt[x])
#define sub_z  26
sh(sub_z)

sh(sub_z)要用sh(x)这个宏定义来展开，形参x对应的实参是sub_z，替换过程如下：

#x要替换成"sub_z"。
n##x要替换成nsub_z。
除了带#和##运算符的参数之外，其他参数在替换之前要对实参本身做充分展开，所以应该先把sub_z展开成26再替换到alt[x]中x的位置。
现在展开成了printf("n" "sub_z" "=%d, or %d\n",nsub_z,alt[26])，所有参数都替换完了，这时编译器会再扫描一遍，再找出可以展开的宏定义来展开，假设nsub_z或alt是变量式宏定义，这时会进一步展开。

再举一个例子：

#define x 3
#define f(a) f(x * (a))
#undef x
#define x 2
#define g f
#define t(a) a

t(t(g)(0) + t)(1);

展开的步骤是：

先把g展开成f再替换到#define t(a) a中，得到t(f(0) + t)(1);。
根据#define f(a) f(x * (a))，得到t(f(x * (0)) + t)(1);。
把x替换成2，得到t(f(2 * (0)) + t)(1);。

注意，一开始定义x为3，但是后来用#undef x取消了x的定义，又重新定义x为2。当预处理器处理到t(t(g)(0) + t)(1);这一行代码时x已经定义成2了，所以用2来替换。

还要注意一点，现在得到的t(f(2 * (0)) + t)(1);中仍然有f，但不能再次根据#define f(a) f(x * (a))展开了，f(2 * (0))就是由展开f(0)得到的，展开的结果中再出现f(...)就不展开了，这样规定可以避免无穷展开（类似于无穷递归），因此我们可以放心地使用递归定义，例如#define a a[0]，#define a a.member等。
根据#define t(a) a最终展开成f(2 * (0)) + t(1);。这时不能再展开t(1)了，因为这里的t就是由展开t(f(2 * (0)) + t)得到的，展开的结果中再出现t(...)就不展开了。

20.3 条件预处理指示

#ifndef、#endif

我们在第19.2.2节中见过Header Guard的写法：

#ifndef HEADER_FILENAME
#define HEADER_FILENAME
/* body of header */
#endif

#if、#elif、#else、#endif、#error

除了这种用法之外，条件预处理指示也常用于源代码的配置管理，例如：

#if MACHINE == 68000
    int x;
#elif MACHINE == 8086
    long x;
#else    /* all others */
    #error UNKNOWN TARGET MACHINE
#endif

假设这段程序是为多种平台编写的，在68000平台上需要定义x为int型，在8086平台上需要定义x为long型，对其他平台暂不提供支持，就可以用条件预处理指示来写。

如果在预处理这段代码之前，MACHINE被定义为68000，则包含int x;这行代码；否则如果MACHINE被定义为8086，则包含long x;这行代码；其他情况下（MACHINE没有定义，或者定义为其他值）包含#error UNKNOWN TARGET MACHINE这行代码，编译器遇到#error预处理指示就报错退出，错误信息就是UNKNOWN TARGET MACHINE。

如果要为8086平台编译这段代码，有几种可选的办法：

手动编辑代码，在前面添一行#define MACHINE 8086。

这样做的缺点是难以管理，如果这个项目中有很多源文件都需要定义MACHINE，每次要为8086平台编译就得把这些定义全部改成8086，每次要为68000平台编译就得把这些定义全部改成68000。
在所有需要配置的源文件开头包含一个头文件，在头文件中定义#define MACHINE 8086，这样只需要改一个头文件就可以影响所有包含它的源文件。

通常这个头文件由配置工具生成，比如在Linux内核源代码的根目录下运行make menuconfig命令可以出来一个配置菜单（make命令在下一章详细介绍），在其中配置的选项会自动转换成内核源代码目录下include/linux/autoconf.h文件中的宏定义。

举一个具体的例子，在内核配置菜单中用回车键和方向键进入Device Drivers ---> Network device support，然后用空格键选中Network device support（菜单项左边的[ ]括号内会出现一个*号），然后保存退出，在内核源代码的根目录下会生成一个名为.config的隐藏文件，其内容类似于：
```
...
#
# Network device support
#
CONFIG_NETDEVICES=y
# CONFIG_DUMMY is not set
# CONFIG_BONDING is not set
# CONFIG_EQUALIZER is not set
# CONFIG_TUN is not set
...
```
然后在内核源代码的根目录下运行make命令编译内核，这时会根据.config文件生成头文件include/linux/autoconf.h，其内容类似于：
```
...
/*
 * Network device support
 */
#define CONFIG_NETDEVICES 1
#undef CONFIG_DUMMY
#undef CONFIG_BONDING
#undef CONFIG_EQUALIZER
#undef CONFIG_TUN
...
```
在内核配置菜单里选中的项会变成#define代码，没选中的项会变成#undef代码。#undef可以确保取消某个宏的定义，比如#undef CONFIG_DUMMY，如果该编译单元的前面定义过CONFIG_DUMMY就取消它的定义，如果前面没定义过CONFIG_DUMMY就什么都不做。

include/linux/autoconf.h被另一个头文件include/linux/config.h所包含，通常内核代码包含后一个头文件，例如net/core/sock.c：
```
...
#include <linux/config.h>
...
int sock_setsockopt(struct socket *sock, int level, int optname,
                    char __user *optval, int optlen)
{
...
#ifdef CONFIG_NETDEVICES
                case SO_BINDTODEVICE:
                {
                        ...
                }
#endif
...
```
再比如drivers/isdn/i4l/isdn_common.c：
```
...
#include <linux/config.h>
...
static int
isdn_ioctl(struct inode *inode, struct file *file, uint cmd, ulong arg)
{
...
#ifdef CONFIG_NETDEVICES
                        case IIOCNETGPN:
                                /* Get peer phone number of a connected
                                 * isdn network interface */
                                if (arg) {
                                        if (copy_from_user(&phone, argp,     sizeof(phone)))
                                                return -EFAULT;
                                        return isdn_net_getpeer(&phone,     argp);
                                } else
                                        return -EINVAL;
#endif
...
#ifdef CONFIG_NETDEVICES
                        case IIOCNETAIF:
...
#endif                          /* CONFIG_NETDEVICES */
...
```
在内核配置菜单中所做的配置通过条件预处理影响到源代码，从而决定了哪些代码编译到内核中，哪些代码不编译到内核中。

#ifdef或#if可以嵌套使用，但预处理指示通常都顶头写不缩进，为了区分嵌套的层次，可以像上面代码中最后一行那样，在#endif处用注释写清楚它结束的是哪个#if或#ifdef。
要定义一个宏不一定非得在代码中用#define定义，早在第11.6节我们就见过用gcc的-D选项定义一个宏NDEBUG。

对于上面的例子，我们需要给MACHINE定义一个值，可以写成这样的命令：gcc -c -DMACHINE=8086 main.c。这种方法需要给每个编译命令都加上适当的选项，和第2种方法相比似乎也很麻烦，第2种方法在头文件中只写一次宏定义就可以在很多源文件中生效，第3种方法能不能做到“只写一次到处生效”呢？等下一章学习了Makefile就有办法了。

#if 后面表达式如何求值

最后通过一个例子看看预处理器如何求值#if后面的表达式，这个表达式必须是常量表达式。

#define VERSION  2
#if defined x || y || VERSION < 3

首先看预处理运算符defined，defined运算符一般用作表达式中的一部分，如果单独使用，#if defined x相当于#ifdef x，而#if !defined x相当于#ifndef x。

在这个例子中，如果x这个宏有定义，则把defined x替换成1，否则替换成0，因此变成#if 0 || y || VERSION < 3。
把有定义的宏展开，变成#if 0 || y || 2 < 3。
把没有定义的宏替换成0，变成#if 0 || 0 || 2 < 3。

注意，即使前面定义了一个变量名是y，在这一步也还是替换成0，#if表达式在预处理时求值，预处理器不知道变量名，甚至也不知道枚举常量，#if表达式中包含的标识符只能是宏定义。
把得到的表达式0 || 0 || 2 < 3像C表达式一样求值，求值的结果是#if 1，因此条件成立。

用 #if 0 注释代码

我们在开发调试中经常需要临时注释掉多行代码，可以用/* ... */注释：

/*
代码行
代码行
...
*/

这样做有一个问题：代码行中可能已经包含/* ... */注释了，而我们讲过/* ... */注释不能嵌套使用。

更好的办法是用#if 0注释掉多行代码：

#if 0
代码行
代码行
...
#endif

20.4 其他预处理特性

#pragma 预处理指示

#pragma 预处理指示供编译器实现一些扩展特性，C标准没有规定#pragma后面应该写什么以及起什么作用，由编译器自己规定。

有的编译器用#pragma定义一些特殊功能寄存器名，有的编译器用#pragma定位链接地址，本书不做深入讨论。

如果编译器在代码中碰到不认识的#pragma指示则忽略它，例如gcc的#pragma指示都是#pragma GCC ...这种形式，别的编译器看到这样的指示直接忽略。

特殊的宏 FILE 和 LINE

C标准规定了几个特殊的宏，不需要定义即可使用，最常用的是__FILE__和__LINE__，__FILE__展开成当前源文件的文件名，是一个字符串，__LINE__展开成当前代码行的行号，是一个整数。

这两个宏在源代码中不同的地方使用会自动展开成不同的值，显然不是用#define能定义得出来的，它们是编译器内建的特殊宏定义。

在打印调试信息时打印这两个宏可以给开发者非常有用的提示，例如在第11.6节我们看到assert打印的错误信息就有__FILE__和__LINE__的值。

实现 assert

现在我们自己实现assert，以便理解它的工作原理。这个实现出自参考文献[5]第1章：

/* assert.h standard header */
#undef assert   /* remove existing definition */

#ifdef NDEBUG
        #define assert(test)    ((void)0)
#else           /* NDEBUG not defined */
        void _Assert(char *);
        /* macros */
        #define _STR(x) _VAL(x)
        #define _VAL(x) #x
        #define assert(test)    ((test) ? (void)0 \
                : _Assert(__FILE__ ":" _STR(__LINE__) " " #test))
#endif

通过这个例子可以全面复习本章所讲的知识。

assert 应该是函数式宏定义，assert(test) 类型应该是 void

C标准规定assert应该实现成函数式宏定义而不是一个真正的函数，并且assert(test)这个表达式应该是void类型的。

首先用#undef assert确保取消前面对assert的定义，然后分两种情况：如果定义了NDEBUG，那么assert(test)直接定义成一个void类型的值，什么也不做；

如果没有定义NDEBUG，则要判断测试条件test是否成立，如果条件成立就什么也不做，如果条件不成立就调用_Assert函数打印调试信息。
调用和展开 assert

假设在main.c文件的第33行调用assert(is_sorted())，那么__FILE__是字符串"main.c"，__LINE__是整数33，#test是字符串"is_sorted()"。

注意_STR(LINE)的展开过程：首先展开成_VAL(33)，然后进一步展开成字符串"33"。

这样，最后_Assert调用的形式是_Assert("main.c" ":" "33" "␣" "is_sorted()")，传给_Assert函数的字符串是"main.c:33 is_sorted()"。

请结合前面讲过的宏展开步骤思考一下，为什么不直接定义#define _STR(x) #x呢？

_Assert函数

_Assert函数是我们自己定义的，在另一个源文件中：

/* xassert.c _Assert function */
#include <stdio.h>
#include <stdlib.h>

void _Assert(char *mesg)
{               /* print assertion message and abort */
        fputs(mesg, stderr);
        fputs(" -- assertion failed\n", stderr);
        abort();
}

以下划线开头的标识符一般留作内部使用

我们在这个实现中定义了一些以_线开头的标识符，例如_STR、_VAL、_Assert，这些标识符是我们的实现内部使用的，并不打算提供给用户程序使用。

在第2.3节讲过，C标准库定义了很多以下划线开头的标识符留作内部使用，在/usr/include下的头文件中你可以找到很多以_线开头的标识符。
C 标准库的头文件是相互独立的，assert 不能调用别的库函数

另外一个问题是：为什么我们不直接在assert宏定义中调用fputs和abort函数呢？

因为C标准规定C标准库的头文件是相互独立的，用户程序只要包含assert.h就应该能使用assert宏定义，assert.h不应该依赖于别的头文件。

如果在assert.h中直接调用fputs和abort，那么用户程序只包含assert.h是不够的，还必须同时包含stdio.h和stdlib.h，头文件之间就不是独立的了。

fputs函数向标准错误输出打印错误信息（详见第24.2.7节），abort函数异常终止当前进程（本书不做详细介绍，请参考Man Page）。

测试自己实现的 assert

现在测试一下我们实现的assert，把assert.h、xassert.c和测试代码main.c放在同一个目录下。

/* main.c */
#include "assert.h"

int main(void)
{
        assert(2>3);
        return 0;
}

注意#include "assert.h"要用"引号而不要用角括号，以保证包含的是我们自己写的assert.h而非C标准库的头文件。然后编译运行：

$ gcc main.c xassert.c
$ ./a.out
main.c:6 2>3 -- assertion failed
Aborted

代表函数名的特殊变量名 func

在打印调试信息时除了文件名和行号之外还可以打印出当前函数名，C99引入一个特殊标识符__func__支持这一功能。这个标识符应该是一个变量名而不是宏定义，不在预处理阶段求值，但它的作用和__FILE__、__LINE__类似，所以放在一起讲。例如：

#include <stdio.h>

void myfunc(void)
{
        printf("%s\n", __func__);
}

int main(void)
{
        myfunc();
        printf("%s\n", __func__);
        return 0;
}

运行结果如下：

$ gcc main.c
$ ./a.out
myfunc
main

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

chapter-20.md

chapter-20.md

20. 预处理

20.1 预处理的步骤

20.2 宏定义

函数式宏定义

内联函数

#、##运算符和可变参数

#undef 预处理指示

宏展开的步骤

20.3 条件预处理指示

#ifndef、#endif

#if、#elif、#else、#endif、#error

#if 后面表达式如何求值

用 #if 0 注释代码

20.4 其他预处理特性

#pragma 预处理指示

特殊的宏 FILE 和 LINE

实现 assert

测试自己实现的 assert

代表函数名的特殊变量名 func

Files

chapter-20.md

Latest commit

History

chapter-20.md

File metadata and controls

20. 预处理

20.1 预处理的步骤

20.2 宏定义

函数式宏定义

内联函数

#、##运算符和可变参数

#undef 预处理指示

宏展开的步骤

20.3 条件预处理指示

#ifndef、#endif

#if、#elif、#else、#endif、#error

#if 后面表达式如何求值

用 #if 0 注释代码

20.4 其他预处理特性

#pragma 预处理指示

特殊的宏 FILE 和 LINE

实现 assert

测试自己实现的 assert

代表函数名的特殊变量名 func