inline 函数是 C++ 中的一种建议编译器将函数调用展开为函数体代码的机制，目的是减少函数调用的开销，从而提升性能。以下是 inline 函数提升性能的几个关键方面：

1. 减少函数调用开销

普通函数调用时，程序需要执行以下操作：
- 将参数压入栈中（或通过寄存器传递参数）。
- 跳转到函数地址执行代码。
- 函数返回时，从栈中恢复调用者的上下文。
inline 函数通过直接将函数代码嵌入调用点，避免了这些额外的操作，从而减少了函数调用的开销。

2. 消除分支跳转

函数调用通常伴随着分支跳转（jump 指令），这可能导致 CPU 指令流水线中断。
inline 函数展开后，代码直接嵌入调用点，避免了分支跳转，从而可能提高 CPU 指令的执行效率。

3. 优化机会

当函数被内联后，编译器可以对展开的代码进行进一步优化，例如：
- 常量折叠（constant folding）。
- 死代码消除（dead code elimination）。
- 循环展开（loop unrolling）等。
这些优化在普通函数调用中可能无法实现，因为编译器无法看到函数内部的实现细节。

4. 适合短小高频函数

inline 函数通常用于短小且频繁调用的函数，例如：
- 简单的 getter/setter 函数。
- 算术运算函数。
- 访问器函数等。
对于这些函数，函数调用的开销可能占函数执行时间的很大一部分，内联可以显著提升性能。

使用 `inline` 的注意事项

尽管 inline 函数有性能提升的潜力，但使用时需要注意以下几点：

代码膨胀（Code Bloat）
- 如果 inline 函数被频繁调用，且函数体较大，内联会导致生成的二进制代码显著增大，可能引发缓存未命中（cache miss），反而降低性能。
编译器决定是否内联
- inline 只是一个建议，最终是否内联由编译器决定。编译器可能会忽略 inline 关键字，尤其是在函数体过大或递归调用的情况下。
调试困难
- 内联展开后，函数调用点不再明确，可能增加调试的难度。
递归函数通常不适合内联
- 递归函数的内联展开可能导致代码无限膨胀，编译器通常会拒绝内联递归函数。

示例代码

```cpp

include

// 使用 inline 关键字
inline int add(int a, int b) {
return a + b;
}

int main() {
int result = 0;
for (int i = 0; i < 1000; ++i) {
result = add(result, i); // 调用内联函数
}
std::cout << "Result: " << result << std::endl;
return 0;
}
```

在上述代码中，add 函数被声明为 inline，编译器可能会将其展开为直接的加法操作，从而避免函数调用的开销。