Python字节码dis模块分析列表推导式的执行效率

列表推导式是Python中一种简洁高效的创建列表的方式。但它的效率优势从何而来？通过分析其底层字节码，我们可以清晰地看到Python解释器是如何优化这一过程的。

1. 准备工作：认识dis模块

要分析字节码，你需要使用Python内置的dis模块。这个模块可以将Python代码反汇编成其对应的字节码指令。

导入dis模块：
```
import dis
```

现在，你可以使用dis.dis()函数来查看任何可调用对象（如函数、lambda表达式）或代码对象的字节码。

2. 基础分析：简单列表推导式 vs. for循环

我们首先比较一个简单的列表推导式和一个等效的for循环。

定义一个简单的列表推导式：
```
my_list_comp = [x for x in range(5)]
```
使用dis模块分析其字节码：
```
dis.dis(my_list_comp, show_code=True)
```
你会看到类似以下的输出，我们关注<listcomp>部分：
```
  1           0 RESUME                   0

  2           2 BUILD_LIST               0
              4 LOAD_FAST                0 (.0)
  -->       6 FOR_ITER                  8 (to 16)
              8 STORE_FAST               1 (x)
             10 LOAD_FAST                1 (x)
             12 LIST_APPEND              2
             14 JUMP_BACKWARD           10 (to 6)

  3     >>   16 RETURN_VALUE
```
让我们逐条解释这些关键指令：
- BUILD_LIST 0：创建一个空的列表。
- FOR_ITER 8：从迭代器（这里是range(5)）中获取下一个元素。如果迭代结束，跳转到16行。
- STORE_FAST 1 (x)：将获取到的元素存入局部变量x。
- LOAD_FAST 1 (x)：将局部变量x的值加载到栈上。
- LIST_APPEND 2：从栈上弹出值（即x），并将其追加到列表中。这里的2表示列表在栈上的位置。
- JUMP_BACKWARD 10：跳转回FOR_ITER指令，继续循环。

定义一个等效的for循环：

my_for_loop = []
for x in range(5):
    my_for_loop.append(x)

分析for循环的字节码：

dis.dis(my_for_loop)

输出如下，我们关注循环体部分：

  1           0 RESUME                   0

  2           2 BUILD_LIST               0
              4 STORE_NAME               0 (my_for_loop)

  3           6 LOAD_GLOBAL              0 (range)
              8 LOAD_CONST               1 (5)
             10 PRECALL                  1
             14 CALL                     1
             24 GET_ITER
  -->       26 FOR_ITER                 12 (to 40)

  4          28 STORE_NAME               1 (x)

  5          30 LOAD_NAME                0 (my_for_loop)
             32 LOAD_METHOD              0 (append)
             34 LOAD_NAME                1 (x)
             36 PRECALL                  1
             40 CALL                     1
             50 POP_TOP
             52 JUMP_BACKWARD           26 (to 26)

  6     >>   54 LOAD_CONST               0 (None)
             56 STORE_NAME               0 (my_for_loop)
             58 LOAD_CONST               2 (None)
             60 RETURN_VALUE

关键指令解释：

STORE_NAME 1 (x)：将元素存入变量x。
LOAD_NAME 0 (my_for_loop)：加载列表对象。
LOAD_METHOD 0 (append)：加载append方法。
LOAD_NAME 1 (x)：加载要追加的值x。
PRECALL 1 / CALL 1：调用append方法。
POP_TOP：弹出调用结果（append返回None）。

对比与结论：
对比两者，我们可以发现列表推导式的字节码更紧凑、更高效。
- 访问速度：列表推导式使用LOAD_FAST和STORE_FAST来访问局部变量，这比for循环中的LOAD_NAME和STORE_NAME更快。LOAD_FAST直接访问局部变量，而LOAD_NAME需要通过字典查找全局或局部命名空间。
- 方法调用开销：for循环中，每次循环都要执行LOAD_METHOD、PRECALL、CALL和POP_TOP等一系列指令来调用append方法。而列表推导式则使用一条LIST_APPEND指令，这是一个C语言级别的优化操作，直接在列表对象上执行追加，避免了Python层面的方法查找和调用开销。
- 指令数量：列表推导式的循环体只有3条指令（STORE_FAST, LOAD_FAST, LIST_APPEND），而for循环的循环体有7条指令（STORE_NAME, LOAD_NAME, LOAD_METHOD, LOAD_NAME, PRECALL, CALL, POP_TOP）。
这就是列表推导式通常比等效for循环更快的原因。

3. 进阶分析：带if条件的列表推导式

接下来，我们分析带if过滤条件的列表推导式。

定义一个带if的列表推导式：

my_list_comp_if = [x for x in range(10) if x % 2 == 0]

分析其字节码：

dis.dis(my_list_comp_if, show_code=True)

输出如下：

  1           0 RESUME                   0

  2           2 BUILD_LIST               0
              4 LOAD_FAST                0 (.0)
  -->       6 FOR_ITER                  16 (to 24)
              8 STORE_FAST               1 (x)
             10 LOAD_FAST                1 (x)
             12 LOAD_CONST               1 (2)
             14 BINARY_MODULO
             16 LOAD_CONST               2 (0)
             18 COMPARE_OP               2 (==)
             20 POP_JUMP_IF_FALSE       6
             22 LOAD_FAST                1 (x)
             24 LIST_APPEND              2
             26 JUMP_BACKWARD           20 (to 6)

  3     >>   28 RETURN_VALUE

关键指令解释：

BINARY_MODULO：计算x % 2。
COMPARE_OP 2 (==)：比较结果是否等于0。
POP_JUMP_IF_FALSE 6：如果比较结果为False，则跳转到FOR_ITER指令，不执行LIST_APPEND。这是if条件的实现。

定义一个等效的for循环（带if）：

my_for_loop_if = []
for x in range(10):
    if x % 2 == 0:
        my_for_loop_if.append(x)

分析其字节码：

dis.dis(my_for_loop_if)

输出如下：

  1           0 RESUME                   0

  2           2 BUILD_LIST               0
              4 STORE_NAME               0 (my_for_loop_if)

  3           6 LOAD_GLOBAL              0 (range)
              8 LOAD_CONST               1 (10)
             10 PRECALL                  1
             14 CALL                     1
             24 GET_ITER
  -->       26 FOR_ITER                 20 (to 48)

  4          28 STORE_NAME               1 (x)

  5          30 LOAD_NAME                1 (x)
             32 LOAD_CONST               2 (2)
             34 BINARY_MODULO
             36 LOAD_CONST               3 (0)
             38 COMPARE_OP               2 (==)
             40 POP_JUMP_IF_FALSE       26

  6          42 LOAD_NAME                0 (my_for_loop_if)
             44 LOAD_METHOD              0 (append)
             46 LOAD_NAME                1 (x)
             48 PRECALL                  1
             52 CALL                     1
             62 POP_TOP
             64 JUMP_BACKWARD           38 (to 26)

  7     >>   66 LOAD_CONST               0 (None)
             68 STORE_NAME               0 (my_for_loop_if)
             70 LOAD_CONST               4 (None)
             72 RETURN_VALUE

关键指令解释：

POP_JUMP_IF_FALSE 26：如果if条件不满足，跳转到FOR_ITER，跳过append调用。

对比与结论：
同样，列表推导式在效率上占优。
- 局部变量访问：LOAD_FAST vs LOAD_NAME。
- 方法调用：LIST_APPEND vs LOAD_METHOD/CALL。
- 指令紧凑性：列表推导式的if条件判断和追加操作被整合在更少的指令中。

4. 深入探讨：列表推导式 vs. 生成器表达式

列表推导式会立即创建并存储整个列表在内存中。如果列表很大，这会消耗大量内存。Python提供了生成器表达式作为替代，它按需生成值，内存效率更高。

定义一个生成器表达式：
```
my_gen_expr = (x for x in range(5))
```

分析其字节码：

dis.dis(my_gen_expr, show_code=True)

输出如下，我们关注<genexpr>部分：

  1           0 RESUME                   0

  2           2 LOAD_FAST                0 (.0)
  -->       4 FOR_ITER                  12 (to 18)
              6 STORE_FAST               1 (x)
              8 LOAD_FAST                1 (x)
             10 YIELD_VALUE
             12 POP_TOP
             14 JUMP_BACKWARD           12 (to 4)

  3     >>   16 RETURN_VALUE

关键指令解释：

YIELD_VALUE：这是生成器的核心。它将x的值生成（yield）出去，然后暂停执行，等待下一次请求。它不会将值存储在列表中。

对比与结论：
- 内存占用：列表推导式使用BUILD_LIST创建一个完整的列表，所有元素都存在于内存中。生成器表达式使用YIELD_VALUE，它不存储任何元素，只在被迭代时逐个生成，因此内存占用极低，几乎可以忽略不计。
- 执行方式：列表推导式是一次性计算出所有结果。生成器表达式是惰性的，只有当你迭代它时（例如通过for循环或next()函数），它才会执行并生成下一个值。
- 适用场景：当你需要处理一个很大的数据集，或者只是想逐个处理数据而不需要全部存储时，生成器表达式是更好的选择。当你确实需要一个列表来进行随机访问或多次迭代时，列表推导式更合适。

通过dis模块分析字节码，我们不仅理解了列表推导式的高效性，还学会了如何区分它和生成器表达式的底层差异，从而在合适的场景下做出更明智的选择。

文章目录

Python字节码dis模块分析列表推导式的执行效率

1. 准备工作：认识dis模块

2. 基础分析：简单列表推导式 vs. for循环

3. 进阶分析：带if条件的列表推导式

4. 深入探讨：列表推导式 vs. 生成器表达式

评论 (0)

文章目录

Python字节码dis模块分析列表推导式的执行效率

1. 准备工作：认识dis模块

2. 基础分析：简单列表推导式 vs. for循环

3. 进阶分析：带if条件的列表推导式

4. 深入探讨：列表推导式 vs. 生成器表达式

评论 (0)

扫一扫，手机查看