Python 列表理解和生成器表达式中的屈服
以下行为对我来说似乎有点违反直觉(Python 3.4): 我觉得很有趣,那三行字居然都能用。上面说只允许在函数定义中使用Python 列表理解和生成器表达式中的屈服,python,generator,list-comprehension,yield,generator-expression,Python,Generator,List Comprehension,Yield,Generator Expression,以下行为对我来说似乎有点违反直觉(Python 3.4): 我觉得很有趣,那三行字居然都能用。上面说只允许在函数定义中使用yield(尽管我可能读错了和/或它可能只是从旧版本复制的)。在Python2.7中,前两行生成一个SyntaxError,但第三行没有 而且,这似乎很奇怪 列表理解返回的是生成器而不是列表 转换为列表的生成器表达式和相应的列表理解包含不同的值 有人能提供更多的信息吗 注意:这是Python在处理理解和生成器表达式中的yield时的一个错误,在Python3.8中修复,在
yield
(尽管我可能读错了和/或它可能只是从旧版本复制的)。在Python2.7中,前两行生成一个SyntaxError
,但第三行没有
而且,这似乎很奇怪
- 列表理解返回的是生成器而不是列表
- 转换为列表的生成器表达式和相应的列表理解包含不同的值
yield
时的一个错误,在Python3.8中修复,在Python3.7中有一个弃用警告。请参阅和的和的新增条目
生成器表达式以及set和dict理解被编译为(生成器)函数对象。在Python3中,列表理解得到相同的处理;本质上,它们都是一个新的嵌套范围
如果尝试反汇编生成器表达式,则可以看到:
>>> dis.dis(compile("(i for i in range(3))", '', 'exec'))
1 0 LOAD_CONST 0 (<code object <genexpr> at 0x10f7530c0, file "", line 1>)
3 LOAD_CONST 1 ('<genexpr>')
6 MAKE_FUNCTION 0
9 LOAD_NAME 0 (range)
12 LOAD_CONST 2 (3)
15 CALL_FUNCTION 1 (1 positional, 0 keyword pair)
18 GET_ITER
19 CALL_FUNCTION 1 (1 positional, 0 keyword pair)
22 POP_TOP
23 LOAD_CONST 3 (None)
26 RETURN_VALUE
>>> dis.dis(compile("(i for i in range(3))", '', 'exec').co_consts[0])
1 0 LOAD_FAST 0 (.0)
>> 3 FOR_ITER 11 (to 17)
6 STORE_FAST 1 (i)
9 LOAD_FAST 1 (i)
12 YIELD_VALUE
13 POP_TOP
14 JUMP_ABSOLUTE 3
>> 17 LOAD_CONST 0 (None)
20 RETURN_VALUE
列表理解中的yield
与生成器表达式中的yield
之间的差异源于这两个表达式的实现方式的差异。在Python3中,列表理解使用list\u APPEND
调用将堆栈顶部添加到正在构建的列表中,而生成器表达式则生成该值。添加(yield)
只需将另一个yield\u值添加到以下任一操作码:
>>> dis.dis(compile("[(yield i) for i in range(3)]", '', 'exec').co_consts[0])
1 0 BUILD_LIST 0
3 LOAD_FAST 0 (.0)
>> 6 FOR_ITER 13 (to 22)
9 STORE_FAST 1 (i)
12 LOAD_FAST 1 (i)
15 YIELD_VALUE
16 LIST_APPEND 2
19 JUMP_ABSOLUTE 6
>> 22 RETURN_VALUE
>>> dis.dis(compile("((yield i) for i in range(3))", '', 'exec').co_consts[0])
1 0 LOAD_FAST 0 (.0)
>> 3 FOR_ITER 12 (to 18)
6 STORE_FAST 1 (i)
9 LOAD_FAST 1 (i)
12 YIELD_VALUE
13 YIELD_VALUE
14 POP_TOP
15 JUMP_ABSOLUTE 3
>> 18 LOAD_CONST 0 (None)
21 RETURN_VALUE
字节码索引15和12处的YIELD_值
操作码是额外的,就像是巢中的布谷鸟。因此,对于列表生成器,每次有1个yield生成堆栈顶部(将堆栈顶部替换为yield
返回值),对于生成器表达式变量,您生成堆栈顶部(整数),然后再次生成,但是现在堆栈包含yield
的返回值,第二次得到None
对于列表理解,仍然返回预期的list
对象输出,但Python 3将其视为生成器,因此返回值作为值
属性附加到:
>>> from itertools import islice
>>> listgen = [(yield i) for i in range(3)]
>>> list(islice(listgen, 3)) # avoid exhausting the generator
[0, 1, 2]
>>> try:
... next(listgen)
... except StopIteration as si:
... print(si.value)
...
[None, None, None]
那些None
对象是yield
表达式的返回值
并再次重申,;同样的问题也适用于Python2和Python3中的字典和集合理解;在Python 2中,yield
返回值仍然添加到预期的字典或set对象中,并且返回值最后“yield”而不是附加到StopIteration
异常:
>>> list({(yield k): (yield v) for k, v in {'foo': 'bar', 'spam': 'eggs'}.items()})
['bar', 'foo', 'eggs', 'spam', {None: None}]
>>> list({(yield i) for i in range(3)})
[0, 1, 2, set([None])]
注意:这是Python在处理理解和生成器表达式中的yield
时的一个错误,在Python3.8中修复,在Python3.7中有一个弃用警告。请参阅和的和的新增条目
生成器表达式以及set和dict理解被编译为(生成器)函数对象。在Python3中,列表理解得到相同的处理;本质上,它们都是一个新的嵌套范围
如果尝试反汇编生成器表达式,则可以看到:
>>> dis.dis(compile("(i for i in range(3))", '', 'exec'))
1 0 LOAD_CONST 0 (<code object <genexpr> at 0x10f7530c0, file "", line 1>)
3 LOAD_CONST 1 ('<genexpr>')
6 MAKE_FUNCTION 0
9 LOAD_NAME 0 (range)
12 LOAD_CONST 2 (3)
15 CALL_FUNCTION 1 (1 positional, 0 keyword pair)
18 GET_ITER
19 CALL_FUNCTION 1 (1 positional, 0 keyword pair)
22 POP_TOP
23 LOAD_CONST 3 (None)
26 RETURN_VALUE
>>> dis.dis(compile("(i for i in range(3))", '', 'exec').co_consts[0])
1 0 LOAD_FAST 0 (.0)
>> 3 FOR_ITER 11 (to 17)
6 STORE_FAST 1 (i)
9 LOAD_FAST 1 (i)
12 YIELD_VALUE
13 POP_TOP
14 JUMP_ABSOLUTE 3
>> 17 LOAD_CONST 0 (None)
20 RETURN_VALUE
列表理解中的yield
与生成器表达式中的yield
之间的差异源于这两个表达式的实现方式的差异。在Python3中,列表理解使用list\u APPEND
调用将堆栈顶部添加到正在构建的列表中,而生成器表达式则生成该值。添加(yield)
只需将另一个yield\u值添加到以下任一操作码:
>>> dis.dis(compile("[(yield i) for i in range(3)]", '', 'exec').co_consts[0])
1 0 BUILD_LIST 0
3 LOAD_FAST 0 (.0)
>> 6 FOR_ITER 13 (to 22)
9 STORE_FAST 1 (i)
12 LOAD_FAST 1 (i)
15 YIELD_VALUE
16 LIST_APPEND 2
19 JUMP_ABSOLUTE 6
>> 22 RETURN_VALUE
>>> dis.dis(compile("((yield i) for i in range(3))", '', 'exec').co_consts[0])
1 0 LOAD_FAST 0 (.0)
>> 3 FOR_ITER 12 (to 18)
6 STORE_FAST 1 (i)
9 LOAD_FAST 1 (i)
12 YIELD_VALUE
13 YIELD_VALUE
14 POP_TOP
15 JUMP_ABSOLUTE 3
>> 18 LOAD_CONST 0 (None)
21 RETURN_VALUE
字节码索引15和12处的YIELD_值
操作码是额外的,就像是巢中的布谷鸟。因此,对于列表生成器,每次有1个yield生成堆栈顶部(将堆栈顶部替换为yield
返回值),对于生成器表达式变量,您生成堆栈顶部(整数),然后再次生成,但是现在堆栈包含yield
的返回值,第二次得到None
对于列表理解,仍然返回预期的list
对象输出,但Python 3将其视为生成器,因此返回值作为值
属性附加到:
>>> from itertools import islice
>>> listgen = [(yield i) for i in range(3)]
>>> list(islice(listgen, 3)) # avoid exhausting the generator
[0, 1, 2]
>>> try:
... next(listgen)
... except StopIteration as si:
... print(si.value)
...
[None, None, None]
那些None
对象是yield
表达式的返回值
并再次重申,;同样的问题也适用于Python2和Python3中的字典和集合理解;在Python 2中,yield
返回值仍然添加到预期的字典或set对象中,并且返回值最后“yield”而不是附加到StopIteration
异常:
>>> list({(yield k): (yield v) for k, v in {'foo': 'bar', 'spam': 'eggs'}.items()})
['bar', 'foo', 'eggs', 'spam', {None: None}]
>>> list({(yield i) for i in range(3)})
[0, 1, 2, set([None])]
请注意,根据语言规范,yield atom
允许在表达式中(在生成器函数中)使用。如果yield-atom
被错误地实现了,那么问题就更大了。@skyking:我就是这么说的;语法允许这样做。我提到的错误是试图在生成器函数中使用yield
作为生成器表达式的一部分,期望yield
应用于生成器函数,而不是生成器表达式嵌套的scope.Wow。信息量确实很大。因此,如果我理解正确,就会发生以下情况:一个同时包含yield
和return
的函数,如文档所述,应该成为一个生成器函数,其return
ed值应该位于StopIteration