Python 生成器理解表达式之间的差异_Python_Generator_Generator Expression

Python 生成器理解表达式之间的差异

python

Python 生成器理解表达式之间的差异,python,generator,generator-expression,Python,Generator,Generator Expression,据我所知，有三种方法可以通过理解1创建生成器经典的一个： def f1(): g = (i for i in range(10)) 产量变量： def f2(): g = [(yield i) for i in range(10)] 来自变量的收益（除了函数内部之外，它会引发一个SyntaxError）：这三种变体导致不同的字节码，这并不奇怪。第一个是最好的，这似乎是合乎逻辑的，因为它是通过理解创建生成器的专用、简单的语法。然而，它并不是产生最短字节码的那个在Pyt

据我所知，有三种方法可以通过理解1创建生成器

经典的一个：

def f1():
    g = (i for i in range(10))

产量

变量：

def f2():
    g = [(yield i) for i in range(10)]

来自变量的

收益（除了函数内部之外，它会引发一个SyntaxError
）：
这三种变体导致不同的字节码，这并不奇怪。
第一个是最好的，这似乎是合乎逻辑的，因为它是通过理解创建生成器的专用、简单的语法。
然而，它并不是产生最短字节码的那个
在Python3.6中进行反汇编
经典生成器理解
>>> dis.dis(f1)
4           0 LOAD_CONST               1 (<code object <genexpr> at...>)
            2 LOAD_CONST               2 ('f1.<locals>.<genexpr>')
            4 MAKE_FUNCTION            0
            6 LOAD_GLOBAL              0 (range)
            8 LOAD_CONST               3 (10)
           10 CALL_FUNCTION            1
           12 GET_ITER
           14 CALL_FUNCTION            1
           16 STORE_FAST               0 (g)

5          18 LOAD_FAST                0 (g)
           20 RETURN_VALUE

从
变体中获得收益
>>> dis.dis(f2)
8           0 LOAD_CONST               1 (<code object <listcomp> at...>)
            2 LOAD_CONST               2 ('f2.<locals>.<listcomp>')
            4 MAKE_FUNCTION            0
            6 LOAD_GLOBAL              0 (range)
            8 LOAD_CONST               3 (10)
           10 CALL_FUNCTION            1
           12 GET_ITER
           14 CALL_FUNCTION            1
           16 STORE_FAST               0 (g)

9          18 LOAD_FAST                0 (g)
           20 RETURN_VALUE

>>> dis.dis(f3)
12           0 LOAD_GLOBAL              0 (range)
             2 LOAD_CONST               1 (10)
             4 CALL_FUNCTION            1
             6 GET_YIELD_FROM_ITER
             8 LOAD_CONST               0 (None)
            10 YIELD_FROM
            12 BUILD_LIST               1
            14 STORE_FAST               0 (g)

13          16 LOAD_FAST                0 (g)
            18 RETURN_VALUE
        


此外，一个timeit
比较表明，

变体的

收益率是最快的（仍然使用Python 3.6运行）：
f3
的速度大约是f1
和f2
的2.7倍
正如Leon在评论中提到的那样，发电机的效率最好通过其可迭代的速度来衡量。
所以我改变了这三个函数，让它们在生成器上迭代，然后调用一个伪函数
def f():
    pass

def fn():
    g = ...
    for _ in g:
        f()

结果更加明显：
>>> timeit(f1)
1.6017412817975778

>>> timeit(f2)
1.778684261368946

>>> timeit(f3)
0.1960603619517669

f3
现在是f1
的8.4倍，是f2
的9.3倍
注意：如果iterable不是范围（10）
而是静态iterable，例如[0,1,2,3,4,5]，则结果大致相同。
因此，速度的差异与范围的优化无关

那么，这三种方式的区别是什么？
更具体地说，来自
变量的

收益率与另外两个变量之间有什么区别

这是正常的行为吗？自然结构

（elt为elt中的elt）

比复杂的

[（从中产生）]

慢吗？从现在起，我应该在所有脚本中用后者替换前者，还是使用

从构造中产生的有任何缺点

编辑
这一切都是相关的，所以我不想提出一个新问题，但这越来越奇怪了。
我试着比较范围（10）
和[（范围（10）的收益率）]

所以。现在，迭代[（范围（10）的收益率]
的速度是迭代裸范围（10）
的186倍
您如何解释为什么迭代[（范围（10）的收益率]
比迭代范围（10）
快得多

1：对于怀疑论者，下面的三个表达式确实生成了一个生成器
对象；尝试调用键入
此构造累积通过其send（）
方法传回生成器的数据，并在迭代结束时通过StopIteration
异常返回该数据1：
好的，send（）
对生成器不起作用yield
ingfrom
range（）
，但让我们至少看看迭代结束时的情况：
>>> g = f()
>>> next(g)
0
>>> next(g)
1
>>> next(g)
2
>>> next(g)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration: [None]
>>> #          ^^^^^^

>>> g = [(yield i) for i in range(3)]
>>> next(g)
0
>>> next(g)
1
>>> next(g)
2
>>> next(g)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration: [None, None, None]


更新
关于三种变体之间的性能差异<代码>从
产生的收益优于其他两种，因为它消除了一定程度的间接性（据我所知，这是引入
产生收益的两个主要原因之一）。然而，在这个特定的例子中，从
产生的收益本身是多余的-g=[（从范围（10）产生的收益）]
实际上几乎与g=range（10）
完全相同，这可能不会像你认为的那样
def f2():
    for i in [(yield from range(10))]:
        print(i)

叫它：
>>> def f2():
...     for i in [(yield from range(10))]:
...         print(i)
...
>>> f2() #Doesn't print.
<generator object f2 at 0x02C0DF00>
>>> set(f2()) #Prints `None`, because `(yield from range(10))` evaluates to `None`.
None
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}

>>def f2（）：
...     对于i in[（范围（10）的收益率]：
...         印刷品（一）
...
>>>f2（）#不打印。
>>>set（f2（））#打印'None'，因为`（范围（10）的产量）`计算结果为'None'。
没有一个
{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}

由于
产生的收益不在理解范围内，因此它被绑定到f2
函数而不是隐式函数，从而将f2
转化为生成函数
def f():
    pass

def fn():
    g = ...
    for _ in g:
        f()


我记得看到有人指出它实际上不是在迭代，但我不记得在哪里看到的。当我重新发现这一点时，我正在自己测试代码。我在搜索中没有找到来源，也没有找到。如果有人找到了来源，请告诉我或将其添加到帖子本身，这样就可以将其记入贷方。
这是您应该做的：
g = (i for i in range(10))

这是一个生成器表达式。相当于
def temp(outer):
    for i in outer:
        yield i
g = temp(range(10))

def temp(outer):
    l = []
    for i in outer:
        l.append((yield i))
    return l
g = temp(range(10))

def f():
    temp = []
    for i in range(10):
        temp.append((yield i))
    g = temp

但是，如果您只是想要一个包含范围（10）
元素的iterable，您可以这样做
g = range(10)

您不需要将这些内容包装到函数中
def f():
    pass

def fn():
    g = ...
    for _ in g:
        f()

如果您在这里学习编写什么代码，您可以停止阅读。这篇文章的其余部分是一篇冗长的技术性解释，解释了为什么其他代码片段被破坏，不应该使用，包括解释了为什么计时也被破坏

这：
是一个多年前就应该拆除的破建筑。问题解决8年后，解决问题的过程是。不要这样做
虽然它仍然在语言中，但在Python3上，它相当于
def temp(outer):
    for i in outer:
        yield i
g = temp(range(10))

def temp(outer):
    l = []
    for i in outer:
        l.append((yield i))
    return l
g = temp(range(10))

def f():
    temp = []
    for i in range(10):
        temp.append((yield i))
    g = temp

列表理解应该返回列表，但由于的收益率
，这个不能返回列表。它的行为有点像生成器表达式，它生成的内容与第一个代码片段相同，但它构建了一个不必要的列表，并将其附加到最后提出的StopIteration

>>> g = [(yield i) for i in range(10)]
>>> [next(g) for i in range(10)]
[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
>>> next(g)
Traceback (most recent call last):
  File "<stdin>", line 1, in <module>
StopIteration: [None, None, None, None, None, None, None, None, None, None]

相当于
def temp(outer):
    for i in outer:
        yield i
g = temp(range(10))

def temp(outer):
    l = []
    for i in outer:
        l.append((yield i))
    return l
g = temp(range(10))

def f():
    temp = []
    for i in range(10):
        temp.append((yield i))
    g = temp

在中创建基于生成器的协同程序。再说一次，如果你的目标是得到一个生成器，你就浪费了很多时间来建立一个毫无意义的列表

这：
这是愚蠢的，但这次没有任何责任在Python身上
这里根本没有理解力或基因。括号不是一个列表；所有的工作
def f():
    temp = []
    for i in range(10):
        temp.append((yield i))
    g = temp

g = [(yield from range(10))]

def f3():
    g = [(yield from range(10))]

def f3():
    yield from range(10)

def f3():
    for i in range(10):
        yield i

def f4():
    g = f3()