Python 为了可读性和避免代码行过长，我们将使用多行： from typing import List, Any def slice_baskets(items: List[Any], maxbaskets: int) -> List[List[Any]]: n_baskets = min(maxbaskets, len(items)) return [items[i::n_baskets] for i in range(n_baskets)]_Python_List_Split_Chunks

Python 为了可读性和避免代码行过长，我们将使用多行： from typing import List, Any def slice_baskets(items: List[Any], maxbaskets: int) -> List[List[Any]]: n_baskets = min(maxbaskets, len(items)) return [items[i::n_baskets] for i in range(n_baskets)]

python list

Python 为了可读性和避免代码行过长，我们将使用多行： from typing import List, Any def slice_baskets(items: List[Any], maxbaskets: int) -> List[List[Any]]: n_baskets = min(maxbaskets, len(items)) return [items[i::n_baskets] for i in range(n_baskets)],python,list,split,chunks,Python,List,Split,Chunks,itertools模块中的islice将提供一种惰性迭代方法，就像问题中最初要求的那样我并不期望大多数用例都能受益匪浅，因为原始数据已经在列表中完全具体化了，但是对于大型数据集，它可以节省近一半的内存使用从itertools导入islice 从输入导入列表，任意，生成器 def收益率（项目：列表[Any]，maxbaskets:int）->生成器[List[Any]，None，None]： n_篮=最小值（最大篮数、长度（项目））对于范围内的i（n_篮）：产量岛（项目、i、无、n_篮子）

itertools模块中的islice将提供一种惰性迭代方法，就像问题中最初要求的那样

我并不期望大多数用例都能受益匪浅，因为原始数据已经在列表中完全具体化了，但是对于大型数据集，它可以节省近一半的内存使用

从itertools导入islice
从输入导入列表，任意，生成器
def收益率（项目：列表[Any]，maxbaskets:int）->生成器[List[Any]，None，None]：
n_篮=最小值（最大篮数、长度（项目））
对于范围内的i（n_篮）：
产量岛（项目、i、无、n_篮子）

使用以下工具查看结果：

from pprint import pprint

items = list(range(10, 75))
pprint(cycle_baskets(items, 10))
pprint(slice_baskets(items, 10))
pprint([list(s) for s in yield_islice_baskets(items, 10)])

更新以前的解决方案这是另一个平衡的解决方案，根据我过去在生产中使用的函数改编，它使用模运算符：

def baskets_from(items, maxbaskets=25):
    baskets = [[] for _ in range(maxbaskets)]
    for i, item in enumerate(items):
        baskets[i % maxbaskets].append(item)
    return filter(None, baskets)

我创建了一个生成器，如果你把它放到一个列表中，它也会这样做：

def iter_baskets_from(items, maxbaskets=3):
    '''generates evenly balanced baskets from indexable iterable'''
    item_count = len(items)
    baskets = min(item_count, maxbaskets)
    for x_i in range(baskets):
        yield [items[y_i] for y_i in range(x_i, item_count, baskets)]

最后，由于我看到上述所有函数都以连续顺序返回元素（如给定的）：

打印出：

[[0], [1], [2], [3], [4], [5]]
[[0], [1], [2], [3], [4], [5]]
[[0], [1], [2], [3], [4], [5]]
[[0, 8, 16], [1, 9, 17], [2, 10, 18], [3, 11, 19], [4, 12, 20], [5, 13, 21], [6, 14], [7, 15]]
[[0, 8, 16], [1, 9, 17], [2, 10, 18], [3, 11, 19], [4, 12, 20], [5, 13, 21], [6, 14], [7, 15]]
[[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 10, 11], [12, 13, 14], [15, 16, 17], [18, 19], [20, 21]]
[['A', 'D', 'G'], ['B', 'E'], ['C', 'F']]
[['A', 'D', 'G'], ['B', 'E'], ['C', 'F']]
[['A', 'B', 'C'], ['D', 'E'], ['F', 'G']]
[[0, 5, 10, 15, 20, 25], [1, 6, 11, 16, 21], [2, 7, 12, 17, 22], [3, 8, 13, 18, 23], [4, 9, 14, 19, 24]]
[[0, 5, 10, 15, 20, 25], [1, 6, 11, 16, 21], [2, 7, 12, 17, 22], [3, 8, 13, 18, 23], [4, 9, 14, 19, 24]]
[[0, 1, 2, 3, 4, 5], [6, 7, 8, 9, 10], [11, 12, 13, 14, 15], [16, 17, 18, 19, 20], [21, 22, 23, 24, 25]]

请注意，连续生成器提供与其他两个相同长度模式的块，但这些项都是有序的，并且它们被均匀地划分，就像人们可以划分离散元素列表一样。

我很惊讶没有人想到使用

iter

：

演示：

这与任何iterable一起工作，并缓慢地生成输出。它返回元组而不是迭代器，但我认为它仍然有一定的优雅。它也没有垫；如果需要填充，只需对上述内容进行简单修改即可：

from itertools import islice, chain, repeat

def chunk_pad(it, size, padval=None):
    it = chain(iter(it), repeat(padval))
    return iter(lambda: tuple(islice(it, size)), (padval,) * size)

演示：

与基于

izip_

的解决方案一样，上述解决方案也始终有效。据我所知，没有一个一行或两行的itertools方法可以实现一个可选的pad函数。通过结合上述两种方法，这一方法非常接近：

_no_padding = object()

def chunk(it, size, padval=_no_padding):
    if padval == _no_padding:
        it = iter(it)
        sentinel = ()
    else:
        it = chain(iter(it), repeat(padval))
        sentinel = (padval,) * size
    return iter(lambda: tuple(islice(it, size)), sentinel)

演示：

我相信这是最短的chunker，它提供了可选的填充

正如Tomasz Gandor所说，如果两个填充块遇到一长串填充值，它们将意外停止。以下是以合理方式解决该问题的最终变化：

_no_padding = object()
def chunk(it, size, padval=_no_padding):
    it = iter(it)
    chunker = iter(lambda: tuple(islice(it, size)), ())
    if padval == _no_padding:
        yield from chunker
    else:
        for ch in chunker:
            yield ch if len(ch) == size else ch + (padval,) * (size - len(ch))

演示：

另一个更明确的版本

def chunkList(initialList, chunkSize):
    """
    This function chunks a list into sub lists 
    that have a length equals to chunkSize.

    Example:
    lst = [3, 4, 9, 7, 1, 1, 2, 3]
    print(chunkList(lst, 3)) 
    returns
    [[3, 4, 9], [7, 1, 1], [2, 3]]
    """
    finalList = []
    for i in range(0, len(initialList), chunkSize):
        finalList.append(initialList[i:i+chunkSize])
    return finalList

我从这个问题的答案中看到了最棒的Python式回答：

from itertools import zip_longest

a = range(1, 16)
i = iter(a)
r = list(zip_longest(i, i, i))
>>> print(r)
[(1, 2, 3), (4, 5, 6), (7, 8, 9), (10, 11, 12), (13, 14, 15)]

您可以为任意n个元素创建n元组。如果

a=范围（1,15）

，则结果将为：

[(1, 2, 3), (4, 5, 6), (7, 8, 9), (10, 11, 12), (13, 14, None)]

如果列表被平均分割，则可以将

zip\u longest

替换为

zip

，否则三元组

（13，14，None）

将丢失。上面使用了Python 3。对于Python 2，使用

izip\u longest

代码：

def split_list(the_list, chunk_size):
    result_list = []
    while the_list:
        result_list.append(the_list[:chunk_size])
        the_list = the_list[chunk_size:]
    return result_list

a_list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

print split_list(a_list, 3)

结果:

[[1, 2, 3], [4, 5, 6], [7, 8, 9], [10]]

在这一点上，我认为我们需要一个递归生成器，以防万一

在python 2中：

def chunks(li, n):
    if li == []:
        return
    yield li[:n]
    for e in chunks(li[n:], n):
        yield e

在python 3中：

def chunks(li, n):
    if li == []:
        return
    yield li[:n]
    yield from chunks(li[n:], n)

此外，在大规模外星入侵的情况下，装饰的递归生成器可能会变得很方便：

def dec(gen): def new_gen(li, n): for e in gen(li, n): if e == []: return yield e return new_gen @dec def chunks(li, n): yield li[:n] for e in chunks(li[n:], n): yield e
其中AA是数组，SS是块大小。例如：

import matplotlib.cbook as cbook segments = cbook.pieces(np.arange(20), 3) for s in segments: print s

>>> AA=range(10,21);SS=3 >>> [AA[i:i+SS] for i in range(len(AA))[::SS]] [[10, 11, 12], [13, 14, 15], [16, 17, 18], [19, 20]] # or [range(10, 13), range(13, 16), range(16, 19), range(19, 21)] in py3

因为这里的每个人都在谈论迭代器。有一个完美的方法，叫做
输出：

[[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10], [11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21], [22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32], [33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43], [44, 45, 46, 47, 48, 49]]
但是，如果您不想对内存发号施令，您可以使用旧方法，首先使用存储完整的
列表。您还可以使用库的功能作为： >>> from utilspie import iterutils >>> a = [1, 2, 3, 4, 5, 6, 7, 8, 9] >>> list(iterutils.get_chunks(a, 5)) [[1, 2, 3, 4, 5], [6, 7, 8, 9]] 您可以通过pip安装：免责声明：我是库的创建者。我对不同方法的性能感到好奇，这里是：在Python 3.5.1上测试 import time batch_size = 7 arr_len = 298937 #---------slice------------- print("\r\nslice") start = time.time() arr = [i for i in range(0, arr_len)] while True: if not arr: break tmp = arr[0:batch_size] arr = arr[batch_size:-1] print(time.time() - start) #-----------index----------- print("\r\nindex") arr = [i for i in range(0, arr_len)] start = time.time() for i in range(0, round(len(arr) / batch_size + 1)): tmp = arr[batch_size * i : batch_size * (i + 1)] print(time.time() - start) #----------batches 1------------ def batch(iterable, n=1): l = len(iterable) for ndx in range(0, l, n): yield iterable[ndx:min(ndx + n, l)] print("\r\nbatches 1") arr = [i for i in range(0, arr_len)] start = time.time() for x in batch(arr, batch_size): tmp = x print(time.time() - start) #----------batches 2------------ from itertools import islice, chain def batch(iterable, size): sourceiter = iter(iterable) while True: batchiter = islice(sourceiter, size) yield chain([next(batchiter)], batchiter) print("\r\nbatches 2") arr = [i for i in range(0, arr_len)] start = time.time() for x in batch(arr, batch_size): tmp = x print(time.time() - start) #---------chunks------------- def chunks(l, n): """Yield successive n-sized chunks from l.""" for i in range(0, len(l), n): yield l[i:i + n] print("\r\nchunks") arr = [i for i in range(0, arr_len)] start = time.time() for x in chunks(arr, batch_size): tmp = x print(time.time() - start) #-----------grouper----------- from itertools import zip_longest # for Python 3.x #from six.moves import zip_longest # for both (uses the six compat library) def grouper(iterable, n, padvalue=None): "grouper(3, 'abcdefg', 'x') --> ('a','b','c'), ('d','e','f'), ('g','x','x')" return zip_longest(*[iter(iterable)]*n, fillvalue=padvalue) arr = [i for i in range(0, arr_len)] print("\r\ngrouper") start = time.time() for x in grouper(arr, batch_size): tmp = x print(time.time() - start) 结果： slice 31.18285083770752 index 0.02184295654296875 batches 1 0.03503894805908203 batches 2 0.22681021690368652 chunks 0.019841909408569336 grouper 0.006506919860839844 以下是其他方法的列表：给定的 import itertools as it import collections as ct import more_itertools as mit iterable = range(11) n = 3 代码标准图书馆 + 参考资料（，）（有序结果需要Python 3.6+）（有序结果需要Python 3.6+）（）（）（另见，） +实现和更多功能的第三方库<代码>>pip安装更多itertools
在Python 3.8中，它变得非常好：

导入itertools def批次（可选，大小）： it=国际热核实验堆（iter） while item:=列表（itertools.islice（it，size））：收益项目
这适用于任意iterable，而不仅仅是列表
导入pprint >>>pprint.pprint（列表（批次范围（75），10））） [[0, 1, 2, 3, 4, 5, 6, 7, 8, 9], [10, 11, 12, 13, 14, 15, 16, 17, 18, 19], [20, 21, 22, 23, 24, 25, 26, 27, 28, 29], [30, 31, 32, 33, 34, 35, 36, 37, 38, 39], [40, 41, 42, 43, 44, 45, 46, 47, 48, 49], [50, 51, 52, 53, 54, 55, 56, 57, 58, 59], [60, 61, 62, 63, 64, 65, 66, 67, 68, 69], [70, 71, 72, 73, 74]]
如果我们不能说出列表的长度会发生什么？在itertools上试试这个。重复（[1,2,3]），例如，这是对问题的有趣扩展，但原始问题明确提出了关于在列表上操作的问题。这个函数需要符合该死的标准library@Calimo你有什么建议？我给你一个包含47个元素的列表。您希望如何将其拆分为“大小均匀的块”？OP接受了答案，因此他们显然对最后一个大小不同的区块没有意见。也许英语短语不精确？大多数人会将其视为批处理和速率限制，因此最后一个块是否较小通常并不重要。请使用“def chunk”而不是“chunk=lambda”。它的工作原理是一样的。一行。同样的特征。更容易让n00bz阅读和理解。@S.Lott：如果n00bz来自scheme:P，则不会。这不是一个真正的问题。谷歌甚至还有一个关键词！为了n00bz，我们还避免了哪些其他功能？我猜yield也不是必需的/c-like，不足以对n00b友好。由
def chunk
而不是
chunk=lambda
生成的函数对象具有属性“chunk”而不是“”。特定名称在回溯中更有用。@Alfe:我不确定是否可以称为主语义dif
zip(*[iterable[i::3] for i in range(3)])

import matplotlib.cbook as cbook segments = cbook.pieces(np.arange(20), 3) for s in segments: print s

def chunks(iterable,n): """assumes n is an integer>0 """ iterable=iter(iterable) while True: result=[] for i in range(n): try: a=next(iterable) except StopIteration: break else: result.append(a) if result: yield result else: break g1=(i*i for i in range(10)) g2=chunks(g1,3) print g2 '<generator object chunks at 0x0337B9B8>' print list(g2) '[[0, 1, 4], [9, 16, 25], [36, 49, 64], [81]]'

>>> orange = range(1, 1001) >>> otuples = list( zip(*[iter(orange)]*10)) >>> print(otuples) [(1, 2, 3, 4, 5, 6, 7, 8, 9, 10), ... (991, 992, 993, 994, 995, 996, 997, 998, 999, 1000)] >>> olist = [list(i) for i in otuples] >>> print(olist) [[1, 2, 3, 4, 5, 6, 7, 8, 9, 10], ..., [991, 992, 993, 994, 995, 996, 997, 998, 999, 1000]] >>>

import numpy as np lst = range(50) np.array_split(lst, 5) # [array([0, 1, 2, 3, 4, 5, 6, 7, 8, 9]), # array([10, 11, 12, 13, 14, 15, 16, 17, 18, 19]), # array([20, 21, 22, 23, 24, 25, 26, 27, 28, 29]), # array([30, 31, 32, 33, 34, 35, 36, 37, 38, 39]), # array([40, 41, 42, 43, 44, 45, 46, 47, 48, 49])]

from itertools import islice def chunks(n, iterable): iterable = iter(iterable) while True: yield tuple(islice(iterable, n)) or iterable.next()

from itertools import chain, islice def chunks(n, iterable): iterable = iter(iterable) while True: yield chain([next(iterable)], islice(iterable, n-1))

from toolz.itertoolz.core import partition list(partition(2, [1, 2, 3, 4])) [(1, 2), (3, 4)]

>>> import statistics >>> statistics.variance([5,5,5,5,1]) 3.2 >>> statistics.variance([5,4,4,4,4]) 0.19999999999999998

[60, 61, 62, 63, 64, 65, 66, 67, 68, 69], [70, 71, 72, 73, 74]]

baskets = [[] for _ in range(number_of_baskets)]

for element, basket in zip(items, cycle(baskets)): basket.append(element)

>>> from pprint import pprint >>> pprint(baskets) [[10, 20, 30, 40, 50, 60, 70], [11, 21, 31, 41, 51, 61, 71], [12, 22, 32, 42, 52, 62, 72], [13, 23, 33, 43, 53, 63, 73], [14, 24, 34, 44, 54, 64, 74], [15, 25, 35, 45, 55, 65], [16, 26, 36, 46, 56, 66], [17, 27, 37, 47, 57, 67], [18, 28, 38, 48, 58, 68], [19, 29, 39, 49, 59, 69]]

from itertools import cycle from typing import List, Any def cycle_baskets(items: List[Any], maxbaskets: int) -> List[List[Any]]: baskets = [[] for _ in range(min(maxbaskets, len(items)))] for item, basket in zip(items, cycle(baskets)): basket.append(item) return baskets

start = 0 stop = None step = number_of_baskets first_basket = items[start:stop:step]

from typing import List, Any def slice_baskets(items: List[Any], maxbaskets: int) -> List[List[Any]]: n_baskets = min(maxbaskets, len(items)) return [items[i::n_baskets] for i in range(n_baskets)]

from pprint import pprint items = list(range(10, 75)) pprint(cycle_baskets(items, 10)) pprint(slice_baskets(items, 10)) pprint([list(s) for s in yield_islice_baskets(items, 10)])

def baskets_from(items, maxbaskets=25): baskets = [[] for _ in range(maxbaskets)] for i, item in enumerate(items): baskets[i % maxbaskets].append(item) return filter(None, baskets)

def iter_baskets_from(items, maxbaskets=3): '''generates evenly balanced baskets from indexable iterable''' item_count = len(items) baskets = min(item_count, maxbaskets) for x_i in range(baskets): yield [items[y_i] for y_i in range(x_i, item_count, baskets)]

def iter_baskets_contiguous(items, maxbaskets=3, item_count=None): ''' generates balanced baskets from iterable, contiguous contents provide item_count if providing a iterator that doesn't support len() ''' item_count = item_count or len(items) baskets = min(item_count, maxbaskets) items = iter(items) floor = item_count // baskets ceiling = floor + 1 stepdown = item_count % baskets for x_i in range(baskets): length = ceiling if x_i < stepdown else floor yield [items.next() for _ in range(length)]

print(baskets_from(range(6), 8)) print(list(iter_baskets_from(range(6), 8))) print(list(iter_baskets_contiguous(range(6), 8))) print(baskets_from(range(22), 8)) print(list(iter_baskets_from(range(22), 8))) print(list(iter_baskets_contiguous(range(22), 8))) print(baskets_from('ABCDEFG', 3)) print(list(iter_baskets_from('ABCDEFG', 3))) print(list(iter_baskets_contiguous('ABCDEFG', 3))) print(baskets_from(range(26), 5)) print(list(iter_baskets_from(range(26), 5))) print(list(iter_baskets_contiguous(range(26), 5)))

[[0], [1], [2], [3], [4], [5]] [[0], [1], [2], [3], [4], [5]] [[0], [1], [2], [3], [4], [5]] [[0, 8, 16], [1, 9, 17], [2, 10, 18], [3, 11, 19], [4, 12, 20], [5, 13, 21], [6, 14], [7, 15]] [[0, 8, 16], [1, 9, 17], [2, 10, 18], [3, 11, 19], [4, 12, 20], [5, 13, 21], [6, 14], [7, 15]] [[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 10, 11], [12, 13, 14], [15, 16, 17], [18, 19], [20, 21]] [['A', 'D', 'G'], ['B', 'E'], ['C', 'F']] [['A', 'D', 'G'], ['B', 'E'], ['C', 'F']] [['A', 'B', 'C'], ['D', 'E'], ['F', 'G']] [[0, 5, 10, 15, 20, 25], [1, 6, 11, 16, 21], [2, 7, 12, 17, 22], [3, 8, 13, 18, 23], [4, 9, 14, 19, 24]] [[0, 5, 10, 15, 20, 25], [1, 6, 11, 16, 21], [2, 7, 12, 17, 22], [3, 8, 13, 18, 23], [4, 9, 14, 19, 24]] [[0, 1, 2, 3, 4, 5], [6, 7, 8, 9, 10], [11, 12, 13, 14, 15], [16, 17, 18, 19, 20], [21, 22, 23, 24, 25]]

from itertools import islice def chunk(it, size): it = iter(it) return iter(lambda: tuple(islice(it, size)), ())

>>> list(chunk(range(14), 3)) [(0, 1, 2), (3, 4, 5), (6, 7, 8), (9, 10, 11), (12, 13)]

from itertools import islice, chain, repeat def chunk_pad(it, size, padval=None): it = chain(iter(it), repeat(padval)) return iter(lambda: tuple(islice(it, size)), (padval,) * size)

>>> list(chunk_pad(range(14), 3)) [(0, 1, 2), (3, 4, 5), (6, 7, 8), (9, 10, 11), (12, 13, None)] >>> list(chunk_pad(range(14), 3, 'a')) [(0, 1, 2), (3, 4, 5), (6, 7, 8), (9, 10, 11), (12, 13, 'a')]

_no_padding = object() def chunk(it, size, padval=_no_padding): if padval == _no_padding: it = iter(it) sentinel = () else: it = chain(iter(it), repeat(padval)) sentinel = (padval,) * size return iter(lambda: tuple(islice(it, size)), sentinel)

>>> list(chunk(range(14), 3)) [(0, 1, 2), (3, 4, 5), (6, 7, 8), (9, 10, 11), (12, 13)] >>> list(chunk(range(14), 3, None)) [(0, 1, 2), (3, 4, 5), (6, 7, 8), (9, 10, 11), (12, 13, None)] >>> list(chunk(range(14), 3, 'a')) [(0, 1, 2), (3, 4, 5), (6, 7, 8), (9, 10, 11), (12, 13, 'a')]

_no_padding = object() def chunk(it, size, padval=_no_padding): it = iter(it) chunker = iter(lambda: tuple(islice(it, size)), ()) if padval == _no_padding: yield from chunker else: for ch in chunker: yield ch if len(ch) == size else ch + (padval,) * (size - len(ch))

>>> list(chunk([1, 2, (), (), 5], 2)) [(1, 2), ((), ()), (5,)] >>> list(chunk([1, 2, None, None, 5], 2, None)) [(1, 2), (None, None), (5, None)]

def chunkList(initialList, chunkSize): """ This function chunks a list into sub lists that have a length equals to chunkSize. Example: lst = [3, 4, 9, 7, 1, 1, 2, 3] print(chunkList(lst, 3)) returns [[3, 4, 9], [7, 1, 1], [2, 3]] """ finalList = [] for i in range(0, len(initialList), chunkSize): finalList.append(initialList[i:i+chunkSize]) return finalList

from itertools import zip_longest a = range(1, 16) i = iter(a) r = list(zip_longest(i, i, i)) >>> print(r) [(1, 2, 3), (4, 5, 6), (7, 8, 9), (10, 11, 12), (13, 14, 15)]

[(1, 2, 3), (4, 5, 6), (7, 8, 9), (10, 11, 12), (13, 14, None)]

def split_list(the_list, chunk_size): result_list = [] while the_list: result_list.append(the_list[:chunk_size]) the_list = the_list[chunk_size:] return result_list a_list = [1, 2, 3, 4, 5, 6, 7, 8, 9, 10] print split_list(a_list, 3)

[[1, 2, 3], [4, 5, 6], [7, 8, 9], [10]]

a = [1, 2, 3, 4, 5, 6, 7, 8, 9] CHUNK = 4 [a[i*CHUNK:(i+1)*CHUNK] for i in xrange((len(a) + CHUNK - 1) / CHUNK )]

def chunks(li, n): if li == []: return yield li[:n] for e in chunks(li[n:], n): yield e

def chunks(li, n): if li == []: return yield li[:n] yield from chunks(li[n:], n)

def dec(gen): def new_gen(li, n): for e in gen(li, n): if e == []: return yield e return new_gen @dec def chunks(li, n): yield li[:n] for e in chunks(li[n:], n): yield e

[AA[i:i+SS] for i in range(len(AA))[::SS]]

>>> AA=range(10,21);SS=3 >>> [AA[i:i+SS] for i in range(len(AA))[::SS]] [[10, 11, 12], [13, 14, 15], [16, 17, 18], [19, 20]] # or [range(10, 13), range(13, 16), range(16, 19), range(19, 21)] in py3

from boltons import iterutils list(iterutils.chunked_iter(list(range(50)), 11))

[[0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10], [11, 12, 13, 14, 15, 16, 17, 18, 19, 20, 21], [22, 23, 24, 25, 26, 27, 28, 29, 30, 31, 32], [33, 34, 35, 36, 37, 38, 39, 40, 41, 42, 43], [44, 45, 46, 47, 48, 49]]

>>> from utilspie import iterutils >>> a = [1, 2, 3, 4, 5, 6, 7, 8, 9] >>> list(iterutils.get_chunks(a, 5)) [[1, 2, 3, 4, 5], [6, 7, 8, 9]]

sudo pip install utilspie

import time batch_size = 7 arr_len = 298937 #---------slice------------- print("\r\nslice") start = time.time() arr = [i for i in range(0, arr_len)] while True: if not arr: break tmp = arr[0:batch_size] arr = arr[batch_size:-1] print(time.time() - start) #-----------index----------- print("\r\nindex") arr = [i for i in range(0, arr_len)] start = time.time() for i in range(0, round(len(arr) / batch_size + 1)): tmp = arr[batch_size * i : batch_size * (i + 1)] print(time.time() - start) #----------batches 1------------ def batch(iterable, n=1): l = len(iterable) for ndx in range(0, l, n): yield iterable[ndx:min(ndx + n, l)] print("\r\nbatches 1") arr = [i for i in range(0, arr_len)] start = time.time() for x in batch(arr, batch_size): tmp = x print(time.time() - start) #----------batches 2------------ from itertools import islice, chain def batch(iterable, size): sourceiter = iter(iterable) while True: batchiter = islice(sourceiter, size) yield chain([next(batchiter)], batchiter) print("\r\nbatches 2") arr = [i for i in range(0, arr_len)] start = time.time() for x in batch(arr, batch_size): tmp = x print(time.time() - start) #---------chunks------------- def chunks(l, n): """Yield successive n-sized chunks from l.""" for i in range(0, len(l), n): yield l[i:i + n] print("\r\nchunks") arr = [i for i in range(0, arr_len)] start = time.time() for x in chunks(arr, batch_size): tmp = x print(time.time() - start) #-----------grouper----------- from itertools import zip_longest # for Python 3.x #from six.moves import zip_longest # for both (uses the six compat library) def grouper(iterable, n, padvalue=None): "grouper(3, 'abcdefg', 'x') --> ('a','b','c'), ('d','e','f'), ('g','x','x')" return zip_longest(*[iter(iterable)]*n, fillvalue=padvalue) arr = [i for i in range(0, arr_len)] print("\r\ngrouper") start = time.time() for x in grouper(arr, batch_size): tmp = x print(time.time() - start)

slice 31.18285083770752 index 0.02184295654296875 batches 1 0.03503894805908203 batches 2 0.22681021690368652 chunks 0.019841909408569336 grouper 0.006506919860839844

import itertools as it import collections as ct import more_itertools as mit iterable = range(11) n = 3

list(it.zip_longest(*[iter(iterable)] * n)) # [(0, 1, 2), (3, 4, 5), (6, 7, 8), (9, 10, None)]

d = {} for i, x in enumerate(iterable): d.setdefault(i//n, []).append(x) list(d.values()) # [[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 10]]

dd = ct.defaultdict(list) for i, x in enumerate(iterable): dd[i//n].append(x) list(dd.values()) # [[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 10]]

list(mit.chunked(iterable, n)) # [[0, 1, 2], [3, 4, 5], [6, 7, 8], [9, 10]] list(mit.sliced(iterable, n)) # [range(0, 3), range(3, 6), range(6, 9), range(9, 11)] list(mit.grouper(n, iterable)) # [(0, 1, 2), (3, 4, 5), (6, 7, 8), (9, 10, None)] list(mit.windowed(iterable, len(iterable)//n, step=n)) # [(0, 1, 2), (3, 4, 5), (6, 7, 8), (9, 10, None)]