Python 如何从Dask数据帧中选择n个等距行?

Python 如何从Dask数据帧中选择n个等距行?,python,bigdata,dask,Python,Bigdata,Dask,我有很多拼花文件,所有的拼花块都太大,无法放入内存。我想将它们加载到dask数据帧中,计算一些结果(cumsum),然后将cumsum显示为绘图。出于这个原因,我想从cumsum行中选择等距数据子集(一些k行),然后绘制这个子集。我该怎么做?您可以尝试: slices=10#或其他 切片\点=int(df.shape[0]/切片) 对于范围内的i(切片): 当前切片df=df.loc[i*切片点:(i+1)*切片点] 对当前切片执行任何您想要的操作我认为使用df[serie].sample(…

我有很多拼花文件,所有的拼花块都太大,无法放入内存。我想将它们加载到dask数据帧中,计算一些结果(cumsum),然后将cumsum显示为绘图。出于这个原因,我想从cumsum行中选择等距数据子集(一些k行),然后绘制这个子集。我该怎么做?

您可以尝试:

slices=10#或其他
切片\点=int(df.shape[0]/切片)
对于范围内的i(切片):
当前切片df=df.loc[i*切片点:(i+1)*切片点]

对当前切片执行任何您想要的操作

我认为使用
df[serie].sample(…)
()可以避免选择代表行子集的编码方式