Python 使用Dask数据帧计算前向差分?
如何使用Dask数据帧计算第一个离散差分?或者,在“熊猫语”中,我在达斯克该怎么办?从数学上讲,这个操作非常简单:从自身移动一行或多行的副本中减去一个列向量 我曾尝试通过以下方式在Dask中实现Python 使用Dask数据帧计算前向差分?,python,dataframe,time-series,dask,Python,Dataframe,Time Series,Dask,如何使用Dask数据帧计算第一个离散差分?或者,在“熊猫语”中,我在达斯克该怎么办?从数学上讲,这个操作非常简单:从自身移动一行或多行的副本中减去一个列向量 我曾尝试通过以下方式在Dask中实现diff(),但都不起作用(目前): df-df.shift(时段=1)在熊猫中工作。但是Dask数据帧没有shift()方法 df.values[:-1]-df.values[1:]在熊猫中工作。但我不知道如何按位置索引到Dask数据帧中 我目前实现diff的最佳想法是按照中的建议在dask.dat
diff()
,但都不起作用(目前):
在熊猫中工作。但是Dask数据帧没有df-df.shift(时段=1)
方法shift()
在熊猫中工作。但我不知道如何按位置索引到Dask数据帧中df.values[:-1]-df.values[1:]
我目前实现
diff
的最佳想法是按照中的建议在dask.dataframe.rolling.wrap_rolling
中封装一些自定义代码(尽管我还没有找到任何关于如何实现这一点的文档)。或者使用Dask延迟包装一些自定义代码?还有其他想法吗?在本PR中,diff
方法现已添加到数据帧和序列中。工作原理与熊猫一样。是的,我建议使用包裹滚动。如果你想把它变成用户可访问的API,我怀疑有人会接受它。(或者这是你想帮助他人的东西?@MRocklin谢谢你的建议!我刚刚创建了。