Pandas 什么是熊猫;“扩展窗口”;功能?

Pandas 什么是熊猫;“扩展窗口”;功能?,pandas,Pandas,Pandas文档列出了一系列“扩展窗口函数”: 但我无法从文档中看出他们在做什么 您可能需要阅读: 滚动统计的常见替代方法是使用扩展 窗口,该窗口生成包含所有数据的统计值 在该时间点之前可用 它们遵循与.rolling类似的接口,并带有.expanding 方法返回展开对象 由于这些计算是滚动统计的特例,因此 在pandas中实现,以实现以下两个调用 等价物: 总结一行中滚动和扩展功能的区别: 在滚动函数中,窗口大小保持不变,而在展开函数中,窗口大小变化 例如: 假设您要预测天气,您有100天

Pandas文档列出了一系列“扩展窗口函数”:

但我无法从文档中看出他们在做什么

您可能需要阅读:

滚动统计的常见替代方法是使用扩展 窗口,该窗口生成包含所有数据的统计值 在该时间点之前可用

它们遵循与.rolling类似的接口,并带有.expanding 方法返回展开对象

由于这些计算是滚动统计的特例,因此 在pandas中实现,以实现以下两个调用 等价物:


总结一行中滚动和扩展功能的区别: 在滚动函数中,窗口大小保持不变,而在展开函数中,窗口大小变化

例如: 假设您要预测天气,您有100天的数据:

  • 滚动:假设窗口大小为10。对于首次预测,它将使用(之前)10天的数据并预测第11天。对于下一个预测,它将使用第2天(数据点)到第11天的数据

  • 扩展:首次预测将使用10天的数据。然而,对于第二次预测,它将使用10+1天的数据。因此,该窗口已“扩展”

    • 在后面的方法中,窗口大小不断扩展
  • 代码示例:

    sums = series.expanding(min_periods=2).sum()
    
    系列
    包含时间序列中以前下载的应用程序数量的数据。 上面写的代码行是到那时为止下载的所有应用程序的总数


    注意:
    min\u periods=2
    表示我们需要至少2个以前的数据点来汇总。我们这里的合计是总和。

    优步的插图很好地解释了这些概念:

    扩展窗口

    滑动窗口


    原始文章:

    所以它是一个滚动操作,窗口是数据帧的全长。我不明白为什么需要一个单独的函数来实现这一点……它实际上非常有用,因为滚动操作是针对固定窗口大小的。但是,此操作是一个扩展窗口大小的操作。它以长度为1个周期的“滚动”窗口开始,下一个窗口大小为2个周期,然后是3、4、5等。对于流式数据,原始数据帧全长的滚动窗口将开始删除前两个观察值,而扩展窗口允许您添加新数据。@Ryan抱歉,但我真的没有看到熊猫能够处理数据流。谷歌什么也没发现,你能给我们举个例子吗?这只适用于处理单个数据帧中的值吗?如果您为每一批加载的数据实例化一个新的数据帧,那么累积std有哪些选项可用?回答得好!!!!
    sums = series.expanding(min_periods=2).sum()