Python 如何获取DataFrame.pct_change以计算每日价格数据的月度变化?

Python 如何获取DataFrame.pct_change以计算每日价格数据的月度变化?,python,pandas,Python,Pandas,我知道可以使用periods参数进行抵消,但是如何将分布在一个月内(例如交易日)的每日价格数据进行收益化呢 示例数据为: In [1]: df.AAPL 2009-01-02 16:00:00 90.36 2009-01-05 16:00:00 94.18 2009-01-06 16:00:00 92.62 2009-01-07 16:00:00 90.62 2009-01-08 16:00:00 92.30 2009-01-09 16:00:00 90.19

我知道可以使用
periods
参数进行抵消,但是如何将分布在一个月内(例如交易日)的每日价格数据进行收益化呢

示例数据为:

In [1]: df.AAPL
2009-01-02 16:00:00    90.36
2009-01-05 16:00:00    94.18
2009-01-06 16:00:00    92.62
2009-01-07 16:00:00    90.62
2009-01-08 16:00:00    92.30
2009-01-09 16:00:00    90.19
2009-01-12 16:00:00    88.28
2009-01-13 16:00:00    87.34
2009-01-14 16:00:00    84.97
2009-01-15 16:00:00    83.02
2009-01-16 16:00:00    81.98
2009-01-20 16:00:00    77.87
2009-01-21 16:00:00    82.48
2009-01-22 16:00:00    87.98
2009-01-23 16:00:00    87.98
...
2009-12-10 16:00:00    195.59
2009-12-11 16:00:00    193.84
2009-12-14 16:00:00    196.14
2009-12-15 16:00:00    193.34
2009-12-16 16:00:00    194.20
2009-12-17 16:00:00    191.04
2009-12-18 16:00:00    194.59
2009-12-21 16:00:00    197.38
2009-12-22 16:00:00    199.50
2009-12-23 16:00:00    201.24
2009-12-24 16:00:00    208.15
2009-12-28 16:00:00    210.71
2009-12-29 16:00:00    208.21
2009-12-30 16:00:00    210.74
2009-12-31 16:00:00    209.83
Name: AAPL, Length: 252

正如您所看到的,简单地用30来抵消将不会产生正确的结果,因为时间戳数据中存在缺口,不是每个月都是30天,等等。我知道使用pandas一定有一种简单的方法来做到这一点。

您可以将数据重新采样到business month。如果您不想要平均价格(这是
重采样
中的默认值),可以使用关键字参数
how
,使用自定义重采样方法:

In [31]: from pandas.io import data as web

# read some example data, note that this is not exactly your data!
In [32]: s = web.get_data_yahoo('AAPL', start='2009-01-02',
...                             end='2009-12-31')['Adj Close']

# resample to business month and return the last value in the period
In [34]: monthly = s.resample('BM', how=lambda x: x[-1])

In [35]: monthly
Out[35]: 
Date
2009-01-30     89.34
2009-02-27     88.52
2009-03-31    104.19
...
2009-10-30    186.84
2009-11-30    198.15
2009-12-31    208.88
Freq: BM

In [36]: monthly.pct_change()
Out[36]: 
Date
2009-01-30         NaN
2009-02-27   -0.009178
2009-03-31    0.177022
...
2009-10-30    0.016982
2009-11-30    0.060533
2009-12-31    0.054151
Freq: BM

我在使用pct_change函数时也遇到了这个错误,我想就这个问题提供我的两分钱

pct_change函数的freq参数似乎只接受固定周期时间偏移,例如“2D”和“3D”。然而,“M”是一个不确定的时间段,可能在28天到31天之间。这就是错误的来源

Pct_change的操作与rolling()函数类似,使用rolling()的“M”时间偏移也会得到相同的错误

以下是使用pct_change参数中的freq参数的工作示例:

以web形式导入datareader.data

return.pct_change(periods = 1, freq = '2D')

Date
2008-03-26         NaN
2008-03-27         NaN
2008-03-28   -0.010342
2008-03-31         NaN
2008-04-01         NaN
            ...   

注意:您也可以使用
asfreq('M',fill_method='ffill')
。日内数据需要谨慎处理however@WesMcKinney不知道首选哪种方法:通常我会使用
重采样
。使用
asfreq
有什么好处吗?(使用
asfreq
时,关键字似乎是
method
(0.10中不是
fill\u method
)请查看问题中的更新。我为您的问题添加了一条注释。
重新采样
应该可以,但不确定
asfreq
的优点。谢谢。删除了更新并标记了答案。差异是由于频率不同:
BM
是营业月,
M
是月(请参阅)。