Pandas 熊猫每月重新取样,是否给出不正确的输出?
我正在尝试从Pandas 熊猫每月重新取样,是否给出不正确的输出?,pandas,pandas-datareader,Pandas,Pandas Datareader,我正在尝试从每日到每月 这就是我正在做的 i = 'NSE/CHENNPETRO' df = pdr.DataReader(i, 'quandl', start, end) df_monthly = df['Close'].resample('M').ohlc() 输出: Date open high low close 2017-07-31 353.55 400.10 353.55 387.00 2017-08-31 414.30 448.35
每日
到每月
这就是我正在做的
i = 'NSE/CHENNPETRO'
df = pdr.DataReader(i, 'quandl', start, end)
df_monthly = df['Close'].resample('M').ohlc()
输出:
Date open high low close
2017-07-31 353.55 400.10 353.55 387.00
2017-08-31 414.30 448.35 378.05 448.35
2017-09-30 460.80 460.80 391.10 402.95
2017-10-31 405.70 468.80 403.10 468.80
2017-11-30 464.55 470.65 427.45 427.45
我对照第10个月的数据进行了检查
Open: 410
High: 478
Low: 400
Close: 468.8
我不确定我可能做错了什么。熊猫非常新您可以使用这个
df_monthly = df['Close'].resample('M').apply(lambda x: x[-1])
你可以用这个
df_monthly = df['Close'].resample('M').apply(lambda x: x[-1])
你知道ohlc在做什么吗?我想,从基本的每日数据中获取当月的开盘、高点、低点和收盘值。我现在正在读有关它的文章。如果不执行某种操作,就无法进行上/下采样。什么意思?最大值?插值您的最终结果几乎总是与您的输入不同。啊..所以,指定我想要的最大值,第10个月,作为高列。等等这些文档并没有真正为我澄清这一点。
resample('M').max()
表示高,resample('M').min()
表示低。对于打开和关闭,您不需要重新采样,只需分组并获取第一行/最后一行。您知道ohlc
在做什么吗?我假设,从基础每日数据中获取当月的打开、高、低、关闭值。我现在正在读有关它的文章。如果不执行某种操作,就无法进行上/下采样。什么意思?最大值?插值您的最终结果几乎总是与您的输入不同。啊..所以,指定我想要的最大值,第10个月,作为高列。等等这些文档并没有真正为我澄清这一点。resample('M').max()
表示高,resample('M').min()
表示低。对于打开和关闭,您不需要重新采样,只需分组并获取第一行/最后一行