Python 迭代调用datareader
我有一个python目录和一个股票列表。我试图在for循环中使用键(股票符号,见下文)为所有股票(以股票符号命名)迭代生成多个pandas数据帧,这些股票通过pandas数据读取器填充价格/数量。 我认为下面的代码中有一个基本的python问题,因为创建的唯一数据帧是“stockName”。 谢谢你的帮助Python 迭代调用datareader,python,pandas,Python,Pandas,我有一个python目录和一个股票列表。我试图在for循环中使用键(股票符号,见下文)为所有股票(以股票符号命名)迭代生成多个pandas数据帧,这些股票通过pandas数据读取器填充价格/数量。 我认为下面的代码中有一个基本的python问题,因为创建的唯一数据帧是“stockName”。 谢谢你的帮助 print stocks.keys() ['TSO', 'WDC', 'EBIX', 'AAPL', 'GTAT', 'MSFT', 'BKE', 'VFSTX', 'ORCL', 'UIS'
print stocks.keys()
['TSO', 'WDC', 'EBIX', 'AAPL', 'GTAT', 'MSFT', 'BKE', 'VFSTX', 'ORCL', 'UIS', 'HSII', 'PETS', 'BBBY', 'RPXC', 'TZOO', 'DLB', 'SPLS', 'CHE', 'INTC', 'CF', 'GTN', 'FFIV', 'ATML', 'BAH', 'DHX', 'HRB', 'VIAB', 'LMT', 'NOC', 'VWO', 'ROST']
for stockName in stocks.keys():
stockName = DataReader(stockName, "yahoo", datetime(2013,1,1), datetime(2013,8,1))
stockName是一个在股票代码列表上循环的变量。它包含股票代码字符串。当您将数据帧分配给它时,该数据帧在
for
循环的下一个回合丢失
创建另一个变量,例如dict
,将股票数据分配到:
stockdata = {}
for stockName in stocks:
stockdata[stockName] = DataReader(stockName, "yahoo", datetime(2013,1,1), datetime(2013,8,1))
如果你只是在股票上迭代,你可以直接用
stocks
DataReader(stocks, 'yahoo', datetime(2013, 1, 1), datetime(2013, 8, 1))
您不需要迭代,因为get\u data\u yahoo
会为您进行迭代。您将返回一个面板
,可以像数据帧
s的命令一样使用它。您甚至不需要调用stocks.keys()
for key in dict(a=1, b=2, c=3):
print key
将打印
a
b
c
结果如下:
In [3]: p = DataReader(stocks, 'yahoo', datetime.datetime(2013, 1, 1), datetime.datetime(2013, 8, 1))
In [4]: p
Out[4]:
<class 'pandas.core.panel.Panel'>
Dimensions: 6 (items) x 147 (major_axis) x 31 (minor_axis)
Items axis: Open to Adj Close
Major_axis axis: 2013-01-02 00:00:00 to 2013-08-01 00:00:00
Minor_axis axis: AAPL to WDC
天空是熊猫的极限
In [7]: p.swapaxes('items', 'minor').AAPL
Out[7]:
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 147 entries, 2013-01-02 00:00:00 to 2013-08-01 00:00:00
Data columns (total 6 columns):
Open 147 non-null values
High 147 non-null values
Low 147 non-null values
Close 147 non-null values
Volume 147 non-null values
Adj Close 147 non-null values
dtypes: float64(6)
In [127]: df = p.to_frame(filter_observations=False)
In [128]: res = df.stack().reset_index()
In [129]: res.columns = ['date', 'metric', 'stock', 'value']
In [130]: res.set_index('date').groupby(['metric', 'stock']).apply(lambda x: x.value.pct_change()).stack()
Out[130]:
metric stock date
Adj Close AAPL 2013-01-03 -0.013
2013-01-04 -0.028
2013-01-07 -0.006
2013-01-08 0.003
2013-01-09 -0.016
2013-01-10 0.012
2013-01-11 -0.006
2013-01-14 -0.036
2013-01-15 -0.032
2013-01-16 0.042
2013-01-17 -0.007
2013-01-18 -0.005
2013-01-22 0.010
2013-01-23 0.018
2013-01-24 -0.124
...
Volume WDC 2013-07-12 -0.083
2013-07-15 -0.179
2013-07-16 -0.302
2013-07-17 -0.168
2013-07-18 0.589
2013-07-19 0.003
2013-07-22 0.049
2013-07-23 0.526
2013-07-24 0.176
2013-07-25 0.616
2013-07-26 -0.363
2013-07-29 -0.357
2013-07-30 0.554
2013-07-31 -0.252
2013-08-01 -0.158
Length: 27010, dtype: float64