Python 迭代调用datareader_Python_Pandas

Python 迭代调用datareader

python pandas

Python 迭代调用datareader,python,pandas,Python,Pandas,我有一个python目录和一个股票列表。我试图在for循环中使用键（股票符号，见下文）为所有股票（以股票符号命名）迭代生成多个pandas数据帧，这些股票通过pandas数据读取器填充价格/数量。我认为下面的代码中有一个基本的python问题，因为创建的唯一数据帧是“stockName”。谢谢你的帮助 print stocks.keys() ['TSO', 'WDC', 'EBIX', 'AAPL', 'GTAT', 'MSFT', 'BKE', 'VFSTX', 'ORCL', 'UIS'

我有一个python目录和一个股票列表。我试图在for循环中使用键（股票符号，见下文）为所有股票（以股票符号命名）迭代生成多个pandas数据帧，这些股票通过pandas数据读取器填充价格/数量。我认为下面的代码中有一个基本的python问题，因为创建的唯一数据帧是“stockName”。谢谢你的帮助

print stocks.keys()
['TSO', 'WDC', 'EBIX', 'AAPL', 'GTAT', 'MSFT', 'BKE', 'VFSTX', 'ORCL', 'UIS', 'HSII', 'PETS', 'BBBY', 'RPXC', 'TZOO', 'DLB', 'SPLS', 'CHE', 'INTC', 'CF', 'GTN', 'FFIV', 'ATML', 'BAH', 'DHX', 'HRB', 'VIAB', 'LMT', 'NOC', 'VWO', 'ROST']

for stockName in stocks.keys():
    stockName = DataReader(stockName,  "yahoo", datetime(2013,1,1), datetime(2013,8,1))

stockName是一个在股票代码列表上循环的变量。它包含股票代码字符串。当您将数据帧分配给它时，该数据帧在

for

循环的下一个回合丢失

创建另一个变量，例如

dict

，将股票数据分配到：

stockdata = {}
for stockName in stocks:
    stockdata[stockName] = DataReader(stockName,  "yahoo", datetime(2013,1,1), datetime(2013,8,1))

如果你只是在股票上迭代，你可以直接用

stocks

DataReader(stocks, 'yahoo', datetime(2013, 1, 1), datetime(2013, 8, 1))

您不需要迭代，因为

get\u data\u yahoo

会为您进行迭代。您将返回一个

面板

，可以像

数据帧

s的

命令一样使用它。您甚至不需要调用stocks.keys（）

for key in dict(a=1, b=2, c=3):
    print key

将打印
a
b
c

结果如下：
In [3]: p = DataReader(stocks, 'yahoo', datetime.datetime(2013, 1, 1), datetime.datetime(2013, 8, 1))

In [4]: p
Out[4]:
<class 'pandas.core.panel.Panel'>
Dimensions: 6 (items) x 147 (major_axis) x 31 (minor_axis)
Items axis: Open to Adj Close
Major_axis axis: 2013-01-02 00:00:00 to 2013-08-01 00:00:00
Minor_axis axis: AAPL to WDC

天空是熊猫的极限
In [7]: p.swapaxes('items', 'minor').AAPL
Out[7]:
<class 'pandas.core.frame.DataFrame'>
DatetimeIndex: 147 entries, 2013-01-02 00:00:00 to 2013-08-01 00:00:00
Data columns (total 6 columns):
Open         147  non-null values
High         147  non-null values
Low          147  non-null values
Close        147  non-null values
Volume       147  non-null values
Adj Close    147  non-null values
dtypes: float64(6)

In [127]: df = p.to_frame(filter_observations=False)

In [128]: res = df.stack().reset_index()

In [129]: res.columns = ['date', 'metric', 'stock', 'value']

In [130]: res.set_index('date').groupby(['metric', 'stock']).apply(lambda x: x.value.pct_change()).stack()
Out[130]:
metric     stock  date
Adj Close  AAPL   2013-01-03   -0.013
                  2013-01-04   -0.028
                  2013-01-07   -0.006
                  2013-01-08    0.003
                  2013-01-09   -0.016
                  2013-01-10    0.012
                  2013-01-11   -0.006
                  2013-01-14   -0.036
                  2013-01-15   -0.032
                  2013-01-16    0.042
                  2013-01-17   -0.007
                  2013-01-18   -0.005
                  2013-01-22    0.010
                  2013-01-23    0.018
                  2013-01-24   -0.124
...
Volume  WDC    2013-07-12   -0.083
               2013-07-15   -0.179
               2013-07-16   -0.302
               2013-07-17   -0.168
               2013-07-18    0.589
               2013-07-19    0.003
               2013-07-22    0.049
               2013-07-23    0.526
               2013-07-24    0.176
               2013-07-25    0.616
               2013-07-26   -0.363
               2013-07-29   -0.357
               2013-07-30    0.554
               2013-07-31   -0.252
               2013-08-01   -0.158
Length: 27010, dtype: float64