在读取html(pandas.read_html)时,如何选择dataframe并在一行中设置索引

在读取html(pandas.read_html)时,如何选择dataframe并在一行中设置索引,pandas,dataframe,Pandas,Dataframe,我正在读一个html,它返回一个数据帧列表。我希望能够从列表中选择数据帧,并以最少的行数设置索引(index_col) 以下是我现在拥有的: import pandas as pd df =pd.read_html('http://finviz.com/insidertrading.ashx?or=-10&tv=100000&tc=1&o=-transactionvalue', header = 0) df2 =df[4] #here I'm assigning df

我正在读一个html,它返回一个数据帧列表。我希望能够从列表中选择数据帧,并以最少的行数设置索引(index_col)

以下是我现在拥有的:

import pandas as pd
df =pd.read_html('http://finviz.com/insidertrading.ashx?or=-10&tv=100000&tc=1&o=-transactionvalue', header = 0)
df2 =df[4]   #here I'm assigning df2 to dataframe#4 from the list of dataframes I read
df2.set_index('Date', inplace =True)   
这一切能在一条线上完成吗?我是否需要创建另一个数据帧(df2)来从列表中分配一个数据帧,或者我是否可以在读取数据帧列表(df)后立即分配该数据帧

谢谢

无论如何:

import pandas as pd

df = pd.read_html('http://finviz.com/insidertrading.ashx?or=-10&tv=100000&tc=1&o=-transactionvalue', header = 0)[4].set_index('Date')

为什么你需要用最少的行数来做呢?这是一个奇怪的要求。。。通常人们追求的是最少的计算量或最少的时间。用于学习目的。我知道有办法,但我不知道怎么做。所以我希望有人能给我看看。谢谢 非常感谢你。