Python—拆分列表中包含的数据帧
我从PDF中提取表格,该页面可以有多个表格。我正在使用蒂卡图书馆提取。在本例中,输出是一个列表中包含的2个数据帧(因此是2个表)-请有人分享我如何提取每个数据帧 对于上下文,每个df有2列和相同数量的行 例如:Python—拆分列表中包含的数据帧,python,python-3.x,pandas,list,dataframe,Python,Python 3.x,Pandas,List,Dataframe,我从PDF中提取表格,该页面可以有多个表格。我正在使用蒂卡图书馆提取。在本例中,输出是一个列表中包含的2个数据帧(因此是2个表)-请有人分享我如何提取每个数据帧 对于上下文,每个df有2列和相同数量的行 例如: [0 data1 1 data2 2 data3 3 data4 0 data10 1 data12 2 data13 3 data14 ] 我想在这里提取第一个df,以便: 0 data1 1 data2 2 d
[0 data1
1 data2
2 data3
3 data4
0 data10
1 data12
2 data13
3 data14 ]
我想在这里提取第一个df,以便:
0 data1
1 data2
2 data3
3 data4
我尝试过这样解析:
df[:3] or df[-1]
有人能告诉我哪里出了问题吗
df1 = df.head(4)
将获得前4项如果是列表,则应该能够索引到列表中。仔细检查数据存储的类型和层次结构。如果不显示错误,就很难判断您的问题是什么。但是,您可以这样做,例如:
df = pd.DataFrame({'a': ['gg', 'bb'], 'h': ['ttt', 'sdf']})
list_of_dfs = [df, df]
# get the first dataframe:
list_of_dfs[0]
# If you are trying to combine them into one table (assuming they are of the same form):
df_all = pd.concat(list_of_dfs)
IIUC:list或dict是存储多个数据帧的合适方式。否则,您将需要手动将每个数据帧实例化为一个变量(例如,
df1=my\u list\u of_dataframes[0]
)。