Excel 熊猫合并多个数据帧并进行文本分析? 问题陈述:
我有一份来自政府部门的拙劣文件,它在一个excel中列出了500多条公交线路的运营计划,这些计划跨越多张表格。这里真的没有结构,作者似乎有一个单一的目标——把所有东西都打包在一个文件中 现在,我想做什么: 进行广泛的文本分析,以提取路线上每次跑步的开始时间。请注意,一张纸上有多条路线,然后总共有12张左右 我用熊猫图书馆切牙,卡在这一点上: 哪里有字典 关键字:图纸名称(随机str,用于标识路线顺序) 值:使用该工作表上的所有单元格数据创建的数据框 我想知道什么:Excel 熊猫合并多个数据帧并进行文本分析? 问题陈述:,excel,python-2.7,pandas,text-analysis,Excel,Python 2.7,Pandas,Text Analysis,我有一份来自政府部门的拙劣文件,它在一个excel中列出了500多条公交线路的运营计划,这些计划跨越多张表格。这里真的没有结构,作者似乎有一个单一的目标——把所有东西都打包在一个文件中 现在,我想做什么: 进行广泛的文本分析,以提取路线上每次跑步的开始时间。请注意,一张纸上有多条路线,然后总共有12张左右 我用熊猫图书馆切牙,卡在这一点上: 哪里有字典 关键字:图纸名称(随机str,用于标识路线顺序) 值:使用该工作表上的所有单元格数据创建的数据框 我想知道什么: 创建一个巨大的数据框,其中包含
在可以尝试多索引数据帧:
df_3d=pd.concat(dfs, # List of dataframes
keys=sheetnames, # List of sheetnames
axis=1)
dfs会是什么样子
dfs=[read_excel(io,sheetname=i) for i in sheetnames]