Warning: file_get_contents(/data/phpspider/zhask/data//catemap/7/python-2.7/5.json): failed to open stream: No such file or directory in /data/phpspider/zhask/libs/function.php on line 167

Warning: Invalid argument supplied for foreach() in /data/phpspider/zhask/libs/tag.function.php on line 1116

Notice: Undefined index: in /data/phpspider/zhask/libs/function.php on line 180

Warning: array_chunk() expects parameter 1 to be array, null given in /data/phpspider/zhask/libs/function.php on line 181
Excel 熊猫合并多个数据帧并进行文本分析? 问题陈述:_Excel_Python 2.7_Pandas_Text Analysis - Fatal编程技术网

Excel 熊猫合并多个数据帧并进行文本分析? 问题陈述:

Excel 熊猫合并多个数据帧并进行文本分析? 问题陈述:,excel,python-2.7,pandas,text-analysis,Excel,Python 2.7,Pandas,Text Analysis,我有一份来自政府部门的拙劣文件,它在一个excel中列出了500多条公交线路的运营计划,这些计划跨越多张表格。这里真的没有结构,作者似乎有一个单一的目标——把所有东西都打包在一个文件中 现在,我想做什么: 进行广泛的文本分析,以提取路线上每次跑步的开始时间。请注意,一张纸上有多条路线,然后总共有12张左右 我用熊猫图书馆切牙,卡在这一点上: 哪里有字典 关键字:图纸名称(随机str,用于标识路线顺序) 值:使用该工作表上的所有单元格数据创建的数据框 我想知道什么: 创建一个巨大的数据框,其中包含

我有一份来自政府部门的拙劣文件,它在一个excel中列出了500多条公交线路的运营计划,这些计划跨越多张表格。这里真的没有结构,作者似乎有一个单一的目标——把所有东西都打包在一个文件中

现在,我想做什么:

进行广泛的文本分析,以提取路线上每次跑步的开始时间。请注意,一张纸上有多条路线,然后总共有12张左右

我用熊猫图书馆切牙,卡在这一点上:

哪里有字典 关键字:图纸名称(随机str,用于标识路线顺序) 值:使用该工作表上的所有单元格数据创建的数据框

我想知道什么:
  • 创建一个巨大的数据框,其中包含12个工作表中的所有行。从我的文本分析文章开始这一步

  • 这是正确的前进方向吗

  • 提前谢谢。

    可以尝试多索引数据帧:

    df_3d=pd.concat(dfs, # List of dataframes
                    keys=sheetnames,   # List of sheetnames
                    axis=1)
    
    dfs会是什么样子

    dfs=[read_excel(io,sheetname=i) for i in sheetnames]