Python 从excel中正确地自动检测表格

Python 从excel中正确地自动检测表格,python,excel,dataframe,Python,Excel,Dataframe,我有几个桌子,每个桌子都有自己的结构。表可以从单元格(C6)或类似的位置开始。有些是水平的,有些是垂直的。我想将表数据提取到pandasdataframe中。现在,我通过定义第一列标题并删除之前的所有内容来实现它。有没有合适的、通用的方法 在: out:如果在excel中将文件保存为.csv格式,则可以使用此选项跳过初始空间: import pandas as pd pd.read_csv('directory/filename.csv', skipinitialspace=True) 然后您

我有几个桌子,每个桌子都有自己的结构。表可以从单元格(C6)或类似的位置开始。有些是水平的,有些是垂直的。我想将表数据提取到
pandas
dataframe中。现在,我通过定义第一列标题并删除之前的所有内容来实现它。有没有合适的、通用的方法

在:


out:

如果在excel中将文件保存为.csv格式,则可以使用此选项跳过初始空间:

import pandas as pd
pd.read_csv('directory/filename.csv', skipinitialspace=True)

然后您可以在单元格中使用所需的列和行。

但它们根本不是空的。如图所示,表外可能有“某物”OK,我明白了,您希望通过指定特定范围来选择零件,对吗?检查此链接,可能会有所帮助:不幸的是,该解决方案太明显了,我希望检测表上的表,排除一些单个数据单元。处理非结构化数据没有通用方法,我认为你们目前的方法很好。我认为用VBA来准备你们的文件更简单。查看范围(“B4”).CurrentRegion属性。它可以选择由任意空行和空列组合限定的范围。