Python 表开始之前的数据(在pandas中)

Python 表开始之前的数据(在pandas中),python,excel,pandas,Python,Excel,Pandas,我正在解析一个Excel文件,它是一个20k行的数据表,使用pandas。到目前为止还不错,但在表的开头还有一点元数据,我也希望使用它(表的生成日期) 当前如果我不跳过任何行: raw = pd.read_excel(datafile, sheetname=0, parse_cols="B, D:I") 前几行只是NaN: >>> raw.values[0] array([nan, nan, nan, nan, nan, nan, nan], dtype=object) 我

我正在解析一个Excel文件,它是一个20k行的数据表,使用pandas。到目前为止还不错,但在表的开头还有一点元数据,我也希望使用它(表的生成日期)

当前如果我不跳过任何行:

raw = pd.read_excel(datafile, sheetname=0, parse_cols="B, D:I")
前几行只是NaN:

>>> raw.values[0]
array([nan, nan, nan, nan, nan, nan, nan], dtype=object)
我可以用更基本的东西(比如xlrd)打开文件来获取数据,但这需要将整个文件加载到内存中两次,我不想这样做


熊猫能否在不重新导入文件的情况下获取表开头上方的数据?

请考虑以下方法:

xl = pd.ExcelFile(filepath)

# you may want to set a correct row and column 
meta_data = xl.book.sheet_by_index(0).cell_value(0,0) 

skiprows = 5 # set it accordnigly...

df = xl.parse(0, skiprows=skiprows, parse_cols="B, D:I") \
       .dropna(axis=1, how='all')

尝试使用该方法中的header参数@不,那不是我想要的。将指定用作索引名的行。我想要在那一行之前的数据。也许你可以向我们提供你的元数据样本。你只想从一个特定的单元格中读取元数据吗?如果我们需要使用xlrd模块跳过使用pandas的行怎么办?我们如何实现it@user3521180,
pd.ExcelFile
在引擎盖下使用
xlrd