Python 表开始之前的数据（在pandas中）_Python_Excel_Pandas

Python 表开始之前的数据（在pandas中）

python excel pandas

Python 表开始之前的数据（在pandas中）,python,excel,pandas,Python,Excel,Pandas,我正在解析一个Excel文件，它是一个20k行的数据表，使用pandas。到目前为止还不错，但在表的开头还有一点元数据，我也希望使用它（表的生成日期）当前如果我不跳过任何行： raw = pd.read_excel(datafile, sheetname=0, parse_cols="B, D:I") 前几行只是NaN： >>> raw.values[0] array([nan, nan, nan, nan, nan, nan, nan], dtype=object) 我

我正在解析一个Excel文件，它是一个20k行的数据表，使用pandas。到目前为止还不错，但在表的开头还有一点元数据，我也希望使用它（表的生成日期）

当前如果我不跳过任何行：

raw = pd.read_excel(datafile, sheetname=0, parse_cols="B, D:I")

前几行只是NaN：

>>> raw.values[0]
array([nan, nan, nan, nan, nan, nan, nan], dtype=object)

我可以用更基本的东西（比如xlrd）打开文件来获取数据，但这需要将整个文件加载到内存中两次，我不想这样做

熊猫能否在不重新导入文件的情况下获取表开头上方的数据？

请考虑以下方法：

xl = pd.ExcelFile(filepath)

# you may want to set a correct row and column 
meta_data = xl.book.sheet_by_index(0).cell_value(0,0) 

skiprows = 5 # set it accordnigly...

df = xl.parse(0, skiprows=skiprows, parse_cols="B, D:I") \
       .dropna(axis=1, how='all')

尝试使用该方法中的header参数@不，那不是我想要的。将指定用作索引名的行。我想要在那一行之前的数据。也许你可以向我们提供你的元数据样本。你只想从一个特定的单元格中读取元数据吗？如果我们需要使用xlrd模块跳过使用pandas的行怎么办？我们如何实现it@user3521180，

pd.ExcelFile

在引擎盖下使用

xlrd

。