Python 导入Excel数据框时使用唯一字符串匹配作为标题

Python 导入Excel数据框时使用唯一字符串匹配作为标题,python,pandas,Python,Pandas,我有一些凌乱的Excel电子表格,希望将少量单元格导入数据框。包含我不感兴趣的信息(“)的行数和列数以及带有空格(~)的单元格数因电子表格而异 以下是电子表格(输入)的示例: 我的逻辑正确吗?我需要先将完整的电子表格导入到数据框中,然后将该数据框解析为唯一字符串(Name),作为头行导入到第二个数据框中使用 这就是我导入的方式,但仍停留在对第二个数据帧的解析上: import pandas file = 'example.xlsx' xl = pandas.ExcelFile(file, dty

我有一些凌乱的Excel电子表格,希望将少量单元格导入数据框。包含我不感兴趣的信息()的行数和列数以及带有空格(~)的单元格数因电子表格而异

以下是电子表格(输入)的示例:

我的逻辑正确吗?我需要先将完整的电子表格导入到数据框中,然后将该数据框解析为唯一字符串(Name),作为头行导入到第二个数据框中使用

这就是我导入的方式,但仍停留在对第二个数据帧的解析上:

import pandas
file = 'example.xlsx'
xl = pandas.ExcelFile(file, dtype=str) #some cells have values and want just as strings
df = xl.parse("Sheet1")
for index, row in df.iterrows():
    for cell in row:
        if 'Name' in str(cell):
            header_start_row = index
            break
所需数据帧(输出):

使用该功能导入excel工作表。它有一个可选的输入参数
skiprows
,允许您指定顶部应忽略的行

import pandas as pd

file = 'example.xlsx'
skiprows_amount = 5
df = pd.read_excel(file, skiprows=range(skiprows_amount), dtype=str)
注意:此解决方案有一个限制,即您必须提前知道要跳过的行数。

使用该功能导入excel工作表。它有一个可选的输入参数
skiprows
,允许您指定顶部应忽略的行

import pandas as pd

file = 'example.xlsx'
skiprows_amount = 5
df = pd.read_excel(file, skiprows=range(skiprows_amount), dtype=str)

注意:此解决方案有一个限制,即您必须提前知道要跳过的行的数量。

pd.read\u excel(file,skiprows=range(header\u start\u row))可能用于折叠rows@lcb是的,这是一个很好的改进。它应该从第六行开始,但是
header\u start\u row
给出了3,而不是6pd。读取excel(文件,skiprows=range(header_start_row))可能用于折叠rows@lcb是的,这是一个很好的改进。它应该从第六行开始,但是
header\u start\u row
给出了3,而不是6
import pandas as pd

file = 'example.xlsx'
skiprows_amount = 5
df = pd.read_excel(file, skiprows=range(skiprows_amount), dtype=str)