Python 导入Excel数据框时使用唯一字符串匹配作为标题_Python_Pandas

Python 导入Excel数据框时使用唯一字符串匹配作为标题

python pandas

Python 导入Excel数据框时使用唯一字符串匹配作为标题,python,pandas,Python,Pandas,我有一些凌乱的Excel电子表格，希望将少量单元格导入数据框。包含我不感兴趣的信息（“）的行数和列数以及带有空格（~）的单元格数因电子表格而异以下是电子表格（输入）的示例：我的逻辑正确吗？我需要先将完整的电子表格导入到数据框中，然后将该数据框解析为唯一字符串（Name），作为头行导入到第二个数据框中使用这就是我导入的方式，但仍停留在对第二个数据帧的解析上： import pandas file = 'example.xlsx' xl = pandas.ExcelFile(file, dty

我有一些凌乱的Excel电子表格，希望将少量单元格导入数据框。包含我不感兴趣的信息（“）的行数和列数以及带有空格（~）的单元格数因电子表格而异

以下是电子表格（输入）的示例：

我的逻辑正确吗？我需要先将完整的电子表格导入到数据框中，然后将该数据框解析为唯一字符串（Name），作为头行导入到第二个数据框中使用

这就是我导入的方式，但仍停留在对第二个数据帧的解析上：

import pandas
file = 'example.xlsx'
xl = pandas.ExcelFile(file, dtype=str) #some cells have values and want just as strings
df = xl.parse("Sheet1")
for index, row in df.iterrows():
    for cell in row:
        if 'Name' in str(cell):
            header_start_row = index
            break

所需数据帧（输出）：

使用该功能导入excel工作表。它有一个可选的输入参数

skiprows

，允许您指定顶部应忽略的行

import pandas as pd

file = 'example.xlsx'
skiprows_amount = 5
df = pd.read_excel(file, skiprows=range(skiprows_amount), dtype=str)

注意：此解决方案有一个限制，即您必须提前知道要跳过的行数。

使用该功能导入excel工作表。它有一个可选的输入参数

skiprows

，允许您指定顶部应忽略的行

import pandas as pd

file = 'example.xlsx'
skiprows_amount = 5
df = pd.read_excel(file, skiprows=range(skiprows_amount), dtype=str)

注意：此解决方案有一个限制，即您必须提前知道要跳过的行的数量。

pd.read\u excel（file，skiprows=range（header\u start\u row））可能用于折叠rows@lcb是的，这是一个很好的改进。它应该从第六行开始，但是

header\u start\u row

给出了3，而不是6pd。读取excel（文件，skiprows=range（header_start_row））可能用于折叠rows@lcb是的，这是一个很好的改进。它应该从第六行开始，但是

header\u start\u row

给出了3，而不是6

import pandas as pd

file = 'example.xlsx'
skiprows_amount = 5
df = pd.read_excel(file, skiprows=range(skiprows_amount), dtype=str)