Python:使用特定的html表标题读取特定的html表

Python:使用特定的html表标题读取特定的html表,python,html,pandas,html-table,Python,Html,Pandas,Html Table,我开始学习Python熊猫,需要一些指导。假设我有一个由多个表组成的html文件,每个表由每个表的标题(即表号135)唯一标识 如果我希望使用唯一标题表246来识别和读取该表,Python如何在忽略其他表的情况下专门读取该表?我需要使用表格246的标题来阅读它,因为这个文件中表格的顺序不是固定的,而是动态的 一直在互联网上搜索,但没有找到任何使用表格标题识别该表格的解决方案 我的html文件内容 表135 用户名 手机号码 约翰 1234567890 表246 薪水 经验 $5000 10

我开始学习Python熊猫,需要一些指导。假设我有一个由多个表组成的html文件,每个表由每个表的标题(即表号135)唯一标识

如果我希望使用唯一标题表246来识别和读取该表,Python如何在忽略其他表的情况下专门读取该表?我需要使用表格246的标题来阅读它,因为这个文件中表格的顺序不是固定的,而是动态的

一直在互联网上搜索,但没有找到任何使用表格标题识别该表格的解决方案

我的html文件内容

表135 用户名 手机号码 约翰 1234567890

表246 薪水 经验 $5000 10


您可以尝试以下代码来提取html表:

import pandas as pd

df = pd.read_html("test.html", match='Table 246')
df[0]
示例代码:


谢谢

您是否查看了用于阅读熊猫中html表的文档?既然你是新来的,我猜我建议你先看看以前的答案。或者类似的问题。你会通过这种方式学到更多…或者等待别人为你回答。谢谢你的理解!